看板 NTHU_STAT97 關於我們 聯絡資訊
作者 wearytolove (奪真書生A.W.) 站內 Baseball 標題 [分享] 本次冠軍戰前六戰的迴歸分析 時間 Sun Oct 25 18:18:30 2009 ─────────────────────────────────────── 因為這次比賽太有趣了,所以就來分析一下 獲勝code為win,有贏=1,沒贏=0 得分code為scores 安打code為hits 失誤code為error 對方的失誤code為erroroth 要跑迴歸,假設win為dependent variable,其他為independent 也就是以是否獲勝為應變數,其他數值為自變數 假設 獲勝=β0+β1得分+β2安打數+β3失誤+β4對方失誤+誤差項 要跑迴歸,所以先對自變數做兩兩相關性,避免correlation 此時就發現一些很有趣的事......... corr scores hit(obs=12) | scores hit -------------+------------------ scores | 1.0000 hit | 0.1118 1.0000 對兩隊來說,得分跟安打是低度相關..........XDDDDDDDDDDDDDDDDDDDDDDD . corr hit error(obs=12) | hit error -------------+------------------ hit | 1.0000 error | 0.2612 1.0000 相對得分來說,自己隊上失誤越多,安打似忽也越多,這是將功贖罪 . corr scores erroroth(obs=12) | scores erroroth -------------+------------------ scores | 1.0000 erroroth | -0.2592 1.0000 更白癡的東西出現了....自己隊的得分跟對方的失誤是負相關, 對方失誤越多我們得分越少 其它項都是低度相關的,包括我們與對方的失誤之間不會傳染 我方安打與對方失誤之間也是沒關的 總之,看起來是沒有高度相關,是可以跑個迴歸分析了 因為win這個變數是二元變數,應該要用二元勝算對數模型 可是因為這次比賽有太多5分,所以自由度太低,因此只好將就用迴歸來跑 . reg win scores hit error erroroth, level(90) Source | SS df MS Number of obs = 12 -------------+------------------------------ F( 4, 7) = 2.95 Model | 1.8823801 4 .470595025 Prob > F = 0.1009 Residual | 1.1176199 7 .159659985 R-squared = 0.6275 -------------+------------------------------ Adj R-squared = 0.4146 Total | 3 11 .272727273 Root MSE = .39957 ------------------------------------------------------------------------------ win | Coef. Std. Err. t P>|t| [90% Conf. Interval] -------------+---------------------------------------------------------------- scores | .1484783 .0635332 2.34 0.052 .0281096 .2688469 hit | -.0084895 .0414875 -0.20 0.844 -.0870909 .0701119 error | .1206245 .0564339 2.14 0.070 .0137061 .2275428 erroroth | -.0662256 .0560804 -1.18 0.276 -.1724743 .040023 _cons | -.2758375 .513328 -0.54 0.608 -1.248378 .6967028 ------------------------------------------------------------------------------ 跑完迴歸後,對係數不拒絕等於0的跑F-test,不拒絕,hit跟erroroth可以同時等於零 也就是......發生了很好笑的事了.................. 幾個結論(假設90%信心水準) 1.每多得1分,勝率約增加15% 2.我方安打數量與我方是否會獲勝是獨立的,完全沒影響 3.我方每多失誤一次,勝率約增加12%,跟我方安打效果一樣 4.對方失誤數量與我方是否會獲勝是獨立的,完全沒影響 ------------ 對於樣本抽樣來說,總冠軍賽有其特殊性, 考量到兩隊都會認真打的情況下,其資料理應更接近棒球比賽實際情況 而跑完迴歸分析後,發現這樣的值顛覆了一般人對棒球的常識 對於兩隊總教練來說,.... 隊員是否打安打不重要 是否要詛咒對方失誤不重要 重要的是,要我方求員盡量失誤!!!!!!!!!! XDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.5.19
krokopaja:這樣也接不到 10/25 18:18
infinitie:用stata嗎 XD 10/25 18:18
ewing112233:是AR model嗎? 10/25 18:19
sowulo:喔喔~ 原來是這樣啊~ 10/25 18:19
sommerno1:XD 10/25 18:19
bravee:趕快推.....不然會被以為看不懂 XD 10/25 18:19
superprada:難怪象隊靠自己失誤贏球 10/25 18:19
doraelephant:這一篇文章值 35 元 10/25 18:20
CombatSniper:我想起了LRF 10/25 18:20
wake1117:嗯嗯嗯!我懂!我懂! 10/25 18:20
Biggg:XD 10/25 18:20
pcafu:是經濟所的嗎 10/25 18:20
santaclub:明明就很專業.. 10/25 18:20
WeiKuang:大家快點笑不然會被人家說我們看不懂英文 10/25 18:20
soren55200:看完後爆笑~~ 10/25 18:20
fluteman:dora看不懂只好亂噓XD 10/25 18:20
ColinKhorkin:胖伸:我們是失誤野球 10/25 18:20
tryitredboy:ANOVA 10/25 18:20
doraelephant:嘿嘿~被發現 10/25 18:20
fluteman:啊就明明是統計學... 10/25 18:20
hchs31705:安打無用論 10/25 18:20
infinitie:難不成是學長po的嗎XD 10/25 18:20
hchs31705:計量經濟也會用到阿 10/25 18:21
wind1776:CPBL:我們有自己的玩法 10/25 18:21
spinMau:有沒有統計LOB和勝利的關係 10/25 18:21
Hinamizawa:原po可以轉到經濟版去嗎? 很有趣XD 10/25 18:21
spppeter:end 10/25 18:23
orzman:專業!! 10/25 18:24
uniqueyby:還滿有趣的 10/25 18:24
pcshjuju:有笑有推 10/25 18:24
pcafu:應該不能用的變數卻很白爛的低度相關 10/25 18:24
hwlrst:觀察值太少= = 應該要把前面幾年的都納進來 10/25 18:24
orzman:可以寫期刊 10/25 18:25
localking686:伸數據檔XD 10/25 18:25
pangigi:這就統計學呀... 10/25 18:25
sworddragon:推統計分析XD,要不要提供給展元 10/25 18:25
hwlrst:是今年太特殊了 所以才有這個結果@@" 10/25 18:25
補上當時後續推文
pran:二元變數要用離散型GLM,模型錯誤解釋意義不大10/25 18:30
jasonkeen:模型錯了,其他分析都是垃圾,騙鄉民還真容易…10/25 18:32
pran:模型F-test沒過,模型不顯著,以此模型解釋數據太過武斷10/25 18:33
JoderTio:樣本數也太少了吧10/25 18:39
localking686:打完再跑一次,給明年參考10/25 18:59
-- [Both at top speed on the New Goblin's glider] Spider-Man: This thing got any more? New Goblin: Hang on! Spider-Man: To what? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.114.36.74
jasonkeen:開放大家來找碴 10/25 18:35
TOOYA:模型本身就有問題 雖然他自己有點出來 後續分析還要看嗎?? 10/27 00:36
jasonkeen:居然只有學長要回這篇…哭哭…我以為大家對統計很熱情~ 10/27 00:53
※ 編輯: jasonkeen 來自: 140.114.36.74 (10/27 00:53)