作者jasonkeen (Nothing but Net)
看板NTHU_STAT97
標題[課業] 迴歸作業
時間Sun Oct 25 18:35:01 2009
作者 wearytolove (奪真書生A.W.) 站內 Baseball
標題 [分享] 本次冠軍戰前六戰的迴歸分析
時間 Sun Oct 25 18:18:30 2009
───────────────────────────────────────
因為這次比賽太有趣了,所以就來分析一下
獲勝code為win,有贏=1,沒贏=0
得分code為scores
安打code為hits
失誤code為error
對方的失誤code為erroroth
要跑迴歸,假設win為dependent variable,其他為independent
也就是以是否獲勝為應變數,其他數值為自變數
假設 獲勝=β0+β1得分+β2安打數+β3失誤+β4對方失誤+誤差項
要跑迴歸,所以先對自變數做兩兩相關性,避免correlation
此時就發現一些很有趣的事.........
corr scores hit(obs=12)
| scores hit
-------------+------------------
scores | 1.0000
hit | 0.1118 1.0000
對兩隊來說,得分跟安打是低度相關..........XDDDDDDDDDDDDDDDDDDDDDDD
. corr hit error(obs=12)
| hit error
-------------+------------------
hit | 1.0000
error | 0.2612 1.0000
相對得分來說,自己隊上失誤越多,安打似忽也越多,這是將功贖罪
. corr scores erroroth(obs=12)
| scores erroroth
-------------+------------------
scores | 1.0000
erroroth | -0.2592 1.0000
更白癡的東西出現了....自己隊的得分跟對方的失誤是負相關,
對方失誤越多我們得分越少
其它項都是低度相關的,包括我們與對方的失誤之間不會傳染
我方安打與對方失誤之間也是沒關的
總之,看起來是沒有高度相關,是可以跑個迴歸分析了
因為win這個變數是二元變數,應該要用二元勝算對數模型
可是因為這次比賽有太多5分,所以自由度太低,因此只好將就用迴歸來跑
. reg win scores hit error erroroth, level(90)
Source | SS df MS Number of obs = 12
-------------+------------------------------ F( 4, 7) = 2.95
Model | 1.8823801 4 .470595025 Prob > F = 0.1009
Residual | 1.1176199 7 .159659985 R-squared = 0.6275
-------------+------------------------------ Adj R-squared = 0.4146
Total | 3 11 .272727273 Root MSE = .39957
------------------------------------------------------------------------------
win | Coef. Std. Err. t P>|t| [90% Conf. Interval]
-------------+----------------------------------------------------------------
scores | .1484783 .0635332 2.34 0.052 .0281096 .2688469
hit | -.0084895 .0414875 -0.20 0.844 -.0870909 .0701119
error | .1206245 .0564339 2.14 0.070 .0137061 .2275428
erroroth | -.0662256 .0560804 -1.18 0.276 -.1724743 .040023
_cons | -.2758375 .513328 -0.54 0.608 -1.248378 .6967028
------------------------------------------------------------------------------
跑完迴歸後,對係數不拒絕等於0的跑F-test,不拒絕,hit跟erroroth可以同時等於零
也就是......發生了很好笑的事了..................
幾個結論(假設90%信心水準)
1.每多得1分,勝率約增加15%
2.
我方安打數量與我方是否會獲勝是獨立的,完全沒影響
3.
我方每多失誤一次,勝率約增加12%,跟我方安打效果一樣
4.
對方失誤數量與我方是否會獲勝是獨立的,完全沒影響
------------
對於樣本抽樣來說,總冠軍賽有其特殊性,
考量到兩隊都會認真打的情況下,其資料理應更接近棒球比賽實際情況
而跑完迴歸分析後,發現這樣的值顛覆了一般人對棒球的常識
對於兩隊總教練來說,....
隊員是否打安打不重要
是否要詛咒對方失誤不重要
重要的是,要我方求員盡量失誤!!!!!!!!!!
XDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.5.19
推 krokopaja:這樣也接不到 10/25 18:18
推 infinitie:用stata嗎 XD 10/25 18:18
→ ewing112233:是AR model嗎? 10/25 18:19
→ sowulo:喔喔~ 原來是這樣啊~ 10/25 18:19
推 sommerno1:XD 10/25 18:19
推 bravee:趕快推.....不然會被以為看不懂 XD 10/25 18:19
→ superprada:難怪象隊靠自己失誤贏球 10/25 18:19
噓 doraelephant:這一篇文章值 35 元 10/25 18:20
推 CombatSniper:我想起了LRF 10/25 18:20
推 wake1117:嗯嗯嗯!我懂!我懂! 10/25 18:20
推 Biggg:XD 10/25 18:20
→ pcafu:是經濟所的嗎 10/25 18:20
推 santaclub:明明就很專業.. 10/25 18:20
→ WeiKuang:大家快點笑不然會被人家說我們看不懂英文 10/25 18:20
推 soren55200:看完後爆笑~~ 10/25 18:20
推 fluteman:dora看不懂只好亂噓XD 10/25 18:20
推 ColinKhorkin:胖伸:我們是失誤野球 10/25 18:20
推 tryitredboy:ANOVA 10/25 18:20
→ doraelephant:嘿嘿~被發現 10/25 18:20
→ fluteman:啊就明明是統計學... 10/25 18:20
推 hchs31705:安打無用論 10/25 18:20
→ infinitie:難不成是學長po的嗎XD 10/25 18:20
→ hchs31705:計量經濟也會用到阿 10/25 18:21
推 wind1776:CPBL:我們有自己的玩法 10/25 18:21
推 spinMau:有沒有統計LOB和勝利的關係 10/25 18:21
→ Hinamizawa:原po可以轉到經濟版去嗎? 很有趣XD 10/25 18:21
推 spppeter:end 10/25 18:23
→ orzman:專業!! 10/25 18:24
推 uniqueyby:還滿有趣的 10/25 18:24
推 pcshjuju:有笑有推 10/25 18:24
→ pcafu:應該不能用的變數卻很白爛的低度相關 10/25 18:24
→ hwlrst:觀察值太少= = 應該要把前面幾年的都納進來 10/25 18:24
→ orzman:可以寫期刊 10/25 18:25
推 localking686:伸數據檔XD 10/25 18:25
→ pangigi:這就統計學呀... 10/25 18:25
推 sworddragon:推統計分析XD,要不要提供給展元 10/25 18:25
→ hwlrst:是今年太特殊了 所以才有這個結果@@" 10/25 18:25
補上當時後續推文
噓 pran:二元變數要用離散型GLM,模型錯誤解釋意義不大10/25 18:30
推 jasonkeen:模型錯了,其他分析都是垃圾,騙鄉民還真容易…10/25 18:32
噓 pran:模型F-test沒過,模型不顯著,以此模型解釋數據太過武斷10/25 18:33
推 JoderTio:樣本數也太少了吧10/25 18:39
推 localking686:打完再跑一次,給明年參考10/25 18:59
--
[Both at top speed on the New Goblin's glider]
Spider-Man: This thing got any more?
New Goblin: Hang on!
Spider-Man: To what?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.114.36.74
→ jasonkeen:開放大家來找碴 10/25 18:35
推 TOOYA:模型本身就有問題 雖然他自己有點出來 後續分析還要看嗎?? 10/27 00:36
→ jasonkeen:居然只有學長要回這篇…哭哭…我以為大家對統計很熱情~ 10/27 00:53
※ 編輯: jasonkeen 來自: 140.114.36.74 (10/27 00:53)