看板 MLB 關於我們 聯絡資訊
※ 引述《tlchen (台灣加油)》之銘言: :   OPS+ 真的能讓張飛打岳飛嗎?我們來看一個小例子。 :   某甲為十年前某校的畢業生,成績全校第一名,平均分數為 98 分。 :   當年全校學生平均分數為 70 分。 假設標準差7分, 甲的z分數4分 :   某乙為今年同一所學校的第一名畢業生,平均分數為 90 分。 :   今年全校學生平均分數為 60 分。 若標準差10分, 乙的z分數是3分 甲是比乙好的 棒球員到底要用ops+比還是用z分數比 應該還不知道哪種比較好 標準差的資料也不知道去哪找 :   為了能讓甲乙相比,某丙創造了一個 score+, : 公式是個人成績除以全校平均再乘 100 : 根據 score+,某乙 150 海放某甲的 140,是個較優秀的學生。 :   發現這樣論證的問題了嗎?score+ 或 OPS+ 這種東西, -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.168.244.153
nickyang:Baseball databank可以download 03/08 08:38
nickyang:攻擊數據都是可以免錢跑的 03/08 08:38
tlchen:若有碩士主修統計的,若剛好有指導老師願意幫助玩這些資料 03/08 11:27
tlchen:我相信是很有機會海放目前的棒球統計 03/08 11:27
OalexO:海放? 樓上真當美國那些數據專家沒統計背景嗎... 03/08 11:40
idtvgame:台灣就有經濟統計碩博士生在寫運動相關的論文了... 03/08 11:46
idtvgame:經濟學也有運動經濟學這塊還有期刊 多的是在跑計量的論文 03/08 11:47
tlchen:期刊,研討會都有,統計界每年的大拜拜,也有運動統計 03/08 11:51
tlchen:問題是有多少人,多少心力真正投入 03/08 11:51
tlchen:若一開始的人稍微有點統計概念,就不該是OPS+這種觀念出現 03/08 11:53
idtvgame:所以這跟你"有碩士主修統計且教授願意幫助就能海放" 03/08 11:59
idtvgame:你這種講法好像都沒有念經濟統計的人在做這塊一樣~ 03/08 12:00
aborwang:推OalexO 03/08 12:13
onime0704:講的數據好像只有OPS+一樣Orz 03/08 12:21
TRAP:海放? XDDDD 03/08 12:35
maxspeed150:海放嗎............................................ 03/08 13:10
maxspeed150:只能說 紅雀每年付給Tango那麼多錢 紅襪付給James那麼 03/08 13:11
maxspeed150:多錢 不是沒理由的 03/08 13:11
maxspeed150:OPS+甚至更進一步的WAR之類你能在BR或FG查到的數據都 03/08 13:12
maxspeed150:是給球迷的小玩具 球隊內部的統計工具發展比這複雜多 03/08 13:12
maxspeed150:抱歉記錯 Tango現在是小熊的人 03/08 13:18
chordate:說海放的真是搞笑,你能海放早就被付錢請去了 03/08 13:34
chordate:OPS+是好算又誤差不會太大 03/08 13:35
chordate:真的當Sabermetrics只有這點東西啊? 03/08 13:37
IAmaMouse:原來美國球團都是槌子, 便宜的學校學生不找, 去花大錢買 03/08 14:06
IAmaMouse:隨便都會被海放的垃圾 03/08 14:06
tlchen:數據當然不只有 OPS+, 還有像是討論價值用 WAR 03/08 14:48
tlchen:統計量本身沒有錯,但不知統叶量該怎麼用,被海放只是剛好 03/08 14:49
tlchen:機密的東西,做到多好,看不到無法評論 03/08 14:50
tlchen:但以目前 Sabermetrics 所公開展現的東西 03/08 14:51
tlchen:我是真的認為,碩士生就能做得比他們好 03/08 14:51
maxspeed150:FG或BR這種放來給大家wow一下的數據本來就是如此 03/08 14:52
tlchen:當然,若是跟著目前主流 Sabermetrics 的作法,那不會有 03/08 14:52
maxspeed150:不管是WAR或OPS+ 這背後都有隱含一個概念: 雖然年度不 03/08 14:52
maxspeed150:同 但是talent分布理論上差距不會太大 03/08 14:53
tlchen:什麼特別的東西.得要自己重新去想想,到底怎樣才是合適的 03/08 14:53
tlchen:WAR 要衡量 talent, 我沒有太大的意見 03/08 14:54
tlchen:但要來衡量貢獻度,那叫掛羊頭賣狗肉 03/08 14:55
idtvgame:你為什麼這麼有把握你幻想中的碩士生能想出一個"特別又 03/08 14:55
tlchen:WAR 本身沒錯,錯的是一堆人把它用在不該用的地方 03/08 14:55
idtvgame:有創新性代表的數據阿"... 03/08 14:55
chordate:衡量talent比衡量貢獻渡還難耶=.= 03/08 14:56
maxspeed150:t大上次吵過一次的論點我還記得啦 他就是認為關鍵時刻 03/08 14:56
maxspeed150:的關鍵一擊才是貢獻度的重點 03/08 14:56
tlchen:不用特別又創新,而是適不適合.就像 z-score 就足以海放 03/08 14:57
tlchen:那些 xxxx+ 03/08 14:57
chordate:那早就有WPA滿足你對關鍵一擊的的重視了 03/08 14:57
maxspeed150:xxxx+是個簡單的數據 只是代表一個球員"比平均"好多少 03/08 14:58
tlchen:我的確認為在衡量貢獻度上,WPA 遠勝 WAR 03/08 14:58
maxspeed150:當然如果要看talent分布的話z-score是比較精準沒錯 03/08 14:58
tlchen:貢獻度是看已發生的表現,而不是預測未來的表現或本身能力 03/08 14:59
chordate:你確定大聯盟是常態分佈再來用z-core 03/08 14:59
tlchen:z-score 也同樣可以看比平均好多少 03/08 15:00
tlchen:我前面也說過,z-score 用來看極端值一樣不可靠 03/08 15:01
idtvgame:如果你覺得標準化這麼有代表性 歡迎寫一寫你投期刊.... 03/08 15:01
tlchen:但它就是比那些 plus 好上許多 03/08 15:01
tlchen:我不認為 z-score 比 xxx+ 有代表性,能投上什麼期刊 :) 03/08 15:03
idtvgame:我只是想做 做這些東西的人很多..沒有您講的這麼不堪這樣 03/08 15:04
tlchen:看統計量,看它跟平均的比,去問問哪個統計的人信服 03/08 15:04
tlchen:當然啦,除非是大家已知那統計量要取 log 來處理比較準 03/08 15:04
tlchen:像是照片中的 intensity 03/08 15:05
idtvgame:就我看Journal of Sports Economics裡面最少超過20篇 03/08 15:05
tlchen:在那樣的情況下,看比例,等於看 log 後的差距 03/08 15:06
idtvgame:講棒球的文章在用你所謂的xxxx+ 再做迴歸 03/08 15:06
idtvgame:如果你能講出他們用的東西沒用...那是還蠻值得丟期刊的阿 03/08 15:06
tlchen:20 篇是指 z-score 比 xxxx+ 的比較? 03/08 15:07
chordate:你這一講就漏餡了,你只是認為用減的比用除的好而已 03/08 15:07
tlchen:我只能說,統計的人,根本不可能去認為 xxx+ 有機會而去用 03/08 15:08
idtvgame:不是 是他們xxx+在當類似球員表現的分析 03/08 15:09
chordate:那一個比較好明明就是要看跟實際狀況預測起來吻不吻合 03/08 15:09
chordate:就像RC公式該不該全是線性組合一樣 03/08 15:10
chordate:除非是完全按照打棒球的機制去模擬 03/08 15:10
chordate:要不然線性組合就只是近似而已 03/08 15:11
chordate:這是就會有人跳出來說,棒球的分數哪裡是這樣生成的 03/08 15:11
chordate:所以這個不對怎麼樣的 03/08 15:12
nickyang:岔題,Z score,12-13 trout 2.6,01-02 Pujols 1.5 03/08 15:16
nickyang:樣本為PA qualified打者。待會做全打者 03/08 15:17
nickyang:12-13比01-02近似常態,1213 avg .338, stdev .078 03/08 15:18
nickyang:01-02 avg .351 stdev .062. 做完再上圖 03/08 15:19
maxspeed150:用wOBA做的? 03/08 15:20
chordate:問一下資料來源是http://www.baseball-databank.org/ 03/08 15:21
nickyang:IQR/1.35 0102=0.03 1213=0.04 03/08 15:23
tlchen:看跟實狀況預測起來吻不吻合?是要叫張飛跟岳飛真的打一場? 03/08 15:24
nickyang:是 03/08 15:24
tlchen:若有興趣,不如隨便找兩個 mean 不是零的分佈,然後各抽樣 03/08 15:25
tlchen:樣個幾百個,然後自己看一下,z-score 跟 xxx+ 那個比較準 03/08 15:26
Yukirin:海放 XDDDDDDDD我每天鑽這個都沒這自信了你什麼豹子膽啊XD 03/08 15:27
tlchen:多做幾次,或許就有感覺,這為什麼根本沒什麼好爭論的 03/08 15:27
chordate:找exponential distribution 出來的結果不就好了 03/08 15:28
tlchen:如果你認為 exponential distribution 合理,那你贏了 03/08 15:32
tlchen:前面已經推過,除非已知取 log 後來處理是比較有意義的 03/08 15:32
chordate:已知已知,不要忘了已知是怎麼來的 03/08 15:33
tlchen:你認為那些數據該先取 log 的話,那我也不便多說什麼了 03/08 15:33
ChaosK:為什麼一定要張飛打岳飛,可不可以關羽打項羽? 03/08 18:12
best2008:都不要看數據 就好了(誤 03/08 19:25
fan0226:任何數據都不是完美的qq 03/08 19:56
TSbb:海放勒,超好笑的 03/11 15:58