看板 MLB 關於我們 聯絡資訊
※ 引述《wallflowers (whatever works)》之銘言: : 看到這個作者的文章我實在覺得有些感嘆,筆者用很多數字來支持他的論點, 但卻堆疊的很怪,某方面讓人覺得很像在掉書袋 : 1.單純用投手WAR來表示一個球隊的“近況”? 光是決定用哪個指標來代表“近況” : , 就夠你寫一篇小論文了 : 2.用季後賽經驗來做文章?這個你聽曾公在電視裡講講可以,不然97的馬林魚和01響尾蛇就直接投降就好啦 : 發明Pecota系統的Nate Silver在他的書說,好的分析一定同時包含了質化和量化的資料,要賣弄數據,相信沒人比得過BP那群數據頭。 : 這位作者的文章裡我看到很多數據....但...沒有球賽的觀察....通篇就是數據累績後的結論 : ----- : Sent from JPTT on my Samsung GT-I9500. 你說的是精準預測 我建議大家去看 有中文版 剛好前一陣子有寫一篇 不嫌棄的話就參考一下吧~ 其實,魔球 (Money Ball) 的爭辯早就結束了。 魔球真正的精神,應該是如何在市場中找出被低估的價值,但是出版社和電影片商在市場 壓力下,半惡意地扭曲這個思想,變成新穎的統計數據和方法如何打敗傳統球探 (在製造 種族對立以提升話題性的功力上,美國和台灣基本上一樣高竿,也一樣垃圾),魔球中所 謂的數據派和傳統派,兩個團體的偏激分子的戰爭讓球界的所有人都被貼上標籤,先進來 的許多老屁股就被貼成傳統派,而另一群人就被歸在數據派,自稱數據派的人儘管否認, 事實上那段時間他們的確是想闡述這件事情:新穎的統計數據和方法可以打敗傳統球探。 有好一陣子網路上數據派說話都很大聲,畢竟運動家、紅襪甚至是藍鳥隊的戰績確實很不 錯,後來被歸在傳統派的紅雀、巨人紛紛拿到世界大賽冠軍,才又讓這個嚴重倒向一邊的 蹺蹺板恢復平衡,人們開始知道,傳統派那邊不全然是那麼一無是處 (事實上被歸在傳統 派的人也讀統計數據,有些甚至奉行魔球思想,但很多數據派還是大力抨擊這些人,我猜 大概是罵那些老屁股讓他們很有成就感)。 初探魔球的球迷,很容易會在其中迷失方向,我會建議您再接著看另一本書,Nate Silver 寫的精準預測 (The Signal and the Noise)。 老棒球迷對 Nate Silver 肯定不陌生,PECOTA 預測系統的發明人,實際上他在其它預測 領域也很有名,比方說美國的總統大選,2008 年 50 個洲成功預測命中 49 洲,2012 年 更是 50 洲全數命中,是統計和預測鬼才。 精準預測的第三章 <我在乎的只有輸贏> 是棒球迷不可錯過的精彩章節,紅襪隊的明星二 壘手 Dustin Pedroia 是這裡的主角,故事就從他開始。 Keith Law是 ESPN 著名的棒球評論家,在 Dustin Pedroia 的新人球季就提出這樣的報 告:Dustin Pedroia 的力量和揮棒速度,無法穩定打中大聯盟投手的球,他也沒有體力 ,如果他能穩定打出兩成六的打擊率,他就還有用處,而如果他可以不要在三壘手和游擊 手之間換來換去的話,當個後備的內野手還會有未來。事實證明,這個報告錯得離譜。 相反地,PECOTA 系統預測 Dustin Pedroia 是最有前途的球員第四名。PECOTA 是 Nate Silver 在會計事務所工作時創造出來的 (假裝在幫客戶寫模型,實際上是在用 excel 寫 PECOTA 系統,這種事我也幹過,上班用 excel 算賠率假裝是幫客戶做問題反映報表。 excel 是上班偷雞好物無誤),中間劈哩啪啦花了好長的篇幅介紹 PECOTA 系統的思考邏 輯,非常精彩,但礙於版權 (實際上是怕各位看到這邊就按上一頁跳出),我這裡就先打 住不談。 看起來 PECOTA 系統大勝球探。事實是這樣嗎?2006 年,PECOTA 成功預測到 Dustin Pedroia、Ian Kinsler、Matt Kemp 等人是未來明星,Baseball Amerca (棒球美國,以 傳統球探意見為主) 連前兩位都沒列入百大潛力新秀,但是,PECOTA 同時也預測 Joel Guzman、Donald Murphy、Yusemiro Petit 等人是未來巨星,而棒球美國預測到了很多 PECOTA 沒選到的球員,包括 Jon Lester、Troy Toluwizki、Nick Markakis,把 2006 年兩套系統擺在一起比較,2011 年他們所創造的勝場數 (wins above replacement player) 分別是 PECOTA 546 場,棒球美國 630 場,棒球美國大勝。 主要在於,以傳統球探為主的棒球美國能夠學習 (雖然電腦也能在資料庫夠龐大的狀況下 做學習動作),學習一些他們本來沒有的統計技術,他們也能看到一些無法量化的東西, 比方說各種心理素質和生活習慣,假設現在有兩位球員,打擊率都是 .300 和 10 支全壘 打,但 A 球員假日都去做慈善義工,B 球員則是去酗酒嗑藥,但是電腦預測 B 球員是未 來巨星,這種結果你接受嗎? 統計預測學家最常犯的錯誤就是過度自信,認為無法量化的東西就不重要,這不能怪他們 ,因為人天生就是感性的動物,無法理性看待每件事情是最大缺點,而且喜新厭舊,對後 來出現的科技技術抱持極度樂觀的看法。棒球數據大師 Bill James 就承認,80 年代他 寫的很多東西都是錯的,最大的改變就是他有孩子了,了解到每個人都是某些人的寶貝, 球員卡、電玩裡那些人物,你真的不會想到他們也是人,正在盡力而為。 魔球中讓人覺得守備不甚重要,事實上重要極了,而且 Billy Beane 很重視這塊,剛好 前陣子和同事討論到守備數據,我必須說你用這些數據真的要很小心,而且很多守備數據 決定的關鍵早在賽前就擬定好了,包括內野手之間的跑位溝通、外野手之間的跑位溝通、 內外野手誰要 cover 比較多的領空範圍,還有各種暗號搭配,甚麼時候誰要進去補位, 這些數據上都看不出來,但這是守備的一環,剛好這又能扯到團隊氣氛,半調子數據頭認 為這種東西不是很重要,事實上重要極了,好的團隊氣氛不一定會讓球隊變的更好,但不 好的團隊氣氛球隊鐵定會變得更糟,因為缺乏溝通,電腦沒辦法幫你檢視這些 (除非你去 下條件教它,只有極少數菁英做得到這種事),它只能幫你統計結果。 魔球中也讓人覺得教練只是人形立牌,我是不知道 Billy Beane 是不是曾經這樣想,但 如果你真的抱持這種想法,那顯然是想把管理學丟進垃圾桶。 真正厲害的人,早就利用球探和電腦各自有的智慧在做事情了,比方說紅襪隊跟紅雀隊, 如果你想知道人類和電腦能抗衡到什麼地步,本書也有一章關於西洋棋大師和電腦較勁的 故事,歡迎自行購買閱讀。 Nate Silver 說,魔球已死,魔球萬歲,這是我那場多年論戰後看到最精闢的註解。 -- Orange and Blue Blood (A blog about NYM ) http://www.sportsv.net/authors/todd7622 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.169.63.202 ※ 文章網址: http://www.ptt.cc/bbs/MLB/M.1413044624.A.0DA.html
TSbb: 你不要這麼專業好不好? 10/12 00:28
tucker: 你不要這麼專業好不好? 10/12 00:29
tucker: 另外是"Keith" Law,todd大好像對名字叫Keith有點苦守XD 10/12 00:32
tucker: 最後苦守要更正成「苦手」 10/12 00:33
lym0715: 推:罵那些老屁股讓他們很有成就感 10/12 00:33
※ 編輯: todd7622 (1.169.63.202), 10/12/2014 00:34:42
lym0715: 這篇把網路上假數據派的盲點都講到一些了 以為學外國數據 10/12 00:34
lym0715: 頭的文章筆法語氣 就是專業的數據分析專家 10/12 00:35
todd7622: 已改 感謝tucker再度糾正XD 10/12 00:35
lym0715: 尤其是認為無法量化的東西就不重要 10/12 00:35
※ 編輯: todd7622 (1.169.63.202), 10/12/2014 00:37:50
tucker: 不敢~我自己也很常中了拼音文字的陷阱orz 感謝好文! 10/12 00:40
honey4617912: 書籍推坑文無誤 10/12 00:41
ohb: 這本書非常有趣 XD 10/12 00:43
DerekJeter02: 好想買來看~~ 10/12 00:43
ocean11: 很棒 10/12 00:59
kurt28: 推 10/12 02:22
cacac: 恩,心理素質,球隊氣氛,甚至教練因素的體會,主要還是得 10/12 02:48
cacac: 看球賽才抓得準確。單看數據,或缺這塊去解釋數據易有盲點 10/12 02:49
rssh0106: 不能預測的事情太多,這就是棒球棒的地方 10/12 03:16
joanamyx: 推 10/12 04:28
Kreen: 推~ 10/12 04:53
rosefan: 同意 10/12 05:41
Pujols5: 不是無法量化就不重要吧 是無法量化只好不管他 10/12 08:27
Pujols5: 畢竟是要做統計去分析 如果無法量化還要把他放進數據裡 10/12 08:28
Pujols5: 那就不叫統計啦 10/12 08:28
goopa: 推這篇~ 10/12 08:34
st6012: 不過也的確看到有人喊出無法量化的東西上不了檯面這種話 10/12 08:53
kei29: 啊數據頭就是搞不清楚自己極限在哪邊啊 10/12 08:58
kei29: 更有甚之直接把極限(難以量化或不能量化)當成不重要因素 10/12 08:58
kei29: 啊該項變因重不重要用量化與否就足夠當引導出有效結論喔 10/12 09:00
kenkenken31: 推這篇~ 10/12 09:14
peterhuo: 守備早就是現代數據發展的重頭戲 10/12 09:56
peterhuo: 追蹤系統讓守備好壞無所遁形(多餘路徑跟啟動時間) 10/12 09:56
mlmt: 美國總統大選不難預測吧~台灣每個縣市藍或綠會贏我想我可以 10/12 10:03
mlmt: 不用看民調就可以預測出來 XD 10/12 10:04
pejahuang: 大推~ 魔球V.S人生決勝球 數據傳統的資料都有價值 10/12 10:45
TSbb: 總統大選不難預測,但是你要全數命中就很難了 10/12 10:46
alfneta: 買來快一年還沒看… 10/12 11:56
abc12812: 球員人格特質那段不同意 如果A球員和B球員數據都一樣 10/12 12:12
abc12812: 那數據跑出來的未來預測一定是差距不遠 沒有一個是巨星 10/12 12:13
abc12812: 另一個是雜魚這種事 10/12 12:13
abc12812: 再說人格特質這邊 傳統球探派恐怕更不重視這塊 君不見 10/12 12:14
abc12812: Delmon Young, Elijah Dukes, Matt Bush等麻煩人物 10/12 12:15
abc12812: 吸毒打架樣樣來 為啥球團機會還是一給再給? 不就是傳統 10/12 12:16
abc12812: 上重視天分高於一切的結果? 反而是很多後段選秀的好好 10/12 12:16
abc12812: 先生 數據一路上來都很不錯 但就是沒有機會 因為"看起來 10/12 12:18
abc12812: 沒法成為大聯盟球員" 數據派在這塊 反而是幫助挖掘出更 10/12 12:18
abc12812: 多璞玉
lowPHkiller: Dukes 好久沒聽到LOL 10/12 12:37
※ 編輯: todd7622 (1.164.134.242), 10/12/2014 14:03:43 ------------------------------------------------------------ 我不是 Silver,所以這只是我的猜測。針對 A 球員和 B球員,我猜他的意思是,在預測 未來表現時,預測系統的條件是 “人” 去寫的,假設 A 球員的數據和 B 球員的數據差 不多,但 A 稍微較好的部分在預測系統上被給予比較多的權重,那系統就會預測 A 的未 來發展性較好,反之就會去預測 B 勝出。 ------------------------------------------------------------ 以上錯誤,請以 Anakin 大那篇為主。 其實,數據頭有時候太過追求真理,真理沒有錯,但事實上,在商場上真理根本不會存在 ,就好像薪資仲裁的時候,兩邊都會丟出對自己有利的數據,但是最後還是會有一個人負 責當仲裁者,又好像公司在做決策的時候,A 方案和 B 方案最後誰會勝出還是得由老闆 或負責仲裁的人來決定,那些仲裁者都是 “人”,一定會有私心,除非現在立刻立法, 以後做決策都用程式決定,就能避免這些麻煩,問題是?真的有人能保證寫出找出真理的 程式嗎? ※ 編輯: todd7622 (1.164.134.242), 10/12/2014 14:05:55
SamDalembert: 請問棒球美國多預測到的 是PECOTA淘汰的還是miss的? 10/12 14:52
maxspeed150: 想到只有power的Goldschmidt 10/12 15:18
※ 編輯: todd7622 (1.164.134.242), 10/12/2014 18:11:20
waitla: 人生決勝球才叫做神話 10/12 18:23
lordi: 10/12 19:53
u8702004: 專業 10/12 20:35
feather7589: 推 10/12 23:00
nnnn7615: 推這本書!!!看得很爽~~ 10/13 03:45
HRyan: 讚,大推 10/14 23:04