精華區beta Baseball 關於我們 聯絡資訊
※ 引述《Tsaurs (台南.台北.高雄.(♂))》之銘言: : 對了 我對數據分析的部分比較有興趣 希望版眾能夠多點這方面的指點 : 感恩 數據是吧.. ︿( ̄︶ ̄)︿ http://twbaseball.info/column.php?column_no=106 身為一個喜歡拿統計數據來看棒球的球迷,唸一些這方面的書自然是不可避免的。由於台灣在棒球統計方面仍然只能算是襁褓時期,再加上市場太小,以致於市面上找不到什麼這方面的中文書籍。有興趣藉由分析數據來探討比賽的人,通常的管道就是上網參與討論,或是尋找一些外文書。由於我對日職接觸很少,也不太清楚日本那邊這方面發展如何,所以以下的介紹全部都是跟MLB有關係的。雖然如此,底下所挑選的書籍包含了不少研究方法及成果,當然也可以應用到中華職棒上頭。 關於這些書的介紹,其實大部分在一些購物網站例如 Amazon 就可以找到比我講的還詳細的內容,有些甚至可以觀看一些書籍內文,所以我只就個人閱讀經驗簡單地用幾句話介紹一下,而另外也來看看有哪些可以拿到中職來考慮。首先從影響我最深的 Bill James 寫的書開始: The (Old and New) Bill James Historical Baseball Abstract Win Shares Whatever Happened to the Hall of Fame? Bill James寫過跟棒球統計有關的書當然遠超過這三本,不過這三本裡談到處理棒球數據的方法相當多,即使是對大聯盟一無所知的人一樣可以學到不少東西。這三本裡面,Win Shares 是最深的,想念的人要有讀統計論文類似東西的心理準備,,簡單地說,Win Shares 就是用一套很複雜的系統來評估每個球員對於球隊的勝場有多少貢獻,並在計算過程中加上適當的調整,以便比較不同年代不同球場的球員,我從前年開始,也花了不少時間,利用這套系統來替台灣職棒史上的球員做了個排名。如果不想看那些公式,The New Bill James Historical Baseball Abstract 書中也稍微提了一下子 Win Shares,順便解釋一下他是如何排名的,這本書跟 Win Shares 書中都有不少文章來探討比較球員的貢獻,相當值得一讀。 至於舊版的 The Bill James Historical Baseball Abstract 有介紹不少現在常被大家使用的公式,像是用來估計打擊者替球隊打下幾分的 Runs Created (RC),拿球隊得失分來推估勝敗紀錄的 Pythagorean Formula 也有提到,還有利用 RC 跟聯盟平均打擊水準來評估打者在歷史中地位的 Offensive Winning Percentage 等等。 Whatever Happened to the Hall of Fame? 這本書是探討美國棒球名人堂選舉制度的,舊版書名叫做 The Politics of Glory,雖然台灣沒有棒球名人堂,不過這跟我推薦此書的理由關係不大。主要原因是,這本書裡也提到了一些評估球員的方法,雖然效果可能沒有用 Win Shares 那麼客觀,不過相對來說方法比較簡單,也比較能讓多一點人看懂。有比較兩球員帳面成績的 Similarity Score,以及評估球員帳面成績在史上地位的 Keltner List,Standard List 等。 雖然棒球統計這個名詞裡有統計二字,不過這跟大學裡統計系的那個統計差蠻多的,會一些棒球統計的人可能對專業一點的機率統計一竅不通。不過接下來要介紹的兩本書就真的是有些機率統計了。 A Mathematician at the Ballpark: Odd and Probabilities for Baseball Fans,by Ken Ross Teaching Statistics Using Baseball,by Jim Albert Curve Ball,by Jim Albert and Jay Bennett 這三本書的難度是愈底下的愈深。三本書都是從最簡單的機率(像是算打擊率這種簡單除法),和統計(像是畫長條圖統計人數)開始。看到這邊,千萬不要以為國中就學過了,書中由淺入深,到書的後面幾章就真的有不少東西需要大學程度統計了。以第二本書來說,有用到相關係數來探討不同數據對球隊勝場數的影響,有用到馬可夫鏈來推估壘上跑者與出局狀況的變化,有用到信賴區間,二項式分佈,負二項式分佈,以及大量的電腦模擬來比較球員成績。這本書曾被作者拿來當作大學棒球統計課的課本。第二本書與第三本書其實討論的主題有七八成相同或類似,主要的差 別在於第二本涵蓋的層面沒那麼廣,取而代之的則是較為平易近人的例子解釋,以及大量的習題讓讀者來練習書中介紹過的方法,這也就是為什麼該書書名看起來像是課本的原因,因為它本來就是一本課本嘛,而第三本書的風格就比較偏向論文集了。 如果想知道這些棒球統計方法演進的人,可以看 The Numbers Game: Baseball’s Lifelong Fascination with Statistics,by Alan Schwarz 簡單地說,這本書就是棒球統計史,可以讓你知道棒球統計是怎麼從一百多年前演化到現在這個樣子的。 底下的書對我來講並沒有那麼重視(指學習棒球統計方法這個層面而言),所以介紹就更簡單了。 Total Baseball: 就是大聯盟棒球年鑑。 Percentage Baseball,by Earnshaw Cook: 近代棒球統計的突破性書籍,作者對於傳統棒球智慧批評甚烈,可能稍過了一些,而且書中的符號與計算繁雜,相當難唸,列在這裡主要是基於歷史地位。 The Hidden Game of Baseball,by Pete Palmer and John Thorn: 評估選手價值的另一套系統 Linear Weight 就是這裡開始的,不過這套系統有嚴重瑕疵,在 Win Shares 書中談了不少。 Moneyball,by Michael Lewis: 如何將棒球統計的結果應用在選球員與球員交易,進而讓球隊少花錢多贏球? 本書中著墨不少。雖然此書寫的可能稍微將事實誇張化了一些,但寫得妙筆生花,讀來津津有味。可惜台灣棒球界制度不善,所以本書拿來台灣也就英雄無用武之地了,唉~~~ -- Win Shares (暫譯勝場貢獻指數) 是由棒球統計魔人 Bill James (現任紅襪隊 Senior Advisor, Baseball Operations) 所提出用來衡量棒球選手攻守整體價值的一套系統, 我 將原公式作了些許的調整與取捨, 以用來計算中華職棒史的球員排名. 相關文章放在 ptt BBS 站 CPBL板精華區以及台灣棒球資訊網專欄區 http://twbaseball.info/column_alist.php?editer_no=21 歡迎來信指教 ^^ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 69.162.28.246
RaXePhOnZeRo:癡漢魔人耶XDD ( ̄▽ ̄)y—~ 59.117.124.162 03/10 00:45
keith2822:期待電子書 61.59.19.91 03/10 00:46
lannkyle:底八格你要我把那句話重推一次嗎 XD218.163.144.240 03/10 00:47
Debugger:哪句? @.@ 69.162.28.246 03/10 00:48
GniKcol:我們都崇拜數據癡翰底八格 221.169.17.88 03/10 00:48
lannkyle:痴漢無敵,我們都崇拜痴漢底八格 <(_ _)>218.163.144.240 03/10 00:50
RaXePhOnZeRo:痴漢無敵,我們都崇拜痴漢底八格 <(_ 59.117.124.162 03/10 00:51
Tsaurs:看完之後有種背脊發涼的感覺,感謝您! :)140.117.196.144 03/10 01:02
Debugger:背脊發涼? ( ̄□ ̄|||) 69.162.28.246 03/10 01:10
LeftVision:一直有個疑問,台灣的教練是不理會呢 61.229.135.44 03/10 01:10
LeftVision:還是他們根本不懂數據代表的意義? 61.229.135.44 03/10 01:11
LeftVision:否則怎會有悟飯換比克再換克林的鳥事 61.229.135.44 03/10 01:13
Debugger:有的東西必須要有足夠的數學底子才知道在 69.162.28.246 03/10 01:13
Debugger:幹嘛 光打球是不會自動學到的 69.162.28.246 03/10 01:14
c823021:FISHER看到會想哭..... 222.157.120.26 03/10 01:15
c823021:還有機率在0-1之間 222.157.120.26 03/10 01:15
c823021:只有平均數 沒有標準差 哪知平均數是否準 222.157.120.26 03/10 01:18
Debugger:我不知道樓上講的東西跟本文有什麼關係 69.162.28.246 03/10 01:19
Tsaurs:背脊發涼是因為發現原來天空不是只有一口井140.117.196.144 03/10 01:20
Tsaurs:那麼大而已! XD140.117.196.144 03/10 01:21
c823021:機率根據3大公設而言在0-1間 222.157.120.26 03/10 01:23
c823021:所有棒球數據後面有"率'都應該屬於這個規 222.157.120.26 03/10 01:24
c823021:範但是我看到的數據超過1都違這個規範的 222.157.120.26 03/10 01:25
Debugger:率本來就不一定是機率 英文是寫 69.162.28.246 03/10 01:38
※ 編輯: Debugger 來自: 69.162.28.246 (03/10 01:38)
Debugger:percentage 不是 probability 69.162.28.246 03/10 01:38
Debugger:不要拿著自己的解釋再來說這個解釋是錯的 69.162.28.246 03/10 01:39
Debugger:如果你是覺得翻譯不好 那就想辦法弄個比렠 69.162.28.246 03/10 01:40
c823021:那中文就要修正 222.157.120.26 03/10 01:41
c823021:用原文就沒事了 222.157.120.26 03/10 01:42
Debugger:較好的出來 在那之前 只能用我知道最好的 69.162.28.246 03/10 01:42
c823021:還有這不是我定義的 俄國人定義的 222.157.120.26 03/10 01:43
c823021:我還沒那麼利害 222.157.120.26 03/10 01:43
Debugger:我是說"率"的解釋 沒人在講學術名詞 69.162.28.246 03/10 01:43
Debugger:俄國人可沒說率只能代表機率吧? 69.162.28.246 03/10 01:43
c823021:那請用原文不要造成困惱 222.157.120.26 03/10 01:44
Debugger:那請去純英文討論區 你來錯地方了 69.162.28.246 03/10 01:44
c823021:俄國說probability是機率..... 222.157.120.26 03/10 01:46
c823021:但是percentage最多用中文翻如比例或...類 222.157.120.26 03/10 01:46
Debugger:一個問題 率能不能當比率解釋? 69.162.28.246 03/10 01:47
Debugger:比率超過一有什麼問題嗎? -_- 69.162.28.246 03/10 01:47
c823021:基本上機率或percentage定義搞不懂 222.157.120.26 03/10 01:48
c823021:如何談統計棒球 222.157.120.26 03/10 01:48
c823021:請看http://episte.math.ntu.edu.tw/artic 222.157.120.26 03/10 02:00
c823021:/mm/mm_02_3_11/index.html 222.157.120.26 03/10 02:02
c823021:台大楊維哲機率一講的第6到第11 222.157.120.26 03/10 02:03
Debugger:從頭到尾只有你在講機率吧? 文中的機率只 69.162.28.246 03/10 02:03
Debugger:講到打擊率 其他的就是率而已 你愛怎麼解 69.162.28.246 03/10 02:04
c823021:基本上機率的發展是從機率空間開始再來條3 222.157.120.26 03/10 02:05
c823021:3大機率公設 222.157.120.26 03/10 02:05
Debugger:釋則不是我能決定的 69.162.28.246 03/10 02:05
c823021:可是你們所用的都是條件機率的概念 222.157.120.26 03/10 02:06
mate45:c板友真的很認真了,不過態度可以好意點喔 203.72.77.157 03/10 02:05
mate45:沒必要虛吧 ^^|| 203.72.77.157 03/10 02:06
Debugger:你可以先找到一個講機率但是超過一的例子 69.162.28.246 03/10 02:06
c823021:不好意思討論統計我會態度比較不好 抱歉 222.157.120.26 03/10 02:07
Debugger:再來談這個問題不遲 69.162.28.246 03/10 02:07
c823021:D先生請問你是學文的還是學理工的 222.157.120.26 03/10 02:16
Debugger:數學 69.162.28.246 03/10 02:18
c823021:哪你知道機率空間嗎???? 222.157.120.26 03/10 02:19
Debugger:學過 69.162.28.246 03/10 02:20
c823021:事件跟機率空間的觀念可以交我1下嗎 222.157.120.26 03/10 02:22
Debugger:力有未逮 69.162.28.246 03/10 02:47
Cathay:講不出道理就孬起來了140.112.212.205 03/10 09:48