精華區beta BaseballNEWS 關於我們 聯絡資訊
畢式定理看戰績 作者:阿ㄈ | 發表時間:2008/09/26 棒球是數據的運動,在有數據派之前之後,我們都看過相當多有用或無用的公式 ,它包含簡潔明瞭的(如勝率,勝場除以已賽場數),包含內容不知所謂的但結 果很有意思的(如RF,評估守備能力),包含內容看似有意義但結果不知所謂的 (如前陣子有人發明的IsoD,拿上壘率減打擊率),也包含內容跟結果都不知所 謂的(如把農場加上馬戲團可以得到球場)。 但很多會把統計學書當小熊娃娃抱的數據派專家常忽略一件事情,公式要兼顧好 用有效,就要能讓一般討厭數學的人也能算的很高興(或至少不排斥)。 像打擊率這個對於評價打者參考價值極低的數據,之所以到現在還被世界上大多 數搞棒球的人當絕對指標,就是因為它很好算,安打數除以打數,除出來大於0. 3就是強打、大於0.4是神、小於0.2 是廢物,簡單的除法,只讀過小學的人也不 會覺得難。 棒球數據派走到這個世紀,被拿來取代打擊率的公式中最容易推廣的也不是像RC 這種,而是沒有單位的 OPS,上壘率加長打率,兩項資料別人都已經算好給你, 加起來大於 0.9超猛,大於1是鬼神,小於0.6是渣,簡單的加法,只讀過小學的 人也不會覺得難。 Bill James,棒球數據派之父。原本只是一位沉迷於fantasy baseball的宅男, 卻成為眾多鑽研數學統計學問的高手都要拜的一方泰斗。所有由他發明的公式中 ,我認為實用性最高的,就是畢氏定理了。 畢式定理,直角三角形,兩個斜邊的平方加起來,會等於斜邊的平方。所以這跟 棒球有什麼屁關係? 還真的有屁關係,相同的屁就是公式複雜度,棒球上的畢氏定理也是一個只要會 「平方加起來」就可以算的公式。它取用的是一支球隊的得分、失分,求出的是 預估勝率。 Bill James的畢氏定理公式長這樣:球隊總得分的平方,除以總得分平方加總失 分平方,就可以推出這支球隊的預估勝率。 不但好記,而且合乎對勝負的認知,且它在絕大多數情況下可以在球季中估計一 支球團應有的年度戰績,或評估該年該隊的表現是嚴重高估或低估。我們知道球 隊要贏球,要做的事就是得分要比失分多,所以每場比賽打下來,總得分量高比 總失分量高越多,可以合理推估這一隊大概會有較高的勝率。很理所當然的推論 ,而且實際上跑出來的結果誤差不大,畢氏定理就是這個好東西。 但幹嘛要平方呢?其實也不用想太多,乘冪的英文叫 power,一看就知道它很有 威力,要很有威力的應用總得分跟總失分求出夠準確的勝率,就把總得分和總失 分拿去「威力」一下就辦得到XD 拿今年的戰績來說,全大聯盟三十支球隊只有三支球隊的預估勝率跟實際勝率差 距超過0.04(差最多的是Angels的0.07),更有三個分區預估勝率的排名跟實際 勝率完全相等。這公式少數的誤差在紅襪隊的戰績被估計高於光芒、藍鳥隊會高 於洋基、及紅雀隊會高於太空人。 除此之外這個公式準確的把該贏的隊擺在該贏的地方,該輸的隊擺在該輸的地方 ,所以恭喜小熊,老虎吃噴吧,Hank小老闆也不用靠北了,你們隊沒有被藍鳥追 過去掉到分區倒數第二還算你們好狗運。 至於去年拿下88勝74敗,卻罕見的在今年被幾乎所有專家認為「他們是頭殼壞掉 才會想爭冠」的水手隊,正是因為去年他們的預估勝率只有.488,本該是個敗多 勝少的失敗球季。果然今年水手隊在眾望所歸之下順利取得百敗,證明他們去年 的確是fluke。 有Ichiro的球隊雖然有時會發生怪事,但絕大多數的時間還是要向偉大的數學定 理低頭XD 後來這個公式有改良版,Bill James本人認為乘冪值應該由2改為1.82 會得出較 精確的答案。是會比較準啦,可是以今年球季來說,乘冪為 2時三十隊合計的勝 率誤差是.192,乘冪1.82時是.184,平均每隊只差0.000267而已。所以,我們還 是繼續用畢式定理的作法算吧。 2008.09.26 雅虎名家專欄 http://tw.sports.yahoo.com/mlb/blog/mlb_foxx/425.html -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.115.131.167