精華區beta Baseball 關於我們 聯絡資訊
※ [本文轉錄自 Sabermetrics 看板] 作者: Debugger (Win Shares 痴漢) 看板: Sabermetrics 標題: Bill James 的重要想法(6) 時間: Sat May 20 13:00:51 2006 20. 你不知道的球場效應: 球場的規格有所不同,有對打者成績有利的球場,有中性的球場,也有偏投手的球場。 每支球隊都應該儘可能的利用主場來發揮戰力。不過 Bill James 發現了一個神奇的現 象:主場是打者球場的球隊,傾向於擁有較差的打者與較好的投手及守備。理由何在? 球場效應使得該隊的打擊成績變得好看,使得球團認為這支球隊的攻擊火力已經夠用了 。而投手的數據則因球場緣故而不太好看,就算他們不差,球團也會想再找投手來補強 (結果找來的投手到了這個主場之後帳面成績也變難看了)。就因為這樣,這類的球隊 常陷於輸球與補錯人的迴圈之中。不過,球團還是一年又一年的找錯戰犯。 21. 相似分數(Similarity Scores): Bill James 發明這玩意兒的動機很簡單:找出數據最接近的球員。在大量的樣本之下, 若能了解過去一共有哪些選手跟我們現在有興趣的球員數據類似,再看看那些選手的生 涯發展趨勢,便能讓我們對於現在有興趣的球員作出更準確的預測。相似分數的定義精 神是,先把兩個完全一樣數據的球員的分數定成 1000,然後比較他們兩人的數項成績, 每一項依照相差的幅度來扣分,最後全部看扣掉多少。扣的愈多就是愈不相似,也就是 說,最後兩人的相似分數愈接近 1000 就當成是愈相似。 Bill James 說“在棒球界的薪資仲裁,可以說有九成是在看成績最接近的一群人作比較 ,這個比例絕不誇大。“因此相似分數在這方面就很有用了。 這個方法可以用來研究某些球隊或球員在特定情況下的表現。比方說,如果想知道某個 投手會不會在芬威球場投得好,就可以找出歷史中跟這位投手成績最類似的,然後去研 究那些投手在芬威球場的表現。 22. 棒球裡的才能不是常態分布的: 若考慮一般大眾,以量化的方式來描述某項才能,則結果畫在圖上會像是一箇鐘型,也 就是常態分布。落在平均水準附近的人數最多,愈往高或低的兩端移動人數就愈少。不 過當我們考慮某項才能最頂尖的那些人時,比方說大聯盟球員,所有的人才都是從上面 那個鍾型的最右邊少數人取出來的。因此,在這些人當中,最容易找到的等級是最底端 的那級,而不是平均水準的那級。 23. 畢達哥拉斯理論: 取這個名字只是因為公式跟畢氏定理有點像。 球隊的勝率大約等於 (得分數的平方)/ (得分數的平方 + 失分數的平方)。 24. 純長打率: 就是長打率扣掉打擊率。 要衡量長打能力時,看長打率的缺點是高打擊率的打者會拉高長打率,但這跟長打能力 關係不大。看平均每支安打打出幾個壘包的缺點是,陳文賓會排在比彭政閔前面,但這 只是因為陳文賓的打擊率低很多的關係,並不是他比較會打長打。 25. 電腦不值一提: 在學習電腦的過程中,我們最主要學到的一件事是,電腦是愚不可及的東西。當你花了 一大把時間讓電腦按部就班地處理許多步驟之後,一個不小心按錯鍵,然後完蛋了,彷 彿之前花的時間完全沒有痕跡一樣。就好像在努力地使用吸塵器清理房子之後,按到了 某個神秘按鈕,然後神奇的吸塵器把剛剛吸進去的東西全部噴出來,幫你重新又裝飾了 一次房子。你一定會想“我的媽啊,笨機器啊,你應該知道我不是這個意思啊!你以前 我之前花那麼時間是好玩的嗎?“然後我們才發覺到,電腦對你想做的事情一點概念都 沒有,就跟吸塵器對你想清理的地方一點概念都沒有一模一樣。 看到了吧?機器真的沒什麼值得一提的啊。我們可能心裡會想,電腦會為棒球做些什麼 呢?電腦會對棒球作出什麼改變呢?什麼都不會。電腦不能為棒球做什麼,電腦也不能 對棒球作出什麼改變,就好像你的車也不會自己從高雄開到台北去。電腦能做的只是擴 展我們的能力極限。 電腦對棒球研究者造成的改變,就好像汽車對旅行家造成的改變一樣。有汽車也許會讓 我們到別的地方比較方便,有了電腦讓我們處理資料比較方便。不過如果你本來對出外 旅行沒有什麼概念的話,就算有了汽車也不會讓你變成有概念;如果你本來不曉得該怎 麼研究分析棒球的話,就算用了電腦也不會讓你變成自動學會。 26. 談守備: 當 Bill James 十五歲的時候,他從廣播聽一場紅雀隊的比賽,轉播員談到了某個不是 固定先發的一壘手,說那個一壘手一場球可以用手套幫球隊省下一支安打。James 想, 一個平均每場比賽可以靠守備幫球隊多省下一支安打的球員,就好像是一個平均每場比 賽可以靠打擊幫球隊多打出一支安打的球員。James 作了點計算,發現這相當於那個一 壘手可以打出 0.430 的打擊率(如果他的守備當成是平均水準的話),那他的球隊一定 是瘋了。一個有著平均守備而能夠打出 0.430 打擊率的球員,為什麼不讓他場場先發呢 ? 後來到了 1982 年,Ozzie Smith 拿到了國家聯盟的最有價值球員,有不少人認為 Smith 能一年幫紅雀隊靠手套多守下一百分。James 不以為然。他說,一百分是什麼意思呢?如 果是跟完全不用游擊手,只用八個守備員,那一百分蠻合理的,可是現在是再跟另外一個 大聯盟游擊手相比耶。1982年紅雀隊一共失去了 609 分,是國家聯盟的球隊中失分最低 的,比聯盟平均的失分數低了 53 分。如果 Smith 真的能比平均水準的游擊手多省下一 百分呢?那就是說,如果紅雀隊換成一個普通水準的游擊手,那麼整隊會變成比聯盟平均 的失分數高了 47 分?該年真的有另外一支球隊比紅雀隊多丟了一百分左右,而且那個球 隊的游擊手的守備是低於平均水準的。這不就代表紅雀隊的其他防守員整體表現還不如那 支多丟一百分的球隊嗎?(因為把 Smith 換成平均的游擊手之後兩隊失分差不多,但是 平均的游擊手還是比另一支球隊的游擊手好,所以紅雀隊的其他防守員就要比那支球隊的 其他防守員差了。)在比較了游擊手以外的防守員之後,這看起來是個相當有問題的結論 。James 的估計是,Smith 那年大約其實是比平均水準省下了三十五分,遠低於一百分。 當談到要如何衡量球員的攻守整體能力來選擇讓誰上場時,James 表示,他不相信這個問 題可以用二分法分成想要防守或是想要攻擊。更精確的說,我們應該要知道的是有多少防 守和有多少攻擊。一個球員不可能完全的被歸在純防守或純攻擊的任何一邊,所以問題不 在於二選一,而在於兩者混合之下要如何取捨。但是決定這個問題的答案難就難在防守價 值的難以評估。 傳統我們會看守備率來比較野手。而較新的參考數據則有 Range Factor、Zone Rating 等等。Range Factor 是去算平均每場球(或每九局)守備能殺掉多少個人,而 Zone Rating 則是看落在守備區域的球有多少比例會被守到。James 認為“打擊是固體,投球 是液體,而守備是氣體。“打擊的價值很明確,定義的很清楚,很容易被評估出來。投球 要稍微看一下所處的環境,看隊友的火力支援有多少,這可能會大幅影響勝敗紀錄;也要 看隊友的守備如何,這會影響被打出去的球是出局還是安打。就好像液體雖然體積固定, 但是形狀卻依裝盛的容器形狀而不同。至於守備呢?就像氣體,沒有特定形狀,沒有特定 體積,很難看到,也很難捕捉到。 一個球員不同球季間的守備成績變化不太會被一般人注意到,這有可能是因為對於守備數 據的不了解以及不信賴,所以寧可相信球員的能力不會有很大的變化。另外,一般人也對 失誤這項數據過度反應了。如果紀錄員“覺得“某個球應該會被守到,但是守備員因為種 種可能的原因犯了錯誤,就會被記上失誤。守備數據跟打擊數據差在哪裡?上場打擊時, 沒有意外的話,就是必然會有一個打擊機會(打席數),而打擊成績就是看在這些打擊機 會當中的表現內容。可是當談到守備時,就不一定有守備機會了,而有沒有守備機會又是 三大要素的混合結果:擊出去的球、守備員的處理、紀錄員的判定。如果守備員的能力讓 他完全沒有機會處理到球,那他也就不可能失誤了。缺乏處理到球的能力不會在守備率反 應出來,但這卻是分辨優秀守備員與平庸守備員的分水嶺;優秀守備員與平庸守備員的守 備機會差異,通常遠遠地超過了他們帳面上失誤的次數差異性。那麼,我們為什麼要特別 注意一個沒那麼重要的數據,卻對影響力更大的視而不見呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 69.162.28.246 ※ 編輯: Debugger 來自: 69.162.28.246 (05/20 13:05) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 69.162.28.246
WillWaiting:推debugger大 220.137.251.16 05/20 13:08
Debugger:準備把書打包了 趕快把最後一篇寫一寫 69.162.28.246 05/20 13:09
TDLemon:固體 液體 氣體這比喻很棒耶218.168.212.124 05/20 13:29
chien533:push 24.136.254.54 05/20 15:15
keith2822:推~ 211.74.97.6 05/20 15:26
ohmylife:推 61.30.35.222 05/20 15:58