精華區beta MLB 關於我們 聯絡資訊
不要看到鐵壁就興奮的點進來看有沒有短裙啊各位(? 德州遊騎兵目前為止83W57L,全大聯盟戰績第二,僅次於今年一飛沖天的小熊, 但是開季的時候戰績大概沒有人想得到,看一下到目前為止的美西季後賽機率, http://i.imgur.com/PRRkUL9.png (from FG),開季還被看雖墊底。
再提供另外一個數字,今年他們的Pythagorean Win-Loss[註一] 為 72-68 跟實際勝場勝差來到了十一場,曾經有過這樣表現的季後賽隊伍,近十年來只有 2012的金鶯(93-69, pyth W-L 82-80, 2012 AL Wild Card), 以及2007的響尾蛇(90-72, pyth W-L 79-83 2007 NL West 1st), 超出畢氏勝率很多的原因,假設不懂數學的話,直觀上的猜測就是: 贏的分數不多,於是一分差比賽是一個值得參考的點。 今年的條子跟陳偉殷到美國第一年的金鶯,都有一個歷史級的紀錄: 一分差比賽的勝率 在今年以前,2012金鶯的一分差比賽 為29-9 76.3%的勝率,為史上第一, 而條子到目前為止已經是30-9更是超越了金鶯的紀錄。 可是這個表現到底是運氣?還是實力與技術? (雖然我在數據上很不喜歡用運氣這個字,但實際看球肯定感受得到。) 在看數據之前先喚起各位的回憶,畢竟那時候開始就變成民視/ESPN金鶯台,有很多比賽看 Buck Showalter一直是一個以善於調度,與掌握牛棚時機的教練, 近幾年來也讓金鶯都是以鐵牛著稱, 就算是看球的印象派,也可以發現inherited runners常常回不來。 近年的金鶯防守都很強悍,而當年的牛棚有蚵嗲,以及年度救援王後來爆炸的金江嬸。 在當時金鶯創下歷史的時候,就有人提出相關的論點[註二], 這裡用logit model跑了07-11年的一分差賽事,模型裡面還放了一堆變數像是park factor, 但模型解釋中,只有IsoP,RPs' K/9 & RPs' BB/9有顯著,其中RP的能力很直觀, 但IsoP的顯著性大於我們觀念中可以造成對手壓力與不確定因素的擊球率與保送率, 甚至防守跟跑壘也都不那麼重要。 (當然,去年的World Series大家看見過了,那所謂的皇家靈氣就是不確定因素) 再來他把同一個模型拿去與一分差以上的比賽做比較,可以發現後援投手在一分差比賽 的影響大於一分差以上的比賽如下圖: http://i.imgur.com/NCdVu8u.jpg
這樣的結果的確make sense,而且看到保送在一分差的負面影響比起一分差以上更明顯。 的確,這三樣東西也是當時金鶯隊強項,只是模型預測出來的勝率,金鶯在一分差的 勝率為64.7%,但實際上我們看到了一個歷史級的存在,76.3%,好吧,剩下來的部分, 就只好交給良好的總教練技術來做解釋了lol 回到條子,目前為止,條子的得分差為+21,在一週前Fangraphs預測球季只會有84勝, 而現在他們已經接近這個數字,在季末要贏下AL West 1st並且超過90勝也不是太大問題。 原因就出在於他們優異的一分差賽事表現,即使同區的太色人勝分差來的更多。 ok,先暫停一下,條子的牛棚算強嗎?雖然在五月中拔掉了Tolleson之後, 可以看到球隊戰績節節高昇,但是球隊牛棚的BB%中段班,K%甚至倒數, (畢竟牛棚屬性都不是三振高手) 雖然團隊的SV是聯盟並列第一,但是ERA也好WAR也好等等數據,都是後面數比較快, 怎麼跟上面的結論不太一樣?看看IsoP吧,不然臉要腫起來惹。結果只有11名!? %%%%%%%%%%%%%%%%,我的臉好腫。 於是跑了一下regression,用近三十年的牛棚WAR跟一分差勝率來跑,嗯, 看來這兩個outlier根本不能解釋,好吧,丟人現眼QQ 雖然帶著正相關,但是相關係數連弱正相關的0.3都沒有,只好先放旁邊。 (雖然一開始跑之前好像就猜的到這種結果惹= = 居然妄想用回歸來解釋這種看起來是outlier的東西,臭87) 不過仔細看一下牛棚組成,當然吸塵器更生人Diekman都蠻強的,(有個酒駕被關的跳過) 可是牛棚裡面也有一些OO,例如被拔掉的Tolleson, Wilhelmsen等, 如果要說這些高手去扛一分差很猛也是合理,你當然不會看到後面那些OO在一分差出現, 除非逼不得已,所以這些人拖低了WAR。 當然,牛棚的確可能overvalued,因為計算的槓桿不同,牛棚每多1WAR就可以多1.18勝, 把WAR轉換成勝率對於牛棚來說顯然可能高估了。 所以我們得另外找一下有沒有其他因素,歷史證明法已經失敗了。 然後就看到了一篇CBSSport寫到的「關鍵時刻的打擊帶領條子創造MLB歷史」[註三] 看來我們要縮小尺度到一些一分差的單場比賽觀察Win Probability, 否則純看WPA大概會跟上面有差不多的結果。 這篇舉了8/31拳王歐多九局下的兩分砲,從一分差loss變成一分差win,看一下這圖, http://i.imgur.com/cflS7pA.png
(想看互動式的請洽http://goo.gl/n66D4Z 這是FG的頁面) 看起來非常精美的,原本在吹哥打出了安打後還是可能輸球,結果一棒就怒提高了80% 直接灌成100%贏得勝利。 看樣子都是時機問題,時機若對,就可以贏下一分差。所以決定去看一下FG的Clutch, 與調查這支球隊的RISP,與各種情況下的OPS。 先來看Clutch,果不其然,6.36。這項數據以零作為平均數,大概在2就是很優秀了, 他們幾乎要是聯盟第二名的1.7倍,表示關鍵時刻有一套。而根據上面CBS的文章內顯示, 這應該是歷史級的數據,FanGraph則顯示這是近百年來第九位的數據 (http://goo.gl/GxnBK2) 另外,當壘包空空的時候球隊只有0.750的OPS,只要一有人就變成0.780, RISP也是0.780,這在聯盟是相當靠前的水準。 除了純二壘有人打比較不好外,其他狀況都相當亮眼, 並且局數越後面打越好,比數越靠近也打越好。 (數據很多,詳見BR http://goo.gl/V77VYc) 這樣的結果,可以歸咎於氣勢,或者是總教練善於派能面對大場面的選手, 這有非常多的因素,讓我想到不知道誰說的The will to win,但相對的, 可以看出這樣的結果與統計事實比較不相符,是否很stable也要再做觀察, 畢竟到了季後賽大場面,選手可能軟手,牛棚也都是各隊精英,還能不能有這麼高檔? 到底是真的有啥科學根據,像是金鶯那種做法,還是條子的The Will to Win呢? 就看這種Clutch可以帶著條子在季後賽走得多遠吧! ============================================================================== [註一] Pyth W-L的公式,常見的Bill James版本為RunsScored^2/(RS^2+RunsAllowed^2) https://arxiv.org/pdf/math/0509698v4.pdf 這份PDF充分的證明了Pyth W-L以及其指數不應該是2 而是1.82 作為本科系學生加上愛好者其實看到這個就...阿斯>///< 推導的蠻漂亮的 詳細內容有點困難,可以簡略看過。 [註二] http://www.fangraphs.com/blogs/how-much-luck-is-involved-in-one-run-games/ logit model是統計上常用的一種非參數方法,常見的應用如:信用卡違約機率等 是一種可以把回歸的outcome壓縮到0,1之間的實用技術,壓縮成二元應變數之後, 計算odds ratio 勝算比也非常容易了。 [註三] http://goo.gl/iiu9UZ ============================================================================= 希望各位批評指教,可以寫得越來越好... 當然下一次可能不會發這麼數據的文,應該會試圖翻譯一些其他的~ -- 「一直保持朋友關係,是很快樂。而愛的越深,受的傷害也越大。」 「但是,人還是要戀愛吧!」--by Haruka Koga 「所以全國四千所學校的高中生,才會那麼期待和甲子園約會。」--by Hiro Kunimi -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.249.176.219 ※ 文章網址: https://www.ptt.cc/bbs/MLB/M.1473349201.A.9C7.html
sam9595: 推推 09/08 23:44
jefftie2000: 看不懂不過好像很厲害XD 09/08 23:47
MasterAsia: 推~ 09/08 23:49
※ 編輯: rn940111 (111.249.176.219), 09/08/2016 23:51:47
lowl99: 條子的牛棚說不穩真的不穩,說穩也是真的很穩 09/08 23:52
robert6615: 專業推 09/08 23:56
noahlin: 一分差39場樣本數也不少了 看季後賽褲子會不會不見 09/08 23:59
ericf129: 推 09/09 00:00
allen63521: 推結論 這才是面對統計數據應該有的態度,不是當加減法 09/09 00:03
okinawa8: 之前有陣子還有得失分差-1結果聯盟一位... 09/09 00:03
eatlion: 推 09/09 00:16
mimikuX: 推一下,可以順便分析一下我襪為什麼一分差一直輸嗎?XD 09/09 00:18
htme: 紅襪迷感到羨慕 09/09 00:22
kevin83h: 專業推 09/09 00:29
kamihio: 例賽的成功 要再季候賽的強度才能見真張 09/09 00:36
accjm2440: 推 雖然不是很懂XDD 09/09 00:43
kevinduh4: 推 09/09 00:44
GaryMatthews: 2011 WS G6 也是一分差 我要被條迷追殺了 .... 09/09 00:46
uranusjr: 統計這種東西本來就註定會有 outlier, 不能解釋就不能啊 09/09 01:16
uranusjr: 看到一個現象就想找原因來解釋/歸咎是人性, 但這世界上 09/09 01:17
uranusjr: 就是有運氣這種東西, outlier 是統計的一部份, 是規則的 09/09 01:18
uranusjr: 例外, 但不是讓定律失效的 X factor 09/09 01:19
uranusjr: 然後這結論其實滿爛的, 季後賽能走多遠和這個現象有沒有 09/09 01:20
uranusjr: 根據其實一點關係不大; 季後賽的小樣本會造成更多偏差可 09/09 01:20
uranusjr: 能, 而這些因素的影響遠大於影響季賽表現的因素, 所以季 09/09 01:21
rn940111: 應該這樣說,很多方法可以處理離群,但是我今天不這麼做 09/09 01:21
rn940111: ,是因為今天目的是來看看這隻球隊的特性為何來做討論。 09/09 01:21
uranusjr: 後賽的表現不能證明任何事情 09/09 01:22
uranusjr: 喔我沒有要質疑你的分析方法啦, 你看的東西都沒問題, 分 09/09 01:23
rn940111: 所以我的結論不想說死,因為季後賽小樣本,我覺得靠關鍵 09/09 01:23
rn940111: 一擊不是很穩。我也沒說金鳥好棒,但是他們的一分差勝率 09/09 01:23
rn940111: 原因來自於統計結果,跟這種比起來,我想看看他們能走多 09/09 01:23
rn940111: 遠,我也其實不是下什麼結論lol 09/09 01:23
uranusjr: 析也很仔細, 只是你前面寫的其實沒辦法導出你最後的結論 09/09 01:24
uranusjr: 如果那不是結論, 你最後一段就不能那樣寫 XD 我隨便猜一 09/09 01:25
uranusjr: 下你應該是大學生?還沒經歷過被釘爆過研究方法, 雖然有 09/09 01:25
uranusjr: 料, 但論述的方式有問題這樣。其實真的寫得不錯啦, 再多 09/09 01:26
uranusjr: 思考一下怎麼從分析 extract 出抽象概念就完美了 09/09 01:27
rn940111: 謝謝指教XD 我是剛畢業的沒有錯哈哈 09/09 01:28
rn940111: 應該這樣說,結論是兩支球隊屬性不同,但是在賽季成功的 09/09 01:33
rn940111: 因素如上。至於季後賽,我只是希望看這種表現能不能延續 09/09 01:33
rn940111: ,畢竟這種戰績跟贏球方式並非我們統計上看到的結果。 09/09 01:34
rn940111: 但如果還要評估季後賽分析,一方面小樣本會不準,二方面 09/09 01:34
saiulbb: 推推 仔細看真的很不錯 09/09 01:44
JustinIdiot: 其實Banister上任後 條子的實際勝率一直是大於理論 09/09 02:37
JustinIdiot: 勝率 然後撇開誇張的一分差 條子今年的理論勝率難看 09/09 02:38
JustinIdiot: 的原因跟投手頗有關 輪值除前兩號之外不夠穩定是一 09/09 02:38
JustinIdiot: 個理由 有趣的是當你看數據以為條子牛棚很差的時候 09/09 02:38
JustinIdiot: 真正看比賽這群牛會稍稍顛覆你的印象 幾乎每個都配 09/09 02:38
JustinIdiot: 備95+的速球 也都各有上得了檯面的變化球 幾個主要 09/09 02:38
JustinIdiot: 牛還是偏滾地投手 事實上 有些評論家在開季前認為條 09/09 02:39
JustinIdiot: 子的牛棚是全聯盟前段班的 09/09 02:39
JustinIdiot: FG這兩年都看衰條子阿 不過全國的評論家就不是這麼回 09/09 02:41
JustinIdiot: 事 雖然當時看好太空人的還是佔較多數 09/09 02:41
rn940111: 對 我在上個月才跟一位朋友提到,明明對條子牛印象很好 09/09 03:01
rn940111: 可是看數據天差地遠,第一個想到的就是敗戰組太爛,只是 09/09 03:01
rn940111: 有時候難看是因為都算是滾球投手的緣故 09/09 03:01
rn940111: 但是總體表現的ERA不好看還是一個無法抹滅的緣故,只是 09/09 03:05
rn940111: 可能就算大好大壞,但clutch可以說無庸置疑我認為 09/09 03:05
yusei: 安安 09/09 03:55
mannypo: 用心推! 09/09 07:04
lanver1220: 不是很懂,總歸一句 條子運氣很好 09/09 07:34
Roshiel: 一分差比賽,感覺勝負也是他媽的運氣 09/09 08:25
king90333: 反正關鍵時刻條子都會軟手 09/09 08:33
Yginger1: 非常簡單 因為條子勝利組的牛很強 守備又好 DP是全聯盟 09/09 08:35
Yginger1: 最多 牛的整體ERA會那麼難看是因為特定幾隻牛被炸了 不 09/09 08:35
Yginger1: 過那幾隻不是被交易就是下放 09/09 08:35
KAIS: 版主很有心 09/09 08:35
lyra53: 專業推 09/09 08:38
kee32: uranusjr真是好人~ 09/09 08:59
kee32: 這篇內容也很認真,板主讚! 09/09 09:00
Asucks: 專業文大推 09/09 09:01
Lucroy: 應該是我加入的關係吧~XD 09/09 09:05
allen63521: SORRY我上面推文說到的結論是指倒數第二段,網路上面看 09/09 09:21
allen63521: 到的數據文常常落入太死的窠臼 感覺原po好像跟我唸 09/09 09:22
allen63521: 同個系 09/09 09:22
Ymie06: 推用心~ 09/09 09:52
vgil: 推分析 09/09 10:25
lightpisces: 推用心 09/09 10:27
edhuang: 推 但我一開始看成條子的一球差比賽 09/09 10:40
edhuang: 然後就馬上連結2011………… 09/09 10:41
jack8759: 推! 09/09 10:41
a26513323: 推 09/09 10:48
alpacaHong: 12金鶯是靠強大牛棚守住的,今年條子則是靠打擊逆轉的 09/09 10:50
alpacaHong: ,看有一場牛棚10上掉兩分結果10下硬是得三分逆轉就知 09/09 10:50
alpacaHong: 道 09/09 10:50
austin7037: 推 09/09 12:01
sulaeric: 專業推。看好條子進世界大賽 09/09 13:58
pohao522: 水,見樹不是樹 見林亦非林,世上沒有一個理論能全吃的 09/09 14:03
pohao522: !凡事都得依賴腦子去判斷,不然電腦就是無敵! 09/09 14:03
toeternia: 推 09/09 14:09
lai35700: 好專業啊!另外看標題我直接想到2011年XD 09/09 19:36
Yenfu35: 感謝板大! 09/09 21:12
doraemon8709: 不明覺厲 09/09 22:30
sandysam: 完全沒看扁啊,開季就買了一萬條子美西冠軍 09/09 23:42
acd51874: 看得懂大部分,後面解釋統計的東西就看不懂了QQ 09/10 00:22
acd51874: 看完這篇突然好想去學統計 09/10 00:23
dan0130: Never ever quit! 09/10 01:20
dan0130: 今天又贏一分差了XD 09/10 20:21
john0601: 雖然看不懂,但是好像很厲害 09/11 01:35
apporience: 好文推推 09/11 06:10
afulet: 未看先猜推文必有2011WS 09/13 12:39