Re: [情報] WAR, a case study: Fielder vs. Ryan

作者nickyang (肌腱炎者少打字)

站內MLB

標題Re: [情報] WAR, a case study: Fielder vs. Ryan

時間Sat Mar 2 02:10:46 2013

※ 引述《abc12812 ()》之銘言： : : 推 julians:我很好奇的是說，如果是這樣的話，那我們擺九個Ryan跟擺 03/01 12:58 : → julians:九個Fielder最後得到的勝場會不會差不多呢? 03/01 12:59 : : 理論上是這樣沒錯 : : Ryan的打擊在一壘會很悲劇但同樣的Fielder當游擊霸的守備肯定也很悲劇 : : 推 Guillen:不會，因為Ryan移去一壘的話WAR會大降，可能會變成負的。 03/01 13:00 : : 理論上不會變因為Ryan照理說會比"守備好的一壘手"再更多攔到很多球 : (可以想像一下Pujols和Ryan的範圍差距) : : 這些多攔到的球抵消掉轉一壘的position adjust (約15分) : : : 不過實際上沒人這樣玩過所以無法驗證其實相反，我覺得理論上不會這樣 wOBA也好、TZ、ZR、WAR也好，所有的關鍵都在runs created/saved上 runs created/saved最後是連到理論勝率上這當中的橋樑都是回歸分析，回歸分析取是大數，不是極端值任何時候你也只能應用這些數字在大樣本、接近平均值的樣本例如說，一支一壘安打長期而言等於0.17分但是在Barry Bonds前面的一壘安打是不是0.17分？很顯然不是，因為Bonds就是個離群值一樣的道理，positional adjustment SS +7.5、 1B -10都是大數取樣你把很顯然的離群值擺進去還能用這個數字推論嗎？可能可以，但是要很小心打個比方，假設今天你用一個價錢區間在$100~$200的東西推算價格彈性那麼能不能計算你把他漲價漲到$1000時的銷售量？不管你在$100~$200之間用的是哪一種curve，out of sample的數字理論上都是沒根據的甚至極端一點，任何沒有出現過的price point都是沒根據的，即使within sample range 我們信賴現在wOBA乃至WAR的理由是他們的計算結果極為接近真實情況 (全隊的wOBA、SIERA推論全隊得失分準確，全隊得失分推論全隊勝率準確）但前提是多數球隊都在你的sample pool裡面玩，沒有人瘋到把肥王子丟到SS 當我們今天要討論肥王子這個個案的時候，守位校正已經失準了事實上，任何的個案都存在這種情況，例如說拿FIP看全盛時期的大數準不準？ FIP可能對99%的球員都準，但偏偏對他就很可能不準 SIERA對他可能稍準一點，但同樣的，因為他是個很例外的投手，你拿根據多數投手計算出來的加權套在他身上誤差就會偏高 : 推 julians:然後，如果Fielder移到游擊去WAR不也會因此大降呢? 03/01 13:12 : → pujos:胖王子去守游擊WAR可能會升.而且機率不是一般的大*-* 03/01 13:14 : : 理論上也是不會變 : : Fielder當游擊霸的防守恐怕不是普通的慘烈 : : → pujos:守備要扣到比在1b慘有可能嗎xdd 03/01 13:17 : → pujos:只要不是連一壘都傳不了.範圍小就小了 03/01 13:18 : : 游擊手比較的對象最爛的是至少很會跳傳的Jeter : : 雖然沒人實驗過但Fielder當游擊真的很可能一個反手就是內安 : : 這樣看來還有人會覺得轉職WAR就會自動加分嗎? 另外一個問題是WAR的假設，對的根據WAR的假設你說的沒錯但是WAR的假設符合這個case嗎？恐怕不是 WAR假設所有的守位可以透過平均校正，這個校正本身忽略了很多因素例如說假設有個人正手接超強反手接超爛，他站在左邊或右邊差異就很大但這個校正的假設是不管你換到哪個位置你的守備能力都不會變再來，守備位置有沒有可能影響打擊表現？ WAR的假設是沒有，很多球界的人相信有，我們不知道有沒有，或說有多大 : : 推 hunterqiji:任憑WAR再怎麼合理﹐真正付錢的老板和GM還是不認的 03/01 13:19 : → hunterqiji:一個簡單的問題﹐Ryan能簽到20M/y的合約嗎? 03/01 13:19 市場效率是一件事，硬球之前有篇文章談守備職人是不是衰退比較快那篇文章懷疑是的。所以Bourn簽不到符合WAR的大約、Ryan甚至連張普通約都可能拿不到也許反映的不是市場效率不彰，是球團的人遠比你以為的聰明 : : 推 TaiwanNeko:守備組薪水比不上重砲手的另一個原因，球迷喜歡打擊大 03/01 21:56 : → TaiwanNeko:爆發勝過穩定的守備，球迷多自然賺的多 03/01 21:57 這話不是沒有道理，但關係可能沒那麼強得分跟全壘打佔票房的比重的確高過失分，但是戰績跟球場才是最重要的 : 推 blue142857:問題是一壘手根本不可能cover"大部分"右半邊內野 03/01 22:56 : → maxspeed150:你怎麼知道不可能? 03/01 22:57 : → blue142857:一壘手在多數的情況下還是會回到壘包而非出去搶球 03/01 22:57 : → maxspeed150:這些守位分數可不是亂加亂扣的 03/01 22:57 不是亂加亂扣，但是沒辦法處理極端值另外blue142857說的也是很有可能，兩個活動力一樣的一壘手跟三壘手假設他們正反手接球都一樣好，他們的站位會一樣嗎？很可能不會，站三壘他可以站得很靠二壘，但是站一壘他必須要回去接球這樣的差別可能只在一個人活動力大到可以站在二三壘中間依舊cover三壘時才出現大部分的情況下不會有這樣的一三壘手，但是Ryan會不會是？我們不知道 : 你給Fielder守1B他當然撿不到幾球但Pujols就不同了 : : 可是Pujols的範圍又跟Ryan有差 : : 可以想像一下Ryan如果守1B會是多神的防守者事實上我覺得Ryan越神這個差距就越無法預測他越是out of sample，我們越不知道會發生什麼事 : → maxspeed150:備就是一個慘烈 03/01 23:13 : → maxspeed150:就是因為1B從來就不會有很多很多球可以守才有守備扣分 03/01 23:13 : → maxspeed150:在看WAR時請把那些理所當然的直覺丟掉一切讓統計數據 03/01 23:14 : → maxspeed150:說話 03/01 23:14 這樣講我覺得就有點太過，任何的統計都假設，你要很清楚這些假設才能正確的讓數字說話。當這個數字出來違反你的常識的時候，除了懷疑常識是否正確也要懷疑假設是否還適用 : → maxspeed150:WAR這東西就是為了要更客觀評價球員才發明的 03/01 23:57 : 推 blue142857:WAR是個客觀評價的標準這我同意　但個人認為他的缺陷在 03/01 23:58 : → blue142857:其實也不算缺陷啦..反正就是他是用統一修正的數據 03/01 23:59 : → blue142857:所以對每個隊伍而言同樣把一個球員WAR提升2.0 03/01 23:59 : → blue142857:可能會因為隊伍組成而帶來不同的效益 03/02 00:00 其實與其說是為了客觀評價，不如說是為了簡化理解你對.3/.4/.5沒概念，換成幾勝總有概念了吧？但問題就在，WAR是透過層層回歸計算的結果，每一次的計算都有假設有越多的假設運用的限制就越多這是不是缺陷？我覺得這不算是缺陷，重點是你要理解你模型的假設跟限制 : 推 OoyaoO:如果規則改成多守下一分對方球隊得分會減1 多守跟多打一分 03/02 00:49 : → OoyaoO:的價值才會相等吧 03/02 00:49 : → OoyaoO:多守了3分被尻陽春HR但是打不下分最後還是會0：1輸球不會 03/02 00:51 : → OoyaoO:變成0：-2贏球 03/02 00:51 你這樣的理解就跟WAR的應用不同了，打出一支一壘安打不會馬上幫你在計分板放上0.17分，但是長期來說會往這個方向回歸一場比賽0:1輸球還是2:0贏球從來都不會是統計的重點統計處理的是長期，是一整季是一個世代，一場球的輸贏表現是沒辦法用任何數字預測的 : 推 waijr:一些統計方法都會有極端值一般來說都是拿掉有必要鑽牛角尖 03/02 01:01 : 推 prereality:要找出war的弊端我覺得很容易假設你找了8個在各防守 03/02 01:12 : → prereality:位置都是頂尖war但是攻擊指數平均只有6~7左右的野手組 03/02 01:12 : → prereality:成一隊應該就會發現問題出在哪了 03/02 01:14 : → prereality:但所謂這種找出8個極端的球員組在一隊並且讓他們打滿 03/02 01:17 : 推 OoyaoO:不可能沒人會去做這種看起來就死定而且高成本的實驗 03/02 01:18 : → prereality:整個球季這種事情現實中幾乎不可能發生所以很難去反駁 03/02 01:19 : 推 catsondbs:現實中防守打擊以外的變數也很多投手+守備也不能控制 03/02 01:27 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 68.61.37.218

推 sitos:推 03/02 02:15

推 oralboralb:好文 03/02 02:20

推 catsondbs:推推這篇即使沒有甚麼數字也好想推數學去死 orz 03/02 03:06

推 asd831129:簡單來說不該用9個Ryan對上9個小王子這樣比較 03/02 03:46

推 onime0704:推! 03/02 03:55

推 Guillen:推 03/02 04:01

推 knoxvillt:大推這篇幫到我理解很多東西 03/02 04:32

推 genie2:推，說得很清楚又仔細 03/02 04:39

推 lolity:推 03/02 05:39

推 blue142857:深夜好文 03/02 06:08

推 m16a117:推 03/02 08:29

推 x147159357:好文大推!! 03/02 08:36

推 jhoc:推 03/02 09:53

推 immortalqq:感謝學長好文 03/02 10:05

推 Sunrise2516:推 03/02 10:19

推 away01231259:推 03/02 10:30

推 hardway:深入淺出啊 03/02 10:40

推 catsondbs:早上再來看一次 WAR守位修正應該也是基於replacement le 03/02 10:46

→ catsondbs:vel的概念對嗎？ 03/02 10:46

推 catsondbs:....腦殘了 WAR本來就是說 replacement level 03/02 11:09

推 julians:感謝大大好文 03/02 11:18

推 azlbf:關於守位影響打擊其實是有的其實守備很消耗體力跟精神 03/02 11:45

→ azlbf:但是你說Ry去打DH打擊成績會好很多嗎? 這也未必 03/02 11:46

→ azlbf:只能說專心打擊的DH有更多時間去調整自己的下一個打擊 03/02 11:47

→ azlbf:也有更多的時間休息以及觀察投手 03/02 11:47

推 sft005:總是有很多人認為數據統計要反映在每"一場"比賽 Orz 03/02 12:10

→ sft005:我真的希望大多數人可以花一點小時間來看看這篇文章 03/02 12:11

推 maxspeed150:但是彭政閔前幾年也說如果上場守備比較不會胡思亂想 03/02 12:44

→ maxspeed150:打擊狀態反而比較好當然這類討論已經超脫數據能說的 03/02 12:44

推 lwifbf:專業好文 03/02 15:07

推 Sheffield3:push 03/02 15:18

推 kenkenken31:推~ 好文 03/02 16:42

推 Sparksfly: 03/02 17:19

推 Sechslee:推 03/02 17:29

推 TheVerve:推好聞 03/02 20:07

推 Yukirin:推最後一段尤其好 03/02 21:42

推 aftermathx:看好幾遍才看懂原來"大數"是指"大樹" 03/03 00:00

推 gghh:推！好多引戰哥都腫了 03/03 05:34

→ nickyang:沒有什麼腫不腫，有想法敢討論比推廢話強一萬倍 03/03 08:01

推 Ruri:意思是說,不該存在九人都是胖王子這種假設來比嗎? 03/03 09:23

→ nickyang:該說像他守這麼爛的是無法預測的 03/03 12:14

→ maxspeed150:我推斷時是沒想到極端值的問題....... 03/03 12:40

推 TKWdEmoN: 03/03 13:12

推 abc12812:position adjust是拿有多重守位的球員做計算這樣有個盲 03/03 13:14

→ abc12812:點是會玩大風吹的大多是有SS底的工具人所以計算起來 03/03 13:15

→ abc12812:SS => 1B的價值估計比較準 1B => SS的估計容易失真 03/03 13:15

→ abc12812:回到Ryan/Fielder的問題如果調換守位我會猜Ryan 1B 03/03 13:16

→ abc12812:會比較接近估計值(~15R) Fielder SS 會比較偏離估計值 03/03 13:17

→ abc12812:9 Ryan 推測起來應該會比 9 Fielder強 03/03 13:17

推 tckenny1:好文推 03/03 16:16

推 hakkacandy:推這篇!真的是"深入淺出" 03/03 21:19

推 b2209187:推好文章! 03/03 23:19

推 gghh:如果所謂「想法」只是拿著「數據」亂用，那比推廢文還可怕 03/04 09:16

→ gghh:偏偏有些假數據派就是拿著雞毛當令劍鬼扯 03/04 09:17

→ gghh:這點在當年大樹哥當紅時特別明顯 03/04 09:18

→ gghh:如果一昧敵視中文報導無論良窳是CCR，那把數據亂用鬼扯 03/04 09:19

→ gghh:其實跟被鄙視的墮落媒體沒兩樣 03/04 09:21

→ gghh:而本篇提到的很多觀念其實只是計量、統計的基礎觀念 03/04 09:22

→ gghh:不是說不能犯這種基礎錯誤，但本版長期以來的風氣，嘿， 03/04 09:30

→ gghh:或許是比較支持容忍這種問題吧 03/04 09:32