作者nickyang (肌腱炎者少打字)
站內MLB
標題Re: [情報] WAR, a case study: Fielder vs. Ryan
時間Sat Mar 2 02:10:46 2013
※ 引述《abc12812 ()》之銘言:
:
: 推 julians:我很好奇的是說,如果是這樣的話,那我們擺九個Ryan跟擺 03/01 12:58
: → julians:九個Fielder最後得到的勝場會不會差不多呢? 03/01 12:59
:
: 理論上是這樣沒錯
:
: Ryan的打擊在一壘會很悲劇 但同樣的Fielder當游擊霸的守備肯定也很悲劇
:
: 推 Guillen:不會,因為Ryan移去一壘的話WAR會大降,可能會變成負的。 03/01 13:00
:
: 理論上不會變 因為Ryan照理說會比"守備好的一壘手"再更多攔到很多球
: (可以想像一下Pujols和Ryan的範圍差距)
:
: 這些多攔到的球抵消掉轉一壘的position adjust (約15分)
:
:
: 不過實際上沒人這樣玩過 所以無法驗證
其實相反,我覺得理論上不會這樣
wOBA也好、TZ、ZR、WAR也好,所有的關鍵都在runs created/saved上
runs created/saved最後是連到理論勝率上
這當中的橋樑都是回歸分析,回歸分析取是大數,不是極端值
任何時候你也只能應用這些數字在大樣本、接近平均值的樣本
例如說,一支一壘安打長期而言等於0.17分
但是在Barry Bonds前面的一壘安打是不是0.17分?
很顯然不是,因為Bonds就是個離群值
一樣的道理,positional adjustment SS +7.5、 1B -10都是大數取樣
你把很顯然的離群值擺進去還能用這個數字推論嗎?可能可以,但是要很小心
打個比方,假設今天你用一個價錢區間在$100~$200的東西推算價格彈性
那麼能不能計算你把他漲價漲到$1000時的銷售量?
不管你在$100~$200之間用的是哪一種curve,out of sample的數字理論上都是沒根據的
甚至極端一點,任何沒有出現過的price point都是沒根據的,即使within sample range
我們信賴現在wOBA乃至WAR的理由是他們的計算結果極為接近真實情況
(全隊的wOBA、SIERA推論全隊得失分準確,全隊得失分推論全隊勝率準確)
但前提是多數球隊都在你的sample pool裡面玩,沒有人瘋到把肥王子丟到SS
當我們今天要討論肥王子這個個案的時候,守位校正已經失準了
事實上,任何的個案都存在這種情況,例如說拿FIP看全盛時期的大數準不準?
FIP可能對99%的球員都準,但偏偏對他就很可能不準
SIERA對他可能稍準一點,但同樣的,因為他是個很例外的投手,你拿根據多數投手計算
出來的加權套在他身上誤差就會偏高
: 推 julians:然後,如果Fielder移到游擊去WAR不也會因此大降呢? 03/01 13:12
: → pujos:胖王子去守游擊WAR可能會升.而且機率不是一般的大*-* 03/01 13:14
:
: 理論上也是不會變
:
: Fielder當游擊霸的防守恐怕不是普通的慘烈
:
: → pujos:守備要扣到比在1b慘有可能嗎xdd 03/01 13:17
: → pujos:只要不是連一壘都傳不了.範圍小就小了 03/01 13:18
:
: 游擊手比較的對象 最爛的是至少很會跳傳的Jeter
:
: 雖然沒人實驗過 但Fielder當游擊真的很可能一個反手就是內安
:
: 這樣看來還有人會覺得轉職WAR就會自動加分嗎?
另外一個問題是WAR的假設,對的根據WAR的假設你說的沒錯
但是WAR的假設符合這個case嗎?恐怕不是
WAR假設所有的守位可以透過平均校正,這個校正本身忽略了很多因素
例如說假設有個人正手接超強反手接超爛,他站在左邊或右邊差異就很大
但這個校正的假設是不管你換到哪個位置你的守備能力都不會變
再來,守備位置有沒有可能影響打擊表現?
WAR的假設是沒有,很多球界的人相信有,我們不知道有沒有,或說有多大
:
: 推 hunterqiji:任憑WAR再怎麼合理﹐真正付錢的老板和GM還是不認的 03/01 13:19
: → hunterqiji:一個簡單的問題﹐Ryan能簽到20M/y的合約嗎? 03/01 13:19
市場效率是一件事,硬球之前有篇文章談守備職人是不是衰退比較快
那篇文章懷疑是的。
所以Bourn簽不到符合WAR的大約、Ryan甚至連張普通約都可能拿不到
也許反映的不是市場效率不彰,是球團的人遠比你以為的聰明
:
: 推 TaiwanNeko:守備組薪水比不上重砲手的另一個原因,球迷喜歡打擊大 03/01 21:56
: → TaiwanNeko:爆發勝過穩定的守備,球迷多自然賺的多 03/01 21:57
這話不是沒有道理,但關係可能沒那麼強
得分跟全壘打佔票房的比重的確高過失分,但是戰績跟球場才是最重要的
: 推 blue142857:問題是一壘手根本不可能cover"大部分"右半邊內野 03/01 22:56
: → maxspeed150:你怎麼知道不可能? 03/01 22:57
: → blue142857:一壘手在多數的情況下還是會回到壘包而非出去搶球 03/01 22:57
: → maxspeed150:這些守位分數可不是亂加亂扣的 03/01 22:57
不是亂加亂扣,但是沒辦法處理極端值
另外blue142857說的也是很有可能,兩個活動力一樣的一壘手跟三壘手
假設他們正反手接球都一樣好,他們的站位會一樣嗎?
很可能不會,站三壘他可以站得很靠二壘,但是站一壘他必須要回去接球
這樣的差別可能只在一個人活動力大到可以站在二三壘中間依舊cover三壘時才出現
大部分的情況下不會有這樣的一三壘手,但是Ryan會不會是?我們不知道
: 你給Fielder守1B他當然撿不到幾球 但Pujols就不同了
:
: 可是Pujols的範圍又跟Ryan有差
:
: 可以想像一下Ryan如果守1B會是多神的防守者
事實上我覺得Ryan越神這個差距就越無法預測
他越是out of sample,我們越不知道會發生什麼事
: → maxspeed150:備就是一個慘烈 03/01 23:13
: → maxspeed150:就是因為1B從來就不會有很多很多球可以守才有守備扣分 03/01 23:13
: → maxspeed150:在看WAR時請把那些理所當然的直覺丟掉 一切讓統計數據 03/01 23:14
: → maxspeed150:說話 03/01 23:14
這樣講我覺得就有點太過,任何的統計都假設,你要很清楚這些假設才能正確的讓數字
說話。當這個數字出來違反你的常識的時候,除了懷疑常識是否正確也要懷疑假設是否
還適用
: → maxspeed150:WAR這東西就是為了要更客觀評價球員才發明的 03/01 23:57
: 推 blue142857:WAR是個客觀評價的標準這我同意 但個人認為他的缺陷在 03/01 23:58
: → blue142857:其實也不算缺陷啦..反正就是他是用統一修正的數據 03/01 23:59
: → blue142857:所以對每個隊伍而言 同樣把一個球員WAR提升2.0 03/01 23:59
: → blue142857:可能會因為隊伍組成而帶來不同的效益 03/02 00:00
其實與其說是為了客觀評價,不如說是為了簡化理解
你對.3/.4/.5沒概念,換成幾勝總有概念了吧?
但問題就在,WAR是透過層層回歸計算的結果,每一次的計算都有假設
有越多的假設運用的限制就越多
這是不是缺陷?我覺得這不算是缺陷,重點是你要理解你模型的假設跟限制
: 推 OoyaoO:如果規則改成多守下一分對方球隊得分會減1 多守跟多打一分 03/02 00:49
: → OoyaoO:的價值才會相等吧 03/02 00:49
: → OoyaoO:多守了3分被尻陽春HR但是打不下分最後還是會0:1輸球 不會 03/02 00:51
: → OoyaoO:變成0:-2贏球 03/02 00:51
你這樣的理解就跟WAR的應用不同了,
打出一支一壘安打不會馬上幫你在計分板放上0.17分,但是長期來說會往這個方向回歸
一場比賽0:1輸球還是2:0贏球從來都不會是統計的重點
統計處理的是長期,是一整季是一個世代,一場球的輸贏表現是沒辦法用任何數字預測的
: 推 waijr:一些統計方法都會有極端值 一般來說都是拿掉 有必要鑽牛角尖 03/02 01:01
: 推 prereality:要找出war的弊端我覺得很容易 假設你找了8個在各防守 03/02 01:12
: → prereality:位置都是頂尖war但是攻擊指數平均只有6~7左右的野手組 03/02 01:12
: → prereality:成一隊應該就會發現問題出在哪了 03/02 01:14
: → prereality:但所謂這種找出8個極端的球員組在一隊並且讓他們打滿 03/02 01:17
: 推 OoyaoO:不可能 沒人會去做這種看起來就死定而且高成本的實驗 03/02 01:18
: → prereality:整個球季這種事情現實中幾乎不可能發生 所以很難去反駁 03/02 01:19
: 推 catsondbs:現實中防守打擊以外的變數也很多 投手+守備也不能控制 03/02 01:27
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 68.61.37.218
推 sitos:推 03/02 02:15
推 oralboralb:好文 03/02 02:20
推 catsondbs:推推 這篇即使沒有甚麼數字也好想推數學去死 orz 03/02 03:06
推 asd831129:簡單來說 不該用9個Ryan對上9個小王子這樣比較 03/02 03:46
推 onime0704:推! 03/02 03:55
推 Guillen:推 03/02 04:01
推 knoxvillt:大推 這篇幫到我理解很多東西 03/02 04:32
推 genie2:推,說得很清楚又仔細 03/02 04:39
推 lolity:推 03/02 05:39
推 blue142857:深夜好文 03/02 06:08
推 m16a117:推 03/02 08:29
推 x147159357:好文大推!! 03/02 08:36
推 jhoc:推 03/02 09:53
推 immortalqq:感謝學長好文 03/02 10:05
推 Sunrise2516:推 03/02 10:19
推 away01231259:推 03/02 10:30
推 hardway:深入淺出啊 03/02 10:40
推 catsondbs:早上再來看一次 WAR守位修正應該也是基於replacement le 03/02 10:46
→ catsondbs:vel的概念對嗎? 03/02 10:46
推 catsondbs:....腦殘了 WAR本來就是說 replacement level 03/02 11:09
推 julians:感謝大大好文 03/02 11:18
推 azlbf:關於守位影響打擊 其實是有的 其實守備很消耗體力跟精神 03/02 11:45
→ azlbf:但是你說Ry去打DH打擊成績會好很多嗎? 這也未必 03/02 11:46
→ azlbf:只能說專心打擊的DH有更多時間去調整自己的下一個打擊 03/02 11:47
→ azlbf:也有更多的時間休息以及觀察投手 03/02 11:47
推 sft005:總是有很多人認為數據統計要反映在每"一場"比賽 Orz 03/02 12:10
→ sft005:我真的希望大多數人可以花一點小時間來看看這篇文章 03/02 12:11
推 maxspeed150:但是彭政閔前幾年也說如果上場守備比較不會胡思亂想 03/02 12:44
→ maxspeed150:打擊狀態反而比較好 當然這類討論已經超脫數據能說的 03/02 12:44
推 lwifbf:專業好文 03/02 15:07
推 Sheffield3:push 03/02 15:18
推 kenkenken31:推~ 好文 03/02 16:42
推 Sparksfly: 03/02 17:19
推 Sechslee:推 03/02 17:29
推 TheVerve:推好聞 03/02 20:07
推 Yukirin:推 最後一段尤其好 03/02 21:42
推 aftermathx:看好幾遍才看懂原來"大數"是指"大樹" 03/03 00:00
推 gghh:推!好多引戰哥都腫了 03/03 05:34
→ nickyang:沒有什麼腫不腫,有想法敢討論比推廢話強一萬倍 03/03 08:01
推 Ruri:意思是說,不該存在九人都是胖王子這種假設來比嗎? 03/03 09:23
→ nickyang:該說像他守這麼爛的是無法預測的 03/03 12:14
→ maxspeed150:我推斷時是沒想到極端值的問題....... 03/03 12:40
推 TKWdEmoN: 03/03 13:12
推 abc12812:position adjust是拿有多重守位的球員做計算 這樣有個盲 03/03 13:14
→ abc12812:點是會玩大風吹的大多是有SS底的工具人 所以計算起來 03/03 13:15
→ abc12812:SS => 1B的價值估計比較準 1B => SS的估計容易失真 03/03 13:15
→ abc12812:回到Ryan/Fielder的問題 如果調換守位 我會猜Ryan 1B 03/03 13:16
→ abc12812:會比較接近估計值(~15R) Fielder SS 會比較偏離估計值 03/03 13:17
→ abc12812:9 Ryan 推測起來應該會比 9 Fielder強 03/03 13:17
推 tckenny1:好文推 03/03 16:16
推 hakkacandy:推這篇!真的是"深入淺出" 03/03 21:19
推 b2209187:推好文章! 03/03 23:19
推 gghh:如果所謂「想法」只是拿著「數據」亂用,那比推廢文還可怕 03/04 09:16
→ gghh:偏偏有些假數據派就是拿著雞毛當令劍鬼扯 03/04 09:17
→ gghh:這點在當年大樹哥當紅時特別明顯 03/04 09:18
→ gghh:如果一昧敵視中文報導無論良窳是CCR,那把數據亂用鬼扯 03/04 09:19
→ gghh:其實跟被鄙視的墮落媒體沒兩樣 03/04 09:21
→ gghh:而本篇提到的很多觀念其實只是計量、統計的基礎觀念 03/04 09:22
→ gghh:不是說不能犯這種基礎錯誤,但本版長期以來的風氣,嘿, 03/04 09:30
→ gghh:或許是比較支持容忍這種問題吧 03/04 09:32