精華區beta Sabermetrics 關於我們 聯絡資訊
通常研究兩聯盟水準差異時, 最常用的方法是研究一批球員在兩個不同聯盟平行移動時 平均成績的差異 (最常看到的例子是Clay Davenport) 比如說同一批球員 在B 聯盟的OPS 大概是在A 聯盟時OPS 的九折 如果只要據此表示B 聯盟水準比A 聯盟高, 高多少 只要樣本夠大我是沒有大問題 (一些小問題當然還有) 不過當拿來預測單一球員的成績轉換時 通常所有人都會再加上一個"假設" 即如果A 球員在A 聯盟OPS 多少, 那在B 聯盟他也照乘九折 這聽起來很合理 但是這其實還假設說原本已經有平行移動資料的那一大堆選手裡面 比如X 好了 X 在A 聯盟的成績比這一堆選手在A 聯盟的成績高出10% 那麼X 在B 聯盟的成績還是會傾向比這一堆選手在B 聯盟的成績高出10% 左右 事實上是不是這樣? 當然不完全是這樣 (每個人適應狀況不同) 我的問題就是有沒有人估計過偏差的狀況大概是怎樣? 一個方法可能是 假設有一群選手{X1,X2,.....X_n} 這群選手在A 聯盟的平均表現數值是P, 在B 聯盟的平均表現是Q 然後X1 在A 聯盟的表現數值相較於P 好了a_1 個百分比 (或者如果平均表現數值是用OPS, 那這個部分可以算OPS+ 之類) X1 在B 聯盟的表現數值相較於Q 則好了b_1 個百分比 依此類推之後 我們拿 {a_1,....a_n} 和{b_1,....,b_n} 來求相關係數 這個相關係數可以大概告訴我們 直接拿conversion factor 去乘成績得到轉換推測結果的可靠度在哪裡 就實務來說 通常認為由三A 推算出來的MLB equivalent 還算可靠 二A 馬馬虎虎 一A 或以下則僅供參考 我是有點好奇這三組情形如果用上面方法算出相關係數, 不知道大概分別會是多少 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 210.203.106.120
newbornme:吐各槽,第六行順序是不是反了? :p 03/18 20:47
Herlin:對, 反了 orz 03/18 20:55
※ 編輯: Herlin 來自: 210.203.106.120 (03/18 20:56)