推 abc0922001: 酷 06/24 16:04
棒球數據圈有個指標叫 Stuff+,用球速、轉速、進壘位移、與自身
速球的反差等物理數據,評投手的「球威」(stuff)。
這次我們用公開 Statcast 資料、近 100 萬顆球,訓練一個梯度
提升(AI)模型自己學「什麼樣的球難打」,看能不能重現。
驗證:模型分數對「整季實際被打 xwOBA」,先發相關 r=-0.46
(負號代表方向正確:球質越高、越難打)
模型最看重的特徵:球速第一,其次是垂直位移、水平位移、與
速球的速差。
它發現的祕密:球速不是「越快越好」這麼線性,而是 ~95 mph
像一道門檻——90 到 94 只是緩升,過了 95 難打度才暴增。這
也是為什麼近年大聯盟瘋狂追速,差那 1~2 mph 就是兩個世界。
接著用 SHAP(逐顆球拆解模型判斷)選出全聯盟最難打的五顆球
(模型評頂 + 實際 xwOBA 也最低),並標出每顆靠什麼:
1. Mason Miller (教士) 滑球 88,招牌:速差+水平位移, .142
2. Anthony Bender (馬林魚) 橫掃 84,招牌:大橫掃, .196
3. Aroldis Chapman (紅襪) 伸卡 99,招牌:球速, .201
4. Misiorowski (釀酒人) 四縫線 100,招牌:球速+延伸, .256
5. Alex Vesia (道奇) 滑球 85,招牌:出手臂角, .261
從上述的球可看出:
a. 兩顆純靠速度(Chapman 99 伸卡、Misiorowski 100 四縫線)。
b. 三顆靠形狀(位移、出手角度),不必快也能很難打。
c. Vesia 最特別——他的「出手臂角」在全聯盟平均重要度只排
第 9、不起眼,但 SHAP 逐球一看,它正是讓他難打的關鍵。
完整圖表(特徵重要度、95mph 曲線、五球履歷):
playcall.tv/lab/stuff-model-upgrade
資料:Baseball Savant (Statcast)。非官方、與 MLB 無關。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.169.116.48 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/MLB/M.1782280796.A.40D.html
※ 編輯: hibob (1.169.116.48 臺灣), 06/24/2026 14:26:09