看板 Spurs 關於我們 聯絡資訊
Regularized Adjusted Plus-Minus (RAPM) 由於APM只用誤差最小平方法進行估算 若有球員表現呈高度相關性 則會出現多重共線性的問題 導致不同球員估算的正負值有劇烈的浮動 有的絕對值十分巨大 有的則趨近於0 此時可以在誤差最小平方合的矩陣外 額外加入λx正負值反矩陣x正負值矩陣 (可以想像成λx正負值平方和) 利用懲罰項λ讓正負值不會出現絕對值異常大的情況 這種作法稱為嶺回歸(ridge regression) 這也是RAPM以及許多新的籃球數據模型的基本方式 除了ridge regression之外 還可以加入幸運值的影響(luck-adjusted RAPM) 舉例來說隊友和對手罰球命中率不會受個別球員能力影響 但不同的命中率會影響球員的正負值 這個也能透過luck-adjust調整 小結 自從PER問世以來 進階數據已隨著資料科學的進步蓬勃發展。 除了引用基本數據做為公式之外 新的進階數據更像是透過新數據不斷修正的模型 有的主打動態數據 有的加入幸運值 有的則是能預測未來發展 甚至還有利用機器學習建立的模型 今天介紹的RAPM是很多先進模型會引用的 其實進階數據背後有很多數學以及原理 若能稍加研究 就能推斷出各個數據的優缺點以及適用範圍 個人覺得比起純粹比數字大小有趣多了XD 延伸閱讀 RAPM介紹 https://reurl.cc/Mk4Qyp Ridge Regression (youtube 影片) https://reurl.cc/V5NxNy Luck-adjusted ratings https://reurl.cc/OkGNGy -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.181.176.148 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Spurs/M.1634219423.A.057.html ※ 編輯: f820203 (175.181.176.148 臺灣), 10/14/2021 21:53:07
blackdevil: 推~ 10/15 07:41
pescado: 推,雖然門外漢只能模糊看懂個大概 10/15 11:06
vfgce: 嚴格來說線性迴歸的迴歸係數才幾個,根本不是overfitting. 10/15 12:35
vfgce: 會有很大預測誤差是因為共線性下符合最小平方的解不止一組 10/15 12:36
vfgce: 沒有新的資料測試前根本不知道哪個預測效果較好。 10/15 12:37
vfgce: ridge ression的重要是盡可能選出小的迴歸係數。 10/15 12:39
vfgce: 避免掉太大的迴歸係數造成過大的預測誤差。 10/15 12:40
f820203: 樓上專業 10/15 12:46
f820203: 線性迴歸的確是想辦法讓MSE壓到最小 10/15 12:46
f820203: 而不是把所有值硬fit出來 10/15 12:46
f820203: Ridge則是收斂用的 10/15 12:54
f820203: 我再修正一下文章 10/15 12:54
f820203: 感謝V大提醒~ 10/15 12:54
fated: 感謝f大一直以來的用心分享諸多好文章 10/15 12:55
cowbay5566: push 10/15 22:23
AriesC: 感謝分享 10/16 00:33
mindd: push 10/16 05:42
softstar0125: 好文推 10/16 10:39
ThisIsNotKFC: 推 10/16 15:47
※ 編輯: f820203 (175.181.157.77 臺灣), 10/16/2021 17:01:50 ※ 編輯: f820203 (175.181.157.77 臺灣), 10/18/2021 13:37:06 ※ 編輯: f820203 (175.181.157.77 臺灣), 10/18/2021 13:39:32