看板 NBA 關於我們 聯絡資訊
※ 引述《dragon803 (wet)》之銘言: : 有一種數據叫做VORP,Value Over Replacement Player : 也就是替換球員差值,替換你的球員與你的差距 這邊完全搞錯了, VORP跟誰替換你完全無關 要講VORP, 要先知道BPM(ASPM), VORP是完全基於BPM(ASPM) 所謂的Replacement Player, 其實是一個想像中的球員 就是你隨時可以從次級聯盟例如NBDL或是CBA, 簽到的球員 一般我們可以稱這種球員為免洗球員或是底薪球員, 可以說是雜魚中的雜魚 而VORP, 就是一個球員比免洗球員能多做出多少貢獻 在這邊, VORP把Replaement Player的水準設定為BPM=-2 所以一個球員的BPM比-2高多少, 乘上他出賽時間比例, 就是他的VORP 不過我主要想要強調的是, BPM不是一個很有意義的數據 BPM是建立在這幾年很紅的RPM的基礎上 他是用所有%系列的進階數據, 兜成如下的函式 a*ReMPG + b*ORB% + c*DRB% + d*STL% + e*BLK% + f*AST% - g*USG%*TO% + h*USG%*(1-TO%)*[2*(TS% - TmTS%) + i*AST% + j*(3PAr - Lg3PAr) - k] + l*sqrt(AST%*TRB%) 然後用2000-2014年的RPM資料跑回歸分析, 算出上面的a~l參數的值 OBPM也是用一樣公式、一樣的方式, 只是目標改成ORPM, 算出a~l 但是DBPM如果用一樣的方式作的話, 會導致OBPM+DBPM<>BPM的結果 於是發明者在這邊用了一個取巧的方法 就是不再去算DBPM, 而是直接讓DBPM=BPM-OBPM 這樣就可以確保OBPM跟DBPM相加會等於BPM 這邊可以看到三個問題 1.得到DBPM的方式本身就莫名其妙 2.既然是用回歸分析跑RPM, 幹嘛不直接看新一年度的RPM 卻要用這種從舊資料得出的公式, 去間接算出來? 3.公式的設計本身的合理性就無法保證, 為什麼BPM跟OBPM用的是同樣的函式?  有些很明顯跟進攻不會有關係的數據, 為甚麼也用在OBPM上? : 通常這個數據可以看出誰是對該球隊「最不可取代的球員」 跟這個無關 : Lebron James以113.9的累積數據排行NBA歷史第一,代表著他對所屬球隊的「無可取代性 : 」,也佐證他對所屬球隊的強大影響力,反面來看,一旦少了他,這個球隊會瞬間瓦解 : Lebron在這個數據上曾經於2005-2013都維持單季第一,直到2013-14才被Durant奪走 : 而在Durant本季加盟後,Curry對勇士的「不可取代性」,也有點下滑的趨勢 : 從過去兩個球季來看,Curry分別以9.81、7.86的累積數據成為聯盟所屬球隊最不可取代 : 的球員,不過本季在Durant加盟後這個數據不僅滑落到了第10名,Durant的名次更是比他 : 前面,這代表著對勇士來說,Durant的「不可取代性」比Curry更高。 -- 願歲月靜好,現世安穩 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.81.61 ※ 文章網址: https://www.ptt.cc/bbs/NBA/M.1488555922.A.017.html
mariandtmac : 專業推 03/03 23:48
abc12812 : 基準是拿豪神當標準嗎? 03/03 23:54
illidan23 : 專業推 03/03 23:56
SmallPon : 快推 免得被發現我看不懂 03/04 00:02
※ 編輯: IBIZA (122.116.81.61), 03/04/2017 00:03:20
kyo28 : 太專業了 我還是找女友研究人生 03/04 00:12
AinalRami : I大你也回太快了吧 03/04 00:16
taiwanrules : 推 真的是無厘頭,把一堆數據捏一捏變成瀨尿牛丸 03/04 00:23
s19790824 : 因為這篇東西他以前就在板上講過了 03/04 00:24
Edison1174 : VORP的概念聽起來跟棒球的WAR很相似 03/04 00:24
s19790824 : 所以不用再想可以馬上講出來吧 03/04 00:24
jimmyjou2006: 原po對數據的解讀很可笑...box迷就是這樣傳染的 03/04 00:32
dustinhuang : 樓上太高看box迷了 box迷是只看box那種 03/04 00:41
Altair : 啊就 籃球的量化分析很多概念是借用棒球計量而來的 03/04 00:41
Altair : 畢竟棒球的計量分析發展得早也比較成熟了 03/04 00:42
Altair : BTW 兩種運動有本質差異 看籃球的量化分析要很小心 03/04 00:45
jimmyjou2006: 數據分析可以多看緯來球評講解啊,記者也都會整理 03/04 00:45
edwin1231 : 哈哈 03/04 00:45
jimmyjou2006: 解讀,和box迷的解釋方法都好相近喔 果然高手在民 03/04 00:45
jimmyjou2006: 間啊! 03/04 00:45
abc7360393 : 好專業 想問下BPM跟RPM到底差在哪 我還是看不懂.... 03/04 00:46
RPM只看正負分, 它是用大量的回合數, 試圖去消除隊友和對手的影響 理論上, 如果真的能排除隊友跟對手的影響 那麼剩下的就是球員個人對於正負分的影響 RPM需要很大量回合數, 才能有基本的準確度 之前在RPM發展時期的網頁上是說起碼要5000回合, 不滿5000回合的數據都只能參考 所以以前RPM都是打了半季才會有數據可以公布, 甚至很多球員跟本累積不到5000回合 RPM被ESPN吸收之後, 現在ESPN打十場就能公布數據, 不確定是怎麼辦到的 ESPN也沒有多作說明, 甚至連回合數也不公布了 不過我猜多半是犧牲準確度, 在回合數不足額的情況下就搶先發布 至於BPM, 它是希望能用比較簡單的方式, 也就是套公式, 就可以得到逼近RPM的結果 所以他用一系列%的進階數據為基礎, 兜出上面的公式, 然後用14年的資料跑回歸分析 去得到公式裡的每個參數 回歸分析是甚麼你可以參考下面網址 https://goo.gl/Reh3n7
lwei781 : 棒球和足球側的量化分析轉過來 @@ 03/04 00:59
blacktea0127: 好專業 03/04 01:00
※ 編輯: IBIZA (122.116.81.61), 03/04/2017 01:20:56
kusami : 欸你好像講第93582179835142576438次了 03/04 01:32
wilson200106: 是不要搖大大!!! 03/04 02:05
alex53001 : 太深了QQ 明天再看 03/04 03:02
lampmouse : 雖然我並不是統計專家 就你的第二個問題說一下 這 03/04 05:07
lampmouse : 其實是非常常見的統計或Machine Learning的應用 在 03/04 05:07
lampmouse : 你相信公式的合理性的這個前提下 也就是你相信BPM和 03/04 05:07
lampmouse : RPM的差距大部分來自公式的變異性和Noise 那麼這個 03/04 05:07
lampmouse : 公式(或模型)的係數(或參數)不應該隨著不同的年度 03/04 05:07
lampmouse : 有所差異 一般來說 我們會把資料至少區分為Training 03/04 05:07
lampmouse : Data和Test Data 那麼一般來說當年度的資料應該被 03/04 05:07
lampmouse : 視為Test Data 也就是檢驗公式的Data 而非用來幫助 03/04 05:07
lampmouse : 找到公式的參數 03/04 05:07
lampmouse : 當然全部的前提都是在相信公式的合理性下 才能有這 03/04 05:10
lampmouse : 樣的解釋 我猜他們應該試驗了非常多的次數不大於三 03/04 05:10
lampmouse : 次的多項式來當作公式(一般來說 次數超過三次很容 03/04 05:10
lampmouse : 易overfitting) 然後就這樣找到一個還不錯的模型吧 03/04 05:10
lampmouse : 不用理我前面講的公式的變異 那有點不對 應該是希 03/04 05:23
lampmouse : 望變異也很小 所以係數的差異也很小 03/04 05:23
thnlkj0665 : 推 03/04 06:55
shifa : 看不懂給推 XD 03/04 07:57
tyson0522 : 專業 03/04 08:05
Jormungandr : 推 03/04 09:34
blues386 : 看不懂給推 03/04 10:35