精華區beta NBA 關於我們 聯絡資訊
如果從 Dean Oliver加入金塊隊起算,數據分析這條路 在籃球界,也不過就是短短的四到五年,雖然很迅速地 在聯盟中蔓延開來,但是其實還有很多爭議的地方。 比方說,數據分析派和傳統籃球派。 現在很多球隊都把數據分析看的越來越認真,但是大多 數球隊對數據分析人員的態度,就好像是後母一樣,把 他們藏在球隊裡面,無論如何都不讓他們出來露面。 這部分最大的原因可能是,球隊嘗試用這些數據分析人 員來替代那些傳統的籃球人,而不是用來輔助。棒球界 也是如此,結果這造成了這些人和傳統棒球界之間的誤 會和裂痕更大。 籃球界的問題也是一樣。 不過由於球員間的互動在解讀數據上扮演很重要的角色 ,所以籃球界的數據分析不像棒球,可以切割的比較乾 淨。如果數據分析人員對籃球的了解不夠,他提出的理 論就會受到更多人的存疑,也不會有人認真參考。 不過有些數據分析人員基於某種原因,會提出一些譁眾 取寵的數據。也許這樣可以讓他們聲名大噪,但是如果 這些數據最後被證明是錯誤的,結果只會損害整個數據 分析界的信譽。重點不在於數據出了錯,而是這些數據 分析人員不自覺流露出來的優越感。要知道,這些傳統 的籃球人每個都花了無數的時間在打籃球、看籃球,結 果最後卻被一個看不懂的電腦系統指正,可以想見會遭 受多大的抵抗。 而解決這個問題的方法,需要雙方大量的溝通與彼此了 解。塞爾蒂克的教練Doc Rivers就對數據分析存疑,所 以Mike Zarren花了很長的時間跟他溝通,即便是Dean Oliver也曾經覺得籃球界的人跟數據分析界的人好像在 說兩種不同的語言。 而就連數據分析這個圈子裡的人,對於哪種數據有價值 的看法都有很大的出入。 比如說PER派和+/-派。 其實概括來說,所謂的 PER派是個廣泛的統稱,簡單來 說,這派的分析素材來自於球員留下的數據。他們可能 會把分數盒子裡面的每個欄位拿來加加減減,或者乘上 一定的比例,最後算出一個數值,算是當作這個球員的 「分數」。 不過籃球場上有太多不可量化的元素,而這些是不會在 分數盒子裡面呈現的。比如說防守。一直很難有個可得 紀錄的數據,顯示球員在場上的防守表現。抄截也許是 一個角度,但是很多球員為了被紀錄抄截一次,失掉了 自己原本應該有的防守位置,賭博性站位,沒有持續緊 跟自己的防守對象,這樣似乎稱不上好的防守。 火鍋也是相同,有球員為了製造火鍋,所以採取賭博性 的防守,再者,把球搧出場外,通常等於給對手重新組 織進攻的機會,這樣算的上成功的防守嗎? 或者球場上跟其他隊友的合作,也不能在分數盒子中顯 現出來。 在這個情形下,+/- 的紀錄方式出現,因為它紀錄的是 一個球員在場上時,本身球隊和對方球隊的分數差。 如果這個球員在場上「創造」了一點不同,讓自己球隊 比對手多得了一點分,或少失了一點分,這就是球員的 價值所在。 然而,這樣的數據也不是沒有瑕疵。比如說隊友的素質 有很大的影響,如果這個球員跟四個聯盟一等的先發球 員同場,幾乎可以預估他的表現,會比跟四個替補球員 一起要好的多。 比賽的強弱也有關聯,當球賽比數已經拉開進入垃圾時 間,雙方的防守自然會比較鬆懈,得分的機會比較容易 ,所以這時候的+/-是不是會隨之失準。 這兩種方式的支持者有時候會批評彼此。設計出Win Shares的David Berri就批評+/-,說一個決策者應該知 道的資訊,已經全部涵蓋在分數盒子裡了,Dan Rosenbaum 則回敬David Berri說那種想法是種謬論,並且說+/-是 比較受歡迎的數據。 而光是如何客觀地評量一個球員,就有幾種不同的方式 ,每個發明者也都宣稱自己的數值比較好。比如說David Berri就批評John Hollinger的PER,在設計每個數據的 權重時,沒有經過回歸分析,純粹出自於 Hollinger的 直覺。 除此之外,數據分析的圈子裡也少不了其他歧見。 比如說有深厚學術背景出身的(像是經濟學或統計學) ,會認為論壇裡面那些沒有經過學術殿堂洗禮的,所提 出的數據分析欠缺嚴謹的論證,沒有經過仔細的檢驗和 思辯。 甚至比如說,數據分析人員應不應該隨隊。隨著球隊出 征的好處是可以看到很多數據裡看不到的,教練的溝通 技巧和指揮能力,球員之間的互動等等,在解讀數據上 也許會有很多幫助。但是球隊找這些人來,似乎就是為 了提供一個客觀第三者的角度,為了不受到干擾和影響 ,是不是應該隔著一段距離,才能提出一般人看不到的 想法。 我們大家都會看數據。就連最傳統的籃球人都會看分數 盒子和場均數據。所以數據分析的價值不在於他們是唯 一看得懂數字的人,而是因為他們對數據有很好的判斷 能力,而這來自對於籃球和數據分析兩者都要很深入的 了解。 但是這樣的門檻相當高。籃球跟棒球不一樣,團隊運作 的模式、球員與球員間的互動都會對數據產生影響。所 以分析人員更要了解球員的角色,甚至包括他的隊友和 對手,所以光是對數字很敏感是不夠的,籃球的數據分 析人員需要對各種數據要有更深入的了解。 球隊在運用數據分析的理想模式應該跟棒球不一樣。這 樣的人員在球隊裡應該是個功能性球員,他要努力在籃 球界裡變得更好,同時也要讓他周圍的所有籃球員變得 更好,除了讓進階數據分析更能被理解,更重要的是, 他們應該更正確地解讀數據,並且了解什麼時候應該注 意哪個數字,而什麼時候又該把某些數字忽略不管。 這最後一點是很困難的,對於不真正了解數據的人來說 ,他們會花上無數的時間研究某個數據,而最後被這個 數字誤導,沒有產生有用的結果。即便是具有深厚學術 素養的人也會犯這個錯,假使他們對籃球不夠了解的話。 所以最後終歸一句話,如何有技巧地解讀數據,其實要 有良好的判斷能力。如果球隊如此倚賴數據分析,結果 這樣的人沒有受到很好的專業訓練,外加深厚的籃球素 養,無疑反而是極大的風險。 數據分析還有一個很大的問題:資源浪費與重複。 在評價一個球員時,你得要作相當多的功課,把每場球 賽的每一球紀錄下來,分門別類地整理,每天都要維護 與更新,這是非常非常浪費時間的。讓這種情形更惡化 的,是因為各隊都把自己數據分析的方法當成秘密,所 以每隊所作的整理很可能有大半都是其他球隊也在作的 ,只不過沒有被揭露出來。 無怪乎有錢如Mark Cuban,有次都曾經開玩笑說,希望 各隊在數據分析人員的花費上,也要設定一個薪資上限。 數據分析在 NBA的現況大致簡述如上,可以預料的是, 會有越來越多的球隊在這上面砸上金錢,也許真是出於 對數據分析的肯定,但也有可能是因為其他球隊投入後 ,所不得不為的防禦性策略,不管如何,對所有球隊來 說,有一點都是很清楚的:數據分析不是萬能。 數據分析只是盡可能地替所有籃球場上發生的事找出對 應的價值,並且作為決策的參考依據之一。但是還有很 多變因是不能預測的,比如說球員的心態與心情,教練 的領導能力與溝通,甚至裁判或是場邊的球迷或場館, 都有可能會影響分析的準確度。 所以我們要知道,數據分析能作的,不是預測並且掌握 籃球場上發生的每一件事,而只是盡可能極大化對自己 有利事件的發生機率,並且盡可能極小化對自己不利事 件的發生機率,剩下的,還是要交給場上的球員去決定 了。 最後,如果你對數據分析有了一點興趣,下面這個網址 是個必去的論壇,這是Kevin Pelton所建立的論壇,上 面提到的所有名字,大概有七成都在這裡有帳號: http://0rz.tw/CteTZ 最後的最後,補充一個花絮。對於數據分析界來說最大 的謎團,也是今年為止最常被拿來開玩笑的題材,是這 個球員-Gerald Green。 看看他待過的球隊吧:波士頓塞爾蒂克、(明尼蘇達灰 狼隊)、休士頓火箭隊、達拉斯小牛隊。現在他在俄國 的Lokomotiv Kuban隊。 -- Walter Brown "Red" Auerbach Dennis Johnson Bill Russell Jo Jo White Bob Cousy Tom Heinsohn "Satch" Sanders John Havlicek Dave Cowens Don Nelson Bill Sharman '57 '59 '60 '61 '62 '63 '64 '65 Boston Celtics '66 '68 '69 '74 '76 '81 '84 '86 Ed Macauley Frank Ramsey Sam Jones K.C. Jones Cedric Maxwell Kevin McHale Larry Bird Reggie Lewis Robert Parish "Loscy" Danny Ainge Len Bias Johnny Most Garden '08 Ray Allen Kevin Garnett Paul Pierce http://blog.pixnet.net/CelticsPride -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.231.99.74
Kshatri : 04/01 20:28