精華區beta NBA 關於我們 聯絡資訊
juby 27板友我想先問你個問題,你如果棒球跟籃球都有在看的話,那你 認為目前棒球統計學發展的比較成熟還是籃球統計學呢?是棒球統計學在 解釋棒球場上的問題時解釋的比較清楚還是籃球統計學在解釋籃球場上的 問題比較清楚呢? 籃球統計學應用在球場上的效力會比棒球統計學應用在球場上的效力來的 大嗎? 如果你認為籃球統計學的發展還不夠成熟到單獨拿來解釋球場上的問題, 為什麼你如此執著在於單單以籃球統計學來解讀比賽呢? 我從來不會反對拿籃球統計學來解釋球場上的事件,問題是我不會只拿籃 球統計學就來解釋籃球場上的事件,因為我知道籃球統計學這塊領域的成 熟度跟棒球統計學比起來還差的很遠,很多事件並沒有在籃球統計學中得 到滿意的解答,所以你覺得光用籃球統計學能解釋出多有用的資訊呢?特 別是你整篇文章就只秀出籃球統計學的資料時,你認為有多大的說服力呢 ? 如果你是提出看Celtics 比賽時的防守站位與戰術,再搭配籃球統計學的 觀點來論證的話,那起碼有一定的說服力,可是你卻只從籃球統計學的角 度就直接斷定Celtics 的防守失分一定要再上修,這會讓我感覺你覺得籃 球統計學無所不行,甚至可以完美預測未來的離群值走向(Celtics 目前 的防守失分),可是籃球統計學真的可以嗎? 重申那句話,你要使用這個統計學方法前,要先知道這個統計學方法的效 力與限制,你給我的感覺就是籃球統計學無敵,可以完美解釋出籃球場上 的事件,問題是籃球統計學的發展真的有你想像的這麼成熟嗎? 我寫文章也會引用數據來佐證,但是我不會把籃球統計學的數據就當成真 理去相信,因為我知道籃球統計學還有許多不完美之處,籃球統計學要讓 我全盤相信前,必須先發展到一個成熟的階段。 還有很重要很重要的一點,如果你也熟悉棒球統計學的話,你會發現棒球 統計學應用在解釋過去的發生事件有很大的發展,但是應用在預測未來的 事件時卻遇到不少瓶頸,尤其尤其是應用在預測那些right tail outliers 時更是屢次出現預測不準的狀況發生。就像你很愛舉的A-Rod 來說好了, 他 06 年低潮後,你要不要重新去看看棒球統計學預測他 07 年成績預測 成怎樣呢?而 A-Rod 在 07 年的表現又是怎樣呢? 除了 A-Rod 之外, 棒球統計學在預測鈴木一朗與王建民時又出現什麼樣 的問題呢? 只要是統計學的 model,在預測離群值時,都會出現很大的落差與不準, 所以你認為籃球統計學可以拿來預測目前Celtics 失分這個離群值嗎? 最近Yankees 板也有討論到統計學這方面的問題,我下面就引述某 版友的文章讓你看看。 研究最常見的問題就是用通則去套一個單一例子,研究人員常犯一個錯誤 ,就是把一個已經存在的model 去套用在一個新的例子上,說一定會打回 原形,或是一定不是常態。但一個好的研究人員知道,以前的準則只是以 當初的例子去推論,很久以前有研究指出人類100公尺的極限是9.8秒,就 是犯了這個錯誤。 以上摘錄自 Yankees 板,某版友的文章。 所以你知道你犯了什麼錯誤嗎? 在 Jordan 還沒出來以前,沒有人會認為一個得分後衛能主宰比賽成這麼 誇張的境界;在 Shaq 沒有出來以前,沒有人會認為以後會再出現一個能 夠比擬 Chamberlain 宰制禁區能力的中鋒;在 Kobe 沒有出來以前, 人 們甚至不認為現代的球員能夠單場拿下八十分以上;在 Kobe 沒有出來以 前,人們也認為單季當場平均 35 分以上的球員應該不會再出現了。 可是上面這些例子不就都活生生在我們眼前發生嗎?看了這麼多的例子, 為什麼你還執著去用以前的例子所堆積出來的統計學model 來預測未來的 離群值呢? 我前面一直在提的就是不要舉特例,因為統計學的效力常常無法涵蓋到右 邊與左邊的 outliers, 在這種情況下,你要拿統計學來預測一個離群值 會有多大的問題發生啊? Celtics 本季的防守能力是不是統計學裡的離群值啊?而你現在要拿以前 的資料所堆積出來的統計模型來預測未來的離群值?恕我說的坦白一點, 請你不要濫用統計學,統計學不是這樣用的。 雖然我很不喜歡在 NBA 板提到棒球的例子, 這一點我在前面幾篇就已經 講過了,真正了解棒球的人不會輕易地把籃球與棒球這兩門運動拿來類比 ,因為光是本質上就有很大的不同。不過你既然又舉了那麼多棒球的例子 ,那我就來聊聊對於你這些例子的看法。 棒球統計學發明出許多數據來衡量一位球員的貢獻與能力,並且把數據經 過年代、聯盟、球隊強度的調整,如:Win Shares、 VORP、 WPA、EqA、 BRAA、FRAA、WARP 等數據。 而現在的籃球統計學呢? 就問你一個問題就好,如果光看數據統計的話,你要怎麼去解釋 Ray Allen 、Paul Pierce、Kevin Garnett等三人的數據在Celtics 為什麼都下滑下 來呢? 難道是他們三個人都開始退化了? 這裡的變化能夠從數據本身解讀出什麼東西嗎? 而棒球統計學行不行呢? 在這裡舉一個粗淺到不行的棒球統計學例子。 今年明星賽前 Dan Haren 的成績是 2.30 ERA,基本上以過去的例子告訴 我們美聯要出現低於 2.50 ERA 的投手是相當相當少見的,但是這只是以 過去的例子來解釋而已,如果棒球統計學只能做到這樣的話,那就犯了跟 juby27 你前面一樣的錯誤,以過去的統計 model 來預測未來的離群值。 很遺憾地,棒球統計學能做到的不僅僅是以過去來預測未來而已,Haren 前半季的好成績有一個很重要的原因是他的 BABIP 低到只有 .234 而已 ,FB 玩家看到這裡就會知道 Haren 的好成績是基於他異常的 BABIP,而 不是他本身的實力表現。在明星賽後,等到 Haren 的 BABIP 升到 .357 之後,他的成績就慢慢又調回來了。 而現在的籃球統計學光是看數據統計要如何去解讀 Allen、Pierce、Garnett 三人的數據下滑呢? 你不看比賽只看數據看的出來為什麼數據下滑嗎? 要先搞清楚籃球統計學的限制,然後再去使用它,而不是動不動就想要用 籃球統計學來解釋球場上的任何事件,如果你正在做這種事情,那很抱歉 ,我覺得你濫用籃球統計學的精神。 還有你一直在舉 A-Rod 在 07 年四月的高潮演出來證明他的全壘打數會下 修。你是不是搞錯了什麼?A-Rod 今年四月的打數是多少?是 93 個AB , 而他整季是幾個打數啊?583 個AB。才 16 % 的打數而已,這完全就是小 樣本的數據啊! 任誰都知道這種小樣本的數據拿來預測任何東西都會有很 大的偏差。 你這個例子就像是拿籃球的例子來舉也是一樣,上個球季 Kobe 曾經連續 四場比賽拿到 50 分以上,這四場比賽 Kobe 的總合 FGA 是 140 個(四 場平均是一場 35 個 FGA),而他整季下來的 FGA 是 1757 個( 一場平 均是 22.8 個 FGA),這很顯然也是小樣本數據下的結果,拿這個來預測 2006-07 球季的 Kobe 在未來幾場會得到平均50分以上也是會有相當相當 大的誤差,這不是很顯然易見的道理嗎? (我當然知道得分不是光看 FGA 而已,只是這邊我著眼在於提出 Kobe 在那四場球誇張的 FGA 數與整個球季的常態有很大的落差。) 所以你反覆提A-Rod的例子是想證明什麼呢?不就是小樣本下的結果嗎? 而現在整個賽季的比賽裡,Celtics 已經打超過三分之一的賽季了,這跟 你前面舉的小樣本數據有一樣嗎?可以拿來一起比較嗎? 我上面的論點簡單總結就是: 1、籃球統計學還有許多發展空間,也還不夠成熟,它還不能夠讓你來完美 的詮釋球場上發生的事件,所以千萬不要以為拿出籃球統計學就是真理 2、統計學是拿以前的資料來做分析並建立模形,在解釋以前發生的事件時 會有很不錯的效力,但是拿來預測未來的事件會有相當大的誤差,尤其 是你拿來預測未來事件的離群值時會出現更大的偏差。 如果你認為今年球季Celtics 的防守失分能力是個離群值,那你還執意要用 過去資料所組成的model 來預測今年Celtics 的失分能力,那很抱歉,這個 系列我就只回文到這邊,因為我想講的話都在上面說了。 ps:在這邊講太多棒球的例子不太應該,我本身也反對在籃球討論群組談棒 球的例子,回文只是針對 juby27 的一些盲點做出回應,對不喜歡在籃 球討論群組看到棒球文的板友說聲抱歉。 -- http://blog.pixnet.net/IZXNHSO 個人 Blog,歡迎參觀指教。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.168.15.85
iori35i:我早就準備好雞排了 科科 01/02 23:38
kkjjkkjj:推 01/02 23:41
oicecnir:我叫好小姐了.. 01/02 23:41
tim1112:因此打籃球還不是算數 但打棒球已經是了 01/02 23:41
andy80209:半夜不要發宵夜文拉 01/02 23:42
Maxslack:看這種文章真爽 科科 真正的頂尖對決... 01/02 23:44
cccssszzz:頂尖統計學家都研究醫學領域的 真希望來個研究運動領域 01/02 23:43
Kirihara:先推再看 比較贊同你的>< 01/02 23:44
Maxslack:放心 數據派已經開始介入NBA了 火箭總管就是 01/02 23:44
Maxslack:只是如同我前篇的推文 數據派還沒在NBA取的成功 還有待 01/02 23:45
Maxslack:考驗 如果火箭GM能成功帶起火箭 能預見的是更多數據派進 01/02 23:46
Maxslack:入NBA做GM... 01/02 23:46
TheDream:籃球統計學正在起步,我也希望它能發展的很健全與成熟。 01/02 23:48
TheDream:但是現在就認為籃球統計學是真理恐怕就走錯方向了。 01/02 23:49
White1stMan:推 打從拿數理來做例子就已經註定他先入為主的觀念 01/02 23:49
AnimalFarm:有道理 受教了 01/02 23:51
gohit:推推 棒球統計學真的是歷史悠久成熟...籃球還真是一百人有 01/02 23:51
gohit:一百種看法 XD 01/02 23:52
gohit:juby版友請趕快來看這篇 真理越辯越明...也許就靠你們兩人 01/02 23:54
uichen:推 邏輯清楚 01/02 23:54
gohit:把籃球統計學給搞起來哩 !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 01/02 23:55
DonNelson:目前籃球數據的確太過貧乏,不過我覺得籃球還是要往數據 01/02 23:56
DonNelson:的方向發展,將世界數字化雖然不保證一定能夠觸及所有真 01/02 23:58
DonNelson:理,但某程度上經常是通往真理的捷徑。當然這必須有高度 01/02 23:59
DonNelson:成熟的計量與分析方法論來輔佐才行,應該是努力的方向。 01/03 00:00
TheDream:不要忘了就算是成熟的棒球統計學也無法成功的預測離群值 01/03 00:01
jajacat:謙和的態度 嚴謹的推論 豐富的資訊 只能說高下立判 01/03 00:01
gohit:所以還是那句老話嗎? 打籃球 不是在做算術 XDDDDDDDDDDDDDD 01/03 00:02
luisfan:推邏輯清楚的這篇~ 01/03 00:02
ARODisGod:統計又不是算命 還想預測未來哩 01/03 00:03
DonNelson:是啊,我並未忽略這點,但我想如何繼續發展統計方法,以 01/03 00:03
blesstw:推 不過以"隊"的觀點和以"人"為觀點 哪個比較不容易失真? 01/03 00:04
DonNelson:其將來能更準確預測,應該是比較好的努力方向吧。 01/03 00:04
jajacat:不過統計在籃球上勢必會遭遇困難,在蒐集數據上,如何在流 01/03 00:04
DonNelson:只是籃球數據目前連分析過去資料的能力都還不夠好就是了 01/03 00:05
SuWeiLin:講真的,兩位都言之有物,極具研討的價值~ 01/03 00:05
Maxslack:我覺得juby版友的想法並不是要預測離群值 而是以統計的角 01/03 00:05
jajacat:動的籃球比賽中紀錄,本身就很有難度! 01/03 00:05
Maxslack:度去推斷超賽未來的表現 01/03 00:06
TheDream:同我前面所說,籃球統計學還不完美,不要任意當成真理。 01/03 00:06
TheDream:還有統計學對於如何處理離群值還很頭痛。 01/03 00:07
TheDream:而juby27認為Celtics是離群值,那怎麼還用統計學來預測? 01/03 00:07
gohit:有沒有人可以介紹一下籃球統計的歷史啊? 為啥棒球會那麼早 01/03 00:08
TheDream:棒球統計學有個關鍵字:Bill James,有興趣就去google。 01/03 00:09
Maxslack:職業棒球上上世紀就有了 職業籃球是上世紀中才開始的 01/03 00:09
ck910164:推 01/03 00:10
DonNelson:我不知道兩種球類的統計史,但棒球聯盟早在 1871 年就開 01/03 00:10
ericlov:推,球員創造數據,球員突破數據,球員因此而偉大..... 01/03 00:10
DonNelson:打,職籃則是 1946 年才開打,六十餘年的差距,夠發生很 01/03 00:11
DonNelson:多事情了 01/03 00:12
DonNelson:是 75 年...我算錯了對不起 01/03 00:13
ted0217:所以賽隊防守好在哪裡? 有不用數據的說明嗎? 01/03 00:16
TheDream:如果ted0217想要好好討論的話,那回篇文來,我會好好回應 01/03 00:18
TheDream:你,但是你如果只等著我丟出什麼結論的話,那就省了吧。 01/03 00:18
TheDream:討論不是等著別人丟出結論才吸收。 01/03 00:18
hardaway:ted0217 可能一開始就沒看懂吧...orz 01/03 00:19
ted0217:對不起 我很弱 寫不出什麼好文 01/03 00:18
ted0217:可是如果可以的話我想看分析防守的好文! 因為我也看不太懂 01/03 00:19
ted0217:防守的精隨。我有詳細看兩位的文章! 結論不就是籃球統計 01/03 00:20
gohit:其實同樓上的我也想看 .__./ 01/03 00:21
ted0217:不成熟 太武斷拿來用很容易出問題。但除此之外要怎麼看呢 01/03 00:21
gohit:我也想看有人分析球場上的防守好文 XD 01/03 00:21
ted0217:美夢大說看賽隊防守可以學到很多! 所以我也很期待看到更棒 01/03 00:22
ted0217:的分析阿! 01/03 00:22
TheDream:更棒的分析等我做足功課再發文吧!或是等非人大的文章。 01/03 00:23
blesstw:judy兄認為以"隊"來說很難有離群值 只是目前到底以"隊" 01/03 00:21
ted0217:期待期待 (拜) 01/03 00:23
TheDream:我現在對於塞隊的防守認知還很片面,正在研究中。 01/03 00:23
blesstw:為主體的統計 到底可信度多少 很難判斷 01/03 00:24
hotdog301:KO!! 01/03 00:25
gohit:期待期待 (拜) 01/03 00:25
TheDream:基本上用統計學來"武斷地"預測離群值這個方向就錯了。 01/03 00:24
blesstw:不過以"球員"的統計來說 籃球的確還很難找到好的統計方法 01/03 00:25
BeanBryant:好文..大推.籃球統計學的發展確實還有待加強.. 01/03 00:34
BeanBryant:跟棒球比的話..感覺還有點落差 01/03 00:35
tonychou:推一個~分析的有條理~思路清晰~十分有邏輯~令人拜服 01/03 00:35
BeanBryant:說不定這系列到最後可以研發出新的一個統計數據!? 01/03 00:36
Price:推 TheDream 精彩文章。個人建議啦,多看數據之餘,別忘了 01/03 00:38
Price:多觀察球員們在場上的每個動作,其實會更有收穫 01/03 00:38
Price:精華區 tyreal 兄的文章就是很精闢的「球場觀察」 01/03 00:40
willyt:http://tinyurl.com/3y9l2p 樓上的動作要看比賽才懂! XD 01/03 00:39
gohit:樓上威力踢是專業七六人迷 XD 01/03 00:42
jasonkeen:棒球是一個PLAY一個PLAY在玩的,籃球紀錄切割太困難了, 01/03 00:42
willyt:我不專業 ._. 專業的是以前的前輩們 orz 01/03 00:43
jasonkeen:個人覺得要跳脫棒球的統計方式思維才有可能建立籃球自己 01/03 00:43
jasonkeen:完整的統計模型,統計還有很多新奇的工具還在法展當中~ 01/03 00:43
willyt:樓上中肯。 01/03 00:47
jasonkeen:現在大部分人學過或接觸過的統計都只是很淺很淺的統計… 01/03 00:47
ericlov:另外美式足球似乎也是很適合導入統計的運動,情形較類似棒 01/03 00:47
ericlov:球,是一個Play 一個Play進行的....... 01/03 00:48
nwohippo:不過如果什麼都可以統計出來~那球賽也不好看了XD 01/03 00:54
jasonkeen:個人想法是,只是數據和時間有高度相關性,就很難用棒球 01/03 00:54
McCain:這篇要不要M起來呢 01/03 00:56
jasonkeen:那一套來玩,棒球的數據跟時間幾乎無關,所以容易紀錄。 01/03 00:56
monmo:其實我覺得兩位都沒錯 只是彼此抱持的信仰中心不同罷了 01/03 01:05
babylon2:老實說.....有史騰和他的手下在,籃球要發展統計很難 01/03 01:05
monmo:另外我也認為judy以隊為核心的探討跟美夢以人探討 似乎不該 01/03 01:05
monmo:一概而論 這樣似乎有點把個體經濟跟總體經濟混在一起談.... 01/03 01:06
monmo:還有 是否應該討論加入"零容忍"政策的影響呢? 也難怪上面的 01/03 01:07
TheDream:我講的是統計學裡離群值的預測本來就是很難。 01/03 01:07
monmo:板友會說有Stern在似乎難以發展統計學XD(還是要推這串討論) 01/03 01:08
TheDream:統計學想預測就有難度了,何況是預測離群值呢? 01/03 01:08
guesswho:BIG的數據為什麼下滑,不是看數字就能知道原因的..推~ 01/03 01:08
Drexler:推 TheDream的文章看起來就是舒服 不亢不卑 01/03 01:09
monmo:所以我說或許根本是你們2位對統計學信仰的不同呀 這真的是 01/03 01:09
monmo:不到最後結果出來 誰也說服不了誰 但所以我說2位都有理 01/03 01:09
mminlyrics:連不亢不卑都出來了 01/03 01:11
TheDream:如果只看結果的話,大家都不用分析了啊!XDDD 01/03 01:11
TheDream:monmo 我文章是指出juby27用統計學的方式錯誤了,一開始 01/03 01:11
monmo:不是這樣說的啦 分析本來就不見得確定誰有理 重要的收穫是 01/03 01:12
guesswho:BIG3 01/03 01:12
monmo:彼此激發對於思考過程中的各種角度 我個人是覺得2位都讓我有 01/03 01:12
TheDream:他的分析方法就無法站住腳,結論當然也就不用看了啊! 01/03 01:12
monmo:收穫...美夢你說的我了解 不過我想judy兄想法跟你應該不同 01/03 01:13
TheDream:除非他真的認為籃球統計學能預測很準,且能預測離群值。 01/03 01:14
monmo:而那不同可能就牽涉到彼此對統計學能做到的事情的不同觀感了 01/03 01:14
TheDream:不然的話,他的其他內容都是基於這兩點下去建立的。 01/03 01:14
monmo:對 就像你說的...不過我認為他信服的是"團隊"的統計數字 01/03 01:15
monmo:這也是我認為美夢你比較多舉"個人"來談籃球統計 其實大概也 01/03 01:15
TheDream:籃球統計學如何從人的數據轉換成隊的數據又是另外一項功 01/03 01:15
monmo:說服不了他的原因 這也是我提到個體經濟VS總體經濟原因 01/03 01:16
TheDream:課了,隊的數據是由人的數據堆積出來的,要讓人信服隊的 01/03 01:16
jasonkeen:我認為還是可以引入 Time series的去預測趨勢,不過目前 01/03 01:17
TheDream:數據以前,籃球統計學必須先做到人的數據完整性。 01/03 01:16
monmo:這門功課我不行XD 只能提出我看到的討論差異 如果可以 能否 01/03 01:16
jasonkeen:還沒有看過有人用這個工具。 ^想法 01/03 01:17
monmo:請你從這角度切入呢? 拿"隊"數據之於籃球統計學的發展來探討 01/03 01:17
TheDream:其實我也跟各位一樣還在摸索籃球統計學。 01/03 01:18
monmo:我被你對離群值的不可預測性說服 但judy來長期"隊"於全聯盟 01/03 01:19
TheDream:而且統計學老實說不是我的強項。XD 01/03 01:19
※ 編輯: TheDream 來自: 118.168.15.85 (01/03 01:21)
monmo:的數據有參考價值我也認同 不過我也認為judy太高估統計數據 01/03 01:19
monmo:所能達到的預測或評估效果... 01/03 01:21
rangertsao:我是覺得籃球的統計學比之棒球可能難發展太多啦 01/03 01:24
rangertsao:籃球的團隊影響比棒球的大太多 01/03 01:25
rangertsao:而且籃球場上的對抗因子更多,所以心理層面的影響也大 01/03 01:26
rangertsao:用統計學是難以解讀關鍵play所造成的影響的 01/03 01:27
cvgoter:juby27大 認為目前樣本不足 也認為超賽不是特例 01/03 04:14
cvgoter:所以用統計學論述 應該可以接受吧 01/03 04:15
cvgoter:就算統計學不成熟也還是能參考看看 01/03 04:16
justlink:好文 真正抓到point 01/03 08:17
loat5oo:真的很厲害…我佩服u 01/03 12:12