精華區beta NBA 關於我們 聯絡資訊
juby27 板友,本來我是不想再回你的文了,不過我看了你的前文,發 覺你自始至終都搞錯一個很重要的問題,你有沒有仔細去看看為什麼我 會質疑你呢? 我就直接告訴你好了,這個討論串從頭到尾我的態度都一樣,我質疑的 是你的推論過程與推論所使用的方法,我從來沒有質疑過你的推論結果 。 在結果還未知的情況下, 我們在 NBA 板這個討論區所討論的是推論的 過程是否合理,推論所使用的方法是否正確,這才是我們討論時最重要 的交集點,我們討論的交集點從來就不是結果是否正確。 雖然我的專業不是在統計學這方面,雖然我只修過生物統計學、流行病 學、公共衛生學這三門統計學相關課程,但是以我所學過的粗淺統計學 觀念,很遺憾地我必須告訴你一件事。 你把統計學想簡單了!!! 下面我就來教你真正的統計學是怎麼運作的吧! 首先這個討論串裡, 提出要用籃球統計學來預測 Celtics 失分走勢的 人是你,那問題就很清楚了,你的目的是想要利用統計學來預測一個事 件的走勢。 要怎麼用統計學來預測事件呢? 第一, 你必須先知道這個事件本身是否能夠量化。 關於籃球場上的事件是否真的能夠完全量化成數據來表示這一點,相信 你也知道目前的籃球統計學在這方面有遇到很大的瓶頸,不過我個人還 是認為你一定會堅信防守失分這個部分一定能夠量化。 如果我在這邊要跟你吵是否能夠量化的話,那看來不管我怎麼說你還是 無法理解,所以我這邊就先假設防守失分這一個事件能夠被數據完全地 量化出來。 雖然我這邊是假設防守失分能夠量化,不過我還是得提醒你一個很重要 的觀念,統計學家是用很有邏輯的觀念與數學模型或數學程式來告訴讀 者,他們如何去把一個很難量化的事件給量化出來,但是很遺憾地,我 從頭到尾都沒看到你告訴大家要如何去把防守失分這個事件給完美地量 化出來。 不過沒關係,如果你不想說服大家你是如何把防守失分這個事件給量化 出來,那也沒關係,我們先跳過這個問題,繼續往下面討論下去。 當你確定能夠把你要研究的事件給量化起來時,你接著該做什麼呢? 第二,選取你要研究的母群體,然後利用這些母群體去找出一個方程式 來表達母群體裡面的每個事件,然後再告訴大家你的 R(相關係數)平 方是多少,讓大家知道你這個方程式是否有到達一定的效力,如果這些 都做完了,這就是你所選的母群體所組織出來的一個模型。 接著你應該就是要拿這個模型來預測了吧? 但是你現在要怎麼說服大家你這個模型真的可以預測呢?因為預測的目 標並不是你原本所取的那些母群體,而是不屬於原來母群體的新事件, 那要怎麼辦呢? 第三,因為你現在想做的是預測這件事,那你應該先讓大家知道這個模 型在預測時到底有多大的效力,這個時候你可以拿這個模型先去預測一 些走勢比較正常的新事件(就是除了那些離群值以外的新事件),等到 你證明給大家看說這個模型的確是能預測新事件走勢時,那你再進一步 來預測所謂的離群值新事件。 舉個例子,在這個討論串裡, 你如果想要預測 Celtics 失分這個你認 為的離群值新事件,那你應該先把你的統計模型拿去預測本季其他球隊 失分的這些新事件(當然要先扣除左端與右端的離群值),等到你的模 型的確能夠精準地預測這些正常走勢時的新事件時,大家才會相信你這 個模型的確是能夠應用在預測新事件。 接著就是要預測新事件中離群值的走勢了吧? 嗯,這邊你可以開始預測新事件中的離群值了,不過我發覺你口口聲聲 把統計學掛在嘴巴上,可是就連基本的統計學核心觀念都沒有,我真的 很好奇你到底是真的懂統計學還是你根本不懂統計學。 沒錯!你現在可以預測離群值,只是我看了一下你前面的文章,感覺你 實在是有點好笑耶。 你拿統計學來預測新事件難道不用附上信賴區間嗎?你連基本的 95 % 信賴區間都沒有列出來,你要讓大家怎麼相信你的預測啊? 我真懷疑你這樣搞真的是在預測嗎?我頭一次看到有人用統計學預測新 事件而且沒有附上信賴區間,最讓我吃驚的是,沒有信賴區間的預測值 竟然能夠讓你講話那麼大聲,我真的懷疑你學的是哪個版本的統計學? 我翻了一下你前面的文章,我發覺你根本就是在鬼打牆,你須要做的不 是舉一大堆完全不相關的例子來證明你的籃球統計學是對的,你須要做 的是實際去做一個模型出來,然後按照上面我所講的過程去預測,你根 本不用浪費那麼多時間舉一堆沒有相關性的例子,你只要把你的模型建 立出來,質疑的人就只能質疑你的模型對錯而已,這麼簡單的道理,我 真懷疑滿口統計學的你竟然不懂? 統計學家做的不是無窮舉例的水磨功夫,他們是建立一個模型讓質疑的 人針對模型去質疑,而只要他們的模型有錯,那就完全不用去看他們的 結論了。 就算 Celtics 的防守失分最後會上修, 我還是敢站出來指出你的錯誤 ,因為我質疑的不是你的結論,而是你拿來論證的方法與推論過程。 在你還沒有辦法做到符合科學步驟的推理過程時,希望你不要再把科學 與統計學掛在嘴巴上,因為那只是假科學,那只是假統計學而已。 等你真的能夠做到科學與統計學的步驟時,那你再來跟其他人說你使用 的是科學,你使用的是統計學。不然的話,你也只是假科學與統計學之 名,進行謊言的包裝來誤導板友而已。 我方法都丟給你了,既然你口口聲聲想要用籃球統計學來預測 Celtics 失分,那你就做給大家看吧!這會比你舉什麼網球的例子、棒球的例子 、足球的例子都還要有意義,在你建立起你的模型來解釋你的理論前, 你的任何舉例都沒有任何說服力。 你口口聲聲把統計學掛在嘴上,你仔細想一想,我上面講的步驟你做到 幾個呢? -- http://blog.pixnet.net/IZXNHSO 個人 Blog,歡迎參觀指教。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.168.12.98
jkw552403:推一個 專業戰文 01/04 00:03
GoBay:這已經跟NBA沒有關係了,要戰寄信去戰 01/04 00:03
ForeverOrz:戰到現在juby講的感覺比較有道理-.- 01/04 00:03
UncleGarlic:收手吧 01/04 00:04
XI:好像已經戰很久了 01/04 00:04
TheDream:jubt27 要使用統計學請按照步驟來。 01/04 00:04
sanpaul:你現在打這篇 已經不算是討論了 算是挑毛病差不多了= = 01/04 00:04
TheDream:上面打錯,是juby27。 01/04 00:05
rangertsao:推~~在我看來 j版友根本是在傳教 01/04 00:04
ARODisGod:好像在看教科書喔 不過還是要推 01/04 00:05
Caster:大魔王出聲了 來人搬張椅子過來 01/04 00:04
TheDream:juby27 的模型有問題,說我挑毛病? 01/04 00:05
Price:喔 ... 個人認為這已經太離題了,建議 TheDream 多聊聊數據 01/04 00:06
chuehyeh:我推美夢大~ 01/04 00:06
Price:背後的東西吧,這才是廣大版友(包括我)想看的喔 ~ 01/04 00:06
Drexler:juby上一篇有點嗆的文章把夢大惹火了Orz 01/04 00:07
rangertsao:被嗆討回來也是正常的啦 01/04 00:07
Price:研究攻守數據的確很有意思,但攻守數據的來源仍然是場上的比 01/04 00:07
TheDream:juby27 想聊統計學,我就陪他聊一下啊! 01/04 00:08
ForeverOrz:..哪門子的惹火 他懷疑他的模型也是你這篇才新跳出來的 01/04 00:08
ericlov:我推你的勇敢與堅持,以及從來就不迂迴的直接(  ̄ ﹁ ̄)b 01/04 00:07
tiberian:數據不一定要全用統計的方法來看吧,模型也不是j大作的啊 01/04 00:07
TheDream:Price 大你說的東西等我有更多了解時,我才敢出來談。 01/04 00:08
ForeverOrz:之前那篇明明只是在講不應該以統計學來看 01/04 00:08
Price:賽,還是先把焦點放在比賽本身吧! 01/04 00:08
TheDream:不是juby27做的?那怎麼預測呢?這是哪門子統計學? 01/04 00:09
TheDream:juby27 想用統計學,那就不要半調子。 01/04 00:10
Price:客氣啦~ 你已經懂很多囉,不過就算懂的不夠多,也還是可以聊 01/04 00:09
hardaway:好想大推......................... 01/04 00:10
rahim1211:推文裡頭好多資深板友XD 01/04 00:10
tiberian:都是用82games上面的東西吧,只是他認為那個數據有點誇張 01/04 00:10
TheDream:他想預測,那他的模型在哪裡我看不到,只看到嘴砲吧! 01/04 00:11
tiberian:但是討論似乎是走錯方向了,他想用常理來推斷卻撿用不太 01/04 00:11
DonNelson:推,這個好。 01/04 00:12
carbineer25:連推文都有原PO的蹤跡^^ 01/04 00:12
tiberian:洽當的例子,統計並不好做啊,82games並沒有開放數據讓大 01/04 00:12
TheDream:juby27 想預測就把自己的模型建立起來再說!不然只是嘴砲 01/04 00:13
tiberian:家自由的去玩,那要怎麼去作呢 01/04 00:13
TheDream:怎麼做為什麼要問我?是我拿數據來預測嗎? 01/04 00:14
tiberian:何必火氣這麼大,他想說塞隊防守不如數據上那麼驚人而已 01/04 00:15
Altair: 說真的 根本就是量化vs.質化 01/04 00:16
Altair: 質化的人說量化研究不可信 01/04 00:16
hardaway:的確,一開始莫名其妙跳出來預測 Celtics 的失分會上修的 01/04 00:16
TheDream:我重申一點,要用統計學,就請不要半調子。謝謝! 01/04 00:16
hardaway:是 jubu27.. 01/04 00:16
Altair: 量化的人說質化在練肖話 End 01/04 00:16
CaCHookaMan:整篇我沒看到跟nba有關的東西 01/04 00:14
rangertsao:問題是量化的那邊說的話又籠統模糊還語帶指責.... 01/04 00:17
CKnightalker:信賴區間ing 推一個XD 01/04 00:18
tim1112:數據分析也是NBA的一部份,何況主題一直繞著塞爾提克啊 01/04 00:19
lawrence0000:整篇我沒看到跟nba有關的東西 01/04 00:19
brianhuang15:我要推這篇 01/04 00:20
jack18262:不推不行 01/04 00:21
tiberian:一些指標本來就是設計給人看的,討論一下沒有什麼關係 01/04 00:20
rangertsao:噓文的是連討論串都沒看就來亂入的吧~~ 01/04 00:21
AQUANGEL:息怒阿~~ 01/04 00:22
joumay:不推不噓, 只想到以前在盈月看到的老怪物(統計系教授)..... 01/04 00:23
joumay:順帶一提-量化必須考到尺度的問題,非連續尺度該怎麼做呢... 01/04 00:24
crazyvsjay:....NBA I love this game 01/04 00:32
niubert:jubu講的是均值迴歸現象,基本上很合理,你真的瞭解統計嗎? 01/04 00:39
voon:這個好...我喜歡 01/04 00:41
TheDream:樓上的知道母群體來源不同嗎? 01/04 00:41
TheDream:我指的是 niubert 01/04 00:41
ader302:想討論可以私下 已經離題了站起來 01/04 00:42
niubert:不同球隊一樣視為NBA的母群所抽樣的樣本啊,不然勒 01/04 00:42
TheDream:.......juby27 用以前三年的母群體還預測今年的Celtics 01/04 00:43
TheDream:這叫母群體一樣,我也真是佩服你。 01/04 00:44
niubert:以年份當X軸,一樣可以預測啊,既然是NBA球隊,一樣是母群 01/04 00:44
niubert:所抽樣出來的 01/04 00:45
jjackk:以數據來說,judy的母群體比較大,不過兩位都說分析的很好 01/04 00:43
kuromo:就算是迴歸也得要有模型去跑才行,不同的母體有不同的分配啊 01/04 00:45
niubert:並不是Dream說的有錯,而是他的對不代表JUBU的錯 01/04 00:46
kuromo:好吧,來個假設檢定唄,天氣冷,大家早點睡吧 01/04 00:49
trh:看到樓上不小心笑了出來... 01/04 00:56
kaede0711:這一系列的專業程度已經遠超過一般水準@@ 01/04 00:58
shch:這篇講很清楚阿... j版友套了統計來預測但又不走常規步驟 01/04 01:06
zomzom:我覺得THE DREAM說的沒錯 拿出東西來 避免質疑 01/04 01:09
shch:所以結論並不能由他的過程推出 (即便是對的結論) 01/04 01:07
tzar:原波對統計似乎也沒有很明白,籃球統計比一般統計更複雜 01/04 01:10
tzar:其實在做這樣的預測時,看得是統計方法的Power,不是信賴區間 01/04 01:12
zomzom:既然很複雜 那JUBU怎麼預測? 01/04 01:12
tzar:你談到關於統計的"重點",對籃球統計而言都不是最重要的問題 01/04 01:13
TheDream:to tzar:http://0rz.tw/a23xp 看看人家是怎麼預測的。 01/04 01:17
shch:tzar兄 P-value還是很重要的觀念 Power是看這模型的適用性 01/04 01:21
shch:也許不同模型 P-value可以修正cutoff 但總還是該有個P-value 01/04 01:22
TheDream:你這些話不應該拿來跟我講,請跟要預測的人講,謝謝。 01/04 01:24
tzar:嗯,那是當然. P值不顯著這個MODEL也不用提了 01/04 01:24
tzar:嗯,我對預測的那一位沒什麼意見,基本上他只是一個想法 01/04 01:25
TheDream:把你想說的話拿去對你應該向他說的人說,謝謝。 01/04 01:25
danieljaw:有人願意提供專業意見 到底有哪裡不妥? 01/04 01:26
tzar:我想說的對象就是你呀,我覺得你的做法很好,但不是很精確 01/04 01:26
TheDream:該做的精確的人不應該是我,是要預測的人,謝謝。 01/04 01:27
ando:兩位的文章真的都很有見解 可是感覺好像有點參入情緒在其中了 01/04 01:27
tzar:信賴區間,p值,POWER,還有MODEL本身,信賴區間是最不重要的東西 01/04 01:27
ando:很可惜的.... 01/04 01:27
tzar:嗯,我只是針對你統計的說法,沒有什麼特別的意思~拍謝 01/04 01:28
TheDream:ando 要不要看看是誰的口氣先變的這麼差的? 01/04 01:28
TheDream:還有 tzar 請看清楚我說的,統計學不是我的專業,我只是 01/04 01:29
TheDream:提出一些 juby27 該努力去論證的方向。 01/04 01:30
tzar:是的,我當然懂,我們都不是統計學專家 01/04 01:30
tzar:我也贊成你指出好的方向給J板友參考 01/04 01:31
TheDream:那你為什麼推文說我對統計學不明白?我自認為沒有像juby2 01/04 01:31
tzar:不過我只是想提醒你,你對統計的說法似乎太果斷 01/04 01:32
TheDream:7那樣濫用統計學,請你先看清楚是誰濫用統計學,謝謝。 01/04 01:32
tzar:我不想比較你和別人,我是針對你本篇的內容推文的 01/04 01:32
TheDream:果斷也罷,我本來就是指出方向而已,你不覺得你這些話更 01/04 01:32
TheDream:應該拿去對濫用統計學的 juby27 說嗎? 01/04 01:33
tzar:我只是單純回應你本篇的內容中,關於統計的部分 01/04 01:33
tzar:我不覺得.懂統計學的人就知道他的預測方法不好 01/04 01:34
TheDream:我不打算做預測,所以我實在不懂你跟我講這些要做什麼。 01/04 01:34
tzar:不懂的也看不出來他做的有什麼不對.所以跟J板友講沒意義 01/04 01:34
tzar:我就是單純要跟你說,你想用對方統計的弱點攻擊別人 01/04 01:35
jeei:哇,教學勒... 01/04 01:35
tzar:就要考慮到自己的統計是不是有弱點,若有,就不要太果斷 01/04 01:35
TheDream:呵呵,原來我提出的步驟錯的juby27來的大,所以你才來推 01/04 01:36
TheDream:文指正我啊。真是受教了,少陪了。 01/04 01:36
tzar:否則你的說法也跟他一樣,是不值得信賴的 01/04 01:36
tzar:我沒有這樣說,TheDream. 你不要硬把自己跟J板友扯在一起 01/04 01:37
ted0217:TheDream已經火起來了,不過我想tzar是沒有惡意的 01/04 01:38
shch:大家消消火氣 Boston這邊零下十三度 冷死我了 (≧<>≦) 01/04 01:39
zedan:thedream好熱血啊 01/04 01:40
kuromo:不過老實說,juby如果要用數據,的確要把自己的模型拿出來 01/04 01:41
kuromo:不然其實是不能說是統計,只是自己主觀的拿些資料用而已 01/04 01:42
kuromo:S大,暴風雪走了沒,再待幾天,我看原油都要破$110了 01/04 01:43
danieljaw:既然有人先提到數據跟統計 那就得回應一下吧??? 01/04 01:57
AKgino:juby大用數據來佐證自己的推論並沒錯阿~ 01/04 02:07
AKgino:況且也不可能寫出一個能百分百預測的模型~ 01/04 02:08
shch:後天會回暖到零度 但是前天還是五度 突然一天降十度受不了 01/04 02:08
maisonette:judy27的方法不是不行 但是對於C's這樣一個相對於近幾 01/04 02:40
maisonette:年差異甚大的隊伍而言 會產生類似Lucas critique的效果 01/04 02:42
shch:剛想到要驗證可以簡單做些數據 把前幾年防守排名好的隊伍 01/04 02:52
shch:82場切割成三份 只要證明局部場次有特別高防守表現 01/04 02:53
shch:但是整體又會趨於穩定平均就可以說明賽程和樣本只有33%有影響 01/04 02:54
shch:這樣就比較不會流於空談 因為別人也發生過局部防守表現特好 01/04 02:56
shch:不過這樣也不足以歸因於為 和強隊交手場次不夠 01/04 02:58
shadowwind:TheDream的主觀意識真的很強 tzar有說錯嗎? 01/04 03:15
shadowwind:為什麼不能想想他說的是什麼意思 而一味地將矛頭轉回 01/04 03:15
shadowwind:juby27 有料令人激賞 但你的態度實在不敢領教 01/04 03:16
shadowwind:口口聲聲說自己統計不夠專業 那為什麼無法接受別人對你 01/04 03:17
shadowwind:在統計上的質疑 不是自打嘴巴嗎? 01/04 03:18
rangertsao:樓上根本搞不清楚狀況 01/04 03:56
Diawara:推這個 01/04 08:52
Diawara:應多看幾場比賽再來做深入評論 看統計數據有很多盲點 01/04 08:55
Caster:大推啊 01/04 09:33
dollow333:有學過統計的才知道你這篇中肯,話說我還要考這科阿 01/04 09:59
Chungyiang:口氣先變差的真的是juby 就此打住吧 01/04 12:11
himem:寫得這麼詳細的話,投稿論文就好了啊,幹嘛來打B -_- 01/04 12:20
himem:這篇的要求太過強人所難 01/04 12:24
danieljaw:如果不是對方要扯到統計學專業 大概也不會變成這樣吧? 01/04 13:12
zerohsu:太猛了 我已經跳過文章了 兩位都太強了 01/04 13:53
himem:這篇文章有歷史群組某戰神的味道 (茶) 01/04 14:47
existfor:我怎麼看都覺得j大上篇口氣不到差 他只是不解被質疑的點 01/04 16:17
SuWeiLin:好文,不過口氣如果能更和緩些一定更好,加油吧! 01/05 02:22
charlie99999:推 01/05 12:10
koking730929:關於模型的建立與效力跟預測力的解釋完全錯誤 01/05 17:22