精華區beta MLB 關於我們 聯絡資訊
※ 引述《nickyang (肌腱炎者少打字)》之銘言: : ※ 引述《tlchen (台灣加油)》之銘言: : : 看到這樣的解讀,不禁讓我想起多年前那個第九棒比第三棒重要的統計分析解讀 : : http://blog.roodo.com/bubblesld/archives/1257814.html : : 統計不能這樣玩的。迴歸分析只告訴你,在某種模式下,一些變數的關係。 : : 在上面的情況,它只是告訴你,若是跑者盜壘的想法不變下(same as 2000-20012) : : 看到盜壘成功跟盜壘失敗的數據,對於得分預測的影響係數為 0.1492 跟 -0.102 : : 若你用這個得結果來說,有四成保握就可以跑, : : 那跟用迴歸分析來說第九棒要放比第三棒好的打者一樣荒謬。 : : 因跟果要先弄清楚。統計分析通常只是分析果。 : 我覺得你說對一件事,但誤解了其他 : 分兩部分講,一部分回應你一部分講我後來的發現 : 先從你給的連結談,不知道作者是不是你 : 沒有錯,數字不會騙人,會騙人的是解讀的人,但是錯誤解讀跟以偏概全是一樣荒謬 : 以那個blog所舉的http://www.beyondtheboxscore.com/story/2006/2/12/133645/296 : 這篇研究來說,其實作者根本沒有犯blogger想要暗示的錯誤 : 的確其他人可能錯誤解讀,襪板的討論可能走偏,但是那篇作者有將他的數字解讀成 : 「好打者應該放在第九棒勝過第三棒」嗎?並沒有 : 看不懂作者研究方法的人容易這樣錯誤解讀,但你說這是不是有價值的東西?絕對是的 你可以再去看一下我 blog 的文章,我說後來那些討論源起於 Beyond the box score 那篇文章。那篇文章沒有問題,它並沒有錯誤解讀。錯誤的是之後的許多討論。甚至 有寫好程式,告訴大家怎麼根據那些迴歸係數來排棒,可以得到最多的分數。若這樣的 方式是對的,就代表越好的打者要放在係數越高的地方。 : 我可以了解你想講的點,但是你那篇研究跟我的問題這兩個例子都找錯了 : 同樣的,我試圖在證明四成把握就該跑嗎?在文中我用的問號 : 在後面我補充了很多可能沒考慮的因素,我的目的是討論,像abc拿矩陣圖出來 : 之前我就沒想過也許這是一條可以解決我的問題的路 : 你說只有在跑者想法不變下這些數字才能應用在未來的決策,理論上這是對的 : 不過用你這樣的想法,實際上所有的棒球統計都不能應用了不是嗎? : 回歸分析只能描述過去,我在之前討論9個Fielder跟Ryan的文章提過一樣的講法 : 就算證明九十九隻羊是白羊,我們的確也不能說第一百隻不是黑羊 : 但用回歸分析預測未來的假設本來就是環境不至於太大的變動,然後發生在過去的事 : 極可能發生在未來,這樣的假設同樣應用在所有棒球統計的預測系統 : 不然一句宇宙無常就解決了,還sabermetrics什麼? : 而且實際上out of sample的預測能力如何? : 假設0.14跟-0.1這兩個數字是對的,理論上這只能表示在00~12這段時間他們的價值如此 : 但是13年會是完全另外一個世界嗎?possible but not likely right? : 如果他們是對的,如果並沒有太多人察覺這一點,比七成把握再盜更冒險的跑非常有可能 : 帶給球隊被低估的好處 : 我也說了這可能有surrivior bias,並不表示四成的人就「應該跑」 : 但是不是表示絕對不可能?如果你試圖證明多數人的解讀方法太大膽 : 我以為你這種反駁方式反過來可能抹煞太多可能性 你還是沒弄懂,2013 的數據,用那係數去預測,沒有問題。迴歸分析,本來就可以 這樣用。有問題的是,試圖用這樣的數據去改變盜壘的機制。這等於是用不同模型去 產生一組新的數據,卻用舊模型的迴歸分析來進行預測,這樣是沒有意義的,就跟之 前用那些數據去建議最佳棒次,犯了一樣的錯誤。 若要考慮多少的機率應該跑,用 run expectancy table 自然是較合適的作法。它也可 以告訴我們,在不同出局數下,多少成功比率以上的盜壘,可以增加得分的期望值。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.109.74.113
nolander:推 03/23 08:52
isaacc:你是泡泡龍嗎? 03/23 08:58
Herlin:樓上到現在才發現.......我必須說有點慢 (溜) 03/23 09:13
isaacc:我十幾年沒看到他啦~看到文章內容才越來越有感覺,呵呵 03/23 10:10
isaacc:念數學的,寫出來的東西就是不太一樣... 03/23 10:11
zDavi:泡泡龍大都還偶有在襪版發文啊 真的發現的太晚了 03/23 23:35