精華區beta Monkeys 關於我們 聯絡資訊
※ 引述《Debugger (Win Shares 痴漢)》之銘言: : ※ 引述《Debugger (Win Shares 痴漢)》之銘言: : : 說到熊隊連勝之後就是連敗 穩定性不足 : : hmm... 穩定性是啥 : : 連勝之後就是連敗就代表穩定性不足嗎? : : 熊隊上半16W32L : : 一支穩定性百分百的銅板 如果正面出現機率固定為1/3 : : 也會偶爾連續幾個正面連續幾個反面耶 : : 那是熊隊的"穩定性"比較好? 還是銅板的穩定性比較好呢? : : 更一般的問題: 六支球隊都看 各用一枚正面機率出現代表該隊上半季勝率的銅板來模擬 : : 請猜! 哪一隊的"穩定性"最好? 最接近穩定性百分百的銅板? : : 等等給解答:b : 讓我的題目更精確一點 : 因為這個想法的動機是"熊隊連勝之後就是連敗 穩定性不足"這句話 : 我要衡量的是 出現連勝的連續場數 以及出現連敗的連續場數 : 跟丟銅板相比 : 會不會有streak平均偏長的跡象? 前幾天閱讀 Hit 雜誌時, 在談到熊隊的部份看到這兩句話: 即使是初階球迷, 也看得出來 La New 熊是一支典型的年輕球隊, 當然, 最欠缺的也就是 穩定. (page 73) 連勝之後又是連敗, La New 熊隊的穩定性還要加強. (page 94) "穩定性"是啥? 這並不是個新鮮名詞, 不管是看報章雜誌還是教練或球員被訪問時所說的 話, 都常常把穩定性拿出來用, 好像穩定性好就會戰績好, 穩定性差就容易會戰績差. 由 於這三個字的意義模糊, 不加以明確定義的話自然是無法用數據來探討的. 依我之經驗, 一般人講到穩定性時, 通常有三種可能的意義: 1. 球隊之勝敗紀錄. 常常連續好幾勝然後連續好幾敗是為不穩定. 前文所引用之 page 94 頁那句話可代表之. 2. 球隊之得失分紀錄. 常常連續好幾局不得(失)分然後又一下子得(失)一堆分數視為不 穩定. 3. 個別球員之攻守紀錄. 以打者為例, 常常一場打個三四安打然後又好幾場打不出來是 為不穩定. 由於這三者意義相差甚多, 在本文中將先探討第一種意義: 勝敗紀錄. 首先我們必須知道, 會連勝然後連敗然後又連勝如此循環的球隊跟穩定性不足未必有關. 如果連續丟一枚正反面出線機率都是五成的銅板二十次, 結果可能是: 正正反反反反正正反反反正正正反正正反反反 (亂數模擬結果) 如果把正面當成勝, 反面當成敗, 那麼這枚銅板一樣也會出現連勝與連敗 但這枚銅板的"穩定性"如何? 如果"穩定性"是指球隊整體獲勝的能力, 也就可以大略用銅板出現正面的機率來代表 (當然, 現實生活中, 這還跟對手的銅板長怎樣有關, 也就是比較像是在玩西八辣, 所以這個模型已被簡化了很多. 不過概念是不變的, 較複雜的模型一樣可以藉由模擬 來比較.) 那麼銅板的穩定性當然是最好的, 不管是第幾次丟, 都是五成五成機會. 那麼實際上的球隊又是如何呢? 以熊隊上半季為例, 勝敗紀錄依序是: (這裡忽略和局以便處理) L, L, W, W, L, L, L, L, W, L, W, W, L, L, L, L, L, W, L, W, L, L, L, L, L, W, L, L, W, L, L, W, L, L, L, W, W, W, W, W, W, L, L, L, L, L, L, L 共16W32L 既然要觀察連勝連敗, 我們將連續的 W 還有連續的 L 改寫成以下的格式 L2, W2, L4, W1, L1, W2, L5, W1, L1, W1, L5, W1, L2, W1, L2, W1, L3, W6, L7 意義就是先連敗兩場, 然後連勝兩場, 然後連敗四場, 以此類推 所以在這 48 場比賽中, 熊隊一共有 19 個連勝或連敗, 而平均每個連勝或連敗的長度是 (2+2+4+1+...+3+6+7)/19 = 2.53 另一方面, 假設現在另有一支球隊, 獲勝機率與熊隊上半季的勝率完全相同, 每場都是 1/3 的機會贏, 我們用一個正面出現機率 1/3 的銅板來模擬, 連丟 48 次, 代表 48 場比賽, 然後紀錄下來連勝連敗的次數以及平均長度. 以丟銅板的觀點來說, 如果熊隊穩定性不足, 傾向於持續連勝連敗的話, 那麼熊隊的平 均連勝或連敗長度就會比銅板的連續正面或連續反面長度要來得更長; 相對的, 熊隊的 連勝或連敗次數就會比銅板的連續正面或連續反面次數要來得更少. 當然, 只拿銅板連丟個 48 次然後來跟熊隊戰績做比較變數太大, 只模擬一次在統計上 的意義不大, 所以我模擬了 1000 個半季, 也就是 1000 次 48 場比賽, 分別記錄下次 數以及長度, 最後加以平均. 除了考慮熊隊, 也對其他隊作相同的處理, 每支隊伍對應 到一個正面機率等於該球隊上半季勝率的銅板, 然後各模擬 1000 個半季. 結果是: Str=Streaks=連勝或連敗的次數 StL=Streak Lengths=連勝或連敗的平均長度 real life coins simulation Games Wins Str StL Wins Str StL 兄弟 48 25 25 1.92 25.07 24.54 2.00 統一 50 24 26 1.92 23.99 25.80 2.02 興農 48 28 23 2.09 27.95 24.07 2.04 中信 48 24 24 2.00 23.94 24.42 2.01 誠泰 48 28 21 2.29 28.01 23.91 2.06 辣妞 48 16 19 2.53 15.95 21.86 2.26 由於模擬的球季數相當多, 每支球隊實際的勝場數跟模擬出來 1000 個球季的平均勝場 數幾乎一樣, 這沒啥新鮮的. 重點來了, 我們觀察每支球隊的實際與模擬的連勝連敗次 數及長度可以發現: 兄弟, 統一, 興農, 中信四支隊伍幾乎沒差. 次數跟長度誤差頂多就只有 5% 上下. 誠泰與辣妞明顯地有較少以及更長的連勝連敗, 似乎符合了 Hit 雜誌中的那句話. 不過, 這兩支隊伍的情況大不相同. 誠泰之球季初期受中本以及兩名日投的影響, 戰績 低迷不振, 而在林恩宇入隊以及啟用馬力歐之後煥然一新. 用 48 場比賽都是固定正面 機率的銅板來模擬誠泰隊會得到相當大的誤差. 至於辣妞, 我找不到什麼好理由了. 所以 Hit 雜誌中的那兩句話的確有些道理. 而穩定性跟會不會奪冠軍有啥關係? 興農誠泰跟統一在這方面的"穩定性"沒啥差別. 別把一支球隊的強弱跟穩定性弄混了. -- Win Shares (暫譯勝場貢獻指數) 是由棒球統計魔人 Bill James (現任紅襪隊 Senior Advisor, Baseball Operations) 所提出用來衡量棒球選手攻守整體價值的一套系統, 我 將原公式作了些許的調整與取捨, 以用來計算中華職棒史的球員排名. 相關文章放在 ptt BBS 站 CPBL板精華區以及台灣棒球資訊網專欄區 http://twbaseball.info/column_alist.php?editer_no=21 歡迎來信指教 ^^ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.114.34.57 ※ 編輯: Debugger 來自: 140.114.34.57 (07/18 23:38)
Debugger:sorry請重新推 @@ 140.114.34.57 07/18
gingling:期待續集~~ m(_ _)m218.184.107.157 07/19
AtpRyan:這個好誇張喔,太猛了,不愧是癡漢。 61.220.216.209 07/19
Debugger:哪裡誇張? @@ 這比 Win Shares 容易算多了 140.114.34.57 07/19
Debugger:喔 穩定性寫了三個意義 就是打算寫三篇的:b 140.114.34.57 07/19
AtpRyan:那你要多多寫一點喔,收入文摘了。 61.220.216.209 07/19