看板 Math 關於我們 聯絡資訊
※ 引述《LPH66 (f0VMRgEBA)》之銘言: : 標題: Re: [機統] 一個想不通的機率問題 : 時間: Tue Dec 17 19:39:52 2013 : : : 這裡是數學板就拿個實際數字出來你自己解讀吧: : : 就以到目前歷史最短的今彩 539 來算 : : 開獎的總號碼數是 C(39,5) = 575757 : : 1~39 裡選 5 個不連號的選法是 C(39-5+1,5) = 324632 : : 也就是說有連號的種類數是 575757 - 324632 = 251125 : : 機率是 251125/575757≒43.62% : : 同樣也可以來算存在至少三連號 37*C(36,2) - 36*35 = 22050 種 : : 機率是 22050/575757≒3.83% : : 存在至少四連號則是 36*35 - 35 = 1225 種 : : 機率是 1225/575757≒0.213% : : 而實際上今彩 539 的歷史數據 : : 到昨天為止的 1971 期當中 (今天的還沒開 XD) : : 有 852 期存在連號 比率是 43.23% : : 有 72 期存在三連號 比率是 3.65% : : 有 4 期存在四連號 比率是 0.203% : : -- : ※ 發信站: 批踢踢實業坊(ptt.cc) : ◆ From: 114.41.20.223 : → wohtp :能不能也提供一下理論值的標準差? 12/17 21:06 : → wohtp :晚餐吃太飽懶得動腦 XD 12/17 21:06 : → LPH66 :你真的晚餐吃太飽了...這只是機率不是分布啊 @@ 12/17 22:15 消化得差不多了,自己來動手一下。 每期出現連號的理論機率是43.62%,一共開了1971期,這就是N = 1971的二次分布嘛。 所以標準差是 43.62% / sqrt(1971) ~ 0.98% (還是分母應該要用1970?反正結果都一樣啦。) 如果用實際上開彩的結果來估計,一個標準差區間是 (43.23 ± 0.97) % 總之,兩邊都在彼此的一個標準差之內,的確是差不多。 : → MOONY135 :推有找數據來驗證的人 12/17 22:26 : → MOONY135 :結果這個機率還真的跟算得差不多XDDDD 12/17 22:27 問題就是,43.23% 跟 43.62% 是不是真的「差不多」?這要看標準差才能知道。 然後我們來看三連號和四連號。 三連號理論值: (3.83 ±0.086) % 四連號理論值: (0.213 ±0.005) % 實際開出的 3.65% 和 0.203% 都在一個標準差以外!尤其是三連號,少了大約 兩個標準差! 兩個標準差以外 => 自然發生的機率只有約 1.5% 樂透開獎真的會迴避連號嗎!? 別高興得太早。三連和四連分別開出72次跟7次,樣本非常少。 從開彩紀錄估計的機率: 三連號 (3.65 ±0.4) % 所以3.83還在取樣誤差裡面 四連號 (0.203 ±0.13) % 這誤差大到沒什麼好說的 所以就是樣本太少,取樣誤差太大,目前還不能斷言三連號和四連號有沒有 被特別迴避。 但二連號的出現頻率符合數字隨機的假設。 L大有興趣看看correlation嗎? XD -- 下列哪一隻鋼彈比較厲害? 1. 公式承認尺寸最小的鋼彈 2. 搭載高性能AI,還有越來越誇張的外掛武裝 3. 在希洽曾被水桶 4. 雖然不能飛,但是很會做菜(? 5. 我想不到第五隻 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.110.184.241
LPH66 :喔是這玩意喔XD 確實三連跟四連樣本數太少 12/17 23:59
LPH66 :correlation應該不用看吧 @@ 四連imply三連imply二連 12/18 00:01
LPH66 :這樣 correlation 的意義好像不大 @@ 12/18 00:01
LPH66 :(其實小樣本數多少也有點故意, 這樣即使差的有點多 12/18 00:02
LPH66 : 表面上看起來還是可以很接近 (炸)) 12/18 00:02
我說correlation是多期之間,例如說用五期、十七期、十九期前的數字 可以預測這一期會開什麼之類的。你找到了我們就發了! ※ 編輯: wohtp 來自: 123.110.184.241 (12/18 00:16)
LPH66 :這種東西不是已經一堆人在做了嗎XD 12/18 01:41
LPH66 :所謂的"拖牌"就是你在講的這個關連啊 12/18 01:41
yhliu :兩倍 "標準差" 並不算太離譜. 不過, 這 "樣本數" 應 12/18 10:30
yhliu :該是指資料的期數, 與幾連號的出現次數是兩回事, 因 12/18 10:31
yhliu :此並沒有 "樣本數太少" 的問題. 比較可能受影響的是: 12/18 10:32
差不多是同一回事啦。 嫌三連號出現72次太少,唯一的解決方法就是等他多開幾千期嘛。
yhliu :一般判斷是否有 "顯著異常" 採用 2倍標準差(標準誤) 12/18 10:33
yhliu :是基於常態近似, 像這種稀有事件, 樣本數需要非常大, 12/18 10:34
yhliu :才足以保證常態近似的適用性. 12/18 10:34
yhliu :如四連號機率 0.00213, 1971期的理論次數是 4.2次, 12/18 10:36
yhliu :常態近似有點不足. 也就是說: 即使實際出現次數與理 12/18 10:37
yhliu :論次數超過2倍標準差, 也尚難說有異常. 用 Poisson 12/18 10:37
yhliu :近似計算其 tail probability 比用常態近似好些. 12/18 10:38
啊,在PTT就稍微嗜血一點嘛 XD 我本行物理,都要求五個標準差的...
silentgiant :除了連號 還有特殊連號或跳號 ex. 2 4 6 8 10 12 12/18 14:47
silentgiant :ex. 4 8 12 16 20 ex. 5 10 15 20 25 ex.2 12 22 32. 12/18 14:49
silentgiant :是不是等我把這些特殊組合都刪除 就 12/18 14:51
itai :推yhliu的講解 12/18 16:12
※ 編輯: wohtp 來自: 123.110.184.241 (12/18 16:39)
MOONY135 :有個笨問題 請問二次分布長怎樣... 12/18 16:25
LPH66 :>silent 你可以看到單算二連就佔去一半了, 12/18 16:27
LPH66 :如果你還把那些特殊連號刪去我想剩下的應該不到三成 12/18 16:28
LPH66 :過往數據分析會告訴你這麼一來中獎率也會剩下三成 12/18 16:29
LPH66 :那這種狀況值不值得你去投資就自己研究吧 12/18 16:30
LPH66 :>MOONY 那個東西好像是叫做二項式分布的樣子 XD 12/18 16:32
LPH66 :也許是 wohtp 記錯名字了吧 12/18 16:33
MOONY135 :我是覺得標準差好像算得很怪...湊不起來 12/18 16:37
sneak : correlation https://daxiv.com 01/02 15:37
muxiv : 如果你還把那些特殊連號 https://muxiv.com 07/07 11:43