推 XII :E=(1/3)(E+1)+(2/9)(2+E)+2(2/3)^2 => E=15/4 04/08 16:11
※ 引述《depo (depo)》之銘言:
: 這一題是模擬考考題,有3顆球,2白1紅,取後放回,當取到連續兩顆白球的時候,
: 停止取球,求取球期望值,我的想法是先重兩顆球,3顆球,4顆球判斷他有沒有規律
: ,發現沒有明顯的規律,不知道是否有更好的解法?
: 推 TWN2 :這是Markov chain練習題吧 用連續兩球顏色當state 04/08 14:12
: 推 LPH66 :樓上這也是中學沒教的東西吧 @@" 04/08 14:42
突然想到應該是用 Markov chain 沒錯
(只不過中學不會把這個名詞講出來而已)
令最後拿出來的兩球是 白白/白紅/紅白/紅紅 之後分別還要多少球才會停的期望值
分別為 n_ww, n_wr, n_rw, n_rr
也就是當最後兩球是紅白時平均還要 n_rw 球才會停 其餘類推
顯然 n_ww = 0 (這是停止條件)
另外三個我們有
n_wr = ((1/3)n_rr + (2/3)n_rw) + 1
n_rw = ((1/3)n_wr + (2/3)n_ww) + 1
n_rr = ((1/3)n_rr + (2/3)n_rw) + 1
解釋一下 以 n_rw 那一行為例
前兩球是紅白時 若抽下一球是紅 (機率 1/3) 則還要 n_wr 個
若抽下一球是白 (機率 2/3) 則還要 n_ww 個
再加上抽的這一球 於是就列出上式
解這個聯立方程組 由於 n_wr = n_rr 若令它們為 n_r 的話
方程可以簡化為
n_r = (1/3)n_r + (2/3)n_rw + 1
n_rw = (1/3)n_r + 1
解得 n_r = n_wr = n_rr = 15/4, n_rw = 9/4
我們要求的總期望值則是
2 + [(4/9)n_ww + (2/9)n_wr + (2/9)n_rw + (1/9)n_rr]
也就是先抽兩球之後套前面的結論
代前面的結果進去即可求得答案為 15/4
--
LPH [acronym]
= Let Program Heal us
-- New Uncyclopedian Dictionary, Minmei Publishing Co.
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.230.62