看板 BoardGame 關於我們 聯絡資訊
※ 引述《nahsnib (悟)》之銘言: : 關於猜拳到底是不是運氣問題,我想可以引用賽局理論(雖然我也沒修過) : 舉例而言: : 現在A與B都有攻擊與防禦兩種選擇,我們畫個表格來表示其結果: : A\B 攻 防 : 攻 A得2分 B得1分 : 防 B得1分 A得1分 : 我們可以很簡單的分析,對A而言攻擊的效果大於防禦的效果。 : 如果這是個比較分數差距的狀況,那麼我們可以稍微改寫一下表格: : A\B 攻 防 : 攻 A得3分 XX : 防 XX A得2分 : 這麼看來,對A來說應該要以3/5的機率選擇攻擊,2/5的機率選擇防禦比較恰當, : (上面這段不太確定,還請實際有學過賽局的人表示一下) 這邊是錯的! 納許平衡是一個保守的策略,他的核心是: 我使用這個策略,不論對手使用什麼策略來應對,"對手的收益"都是一樣的 A\B 攻 守 攻 2\0 0\1 守 0\1 1\0 這個表格表示雙分策略組合的得分 我們先用直覺想一下,如果你是B,你知道A有較大的機率選攻擊(3/5),你會怎麼做? 一般正常人都知道應該要選防守,來讓自己得分的機會變大 你有3/5的機會得1分,2/5的機會得0分,顯然A這樣的策略是行不通的 如果A總是選擇防守,顯然B也應該要總是選擇攻擊,所以A的策略不能總是選擇防守 因此A要選擇防守和攻擊都有可能的"混合策略",讓B不會有"比較好"的決定 ---------------------------------------------------------------------- A\B 攻 守 攻 2\0 0\1 守 0\1 1\0 以上大概念,以下實際的計算: A的策略應該是要讓B無論選擇什麼策略,期望值都一樣。 假設A選擇攻擊的機率為x,防守的機率為1-x 則: B選擇攻擊的期望值=B選擇防守的期望值 A攻B攻+A守B攻=A攻B守+A守B守 x*0+(1-x)*1=x*1+(1-x)*0 x=1/2 A應該要選擇1/2攻擊、1/2防守,此時無論B選擇什麼策略都會得到1/2的期望值 相對的也可以分析B的策略,如果B也採用納許平衡的策略 假設B選擇攻擊的機率為y,防守的機率為1-y 則: A選擇攻擊的期望值=A選擇防守的期望值 A攻B攻+A攻B守=A守B攻+A守B守 y*2+(1-y)*0=y*0+(1-y)*1 y=1/3 B應該要選擇1/3攻擊、2/3防守,此時無論A選擇什麼策略都會得到2/3的期望值 因此實際上,雙方都採用奈許的策略時: 16.7% A得2分 50% B得1分 33.3% A得1分 -------------------------------------------------------------------- 這個賽局表格也可能會長下面的樣子,算起來完全不一樣: A\B 攻 守 攻 2\-2 -1\1 守 -1\1 1\-1 這是個零和賽局 A應該選擇2/5攻擊、3/5防守,給予B -1/5的期望值,不論B做什麼決定 B應該選擇2/5攻擊、3/5防守,給予A 1/5的期望值,不論A做什麼決定 因此實際上,雙方都採用最保守的奈許的策略時,我們預測: 16% A得 2分,B得-2分 48% A得-1分,B得 1分 36% A得 1分,B得-1分 大家可以自己試著算算看 記住奈許均衡的策略核心是: 不論對手做什麼樣的策略決定,他的受益都是一樣的,即使他完完全全了解你的策略 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.114.214.35 ※ 文章網址: http://www.ptt.cc/bbs/BoardGame/M.1405950718.A.1B5.html ※ 編輯: itisonlyform (140.114.214.35), 07/21/2014 21:54:06
nahsnib:謝謝指正 07/21 21:55
oktryit:這一定要推一下! 07/21 22:20
isnoneval:平衡點是「沒有人能透過改變自己的策略讓自己更好」 07/21 22:53
tinyfan:推專業分析 07/22 00:34
dharma:推 07/22 14:30