這問題要用backward induction
從你的計算,對囚犯而言死的payoff是 0 而放人的payoff是1
對國王而言死的payoff是 1 而放人的payoff是0
我們的決策樹可以表示成normal form:
First Stage:
P
B W
B 0,1 1,0
K
W 1,0 2nd stage
Second Stage:
P
B W
B 0,1 1,0
K
W 1,0 0,1
Second stage 的 game 就成為matching penny的game。
我們可以知道 P3=1/2 and P4=1/2
我們再將second stage 的預期 payoff 帶入 first stage:
First Stage:
P
B W
B 0,1 1,0
K
W 1,0 1/2,1/2
從這我們可以求P1=1/3 and P2=1/3。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.58.77.116