推 beareyes:請問為什麼第一個表中,投手最佳策略是好球呢? 03/16 22:02
推 beareyes:其實我是看不太懂如何從表中算出最佳策略XD 03/16 22:05
→ beareyes:可以拿table 3當例子如何算出那個機率嗎? 03/16 22:06
簡單來說作者的邏輯是這樣的:
1. 打者的最適策略是:不揮
2. 投手已知打者的最適策略是不揮
3. 投手投好球對付不揮的打者
4. 投手最適策略:投好球
“ The equilibrium is obvious when we realize that the batter
has a dominant strategy of taking, so knowing this, the
pitcher’s preference is to throw a strike. ”
於是就要問為什麼打者的最適策略是不揮了
我們來看表一
※ 投打期望值
----------------------------------------
投手\打者 | 打 | 不打
----------------------------------------
好球 | -2,2 | -3,3
----------------------------------------
壞球 | -1,1 | -4,4
----------------------------------------
打者有兩種策略,打或不打。
打的期望值是 : 2 + 1 = 3
不打的期望值是: 3 + 4 = 7
7 > 3,所以打者當然選擇不打。
於是回到前面的邏輯
當投手知道打者不打時
投手的最適策略就是投好球
無聊的時候可以再亂改一下數據
算出來的最適決策又會不一樣
※ 投打期望值(投打不知對方最適決策)
----------------------------------------
投手\打者 | 打 | 不打
----------------------------------------
好球 | -5, 5 | 3,-1
----------------------------------------
壞球 | 1,-3 | -1, 3 最適決策!
----------------------------------------
無最適決策
不然就上上 BR、BP、FG 找一找不同條件下的投打期望值
放進格子裡算一算、比一比大小
你就會發現............
..........................其實只是多了格子的比數字遊戲
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.119.143.208
推 sardiyal:你弄錯dominate strategy的定義了 有DS不是因為期望值高 03/16 23:12
→ sardiyal:低差別 而是不管對手怎麼選,選那項就是比較好,才是DS 03/16 23:13
就是期望值比較高的意思阿
因為決策者選擇某特定決策所得到的結果優於其他任何決策
於是決策者將選擇此作為唯一決策
此時此最優決策就被稱為 dominate strategy
我有學過一丁點賽局啦
但這東西真的只是畫格子遊戲
不用故意從數字出發去繞一大圈公式回來然後比數字
何苦呢
→ sardiyal:下面的也可以找mixed-strategy Nash equilibrium,也就是 03/16 23:14
→ sardiyal:混合策略的最適策略,這也是為什麼說不會知道要怎麼投與 03/16 23:15
→ sardiyal:打,因為最好的策略就是好壞球以某種比例混合,所以打與 03/16 23:16
→ sardiyal:不打的最好選擇也是某種機率的選擇y 03/16 23:17
不是喔 公式是("機率"X"報酬")得出的"期望值"喔
只是因為"機率"是未知數,"報酬"是已知數
所以算出來的樣子看起來是:「"機率"等於某數值」
其實"報酬"已經被算到那個數值裡面去了
另外 mixed strategy 與好壞球"混合"沒關係
你看公式其實都是 one-shot relationship game (一次式賽局)
如果是你說的要好壞球混合
那公式應該會是 two-shot 以上甚至到循環賽局
推 autumned:いいてんきですね 03/16 23:28
推 sardiyal:真的跟期望值沒關係 而是選項的每個結果都比另一個選項好 03/16 23:30
推 DreamWolfX:sardiyal說的是正解,你現在提到的這個不是機率問題 03/16 23:31
我說是"期望值"阿
→ sardiyal:如果要說比數字遊戲,棒球本來也就是球跟棒子的遊戲而已 03/16 23:32
※ 編輯: dans 來自: 140.119.143.208 (03/16 23:34)
推 DreamWolfX:單純是因為3>2而4>1,所以打者會選擇不打 03/16 23:34
我要表示的就是這個,其實作者後面列的公式都沒有意義,因為一開始的數字
就看得出來是這個結果了。作者基於寶隔中的數字演算了一個公式,最後又算
回來說:「你看!打者選擇不揮棒,所以投手最好投好球!」
其實不必這樣阿,就同你所說的:「單純是因為3>2而4>1,所以打者會選擇不打。」
→ sardiyal:你說的公式是指求N.E.的公式,我說的是N.E.的存在性 03/16 23:34
→ DreamWolfX:期望值本身就是機率問題,這又必須區別事後機率和事前 03/16 23:34
→ DreamWolfX:機率。 03/16 23:35
→ DreamWolfX:你可能把太多東西混淆在一起了 03/16 23:35
※ 編輯: dans 來自: 140.119.143.208 (03/16 23:42)
噓 strygwyr:你真的有學過賽局嗎? 廢文也不是這樣發的吧 03/16 23:40
唉...119雖然是文組學校但會教賽局理論啦...
我是在陳老師的 Industrial Organization 課程中學的
※ 編輯: dans 來自: 140.119.143.208 (03/16 23:44)
推 DreamWolfX:問題是你的計算是錯的,這個不是用期望值決定 03/16 23:43
→ DreamWolfX:而是仔細審視每一個決策 03/16 23:44
→ DreamWolfX:更別說是直接相加了.... 03/16 23:44
嗯...我的確沒兩邊同除二...但基本上結果是一樣的
3/2 < 7/2 → 打者依然選擇不揮棒
推 kurt28:這跟權重有關吧? 看作者給的權重去做計算 03/16 23:45
是呀 表一表二表三權重不一樣
所以第一篇那個都是正負一的算出來就是:"無最適決策"
※ 編輯: dans 來自: 140.119.143.208 (03/16 23:49)
推 enoeht20181:你搞錯Dominant Strategy的定義了@@ 03/16 23:52
推 enoeht20181:而且為什麼我搞不太懂這篇在幹嘛 數字也不是隨便弄的 03/16 23:54
我知道有引 wOBA 唷
※ 編輯: dans 來自: 140.119.143.208 (03/16 23:56)
→ enoeht20181:不論對手選什麼 我選A策略都比BCD...還要好 A就是DS 03/17 00:24
→ enoeht20181:重點是"不論選什麼" 跟期望值沒有關係 03/17 00:24
→ enoeht20181:你給的表一 打者的DS是不打 但不是因為7>3 03/17 00:25
→ enoeht20181:而是因為不論好壞球 不打都比打還要好 03/17 00:25
推 enoeht20181:另外矛盾的是 你算打者用"期望值" 投手卻用"想的" 03/17 00:29
推 DreamWolfX:就算除以二還是不對,不過底下s大回了,就不再贅述 03/17 00:30
推 Yukirin:不是期望值啦.... 03/17 01:10
噓 fifth:....... 03/17 08:08