[問題] 想問李世石lphago第四戰那一手

作者jane3031 (珊牛)

看板GO

標題[問題] 想問李世石lphago第四戰那一手

時間Fri Jul 20 15:21:47 2018

本身很少在下圍棋但很想知道第四戰李世石對alphago那一場電腦到底是什麼缺陷？第78手時alphago預判李世石下那手的機率是0.0007 結果下了以後電腦開始亂下我的問題是： 1.電腦之所以會亂下是因為機率太低、alphago在那樣情況下的棋譜樣本不夠所以alphago不知道該下哪嗎？ 2.所以第78手以棋手來看是很笨穩輸的一手嗎？如果是人類棋手對人類棋手李世石第78手會穩輸嗎？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.193.9.160 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1532071310.A.FF5.html ※ 編輯: jane3031 (123.193.9.160), 07/20/2018 15:23:24 ※ 編輯: jane3031 (123.193.9.160), 07/20/2018 15:24:35 ※ 編輯: jane3031 (123.193.9.160), 07/20/2018 15:27:07

推 HeterCompute: 電腦之所以亂下是因為他自認的前幾個選點都找不到 07/20 16:41

→ HeterCompute: 好方法，於是開始找一些對方必定得應的地方來維持 07/20 16:42

→ HeterCompute: 勝率，但是那幾手全部都是虧的，原來的問題還是無法 07/20 16:42

→ HeterCompute: 解決，所以電腦就看起來像是在亂下導致輸棋 07/20 16:43

→ HeterCompute: 而造成的原因確實是因為棋譜樣本不夠 07/20 16:43

→ HeterCompute: 以人類棋手來看，需要一些時間計算來下出正確著手 07/20 16:44

→ HeterCompute: 強職業可能10分鐘就把裡面全部看清了，但如果在時間 07/20 16:45

→ HeterCompute: 緊迫的情況下也有可能應對錯誤，但無論如何都不會像 07/20 16:45

→ HeterCompute: 實戰電腦發瘋那樣慘就是了 07/20 16:45

→ jane3031: 所以如果是面對人類棋手而不是電腦的話是不會下出那樣 07/20 17:59

→ jane3031: 的78手嗎？ 07/20 17:59

→ jane3031: 所以這樣評論對嗎「這場本應是穩穩的由alphago勝出，但 07/20 18:05

→ jane3031: 李世石靠著人類不會犯的錯的電腦漏洞而產生逆轉」 07/20 18:05

推 callpolice: 不，不會因為對方是誰就下出怎樣的棋步，同樣的盤面， 07/20 19:07

→ callpolice: 不論對手是誰，自己想出的最佳解都是一樣的 07/20 19:07

→ HeterCompute: 面對人類棋手也會下78手，因為李世石也是選最複雜 07/20 19:07

→ kenwufederer: 對方如果是人類，小李不會這樣下 07/20 19:07

→ HeterCompute: 的下，這場也是應該由alphago穩穩勝出 07/20 19:08

→ kenwufederer: 看小李一直忍住不斷就覺得心裡有需影響 07/20 19:08

→ callpolice: 除非是實力有落差要故意退讓 07/20 19:08

→ kenwufederer: 否則對電腦來說，你從第一步就是不成立的 07/20 19:09

→ HeterCompute: 應該說第四盤一開始的策略就是刻意營造出來的，所以 07/20 19:09

→ HeterCompute: 前面對人類不會這樣下，不過78手對李世石應該是唯一 07/20 19:09

→ HeterCompute: 一手 07/20 19:10

→ kenwufederer: 靠BUG也是獲勝，不會有人去否定那一場的勝利 07/20 19:10

→ callpolice: 所以重點不在於是人還是電腦，而是你知道自己和對手的 07/20 19:10

→ callpolice: 棋力後擬出的策略 07/20 19:10

→ HeterCompute: 人類本來就會因為對手而選擇不一樣的下法 07/20 19:11

推 ilw4e: 那時候的電腦就是還沒完全體，現在版的下幾手就會自己投了 07/20 19:47

推 ilw4e: 李那手在電腦意料外原本就算得少，然後又算錯就開始崩了 07/20 19:50

推 ddavid: 用人類的說法就是，AlphaGo沒排過這個定石或手筋，臨場又 07/21 05:30

→ ddavid: 來不及算出來所以爆破了 07/21 05:31

推 ddavid: 至於為什麼爆破後會看起來亂下，我在 #1P_VopGM 有做比較 07/21 05:34

→ ddavid: 詳細的解釋 07/21 05:34

→ ddavid: 一樓說「找必應的地方來維持勝率」我個人覺得不算是最正確 07/21 05:35

→ ddavid: 的解釋，不過以人來解讀是一定程度可以那麼解釋 07/21 05:37

→ HeterCompute: 樓上是不是搞錯了？這篇專門討論第4局78手 07/21 06:00

推 ddavid: 我並沒有搞錯啊，那一挖造成的後續詭異下法本來就是這一類 07/21 19:42

→ ddavid: 的問題 07/21 19:42

→ ddavid: 「找必應的地方來維持勝率」這個說法是人為解讀過的加料， 07/21 19:42

→ ddavid: 事實上就是「維持勝率」而已，AI並不會特別去想什麼必應不 07/21 19:42

→ ddavid: 必應的，只不過在當下情況，飲鳩止渴的必應手剛好會是最能 07/21 19:44

→ ddavid: 帶來「維持現狀」假象的下法而已 07/21 19:44

→ ddavid: 勝率暫時掉最少就被視為是目前最佳著手而已 07/21 19:46

→ HeterCompute: 「找必應的地方來維持勝率」只是描述行為結果，也沒 07/21 20:30

→ HeterCompute: 加料 07/21 20:31

推 ddavid: 我不是說你真的講錯了，但是這句就是太過人為解讀後的結果 07/22 16:50

→ ddavid: 假設有一處著手對方沒有必應，但是剛好勝率就跟所謂必應之 07/22 16:51

→ ddavid: 處維持差不多，AI一樣會去選擇這個著手，它並沒有刻意去選 07/22 16:52

→ ddavid: 必應之處 07/22 16:52

→ ddavid: 只是因為下到這種局面很有可能「只剩」必應之處不會太快掉 07/22 16:52

→ ddavid: 勝率，所以才會表現出只下這些地方，因果是相反的 07/22 16:54

推 enjoytbook: 應該說電腦不會打亂局面這種下法，那時候就是被逼到沒 07/23 19:15

→ enjoytbook: 琪了卻不會認輸吧？ 07/23 19:15

推 ddavid: 也是理由之一。AI其實並不知道什麼局面複不複雜，所以也沒 07/23 19:53

→ ddavid: 有什麼就算勝率低但是複雜亂戰的思考方向，它找不出那種人 07/23 19:54

→ ddavid: 類思維中雖然並非最佳著手但可以亂戰一拚的勝負手概念 07/23 19:55

推 wadashi1: 3天版的AG Zero跟李世石版對奕已經100盤100連勝 07/24 09:28

→ wadashi1: 是自己對奕而來,並非由李世石版本進化,無版本演進剋制問 07/24 09:29

→ wadashi1: 題!是可以討論第78手,但那也只是曾勝過李世石版的指標! 07/24 09:30

→ wadashi1: 真要研究,相信黃士傑博士早有答案,之前他也說過,Master 07/24 09:32

→ wadashi1: 跟Zero版都已克服這一手的問題,接著下都不會有亂下的狀 07/24 09:33

→ wadashi1: 況。真要研究的話,請dp用出變化棋譜可能有些麻煩,但LZ這 07/24 09:34

→ wadashi1: 個免費軟體,不知道有沒有人拿來試過? 07/24 09:34