看板 GO 關於我們 聯絡資訊
本身很少在下圍棋但很想知道第四戰李世石對alphago那一場電腦到底是什麼缺陷? 第78手時alphago預判李世石下那手的機率是0.0007 結果下了以後電腦開始亂下 我的問題是: 1.電腦之所以會亂下是因為機率太低、alphago在那樣情況下的棋譜樣本不夠所以alphago不知道該下哪嗎? 2.所以第78手以棋手來看是很笨穩輸的一手嗎?如果是人類棋手對人類棋手李世石第78手會穩輸嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.193.9.160 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1532071310.A.FF5.html ※ 編輯: jane3031 (123.193.9.160), 07/20/2018 15:23:24 ※ 編輯: jane3031 (123.193.9.160), 07/20/2018 15:24:35 ※ 編輯: jane3031 (123.193.9.160), 07/20/2018 15:27:07
HeterCompute: 電腦之所以亂下是因為他自認的前幾個選點都找不到 07/20 16:41
HeterCompute: 好方法,於是開始找一些對方必定得應的地方來維持 07/20 16:42
HeterCompute: 勝率,但是那幾手全部都是虧的,原來的問題還是無法 07/20 16:42
HeterCompute: 解決,所以電腦就看起來像是在亂下導致輸棋 07/20 16:43
HeterCompute: 而造成的原因確實是因為棋譜樣本不夠 07/20 16:43
HeterCompute: 以人類棋手來看,需要一些時間計算來下出正確著手 07/20 16:44
HeterCompute: 強職業可能10分鐘就把裡面全部看清了,但如果在時間 07/20 16:45
HeterCompute: 緊迫的情況下也有可能應對錯誤,但無論如何都不會像 07/20 16:45
HeterCompute: 實戰電腦發瘋那樣慘就是了 07/20 16:45
jane3031: 所以如果是面對人類棋手而不是電腦的話是不會下出那樣 07/20 17:59
jane3031: 的78手嗎? 07/20 17:59
jane3031: 所以這樣評論對嗎「這場本應是穩穩的由alphago勝出,但 07/20 18:05
jane3031: 李世石靠著人類不會犯的錯的電腦漏洞而產生逆轉」 07/20 18:05
callpolice: 不,不會因為對方是誰就下出怎樣的棋步,同樣的盤面, 07/20 19:07
callpolice: 不論對手是誰,自己想出的最佳解都是一樣的 07/20 19:07
HeterCompute: 面對人類棋手也會下78手,因為李世石也是選最複雜 07/20 19:07
kenwufederer: 對方如果是人類,小李不會這樣下 07/20 19:07
HeterCompute: 的下,這場也是應該由alphago穩穩勝出 07/20 19:08
kenwufederer: 看小李一直忍住不斷就覺得心裡有需影響 07/20 19:08
callpolice: 除非是實力有落差要故意退讓 07/20 19:08
kenwufederer: 否則對電腦來說,你從第一步就是不成立的 07/20 19:09
HeterCompute: 應該說第四盤一開始的策略就是刻意營造出來的,所以 07/20 19:09
HeterCompute: 前面對人類不會這樣下,不過78手對李世石應該是唯一 07/20 19:09
HeterCompute: 一手 07/20 19:10
kenwufederer: 靠BUG也是獲勝,不會有人去否定那一場的勝利 07/20 19:10
callpolice: 所以重點不在於是人還是電腦,而是你知道自己和對手的 07/20 19:10
callpolice: 棋力後擬出的策略 07/20 19:10
HeterCompute: 人類本來就會因為對手而選擇不一樣的下法 07/20 19:11
ilw4e: 那時候的電腦就是還沒完全體,現在版的下幾手就會自己投了 07/20 19:47
ilw4e: 李那手在電腦意料外原本就算得少,然後又算錯就開始崩了 07/20 19:50
ddavid: 用人類的說法就是,AlphaGo沒排過這個定石或手筋,臨場又 07/21 05:30
ddavid: 來不及算出來所以爆破了 07/21 05:31
ddavid: 至於為什麼爆破後會看起來亂下,我在 #1P_VopGM 有做比較 07/21 05:34
ddavid: 詳細的解釋 07/21 05:34
ddavid: 一樓說「找必應的地方來維持勝率」我個人覺得不算是最正確 07/21 05:35
ddavid: 的解釋,不過以人來解讀是一定程度可以那麼解釋 07/21 05:37
HeterCompute: 樓上是不是搞錯了?這篇專門討論第4局78手 07/21 06:00
ddavid: 我並沒有搞錯啊,那一挖造成的後續詭異下法本來就是這一類 07/21 19:42
ddavid: 的問題 07/21 19:42
ddavid: 「找必應的地方來維持勝率」這個說法是人為解讀過的加料, 07/21 19:42
ddavid: 事實上就是「維持勝率」而已,AI並不會特別去想什麼必應不 07/21 19:42
ddavid: 必應的,只不過在當下情況,飲鳩止渴的必應手剛好會是最能 07/21 19:44
ddavid: 帶來「維持現狀」假象的下法而已 07/21 19:44
ddavid: 勝率暫時掉最少就被視為是目前最佳著手而已 07/21 19:46
HeterCompute: 「找必應的地方來維持勝率」只是描述行為結果,也沒 07/21 20:30
HeterCompute: 加料 07/21 20:31
ddavid: 我不是說你真的講錯了,但是這句就是太過人為解讀後的結果 07/22 16:50
ddavid: 假設有一處著手對方沒有必應,但是剛好勝率就跟所謂必應之 07/22 16:51
ddavid: 處維持差不多,AI一樣會去選擇這個著手,它並沒有刻意去選 07/22 16:52
ddavid: 必應之處 07/22 16:52
ddavid: 只是因為下到這種局面很有可能「只剩」必應之處不會太快掉 07/22 16:52
ddavid: 勝率,所以才會表現出只下這些地方,因果是相反的 07/22 16:54
enjoytbook: 應該說電腦不會打亂局面這種下法,那時候就是被逼到沒 07/23 19:15
enjoytbook: 琪了卻不會認輸吧? 07/23 19:15
ddavid: 也是理由之一。AI其實並不知道什麼局面複不複雜,所以也沒 07/23 19:53
ddavid: 有什麼就算勝率低但是複雜亂戰的思考方向,它找不出那種人 07/23 19:54
ddavid: 類思維中雖然並非最佳著手但可以亂戰一拚的勝負手概念 07/23 19:55
wadashi1: 3天版的AG Zero跟李世石版對奕已經100盤100連勝 07/24 09:28
wadashi1: 是自己對奕而來,並非由李世石版本進化,無版本演進剋制問 07/24 09:29
wadashi1: 題!是可以討論第78手,但那也只是曾勝過李世石版的指標! 07/24 09:30
wadashi1: 真要研究,相信黃士傑博士早有答案,之前他也說過,Master 07/24 09:32
wadashi1: 跟Zero版都已克服這一手的問題,接著下都不會有亂下的狀 07/24 09:33
wadashi1: 況。真要研究的話,請dp用出變化棋譜可能有些麻煩,但LZ這 07/24 09:34
wadashi1: 個免費軟體,不知道有沒有人拿來試過? 07/24 09:34