Re: [爆卦] AlphaGo發現自己79步失誤

作者tlchen (台灣加油)

看板GO

標題Re: [爆卦] AlphaGo發現自己79步失誤

時間Sun Mar 13 18:53:46 2016

※ 引述《tsppajrdrrfs ()》之銘言： : ※ [本文轉錄自 Gossiping 看板 #1MvIov-I ] : 作者: n91324 (不丹) 看板: Gossiping : 標題: [爆卦] AlphaGo發現自己79步失誤 : 時間: Sun Mar 13 17:02:45 2016 : Deep Mind 創辦人在推特表示 : Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87 : 所以AG確實在79有失誤 : 而且她下到87才發現自己之前的失誤 : 補上推特: : 推 OrzJ: https://twitter.com/demishassabis 推特從這兩個 twitter 來看， AI 在 79 時仍認為自己有 79% 的勝率，直到第 87 手時，才發現勝率驟降。四日棋迷猜測如下： AI 估計勝率是經由之後的模擬，白 78 手被認為神手，但或許是之後的巧妙變化是不明顯的，所以 AI 無法知道這手有這麼大的功用，或是說，無法準確的評估此時的盤面。要知道，AI 的估算是根據之後的模擬，它並沒有人類邏輯式的推演，所以它不見得能得到之後的最佳變化。某種意思下，它是取模擬的加權平均，但只要之後最佳的應對沒被模擬到，它的評估自然不準。又或者是，最佳應對跟其它應對方的結果差很多，若不能給最佳應對接近 1 的權重，那它的評估就失準。而隨著棋局變化，又多下了幾手，能變化的地方變少，AI 自然比較能模擬到正確的應對，才驚覺自己已經落後。這提供了要對付目前這版 AlphaGo 的方法，你最好下一些方法是：接下來對你的最佳解跟次佳解，結果會差很多，這樣 AI 用模擬的，就有機會誤判。如果你下的棋，接下來的應對，結果都差不了太多，那 AI 自然估得準。讓它估不準，才會在接下來還沒估準前，繼續出錯。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.74.113 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457866429.A.E29.html

→ kingrichman: AI遇到沒遇過狀況，但這次他就記起來了 03/13 18:55

→ kingrichman: 相同的招以後想再用就沒用了 03/13 18:56

推 aegis43210: 所以由此可見得黑77手那時，alphaGO的勝算有多大… 03/13 18:57

→ ilw4e: 他勝算大是認定他跑的圖都把白吃光了吧，暴動手筋沒算到 03/13 19:00

推 wnglon: 不一定如果稍微改變幾個棋子 BUG還是存在因為這是程式阿 03/13 19:01

→ wnglon: 必須根本性解決這問題 03/13 19:01

推 indium111: 那時候直播的職業棋手幾乎都認為李快要四連敗了 03/13 19:01

→ indium111: 直到李世石78的神之一手才逆轉大家的看法 03/13 19:02

推 Uizmp: 既然有所謂的勝率, 就有被AG認為會敗的招 03/13 19:05

推 derekhsu: AlphaGo不能即時學習 03/13 19:06

→ derekhsu: 要重新訓練 03/13 19:06

→ Uizmp: 很有可能在78手起連續被打在AG評估會敗的地方導致勝率狂掉 03/13 19:07

推 JDKnife: 最好是逆轉...那邊本來就有手段不只78那個位置 03/13 19:07

→ Uizmp: 到87手的時候 AG 發現自己的勝率掉到某個門檻以下 03/13 19:08

推 siyaoran: 是逆轉吧電腦勝率從79%掉還有職九們覺得李要輸了 03/13 19:08

推 aegis43210: 有比挖更好的下法嗎？這一步李世石想了十五分鐘的說 03/13 19:08

→ siyaoran: 依照古力和柯潔的下法明明就還差很多 03/13 19:09

→ BusterPosey: 版上有不世出的高手啊請賜教 03/13 19:09

推 deacon: 這手很明顯連alphago也沒算到不然後面不會崩潰那麼明顯 03/13 19:10

推 NaoGaTsu: 78手改下靠的話，結果真的難料... 03/13 19:10

推 siyaoran: AI不能快速從錯誤中學習的確還有一大段路要走 03/13 19:16

推 DemonElf: Alphago之所以有別於以往的圍棋AI就是他能學習成長好嗎 03/13 19:29

推 smallyuki: 覺得要逼狗犯無可挽回的大錯有兩個條件 03/13 19:32

→ smallyuki: 第一是極佳的妙手，第二是這一手遠超出狗的預期範圍 03/13 19:34

推 DemonElf: 李能下出超出預期的這一手真的是很難得，別忘了Alphago 03/13 19:37

→ DemonElf: 已經自我對奕超過三千萬盤棋 03/13 19:37

→ Uizmp: 其實也有個弔詭的地方, 勝率接近八成代表還有兩成可破 03/13 19:52

→ Uizmp: 說不定2成中就會有像今天這種一下子把勝率壓到很低的走法 03/13 19:54

推 danibaba5566: 78手確實是手筋 03/13 20:10

推 utap2001: 李也說78手是唯一一手所以他也知道他那時候勝率有2成 03/13 20:39

→ utap2001: 而2成的勝率就要從這裡突破他跟alphago想的都一樣 03/13 20:39

→ mothertime: alphago好像不會記得這幾盤棋 03/13 21:45

推 fywei: 軟體用的是大數據training 不會去特別對應某種情況 03/13 22:28