看板 GO 關於我們 聯絡資訊
※ 引述《tsppajrdrrfs ()》之銘言: : ※ [本文轉錄自 Gossiping 看板 #1MvIov-I ] : 作者: n91324 (不丹) 看板: Gossiping : 標題: [爆卦] AlphaGo發現自己79步失誤 : 時間: Sun Mar 13 17:02:45 2016 : Deep Mind 創辦人在推特表示 : Mistake was on move 79, but #AlphaGo only came to that realisation on around move 87 : 所以AG確實在79有失誤 : 而且她下到87才發現自己之前的失誤 : 補上推特: : 推 OrzJ: https://twitter.com/demishassabis 推特 從這兩個 twitter 來看, AI 在 79 時仍認為自己有 79% 的勝率, 直到第 87 手時,才發現勝率驟降。四日棋迷猜測如下: AI 估計勝率是經由之後的模擬,白 78 手被認為神手,但或許是之後 的巧妙變化是不明顯的,所以 AI 無法知道這手有這麼大的功用,或 是說,無法準確的評估此時的盤面。 要知道,AI 的估算是根據之後的模擬,它並沒有人類邏輯式的推演, 所以它不見得能得到之後的最佳變化。某種意思下,它是取模擬的加權 平均,但只要之後最佳的應對沒被模擬到,它的評估自然不準。又或者 是,最佳應對跟其它應對方的結果差很多,若不能給最佳應對接近 1 的權重,那它的評估就失準。 而隨著棋局變化,又多下了幾手,能變化的地方變少,AI 自然比較能 模擬到正確的應對,才驚覺自己已經落後。 這提供了要對付目前這版 AlphaGo 的方法,你最好下一些方法是:接 下來對你的最佳解跟次佳解,結果會差很多,這樣 AI 用模擬的,就有 機會誤判。如果你下的棋,接下來的應對,結果都差不了太多,那 AI 自然估得準。讓它估不準,才會在接下來還沒估準前,繼續出錯。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.74.113 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457866429.A.E29.html
kingrichman: AI遇到沒遇過狀況,但這次他就記起來了 03/13 18:55
kingrichman: 相同的招以後想再用就沒用了 03/13 18:56
aegis43210: 所以由此可見得黑77手那時,alphaGO的勝算有多大… 03/13 18:57
ilw4e: 他勝算大是認定他跑的圖都把白吃光了吧,暴動手筋沒算到 03/13 19:00
wnglon: 不一定 如果稍微改變幾個棋子 BUG還是存在 因為這是程式阿 03/13 19:01
wnglon: 必須根本性解決這問題 03/13 19:01
indium111: 那時候直播的職業棋手幾乎都認為李快要四連敗了 03/13 19:01
indium111: 直到李世石78的神之一手才逆轉大家的看法 03/13 19:02
Uizmp: 既然有所謂的勝率, 就有被AG認為會敗的招 03/13 19:05
derekhsu: AlphaGo不能即時學習 03/13 19:06
derekhsu: 要重新訓練 03/13 19:06
Uizmp: 很有可能在78手起連續被打在AG評估會敗的地方導致勝率狂掉 03/13 19:07
JDKnife: 最好是逆轉...那邊本來就有手段 不只78那個位置 03/13 19:07
Uizmp: 到87手的時候 AG 發現自己的勝率掉到某個門檻以下 03/13 19:08
siyaoran: 是逆轉吧 電腦勝率從79%掉 還有職九們覺得李要輸了 03/13 19:08
aegis43210: 有比挖更好的下法嗎?這一步李世石想了十五分鐘的說 03/13 19:08
siyaoran: 依照古力和柯潔的下法明明就還差很多 03/13 19:09
BusterPosey: 版上有不世出的高手啊 請賜教 03/13 19:09
deacon: 這手很明顯連alphago也沒算到 不然後面不會崩潰那麼明顯 03/13 19:10
NaoGaTsu: 78手改下靠的話,結果真的難料... 03/13 19:10
siyaoran: AI不能快速從錯誤中學習的確還有一大段路要走 03/13 19:16
DemonElf: Alphago之所以有別於以往的圍棋AI就是他能學習成長好嗎 03/13 19:29
smallyuki: 覺得要逼狗犯無可挽回的大錯有兩個條件 03/13 19:32
smallyuki: 第一是極佳的妙手,第二是這一手遠超出狗的預期範圍 03/13 19:34
DemonElf: 李能下出超出預期的這一手真的是很難得,別忘了Alphago 03/13 19:37
DemonElf: 已經自我對奕超過三千萬盤棋 03/13 19:37
Uizmp: 其實也有個弔詭的地方, 勝率接近八成 代表還有兩成可破 03/13 19:52
Uizmp: 說不定2成中就會有像今天這種一下子把勝率壓到很低的走法 03/13 19:54
danibaba5566: 78手確實是手筋 03/13 20:10
utap2001: 李也說78手是唯一一手 所以他也知道他那時候勝率有2成 03/13 20:39
utap2001: 而2成的勝率就要從這裡突破 他跟alphago想的都一樣 03/13 20:39
mothertime: alphago好像不會記得這幾盤棋 03/13 21:45
fywei: 軟體用的是大數據training 不會去特別對應某種情況 03/13 22:28