作者reinhert (史丹佛的銀色子彈)
看板GO
標題Re: [討論] 李世石 對 AlphaGo 第四局 78 手解說(找到bug)
時間Sun Mar 13 22:40:57 2016
※ 引述《wnglon (冷面笑匠)》之銘言:
: http://www.techbang.com/posts/41961-man-machine-war-world-war-iv-li-shishi-won
: 從新聞上的圖來看 右上黑子看起來把右上角圍起來了
: 所以ai誤認自己有70%的勝率 所以一直下
: 直到51、57、49、47、87、89、93、101手的8顆黑子死棋後才發現自己下錯
: ai就是認為自己已經把右上角圍起來了(從43手黑棋算起
: 有經過65手、81手、57手、87手、直到101手 黑棋真的有圍成一個領地)
: 卻不知道這樣下會讓自己慘敗
: 寫程式的人通常會遇到這種邏輯矛盾問題
: 才會讓程式有bug
這種把下棋邏輯寫死在程式內已經很早之前的方法了
事實上越複雜的事情根本不可能這樣處理
特別是你根本不知道問題的Pattern或要處理的計算量太大的時候
所以之前的圍棋軟體才會無法挑戰人類
AlphaGo是用了現代的ML技術去做出來的
也就是透過大量的統計資料讓演算法自己去適應這些資料來得出比較好的結果
這和手寫邏輯是完全不同的
在這種情況下機器會判斷出什麼只有等結果出來才會知道
一般圍棋邏輯或術語或行為,比方如之前提到的打劫問題
對AlphaGO來說都是"沒有意義"的,它並沒有"意識"到這些問題
AlphaGo要處理的只有把棋下在哪會提高勝率
只是他經過處理後得到的結果
讓人類"看起來"像是在做那些行為而已
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.180.166.106
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457880062.A.44D.html
推 wnglon: 我覺得你才抓不到我說的重點 03/14 12:51
→ wnglon: 我提一個可能出現的錯誤bug 03/14 12:51
→ wnglon: 機器是否自己學習的 我覺得不重要 03/14 12:52
→ wnglon: 重要的是創始者希望ai能朝勝率最高的一步下棋 03/14 12:53
推 wnglon: 做了讓機器學習的演算法 03/14 12:55
推 wnglon: 可是這種演算法還是有我剛剛說的bug存在 03/14 12:57
→ wnglon: 我用了部份人士說的機器人會自己學習 03/14 12:58
推 wnglon: 這跟邏輯寫在ai中的道理是差不多的 重要的是 這種bug無法 03/14 13:01
→ wnglon: 讓ai不出錯 03/14 13:01
推 OverInfinity: 樓上,這其實與其說是BUG不如說是機器或人類自我學 03/14 15:06
→ OverInfinity: 習過程中的盲點或疏漏點,跟人類的自以為判斷正確其 03/14 15:06
→ OverInfinity: 實差不了多少 03/14 15:06