看板 GO 關於我們 聯絡資訊
依本文說法,AlphaGo的臭棋 (人類認定) 有三種可能性,而且都已經發生了: 其一,在電腦判定的獲勝機率已經非常高時, 不同下法對機率的影響會鈍化,可能只是99.9%與99.91%的差別而已, 而算法設計可能會讓非最佳解更容易被隨機挑到。 這種非最佳解,就是真正的臭棋 (邏輯上為嚴格劣勢策略)。 然而,若以上敘述為真,當電腦下出明顯臭棋時,電腦應該已經大幅佔優了。 相反的,情勢還在膠著時,下錯會讓獲勝機率大幅降低, 臭棋被挑中的機率近乎為零,這時,我們會看到非常緊繃的對局。 這一點呼應「遇強則強,遇弱則弱」。 (最後一句不是指李和樊的差距,因為電腦棋力這幾個月增加不少); 其二,電腦傾向簡化盤面,這樣可以捨棄一些搜尋樹, 但是每棵樹可以搜尋得更深,如此,確保了獲勝機率夠大也夠準: 放棄潛在的最優解,而專注於目標(獲勝)的可達性。 反映在棋面上,就是風格明朗,有時候笨笨的,但是很難說錯; 其三,電腦對大勢的考量超乎現階段人類的極致,換子整形都極有效率, 看似魯莽骨子裏卻極為精確凶悍。這種大智若愚是人類難以理解也難以琢磨的。 由於人類目前能系統建構知識的方式還是屬於還原論模式, 所以這種整體性的估量方法 (若無人機合一) 將是難以跨過的鴻溝。 --- 準此,我們大概可以想像這樣的場景: AlphaGo 再自我演化個一兩年後出關,我們派出人類最後也是最強大的棋士---柯潔, 他年僅二十,已經稱王許久,展現絕對的統治力,號稱柯冑求敗。 他自信滿滿地迎戰。僅僅下到第二十子時,電腦就開始下真正意義的臭棋。 當其時,柯潔和諸位職業九段內心都鬆了一口氣。 柯潔os: 不過業餘水準。講評: 業餘五段,但是我要想一想。 一百手後,柯潔覺得狀況不太好,沒有下出自己的風格。 兩百手後,柯潔輸給了業餘選手阿爾法狗。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.139.133.40 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457695408.A.194.html
TaiwanUp: 2跟3是不是一樣的意思 03/11 19:25
a3831038: 柯潔柯潔得第一 03/11 19:28
raiderho: 不一樣。二是簡化演算法,三是機器學習能獲得一些精確的 03/11 19:31
raiderho: 整體性衡量方式,而那時人腦無法採用的。人類的確有一些 03/11 19:31
raiderho: 整體性的盤面直覺,但是運作不同,也不精確 03/11 19:31
wadashi1: 我覺得這樣的場景..應該不久了就會有了,不會到一兩年後! 03/11 19:34
raiderho: 我寫一兩年後,是想像AlphaGo把狀況一的臭棋提前下了。 03/11 19:39
raiderho: 若這兩三個月柯就下了,臭棋應該更晚出現 03/11 19:39
chordate: 推 03/11 19:48
Herlin: 所以阿發狗是不是跟我們之前想像的電腦完全相反 03/11 20:08
Herlin: 因為他練習了幾百幾千萬局而且統計了大量的資料 03/11 20:09
Herlin: 他比起人類在判斷某一手會把大局帶向好或不好的方向更強 03/11 20:10
Herlin: (也就是人類所謂的大局觀 當然阿發狗只有搜尋樹而已) 03/11 20:11
Herlin: 但是他在盤面還很大時 反而不一定會搜尋到局部最佳的一手 03/11 20:11
Herlin: 在這種時候職業棋士會覺得阿發狗這棋真臭 業餘的吧 這樣? 03/11 20:12
Herlin: 電腦變成大局觀"很難理解"的強 但反而局部細算會打勺 03/11 20:14
Herlin: 這樣講來這阿發狗真是有個性 可能比真人還有個性... 03/11 20:14
fgkor123: 有興趣可以看一下 fb研究類似課題的寫的 03/11 20:28
hankyan919: 這篇分析的很不錯 03/11 20:53
Verola: 同感 03/11 21:37
poverty: 但是真正的妙手(天才手)會出現嗎? 03/11 21:46
NaoGaTsu: 同感 03/11 22:08
lwei781: 二包括下厚 03/11 23:40
blackwindy: 如果是這樣的話那還可以加些方法減少臭棋發生的機會 03/12 00:41
Cadd: 標題這樣講誤很大, 就算世界冠亞軍對決也不是100%勝率 03/12 12:42
Cadd: 是人就會失誤, 失誤中又衍伸出新的對決方法 03/12 12:43
Cadd: 這就是勝負之外的圍棋之美, 爭鬥藝術 03/12 12:44