[轉錄]加藤英樹談圍棋ＡＩ的過去．現在與未來(4)

作者oldTim (TIME WILL TELL)

看板GO

標題[轉錄]加藤英樹談圍棋ＡＩ的過去．現在與未來(4)

時間Mon Nov 6 01:56:40 2017

加藤英樹談圍棋ＡＩ的過去．現在與未來(4) http://koubokukei.blogspot.tw/2017/11/blog-post_4.html ＤＺＧ的特長加藤：其實圍棋這個遊戲，手順是非常重要的。好比說像下圖的攻殺，不要馬上Ａ打，反而要先從根本的Ｂ位粘住，然後再下Ａ打，才是正確的手順。然而在模擬時，如果不花點心思、不好好在程式上寫些東西，電腦就會很常出現上述直接Ａ打的問題。其他像是反提或是接不歸等型態，也必須加入檢查用的程式。像這樣的檢查工夫，在Ｚｅｎ的時代（未加入ＶＮ、ＰＮ的時代）我們就加了非常多，這就是Ｚｅｎ強大的地方。也是靠著這些工夫，才能強到可以在被武宮正樹九段讓四子還能獲勝的水準。不過，到了這個程度，我們就撞牆了，從此進入了冰河時期。甚至到了讓尾島先生想停止開發的程度。星合：也就是開發的動機不見了啊。加藤：就在此時，阿發夠出現了。星合：這就和尾島先生讀了阿發夠論文之後想去拜託多玩國公司的事情連了起來了呢。大橋：將蒙地卡羅搜尋樹、ＰＮ、ＶＮ結合起來的ＤＺＧ在接近戰上也還是非常強，應該也是前述的功夫發揮了作用的關係吧。避戰的阿發夠星合：這樣我多少理解電腦圍棋的架構了。但與ＤＺＧ相比，阿發夠的特徵又是甚麼呢？加藤：如果仔細咀嚼股溝公司的論文的話，就知道這個程式是用絕對不會往自己不擅長的地方走的方向來寫成的。星合：所以阿發夠也是有不擅長的地方？加藤：具體來說，就是因為一手之差而導致勝負翻轉的局面。星合：意思是戰鬥或攻殺嗎？加藤：並不是指全局而是可能會造成「翻轉勝負」的攻殺或戰鬥。像這樣的局面，阿發夠會評價成「不利的局面」，而阿發夠的ＶＮ就是根據這個原則來做成的。這也許會被看成是不敢正面對決的狡猾做法，但其實人類本身也是會用避開自己不擅長的局面而想轉往自己擅長的局面的方式來下呢。星合：原來如此。雖然它是避開不擅長的攻殺或戰鬥，但結果上卻是用人類視角來看，變成了具有高度大局觀的下法呢。我一直有ＡＩ具備了強大細算能力的印象，其實是根本相反的啊。加藤：圍棋ＡＩ總是用全局的角度來檢視，其實是無法像人類那樣集中在某個局部來深入細算的。大橋：人類是一面俯視全局、一面根據需要進行局部的細算，這其實是ＡＩ還沒辦法做到的。加藤：像這種靈活切換大局與局部的能力，不僅是圍棋而已，其實也是所有領域ＡＩ設計的課題。如果ＤＺＧ和阿發夠一戰的話．．．？加藤：ＡＩ和人類下棋時，是利用ＶＮ盡量在佈局階段領先，然後一路維持優勢到底的下法。然而在圍棋ＡＩ程式對戰時，由於彼此的佈局都很強，就很難在一開始拉開差距。因此，就變成了中盤的戰鬥力才是勝負的關鍵。在世界電腦圍棋公開賽時，因為ＤＺＧ在預賽中分別輸給了ＣＧＩ與絕藝的關係，所以在決賽時故意調降了ＶＮ的比重，而把模擬的比重提升而使中盤戰鬥力加強起來。因為一如前述，ＤＺＧ在模擬中的戰鬥能力上花了很多心血，這也是我們長期開發累積出來的成果。最近才開始開發的圍棋ＡＩ並沒有這一塊，所以就算是把ＶＮ比重下調，也無法讓戰鬥力變強。星合：那阿發夠與ＤＺＧ到底何者比較強？加藤：這就不知道了。就像前面說過的一樣，能勝過人類並不代表能勝過其他圍棋ＡＩ。如果將ＣＧＩ、絕藝一起加進來下循環賽的話，阿發夠說不定也會輸掉。在這方面，因為ＤＺＧ在中盤的戰鬥力做的不錯，在這方面上有一定的好處。所以關鍵就在於在佈局階段會有多少差距了。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.37.173.80 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1509904604.A.972.html

推 lwei781: 好有自信 11/06 02:16

推 HeterCompute: 就像王元均知道自己比柯潔差一些，但還是能下一下 11/06 07:19

→ jpg31415926: 現在肯定贏不了AG 但AG停止開發了幾年後有機會超越 11/06 07:23

推 lwei781: 絕藝現在應該要更壓倒性啊 11/06 10:20

→ lwei781: 絕藝零 11/06 10:20

推 moonlind: alphaGO master不是自戰過那種超複雜攻殺的嗎? 11/06 10:33

→ moonlind: 私心認為 DZG對上alphaGO master應該是拼不贏 11/06 10:34

→ jackcselab: 這邊的alphago應該不包含master版 11/06 12:51

推 lwei781: master 應該是很愛超複雜攻殺的 11/06 12:57

推 s891234: 跟master攻殺根本找死 11/06 15:45

→ oldTim: 雖然我也不認為攻殺上AlphaGo會落下風，但加藤先生說法也 11/06 18:49

→ oldTim: 有道理，Deepmind目標是在通用AI，不像Zen針對圍棋作太多 11/06 18:50

→ oldTim: 演算法優化，但是這些優化在足夠訓練量面前是否有優勢就 11/06 18:52

→ oldTim: 難說了(甚至有可能因overfitting而變弱) 11/06 18:52

推 qqq1397: 設計太多頂多lee級，看過zero用一堆人類眼中的利用屠爆ma 11/06 20:46

→ qqq1397: ster 中腹，少打多反屠master;master自戰可是超多擴及全 11/06 20:46

→ qqq1397: 盤互攪的攻殺。拿人類的手順、思維要設計神??! 11/06 20:46

→ chris610020: 阿法狗是軟硬體結合開發的，DZG只是軟體 11/07 12:43

→ chris610020: 如同iOS與a系列處理器都由apple設計就完爆，android 11/07 12:45

推 arcworld: master不跟你攻殺，理由不是自己弱，而是你不夠強... 11/08 13:35

→ arcworld: 更別說Zero了，DZG對上ZERO肯定要吃土的...=.= 11/08 13:37

推 ckuser: 我覺得DZG 應該連master都打不贏 11/08 20:53

推 arcworld: 其實這文出刊前，雜誌社應該要跟受訪人再次確認一下... 11/09 09:47

→ arcworld: 不然這樣誇誇其談，實在是對人的形象不太好... 11/09 09:51