[新聞] AlphaGo成功關鍵 黃士傑：策略結合值網路

作者amix (^^)

看板GO

標題[新聞] AlphaGo成功關鍵黃士傑：策略結合值網路

時間Fri Mar 18 23:42:58 2016

AlphaGo成功關鍵黃士傑：策略結合值網路 http://i.epochtimes.com/assets/uploads/2016/03/1603181042202544.jpg

黃士傑解說機器學習如何讓AlphaGo自我學習。（陳懿勝/大紀元）【大紀元2016年03月18日訊】（大紀元記者陳懿勝台灣台北報導）谷歌（ Google）旗下DeepMind開發的人工智慧系統「AlphaGo」，日前以4:1大勝韓國九段圍棋高手、世界冠軍李世石。AlphaGo主要開發者、來自台灣的黃志傑 18日返台及分享經驗，他表示，AlphaGo成功的主要關鍵在於策略網路（ Policy Network）與值網路（Value Network）的分析方式，讓它能在20~30 萬份對戰棋譜中，找出最好的20步，才能夠在此世紀之戰中獲勝。黃志傑指出，圍棋第一步的下法選擇就高達361種，變化數有10的364次方，對早期人工智慧來說，根本無法計算。但對AlphaGo來說，運用策略網路來減少搜尋廣度，從360步只要找到20步；價值網路則是直接判斷盤面狀況，了解優勢還是劣勢，減少搜索深度，自然會提升勝率。對於第四局對戰AlphaGo落敗，黃志傑說，當時李世石下了神之一手，以致值網路發生誤判，接連處在劣勢。由於AlphaGo會在比賽中隨時計算勝率，如果勝率低於20%就會投降，但為何會誤判，目前仍不清楚詳細原因。黃志傑說，當AlphaGo通知投降時，他自己有笑了一下，因為他很尊敬李世石，看過李世石大部分的棋譜與比賽，很榮幸能夠坐在他對面。「我為李世石高興，因為知道他的壓力很大，4比1是蠻圓滿的結果。」至於AlphaGo的未來發展，黃志傑表示，未來人工智慧可望運用在醫療及機器人上，並達到預先診斷、找出病徵，協助醫學診斷。◇ 新聞網址：http://www.epochtimes.com/b5/16/3/18/n4666018.htm -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.228.119.147 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1458315782.A.49F.html ※ 編輯: amix (220.141.125.110), 03/18/2016 23:49:00

→ devidevi: 結果1萬個人有1個人出錯，就被告不完了，這是現在醫生的 03/19 09:19

→ devidevi: 困境 03/19 09:19

推 wadashi1: 黃志傑是誰？ 03/19 11:15

→ gamania10000: 球給 03/19 11:58

推 NCUking: 連名字都寫錯這記者… 03/19 19:54

推 agario: 其實這點大公司比個人醫生有利，因為大公司可以買保險 03/20 09:31

→ agario: 一萬人才出錯一次的話說不定保險就完全理賠完，根本不怕~ 03/20 09:31