[新聞] 科學視角解讀 AI3-5年內將贏遍人類棋手

作者zkow (逍遙山水憶秋年)

看板GO

標題[新聞] 科學視角解讀 AI3-5年內將贏遍人類棋手

時間Sat Mar 12 16:16:35 2016

科學視角解讀人機大戰 AI3-5年內將贏遍人類棋手　中新網北京3月12日電（記者王牧青）一場“人機大戰”，將人工智慧的話題推到公眾面前，李世石連輸兩陣，更讓人對科技的發展瞠目結舌，甚至聯想到《星球大戰》是否真的會發生、人類會否被機器統治等問題。此時，我們不妨用科學的視角，理性而客觀地看待人工智慧的現狀和未來。中新網（微信號：cns2012）記者特別採訪了長期從事人工智慧和智慧科學研究、來自中國科學院計算技術研究所的史忠植研究員，解讀“阿爾法圍棋”和人工智慧的問題。　　“人機大戰”為什麼選擇圍棋？ 171位數“嚇死你” 　　“人機大戰”的興起，最早是1997年，IBM超級電腦“深藍（Deep Blue）” 擊敗了國際象棋大師加里-卡斯帕羅夫。科學界認為，圍棋“人機大戰”可以看成是人工智慧發展具有標誌性的進展。曾經“深藍”的勝利鼓舞了人工智慧研究的士氣，吸引了投資者對人工智慧的興趣。　　至於為什麼選擇圍棋，史忠植教授解讀稱：“圍棋之所以很難被人工智慧攻破，戰勝人類高手，就是其可能的組合數異常龐大。至於多麼異常，2016 年1月，普林斯頓的研究人員給出了最新研究結果：對於一個19x19的圍棋棋盤而言，一共有361個位置，而每個位置可以單獨放置黑棋、白棋或者留空，理論上所有的可能組合是3361種。但根據圍棋規則，不是所有位置都可合法落子，例如在圍棋術語中沒有氣的位置就不能落子。” 　　“那麼，排除掉這些不合法的棋局後總共還剩多少種呢？普林斯頓的研究人員給出的 19x19格圍棋的精確合法棋局數：　　 ‘ 208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935 。’” 　　“171位數！”這個數字比我們地球所有的沙粒數量還要多！比人類已知宇宙的所有星球數量還要多！對比來講，穀歌學習的近萬盤人類棋局是5位數，谷歌自行對戰的3000 萬盤是8位數，而圍棋所有可能的棋局盤數是171位數。如果規避還有可能的重複變化，把大頭去掉，那也是70位數的棋局變化。　　2013年10月29日，史忠植在在創新驅動發展大資料時代的人工智慧高峰論壇上，提出了智慧科學（人工智慧）發展的“路線圖”，並在著作《心智計算》一書中有詳細的闡述。　　其中提到，2020年，人工智慧將實現初級類腦計算，即Elementary Brain Computing 。在這個階段，我們將實現的目標是電腦可以完成精准的聽、說、讀、寫；到2035年，我們將進入高級類腦計算階段，即 Advanced Brain like Computing，那時，電腦不但具備 “智商”，還將擁有“情商”；到2050年，智慧科學（人工智慧）有望發展出神經形態電腦，實現超腦計算，即 Super-brain Computing。到那個時候，電腦的高性能與人的高智慧完美結合。　　史忠植認為：“按照這個標準，這次圍棋“人機大戰”中，若穀歌圍棋AI程式‘ AlphaGo’最終戰勝世界冠軍李世石，將說明人工智慧達到了初級類腦計算的水準。” 　　“AlphaGo”如何工作？　　史忠植介紹，“阿爾法圍棋”下棋過程中主要通過四步完成工作，分別是：快速判斷、深度模仿、自學成才和全域分析。　　其中，快速判斷，指用於快速的觀察圍棋的盤面，類似於人觀察盤面獲得的第一反應。深度模仿，指“AlphaGo”學習近萬盤人類歷史高手的棋局來進行模仿學習，用得到的經驗進行判斷。這個深度模仿能夠根據盤面產生類似人類棋手的走法。　　自學成長，指“AlphaGo”不斷與“自己”對戰，下了3000萬盤棋局，總結出經驗作為棋局中的評估依據。全域分析，指利用第三步學習結果對整個盤面的贏面判斷，實現從全域分析整個棋局。　　人工智慧經過60年的風風雨雨，取得了長足的進展，目前已在各行各業得到應用。史忠植的《人工智慧》一書中，將其歸納為8個方面：專家系統、資料採擷、自然語言處理、智慧型機器人、模式識別、分散式人工智慧、互聯網智慧和博弈。　　看到了“阿爾法圍棋”，人們自然聯想到中國的同類科技，目前能否達到甚至、超越這一水準。史忠植介紹說：“在國家自然科學基金、973、863 和廣大企業等的支援下，在廣大科研人員和應用單位的努力下，我國人工智慧幾乎與世界同步發展，特別在機器翻譯、語音辨識、人臉識別、農業專家系統、資料挖掘、深水機器人等方面是非常有特色的，也有能力創造出戰勝世界頂級棋手的人工智慧系統。” 　　人工智慧會否有朝一日能戰勝所有人類棋手？如果可以，大概需要多久？　　李世石接連落敗，柯潔甚至成為拯救人類圍棋智慧“尊嚴”的最後稻草。史忠植認為，經過學習和積累，在未來3-5年人工智慧系統能夠戰勝所有的人類棋手。　　為何這台人工智慧如此厲害，不妨深究其內涵：“AlphaGo”的核心是兩種不同的深度神經網路：“策略網路”（policy network）和“值網路”（value network）。它們的任務在於合作“挑選”出那些比較有前途的棋步，拋棄明顯的差棋，從而將計算量控制在電腦可以完成的範圍裡。　其中，“值網路”負責減少搜索的深度——AI會一邊推算一邊判斷局面，局面明顯劣勢的時候，就直接拋棄某些路線，不用一條道算到黑；而“策略網路”負責減少搜索的寬度 ——面對眼前的一盤棋，有些棋步是明顯不該走的，比如不該隨便送子給別人吃。　　然後，將這些資訊放入一個概率函數，AI就不用給每一步以同樣的重視程度，而可以重點分析那些有戲的棋招。“AlphaGo”利用這兩個工具來分析局面，判斷每種下子策略的優劣，就像人類棋手會判斷當前局面以及推斷未來的局面一樣。這樣，“AlphaGo”分析了比如未來20步的情況下，就能判斷在哪裡下子贏的概率會高。　　另據媒體報導，阿爾法圍棋採用機器學習方法，主要是深度卷積神經網路和強化學習。研發團隊收集了圍棋職業高手大量的棋譜，並用這些棋譜對“深度卷積神經網路”進行了3000萬步的訓練，使其判斷職業選手下一步走法的正確率達到了57%，之前的紀錄是44% 。　　（中國新聞網） http://sports.sina.com.cn/go/2016-03-12/doc-ifxqhmvc2363252.shtml 今天看來人類已經戰勝不了了... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.77.49 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457770598.A.1F2.html

→ NaoGaTsu: 今天就證明人類棋手根本… 03/12 16:19

→ goldduck: 就是三天前 03/12 16:23

推 deicide218: 今天就可以了不用三年QQ 03/12 16:24

噓 aixrotap: 直接轉繁體也校一下稿好嘛 03/12 16:27

→ qwerty110: 人家洗文哪會管這麼多 03/12 16:28

噓 remmurds: 強國人文章不意外 03/12 16:29

→ iandddy0986: 阿發狗你哪時會成為天下第一啊 03/12 16:30

→ hinajian: 合法棋局不知道有沒有包括吃掉一大塊然後在裡面繼續下 03/12 16:30

推 lanucelot: https://youtu.be/aBpGkhEa2Qw 準備嚇尿吧... 03/12 16:31

噓 Ommm5566: 03/12 16:32

推 hmt17: 這板又沒限制當然可以洗好洗滿阿 03/12 16:36

→ derekhsu: 李世石已經是現在的世界第二，再擊敗柯潔就結束了 03/12 16:57

→ angus9088: zkow事蹟 https://goo.gl/jblHTo 03/12 18:56

→ angus9088: 不要丟112 119的臉好嗎zkow 03/12 19:10