[新聞] 黃士傑博士 遠不止AlphaGo的人肉臂

作者zkow (逍遙山水憶秋年)

看板GO

標題[新聞] 黃士傑博士遠不止AlphaGo的人肉臂

時間Thu Jun 1 15:49:47 2017

黃士傑博士遠不止AlphaGo的人肉臂　他面無表情，他冷靜鎮定，他會出現在對手的夢裡，他是AlphaGo人肉臂。他熱情幽默，多才多藝。他很少登臺演講。他不被允許接受採訪。他是AlphaGo真正的創造者。他是 Aja，黃士傑。許峰雄綽號“CB”。　　1980年，許峰雄（Feng-Hsiung Hsu）從臺灣大學本科畢業，1985年考入卡內基梅隆大學。1988年，CB製造出國際象棋程式Deep Thought（深思），後來經過學弟李開複介紹，1989年加盟IBM繼續展開研究。　　1997年　　這一年5月11日，卡斯帕羅夫與Deep Blue（深藍）的第二次國際象棋人機大戰落幕，最終人類棋王以2½-3½的總比分，不敵IBM的超級電腦。　　這是載入人類歷史的一戰。　　Deep Blue，就是CB許峰雄在IBM開發出的新一代國際象棋電腦程式，棋力數百倍於早先的Deep Thought。 http://n.sinaimg.cn/kandian/crawl/20170601/kGRo-fyfuzmy0370295.jpg

△ 卡斯帕羅夫與深藍的國際象棋人機大戰　　同年7月，臺北成功高中的黃士傑參加聯考。當年國文試題第15題，B選項是：現代電腦的優點多得‘罄竹難書’令人不得不嘆服。　　黃士傑最終考入臺灣交通大學，四年後獲得電腦與資訊科學學士。2001年，黃士傑考入臺灣師範大學攻讀研究生學位。　　2003年，黃士傑碩士畢業。畢業論文：《電腦圍棋打劫的策略》。在學校當了一年的研究助理後，2004年，黃士傑再次考入師大資訊工程研究所博士班。　　2007年　　這年2月28日，臺灣師範大學的學生組織了一次圍棋同好聚會。隨後這個定期的聚會，發展為師大圍棋社，黃士傑是其中年紀最大的學長，並擔任首屆社長。3月，黃士傑擬定了首次對戰分組表，比賽地點在男生宿舍地下餐廳。 http://n.sinaimg.cn/kandian/crawl/20170601/wUuV-fyfrfvv5507720.jpg

左一是師大就讀期間的黃士傑　　同年5月，黃士傑帶領師大圍棋社參加臺灣大專杯圍棋賽。曾經有臺灣媒體報導稱黃士傑曾經帶領師大圍棋社在這項比賽中奪冠。不過量子位仔細查找後發現，師範大學僅在 2009年獲得過第五名，其他年份均榜上無名。　　同一賽事15個級別的個人戰中，前八名也沒有看到黃士傑的名字。2004-2011年間，黃士傑一直博士在讀，而他的棋力水準是業餘六段。　　雖然沒能在人類的圍棋賽中獲得矚目成績，但黃士傑在另一條路上繼續進發。他的一個主要戰場是國際電腦遊戲協會（ICGA）組織的電腦棋類程式競賽。顧名思義，來自全世界的電腦高手，在象棋、圍棋等領域展開鬥法。　　在這個比賽中，黃士傑的名字寫作：Shih-Chieh Huang。　　2006年，黃士傑獨自開發的第一款圍棋程式AjaGo，獲得圍棋大賽第11名；他參與的中國象棋程式Elephant（大象），獲得大賽的銅牌。此後幾年，黃士傑開發的圍棋程式參賽成績一直沒有亮眼的成績。　　2010年　　這一年9月，哈薩比斯（Demis Hassabis）等三人在英國倫敦合夥成立了一家新公司，名字叫做DeepMind。 http://n.sinaimg.cn/kandian/crawl/20170601/ZTMt-fyfrfvv5507725.jpg

2010年黃士傑開發的Erica擊敗Zen獲得冠軍　　同一個9月，黃士傑在Rémi Coulom的指導下，開發出圍棋程式Erica，並在圍棋比賽中擊敗日本的Zen，獲得當年的冠軍。這在當時可算了不起的成就。Rémi Coulom是另一個圍棋程式Crazy Stone的作者。　　因為Erica的奪冠，讓黃士傑在參加博士畢業答辯前，就已經獲邀前往加拿大阿爾伯塔大學攻讀博士後，並擔任電腦圍棋程式的研究員。他的博士論文題目是：《應用于電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法》。　　2011年6月，黃士傑博士答辯通過，7月1日，黃士傑飛赴加拿大。　　此時，他後來會遇到的席爾瓦（David Silver），早於一年前從阿爾伯塔大學離開，前往倫敦大學學院。在倫敦，席爾瓦會遇到哈薩比斯。　　到阿爾伯塔大學後，黃士傑繼續研究蒙特卡洛樹搜索。他還淺度參與了Fuego的開發，這個團隊裡還有Markus Enzenberger、Martin Müller等人，這個圍棋參加了當年的 ICGA大賽，不過可謂一無所獲。　　當年11月，奪冠的還是Zen。　　時間再過一年，2012年11月，黃士傑也來到倫敦，加入DeepMind擔任高級研究員。至少從這個時候開始，黃士傑開始用新的英文名：　　Aja Huang。　　2014年初　　加入DeepMind的兩年裡，黃士傑似乎沒有重大的研究成果。從論文發佈量上看，也是如此，2014年前幾乎搜不到他發的論文。　　然而事情很快有了轉機。　　2014年1月26日，Google宣佈5億美元收購DeepMind，拿下這家日後會大放異彩的初創公司。 http://n.sinaimg.cn/kandian/crawl/20170601/taIq-fyfrfvv5507728.jpg

　△ 左為哈薩比斯，右為席爾瓦　　有一天，席爾瓦走到黃士傑面前說：“Aja，我們準備啟動一個圍棋項目。最開始只有你和我”。2014年2月，AlphaGo項目正式啟動，團隊三個人：哈薩比斯、席爾瓦、黃士傑。哈薩比斯是整個公司的老闆，席爾瓦是黃士傑的經理。所以，這個團隊真正幹活的只有黃士傑一個人。　　AlphaGo項目，就是想搞出一個強大的圍棋程式。而且從一開始，這個團隊就決定不會嘗試所有的方法，他們只有一個方向：沿著深度學習和強化學習的方向探索。也是從一開始，他們就知道這是一個非常困難的挑戰。　　哈薩比斯說，希望通過AlphaGo的研究，讓機器獲得直覺和創造力。　　而更現實的困難是，與國際象棋相比，圍棋的計算空間巨大，而且電腦無法理解一盤棋到底誰獲得了勝利。　　但他們就這樣出發了。　　2014年6月-2015年6月　　這年夏天，AlphaGo的第一個重要武器出現了。在卷積神經網路的説明下，AlphaGo學習了很多人類高手的棋譜，能在3毫秒內做出比肩人類的下棋直覺。後來黃士傑給這個武器命名：“策略網路”，並且持續進行訓練優化。　　這個時候，AlphaGo的訓練還是在GPU上完成的。　　時間再過一年。2015年6月，AlphaGo擁有了更強大、分散式的搜索技術支援。閱讀棋局的能力大幅提升，可以檢索多種局面變化，並且找到最佳的應對方式。這個時候的 AlphaGo，可以算出後續40-60步棋。　　（量子位注：擊敗柯潔的最新版AlphaGo，也只算到50步棋就停止了。）　　當時在相同的硬體條件下，AlphaGo對另一個圍棋程式Crazy Stone取得了70%的勝率，換句話說棋力領先了一個子。這個成就讓整個DeepMind都很受鼓舞，哈薩比斯這時候對黃士傑說： “Aja，咱們要組一個團隊，你不用再單打獨鬥了”。　　從這時候開始，逐漸有更多的深度學習工程專家加入AlphaGo團隊。黃士傑還為新加入的同事辦了一個訓練班，普及基本的圍棋規則。 http://n.sinaimg.cn/kandian/crawl/20170601/SGxO-fyfrfvv5507733.jpg

黃士傑　　2015年8月　　與此同時，另一個重要的節點已在不遠。兩個月後，AlphaGo將掌握稱霸圍棋世界最關鍵的能力：形勢判斷。　　“事實上，形勢判斷是圍棋過程中最難、最令人頭疼的環節，要進行準確的判斷，必須具備精確測算雙方目數的能力，同時還要兼備綜觀全域的大勢觀、挖掘潛在價值的分析能力和推理能力……要下出真正具有水準的圍棋，形勢判斷十分必要。” 　　上面這段話，來自李昌鎬。這位綽號“石佛”的韓國棋手，從1992年奪得第一個世界冠軍開始，到2007年為止共獲得18次個人冠軍、13次團體冠軍，開創了“李昌鎬時代”。　　AlphaGo如何獲得形勢判斷的能力？　　解決這個問題的人是席爾瓦。有天他對黃士傑說：“Aja，我有一個主意，我覺得可能會管用”。席爾瓦的主意後來被稱為“價值網路”。當時黃士傑對這個主意非常懷疑，他回復說：“能管用麼？咱們試試吧。” 　　價值網路也是一個卷積神經網路，輸入是落子位置，輸出0-1之間的數字，0代表對手勝利，1代表自己勝利，如果差不多就輸出0.5。（量子位注：Google最近公佈的數字是 -1~1，略有不同）。　　總之，AlphaGo通過自我對弈，訓練出價值網路，進而可以判斷每一手棋背後代表的勝率。這就形成了形勢判斷的能力。　　價值網路的出現，讓AlphaGo棋力突飛猛進。與Crazy Stone的對弈中，AlphaGo勝率達到95%，也就是達到讓兩子的水準。　　“當時AlphaGo已經可以碾壓我了，我已經感覺到它的強大”黃士傑回憶說。　　2015年10月　　也是8月，樊麾在參加歐洲圍棋大會，回到法國的家中。他收到一封電子郵件，寄件者是AlphaGo團隊的Maddy。郵件內容非常簡單：我們是一家倫敦的公司，希望邀請你來我們公司。也沒有更多資訊。　　樊麾一度認為是垃圾郵件。但鬼使神差，他回了郵件說：“可以呀”。然後他們用 Skype進行了線上溝通，席爾瓦當時也參加了，他們給樊麾講述正在做有趣的專案，也講述了自己是一家Google收購的公司。　　隨後樊麾上了DeepMind的官網，確定有這麼一家公司，以及公司主頁上還提到了圍棋的字樣。於是他下定決心過去看看。　　雙方第一次見面是9月底，當他確定自己要跟一個圍棋程式對弈時，整個人一下就放鬆了，心說：“對付一個軟體，還不分分鐘的事兒”。樊麾當時甚至跟AlphaGo團隊表示，他跟AlphaGo的下棋時間，只需要一個小時就夠了。　　當時黃士傑反復跟樊麾說AlphaGo很厲害。但樊麾根本聽不進去。 http://n.sinaimg.cn/kandian/crawl/20170601/fdj5-fyfuzpn2355721.jpg

　△ 最後一局樊麾為自己的失誤懊惱不已　　2015年10月5日-9日。樊麾再赴倫敦，跟AlphaGo大戰五回合，當時代替AlphaGo落子的就是黃士傑本人。結果可能大家都知道，樊麾全輸了。“當時我的整個圍棋世界都崩潰了。”樊麾說。　　和樊麾的比賽結果，DeepMind一直到2016年初才對外發佈。那時樊麾已經受聘成為 AlphaGo的教練。公佈賽果那天，樊麾關閉了手機。外出買菜的樊麾妻子給家裡座機打電話：“千萬不要上網看評論，說的可難聽了。” 　　聶衛平當時評價說：“樊麾水準太低，給我們丟臉了。” 　　2016年　　1月27日，《自然》雜誌以封面論文的形式，介紹了DeepMind團隊開發的AlphaGo，以及它擊敗了歐洲冠軍樊麾的消息。　　席爾瓦和黃士傑，並列作為這篇論文的第一作者。　　在擊敗樊麾之後，AlphaGo的價值網路、策略網路和搜索能力都在繼續增強，使用的硬體也從GPU換成TPU。TPU讓AlphaGo的計算能力獲得極大提升。　　3月9日-15日，AlphaGo和李世石大戰五場。最終AlphaGo以4：1取得勝利。當時坐在李世石對面，代替AlphaGo落子的還是黃士傑。 http://n.sinaimg.cn/kandian/crawl/20170601/mxR_-fyfuzpn2355741.jpg

左一為黃士傑，中間坐著的是樊麾　　黃士傑第一次出現在全球觀眾的視線裡。　　黃士傑像機器人一樣，出現在李世石和全球觀眾的視線裡。　　李世石後來回憶說：“黃士傑是此次人機對弈中最辛苦受累的人，他擔心我會受到影響，對弈期間，他一直面無表情，甚至連一次洗手間都沒去過”。　　一次對弈，最長可能耗時近6個小時。在與李世石的無論對弈中，黃士傑只喝過一口水。黃士傑的這種表現，甚至走進了對手的夢裡。　　有次酒店的早餐送來後，李世石的妻子喚醒他起來吃早飯。沒想到李世石竟然回答說：“嗯，我要和Aja一起吃。” 　　與李世石的比賽之後，黃士傑有過短暫的休假，幾乎沒有採訪報導留下。一位元名叫 Fred Zhou的中國記者告訴量子位元，在韓國比賽期間，黃士傑並不被允許接受採訪，據說是因為他習慣於表達的毫無保留。　　再後來DeepMind放出了棋譜，AlphaGo繼續新的成長。這年11月18日，黃士傑總結說：“最近我的一個心得是，人的進步最多是用跑的，電腦的進步卻是用飛的”。　　在這一年即將結束的時候，AlphaGo又回來了。2016年12月30日，Science News發佈了一條推特，基本跟內文無關，推文如下： AlphaGo： “Now， I am the master。” 　　2017年　　事情從2016年12月29日晚開始，一個用戶名為“Master”，標注自己是韓國九段的棋手，連續在弈城和野狐圍棋平臺大殺四方，連續“斬殺”各路圍棋高手，包括：柯潔、朴廷桓、井山裕太、陳耀燁、申真諝、常昊、古力、周睿羊…… 　　Master挑起的這場戰鬥，以60連勝頂級高手而告終。其中柯潔連輸三場，期間因為急性腸胃炎而人生第一次住院，這一經歷也被編成調侃的小段子。　　取得第59場連勝之後，Master在聊天室公佈了自己的身份：“我是AlphaGo的黃博士 ”。果然是AlphaGo，果然又是黃士傑。 http://n.sinaimg.cn/kandian/crawl/20170601/U_T8-fyfuzpn2355745.jpg

黃士傑自報身份　　“非常期望今年能有機會與圍棋組織以及專家共同探索圍棋，在相互啟發的氣氛中共同領會圍棋的奧妙。我們希望儘快發佈其他公告”，哈薩比斯在稍後的正式聲明中說，這再次暗示了AlphaGo與柯潔的大戰即將進行。　　4月10日下午三點，在中國棋院的發佈會上，正式宣佈柯潔與AlphaGo的人機大戰5月底開打，柯潔當時表態會不惜一切手段與AlphaGo一決勝負：“我不會說輸了無所謂，我抱有必勝的心態和必死的信念”。　　5月23日，雨從早下到晚，圍棋人機大戰如期舉行。柯潔對面，坐著的仍是黃士傑，仍然作為AlphaGo的人肉臂代為落子。　　柯潔旁邊的桌子上，除了一個水杯，還有兩盤水果和零食。而黃士傑這邊的桌子上，只有一個白色的瓷質水杯。三場比賽皆是如此。 http://n.sinaimg.cn/kandian/crawl/20170601/L3eY-fyfuzny1696036.jpg

雙方對弈的最後一局　　每場比賽結束後，黃士傑都會很快的從對局室，返回現場的觀賽大廳。但他只是靜靜的站在一個角落，低頭看著自己的手機，有時朝臺上看看，等待柯潔等人站在聚光燈下，而身材不算高大的他時常會被身邊的人擋住。　　第二場對戰結束後，柯潔在臺上談起黃士傑： “黃博士作為AlphaGo的核心人物，非常了不起。我覺得，他坐在我面前就像個機器人一樣（笑）。如果是古力坐在我對面，他可能看到AlphaGo的下法可能會露出驚訝的表情。” “黃博士來擺棋，可能更讓我有和AI對戰的感覺。我也特別佩服黃博士，大家看直播也能看到我很愛動，總喜歡活動身體，而黃博士總是一動不動，不上廁所、不喝水、也不吃東西……所以跟黃博士下棋時，我覺得黃博士就是AlphaGo。” 　　當時哈薩比斯也說：“黃博士非常不可思議，有時候我們也覺得他是個機器人。我想他之前一定對著鏡子練過”。 http://n.sinaimg.cn/kandian/crawl/20170601/VfsL-fyfuzny1696041.jpg

　“最後一局即將開始，我要親手下出AlphaGo的每一步棋”，人機大戰最後一天的上午9 ：35，黃士傑在朋友圈發了這樣一句話。　　量子位當時就有一種異樣的感覺。一是黃士傑從來沒有在賽前發聲，二是這話裡明顯有著隱忍而又強烈的情緒。　　最後一戰，柯潔一樣情緒強烈。　　那天下午1點06，對局中的柯潔摘下眼鏡，神情沮喪。兩分鐘後，柯潔起身離席。代替AlphaGo落下第127子的黃士傑博士，趕緊拿起杯子喝了一口水。隨後黃士傑又恢復平靜的表情，一直低頭看著棋盤。　　時間過了很久，離席的柯潔還沒回來，黃士傑也開始抬頭張望。十多分鐘後，柯潔終於回來。後來我們知道，柯潔躲在現場的宣傳板後，哭了。　　下午1點22分，柯潔又抹了抹眼角。此時雙方行至第129手。　　經過209手的交鋒，柯潔再負AlphaGo。　　“其實今天下棋的時候我有點失態了，因為它（AlphaGo）下得實在是太完美了…… 我只能猜得出它一半的棋，這就是我和它之間巨大的差距”，賽後柯潔在臺上哽咽講出最後一戰的感受。　　稍後不就，同在臺上的哈薩比斯表示，AlphaGo從此“退役”。這時量子位才多少理解了黃士傑早上那條朋友圈的意義。　　上述種種發生的時候，黃士傑就坐在台下第一排，正中間的位置，抬著頭靜靜地聽著。看不到他有什麼表情，也看不到有什麼動作。也仍然沒有上臺發言的機會。有媒體靠近，黃士傑仍是那句：他們不讓我接受採訪。　　5月28日淩晨0：34，黃士傑在朋友圈發出這樣一句話：“天下沒有不散的筵席，我轉往其他專案的時刻已到”。　　一切就這樣收官了。　　這是載入人類歷史的又一戰。 http://n.sinaimg.cn/kandian/crawl/20170601/iGsS-fyfuzmy0370375.jpg

　最後　　“這幾年，特別是來到英國工作之後，有時候我覺得人生就像做夢一樣。在團隊與同事們的身上，我也看見了人因夢想而偉大的真實意義”，年初有同事問黃士傑以前研究電腦圍棋時有沒有想到今天，他寫下這樣一段話。　　從開始到現在，黃士傑看著AlphaGo的出生、成長、名滿天下。黃士傑一直以AlphaGo 人肉臂的樣子出現，像一個機器人一樣。 http://n.sinaimg.cn/kandian/crawl/20170601/4U82-fyfuzmy0370380.jpg

　但黃士傑，遠遠不止是AlphaGo的人肉臂。　　他也絕不是一個冷漠無趣的機器人。　　不信你聽聽下面這首黃士傑彈的樂曲，這是黃士傑初二時從音樂班轉學後創作的。在音樂課的前一晚，黃士傑準備了這首曲子。 http://sports.sina.com.cn/go/2017-06-01/doc-ifyfuzym7534553.shtml 難得中國這麼詳盡的報導黃博士，還寫得文采並茂挺不錯的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.74.38 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1496303391.A.E66.html

推 yys310: 好長篇的報導 06/01 15:51

※ 編輯: zkow (123.192.74.38), 06/01/2017 15:55:58

推 sarraya: 為什麼要把聯考題的選項也都挖出來，又不是沒料可寫 = =" 06/01 15:58

推 chigi: 推 06/01 16:07

推 stfang925: 整個求學生生涯都在專研圍棋AI 在最後劃下完美的句點 06/01 16:29

→ stfang925: 最後一段看了很感動希望在Alphago轉型之後黃博士可以 06/01 16:31

→ stfang925: 繼續保持下去 06/01 16:31

推 seaEPC: 不知道未來Aja有沒有能暢所欲言的機會 06/01 16:34

推 aegis43210: 人因夢想而偉大 06/01 16:38

推 defendtextbk: 哭惹 06/01 16:59

推 gamera: 推 06/01 17:01

推 jaw13: 推 06/01 17:04

推 nendi: 人因夢想而偉大！ 06/01 17:15

推 iandddy0986: 推!! 06/01 17:19

推 arthurwang: 能看到AG這些精彩的棋譜，真的謝謝黃博士 06/01 17:21

推 henry1915: 感人 06/01 17:24

推 blacktom: 推黃博士，好感動啊 06/01 17:51

推 intointo: 看到一開始是他自己摸索我覺得我要堅強… 06/01 18:17

推 rekku: 黃博士的精神正是將理想轉化為現實的道路! 06/01 18:18

推 josephlu0404: 淚流滿面 06/01 18:45

推 MonkeyCL: AjaGo聽起來好可愛 06/01 18:57

推 horseham: 這群人對於圍棋求真的態度不輸給任何一位職棋 06/01 19:04

→ devidevi: 這間公司只有三個人，一個是老闆，一個是經理，實際上 06/01 19:27

→ devidevi: 做事的只有一個人，好想哭... 06/01 19:27

推 FantasyNova: 老闆跟經理有它們要做跟負責的地方... 06/01 19:33

推 jhan6301: 推好文 06/01 19:58

推 a2156700: Aja，咱們要組一個團隊，你不用再單打獨鬥了 QQ 06/01 20:01

推 zeat: 這個團隊真正幹活的只有黃士傑一個人XDD 06/01 20:14

推 stevengoddy: 推可以收藏了 06/01 20:19

推 Maybetrue: 06/01 20:25

推 ssnneqay: 最後一局開始前的那句話好傷感，就好像是親手牽著自己的 06/01 21:03

→ ssnneqay: 孩子走完最後一程 06/01 21:03

推 william12tw: 感人@@ 06/01 21:37

推 aspwell520: 推黃博士 06/01 21:40

推 kk2025: 推 06/01 21:50

推 Lamuneforty: 感動推 06/01 21:54

推 Yz: 好棒的文 06/01 22:16

推 newtonyd: 個人覺得寫的很好啊 06/01 22:54

推 Kydland: 黃博士是台灣人台灣的媒體到底在幹嘛...... 爛死了 06/01 22:57

→ Kydland: 新創公司差不多都是這樣老闆負責social找錢 06/01 22:59

→ Kydland: 中階幹部才是管理者做苦工的又是另一批 06/01 23:00

推 airflow: AlphaGO 知道自己的命運所以最後一盤就大開殺戒了? 06/01 23:05

→ Kydland: 這就和當年革命黨一樣真正在做事的是黃興孫文負責嘴砲 06/01 23:07

推 hochirijay: 如果柯潔能真的贏一盤也許研究就會繼續，無奈真的差 06/01 23:16

→ hochirijay: 太多了 06/01 23:16

推 Lindeman5566: 好勵志啊 QQ 06/01 23:32

→ AirOctopus: 所以Kydland想要臺灣媒體幹麻？報導黃世傑嗎？ 06/01 23:35

→ AirOctopus: 不是報導很多次了？所以到底要幹麻？ 06/01 23:35

推 Kydland: 報導的水準不高啊尤其這次的著墨程度不比去年 06/01 23:37

→ Kydland: 整天在那邊報愛賭博欠債拖累自己的女兒卻死不認錯一句 06/01 23:40

→ Kydland: 誠懇的道歉都不說硬想要上台獻花的豬哥亮 06/01 23:40

推 GHowPan: 所以AG能算是混血兒嗎？ 06/01 23:52

推 RicFlair: 真詳盡 06/01 23:57

推 CGary: David Silver提出了價值網路, 雖然Aja功勞很大, 但把Silver 06/02 00:01

→ CGary: 說成是一個經理, 不幹活的角色... 實在是有點太過吹捧... 06/02 00:02

→ CGary: 而且Hassabis本人也是產業專家也是個會動手的人並不是只 06/02 00:03

→ CGary: 有老闆這麼單純在這產業我常遇到一些小公司被大公司收購 06/02 00:04

→ CGary: 前整個公司都是博士全部都是能打的老闆會參與到每個細節 06/02 00:04

→ CGary: 並不是每個新創公司都「差不多是這樣」尤其這種高強度的技 06/02 00:05

→ CGary: 術性創業老闆沒料根本搞不定下面的人... 06/02 00:06

→ CGary: 只是他們負責的事通常較多在專案的時間不可能有aja多而已 06/02 00:07

→ ykes60513: Silver不知幫了多少前期應該不是code都Aja寫的吧 06/02 03:07

→ ykes60513: 能提出價值網路代表他對程式應該也蠻了解的才是 06/02 03:08

推 H45: Aja很早就在網路上自稱Aja了，新聞多少還是有些誤差，須留意 06/02 07:16

推 sunev: 都與黃士傑並列論文的第一作者了，說只是經理實在是 06/02 09:08

→ sunev: 還有是李開復不是李開複，轉新聞至少要自己看過一遍吧 06/02 09:09

→ AirOctopus: 還報導水準不高咧，這篇是有多高？這次人機本來世界 06/02 10:04

→ AirOctopus: 就沒什麼關注，再報導同樣的人一次是要幹麻？ 06/02 10:05

→ AirOctopus: 而且豬哥亮本來就是名人，不報導他發生什麼事才奇怪 06/02 10:06

→ AirOctopus: 而且你以為中國沒有整天報導奇怪的東西？別幻想了 06/02 10:07

→ AirOctopus: 還可以花整篇新聞污辱人水準真高XD 06/02 10:09

推 hdjj: 推,黃博士願意的話,應該有一大堆人搶著找他繼續研究圍棋 06/02 10:26

→ hdjj: 只是沒有Google的資源和環境的話,也很難有如此偉大的成就 06/02 10:27

推 blacktom: 幹嘛繼續研究圍棋，他在深度學習的領域可以有更多其他貢 06/02 10:39

→ blacktom: 獻 06/02 10:39

推 Microyanke: 推 06/02 10:52

→ LeeSeDol: 從賽後記者會看得出D. Silver的貢獻應該是不輸給任何人 06/02 11:12

→ LeeSeDol: 。他是知道研究方向朝哪邊去才有成果的人。看看新論文的 06/02 11:12

→ LeeSeDol: 第一作者是誰吧！我猜是Silver獨居，畢竟他在reinforcem 06/02 11:13

→ LeeSeDol: ent這塊是專家，這是AlphaGo棋力繼續提升的關鍵 06/02 11:13

推 ztdxqa: Silver在RL這塊無人不知無人不曉啊他師父Sutton 06/02 12:00

→ ztdxqa: 就是RL那本聖經的作者啊把他說成經理實在是很好笑 06/02 12:00

→ ztdxqa: 黃博士或許是蒙地卡羅的專家但AlphaGo能真正勝過人類的 06/02 12:02

→ ztdxqa: 關鍵是DRL D.Silver才是關鍵中的關鍵 06/02 12:03

→ Lordaeron: aja的論文就是RL 了, 有人看過? 06/02 14:51

→ Lordaeron: Silver在RL這塊,有幾人知曉,要統計一下囉. 06/02 14:53

→ Lordaeron: 但aja 的論文是RL,看來沒人知呢. 06/02 14:54

推 ztdxqa: 驚真假哪一篇啊？ 06/02 14:54

→ Lordaeron: 假的!!他又不是"大師". 更是無人知曉的. 06/02 14:58

→ Lordaeron: 他的就是MONTE CARLO而已, 教你怎麼蒙贏ZEN 06/02 15:01

推 CGary: D.Silver是不是無人知曉我不確定但他恩師是產業大咖倒是沒 06/02 15:55

→ CGary: 甚麼問題,他跟他老闆Andrew Barto可以算是學閥一支... 06/02 15:59

→ CGary: 至於aja的博士論文不難找到:"應用於電腦圍棋之蒙地卡羅樹 06/02 16:01

→ CGary: 搜尋法的新啟發式演算法", 那時alphago 橫空出世就下載來看 06/02 16:01

→ Lordaeron: 哪有看到調參數? 06/02 16:03

→ CGary: 完或許我才疏學淺看不出MCTS SB 跟 RL 的關係... 不過aja 06/02 16:05

→ CGary: 對RL有涉獵不奇怪以演算法為業的人都是跳來跳出找題目做的 06/02 16:06

推 CGary: 另外, 其實我對 Silver 最記得的倒不是alphago,而是atari 06/02 16:09

推 lwei781: V18 ~ V25 差最多的是RL??? 06/02 16:11

→ lwei781: 然後只算到50步後 cut? 那Zen/絕藝有機會超越 06/02 16:11

→ CGary: 這個目前沒人真的知道這個value network 可能有不小的調整 06/02 16:13

→ CGary: 反正DM丟出來後會有很多產業界的人會動手把它弄出來... 06/02 16:13

推 lwei781: 其實就算是V18 似乎都有東西比絕藝強 06/02 16:25

推 lwei781: 還是有找出 Value 和 Strategy Network 可以互動的部分?? 06/02 16:30

→ lwei781: 其實希望還是在Zen, 應該至少會把他們能理解的部分處理 06/02 16:31

推 wadashi1: 我關心的是AlphaGo圍棋的部份是所有版本就此關機完結,還 06/02 16:38

→ wadashi1: 是純粹不公開而已,然後繼續耗電,在非公開繼續成長? 06/02 16:38

→ Lordaeron: 單純MCTS 只會亂下, 加個SB 好一點,但沒TRAIN下來,你 06/02 16:39

→ Lordaeron: SB 的參數也隨機? 06/02 16:40

→ wadashi1: aja這生都奉獻給電腦圍棋了,就此斷結,實在可惜.. 06/02 16:40

推 blacktom: 他才幾歲...講成這一生都奉獻給圍棋也太奇怪，而且圍棋 06/02 16:50

→ blacktom: 本來就是人工智能發展過程的一個課題而已 06/02 16:50

推 intointo: 如果把其他AI領域的技術帶回圍棋阿老師也算是在成長 06/02 17:32

推 aegis43210: 嗯，樓上+1，期望阿老師能成為真正的圍棋上帝 06/02 17:51

推 lwei781: 可能沒全關機但是沒新演算法idea 可能不會狂跑 06/02 18:33

推 ddavid: 別再以為做電腦圍棋的就一輩子只會只能做電腦圍棋了XD 06/02 18:58

→ ddavid: 這個領域的可轉移性很高的，跟不同的背景知識合作馬上又是 06/02 18:58

→ ddavid: 新應用 06/02 18:58

→ ddavid: 只是說Aja針對電腦圍棋一定會有特殊的感情，所以要轉移也 06/02 19:00

→ ddavid: 難免有所感傷XD 06/02 19:00

推 lwei781: Aja 做些其他的搞不好可以學到東西或靈感回來加強狗 06/02 20:16

推 fishinthesky: 好文推 06/02 21:02

推 devidevi: 以前系統寫死的話，是真的有這個可能 06/02 22:53

→ devidevi: 但是現在寫的是自我學習，核心不變的情況下，修改條件.. 06/02 22:53

→ devidevi: 可以適用其他環境，這才是自動學習最大的功能 06/02 22:54

推 Boyzone: 讚 06/02 23:15

推 ckuser: 該不會小李那一挖也間接促使阿發狗的進化 06/03 00:25

推 ddavid: 不是該不會，事實上就是 06/03 07:36

推 ddavid: 那一手同時能列入圍棋史冊跟人工智慧發展史冊了 06/03 07:39

噓 bidodu: 祖國媒體創作鄉民也能高潮，根本沒訪問本人呵呵 06/03 10:30

推 jacky7987: 看完好感人喔 06/03 11:25

→ aks4751: 第一段我以為在看食神 06/03 12:51

推 Edaw: 推Aja 06/03 15:09

→ Edaw: 參與了製作上帝根本是其他人一生都無法達成的成就 06/03 15:10

→ Edaw: 人工智慧歷史有他的一筆 06/03 15:10

推 cartoonss: 真希望以後可以有Aja的專訪！ 06/04 19:49

推 lwei781: 中國用長江學者挖他的話應該會有專訪 06/04 20:44

推 Kydland: 某人只會在那邊崩潰笑死人了加油好嗎 06/14 01:52

→ Kydland: 大家來關注圍棋有甚麼不好難不成關起門來取暖嗎 06/14 01:53

→ Kydland: 真的是笑死人 06/14 01:55