[情報]DeepMind宣布更強的AlphaGo算法

作者wadashi1 (阿拉丁)

看板GO

標題[情報]DeepMind宣布更強的AlphaGo算法

時間Tue Dec 31 00:17:47 2019

一個月前的新聞了冥冥天意：李世石退役 DeepMind宣布更強的AlphaGo算法原文網址：https://kknews.cc/tech/zyojoql.html 11月19日，韓國棋院宣布，李世石九段辭去職業棋手職務，正式宣布退役。在與AlphaGo 的第一次人機大戰當中，李世石神奇的一挖，成就了人類與AlphaGo唯一的勝局。或許是天意，就在昨天，谷歌的DeepMind再次發表論文，宣布推出全新的算法MuZero，通過這一算法，可以加快人工智慧的訓練速度。目前在圍棋、西洋棋、將棋以及數十個 Atari遊戲的學習表現當中優於目前所有算法，具體到圍棋上，已經可以超越之前的 AlphaZero。 ============================================== 另一個說明MuZero的網頁: https://www.chainnews.com/zh-hant/articles/175196541080.htm 通用 AlphaGo 誕生？DeepMind 的 MuZero 在多種棋類遊戲中超越人類 DeepMind 近期的一項研究提出了 MuZero 算法，該算法在不具備任何底層動態知識的情況下，通過結合基於樹的搜索和學得模型，在雅達利 2600 遊戲中達到了 SOTA 表現，在國際象棋、日本將棋和圍棋的精確規劃任務中可以匹敵 AlphaZero，甚至超過了提前得知規則的圍棋版 AlphaZero。 ============================================== 就在大家都說deepmind的AlphaGo已退役,不可能再出來,什麼都是張飛打岳飛! 殊不知,Deepmind依然繼續再研究,再次超越Alphazero的新演算法MuZero再次橫空出現! 就在李世石和leelazero相繼表明退休及結束訓練的這時候。要不要讓張飛可以跟岳飛打,決定權在Deepmind,祖師爺不想跟徒子徒孫打也沒辦法。 AlphaZero是在既定規則下訓練出來會下圍棋。 MuZero據說層次更高,在沒有規則下..由人類誘導下,發明了圍棋,又成為棋聖! 希望MuZero可以在讓子棋上有更強大的發揮! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 106.104.98.191 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1577722671.A.3BC.html

推 kenwufederer: 期待棋譜 12/31 00:40

※ 編輯: wadashi1 (106.104.98.191 臺灣), 12/31/2019 00:52:10

推 rnoro: 不過deepmind的文章中好像沒有說MuZero超越AlphaZero， 12/31 03:57

→ rnoro: 我想他的意思是在學習的效率上可以匹配（match），但文章的 12/31 03:58

→ rnoro: 的圖表中並沒有表明MuZero的棋力更高明～ 12/31 03:58

→ rnoro: 事實上在figure 3A中，MuZero在長期的表現中還是稍稍輸給 12/31 04:01

→ rnoro: AlphaZero 12/31 04:01

推 aegis43210: 話說Leela被bjiyxo大續命後，目前又卡關了 12/31 04:45

推 HeterCompute: 強是強在通用，棋力應該沒有更高明 12/31 09:00

推 abc0922001: 現在 bjiyxo 還在努力要給 LZ續命! 12/31 09:12

推 pan0531: 樓上從何處得知的消息?@@ 01/01 00:48

推 maplefoxs: 效率更高是不是代表不用那麼強的硬體 01/01 13:39

推 abc0922001: http://zero.sjeng.org/ Test Matches 的 Table 01/01 15:06

→ abc0922001: 滑鼠移到權重那邊會顯示資訊 01/01 15:07

推 pan0531: 又出更強的權重了...bjiyxo大好猛 01/01 20:20

推 lwei781: liminf 還是重點啊 01/01 22:35

推 intointo: 演算效率提升吧？ 01/03 08:40