看板 GO 關於我們 聯絡資訊
我要用我的理解來分析AlphaGo強度,主要借助工具是Elo,先看張圖: http://i.imgur.com/ylQTErVl.jpg
AlphaGo V13是3000分、V18是4500分,也就是每代會多300分。 (根據查到的Elo公式,「勝率= 1/(1+10^m) * 100%」,其中「m= 兩選手Elo差/400」, 所以差100勝率為64%、差200為76%、差300為85%,跟AlphaGo每代間80~90%勝率吻合。) 各個AI強度分析: 人類最高等級大概3600,也就是AlphaGo V15,不過AlphaGo自戰導致Elo通貨膨脹, 因此V15大概略弱於人類頂尖,斷定人類頂尖介於V15~V16之間。 而DeepZenGo跟趙治勳比賽版是3000,對網路9D以上勝率超過90%、贏過幾位前段棋手, 也就是V13快棋已有機會勝過前段棋手,如果V13快棋有機會勝過前段棋手, 那V14大概快棋等於、甚至略勝前段棋手。 而絕藝的升級版刑天,快棋對決前段棋手快90%勝率,所以估計實力比V14強、比V15弱, Elo 3400左右。雖然網路快棋對柯潔 5:2 領先,但正式賽對柯潔大概勝率只有24%, 也就是七番棋會2:5或1:6落敗(不過至少能贏柯潔一盤了)。 至於GodMoves或Master,由於沒輸過所以無法估計,不過要做到目前的超強41連勝, 以 AlphaGo V15 3600分的人類頂尖實力,加上快棋優勢即可輕鬆做到。 有人懷疑GodMoves或Master是AlphaGo,我認為很有可能,因為韓國網友都沒消息, 如果真的是韓國AI,韓國那邊應該多少會有風聲,至少謠傳比如誰做的之類。 (當然可能是因為沒人看得懂韓文,所以才沒人知道韓國當地的傳言。) 外加柯潔對AlPhaGo以幾成定局,從2016的直播來看,中國棋手會強烈要求先下測試棋, 因此不排除Aja或樊麾會讓Master先上線,所以我大膽推定Master就是AlphaGo! 至於到底是AlphaGo哪個版本,我認為應是V18或V19,(柯潔說最新是V25版), 因為沒道理放個比V18更低的版本,而且從DeepMind不斷保密AlphaGo實力、 覺得會讓大家嚇一跳來看,http://i.imgur.com/QLWVmNC.png
也沒道理放一個太新的版本(從0直接變100才有趣,先放個50的就破梗了。) 所以我大膽推定就是V18,Master = GodMoves = V18! (不過是V19或V20的可能性也不低,畢竟現在已經有V25了。) 心得: V18 4500分已經人類無法企及,快棋在人類看來可能更跟神仙一樣,根據上面分析, 可能快棋V16就已經跟神仙一樣,人類早已無法區別實力。 整體人類每年Elo大概多個8~9,AlphaGo現在每個月升一代、Elo+300, 成長速度是人類的400倍。現在的V25 AlphaGo預估6600分,比頂尖人類多了3000分, 相當對柯潔勝率高達99.9999968377%,也就是如果辦個「一億番棋」,柯潔可以贏3盤... AlphaGo V25,相當於333年後的未來人回來下棋,333年前大概是1680年, 相當本因坊秀策出生前150年、大清國棋聖范西屏出生前20年,如果柯潔穿梭回去那時候, 棋弈水準大概就是現在的AlphaGo。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.165.68.147 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1483414419.A.2FE.html
oldTim: 人類棋手若能和數學家合作,開發新的理論,還是有機會贏 01/03 11:39
oldTim: 此理論只要是解析解,就可擊敗近似解且人腦可以掌控 01/03 11:41
zkow: 人類還是能大躍進的 01/03 11:56
paulli: 請問您的文章能借轉yigo嗎? 謝謝! 01/03 12:11
AirOctopus: OK! 01/03 12:15
ggoutoutder: 數學家XDD 01/03 12:25
aaaba: 哈哈哈哈,np-hard問題的解析解 01/03 12:30
※ 編輯: AirOctopus (118.165.68.147), 01/03/2017 12:43:10
hipocritos: 解析解...噗噗 01/03 12:39
semihumanity: 滿有趣的! 01/03 12:49
aegis43210: 看有沒有棋手要學李世石第四盤的下法和master下 01/03 13:00
oldTim: 誤用解析解是我的錯,小弟的意思是藉由跨界合作 01/03 13:23
oldTim: 讓圍棋理論能更加接近公理化的數學一樣清晰,比如手割理論 01/03 13:25
oldTim: 目前還存在很多模糊不清之處,也是人未來進步的機會 01/03 13:28
paulli: 謝謝,轉文位置 https://goo.gl/e6Gbiy 01/03 13:34
liaon98: 成長應該會是呈J曲線 到後面應該就不會這樣一千一千的加 01/03 17:09
liaon98: 了 反正只要強一些就能贏了 01/03 17:09
ddavid: ELO算法不會讓分數無限線性成長 01/03 18:09
ddavid: 基本上一個超強者把別人都殺爆會導致別人的ELO都不斷下降 01/03 18:11
ddavid: ,因而他贏別人取得的分數會越來越低 01/03 18:14
AirOctopus: 但輸給elo高很多的也不太會降,主要是elo差不多的人碰 01/03 18:17
AirOctopus: 到較會有變化,AlphaGo新版可以利用電舊版狂升Elo 01/03 18:18
AirOctopus: 如果能把舊版殺到剩20%勝率,elo基本上就比舊版高很多 01/03 18:22
AirOctopus: 所以有更高的elo後,更新版再把原新版殺爆,又可狂升 01/03 18:23
AirOctopus: elo大概是輸強很多的沒事、贏弱很多的也沒事、贏高很 01/03 18:29
AirOctopus: 多得升很多、輸弱很都得掉很多。所以我好像搞錯了,是 01/03 18:34
AirOctopus: 算碰到差很多的人比較有變化(?) 01/03 18:35
ddavid: 沒錯,新版一開始初始積分殺舊版高分會生很快,但是舊版就 01/03 19:33
ddavid: 會跌很快,兩邊往中間靠攏後勢頭就會趨緩,不會因此新版就 01/03 19:34
ddavid: 會相對舊版分數線性漲上去。所謂的暴升只有一開頭。 01/03 19:34
AirOctopus: 但舊版elo就在那裡,新版確定elo後大概就多個300,再 01/03 19:43
AirOctopus: 新版又可以靠原新版多個300,基本上就無限上升啦 01/03 19:44
AirOctopus: 每代相對勝率80%就不斷無限上升啦 01/03 19:45
ddavid: 新版一定會比舊版多加300的依據是什麼,這可不是例證法能 01/03 20:00
ddavid: 證的東西XD 01/03 20:00
ddavid: 每一版本之間的勝率就不一定相同了,而且目前你看到的ELO 01/03 20:01
ddavid: 值都是宣稱出來的,並沒有丟到包括人類棋手的這個池裡面實 01/03 20:02
ddavid: 際跑過,光是公開比賽過的那個版本之ELO值就已經不夠可信 01/03 20:02
ddavid: 了,我認為要拿這個宣稱的ELO值來說後面的故事還太早 01/03 20:03
AirOctopus: deepmind說大概80~90%勝率就算一個新版本啊 01/03 20:04
ddavid: 喔好,我知道你在說什麼了XD 01/03 20:08
AirOctopus: 我不確定實際分數怎麼算,如果差300=85%勝率的話,差 01/03 20:08
aaaba: 這篇本來就趣味導向,幹嘛看那麼仔細,那我來問一句,300年 01/03 20:09
aaaba: 後有人類嗎? 01/03 20:09
AirOctopus: 個300應該是正常 01/03 20:09
ddavid: 不過ELO本身就不是一個用在單挑勝率評比的的東西,AlphaGo 01/03 20:10
ddavid: 版本之間的高勝率差有可能是改善了前一版的某致命缺點(即 01/03 20:10
ddavid: 便那個致命缺點也許人類也引發不了) 01/03 20:11
AirOctopus: 我的確對elo不算很了解,我只是用查到的公式去算的 01/03 20:11
ddavid: 也許真正的整體實力不見得是這樣飆升的,等待實戰吧 01/03 20:13
ddavid: 趣味導向的文章就不能被仔細看是在侮辱寫文章的人嗎?XD 01/03 20:13
AirOctopus: 可能會算出完全錯的東西也不一定XD 01/03 20:13
liaon98: 贏的人elo會上升 輸的會下降 A大你這樣講等於是把輸的AI 01/03 20:13
liaon98: 的elo訂死 這樣才能讓贏的AI的elo無限上升 01/03 20:14
ddavid: 不,就單挑重複一直下的情況下他說的其實沒錯 01/03 20:15
ddavid: 同樣兩人重複下無限盤,如果勝率很固定,分數差會收斂在他 01/03 20:16
ddavid: 說的範圍附近這樣 01/03 20:16
aaaba: 為了不侮辱人,我也來仔細看,把一隻AI 放到elo評比,分數 01/03 20:20
aaaba: 絕對高不起來,要放超多AI,才能把地基夯實,墊高最強的那 01/03 20:20
aaaba: 隻AI的elo,屆時需要的AI的數量可能比人還多 01/03 20:20
ddavid: 其實主要原因也就是對局數不夠,就算理論上的ELO可以那麼 01/03 20:29
ddavid: 高,但實戰沒那麼多場次就堆不到那個地步XD 01/03 20:30
ddavid: 所以你說加AI數量也是沒錯,其實就是增加總對局數量 01/03 20:30
tume7: 說不定是單機版阿老師… 01/03 21:11
s4340392: 推 01/03 22:25