[建議] AlphaGo是300年後的人類

作者AirOctopus (AirOctopus)

看板GO

標題[建議] AlphaGo是300年後的人類

時間Tue Jan 3 11:33:36 2017

我要用我的理解來分析AlphaGo強度，主要借助工具是Elo，先看張圖： http://i.imgur.com/ylQTErVl.jpg AlphaGo V13是3000分、V18是4500分，也就是每代會多300分。（根據查到的Elo公式，「勝率= 1/(1+10^m) * 100%」，其中「m= 兩選手Elo差/400」，所以差100勝率為64%、差200為76%、差300為85%，跟AlphaGo每代間80~90%勝率吻合。）各個AI強度分析：人類最高等級大概3600，也就是AlphaGo V15，不過AlphaGo自戰導致Elo通貨膨脹，因此V15大概略弱於人類頂尖，斷定人類頂尖介於V15~V16之間。而DeepZenGo跟趙治勳比賽版是3000，對網路9D以上勝率超過90%、贏過幾位前段棋手，也就是V13快棋已有機會勝過前段棋手，如果V13快棋有機會勝過前段棋手，那V14大概快棋等於、甚至略勝前段棋手。而絕藝的升級版刑天，快棋對決前段棋手快90%勝率，所以估計實力比V14強、比V15弱， Elo 3400左右。雖然網路快棋對柯潔 5:2 領先，但正式賽對柯潔大概勝率只有24%，也就是七番棋會2:5或1:6落敗（不過至少能贏柯潔一盤了）。至於GodMoves或Master，由於沒輸過所以無法估計，不過要做到目前的超強41連勝，以 AlphaGo V15 3600分的人類頂尖實力，加上快棋優勢即可輕鬆做到。有人懷疑GodMoves或Master是AlphaGo，我認為很有可能，因為韓國網友都沒消息，如果真的是韓國AI，韓國那邊應該多少會有風聲，至少謠傳比如誰做的之類。（當然可能是因為沒人看得懂韓文，所以才沒人知道韓國當地的傳言。）外加柯潔對AlPhaGo以幾成定局，從2016的直播來看，中國棋手會強烈要求先下測試棋，因此不排除Aja或樊麾會讓Master先上線，所以我大膽推定Master就是AlphaGo！至於到底是AlphaGo哪個版本，我認為應是V18或V19，（柯潔說最新是V25版），因為沒道理放個比V18更低的版本，而且從DeepMind不斷保密AlphaGo實力、覺得會讓大家嚇一跳來看，http://i.imgur.com/QLWVmNC.png，也沒道理放一個太新的版本（從0直接變100才有趣，先放個50的就破梗了。）所以我大膽推定就是V18，Master = GodMoves = V18！（不過是V19或V20的可能性也不低，畢竟現在已經有V25了。）心得： V18 4500分已經人類無法企及，快棋在人類看來可能更跟神仙一樣，根據上面分析，可能快棋V16就已經跟神仙一樣，人類早已無法區別實力。整體人類每年Elo大概多個8~9，AlphaGo現在每個月升一代、Elo+300，成長速度是人類的400倍。現在的V25 AlphaGo預估6600分，比頂尖人類多了3000分，相當對柯潔勝率高達99.9999968377%，也就是如果辦個「一億番棋」，柯潔可以贏3盤... AlphaGo V25，相當於333年後的未來人回來下棋，333年前大概是1680年，相當本因坊秀策出生前150年、大清國棋聖范西屏出生前20年，如果柯潔穿梭回去那時候，棋弈水準大概就是現在的AlphaGo。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.165.68.147 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1483414419.A.2FE.html

推 oldTim: 人類棋手若能和數學家合作，開發新的理論，還是有機會贏 01/03 11:39

→ oldTim: 此理論只要是解析解，就可擊敗近似解且人腦可以掌控 01/03 11:41

推 zkow: 人類還是能大躍進的 01/03 11:56

推 paulli: 請問您的文章能借轉yigo嗎? 謝謝! 01/03 12:11

→ AirOctopus: OK！ 01/03 12:15

推 ggoutoutder: 數學家XDD 01/03 12:25

推 aaaba: 哈哈哈哈，np-hard問題的解析解 01/03 12:30

※ 編輯: AirOctopus (118.165.68.147), 01/03/2017 12:43:10

推 hipocritos: 解析解...噗噗 01/03 12:39

推 semihumanity: 滿有趣的！ 01/03 12:49

推 aegis43210: 看有沒有棋手要學李世石第四盤的下法和master下 01/03 13:00

推 oldTim: 誤用解析解是我的錯，小弟的意思是藉由跨界合作 01/03 13:23

→ oldTim: 讓圍棋理論能更加接近公理化的數學一樣清晰，比如手割理論 01/03 13:25

→ oldTim: 目前還存在很多模糊不清之處，也是人未來進步的機會 01/03 13:28

推 paulli: 謝謝，轉文位置 https://goo.gl/e6Gbiy 01/03 13:34

推 liaon98: 成長應該會是呈J曲線到後面應該就不會這樣一千一千的加 01/03 17:09

→ liaon98: 了反正只要強一些就能贏了 01/03 17:09

推 ddavid: ELO算法不會讓分數無限線性成長 01/03 18:09

→ ddavid: 基本上一個超強者把別人都殺爆會導致別人的ELO都不斷下降 01/03 18:11

→ ddavid: ，因而他贏別人取得的分數會越來越低 01/03 18:14

→ AirOctopus: 但輸給elo高很多的也不太會降，主要是elo差不多的人碰 01/03 18:17

→ AirOctopus: 到較會有變化，AlphaGo新版可以利用電舊版狂升Elo 01/03 18:18

→ AirOctopus: 如果能把舊版殺到剩20%勝率，elo基本上就比舊版高很多 01/03 18:22

→ AirOctopus: 所以有更高的elo後，更新版再把原新版殺爆，又可狂升 01/03 18:23

→ AirOctopus: elo大概是輸強很多的沒事、贏弱很多的也沒事、贏高很 01/03 18:29

→ AirOctopus: 多得升很多、輸弱很都得掉很多。所以我好像搞錯了，是 01/03 18:34

→ AirOctopus: 算碰到差很多的人比較有變化(?) 01/03 18:35

推 ddavid: 沒錯，新版一開始初始積分殺舊版高分會生很快，但是舊版就 01/03 19:33

→ ddavid: 會跌很快，兩邊往中間靠攏後勢頭就會趨緩，不會因此新版就 01/03 19:34

→ ddavid: 會相對舊版分數線性漲上去。所謂的暴升只有一開頭。 01/03 19:34

→ AirOctopus: 但舊版elo就在那裡，新版確定elo後大概就多個300，再 01/03 19:43

→ AirOctopus: 新版又可以靠原新版多個300，基本上就無限上升啦 01/03 19:44

→ AirOctopus: 每代相對勝率80%就不斷無限上升啦 01/03 19:45

推 ddavid: 新版一定會比舊版多加300的依據是什麼，這可不是例證法能 01/03 20:00

→ ddavid: 證的東西XD 01/03 20:00

→ ddavid: 每一版本之間的勝率就不一定相同了，而且目前你看到的ELO 01/03 20:01

→ ddavid: 值都是宣稱出來的，並沒有丟到包括人類棋手的這個池裡面實 01/03 20:02

→ ddavid: 際跑過，光是公開比賽過的那個版本之ELO值就已經不夠可信 01/03 20:02

→ ddavid: 了，我認為要拿這個宣稱的ELO值來說後面的故事還太早 01/03 20:03

→ AirOctopus: deepmind說大概80~90%勝率就算一個新版本啊 01/03 20:04

推 ddavid: 喔好，我知道你在說什麼了XD 01/03 20:08

→ AirOctopus: 我不確定實際分數怎麼算，如果差300=85%勝率的話，差 01/03 20:08

推 aaaba: 這篇本來就趣味導向，幹嘛看那麼仔細，那我來問一句，300年 01/03 20:09

→ aaaba: 後有人類嗎？ 01/03 20:09

→ AirOctopus: 個300應該是正常 01/03 20:09

→ ddavid: 不過ELO本身就不是一個用在單挑勝率評比的的東西，AlphaGo 01/03 20:10

→ ddavid: 版本之間的高勝率差有可能是改善了前一版的某致命缺點（即 01/03 20:10

→ ddavid: 便那個致命缺點也許人類也引發不了） 01/03 20:11

→ AirOctopus: 我的確對elo不算很了解，我只是用查到的公式去算的 01/03 20:11

→ ddavid: 也許真正的整體實力不見得是這樣飆升的，等待實戰吧 01/03 20:13

→ ddavid: 趣味導向的文章就不能被仔細看是在侮辱寫文章的人嗎？XD 01/03 20:13

→ AirOctopus: 可能會算出完全錯的東西也不一定XD 01/03 20:13

推 liaon98: 贏的人elo會上升輸的會下降 A大你這樣講等於是把輸的AI 01/03 20:13

→ liaon98: 的elo訂死這樣才能讓贏的AI的elo無限上升 01/03 20:14

→ ddavid: 不，就單挑重複一直下的情況下他說的其實沒錯 01/03 20:15

→ ddavid: 同樣兩人重複下無限盤，如果勝率很固定，分數差會收斂在他 01/03 20:16

→ ddavid: 說的範圍附近這樣 01/03 20:16

→ aaaba: 為了不侮辱人，我也來仔細看，把一隻AI 放到elo評比，分數 01/03 20:20

→ aaaba: 絕對高不起來，要放超多AI，才能把地基夯實，墊高最強的那 01/03 20:20

→ aaaba: 隻AI的elo，屆時需要的AI的數量可能比人還多 01/03 20:20

推 ddavid: 其實主要原因也就是對局數不夠，就算理論上的ELO可以那麼 01/03 20:29

→ ddavid: 高，但實戰沒那麼多場次就堆不到那個地步XD 01/03 20:30

→ ddavid: 所以你說加AI數量也是沒錯，其實就是增加總對局數量 01/03 20:30

推 tume7: 說不定是單機版阿老師… 01/03 21:11

推 s4340392: 推 01/03 22:25