Re: [閒聊] Master已經突破人類圍棋運算的極限了嗎?

作者Justice5566 (正義56)

看板C_Chat

標題Re: [閒聊] Master已經突破人類圍棋運算的極限了嗎?

時間Thu Jan 5 12:56:31 2017

※ 引述《a127 (毛蘿蔔)》之銘言： : ※ 引述《Emerson158 (紅豆 X 八嘎 X 烏魯賽)》之銘言： : 個人只是看過一些簡報介紹， : 但我覺得阿發狗的壓倒性實力應該沒那麼絕望才對。 : 以前西洋棋被電腦演算直接暴力破解， : 原因在於合法步少，對手的下一手反制只有2X步可能， : 圍棋的合法步多，前幾手對手的反制有200步以上的可能。 : 然後西洋棋的好步就是成功的殺死對手的棋子+國王， : 圍棋的好步眾說紛紜，就連佈局來說不同的棋手就有各自不同的審美觀。 : 雖然人類已經神乎其技的知道自己的佈局在爭奪N個目的地， : 但兩個不同的N相比起來，還是會很微妙的難以判斷哪方優劣。 : 所以圍棋比賽沒有足夠時間被暴力破解， : 於是就變成阿發狗利用評價網路來建立圍棋的審美觀， : 也就是把人類棋手應對的"好步"記起來， : 利用這些好步跟有限的計算來擊倒對手。 : 原本我在想既然餵養阿發狗的食物來源也是人類創造的，這段你搞錯了餵人類棋譜長大的是舊版的阿發狗也就是去年跟李世石下的那隻去年那隻在李世石第78步下出神之一手後整個錯亂導致輸棋可能也是因為李那步超越了去年狗狗建立的理論今年這隻阿發狗是純粹藉由自我對局學習的差別在於今年這隻會在前期中棋下一些違反常理甚至被認為是臭棋的棋步但事後發現這些棋步都是神之一手所以才很多職業棋士說新版阿發狗顛覆了傳統圍棋理論 : 那麼阿發狗為什麼會這麼容易的擊敗世界頂尖的好手呢? : 我在猜測其實職業棋手一場比賽其實"好步"的數量沒那麼多， : 相較阿發狗則是利用他的評價網路希望他每一手都是好步(但可能也是部分而已) : 會有這種猜測是這五十場勝利之中，其實有幾場是幾目的勝負， : 而且都是在前中期阿發狗被評論大幅領先，在後面被人類追上。 : 我認為會有這種異常狀況出現，可能在於一部分的賽局都以投子結束， : 等於在最後收官階段給阿發狗餵養的資料不夠多， : 因此目前人類在後期的計算跟審美仍然略優於阿發狗的關係。這點你判斷也是有問題阿發狗中期贏很多後期贏面變小的理由主要是來自於他所設定的目標對阿發狗來講贏半目跟贏100目都是贏所以我不需要贏很多只要保持一定贏就可以了所以狗狗在穩定領先時會變得保守的理由就在這邊反觀人類在獲得優勢時常常想要擴大優勢但這個行為往往得不償失這就是電腦最強的地方電腦完全沒有情緒他只往最高勝率的方向走所以不容易犯錯 -- BZ黑一到板，所有看板的人便都看著他笑，有的叫道：「BZ黑，鬥陣特攻拿年度最佳遊戲了！」他不回答，對板裡說：「發兩篇廢文。」便排出九文批幣。他們又故意的高聲嚷道：「鬥陣特攻還拿最佳電競跟最佳多人遊戲！」BZ黑睜大眼晴說：「鬥陣早過氣了…」「什麼過氣？我前天親眼見鬥陣特攻包辦三個獎。」BZ黑便漲紅了臉，額上的青筋條條綻出，爭辯道：「只拿一次GOTY不能算贏…競技遊戲，能算GOTY嗎？」接連便是難懂的話，什麼「對手太弱」，什麼「陰屍路也拿過」之類，引得眾人都哄笑起來：板內外充滿了快活的空氣。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.51.10 ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1483592194.A.DD7.html

→ intela60474: 我覺得不是變保守而是後期資訊量對人類來說終於夠了 01/05 13:00

推 orze04: AlphaGo在後期會把一些還有變化的地方早早結束掉 01/05 13:01

→ emptie: 這就是我們學棋跟阿發狗最大的不同…… 01/05 13:02

→ emptie: 我們會關注贏多少他只會管有沒有贏 01/05 13:03

推 shadowblade: 機器沒有賭徒性格差很多 01/05 13:03

推 a1234567289: 和李世石打的那隻也有自我對奕了吧 01/05 13:03

那隻有自我對羿但是他還是吃人類棋譜長大的現在這隻完全不受人類棋譜污染他是純粹自我對羿長大的

推 orze04: 人會犯錯啊又不可能像AI那麼精準計算 01/05 13:03

→ emptie: 也不能說人的下法不對因為我們怕失誤所以會希望能盡量多 01/05 13:04

→ orze04: 不能說錯的人也很難完整複製AI那套下法 01/05 13:04

重點是既往圍棋理論會跟你說絕對不能這樣下的棋步被狗狗證明是可以這樣下的光這點就夠震撼了

→ emptie: 凹一點但是機器不會失誤 01/05 13:04

※ 編輯: Justice5566 (114.34.51.10), 01/05/2017 13:05:40

→ MikiSayaka: 還有電腦的訓練量就算是最強的職業棋士都難望項背... 01/05 13:10

→ MikiSayaka: 職業棋士沒有辦法 24x7 都在下棋... ||| 01/05 13:10

→ orze04: AlphaGo能那樣下是因為它能發揮人能不能發揮同樣效力? 01/05 13:10

→ MikiSayaka: AlphaGO 的著棋思路可能沒有辦法從內部結構去理解 01/05 13:11

→ henry1234562: 人類跟ai在下圍棋的根本判斷方式有不同 01/05 13:12

→ henry1234562: 雖然結果都是為了最大勝率但過程差很多 01/05 13:13

推 ADIE2: 現在看起來李世石真的是神之一手可能是阿發狗最後一敗 01/05 13:16

→ dreamnook: 圍棋理論也是建立在大量棋局的收斂經驗談上吧? 01/05 13:17

推 shinwind: 他前中期的下法.其實不是人類不懂.. 01/05 13:18

→ shinwind: 而是我們沒辦法判斷這麼宏觀 01/05 13:18

→ shinwind: 這樣說好了.人類的觀點都在局部.=而阿法狗下的都是宏 01/05 13:18

→ shinwind: 觀的勝利.其實人類也可以只是... 01/05 13:18

→ shinwind: 你無法像AI那樣.中收尾不出錯 01/05 13:19

→ flysonics: "士傑讀了Alpha狗萬局練蠱棋局後竟也成一代武林奇俠" 01/05 13:20

→ flysonics: 這種套路感覺好像武俠小說wwww 01/05 13:21

→ shinwind: 其實看解說就能有這種感覺.有時候一個局部固定的定式 01/05 13:25

→ shinwind: 解說就會說出這邊會怎樣下.但阿法狗就下一半就不鳥了.. 01/05 13:25

→ shinwind: 跑出旁邊下. 01/05 13:26

推 zeyoshi: 我覺得電腦預測的能力比人類高很多所以判斷是否需要收 01/05 13:26

→ zeyoshi: 手或進攻的時間會變得相當準確 01/05 13:26

推 loadingN: 最大的優勢應該是不會有太大的失誤 01/05 13:27

推 henry1234562: 只是因為ai的目標單純只放在贏而已 01/05 13:32

→ henry1234562: ai在確定當前局面基本贏定後就是不會再擴大優勢 01/05 13:33

推 shinwind: 這也是為什麼收宮會看到填自己目的情況XD 01/05 13:36

推 wateryoo: 專業推～ 01/05 13:41

推 seaEPC: 目前這個發展階段能贏還是重點,不然AI目標要調整成盡可能 01/05 13:43

→ seaEPC: 贏越多目應該也不是問題,只是可能翻船機率稍大一點 01/05 13:43

推 jupto: 我覺得是因為AI預測能力高於人類人類僅能不斷擴大優勢去確 01/05 13:49

→ jupto: 保自己的勝利機率但AI可以不斷地消除自己輸棋的未來來確保 01/05 13:50

→ jupto: 自己的勝利所以對於棋局的走向才會有所差異 01/05 13:51

→ jupto: 以程式的觀點人類的思考模式是loop AI是遞迴 01/05 13:52

→ blackwindy: loop跟遞迴一樣阿... 01/05 13:53

→ jupto: 一個反著來一個正面上概念上有差啦 01/05 13:54

→ blackwindy: 差別只是遞迴會呼叫自己 01/05 13:54

→ blackwindy: 不要亂套用專有名詞那不是你想的那樣 01/05 13:54

→ blackwindy: 最好笑的應該是以往圍棋大家都說人類有宏觀視野戰略 01/05 13:55

→ blackwindy: 現在AI已經用實戰證明那些只不過是屁人類應該謙虛點 01/05 13:56

推 zader: 深層運算跟宏局觀真的是贏不過電腦 01/05 14:01

推 jupto: 事實上什麼宏觀視野戰略人類自己都不瞭解那東西的本質 01/05 14:03

→ jupto: 結果使用模擬大腦運作方式AI就自己發展出來了 01/05 14:04

推 orze04: 遞迴可以用stack和loop做出來沒錯 01/05 14:08

推 agag5123: 區域不走完用機器的角度想可能是另一區的手價值更高吧 01/05 14:21

→ agag5123: 即使當下這區放掉會損一些也比不過另一區先下得的收穫 01/05 14:23

推 shinwind: 其實這一部分也是很有趣 01/05 14:24

→ agag5123: 人可能都要下到顯而易見才能判斷價值高低機器則看的早 01/05 14:24

→ shinwind: 這完全是判斷格局的不同.沒下完未必是損 01/05 14:25

→ agag5123: 所以才會出現許多不能理解的神之一手 01/05 14:25

→ shinwind: 如果這一手不跟上.那區域的爭奪是損還是賺? 01/05 14:25

→ shinwind: 局勢判斷上差太多了.(還不是形勢.形勢偏區域 01/05 14:26

推 sarspieya521: 光沒有情緒這點來講真的很可怕 01/05 14:36

推 agag5123: 如果可以看狗對狗的棋譜感覺會很可怕 01/05 14:38

→ agag5123: 一直維持在勝率50左右的宏局作戰不知道長得怎樣 01/05 14:40

推 tsming: 感覺該跪舔天網了XD 01/05 14:46

推 grandzxcv: 我看出人類對宇宙百害無一利，所以該毀滅人類 01/05 14:49

推 weltschmerz: 所以新版的有出PAPER了嗎? 我上次看的那篇有用到 01/05 14:50

推 opmina: 兩個ai的差異蠻有趣的 01/05 14:50

→ weltschmerz: 人類經驗做落點預測 01/05 14:51

推 tsubasawolfy: 今天的Nature沒有只有新聞快報看看下禮拜吧 01/05 14:57

推 davidyang1: 我的看法跟你不一樣 01/05 15:10

推 lugiam: 有那個版面對這個議題有深入討論嗎想拜見一下 01/05 15:31

推 jupto: 看起來目前的狗狗沒有針對對手個體行為做預測與調整 01/05 15:37

→ jupto: 也就是不管給他誰當對手他的思考方式都一樣 01/05 15:39

→ jupto: 如果未來要出專門玩猜拳的狗狗應該就會發展出個體行為分析 01/05 15:40

→ jupto: 與預測的狗狗了 01/05 15:40

推 z101924512: 換句話說，狗已經領悟圍棋本質，根本不在乎對手.... 01/05 15:42

→ z101924512: 好像更厲害... 01/05 15:43

推 jupto: 這要看人有人覺得下棋重在兩個人之前的互相影響 01/05 15:46

→ jupto: 如何打亂對方的節奏如何不被對方打亂節奏 01/05 15:46

→ jupto: 但是狗狗就只是在想怎麼放子可以贏 01/05 15:47

推 moonlind: 究竟是從哪裡流出：這個AlphaGO是完全自我對弈出來的 01/05 16:09

→ moonlind: 官方也只說新版甚至沒講如何新版怎麼腦補的? 01/05 16:09

→ moonlind: 去年三月 AlphaGO就有過跳脫思維演出了你也無法否定 01/05 16:10

→ moonlind: 他在一年的時間內透過自我對弈又刪除了不少人類棋譜的 01/05 16:11

→ moonlind: 可能性啊 01/05 16:11

→ goenitzx: 那AlphaGO2只要跟AlphaGO1對弈練習... 01/05 16:12

→ zseineo: 從新版那個字眼聯想出來的，沒有正式說法 01/05 16:19

推 davidpanda: 可是自我對弈的棋譜也是從上一版的AlphaGo來的吧? 01/05 16:19

→ davidpanda: 所以多少還是需要採用人類棋手的智慧? 01/05 16:20

→ davidpanda: 不太相信他們可以從全部隨機開始train出這版alphaGo.. 01/05 16:20

→ Justice5566: 訓練方式是go板看到的陸聞寫的姑妄聽之吧 01/05 16:23

推 orion: 因為去年Google有說下一版的將會是自我對奕出來的版本 01/05 16:26

→ orion: 所以才會這樣說吧 01/05 16:26

→ orion: 人類的棋譜也是上千年棋局累積出來的 01/05 16:27

→ orion: 可是電腦自己下，可能幾個月就能累積出人類上千年的量 01/05 16:27

→ orion: 從而形成自己的棋譜 01/05 16:27

推 moonlind: 但是圍棋wiki上寫的歷史最早圍棋跟現在好像布一樣 01/05 17:29

→ moonlind: 不知道現代圍棋大概算是幾年的歷史 01/05 17:30

推 gemini2010: 圍棋真的太奧妙，可惜相較之下西方不夠盛行，想看東西 01/05 18:00

→ gemini2010: 方各種天才的比拼 01/05 18:00

推 shinwind: 樓上不需要了.接下來讓ai帶著大家前進 01/05 18:09

→ goenitzx: 以後圍棋賽變成電腦拼電腦人類會看熱鬧可是都看不懂XD 01/05 18:57

推 a127: 西洋棋被征服之後還是有職業棋賽阿 01/05 18:59

推 octopus4406: 簽名檔我笑了 01/05 23:49