Re: [討論] AlphoGo什麼時候在長考？

作者mathbug (天堂的定義)

看板GO

標題Re: [討論] AlphoGo什麼時候在長考？

時間Fri Mar 11 08:52:07 2016

※ 引述《mathbug (天堂的定義)》之銘言： : 我覺得這是一個很有趣的問題 : AlphaGo 什麼時候長考？就是什麼時候要花很多時間計算？ : 理論上，當人類對手在思考下一手的時間 : AlphaGo 也可以用自己的邏輯(value function)〝幫〞對方選出最佳的幾個點 : 然後同時思考自己的對策 : 一旦人類對手的落點不在自己選出最佳的幾個點時，一切又要重新計算了 : 換言之，當AlphaGo長考的時候，表示人類對手的選點不同於自己的邏輯 : (非電腦判斷分數最高的幾個點) : 也許好好在重播中觀察AlphaGo的長考時間點可以多瞭解它不同的邏輯第一盤 AlphaGo 好幾手花很多時間在思考導致AlphaGo用時也非常可觀(第二盤AlphaGo用時少很多了) 顯然李也給AlphaGo出了難題甚至於行至中盤右下角白棋沒做活之前很多高手仍然認為黑棋佔優第三盤的最佳策略應該如下： 1. 相同開局，AlphaGo 應該會相同應對直到李世石自己認為的問題手 2. 真心認為人類要(好好看重播) 知道怎麼下才會讓AlphaGo重新花時間計算思考唯有這樣才能讓AlphaGo有前後策略不連貫的機會 3. 前半盤沒優勢(戰略階段) 後半盤應該沒機會(戰術階段電腦計算大勝人類) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.12.82 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457657530.A.839.html

推 agreerga: 如果下一模一樣的步法 AG會同樣策略嗎? 03/11 09:03

推 sarraya: 相同開局未必相同應對，AG最少也會把第一局參入經驗 03/11 09:03

※ 編輯: mathbug (180.177.12.82), 03/11/2016 09:06:52

→ shyangs: 第一局的經驗是必勝. 03/11 09:12

推 fh48105: 應該不會相同策略. AG的演算法有加入亂數取點. 03/11 09:23

推 newtonyd: 一定有亂數取點不然對電腦就會出現必勝法(BUG) 03/11 09:40

推 SansWord: 按照類神經網路的邏輯，這兩場完參數應該又不同了 03/11 09:48

→ SansWord: 如果這幾天 AlphaGO 都仍舊不斷自我練習的話，兩天後 03/11 09:48

→ SansWord: 不會是一模一樣的應對....它還在不斷成長阿！ 03/11 09:48

推 agreerga: 那如果可以無限反悔有辦法Try出一條贏AG的局嗎 03/11 10:07

推 nangle: 就窮舉法啊樓上 03/11 10:36

推 aegis43210: 無限反悔的話，一盤棋要下幾天？ 03/11 12:26

推 agreerga: 下小棋盤來觀察AG的步法? 03/11 13:40

推 Danielly: 小棋盤每個點跑出來的權重也會不一樣啊 03/12 00:09