看板 GO 關於我們 聯絡資訊
本來想問這裡沒有人有可以出來解釋一下這篇(講AlphaGo用的演算法) http://benkampha.us/posts/2016-03-11.html (不過不知道為什麼, 連結好像失效了?) 只大概看了一下, 因為連什麼是hand coded evaluation都一頭霧水啊 XD 其中提到兩種演算法, 一組叫policy network,用來模仿人類的棋步, 很妙 另一組是value network,用以判斷一個棋步有多少價值(應該無關好壞,而是目數) 前者還有分階段, 先supervised後reinforcement 而後者並不是放手讓電腦自行去繞,而是有給點指示 大概是這樣, 不過我更想知道這個convolutional neural networks是什麼? 和節點的類神經網路有什麼不一樣啊? 希望版上有神人可以解答 @_@" 以下是我自己昨天看棋的感想: 做為一個曾經的棋迷, 我在2004-2008年間看過很多棋賽 那時會和朋友用MSN Live討論的比賽(自LGS、棋聖道場、幽玄之間等的轉播) 或從奇譜士找我們有興趣的舊譜來討論 感覺身為棋迷很幸福啊, 因為網路上資源相當豐富 論壇人多, 又值棋界動盪不安, 很多八卦可看XD 比方說, 在當時個性和作風就很妙的小李 那時還是大李比較強, 但已壓不住他的風頭 所以小李在09年突然說要停職時, 雖然我已漸漸不太看棋了, 還是很錯愕 他一直都有驚人之舉, 但當時正是他全盛的時候啊! 沒有職業棋手會在自己剛27歲, 迎上頂峰的時候說要「暫停」! 那時應該是所有人都看壞一年多後回來的他 覺得沒有棋士--尤其是頂尖的職業棋士--可以離開高壓的賽圈再回來而不退步 但小李就是要向大家證明他能, 他也的確做到了 從此他不再是大李之下的小李, 而是只管走自己路的李世石了 這是為什麼和AlphaGo這次的對決會這麼轟動 因為以李世石的身份, 他願意和電腦比這種棋賽本身就很讓人訝異 他的實力在世界冠軍裡是絕無僥倖的 Google想必有絕佳的公關團隊吧, 讓他們可以找到一個這麼有說服力的對手 不能不說天時、人和, AlphaGo都有了 為什麼是天時呢? 這次看第二盤的轉播時, 覺得這個用時對李世石真是太不利了 尤其是進到官子階段的讀秒 不管兩小時這麼短的用時是不是李世石自己提出的, 他都不可能還沒壓力了 人可以像時間暫停般做收官的, 除了AI, 恐怕還是只有李昌鎬做得到 但現在已經不是李昌鎬的全盛期了....AlphaGo還是來的太晚了 我覺得很可惜啊 好在官子不是圍棋唯一的特色 李世石這個有閱歷又藝高人膽大的, 多變的風格正適合這種前無古人的對局! 在經過兩次對局、探到對手的能耐後, 他會進行什麼樣的布局? 畢竟, AlphaGo會進步, 而李世石也會啊! 期待明天的對奕~ -- 也想知道韓國棋院這兩天的覆盤 @//@ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.135.67 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457711964.A.D62.html
arnold3: 人類若只能還在用形容詞來描述棋局時 注定離電腦一大截 03/12 00:03
notmuchmoney: 賽前李世石對環境也沒太多要求 也許沒料到挑戰如此 03/12 00:15
notmuchmoney: 巨大 03/12 00:15
fgkor123: http://goo.gl/XfKUNc 這兩篇應該有幫助 03/12 00:23
fgkor123: http://dataunion.org/11692.htm 03/12 00:23
Rubio5566: 第二篇連結失效了 03/12 00:25
fgkor123: http://dataunion.org/11692.html 正常阿QQ好像少l 03/12 00:27
ginstein: https://www.zhihu.com/question/39905662 03/12 00:29
fgkor123: 那兩篇是架構 03/12 00:31
fgkor123: cnblogs.com/fengfenggirl/p/cnn_implement.html 03/12 00:32
fgkor123: 這篇只談CNN,附程式碼和github連結 03/12 00:32
sadmonkey: 分享一下個人對演算法的理解,AG每步棋下棋模式就像是 03/12 00:40
sadmonkey: 一位長期練習後的業餘棋手,已經懂得每步棋要下時大約 03/12 00:41
sadmonkey: 可以下的哪五步棋比較好,而這時他會請一千名跟他同等 03/12 00:41
sadmonkey: 級業餘棋手分五組兩兩配對來對那五步棋開始下,直到下 03/12 00:41
sadmonkey: 完這一千盤統計這五步哪步勝率高,最後就決定下那步。 03/12 00:41
sadmonkey: 而AG的長期練習就是不斷的跟自己同等級的人下,每步棋 03/12 00:41
sadmonkey: 依據前面的下法,每局下完後會依據勝負檢討黑方白方誰 03/12 00:41
sadmonkey: 下的好,並就依勝負加權那方中間下過的每步棋,而且他 03/12 00:41
sadmonkey: 記憶力驚人永不忘記,體力驚人永不會累,並永遠可以找 03/12 00:42
sadmonkey: 到一位跟他一模一樣棋力的人下,經過上千萬棋局的自我 03/12 00:42
sadmonkey: 修練後來跟人類下棋。 03/12 00:42
sadmonkey: 只要他檢討棋局的方向正確,他就會一直的進步下去,而 03/12 00:42
*[1;31m→ *[33msadmonkey*[m*[33m: AG與以往不同的就是他用了更有效率的方法做上述的事。 *[m 03/12 00:42
NaoGaTsu: 簡單說就是鳴人的影分身之術外掛練等法。(無誤 03/12 00:42
fgkor123: 另外你講的是這篇? 03/12 00:43
fgkor123: 還是http://benkampha.us/ 03/12 00:44
對 我連的是benkampha.us那篇
sadmonkey: 過去即使用影分身可能要練一百年,AG找到精神時光屋所 03/12 00:44
sadmonkey: 以練了四年打敗樊麾,多練半年打敗李世石 03/12 00:46
wadashi1: 我去爬了,早在13年前黃士傑就做過電腦圍棋打劫的策略論 03/12 00:47
fgkor123: 明顯你網址多了/posts XD 03/12 00:47
應該不是我多打post 而是作者昨天剛好在那時搬文了啦> <
wadashi1: 文.http://goo.gl/utCkwl 接下來李世石要用打劫的方法對 03/12 00:48
sadmonkey: 用deepmind來研究圍棋是近四五年才開始成立的公司 03/12 00:49
wadashi1: 對阿法GO,正好可以見論電腦圍棋對打劫的方法。李世石究 03/12 00:49
wadashi1: 竟會不會是自尋困擾呢?畢竟現在的電腦運算太快了! 03/12 00:50
----------------------------------------------------------------------------------------------------- 以下推文因為和本文沒有太大關係 所以我把它分開 希望要討論aja帳號的朋友可以不要再回在這裡 另外開個文 謝謝! *[1;31m→ *[33mTaiwanUp*[m*[33m: AlphaGo在弈城的帳號二月底好像還是有輸帶p的職業 *[1;31m→ *[33mTaiwanUp*[m*[33m: 這也讓李世石被預期頂多輸一盤 *[1;31m→ *[33mTaiwanUp*[m*[33m: 現在換李世石贏一盤也會震驚全世界了(?) *[1;31m→ *[33mvencil*[m*[33m: AlphaGo在奕城的帳號是? *[1;31m→ *[33mvencil*[m*[33m: http://goo.gl/qpxdVh deepmind應該一直是本人? *[1;37m推 *[33mcoldlian*[m*[33m: 那是aja的帳號 不是alphago的... *[1;31m→ *[33mTaiwanUp*[m*[33m: deepmind *[1;31m→ *[33mzelkova*[m*[33m: aja說那是他的帳號 不是測試用帳號 *[1;31m→ *[33mTaiwanUp*[m*[33m: AlphaGo在弈城下棋的帳號 根據棋譜不是被推論是AG嗎 *[1;31m→ *[33mzelkova*[m*[33m: 推論是金灿佑那篇? 但aja之前不就打敗過職業 *[1;31m→ *[33mzelkova*[m*[33m: 至少我不會那麼直接說 deepmind=alphago
TaiwanUp: deepmind打敗職棋的棋風不是aja 我也沒有說AG=Deepmind 03/12 00:53
TaiwanUp: AG在弈城的帳號也可以是aja的帳號 這是多對一的概念 03/12 00:54
TaiwanUp: #1MswLK3O推論某些局是AG下的 03/12 00:58
zelkova: AG有沒有在弈城下過棋就是一個問題了 03/12 00:59
zelkova: 再來才是AG的帳號是什麼 03/12 01:00
liaon98: 不過AG去下網路圍棋鍛鍊 也是個不錯的方法吧 03/12 01:01
TaiwanUp: 7372這篇推論AG有在弈城下過 載體是deepmind 80%+是真的 03/12 01:06
zelkova: 7373呢? 80%又哪來的 還有人說99%呢 03/12 01:15
TaiwanUp: 7373也是說連勝應該不是aja下的有問題嗎 03/12 01:22
zelkova: 你可能沒理解文章 他是說 "你可以這麼說 但我不這麼認為" 03/12 01:29
TaiwanUp: 他說"這個狀況,說明了應該有位職業棋手在操刀" 03/12 01:31
TaiwanUp: 所以他說不是aja下的沒錯呀 03/12 01:32
zelkova: 後面那段是什麼 可以唸出來嗎?? 03/12 01:32
TaiwanUp: 不可能達成那麼驚人的(9d)連勝成就 03/12 01:36
zelkova: 我覺得你很有當記者的淺力.. 03/12 01:38
zelkova: 「這個狀況,說明了應該有位職業棋手在操刀,從 Alphago 03/12 01:38
zelkova: 的棋感覺不出來,可以在九段達成那麼驚人的連勝記錄,除 03/12 01:39
zelkova: 非他有所謂的:遇強則強,遇弱則弱的狀況,所以我覺得應 03/12 01:39
zelkova: 該是有職業棋手接手了 Aja Huang 的號在下,而不是Alphag 03/12 01:39
zelkova: o 在下。」 03/12 01:39
TaiwanUp: 所以確實他認為不是aja下的沒錯呀 要9d連勝也接近世石了 03/12 01:42
TaiwanUp: aja有必要或有能力請到這種棋手來幫他代打或測試嗎 03/12 01:43
zelkova: 但是你沒發現人家在分析的時候 都是持保留態度 03/12 01:44
zelkova: 而不是把「AG在弈城的帳號...」掛在嘴邊 03/12 01:44
TaiwanUp: 而他前面也有說 如果之後公佈是AG那他也認了 從前兩戰結 03/12 01:44
zelkova: 這樣跟那些在說這次有不打劫協議的人有什麼差別 03/12 01:45
TaiwanUp: 果看來 保守猜測是AG應該沒問題吧 03/12 01:46
TaiwanUp: 說有不打劫協議是不承認真實 我不承認aja能連勝九段 03/12 01:49
TaiwanUp: 和7373這篇的想法一樣 都是認同真實事實的行為 03/12 01:50
zelkova: 雖然大家想法一樣 但是結論完全不一樣 03/12 01:51
zelkova: 你高興就好 恩 晚安 03/12 01:52
TaiwanUp: 如果你認為aja能連勝九段 才是無異於不打劫協議派的人 03/12 01:54
TaiwanUp: 是潛力不是淺力 記者至少分得清楚這兩個字 03/12 01:55
zelkova: 你也沒搞懂我意思 我沒說aja一定能連勝九段 至少得有證據 03/12 08:19
zelkova: 不然 柯潔懷疑有不打劫協議->網友說估狗有不打劫協議 03/12 08:20
zelkova: 陳經懷疑deepmind就是AG->網民說AG就是用deepmind 03/12 08:21
zelkova: 這中間哪裡有差別? 最後還自己加個80% 完全就自己定論了 03/12 08:24
※ 編輯: bbbtri (61.223.114.150), 03/12/2016 09:51:47
TaiwanUp: 我有斷句 不是在引用數據 不要搞文字獄 03/12 15:20