看板 GO 關於我們 聯絡資訊
http://www.slideshare.net/ShaneSeungwhanMoon/how-alphago-works Shou-de Lin Facebook上面最新的文章(一直判定廣告網站不能貼) 這裡有講alphago的怎麼運作的 "反而利用過去學到的policy 結合了蒙地卡羅樹狀搜尋(MCTS)的方法找出最好棋步" "必須要能夠走出前所未見的局面,降低它對於盤面估測的準確度才會有機會" 可以解釋為甚麼在李九段下出神之一手後就開始秀逗了 alphago利用過去棋譜和不斷自我訓練得一個函數 加上蒙地卡羅樹狀搜尋 來模擬最好的棋步 因為這神之一步是alphago在這幾千萬局中完全沒模擬到的一步 導致模擬全部重來所以之後幾步都下出低級失誤 弱點非常清楚下出alphago沒想出的一步 不過這一步的機會只能用一次 但是因為alphgo能一直不斷學習 這棋譜加入資料庫後同樣的手法就沒用了 所以第五局除非李九段可以下出和今天一樣的神之一手不然沒有機會贏 問題是根本不知道alphago哪些是它下過、哪些是它沒下過的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.249.104.200 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457865583.A.415.html
qweewqq: 其實最有趣的是Alphago不知他在下棋XD 03/13 18:40
louiswoman: 聖鬥士表示: 03/13 18:41
cksxxb123: 希望阿法狗是蘿莉 03/13 18:41
NaoGaTsu: 這是誤解吧,每一手AG都是獨立模擬計算,沒有全部重來的 03/13 18:41
NaoGaTsu: 說法?應該是形勢判斷的邏輯編寫上有問題。 03/13 18:42
umano: 希望週二能再現奇蹟 03/13 18:42
zkow: 我覺得這次李世石在棋界重返顛峰 03/13 18:45
Ethical: 神之一手!? 03/13 18:48
MK12: 如果他下場順序放法都一樣,也會贏,因為alpha還沒修正,但 03/13 18:49
MK12: 李不會這樣做,就是了 03/13 18:49
zkow: 應該是有很多選擇可以下,不一定會一樣吧 03/13 18:51
zkow: 就算你跟一般電腦玩,也不太可能按部就班每次就會一樣 03/13 18:51
qaaz: 這盤棋只是他千萬模型的一個,要影響整個學習成果還早 03/13 18:52
birdy590: 這隱含的意義是過去以人類棋譜為主的訓練有問題 03/13 19:17
birdy590: 也難怪已經計畫好要砍掉重練了 03/13 19:17
Marino: 神個蛋 感覺狗狗被調過了 顯然deepmind不想太招遙 03/13 19:18
Marino: 全敗太難看 讓一下輸一場較好 那麼低級的失誤誰相信 03/13 19:18
liaon98: 兩方輸了都有人不相信崩潰 板上也不少 03/13 19:23
profyang: 果然出現了XDD 我就知道有人會說阿發夠被調過 這跟之前 03/13 19:25
profyang: 懷疑保密協定是有啥兩樣 03/13 19:25
DemonElf: 推"liaon98: 兩方輸了都有人不相信崩潰"XDDD 03/13 19:26
Tenging: alphago以為自己在算數學呢 03/13 19:30
jyhfang: 進化過的陰謀論嗎 XD 03/13 19:31
HamalAri: MK12 亂說,MC 每次算出的機率又不會一樣 03/13 19:52
Wishmaster: 阿法溝的下法有玩過電腦圍棋的應該都看過,只是他是 03/13 19:53
Wishmaster: 阿發溝,怎麼會犯這種低級失誤 XDDDDDD 03/13 19:53
DemonElf: 我覺得現在在講Alphago低級失誤的跟前三盤在講李失誤的 03/13 19:58
DemonElf: 的不覺得有即視感嗎?他之所以沒下出好棋是因為對手逼出 03/13 19:59
smallyuki: 只能推liaon98了...不知道後天又是哪一方崩潰XDD 03/13 20:00
DemonElf: 來的,就像Google說明了AI到87步發覺了79步開始下錯了 03/13 20:01
DemonElf: 而79步之後的局面是因為李78步的絕妙好棋造成的 03/13 20:01
當時看著古力直播 下完那76步之後 ALPHAGO有下左下角一步古力直接挖了一聲 小李也滿臉狐疑(youtube 3h35m) 還有好幾次下在中間右方絕對逃不出去 一直下到棋盤邊邊 古力一直說一直在損失目 bug太明顯了 ※ 編輯: cscscscs22 (111.249.104.200), 03/13/2016 20:13:49
Wishmaster: 我不是指誤算喔,我是指必死棋還補一手和下那種低段才 03/13 20:08
Wishmaster: 會下的死活棋. 不過也很合理,電腦只會想贏,他哪知道 03/13 20:08
Wishmaster: 對手實力來決定對方最簡單的死活是否會出錯... 03/13 20:09
agario: 其實看過這篇就多半會懷疑AlphaGo的 value net 偶爾會錯了 03/13 20:22
agario: http://goo.gl/3qzyIv <- 奇怪的圖片偶而騙過 net 03/13 20:23
agario: AlphaGo 就是把棋盤當成圖片餵給類似上面文章的 net 03/13 20:27
Cadd: 真的, 那步棋就是全場狐疑怎麼會下在那邊 03/13 20:33
Cadd: 以籃球比喻, 失誤可能是投球沒進或運球掉球 03/13 20:34
Cadd: 而那手就好像AlphaGo拿球跑去投自己籃送你分 03/13 20:34
Cadd: 不過這也說明人跟AI的差別, 重要決定還是不能只由AI決定 03/13 20:36
plaxtic: Alphago沒有資料庫 是靠不停得自我修正程式 03/14 08:21