看板 GO 關於我們 聯絡資訊
其實有個很大的問號,雖然阿爾法對外的更新已經中止 但他自己有學習功能 上一場輸給李世石那盤,為了避免劫爭而導致崩盤的情形 不知在第五盤時是否會自動修正這個失誤? 面對類似選擇時,會下別的位置,或勇於打劫呢? 因為有前盤"經驗",使他不再重蹈覆轍? 不知電腦自動學習功能是如何,會改變他的棋風跟戰略嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.84.115 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457944278.A.2F0.html ※ 編輯: zkow (123.192.84.115), 03/14/2016 16:33:16
shadeel: 直接寫信去問deepmind阿 03/14 16:36
a1223356: 谷歌是說這幾場比賽期間他們都沒有調整過電腦,只有收 03/14 16:42
a1223356: 集數據而已,所以只有依賴自我學習。但又有人說電腦比 03/14 16:42
a1223356: 賽完就停機不動了,自然就沒啟動自我學習,所以好像有 03/14 16:42
a1223356: 兩種說法。 03/14 16:42
nangle: 這幾天沒有自我學習,第五天的版本就是第一天的版本 03/14 16:52
indium111: DCNN的學習模式在比賽前就停止學習了 03/14 16:55
Marino: 只要不啟動權重調整程序就不會學習啦 下幾盤都一樣 03/14 17:04
blackwindy: 其實這樣也不太公平 正常來說要啟動學習功能 03/14 17:18
blackwindy: 不然高手戰個幾盤看出破綻就屌打了 03/14 17:18
blackwindy: 只是阿法狗前面太猛了所以沒人說話 03/14 17:19
goldduck: 有沒有調整只有谷哥自己才知道了 這是一場商業秀 03/14 17:41
NaoGaTsu: 第五盤和第四盤是同版本,沒修bug 03/14 17:44
NaoGaTsu: 小李拿到賽後資料回饋時就知道了有沒有修版本了,韓棋院 03/14 17:44
NaoGaTsu: 應該也會希望小李釋出他拿到的資料。 03/14 17:45
MicroB: 自我學習也跟小李下的那幾盤沒關係 跟看破戰無關啦 03/14 18:08
MicroB: google就說了要針對李世石 一千盤李世時棋譜都遠遠不夠 03/14 18:09
MicroB: 而若是靠左右互博五天就能贏 那根本不用AG 把AG內的RL拉出 03/14 18:12
MicroB: 來就可以了 這東西多算搞不好產生bias棋力還會下降 03/14 18:13
doom3: 不然也修一下崩潰亂下啊 03/14 18:44
MicroB: 如果直接加限制條件就是針對圍棋了 deepmind是想展現他們 03/14 18:54
MicroB: 深度學習的強大和適用性 所以連局部死活都不算交給神經網 03/14 18:55
MicroB: 不是只要贏而已 追求的是不同的美感 XD 03/14 18:57
jinmin88: 我記得昨天阿狗輸的時候跳出的視窗感覺是說已存檔.. 03/14 19:22
cloud1030: 鎖版本了,應該不會微調 03/14 19:29
bxxl: 訪問時就有講了啊,每一場比賽的版本都一樣 03/14 20:03
broodworld: 其實這4盤在樣本數裡應該蠻小 03/14 20:13
papawalk: 如果鎖版本,反而是小李這幾盤成長,阿法狗停止學習XDDD 03/14 23:06
papawalk: 果斷猜明天小李贏 03/14 23:06