噓 shadeel: 直接寫信去問deepmind阿 03/14 16:36
推 a1223356: 谷歌是說這幾場比賽期間他們都沒有調整過電腦,只有收 03/14 16:42
→ a1223356: 集數據而已,所以只有依賴自我學習。但又有人說電腦比 03/14 16:42
→ a1223356: 賽完就停機不動了,自然就沒啟動自我學習,所以好像有 03/14 16:42
→ a1223356: 兩種說法。 03/14 16:42
推 nangle: 這幾天沒有自我學習,第五天的版本就是第一天的版本 03/14 16:52
推 indium111: DCNN的學習模式在比賽前就停止學習了 03/14 16:55
→ Marino: 只要不啟動權重調整程序就不會學習啦 下幾盤都一樣 03/14 17:04
推 blackwindy: 其實這樣也不太公平 正常來說要啟動學習功能 03/14 17:18
→ blackwindy: 不然高手戰個幾盤看出破綻就屌打了 03/14 17:18
→ blackwindy: 只是阿法狗前面太猛了所以沒人說話 03/14 17:19
→ goldduck: 有沒有調整只有谷哥自己才知道了 這是一場商業秀 03/14 17:41
→ NaoGaTsu: 第五盤和第四盤是同版本,沒修bug 03/14 17:44
→ NaoGaTsu: 小李拿到賽後資料回饋時就知道了有沒有修版本了,韓棋院 03/14 17:44
→ NaoGaTsu: 應該也會希望小李釋出他拿到的資料。 03/14 17:45
推 MicroB: 自我學習也跟小李下的那幾盤沒關係 跟看破戰無關啦 03/14 18:08
→ MicroB: google就說了要針對李世石 一千盤李世時棋譜都遠遠不夠 03/14 18:09
推 MicroB: 而若是靠左右互博五天就能贏 那根本不用AG 把AG內的RL拉出 03/14 18:12
→ MicroB: 來就可以了 這東西多算搞不好產生bias棋力還會下降 03/14 18:13
推 doom3: 不然也修一下崩潰亂下啊 03/14 18:44
推 MicroB: 如果直接加限制條件就是針對圍棋了 deepmind是想展現他們 03/14 18:54
→ MicroB: 深度學習的強大和適用性 所以連局部死活都不算交給神經網 03/14 18:55
→ MicroB: 不是只要贏而已 追求的是不同的美感 XD 03/14 18:57
推 jinmin88: 我記得昨天阿狗輸的時候跳出的視窗感覺是說已存檔.. 03/14 19:22
推 cloud1030: 鎖版本了,應該不會微調 03/14 19:29
推 bxxl: 訪問時就有講了啊,每一場比賽的版本都一樣 03/14 20:03
推 broodworld: 其實這4盤在樣本數裡應該蠻小 03/14 20:13
推 papawalk: 如果鎖版本,反而是小李這幾盤成長,阿法狗停止學習XDDD 03/14 23:06
→ papawalk: 果斷猜明天小李贏 03/14 23:06