看板 GO 關於我們 聯絡資訊
1. 據說 AlphaGo用到的Neuro Network深達13層 有任何穩定性的報告或是說明嗎? 2. 圍棋的勝敗至少包括兩種,一種是壓著打或是完勝,另一種是反敗為勝 AlphaGo的設計應該是循著第一條路線 問題是餵它的千萬盤訓練用人類棋譜卻包含非常多第二類棋譜 反敗為勝的棋譜應該非常多用的是勝負手(或是無理手) 不曉得這會不會是AlphaGo昨天崩潰的原因? 3. 以現在AG的能力,它應該可以先歸類/分群 將之前訓練的棋譜分開 重新訓練時只採用第一種壓著打或是完勝的棋譜 也許就不會有無理手的出現了 (或數學上 讓它的系統參數穩定) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.12.82 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457943491.A.16B.html
Uizmp: AG設計團隊的理念應該是要盡量消除人類的影響因素 (? 03/14 16:19
dan310546: 好像有可能 03/14 16:20
indium111: 所謂的13層應該是指AG的神經網路中的隱藏層有13層吧 03/14 16:21
agreerga: 2.3點不會有衝突嗎? 03/14 16:22
birdy590: 我覺得很多人都想太多了, AlphaGO 根本不是在下圍棋 03/14 16:22
indium111: 中間的參數設定沒看到有人介紹過(多數人應該也沒興趣) 03/14 16:22
birdy590: 它只是在進行"從過去棋譜和自我對奕學到的一種數學計算" 03/14 16:22
birdy590: 像估值網路的訓練可以說是從白紙一張開始 沒人說的清楚 03/14 16:23
birdy590: 怎麼訓練法結果會比較好(絕對不是亂倒棋譜進去) 03/14 16:24
aegis43210: 誰也不知道之後棋譜洗掉的alphaGO會變的如何? 03/14 16:29
aegis43210: 希望是成為以宇宙流為主的棋手,但人類就難以模仿 03/14 16:31
bbbtri: 如果演算法真的能創造出典範轉移 難以模仿也可以喲~~ 03/14 16:41
bbbtri: 期待今後AlphaGo發展出宇宙流的死活題給大家解 03/14 16:42
※ 編輯: mathbug (180.177.12.82), 03/14/2016 16:46:16
Rinehot: 簡單來說昨天ag應該是沒有意識到出棋了 才會下ㄧ堆損棋 03/14 17:02
kafai: 3.的話誰來判斷呢?2.的話我覺得會有負面影響,但自我學習 03/14 17:58
kafai: 有機會把那些負面影響扳回來 03/14 17:58
aaaba: 3的確是棘手的問題,大數據的labelling,可用value network 03/14 20:00
aaaba: 試試 03/14 20:01