看板 GO 關於我們 聯絡資訊
如題 大家似乎發現alphago面對變化多或變化少勝率差不多 會傾向選變化少的 那alphago和自己下個幾百萬盤 alphago會不會永遠都選擇變化少的呢? 或者說 變化少的他都下習慣了 變化少的一直打反而勝率一直提高 變化多的很少下反而勝率一直降低 他和他自己下會不會導致演算法原本的"缺點"(汙染)會被放大呢? 自己天生避開劫爭 自己跟自己下個一百萬場只是讓這個避開劫爭的傾向變得更加明顯? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.213.192 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457854937.A.F56.html ※ 編輯: hayuyang (220.136.213.192), 03/13/2016 15:43:12
kingrichman: 我是認為如果勝率低於50%,就會陷入只能選低於50% 03/13 15:43
kingrichman: 的循環,所以越下越糟 03/13 15:44
blacktom: 這種問題誰知道,就等研發團隊測試出來再看看吧 03/13 15:46
Murasaki0110: 不會 除非你讓他認為輸的棋是贏 03/13 15:47
carylorrk: training data 的 skew 是很基本的概念,不用替專家煩 03/13 15:55
carylorrk: 惱這個啦XD 03/13 15:55
jacklin2002: 當汙染率達到400%,AlphaGo將跟人類一起變成柳橙汁 03/13 16:03
mothertime: 只要勝率不是0,都有可能回升到50%以上 03/13 16:09
tn00371115: 這是有可能的 但不知道純淨的比較強還是棋譜比較強 03/13 16:37
tn00371115: 不過現在可能有大BUG 03/13 16:37
grimmq427532: 機器學習的的overfitting是老問題了 03/13 16:49
wnglon: 被提掉那八目是重點 就是因為阿發狗亂下一子 03/13 16:50
wnglon: 導致八目死棋 03/13 16:50