→ darkseer: 等等,你上一篇文章沒有解釋為什麼會傾向簡明+高勝率呀? 03/14 09:05
→ Uizmp: 我個人是覺得 AG自身學習的結論, 對含有打劫的分支權重偏低 03/14 09:32
→ Uizmp: 有可能是樣本不夠多, 有可能是多重劫的分支很難有效展開 03/14 09:34
→ Uizmp: 因此都會採取避免打劫的的方式進行 03/14 09:34
→ darkseer: 不過這樣子會不會反而輕忽對手可以導入打劫的下子? 03/14 09:37
→ darkseer: 純粹討論AI,如果AlphaGo自己覺得打劫很不好,那應該同 03/14 09:38
→ darkseer: 時會輕忽李九段可以導入打劫的棋手,但看了職業講解不像 03/14 09:39
→ Uizmp: 很有可能,前三盤要不就是成功避開,要不就是打劫影響不夠大 03/14 09:39
→ darkseer: 因為我聽講解好像是說,李九段本來有機會打劫,但AG規避 03/14 09:41
→ darkseer: 當然像你說的,只有三盤本來我這樣想就很容易有盲點XD 03/14 09:42
→ Uizmp: 不太懂你上面兩段說的, 輕忽導入打劫的棋手 vs AG規避 03/14 09:44
→ Uizmp: 這兩件事情不一樣嗎? 我的意思是AG對往打劫的分支權重較低 03/14 09:44
→ darkseer: 噢sorry,我是說,單論他們paper內容,搜尋樹對黑白對稱 03/14 09:45
→ darkseer: 所以如果覺得黑主動挑起劫爭是壞棋,那反過來應該也會, 03/14 09:45
→ darkseer: 也就是會樂意製造讓對手有機會產生劫爭的棋步, 03/14 09:46
→ darkseer: 但前三盤轉播的看法好像與此相反,認為AG會規避劫爭 03/14 09:47
→ Uizmp: 我猜是自我對弈的中,不管AG執黑或白,打劫分支都會降低勝率 03/14 09:50
→ Uizmp: 打劫分支的展開可能會比避劫多出很多,而且勝負難料,算不完 03/14 09:52
→ darkseer: 黑白同時降低勝率這個我自己覺得是演算法的基本錯誤XD 03/14 09:57
→ Uizmp: 假設打劫雙方都討不了好,勝率50%,當時避劫AG評估將近80% 03/14 09:57
→ darkseer: 跟棋手不應該下出97一樣比較難相信@@ 03/14 09:57
→ darkseer: 那樣的話,就是要贏了不想打劫,要輸了很想打? 03/14 09:58
→ Uizmp: 以50%舉例, 就是說對黑方不利, 白方有利 03/14 09:58
→ Uizmp: 至於 97 那邊我覺得是另外一個問題 03/14 09:59
→ darkseer: 對不起97舉例可能不太好,譬如說93 :p 只是類比 03/14 09:59
→ Uizmp: 之前的棋局裡面, 好像還沒有逼到AG勝率低迷的情況 ? 03/14 09:59
→ darkseer: 嗯嗯,我不反對你的結論XD 03/14 10:00
→ darkseer: 對不起補充一下,你說的對,我主要就是因為這裡是圍棋板 03/14 10:07
推 Uizmp: 搞不好AG還有一個"靠北,算不完,我不要打劫"的價值評估 03/14 10:07
→ darkseer: 覺得應該強調『演算法的結論是AI可能在優勢時避免劫爭』 03/14 10:08
→ darkseer: 說不定XD 也許圍棋高手會得到這樣的結論 :p 03/14 10:08
→ darkseer: 但是從演算法的觀點沒有理由特別相信這樣..吧? :D 03/14 10:09
噓 aaaba: 看你ID,應該是懂點數學,請解釋在NN這種高度非線性函數裡 03/14 10:12
→ aaaba: ,什麼叫穩定係數。你要說得那麼空泛,乾脆推文就可以了 03/14 10:12
可以設計類似 the Lyapunov function的東東 或是其他方式(e.g. 做一些pertubation?)
(請參考
http://jacobi.math.wvu.edu/~ef/preprints/LyapNeuralNetsLNCSFormatted.pdf )
噓 doomhydra: 學點 deep learning 再來好嗎? 一篇一篇打臉很累 03/14 10:48
※ 編輯: mathbug (180.177.12.82), 03/14/2016 15:41:48
→ aaaba: 抱歉,我看不出alphaGo有回授 03/14 17:35
我初步的想法是
1. 從AI系統的角度來看
有沒有辦法了解它系統係數/NN係數的穩定性?
(容不容易產生bifurcations?)
2. 從棋盤上的理解來看 (e.g. 一般認為中腹複雜於邊角)
當可選的點多分散在中腹時,也許我們就認為風險係數提高(穩定係數降低)
AlphaGo應該花更多的精神或是分支計算
※ 編輯: mathbug (180.177.12.82), 03/14/2016 17:57:10