看板 GO 關於我們 聯絡資訊
※ 引述《nanlong (懶龍)》之銘言: : ※ 引述《zkow (逍遙山水憶秋年)》之銘言: : : 圍棋世紀人機大戰李世石 vs AlphaGo 第四盤 : : 張東岳點評:彌足珍貴的一場勝利【圍棋TV】 : : https://www.youtube.com/watch?v=00HP4e8e_iQ
: : 解說詳細,長達二十幾分鐘,可看看 : 看了影片及網路一些高手解說後 : 才知那手還真不是 圍棋 所說的神之一手 : , 因為對手冷靜下來想就有幾種應法都可不吃虧繼續領先 : 甚至直接讓棋局告終。 : 不過實戰結果卻有讓狗狗中風的奇效 算是另一類的 "神之一手" 哈。 : ps: 棋界的神之一手大概是說 讓所有人在事前事 後 : 怎樣想都無法抵抗的勝著妙手吧。 : 有時對手會驚訝到 "含笑九泉" ~~ 有可能這是這一代AlphaGo系統伴隨的不穩定性 請參考 我的文章 #1MvKziMw 這也是為什麼AlphaGo所有的選擇都傾向 簡明 + 高勝率 這在系統工程上不是小問題 問題的解決有可能需要讓AlphaGo加上一個穩定係數/函數 當盤面/系統的不穩定情況大增 計算方式或是記算量需要調整 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.12.82 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457917019.A.F10.html
darkseer: 等等,你上一篇文章沒有解釋為什麼會傾向簡明+高勝率呀? 03/14 09:05
Uizmp: 我個人是覺得 AG自身學習的結論, 對含有打劫的分支權重偏低 03/14 09:32
Uizmp: 有可能是樣本不夠多, 有可能是多重劫的分支很難有效展開 03/14 09:34
Uizmp: 因此都會採取避免打劫的的方式進行 03/14 09:34
darkseer: 不過這樣子會不會反而輕忽對手可以導入打劫的下子? 03/14 09:37
darkseer: 純粹討論AI,如果AlphaGo自己覺得打劫很不好,那應該同 03/14 09:38
darkseer: 時會輕忽李九段可以導入打劫的棋手,但看了職業講解不像 03/14 09:39
Uizmp: 很有可能,前三盤要不就是成功避開,要不就是打劫影響不夠大 03/14 09:39
darkseer: 因為我聽講解好像是說,李九段本來有機會打劫,但AG規避 03/14 09:41
darkseer: 當然像你說的,只有三盤本來我這樣想就很容易有盲點XD 03/14 09:42
Uizmp: 不太懂你上面兩段說的, 輕忽導入打劫的棋手 vs AG規避 03/14 09:44
Uizmp: 這兩件事情不一樣嗎? 我的意思是AG對往打劫的分支權重較低 03/14 09:44
darkseer: 噢sorry,我是說,單論他們paper內容,搜尋樹對黑白對稱 03/14 09:45
darkseer: 所以如果覺得黑主動挑起劫爭是壞棋,那反過來應該也會, 03/14 09:45
darkseer: 也就是會樂意製造讓對手有機會產生劫爭的棋步, 03/14 09:46
darkseer: 但前三盤轉播的看法好像與此相反,認為AG會規避劫爭 03/14 09:47
Uizmp: 我猜是自我對弈的中,不管AG執黑或白,打劫分支都會降低勝率 03/14 09:50
Uizmp: 打劫分支的展開可能會比避劫多出很多,而且勝負難料,算不完 03/14 09:52
darkseer: 黑白同時降低勝率這個我自己覺得是演算法的基本錯誤XD 03/14 09:57
Uizmp: 假設打劫雙方都討不了好,勝率50%,當時避劫AG評估將近80% 03/14 09:57
darkseer: 跟棋手不應該下出97一樣比較難相信@@ 03/14 09:57
darkseer: 那樣的話,就是要贏了不想打劫,要輸了很想打? 03/14 09:58
Uizmp: 以50%舉例, 就是說對黑方不利, 白方有利 03/14 09:58
Uizmp: 至於 97 那邊我覺得是另外一個問題 03/14 09:59
darkseer: 對不起97舉例可能不太好,譬如說93 :p 只是類比 03/14 09:59
Uizmp: 之前的棋局裡面, 好像還沒有逼到AG勝率低迷的情況 ? 03/14 09:59
darkseer: 嗯嗯,我不反對你的結論XD 03/14 10:00
darkseer: 對不起補充一下,你說的對,我主要就是因為這裡是圍棋板 03/14 10:07
Uizmp: 搞不好AG還有一個"靠北,算不完,我不要打劫"的價值評估 03/14 10:07
darkseer: 覺得應該強調『演算法的結論是AI可能在優勢時避免劫爭』 03/14 10:08
darkseer: 說不定XD 也許圍棋高手會得到這樣的結論 :p 03/14 10:08
darkseer: 但是從演算法的觀點沒有理由特別相信這樣..吧? :D 03/14 10:09
aaaba: 看你ID,應該是懂點數學,請解釋在NN這種高度非線性函數裡 03/14 10:12
aaaba: ,什麼叫穩定係數。你要說得那麼空泛,乾脆推文就可以了 03/14 10:12
可以設計類似 the Lyapunov function的東東 或是其他方式(e.g. 做一些pertubation?) (請參考 http://jacobi.math.wvu.edu/~ef/preprints/LyapNeuralNetsLNCSFormatted.pdf )
doomhydra: 學點 deep learning 再來好嗎? 一篇一篇打臉很累 03/14 10:48
※ 編輯: mathbug (180.177.12.82), 03/14/2016 15:41:48
aaaba: 抱歉,我看不出alphaGo有回授 03/14 17:35
我初步的想法是 1. 從AI系統的角度來看 有沒有辦法了解它系統係數/NN係數的穩定性? (容不容易產生bifurcations?) 2. 從棋盤上的理解來看 (e.g. 一般認為中腹複雜於邊角) 當可選的點多分散在中腹時,也許我們就認為風險係數提高(穩定係數降低) AlphaGo應該花更多的精神或是分支計算 ※ 編輯: mathbug (180.177.12.82), 03/14/2016 17:57:10