Re: [影片] 張東岳解說李世石獲勝第四盤

作者mathbug (天堂的定義)

看板GO

標題Re: [影片] 張東岳解說李世石獲勝第四盤

時間Mon Mar 14 08:56:56 2016

※ 引述《nanlong (懶龍)》之銘言： : ※ 引述《zkow (逍遙山水憶秋年)》之銘言： : : 圍棋世紀人機大戰李世石 vs AlphaGo 第四盤 : : 張東岳點評：彌足珍貴的一場勝利【圍棋TV】 : : https://www.youtube.com/watch?v=00HP4e8e_iQ

: : 解說詳細，長達二十幾分鐘，可看看 : 看了影片及網路一些高手解說後 : 才知那手還真不是圍棋所說的神之一手 : , 因為對手冷靜下來想就有幾種應法都可不吃虧繼續領先 : 甚至直接讓棋局告終。 : 不過實戰結果卻有讓狗狗中風的奇效算是另一類的 "神之一手" 哈。 : ps: 棋界的神之一手大概是說讓所有人在事前事後 : 怎樣想都無法抵抗的勝著妙手吧。 : 有時對手會驚訝到 "含笑九泉" ~~ 有可能這是這一代AlphaGo系統伴隨的不穩定性請參考我的文章 #1MvKziMw 這也是為什麼AlphaGo所有的選擇都傾向簡明 + 高勝率這在系統工程上不是小問題問題的解決有可能需要讓AlphaGo加上一個穩定係數/函數當盤面/系統的不穩定情況大增計算方式或是記算量需要調整 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.12.82 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1457917019.A.F10.html

→ darkseer: 等等，你上一篇文章沒有解釋為什麼會傾向簡明+高勝率呀? 03/14 09:05

→ Uizmp: 我個人是覺得 AG自身學習的結論, 對含有打劫的分支權重偏低 03/14 09:32

→ Uizmp: 有可能是樣本不夠多, 有可能是多重劫的分支很難有效展開 03/14 09:34

→ Uizmp: 因此都會採取避免打劫的的方式進行 03/14 09:34

→ darkseer: 不過這樣子會不會反而輕忽對手可以導入打劫的下子? 03/14 09:37

→ darkseer: 純粹討論AI，如果AlphaGo自己覺得打劫很不好，那應該同 03/14 09:38

→ darkseer: 時會輕忽李九段可以導入打劫的棋手，但看了職業講解不像 03/14 09:39

→ Uizmp: 很有可能,前三盤要不就是成功避開,要不就是打劫影響不夠大 03/14 09:39

→ darkseer: 因為我聽講解好像是說，李九段本來有機會打劫，但AG規避 03/14 09:41

→ darkseer: 當然像你說的，只有三盤本來我這樣想就很容易有盲點XD 03/14 09:42

→ Uizmp: 不太懂你上面兩段說的, 輕忽導入打劫的棋手 vs AG規避 03/14 09:44

→ Uizmp: 這兩件事情不一樣嗎? 我的意思是AG對往打劫的分支權重較低 03/14 09:44

→ darkseer: 噢sorry，我是說，單論他們paper內容，搜尋樹對黑白對稱 03/14 09:45

→ darkseer: 所以如果覺得黑主動挑起劫爭是壞棋，那反過來應該也會， 03/14 09:45

→ darkseer: 也就是會樂意製造讓對手有機會產生劫爭的棋步， 03/14 09:46

→ darkseer: 但前三盤轉播的看法好像與此相反，認為AG會規避劫爭 03/14 09:47

→ Uizmp: 我猜是自我對弈的中,不管AG執黑或白,打劫分支都會降低勝率 03/14 09:50

→ Uizmp: 打劫分支的展開可能會比避劫多出很多,而且勝負難料,算不完 03/14 09:52

→ darkseer: 黑白同時降低勝率這個我自己覺得是演算法的基本錯誤XD 03/14 09:57

→ Uizmp: 假設打劫雙方都討不了好,勝率50%,當時避劫AG評估將近80% 03/14 09:57

→ darkseer: 跟棋手不應該下出97一樣比較難相信@@ 03/14 09:57

→ darkseer: 那樣的話，就是要贏了不想打劫，要輸了很想打? 03/14 09:58

→ Uizmp: 以50%舉例, 就是說對黑方不利, 白方有利 03/14 09:58

→ Uizmp: 至於 97 那邊我覺得是另外一個問題 03/14 09:59

→ darkseer: 對不起97舉例可能不太好，譬如說93 :p 只是類比 03/14 09:59

→ Uizmp: 之前的棋局裡面, 好像還沒有逼到AG勝率低迷的情況 ? 03/14 09:59

→ darkseer: 嗯嗯，我不反對你的結論XD 03/14 10:00

→ darkseer: 對不起補充一下，你說的對，我主要就是因為這裡是圍棋板 03/14 10:07

推 Uizmp: 搞不好AG還有一個"靠北,算不完,我不要打劫"的價值評估 03/14 10:07

→ darkseer: 覺得應該強調『演算法的結論是AI可能在優勢時避免劫爭』 03/14 10:08

→ darkseer: 說不定XD 也許圍棋高手會得到這樣的結論 :p 03/14 10:08

→ darkseer: 但是從演算法的觀點沒有理由特別相信這樣..吧? :D 03/14 10:09

噓 aaaba: 看你ID，應該是懂點數學，請解釋在NN這種高度非線性函數裡 03/14 10:12

→ aaaba: ，什麼叫穩定係數。你要說得那麼空泛，乾脆推文就可以了 03/14 10:12

可以設計類似 the Lyapunov function的東東或是其他方式(e.g. 做一些pertubation?) (請參考 http://jacobi.math.wvu.edu/~ef/preprints/LyapNeuralNetsLNCSFormatted.pdf )

噓 doomhydra: 學點 deep learning 再來好嗎? 一篇一篇打臉很累 03/14 10:48

※ 編輯: mathbug (180.177.12.82), 03/14/2016 15:41:48

→ aaaba: 抱歉，我看不出alphaGo有回授 03/14 17:35

我初步的想法是 1. 從AI系統的角度來看有沒有辦法了解它系統係數/NN係數的穩定性？ (容不容易產生bifurcations?) 2. 從棋盤上的理解來看 (e.g. 一般認為中腹複雜於邊角) 當可選的點多分散在中腹時，也許我們就認為風險係數提高(穩定係數降低) AlphaGo應該花更多的精神或是分支計算 ※ 編輯: mathbug (180.177.12.82), 03/14/2016 17:57:10