Re: [心得] 電腦圍棋的小常識

作者cabon (低語森林悄悄寧靜)

看板GO

標題Re: [心得] 電腦圍棋的小常識

時間Mon Feb 1 17:43:28 2016

推 staristic: 我猜應該秒殺，這些名局應該是第一批餵AI的食物 02/01 11:57 → staristic: 就算不是第一批，應該也是餵過。如果答不出來…… 02/01 11:57 很難阿之前做題目都會遇到題目太大電腦跑不動的狀況就算是付費的熊貓老師也一樣哈哈推 kafai: 餵過跟TRAIN起來是兩回事，偶發的鬼手可能當NOISE進不去 02/01 13:07 推 coldmilk: 我不行啦，身體太多毛病，已經不寫圍棋程式了。還有Cold 02/01 13:16 → coldmilk: milk根本比不上Zen，倒是交大吳毅成老師的團隊開發的CGI 02/01 13:16 → coldmilk: 最近棋力突飛猛進，我看很有可能已經有KGS 6D水準了 02/01 13:16 喔喔這訊息就沒跟上那這次如果有去溫哥華的話再來學學推 aaaba: 這個問題太有趣了。因為機器學習講究的是學到普遍性的原則 02/01 13:19 → aaaba: ，而非記憶各種特殊解，所以這個問題就得看這些鬼手發生當 02/01 13:19 → aaaba: 時的盤面會不會透過類神經網路映射到一個容易發現鬼手的特 02/01 13:19 → aaaba: 殊空間(而不是人類直觀看到的361維空間)。如果可以，表示Al 02/01 13:19 → aaaba: phaGo的普遍性原則萃取得非常之好，很神。 02/01 13:19 → nanlong: 有時鬼手妙手是因非理性或失衡造成某種局面而爆發出來的. 02/01 14:02 → nanlong: 人比較會這樣..電腦很理性我就不知會不會這樣會爆。 02/01 14:03 → nanlong: 有時雙方無錯著還挺無聊的-看起伏落差大的對局有趣點。 02/01 14:05 我以為圍棋的美麗就是這些層出不窮的鬼手跟妙手阿這不也是實力展現的一部分另外藤澤跟加藤的對局如果那一手是唯一解那理論上電腦就該跑得出來這位置這也是個很好的測試阿 http://imgur.com/FljPwS6 不然遇到這個狀態下的李世石要贏還真是很辛苦.... 白68右下角托大部分的人跟電腦應該都會覺得這只能跟著應... 手拔中央尖一個實在太強 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.163.41.35 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1454319812.A.6BE.html

推 ztdxqa: Deep Learning 不可能學到鬼手鬼手只能靠硬爆也就是暴力 02/04 12:22

→ ztdxqa: 窮舉破解法等電腦速度能算到五十步以後鬼手就會出來了 02/04 12:23

→ ztdxqa: 現在AlphaGo的演算法就是跟人一樣是靠學習的不要把它想的 02/04 12:25

→ ztdxqa: 那麼厲害還有我不太懂什麼叫做唯一解＠＠下圍棋還有唯一 02/04 12:26

→ ztdxqa: 解的話除了局部攻殺我不覺得有人可以證出來 02/04 12:27

→ ztdxqa: 我覺得現階段AlphaGo不可能靠佈局贏人類只能靠人類的失誤 02/04 12:30

→ ztdxqa: 但人是很容易算不清打勺的 02/04 12:30

→ ztdxqa: 有一點我是覺得值得討論當AI贏了人類後圍棋的普及是會進 02/04 12:39

→ ztdxqa: 步還是退步呢？我自己感覺是會退步因為他的魅力對沒有接 02/04 12:41

→ ztdxqa: 觸過圍棋的人來講是減少很多的不知道國際象棋在1997年以 02/04 12:42

→ ztdxqa: 後普及的程度有提高嗎？還是越來越少人下了？ 02/04 12:42

推 aaaba: “不可能找出鬼手”，是一句不能證明的論述。人感知的鬼手 02/04 12:43

→ aaaba: 隱蔽程度高段與低段就有所不同，何況是不同參數學出的各種c 02/04 12:43

→ aaaba: nn 02/04 12:43

推 aaaba: 如果如果某些鬼手在AlphaGo認為下一手可能位置的機率值的前 02/04 12:48

→ aaaba: 二十名，算是學到了嗎？ 02/04 12:48

推 ztdxqa: 如果機率是前20 然後最後應法都正確的話就算找出鬼手沒錯 02/04 13:03

推 ddavid: 就這些完全資訊公開的棋類遊戲來說，最佳解都是被證明存在 02/04 21:32

→ ddavid: 的啊，當然最佳解可能不是唯一的 02/04 21:33

→ ddavid: 至於鬼手只能靠暴力法找這個論述你講得有點果斷，我不同意 02/04 21:34

推 ztdxqa: 我說的鬼手只能靠暴力解是以目前的演算法作為基礎的 02/05 06:00

→ ztdxqa: 以目前發展的演算法鬼手要出來的話必須靠暴力搜索來 02/05 06:02

→ ztdxqa: "找到" (並不是學到) 當然科技進步那麼快說不定兩年後新 02/05 06:03

→ ztdxqa: 的演算法發表出來也是有可能的 02/05 06:04

推 ztdxqa: 我是覺得以目前這個演算法就有機會打敗人類頂尖了 Google 02/05 06:10

→ ztdxqa: 並沒有想要把圍棋AI變成神等到目前這個AI的棋力比頂尖棋 02/05 06:11

→ ztdxqa: 手強一子後這個象徵性的研究項目大概也會結束接下來會研 02/05 06:12

→ ztdxqa: 究的可能就只剩對圍棋有興趣的要組織二三十人有AI知識的 02/05 06:13

→ ztdxqa: 研究者是不太可能的 02/05 06:14

推 aaaba: 我認為人和機器行棋中目的都是在於“有效率的搜尋到較佳的 02/05 07:46

→ aaaba: 一手棋”。至於你所謂“學到”和“找到”到底區隔在哪？我 02/05 07:46

→ aaaba: 不是把AI當神，而是認為不必把人的“學習”當成神聖的詞彙 02/05 07:46

→ aaaba: ，套在機器上面好像就有種抗拒感。 02/05 07:46

推 ztdxqa: 我非常同意你所說的"有效率搜索到最佳的一手棋"因為這以目 02/05 10:19

→ ztdxqa: 前的狀況下(例如機器資源配置秒數設定) 所能得到的最佳手 02/05 10:20

→ ztdxqa: 鬼手有點像是唯一一手神之一手這樣想要強調的是AI沒有 02/05 10:22

→ ztdxqa: 那麼強不要把那麼神聖的任務放在他身上 02/05 10:24

→ ztdxqa: AI沒辦法達到唯一的一手是很正常的也不要因為這樣就覺得 02/05 10:25

→ ztdxqa: 人類最終還是比較有創造性啊什麼的然後去排斥AI 02/05 10:27

推 ztdxqa: 最近看到有些論壇把AI神格化或是妖魔化感覺都不太恰當 02/05 10:32

推 ztdxqa: 噢我對把學習這個詞套在機器上一點也沒有抗拒感 02/05 10:40

推 ztdxqa: 我把學到跟找到兩個詞做一下區別只是區別用在AlphaGo的演 02/05 10:43

→ ztdxqa: 算法上面以Deep Learning找到鬼手是不可能的但如果用傳 02/05 10:45

→ ztdxqa: 統硬爆搜索的方法就有可能但因為硬體運算速度限制 02/05 10:46

→ ztdxqa: 所以目前很難實現職業棋手所謂的鬼手吧 02/05 10:48

推 ztdxqa: 好像越講越不清楚學到=機器學習統計得出找到=用傳統搜索 02/05 10:53

推 ddavid: @ztdxqa 我只覺得你把AI（或說學習）的範圍過度狹義化了。 02/06 04:24

推 ddavid: 然後再說一次，你認為學不到鬼手，這個結論太果斷了。 02/06 04:26

→ ddavid: 先不提我前面有提過確實有研究就是針對找出稀少有意義的 02/06 04:27

→ ddavid: Pattern（雖然目前應該是並沒有圍棋的AI在使用，這比較常 02/06 04:28

→ ddavid: 見於Frequent Pattern一系） 02/06 04:28

→ ddavid: 我只要把學習的條件改為「越稀少但是有贏過」的下法，就能 02/06 04:30

→ ddavid: 學到一大堆鬼手了。雖然相對地也會學到一大堆垃圾下法，導 02/06 04:30

→ ddavid: 致這個AI整體來說可能很爛，但我要表明的是「現在的學習方 02/06 04:31

→ ddavid: 法一定學不到鬼手」這個結論是不正確的 02/06 04:31

→ ddavid: 而當中如果有針對性的設計，因為它可以用帶有亂數的自我對 02/06 04:33

→ ddavid: 局進一步學習，學出鬼手並非徹底不可能的事，只是我強調「 02/06 04:34

→ ddavid: 這是需要一些額外特別設計來支援」，它必須撥出一個比例的 02/06 04:35

→ ddavid: 運算資源來處理稀少著手。 02/06 04:35

→ ddavid: 然後「AI沒辦法達到唯一的一手是很正常的」這句話也很詭異 02/06 04:36

→ ddavid: 就是了，因為就現在而言AI算不清的公開資訊棋類，人類也都 02/06 04:38

→ ddavid: 算不清XD 02/06 04:38

推 ddavid: 但很多人類也算得清的棋類，AI一樣都能學到唯一必勝的下法 02/06 04:45

推 ztdxqa: 恕我見識淺薄我確實沒聽過 frequent pattern這類型的演算 02/06 14:21

→ ztdxqa: 法(跟naive bayse類似？)所以也不清楚發展到哪裡如果他能 02/06 14:23

→ ztdxqa: 用在圍棋AI上且能確實學到鬼手會是很大的突破那這可能會 02/06 14:24

→ ztdxqa: 是繼Deep Learaning RL又一大進步吧 02/06 14:25

→ ztdxqa: 不過以目前我所知道已發表的演算法(蒙地卡羅搜索CNN RL) 02/06 14:27

→ ztdxqa: 我實在看不出要怎麼學到職業棋士所認為的鬼手大頭鬼這種 02/06 14:29

→ ztdxqa: 常用的當然是學得出來 02/06 14:30

推 ztdxqa: 處理稀少數據確實是學界一直在努力奮鬥的目標但目前似乎 02/06 14:40

→ ztdxqa: 沒有一個很有效且通用的法(就我所知) 找到鬼手這種機率很 02/06 14:41

→ ztdxqa: 小可能一百場職業棋譜也找不出一手的數據量我覺得很不太 02/06 14:43

→ ztdxqa: 容易辦得到尤其是以機器學習這種方法來實現 02/06 14:46

→ ztdxqa: 至於你說人類算得清機器也算得清唯一必勝的下法我覺得他 02/06 14:49

→ ztdxqa: 用的算法一定是brute force 圍棋跟棋類相比就是以目前的 02/06 14:51

→ ztdxqa: 圍棋跟其他棋類相比就是以目前的硬體效能還不能用暴力法 02/06 14:53

→ ztdxqa: 不能說國際象棋可以找出唯一解圍棋就可以又如果人類都算 02/06 14:54

→ ztdxqa: 不清你又如何評斷電腦算得清呢?(暴力解法除外) 所以我認 02/06 14:56

→ ztdxqa: 為這是假議題. 02/06 14:57

→ ztdxqa: 電腦贏人類應該是不需要鬼手就可以贏了(最多三年吧@@) 02/06 15:00

→ aaaba: 你的brute force到底是多brute？難道涉及到樹的搜尋都被你 02/06 15:52

→ aaaba: 歸類為brute force？那人找出鬼手時如果用上一手手排除的尋 02/06 15:52

→ aaaba: 找，也要被你認為是brute force？好吧！那你對了，deep lea 02/06 15:52

→ aaaba: rning 的確不是用來取代搜尋而是輔助搜尋，不用樹的搜尋而 02/06 15:52

→ aaaba: 解類似賽局概念的問題我還沒想過有這種可能性，無論是人或 02/06 15:52

→ aaaba: 機器。 02/06 15:52

推 ddavid: 你說的學不到鬼手其實是建立在一個前提上，就是不能為了學 02/07 00:25

→ ddavid: 鬼手而多學垃圾手拖累棋力。這叫是不為也，非不能也。 02/07 00:26

→ ddavid: 然後我還是要說你沒有搞清楚你講出「AI沒辦法達到唯一的一 02/07 00:27

→ ddavid: 手是很正常的」這句話到底有多不嚴謹XD 02/07 00:28

→ ddavid: 我並沒有否定「現在的AI，很難在圍棋上得到絕對最佳解」， 02/07 00:30

推 ddavid: 當人類跟AI都算不清時，你講那句話根本沒有論證任何高下的 02/07 00:33

→ ddavid: 效果，特別是你句子還沒有指定圍棋XD 02/07 00:33

→ ddavid: 然後鬼手也跟最佳著手一點關係也沒有，反而跟人類的思考比 02/07 00:34

→ ddavid: 較有關，鬼手並不一定要是最佳著手，只要對人類來說是出乎 02/07 00:36

→ ddavid: 意料，導致後續取得利益就可稱之，而要學到這種著手只要調 02/07 00:39

→ ddavid: 整評估方式就有機會將之納入，只不過會同時也學到很多垃圾 02/07 00:40

→ ddavid: 手而已，並非學不到。 02/07 00:40

推 ddavid: 鬼手被算清後，它就可能會變成標準的妙著或其實是應對得當 02/07 00:43

→ ddavid: 就沒那麼好的下法，而相對於人類使用大量研究來證實這些東 02/07 00:44

→ ddavid: 西，AI也可以利用大量帶隨機性的模擬對局來進行「研究」， 02/07 00:45

→ ddavid: 這其中唯一的問題就在於鬼手的稀少有可能導致AI一開始就沒 02/07 00:45

→ ddavid: 有打算把它列入需要花運算資源去驗證的範圍內。因此，只要 02/07 00:46

→ ddavid: 這邊做些設計，讓鬼手有可能進入被模擬對局驗證的範圍即可 02/07 00:48

→ ddavid: 。當然如上面一直強調的，危險性就在可能讓很多垃圾下法也 02/07 00:49

→ ddavid: 進去搶奪運算資源，甚至劣幣驅逐良幣，這跟灌進大量低棋棋 02/07 00:50

→ ddavid: 譜結果越學越差是某程度上相似的狀況。 02/07 00:51

推 ddavid: 賽局理論的話，事實上解賽局理論更需要窮舉，因為需要得到 02/07 00:56

→ ddavid: 完整的pay-off table......XD 02/07 00:57

推 ddavid: 而且事實上賽局理論的分析在某些情況還是會使用樹狀展開處 02/07 01:01

→ ddavid: 理的，不管用樹狀或矩陣式，目標都是窮舉所有選擇對雙方的 02/07 01:05

→ ddavid: 價值 02/07 01:05