看板 GO 關於我們 聯絡資訊
推 staristic: 我猜應該秒殺,這些名局應該是第一批餵AI的食物 02/01 11:57 → staristic: 就算不是第一批,應該也是餵過。如果答不出來…… 02/01 11:57 很難阿 之前做題目都會遇到 題目太大電腦跑不動的狀況 就算是付費的熊貓老師也一樣 哈哈 推 kafai: 餵過跟TRAIN起來是兩回事,偶發的鬼手可能當NOISE進不去 02/01 13:07 推 coldmilk: 我不行啦,身體太多毛病,已經不寫圍棋程式了。還有Cold 02/01 13:16 → coldmilk: milk根本比不上Zen,倒是交大吳毅成老師的團隊開發的CGI 02/01 13:16 → coldmilk: 最近棋力突飛猛進,我看很有可能已經有KGS 6D水準了 02/01 13:16 喔喔 這訊息就沒跟上 那這次如果有去溫哥華的話 再來學學 推 aaaba: 這個問題太有趣了。因為機器學習講究的是學到普遍性的原則 02/01 13:19 → aaaba: ,而非記憶各種特殊解,所以這個問題就得看這些鬼手發生當 02/01 13:19 → aaaba: 時的盤面會不會透過類神經網路映射到一個容易發現鬼手的特 02/01 13:19 → aaaba: 殊空間(而不是人類直觀看到的361維空間)。如果可以,表示Al 02/01 13:19 → aaaba: phaGo的普遍性原則萃取得非常之好,很神。 02/01 13:19 → nanlong: 有時鬼手妙手是因非理性或失衡造成某種局面而爆發出來的. 02/01 14:02 → nanlong: 人比較會這樣..電腦很理性我就不知會不會這樣會爆。 02/01 14:03 → nanlong: 有時雙方無錯著還挺無聊的-看起伏落差大的對局有趣點。 02/01 14:05 我以為圍棋的美麗就是這些層出不窮的鬼手跟妙手阿 這不也是實力展現的一部分 另外藤澤跟加藤的對局 如果那一手是唯一解 那理論上電腦就該跑得出來這位置 這也是個很好的測試阿 http://imgur.com/FljPwS6 不然遇到這個狀態下的李世石要贏還真是很辛苦.... 白68右下角托 大部分的人跟電腦應該都會覺得這只能跟著應... 手拔中央尖一個實在太強 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.163.41.35 ※ 文章網址: https://www.ptt.cc/bbs/GO/M.1454319812.A.6BE.html
ztdxqa: Deep Learning 不可能學到鬼手 鬼手只能靠硬爆 也就是暴力 02/04 12:22
ztdxqa: 窮舉破解法 等電腦速度能算到五十步以後鬼手就會出來了 02/04 12:23
ztdxqa: 現在AlphaGo的演算法就是跟人一樣是靠學習的 不要把它想的 02/04 12:25
ztdxqa: 那麼厲害 還有我不太懂什麼叫做唯一解@@ 下圍棋還有唯一 02/04 12:26
ztdxqa: 解的話除了局部攻殺 我不覺得有人可以證出來 02/04 12:27
ztdxqa: 我覺得現階段AlphaGo不可能靠佈局贏人類 只能靠人類的失誤 02/04 12:30
ztdxqa: 但人是很容易算不清打勺的 02/04 12:30
ztdxqa: 有一點我是覺得值得討論 當AI贏了人類後 圍棋的普及是會進 02/04 12:39
ztdxqa: 步還是退步呢?我自己感覺是會退步 因為他的魅力對沒有接 02/04 12:41
ztdxqa: 觸過圍棋的人來講是減少很多的 不知道國際象棋在1997年以 02/04 12:42
ztdxqa: 後普及的程度有提高嗎?還是越來越少人下了? 02/04 12:42
aaaba: “不可能找出鬼手”,是一句不能證明的論述。人感知的鬼手 02/04 12:43
aaaba: 隱蔽程度高段與低段就有所不同,何況是不同參數學出的各種c 02/04 12:43
aaaba: nn 02/04 12:43
aaaba: 如果如果某些鬼手在AlphaGo認為下一手可能位置的機率值的前 02/04 12:48
aaaba: 二十名,算是學到了嗎? 02/04 12:48
ztdxqa: 如果機率是前20 然後最後應法都正確的話 就算找出鬼手沒錯 02/04 13:03
ddavid: 就這些完全資訊公開的棋類遊戲來說,最佳解都是被證明存在 02/04 21:32
ddavid: 的啊,當然最佳解可能不是唯一的 02/04 21:33
ddavid: 至於鬼手只能靠暴力法找這個論述你講得有點果斷,我不同意 02/04 21:34
ztdxqa: 我說的鬼手只能靠暴力解是以目前的演算法作為基礎的 02/05 06:00
ztdxqa: 以目前發展的演算法 鬼手要出來的話必須靠暴力搜索來 02/05 06:02
ztdxqa: "找到" (並不是學到) 當然科技進步那麼快 說不定兩年後新 02/05 06:03
ztdxqa: 的演算法發表出來也是有可能的 02/05 06:04
ztdxqa: 我是覺得以目前這個演算法就有機會打敗人類頂尖了 Google 02/05 06:10
ztdxqa: 並沒有想要把圍棋AI變成神 等到目前這個AI的棋力比頂尖棋 02/05 06:11
ztdxqa: 手強一子後這個象徵性的研究項目大概也會結束 接下來會研 02/05 06:12
ztdxqa: 究的可能就只剩對圍棋有興趣的 要組織二三十人有AI知識的 02/05 06:13
ztdxqa: 研究者是不太可能的 02/05 06:14
aaaba: 我認為人和機器行棋中目的都是在於“有效率的搜尋到較佳的 02/05 07:46
aaaba: 一手棋”。至於你所謂“學到”和“找到”到底區隔在哪?我 02/05 07:46
aaaba: 不是把AI當神,而是認為不必把人的“學習”當成神聖的詞彙 02/05 07:46
aaaba: ,套在機器上面好像就有種抗拒感。 02/05 07:46
ztdxqa: 我非常同意你所說的"有效率搜索到最佳的一手棋"因為這以目 02/05 10:19
ztdxqa: 前的狀況下(例如機器資源配置 秒數設定) 所能得到的最佳手 02/05 10:20
ztdxqa: 鬼手有點像是唯一一手 神之一手這樣 想要強調的是AI沒有 02/05 10:22
ztdxqa: 那麼強 不要把那麼神聖的任務放在他身上 02/05 10:24
ztdxqa: AI沒辦法達到唯一的一手是很正常的 也不要因為這樣就覺得 02/05 10:25
ztdxqa: 人類最終還是比較有創造性啊什麼的 然後去排斥AI 02/05 10:27
ztdxqa: 最近看到有些論壇把AI神格化或是妖魔化感覺都不太恰當 02/05 10:32
ztdxqa: 噢 我對把學習這個詞套在機器上一點也沒有抗拒感 02/05 10:40
ztdxqa: 我把學到跟找到兩個詞做一下區別只是區別用在AlphaGo的演 02/05 10:43
ztdxqa: 算法上面 以Deep Learning找到鬼手是不可能的 但如果用傳 02/05 10:45
ztdxqa: 統硬爆搜索的方法就有可能 但因為硬體運算速度限制 02/05 10:46
ztdxqa: 所以目前很難實現職業棋手所謂的鬼手吧 02/05 10:48
ztdxqa: 好像越講越不清楚 學到=機器學習統計得出 找到=用傳統搜索 02/05 10:53
ddavid: @ztdxqa 我只覺得你把AI(或說學習)的範圍過度狹義化了。 02/06 04:24
ddavid: 然後再說一次,你認為學不到鬼手,這個結論太果斷了。 02/06 04:26
ddavid: 先不提我前面有提過確實有研究就是針對找出稀少有意義的 02/06 04:27
ddavid: Pattern(雖然目前應該是並沒有圍棋的AI在使用,這比較常 02/06 04:28
ddavid: 見於Frequent Pattern一系) 02/06 04:28
ddavid: 我只要把學習的條件改為「越稀少但是有贏過」的下法,就能 02/06 04:30
ddavid: 學到一大堆鬼手了。雖然相對地也會學到一大堆垃圾下法,導 02/06 04:30
ddavid: 致這個AI整體來說可能很爛,但我要表明的是「現在的學習方 02/06 04:31
ddavid: 法一定學不到鬼手」這個結論是不正確的 02/06 04:31
ddavid: 而當中如果有針對性的設計,因為它可以用帶有亂數的自我對 02/06 04:33
ddavid: 局進一步學習,學出鬼手並非徹底不可能的事,只是我強調「 02/06 04:34
ddavid: 這是需要一些額外特別設計來支援」,它必須撥出一個比例的 02/06 04:35
ddavid: 運算資源來處理稀少著手。 02/06 04:35
ddavid: 然後「AI沒辦法達到唯一的一手是很正常的」這句話也很詭異 02/06 04:36
ddavid: 就是了,因為就現在而言AI算不清的公開資訊棋類,人類也都 02/06 04:38
ddavid: 算不清XD 02/06 04:38
ddavid: 但很多人類也算得清的棋類,AI一樣都能學到唯一必勝的下法 02/06 04:45
ztdxqa: 恕我見識淺薄 我確實沒聽過 frequent pattern這類型的演算 02/06 14:21
ztdxqa: 法(跟naive bayse類似?)所以也不清楚發展到哪裡 如果他能 02/06 14:23
ztdxqa: 用在圍棋AI上且能確實學到鬼手會是很大的突破 那這可能會 02/06 14:24
ztdxqa: 是繼Deep Learaning RL又一大進步吧 02/06 14:25
ztdxqa: 不過以目前 我所知道已發表的演算法(蒙地卡羅搜索CNN RL) 02/06 14:27
ztdxqa: 我實在看不出要怎麼學到職業棋士所認為的鬼手 大頭鬼這種 02/06 14:29
ztdxqa: 常用的當然是學得出來 02/06 14:30
ztdxqa: 處理稀少數據確實是學界一直在努力奮鬥的目標 但目前似乎 02/06 14:40
ztdxqa: 沒有一個很有效且通用的法(就我所知) 找到鬼手這種機率很 02/06 14:41
ztdxqa: 小 可能一百場職業棋譜也找不出一手的數據量 我覺得很不太 02/06 14:43
ztdxqa: 容易辦得到 尤其是以機器學習這種方法來實現 02/06 14:46
ztdxqa: 至於你說人類算得清機器也算得清唯一必勝的下法 我覺得他 02/06 14:49
ztdxqa: 用的算法一定是brute force 圍棋跟棋類相比 就是以目前的 02/06 14:51
ztdxqa: 圍棋跟其他棋類相比 就是以目前的硬體效能 還不能用暴力法 02/06 14:53
ztdxqa: 不能說國際象棋可以找出唯一解 圍棋就可以 又如果人類都算 02/06 14:54
ztdxqa: 不清 你又如何評斷電腦算得清呢?(暴力解法除外) 所以我認 02/06 14:56
ztdxqa: 為這是假議題. 02/06 14:57
ztdxqa: 電腦贏人類 應該是不需要鬼手就可以贏了(最多三年吧@@) 02/06 15:00
aaaba: 你的brute force到底是多brute?難道涉及到樹的搜尋都被你 02/06 15:52
aaaba: 歸類為brute force?那人找出鬼手時如果用上一手手排除的尋 02/06 15:52
aaaba: 找,也要被你認為是brute force?好吧!那你對了,deep lea 02/06 15:52
aaaba: rning 的確不是用來取代搜尋而是輔助搜尋,不用樹的搜尋而 02/06 15:52
aaaba: 解類似賽局概念的問題我還沒想過有這種可能性,無論是人或 02/06 15:52
aaaba: 機器。 02/06 15:52
ddavid: 你說的學不到鬼手其實是建立在一個前提上,就是不能為了學 02/07 00:25
ddavid: 鬼手而多學垃圾手拖累棋力。這叫是不為也,非不能也。 02/07 00:26
ddavid: 然後我還是要說你沒有搞清楚你講出「AI沒辦法達到唯一的一 02/07 00:27
ddavid: 手是很正常的」這句話到底有多不嚴謹XD 02/07 00:28
ddavid: 我並沒有否定「現在的AI,很難在圍棋上得到絕對最佳解」, 02/07 00:30
ddavid: 當人類跟AI都算不清時,你講那句話根本沒有論證任何高下的 02/07 00:33
ddavid: 效果,特別是你句子還沒有指定圍棋XD 02/07 00:33
ddavid: 然後鬼手也跟最佳著手一點關係也沒有,反而跟人類的思考比 02/07 00:34
ddavid: 較有關,鬼手並不一定要是最佳著手,只要對人類來說是出乎 02/07 00:36
ddavid: 意料,導致後續取得利益就可稱之,而要學到這種著手只要調 02/07 00:39
ddavid: 整評估方式就有機會將之納入,只不過會同時也學到很多垃圾 02/07 00:40
ddavid: 手而已,並非學不到。 02/07 00:40
ddavid: 鬼手被算清後,它就可能會變成標準的妙著或其實是應對得當 02/07 00:43
ddavid: 就沒那麼好的下法,而相對於人類使用大量研究來證實這些東 02/07 00:44
ddavid: 西,AI也可以利用大量帶隨機性的模擬對局來進行「研究」, 02/07 00:45
ddavid: 這其中唯一的問題就在於鬼手的稀少有可能導致AI一開始就沒 02/07 00:45
ddavid: 有打算把它列入需要花運算資源去驗證的範圍內。因此,只要 02/07 00:46
ddavid: 這邊做些設計,讓鬼手有可能進入被模擬對局驗證的範圍即可 02/07 00:48
ddavid: 。當然如上面一直強調的,危險性就在可能讓很多垃圾下法也 02/07 00:49
ddavid: 進去搶奪運算資源,甚至劣幣驅逐良幣,這跟灌進大量低棋棋 02/07 00:50
ddavid: 譜結果越學越差是某程度上相似的狀況。 02/07 00:51
ddavid: 賽局理論的話,事實上解賽局理論更需要窮舉,因為需要得到 02/07 00:56
ddavid: 完整的pay-off table......XD 02/07 00:57
ddavid: 而且事實上賽局理論的分析在某些情況還是會使用樹狀展開處 02/07 01:01
ddavid: 理的,不管用樹狀或矩陣式,目標都是窮舉所有選擇對雙方的 02/07 01:05
ddavid: 價值 02/07 01:05