推 ztdxqa: Deep Learning 不可能學到鬼手 鬼手只能靠硬爆 也就是暴力 02/04 12:22
→ ztdxqa: 窮舉破解法 等電腦速度能算到五十步以後鬼手就會出來了 02/04 12:23
→ ztdxqa: 現在AlphaGo的演算法就是跟人一樣是靠學習的 不要把它想的 02/04 12:25
→ ztdxqa: 那麼厲害 還有我不太懂什麼叫做唯一解@@ 下圍棋還有唯一 02/04 12:26
→ ztdxqa: 解的話除了局部攻殺 我不覺得有人可以證出來 02/04 12:27
→ ztdxqa: 我覺得現階段AlphaGo不可能靠佈局贏人類 只能靠人類的失誤 02/04 12:30
→ ztdxqa: 但人是很容易算不清打勺的 02/04 12:30
→ ztdxqa: 有一點我是覺得值得討論 當AI贏了人類後 圍棋的普及是會進 02/04 12:39
→ ztdxqa: 步還是退步呢?我自己感覺是會退步 因為他的魅力對沒有接 02/04 12:41
→ ztdxqa: 觸過圍棋的人來講是減少很多的 不知道國際象棋在1997年以 02/04 12:42
→ ztdxqa: 後普及的程度有提高嗎?還是越來越少人下了? 02/04 12:42
推 aaaba: “不可能找出鬼手”,是一句不能證明的論述。人感知的鬼手 02/04 12:43
→ aaaba: 隱蔽程度高段與低段就有所不同,何況是不同參數學出的各種c 02/04 12:43
→ aaaba: nn 02/04 12:43
推 aaaba: 如果如果某些鬼手在AlphaGo認為下一手可能位置的機率值的前 02/04 12:48
→ aaaba: 二十名,算是學到了嗎? 02/04 12:48
推 ztdxqa: 如果機率是前20 然後最後應法都正確的話 就算找出鬼手沒錯 02/04 13:03
推 ddavid: 就這些完全資訊公開的棋類遊戲來說,最佳解都是被證明存在 02/04 21:32
→ ddavid: 的啊,當然最佳解可能不是唯一的 02/04 21:33
→ ddavid: 至於鬼手只能靠暴力法找這個論述你講得有點果斷,我不同意 02/04 21:34
推 ztdxqa: 我說的鬼手只能靠暴力解是以目前的演算法作為基礎的 02/05 06:00
→ ztdxqa: 以目前發展的演算法 鬼手要出來的話必須靠暴力搜索來 02/05 06:02
→ ztdxqa: "找到" (並不是學到) 當然科技進步那麼快 說不定兩年後新 02/05 06:03
→ ztdxqa: 的演算法發表出來也是有可能的 02/05 06:04
推 ztdxqa: 我是覺得以目前這個演算法就有機會打敗人類頂尖了 Google 02/05 06:10
→ ztdxqa: 並沒有想要把圍棋AI變成神 等到目前這個AI的棋力比頂尖棋 02/05 06:11
→ ztdxqa: 手強一子後這個象徵性的研究項目大概也會結束 接下來會研 02/05 06:12
→ ztdxqa: 究的可能就只剩對圍棋有興趣的 要組織二三十人有AI知識的 02/05 06:13
→ ztdxqa: 研究者是不太可能的 02/05 06:14
推 aaaba: 我認為人和機器行棋中目的都是在於“有效率的搜尋到較佳的 02/05 07:46
→ aaaba: 一手棋”。至於你所謂“學到”和“找到”到底區隔在哪?我 02/05 07:46
→ aaaba: 不是把AI當神,而是認為不必把人的“學習”當成神聖的詞彙 02/05 07:46
→ aaaba: ,套在機器上面好像就有種抗拒感。 02/05 07:46
推 ztdxqa: 我非常同意你所說的"有效率搜索到最佳的一手棋"因為這以目 02/05 10:19
→ ztdxqa: 前的狀況下(例如機器資源配置 秒數設定) 所能得到的最佳手 02/05 10:20
→ ztdxqa: 鬼手有點像是唯一一手 神之一手這樣 想要強調的是AI沒有 02/05 10:22
→ ztdxqa: 那麼強 不要把那麼神聖的任務放在他身上 02/05 10:24
→ ztdxqa: AI沒辦法達到唯一的一手是很正常的 也不要因為這樣就覺得 02/05 10:25
→ ztdxqa: 人類最終還是比較有創造性啊什麼的 然後去排斥AI 02/05 10:27
推 ztdxqa: 最近看到有些論壇把AI神格化或是妖魔化感覺都不太恰當 02/05 10:32
推 ztdxqa: 噢 我對把學習這個詞套在機器上一點也沒有抗拒感 02/05 10:40
推 ztdxqa: 我把學到跟找到兩個詞做一下區別只是區別用在AlphaGo的演 02/05 10:43
→ ztdxqa: 算法上面 以Deep Learning找到鬼手是不可能的 但如果用傳 02/05 10:45
→ ztdxqa: 統硬爆搜索的方法就有可能 但因為硬體運算速度限制 02/05 10:46
→ ztdxqa: 所以目前很難實現職業棋手所謂的鬼手吧 02/05 10:48
推 ztdxqa: 好像越講越不清楚 學到=機器學習統計得出 找到=用傳統搜索 02/05 10:53
推 ddavid: @ztdxqa 我只覺得你把AI(或說學習)的範圍過度狹義化了。 02/06 04:24
推 ddavid: 然後再說一次,你認為學不到鬼手,這個結論太果斷了。 02/06 04:26
→ ddavid: 先不提我前面有提過確實有研究就是針對找出稀少有意義的 02/06 04:27
→ ddavid: Pattern(雖然目前應該是並沒有圍棋的AI在使用,這比較常 02/06 04:28
→ ddavid: 見於Frequent Pattern一系) 02/06 04:28
→ ddavid: 我只要把學習的條件改為「越稀少但是有贏過」的下法,就能 02/06 04:30
→ ddavid: 學到一大堆鬼手了。雖然相對地也會學到一大堆垃圾下法,導 02/06 04:30
→ ddavid: 致這個AI整體來說可能很爛,但我要表明的是「現在的學習方 02/06 04:31
→ ddavid: 法一定學不到鬼手」這個結論是不正確的 02/06 04:31
→ ddavid: 而當中如果有針對性的設計,因為它可以用帶有亂數的自我對 02/06 04:33
→ ddavid: 局進一步學習,學出鬼手並非徹底不可能的事,只是我強調「 02/06 04:34
→ ddavid: 這是需要一些額外特別設計來支援」,它必須撥出一個比例的 02/06 04:35
→ ddavid: 運算資源來處理稀少著手。 02/06 04:35
→ ddavid: 然後「AI沒辦法達到唯一的一手是很正常的」這句話也很詭異 02/06 04:36
→ ddavid: 就是了,因為就現在而言AI算不清的公開資訊棋類,人類也都 02/06 04:38
→ ddavid: 算不清XD 02/06 04:38
推 ddavid: 但很多人類也算得清的棋類,AI一樣都能學到唯一必勝的下法 02/06 04:45
推 ztdxqa: 恕我見識淺薄 我確實沒聽過 frequent pattern這類型的演算 02/06 14:21
→ ztdxqa: 法(跟naive bayse類似?)所以也不清楚發展到哪裡 如果他能 02/06 14:23
→ ztdxqa: 用在圍棋AI上且能確實學到鬼手會是很大的突破 那這可能會 02/06 14:24
→ ztdxqa: 是繼Deep Learaning RL又一大進步吧 02/06 14:25
→ ztdxqa: 不過以目前 我所知道已發表的演算法(蒙地卡羅搜索CNN RL) 02/06 14:27
→ ztdxqa: 我實在看不出要怎麼學到職業棋士所認為的鬼手 大頭鬼這種 02/06 14:29
→ ztdxqa: 常用的當然是學得出來 02/06 14:30
推 ztdxqa: 處理稀少數據確實是學界一直在努力奮鬥的目標 但目前似乎 02/06 14:40
→ ztdxqa: 沒有一個很有效且通用的法(就我所知) 找到鬼手這種機率很 02/06 14:41
→ ztdxqa: 小 可能一百場職業棋譜也找不出一手的數據量 我覺得很不太 02/06 14:43
→ ztdxqa: 容易辦得到 尤其是以機器學習這種方法來實現 02/06 14:46
→ ztdxqa: 至於你說人類算得清機器也算得清唯一必勝的下法 我覺得他 02/06 14:49
→ ztdxqa: 用的算法一定是brute force 圍棋跟棋類相比 就是以目前的 02/06 14:51
→ ztdxqa: 圍棋跟其他棋類相比 就是以目前的硬體效能 還不能用暴力法 02/06 14:53
→ ztdxqa: 不能說國際象棋可以找出唯一解 圍棋就可以 又如果人類都算 02/06 14:54
→ ztdxqa: 不清 你又如何評斷電腦算得清呢?(暴力解法除外) 所以我認 02/06 14:56
→ ztdxqa: 為這是假議題. 02/06 14:57
→ ztdxqa: 電腦贏人類 應該是不需要鬼手就可以贏了(最多三年吧@@) 02/06 15:00
→ aaaba: 你的brute force到底是多brute?難道涉及到樹的搜尋都被你 02/06 15:52
→ aaaba: 歸類為brute force?那人找出鬼手時如果用上一手手排除的尋 02/06 15:52
→ aaaba: 找,也要被你認為是brute force?好吧!那你對了,deep lea 02/06 15:52
→ aaaba: rning 的確不是用來取代搜尋而是輔助搜尋,不用樹的搜尋而 02/06 15:52
→ aaaba: 解類似賽局概念的問題我還沒想過有這種可能性,無論是人或 02/06 15:52
→ aaaba: 機器。 02/06 15:52
推 ddavid: 你說的學不到鬼手其實是建立在一個前提上,就是不能為了學 02/07 00:25
→ ddavid: 鬼手而多學垃圾手拖累棋力。這叫是不為也,非不能也。 02/07 00:26
→ ddavid: 然後我還是要說你沒有搞清楚你講出「AI沒辦法達到唯一的一 02/07 00:27
→ ddavid: 手是很正常的」這句話到底有多不嚴謹XD 02/07 00:28
→ ddavid: 我並沒有否定「現在的AI,很難在圍棋上得到絕對最佳解」, 02/07 00:30
推 ddavid: 當人類跟AI都算不清時,你講那句話根本沒有論證任何高下的 02/07 00:33
→ ddavid: 效果,特別是你句子還沒有指定圍棋XD 02/07 00:33
→ ddavid: 然後鬼手也跟最佳著手一點關係也沒有,反而跟人類的思考比 02/07 00:34
→ ddavid: 較有關,鬼手並不一定要是最佳著手,只要對人類來說是出乎 02/07 00:36
→ ddavid: 意料,導致後續取得利益就可稱之,而要學到這種著手只要調 02/07 00:39
→ ddavid: 整評估方式就有機會將之納入,只不過會同時也學到很多垃圾 02/07 00:40
→ ddavid: 手而已,並非學不到。 02/07 00:40
推 ddavid: 鬼手被算清後,它就可能會變成標準的妙著或其實是應對得當 02/07 00:43
→ ddavid: 就沒那麼好的下法,而相對於人類使用大量研究來證實這些東 02/07 00:44
→ ddavid: 西,AI也可以利用大量帶隨機性的模擬對局來進行「研究」, 02/07 00:45
→ ddavid: 這其中唯一的問題就在於鬼手的稀少有可能導致AI一開始就沒 02/07 00:45
→ ddavid: 有打算把它列入需要花運算資源去驗證的範圍內。因此,只要 02/07 00:46
→ ddavid: 這邊做些設計,讓鬼手有可能進入被模擬對局驗證的範圍即可 02/07 00:48
→ ddavid: 。當然如上面一直強調的,危險性就在可能讓很多垃圾下法也 02/07 00:49
→ ddavid: 進去搶奪運算資源,甚至劣幣驅逐良幣,這跟灌進大量低棋棋 02/07 00:50
→ ddavid: 譜結果越學越差是某程度上相似的狀況。 02/07 00:51
推 ddavid: 賽局理論的話,事實上解賽局理論更需要窮舉,因為需要得到 02/07 00:56
→ ddavid: 完整的pay-off table......XD 02/07 00:57
推 ddavid: 而且事實上賽局理論的分析在某些情況還是會使用樹狀展開處 02/07 01:01
→ ddavid: 理的,不管用樹狀或矩陣式,目標都是窮舉所有選擇對雙方的 02/07 01:05
→ ddavid: 價值 02/07 01:05