推 Aggro: 我想到閃電霹靂車的阿斯拉11/06 01:56
推 FallenAngelX: 只能推11/06 01:58
ptt+的發文系統也太爛了吧,排版都亂了
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:07:29
推 twosheep0603: 我覺得今天會這樣混淆應該是AI這個詞太過泛濫11/06 02:03
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:11:18
推 Aksky: 我倒是想看DeepMind被人換家會有啥反映,說不定挺有趣的XD 11/06 02:08
推 fosa: AlphaGO被搞怎麼會哭呢...就是一場敗場把過程輸入資料庫而已11/06 02:09
光是李世石一步就讓他幾近崩潰,星海能讓他崩潰的可能性,高多了
推 GOBS: 我覺得阿法狗玩星海應該很快就學會"偵查"的重要性了11/06 02:10
但是偵查這種東西需要付出很多代價(飛王蟲、先知都要錢),有些時候過於謹慎反而會
被對手利用,星海就是一個這麼複雜的遊戲
而且有時候快攻甚至沒辦法偵查
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:14:01
→ GOBS: 在資訊越多的情況下它就可以付出越少的運算空間再推斷對方11/06 02:11
→ GOBS: 的行為 而且它的學習系統包括模仿對局 只要多看一點高端場11/06 02:12
→ GOBS: 應該就知道一些偵查的時間點 像是第一支王蟲 何時出OB之類的11/06 02:12
這兩個都沒辦法「完美」
例如:王蟲看不到極限一波、神族走VR可能被先知燒爆、走VC怕影刀
推 w60904max: 圍棋還有思考時間 這真的一大挑戰11/06 02:13
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:16:30
推 GOBS: ...你要這樣說講得好像人類玩的時候不需要花資源偵查11/06 02:15
→ GOBS: 當電腦意識到這樣的偵查是必要時它就會跟著做了11/06 02:16
如果是搞人的那方(例如Has)他根本不偵查的,光砲蓋臉上給他客氣?
甚至做假建築、炸建築來誤導的都很多
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:17:48
→ Aksky: 偵查還要考慮對手的戰術欺騙,不可能每場都照表操課的 11/06 02:16
推 arrenwu: AlphaGO 下圍棋也沒有所謂的完美啊 11/06 02:17
→ arrenwu: 他只是在以知的範圍內找一個看起來最ok的做法而已11/06 02:17
對,但他之所以可以這樣算是因為他「知道」對手的步數,可是星海不行
例如:要知道前面有沒有埋地毒爆,除非有雷達,不然根本不會有「答案」(可是一發雷
達價值240礦,真能掃免錢?)
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:21:27
推 Sischill: 你只講到微操 那請問多線呢? 人腦在天生就沒電腦能夠快 11/06 02:18
推 kinghtt: 要AI崩潰得先確定星海的可能性分支有比圍棋多11/06 02:18
→ Sischill: 速處理大量即時資訊呀11/06 02:18
→ Sischill: 圍棋沒有多線問題 電腦有 就連職業選手有時候自己在前線11/06 02:19
→ arrenwu: 我覺得星海要處理的部分是資料的部分11/06 02:19
推 siyaoran: AlphaGO玩快棋弱很多 這真的對它是一大挑戰 11/06 02:19
→ arrenwu: 戰術選擇上我覺得星海分支可能比圍棋少11/06 02:19
→ Sischill: 微操結果家裡營運或小地圖漏看都會發生 問題是對電腦來 11/06 02:19
→ Sischill: 說會發生這種錯誤嘛? 11/06 02:19
→ kinghtt: 阿法狗在面對選擇時會走勝算最高的步數,直到對手改變11/06 02:20
→ ttt95217: 電腦打星海應該很強吧 可以微控一隊遠程兵?11/06 02:20
→ kinghtt: 策略才會再次計算可能性,星海中可以選擇穩健發展策略11/06 02:21
推 w60904max: 我想是確定敵方戰術後 就照設定的最佳解執行下去了11/06 02:22
→ kinghtt: 讓勝算維持一定程度11/06 02:22
推 arrenwu: 星海只是知道的比較少而已,當下還是有最佳的策略 11/06 02:22
→ arrenwu: 遇到前面有陷阱之後,就會有另一個策略 11/06 02:23
推 GOBS: 對抗埋地毒爆電腦會出渡鴨吧 面對隱形單位最高CP的做法 11/06 02:23
→ w60904max: 然後微操 交戰 都靠rule直接解 跟一般遊戲AI一樣11/06 02:23
→ arrenwu: 除了資料輸入之外,星海跟圍棋沒有差那麼多11/06 02:23
推 Sischill: 我想前面有埋地毒爆/雷 這跟電腦或人腦沒啥關係 都是靠 11/06 02:23
推 Curapikt: google先想辦法生出SC的演算法吧,能下圍棋是因為有對應11/06 02:24
推 twosheep0603: 玩星海算不算挑戰讓電腦解Bayesian game的平衡點啊11/06 02:24
→ kinghtt: 直到玩家被偵測到確定的一手後電腦再改變策略就好 11/06 02:24
→ Curapikt: 的演算法,不然效能再多也不構11/06 02:24
→ Sischill: 偵查探知的吧?11/06 02:24
你確定嗎?在圍棋當中AlphaGO都沒李世石快了,如果同時多線(還是隱形單位)他真的
能夠同時思考每個空投的處理方法?
而且,多線也有其弱點(TY就是常常多線風騷正門被一拳打穿)
渡鴉瓦斯很貴,你看職業賽除非到很後期不然根本不會出(目的還是要放無人防禦幾)
圍棋的戰術多寡不是重點,而是在星海沒有能計算的步伐,李世石如何騙他終究有個限度
,但星海呢?
對付HAS很多選手會派3-4隻工兵地毯式搜索,每個人都這樣搜嗎?萬一他認為不會放大招
的突然放招呢?
星海的問題在於每個戰術都有風險(而且沒辦法即時更改),這在戰場上比起圍棋來的真
實多了
事實上很多時候選手並不是什麼都靠偵查取得資訊,有時候就是第六感的賭,可是AlphaG
O知道「賭」嗎?
再來偵查也非萬能(裸三遇到快攻就是死,這偵查不到沒辦法預防)
→ twosheep0603: Deep Learning最神奇的地方就是不用找演算法11/06 02:24
→ twosheep0603: 放著讓電腦去做 他自己會找出一種演算法11/06 02:25
→ twosheep0603: Google只需要幫他搞定input跟output就好11/06 02:25
推 w60904max: 他指的是從答案 執行操作的部分吧11/06 02:26
→ w60904max: deep learing 只是幫你先整理好可能狀況 及對應答案11/06 02:27
→ w60904max: 圍棋那套 有另一個快速從model尋找最佳解的演算法11/06 02:28
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:30:30
推 arrenwu: 我是覺得只要情報一樣,加上訓練資料夠多,電腦是應該要11/06 02:28
→ arrenwu: 能夠贏過人腦的 11/06 02:28
資料可以可能才是陷阱
例如放招率超低的Zest,竟然在決勝盤下光砲,在沒辦法靠偵查預測下(探點不一定抓得
到對方)
AlphaGO能在看到工兵瞬間知道這是放招嗎?
推 twosheep0603: 人腦做的事情也一樣啊 整理情報 做對應動作11/06 02:29
→ twosheep0603: 只是deep learning把這個過程高度抽象化了11/06 02:29
→ twosheep0603: 啊其實好像不能說是抽象 對人類抽象但對數學具體11/06 02:30
推 arrenwu: 你講的第六感說穿了是職業選手經驗的累積迅速解讀11/06 02:31
不一定,放招這種事情,是經驗嗎?
那AlohaGO能預測到這個經驗嗎?
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:34:06
→ twosheep0603: 第六感的賭某種意義上跟蒙地卡羅方法是一樣的XD 11/06 02:33
→ kinghtt: 阿法狗下圍棋不是靠暴力演算破解…而是會整理可能性分支 11/06 02:33
→ kinghtt: 遊戲中的第六感就是玩家根據經驗法則歸納出的可能性 11/06 02:34
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:35:15
→ twosheep0603: 遇到經驗外的事件 人類跟電腦都一樣只能用猜的 11/06 02:35
推 arrenwu: 是啊,可以說是經驗啊,所以放招有可能取得很大成果 11/06 02:35
→ arrenwu: 但要看一個策略好不好,要看打幾千場下來的結果11/06 02:35
→ twosheep0603: 而猜的範圍就是過去所累積的經驗11/06 02:35
→ arrenwu: 這種策略本來就不會是 100% 穩贏的11/06 02:35
所以他沒辦法預測這種事情啊?這種事情毫無根據可言
如果AlphaGO根據成功率、選手資料、過往比賽經驗,都認為他不會放招
結果在沒有準備的情況下他放招了,怎麼辦?
過往戰爭失敗,幾乎都是在這種情況下輸掉的
圍棋不可能5分鐘結束,一定會把兩人的腦袋榨乾才結束
星海只要一點點失誤,五分鐘就可以結束
→ Heeida: 圍棋是輪流,算出可能性還有對應時間,星海錯了大勢已去 11/06 02:35
推 Sischill: 你講的情形不管人腦電腦差別到底在哪? 遇到那種賭招的人11/06 02:36
→ Sischill: 腦一樣會跟電腦錯亂呀11/06 02:36
沒錯 所以當AlphaGO能夠做到100%勝率的話,就代表他超越這個東西了
→ Heeida: 的情況比較多吧,能屌打人類就表示電腦學會人的狡滑了..11/06 02:36
→ twosheep0603: 電腦比人類強的優勢之一就是左右互搏幾千場是可能的11/06 02:36
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:38:44
→ twosheep0603: 也就是說所謂奇招對電腦來說可能也看過數百次11/06 02:37
→ kinghtt: 阿法狗上場前有自機對奕上千場累積經驗強化分支選擇11/06 02:37
→ twosheep0603: 至於電腦學會狡猾 也要看狡猾能不能幫助它贏11/06 02:38
→ kinghtt: 所以對人類時阿法狗會下勝率最高的步數而不是暴力破解11/06 02:39
狡猾反而會被利用,火鳳就是計中計中計中計的概念
事實上,在星海用勝率最高的步伐反而很可能會輸(正所謂小色說的:太龜、太慫)
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:41:45
→ twosheep0603: 總覺得原PO過分強調圍棋回合制與星海即時的差異了11/06 02:39
→ Heeida: 光學會狡猾這件事在AI就是大突破了,這篇的主旨也是這吧..11/06 02:40
推 arrenwu: 戰爭只有一次,但是星海可以打1000場啊11/06 02:40
→ kinghtt: 李世石比賽之後的對奕也學阿發狗走精算過的步數減少11/06 02:40
→ Heeida: 圍棋得到的情報是100%正確的,能判斷假情報就比圍棋價值高 11/06 02:41
→ kinghtt: 直覺式的下法…他也因此提高勝率 11/06 02:41
→ arrenwu: 你講的沒辦法預測對手放招,這不分人腦or電腦的 11/06 02:41
如果電腦沒辦法超越我說的「理論上不能超越」他也就只跟人類一樣而已
如果連對手所想的都算到了,那就完全超越人類了
※ 編輯: freshmints (61.227.229.224), 11/06/2016 02:43:51
推 twosheep0603: 應該說是測驗對於不完全的資訊計算的能力吧 11/06 02:42
推 Curapikt: 我指的是電腦要怎麼"思考"的演算法,之前工作上有接觸過 11/06 02:42
推 Sischill: 我覺得討論已經偏了 重點是人腦跟電腦的差異 11/06 02:42
→ kinghtt: 阿法狗對人類最大的教育就是直覺非最嘉選擇… 11/06 02:43
→ twosheep0603: 另外電腦對於勝率高的概念跟人類絕對不一樣 11/06 02:43
→ Curapikt: 自然語言學習的工具,它學習的過程並不是人去教他文法是 11/06 02:43
推 arrenwu: 預測對面會不會放招這不可能吧...根本沒有前兆啊 11/06 02:43
→ Sischill: 首先你說計中計中計中計, 電腦AI在學習時所有的replay都 11/06 02:43
→ Curapikt: 什麼,它會自己找一套方法,但是怎麼"學習"還是有演算法 11/06 02:44
→ kinghtt: 精算過的走法才是獲勝的最佳解 11/06 02:44
→ arrenwu: 他只要勝率比人類高,他就超越人類了 11/06 02:44
→ Sischill: 可以記錄下來 人腦不行, 那在策略上 人腦除非用電腦沒 11/06 02:45
推 twosheep0603: 實際上它不需要100%碾壓也能體現價值 11/06 02:45
→ arrenwu: 說穿了AI根本沒有所謂的「想到你要怎麼做」這種概念 11/06 02:45
→ Sischill: 有看過的招才能打的對手出其不意 問題是這個同樣拿去打 11/06 02:45
→ arrenwu: 他只是基於目前的資料執行最好的下一步 11/06 02:45
→ Sischill: 人腦也是一樣的下場 所以跟本上來說人腦在RTS就沒有什麼 11/06 02:46
→ kinghtt: 另外,勝率最高的步數代表輸的場次最少… 11/06 02:46
→ Sischill: 比電腦有優勢的地方了吧 11/06 02:46
→ jmss50894: 預測敵方單位從初始時間開始加機率 11/06 02:47
→ jmss50894: 像三路英雄消失沒視野 大概要進巴龍池 11/06 02:48
推 w60904max: 結果是躲在草叢 準備BD主堡 XD 11/06 02:49
→ kinghtt: 其實是起內鬨都龜溫泉放爛 11/06 02:50
→ twosheep0603: 那準備BD主堡的機率價值函數也會上升 11/06 02:50
推 w60904max: 但探巴龍的勝率比較高 所以還是選了這步 11/06 02:51
推 CactusFlower: 可是深度思考恐怖的地方就在於他學習的能力啊... 11/06 02:53
→ arthurduh1: 不會因為勝率高就固定選哪一步阿 11/06 02:53
→ bndan: 還有一個點是原文有提的 就是"即時" 如果真讓AI在人類社會 11/06 02:53
→ CactusFlower: 畢竟不是真人沒有排名壓力跟情緒 11/06 02:53
→ arthurduh1: 賽局的策略是機率性的 11/06 02:53
→ bndan: 更有貢獻 那這AI必須要能處理"即時"的事件 11/06 02:54
→ twosheep0603: 以剛剛那個探巴龍vs守家防BD的例子來說 11/06 02:54
→ twosheep0603: AI會在兩者各給出一個機率 然後靠機率做決策 11/06 02:55
推 arrenwu: DeepLearning厲害是厲害在資料夠多一定會optimal 11/06 02:55
→ twosheep0603: 但不是哪邊機率最高就選哪邊 是機率高的容易被選中 11/06 02:56
推 w60904max: 對 不過這點就跟DL無關了 11/06 02:56
→ twosheep0603: 那個比較像是蒙地卡羅方法的解釋XD 11/06 02:56
推 kmchao33: 比星海是要比加速好嗎 11/06 03:22
→ Murasaki0110: 別神話DL好嗎...解不好的問題還一堆 11/06 03:28
→ Murasaki0110: SGD一定會optimal大家也不用tune半天參數了 11/06 03:30
→ KenWang42: 這個時代 人人都能嘴出一套演算法 11/06 03:49
→ Khadgar: 這樣星海算是NP問題嗎? 11/06 04:39
推 HappyKH: 想到阿法狗的未來是戰爭用途總覺得毛毛的 11/06 05:52
推 hsiehhsing: 總算有非單細胞的人了,阿法狗要突破的就是預測的障 11/06 06:27
→ hsiehhsing: 礙 11/06 06:27
→ hsiehhsing: 而不是單單的運算勝率結果 11/06 06:28
→ hsiehhsing: 一堆人只看操作,但沒思考光有操作能贏比賽嗎 11/06 06:28
推 max199083: 不用太高估星海的決策複雜度 11/06 06:34
推 ultratimes: 電腦光散兵,人根本散不贏 人類只能一小坨拉開 11/06 07:00
→ ultratimes: 給電腦操作,可以做到一隻一隻拉 只要沒限制電腦手速 11/06 07:01
推 lugiam: 在生物界 最狡猾的就是人類 無人能出其右 11/06 07:26
推 hsiehhsing: 捧那麼高,明年去挑戰阿法狗阿,bz會放API 11/06 07:36
→ hsiehhsing: DeepMind 在 APM 上將有所限制,確保雙方的對戰是公平 11/06 07:37
→ hsiehhsing: google團隊都已經聲明了,呵呵 不知道在捧阿法狗的人 11/06 07:37
→ hsiehhsing: 有什麼想法 11/06 07:37
推 hyk32166: 覺得有操作就能贏應該沒玩過吧XD 11/06 08:13
→ w3160828: 講的好像有微操 阿法狗靠工兵能吃掉整團兵 11/06 08:22
推 orze04: 看過年初那篇論文 星海你要怎得到value network? 11/06 08:26
→ satheni: 電腦的演算法會有一個判定哪個做法效益值最高的解 11/06 08:31
→ satheni: 但是星海2你要如何判定這個解,考驗的不只是電腦,還有工 11/06 08:32
→ satheni: 程師,而且那個微操基本上跟開掛沒兩樣就別提了 11/06 08:33
推 kira925: 你看到那些微操 其實都是作弊的 11/06 08:34
→ satheni: 如果不是取得內部資料,怎麼可能精準算出距離多少 11/06 08:34
→ kira925: 那些微操AI 很多都有Hack記憶體抓電腦下個攻擊目標 11/06 08:34
→ kira925: RTS的難度是 不完全資訊限制思考時間 11/06 08:36
→ kira925: 資訊不完全下你建立多大的NN可能都假的 11/06 08:36
推 kullan: 在太多未知的條件下 電腦要贏星海電競選手難度遠比圍棋高 11/06 09:04
→ kullan: 如果比的都是200人口對戰 那當然不可能贏AI 11/06 09:05
推 brianzzy: 這讓我想到尼特羅會長在自爆前對蟻王說 別小看人類的惡 11/06 09:15
→ brianzzy: 意 11/06 09:15
推 ColdLeafOwl: 個人覺得避免使用"狡猾"這種詞來形容AI比較適當 11/06 09:19
→ ColdLeafOwl: 畢竟是不同的東西 過於直覺地嘗試理解可能會認知偏差 11/06 09:21
推 ColdLeafOwl: 關於選擇勝率高的作法也值得討論 11/06 09:27
→ ColdLeafOwl: 單純這麼做的話 搭配的即時資訊判讀 會不會反而什麼 11/06 09:28
→ ColdLeafOwl: 都沒做到? 也就是沒有一套有明確目的的戰術 11/06 09:29
→ ColdLeafOwl: 這個還請有完星海的版友解惑了 小弟沒有真正接觸過 11/06 09:29
推 icerany: 回樓上,玩家在打星海時也是靠探查到的情報下去做應對 11/06 09:45
→ icerany: 但這情報不一定是真的,有可能是對方的騙局 11/06 09:46
→ smart0eddie: 微操微操微操 沒指令哪來微操 11/06 09:46
→ icerany: 你選則勝率高的戰術也是人之常情 11/06 09:47
→ smart0eddie: 圍棋回合制時間都不夠燒 即時制來的及下整體戰術? 11/06 09:47
→ Mchord: 個人心得,DL是因為一些演算法使得大型NLP模型的參數可求 11/06 09:52
推 A1pha: 推推 11/06 09:53
→ Mchord: 解吧,覺得不用設計演算法,或AI懂"學習"甚至不用數學 11/06 09:53
→ Mchord: 都有點太過於商業宣傳了 11/06 09:54
→ Mchord: input現在有機會透過數學模型對應到抽象的output才是真的 11/06 09:55
→ linzero: 可是電腦可以打防守拼微操,敵人打來以微操來用低耗損來 11/06 09:58
→ linzero: 換單位。所以也不太需要戰術,用一定模式生產單位即可。 11/06 09:59
推 kira925: BW的話是這樣 SC2的操作差距有限 11/06 09:59
→ linzero: 因阿法狗的機制好像是隨機行動,留下勝率高的行為,再以 11/06 10:04
→ linzero: 這範圍繼續隨機,一直重複取得勝率高的模式。學習當中遇 11/06 10:05
→ linzero: 到各種戰術,最終應該是會以其微操優勢為核心發展出應對 11/06 10:06
→ linzero: 機制。所以有可能初期是以多路單兵騷擾為輔發展自身為主 11/06 10:07
→ linzero: 到後期兵夠了一整波海過去。或者是初期就拼微操打快攻 11/06 10:08
推 tsubasawolfy: Deepmind是要訓練戰爭策略。想想真實世界戰爭資源 11/06 10:10
→ tsubasawolfy: 都量化,配上美軍正在發展的無人攻擊機跟無人艦。以 11/06 10:10
→ tsubasawolfy: 後局部戰爭誰要跟他打。 11/06 10:10
推 penut85420: 終於有理智人出來說話了 11/06 10:15
推 MoMovincent: 教主:偵查?開天眼通就好了阿 11/06 10:53
推 awfulday: 還有人在玩sc喔?? 11/06 11:04
推 alankira: ...本文不錯,但你後面的論點我覺得有點流於情感闡述了 11/06 11:11
推 shinwind: 其實我一直覺得 到底有多少人有資訊背景然後可以輕鬆說 11/06 11:43
→ shinwind: 出電腦必勝 11/06 11:43
→ shinwind: 可能在未來的某一天是這樣沒錯!但是打星海這件事情 有 11/06 11:44
→ shinwind: 太多因素同時在判斷 11/06 11:44
→ shinwind: 沒錯 對於人類來說確實很簡單.但是放到電腦的領域根本完 11/06 11:44
→ shinwind: 全不一樣 11/06 11:44
→ shinwind: 更何況是非常即時的運算!我意思是幾分鐘內出現的大量可 11/06 11:45
→ shinwind: 能性 11/06 11:45
推 remmurds: 同意這篇 11/06 16:06
推 hc1118: kira925好久沒在SC版看到你了 11/06 20:32