精華區beta C_Chat 關於我們 聯絡資訊
: 大家可以看 2:10:16 開始的部分 https://youtu.be/cUTMhmVh1qs?t=7816
: 這時候AlphaStar有一大票追獵者,看起來非常兇悍。 : 但 Mana 只要用稜鏡把部隊運到對方家裡騷擾,AlphaStar的大軍就會班師回朝 : 戰鬥上 AlphaStar 只有「大部隊集結抗衡敵人」的概念 : 同時,AlphaStar 策略上也不太屌兵種對抗優劣,從頭至尾貫徹「追獵者最棒!」 : 這個大家在猜是因為AlphaStar覺得這兵種在消耗上最有效率 : 然後面對 Mana 的 不朽+破壞能 大軍,AlphaStar一樣用追獵者上去對幹。 : 想當然爾當然是輸了 從人類的角度看起來這兵種對抗要贏實在太難了 我覺得這部分當然應該是訓練給的APM相關參數有問題 也就是說給AI的APM上限還是太高,導致AI可以靠操作硬幹 我個人的推測是AI對局那個兩百年數據量,不太可能沒有用到不朽 那如果數據裡面有不朽結果還是敢用追獵硬推,而且確實也給他推成功了 那簡單來說就是這種微操無敵的兵種對AI來說太強 強到一般人類理解的優劣跟AI對局時的優劣是不同的 其實個人覺得星海一部分的問題在這裡 有沒有微操的情況下兵種強度存在差異 微操算是職業選手的基本功 雖然AI做出來的微操有點太離譜,但其實在一般人眼中選手的微操也很離譜 而重點是-不同微操能力下兵種克制的狀態也不同 就像一般人而言被毒爆衝生化會被換的很傷 但對選手而言,傷不傷取決於你散兵的能力 因此同理,對AI而言 如果部隊交戰時的微操對對局的影響大於你運營、策略、兵種克制的影響 那AI就會傾向於在部隊交戰時微操最大化 那就會回歸上面那個前提-APM設定太高導致兵種克制的概念與人類不同 某程度確實算是訓練失敗,因為前提與人類有明顯差距 但可以5:0可能代表在AI那個APM之下,閃追幹正面是局部最佳解 就跟人類以前找出來的三不朽等局部最佳解類似 : 當然你可以說結果就是 4:1 ,AlphaStar屌虐。 : 但我同時也相信那個時間點找其他人類高手跟AlphaStar打, : AlphaStar的贏面應該是很低。因為策略認知上的缺陷被Mana暴露出來了 我是覺得AI的策略有時候是這樣 AI的局部最佳解不一定跟人類的局部最佳解一樣 而星海這個遊戲的微操會大幅影響遊戲的特質 讓AI只要在操作上設定的不夠貼近人類,那他得到的答案就會跟人類差距很大 以前圍棋沒有所謂的微操問題 具體來說只有每一步有多少思考時間的差別 但星海爭霸這款微操會影響策略的遊戲 這次AI讓人不服氣的點是交戰時APM過高導致兵種克制與我們認知的差距太大 但其實AI下棋的時候也有類似的狀況 很多職業棋手看到AI的下法都會困惑,更會直接建議初學者不要學AI的下法 因為AI的策略不會告訴你他的邏輯是什麼 所以直接說AI的策略有問題可能只是人類的一廂情願 因為可能在AI的領域中,那個策略問題都是可以解決的 也因此回到前面的部分,你要為AI設下多少限制才「公平」 這次是閃追獵的操作上限太高,職業選手也做不到這個上限 所以變成騎摩托車跑一百公尺那種感覺 但是AI的自我對局中,大家(自己跟自己的分身)都是騎摩托車的 所以策略都是基於騎摩托車來發展 不過似乎這計畫沒有要繼續做下去 所以也很難看到AI再壓低APM之後的策略轉變了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.64.25.104 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1661853349.A.467.html
tonyy801101: 手速太高基本上不是跟AI打,是跟外掛打 08/30 17:58
tonyy801101: 那個人類也做不到的操作基本上就是不公平的存在 08/30 17:59
lsd25968: 是說AI是不是情蒐都做得很到位? 大招有用嗎XD 雖然我想 08/30 18:00
lsd25968: 大招成功幾次後 AI懂得怎麼防了就沒用了 08/30 18:00
hh123yaya: 情蒐也是要犧牲單位去巡邏才有 AI有養成嗎? 08/30 18:01
hh123yaya: 不管有沒有情蒐都閃追幹死你的話 也沒必要情蒐了 08/30 18:01
arrenwu: @lsd25968 你講的這種思考方式是人類的思考方式 08/30 18:01
goliath: 早期搞人的手段 微操好可以解決七八成吧 08/30 18:01
Senkanseiki: 問題是高手速前提下大招可能都不是大招,我記得之前 08/30 18:02
Senkanseiki: AI被先知搞結果損失都是微乎其微 08/30 18:02
arrenwu: 另外關於APM的部分,我沒有相關證據,但我自己認為APM 08/30 18:02
arrenwu: 會設定成我們看到的那種高度很可能是因為如果不這樣設定 08/30 18:02
arrenwu: AlphaStar可能沒辦法訓練到能拿出來DEMO的程度 08/30 18:03
LeeXX: 同意在ai的apm下 會有和人類玩家不同的meta 08/30 18:03
arrenwu: 至少我覺得沒啥道理他如果 APM 150就能打贏人類他會需要 08/30 18:03
arrenwu: 給到 300 APM 08/30 18:03
arrenwu: 畢竟這項實驗,APM設定越低 結果的價值就越高 08/30 18:04
LeeXX: 這也是RTS對遊戲公司而言為難的地方 最早期人族打針高階玩 08/30 18:05
LeeXX: 家無敵中低階就是被滾爛燒爛 沒有一個平衡性是能高低階環 08/30 18:05
LeeXX: 境兼顧的 08/30 18:05
goliath: 畢竟實驗結果是跟你說AI和人的apm操作結果不同了 08/30 18:05
tasin: 選手的微操不會在一般人眼中離譜啊 做不到而已 ai那個叫肉 08/30 18:05
tasin: 眼看就知道人類做不到 08/30 18:05
LeeXX: 不不選手的操作看起來也一點都不像人類啊 每個都像有四隻 08/30 18:07
LeeXX: 手 屏幕一秒刷一次的 08/30 18:07
cycy771489: 取消戰爭迷霧,AI還會選擇爆單一兵種嗎? 08/30 18:08
LeeXX: 而且像parting也有打過完全無損閃追操作贏下一局 那也是很 08/30 18:08
LeeXX: 非人類 08/30 18:08
arrenwu: 取消戰爭迷霧那玩的就不是星海爭霸了 08/30 18:08
hh123yaya: 其實這也牽扯到遊戲本身平衡的方向了 兵種的操作性本來 08/30 18:09
hh123yaya: 就在平衡的考量中 08/30 18:10
cycy771489: 先讓他學習 08/30 18:10
jeeyi345: 本來想看策略 結果AI覺得微操就夠了 08/30 18:10
cycy771489: 兵種相剋,再開啟戰爭迷霧讓它擬定策略 08/30 18:10
Senkanseiki: 問題是這其實不是這種AI的訓練方式 08/30 18:11
arrenwu: 是啊 你不能想像他是個人類XD 08/30 18:12
LeeXX: 當初會選星海來訓練就是因為不像圍棋,星海有迷霧吧 08/30 18:12
arrenwu: 我聽到的也是想嘗試看看RL下AI在非全知遊戲下的表現 08/30 18:13
jeeyi345: 不然回去比非即時呢 08/30 18:15
LeeXX: 回到職業選手 先不管地圖快捷 一般大後期為了閃AOE和方便 08/30 18:15
LeeXX: 施法 加上要顧後方 控制群組至少要6、7個時時緊盯 這你覺 08/30 18:15
LeeXX: 得是人類幹得出來的事? 08/30 18:15
NoLimination: 結果AI:戰爭迷霧?閃現追獵能解決一切問題 08/30 18:15
LeeXX: 非即時到alphago養好就已經不用再比啦 08/30 18:16
goliath: 按鍵太多 手就開始跟不上腦袋了 AI可沒這個問題 08/30 18:16
arrenwu: 另外,策略認知有無問題是結果論。不是說AI在模擬環境 08/30 18:18
arrenwu: 覺得這是最佳解那就正確 08/30 18:18
根據我的認知,這種AI並沒有很明確的邏輯跟因果 而是把每一場訓練出來的參數透過神經元疊層等複雜的計算方式給予不同的權重 是比較類似人類大腦運作方式的AI 因為不是靠邏輯推演,給他更多資訊他只會告訴你我的訓練的資料不是長這樣 所以直接把戰爭迷霧解除對AI而言可能只會讓她困惑「這種場面我沒看過」 然後為什麼我說AI的局部最佳解會因為APM設定過寬鬆而跟人類顯著不同 原因是這種AI是左右互搏在訓練的 如果你設定的微操速度過高,那AI就會基於那個微操速度來左右互搏 因此在人類看起來很傻眼的閃追獵,在AI對局裡面應該是基本戰術 然後這個戰術強無敵導致AI只要速爬閃追獵就能吃掉所有對局 所以進一步的讓AI寧可冒不偵查的風險也要賺那一點資源來抵達這個「終點」 類似的狀況還有AI跟人對局,工兵數一樣但AI的資源生產效率就是快1成 這多半也是AI為了盡快抵達特定戰略目標而產生的「產資源微操」 ※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 18:30:22
LeeXX: 職業選手恐怖就在那些按鍵腦袋和手都能處理 而且是非公式 08/30 18:21
LeeXX: 化的應對 至少在serral碾壓的時候是這麼一回事 歐美的大後 08/30 18:21
LeeXX: 期靈活打法更勝韓國的公式化打法 08/30 18:21
tasin: Serral明明是個完美呈現公式化應對到極致的玩家XD 所以他最 08/30 18:28
tasin: 不會打ZVZ這種主動的對抗 08/30 18:28
chang1248w: 要說準備戰術不得不提bo無敵的男人rogue 08/30 18:32
chang1248w: 看他打zvz根本藝術 08/30 18:32
KuBiLife: 就AI發現剪刀石頭布裡面石頭其實是手榴彈 08/30 18:35
KuBiLife: 他學怎麼丟手榴彈就好 管他剪刀跟布 08/30 18:36
black80731: 之前有 沒限制的 影片 08/30 18:40
black80731: ai的可以 把部隊散開 閃aoe 太扯 08/30 18:40
kuoyipong: AlphaStar有限制,但看來限制太寬鬆 08/30 18:42
kuoyipong: 導致AS得到的結果就是閃追OP 08/30 18:42
kuoyipong: 然後鳳凰強無敵 08/30 18:42
Minesweeper: 沒限制不就跟悍馬一樣,有意義嗎 08/30 18:44
沒限制的意義就是悍馬內戰誰最強 這也是說這個計畫不是那麼成功的原因 我知道了閃追強無敵,但這不是我想知道的 我有找到一些其他的AS對戰影片,等我看完再來告訴大家一些結論 ※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 18:47:08
kluele585: 事實上你指的 人類不知道AI這麼做的原因是什麼<—這點 08/30 18:55
kluele585: 這幾年一直是研究的方向之一 以圍棋舉例好了 現在的AI 08/30 18:55
kluele585: 已經能告訴你出這步棋他為什麼這麼下 好是好在哪裡 甚 08/30 18:55
kluele585: 至人類下一手也能分析出勝率跟優劣 08/30 18:55
Minesweeper: 看勝率本來就可以了吧,能夠自解釋倒是聞所未聞,哪 08/30 19:32
Minesweeper: 家的圍棋ai? 08/30 19:32
Minesweeper: 要解釋這一手好在哪,是什麼解釋法? 08/30 19:33
pleaseask: ai自練,可能因為總是在找最佳化策略(而非針對所有策 08/30 19:46
pleaseask: 略的應對模式),最終的答案就是閃追互打,打了幾千萬 08/30 19:46
pleaseask: 局之後就只是一直優化這個策略,人類出奇招(甚至只是 08/30 19:46
pleaseask: 很普通的偷家)就會讓ai整個錯愕然後失常 08/30 19:46
kuoyipong: 其實奇招是有考慮的 08/30 20:01
kuoyipong: 而且結論就是,你就算奇招還是打不贏我閃追(遠目) 08/30 20:02
kuoyipong: 至少這五場閃追都是強到超乎人類所知的策略 08/30 20:03
人類方出的奇招在AI方算不算奇招其實要打個問號 因為如果微操強無敵的話,照理來說完美操作的大招應該也很強 但從AI應對先知騷擾等手段來看, 其實人類認知的大招在AI眼中幾乎是可以用操作來處理的 ※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 20:05:33
km850105: 阿法星當初去打天梯也被養壞,被三族各路大招快攻搞到只 08/30 20:09
km850105: 會大召 08/30 20:09
km850105: 然後韓國的星海風和歐洲完全不同,想搞出kespa鼎盛期韓 08/30 20:12
km850105: 國的大將級選手機乎不可能 08/30 20:12