看板 StarCraft 關於我們 聯絡資訊
原始論文: https://arxiv.org/pdf/1809.07193v1.pdf 我本身是SC2玩家也對AI稍有研究,最近剛好看到這篇上禮拜才發表的論文,台灣似乎還沒什麼新聞或討論。 這篇應該是目前第一篇“公開”研究聲稱可以“進行整場遊戲並擊敗玩家”的論文,先前SC2的研究都是只能進行小遊戲的程度。 簡單來講,騰訊發表了2個不同的AI稱為TStarBot1跟TStarBot2在深海礁岩這張地圖進行ZvZ遊戲,APM限制在400-800。 TStarBot1是跟電腦對局了700萬場自我學習的,TStartBot2則是沒有經過學習直接被人類給予規則的AI(Rule-base AI)。 這兩隻AI對上作弊電腦分別取得80%跟90%的勝率,並成功擊敗白金~鑽石段位的玩家(不過場次很少)。 不過論文中有提到,TStarBot1在玩了700萬場後學到勝率最高的招式是異化蟲快攻,因此對上真實玩家多打幾場就會被破解。 而TStarBot2使用的戰術就比較多元,但以AI研究的角度來看,Rule-base AI就只是根據人類賦予的知識進行遊戲,並沒有辦法自行學習更強的戰術,因此現在的AI研究多半是自我學習為重點。 技術細節的部分我就不提了,有興趣了解的可以推文我盡量解答￿。 重點就是現在SC2 AI的研究還只能打打電腦,先前天梯高端有AI出沒的傳言多半是假的,不然就是除了騰訊外有其他尚未公開的研究在測試,雖然個人認為機率不高就是了。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.97.96 ※ 文章網址: https://www.ptt.cc/bbs/StarCraft/M.1537942999.A.CBF.html
homelife: 之前在API發表之後,Deepmind玩SC2似乎都還沒有消息?09/26 14:45
ws870325: 700萬場只會12d???09/26 14:45
kira925: 700萬場的Z學會了一個12D...09/26 14:48
kira925: 而且是ZvZ...09/26 14:48
eternalviva: 應該不是只學會12D 而是12D效率最佳 XD09/26 14:51
eternalviva: 學T的時候 大概也是每一場2BB09/26 14:51
homelife: 沒有讀檔案內文,但如果是照AlphaGO的模式,一開始應該 09/26 15:00
homelife: 是從AI連規則都不清楚就讓他自己摸索? 09/26 15:00
AlphaGo是先模仿人類之後才自我學習,一般來講這種學法比較有效,但SC2要取得大量可學習的replay比較困難,看文章應該是重頭學沒錯
fragmentwing: deepmind的不是還在人族建築起飛戰術?09/26 15:10
lather: 2bb 12D 野bg 應該都是最高的 博弈心態再加上操作 09/26 15:13
kira925: 400~800APM也太高了 200~400才合理吧 09/26 15:16
kira925: 看了下內容 他直接做了165個Macro 換句話說他已經先綁好 09/26 15:18
kira925: AI會做什麼子動作了...09/26 15:18
kira925: 不能說偷雞拉 因為確實這些動作是可以先設定好的 09/26 15:19
kira925: 但是就不是從0開始 09/26 15:19
penut85420: 我覺得一開始有些Marco應該還算合理,如果一出世就有09/26 15:22
penut85420: 個Rule Base而且沒綁腳本感覺有點太可怕。不過很看好09/26 15:22
penut85420: 他的前景,期許有天可以改善遊戲內建的AI,甚至有機會 09/26 15:22
penut85420: 指導玩家哪些細節需要改善09/26 15:22
penut85420: 發現筆誤,不是說Rule Base而是只有純輸入Rule09/26 15:23
aegis43210: 強化獎勵的部份最難09/26 15:40
zero790425: AIp要是碾壓另外兩族ai算不算是pimba(被拉走 09/26 16:00
Adonisy: 謝謝你告訴我12D轉大龍 09/26 16:20
abc0922001: 能打贏作弊難度的電腦很厲害欸 09/26 16:59
qqq87112: 以為看到吃肉人族 先打電腦 09/26 17:00
※ 編輯: andy920262 (114.136.97.96), 09/26/2018 17:37:19
win4104: 12D勝感覺...很靠賽 09/26 17:36
firefoxriko: 感覺ai條件比新人還差,新人還能上網找攻略,AI看攻 09/26 19:16
firefoxriko: 略的話就被說作弊了。 09/26 19:16
zseineo: 因為目標不一樣啊XD 09/26 19:33
firefoxriko: 我只是想說這樣還打的贏很厲害,我看了攻略都沒能打 09/26 20:02
firefoxriko: 贏 09/26 20:02
kirimaru73: 其實從來就沒有規定AI不能參考這個參考那個 09/26 21:28
kirimaru73: 只是那隻狗Re:0的威能太大 所有人都會想拿來比一下 09/26 21:28
wiki2548: 期待像圍棋一樣能探索出一個全新的世界 09/26 21:30
only1032: 二樓好好笑 09/26 21:51
shiyhsien: 我APM只有100不到 09/26 23:30
Mensholaten: 星海的變化比圍棋複雜太多 要training很久才有可能適 09/26 23:33
Mensholaten: 應各種情況吧 09/26 23:33
rodney228: 看了一下,Bot1只是給了165個"基本概念"比如甚麼是挖礦 09/27 03:54
rodney228: 攻擊的時候要點選目標、甚麼是科技之類的 09/27 03:55
rodney228: deepmind則是故意甚麼都不教? 09/27 03:56
rodney228: 只是APM設計得有點太高了,職業選手也很難一直這樣 09/27 03:58
rodney228: 更何況,學習戰術、操作一定程度之後,理論上Bot不會有 09/27 03:59
rodney228: 操作失誤吧 09/27 03:59
kira925: Deepmind是故意什麼都不教 Bot1是先設定好了一點結構 09/27 08:25
kira925: 不是不可以拉 但是要詳細看到寫得多死 09/27 08:26
jim8596: 我還以為最強是ai是甩毒爆的槍兵 09/28 15:38
jim8596: 而且rouge曾經出現2000apm過 限制不為過吧 09/28 15:39
kira925: 那我用加速鍵盤丟蛋瞬間APM破萬也算嗎... 09/28 15:43
amsmsk: 2000APM是產單位吧 09/28 21:58