精華區beta C_Chat 關於我們 聯絡資訊
: 推 win4104: 現在阿法狗團隊的瓶頸是 沒辦法把戰局優劣勢簡單實時的 10/25 15:23 : → win4104: 量化 10/25 15:23 不太懂為什麼沒辦法量化,去比較低、中、高階的記錄檔就可以發現一些很主要的差異 例如:資源量、有效操作量、資源交換比 為什麼 RTS 絕大部分提高遊戲 AI 難度都是靠著給 AI 更多資源? 一大主因就是資源量很重要,當你的資源比對手少時,你只能靠著提高資源交換比 來扳回資源差距,影響資源交換比的要素太多就先不討論,但若只是需要指標的話 ,資源交換比絕對是需要列出來比較的 資源交換比就是你用了多少資源換掉對手多少資源,例如你不損一隻就全殲對手全部 軍事單位,這次交戰的資源交換比就是對手生產軍事單位所花掉的資源,去除以你用 來殲滅對手軍事單位所花掉的資源 有效操作量對電腦來說可能比較沒影響,因為電腦不會像人類一樣玩到後期很容易腦 袋空空,下出一些很沒意義的指令,不過有效操作量在哪個時間點該花在哪方面則是 需要深入研究 另一個很重要的是時間點,這邊用快攻來說明比較方便,假設一邊採取快攻,另一邊 採取爬科技,若快攻方在那邊一直屯兵,想說屯到數量夠了才進攻,結果夠了的時候 對方已經爬完科技,導致快攻方被高科技的兵屠殺 越早把資源用來生產軍事單位,越要確保你的資源交換比夠大,大到可以消耗或抵銷 對手先把資源用來拼經濟或科技所帶來的優勢;對手方則是反過來,盡可能地減少快 攻方的資源交換比 雖然比的還是資源交換比,但進攻時間點的選擇則是取決於你的戰術 從另一個角度來看,就是你花在軍事單位上的資源到開始有資源交換比的閒置時間有 多長,通常時間越長越不好,不過由於星海不封路的場次很少見,所以這數據未必能 用來當量化指標 通常資源量、資源交換比都贏對手的情況下,都是勝利的一方 -- 「看在上帝的份上,我們不能當著孩子的面槍殺他的父親!」 「那我們就連孩子一起幹掉!」 「第一槍打中的是那個天真的孩子,第二槍是抱著孩子的母親。第三槍 停頓了三秒,當難以致信的父親擦拭著臉上愛子的腦漿從震驚中醒轉 過來,慢慢的轉頭看向停車的地方,分辨出是誰在攻擊他後,第三顆 子彈才將他的腦殼打飛。」 ─摘自〈狼群〉 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.167.137 ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1508949875.A.FD7.html
win4104: 要評價的是 這個營運流程能不能得到更高的資源量 10/26 00:55
win4104: 這個操作是不是有效操作 10/26 00:55
win4104: 這樣的戰術選擇與配兵能不能得到更多的交換比 10/26 00:55
win4104: 五分鐘內是這樣 十分鐘後是嗎? 十五分鐘後是嗎? 10/26 00:55
elfkiller: 那AI在蓋了一棟很貴的建築後就會投降了 因為資源見底 10/26 00:55
win4104: 同樣的操作在不同的情境下評價會不同 10/26 00:56
win4104: 而那個評價的依據還可能是來自還在戰場迷霧中的資訊 10/26 00:56
art1: 以深度學習的做法來看,需要給的只有指標,剩下的靠訓練過程 10/26 00:57
art1: 這邊說的資源量是累積的總量,不是目前手上擁有的資源 10/26 00:58
win4104: Rts 沒有那麽單純 一隻兵站在某個點上 從不同的角度解釋 10/26 00:58
win4104: 可能是優 可能是劣 10/26 00:58
win4104: 局勢大體會跟資源 交換比這些成正相關 但這不是絕對 10/26 00:59
win4104: 你有可能存了200的資源跟部隊 但是因為沒反隱形被一隊隱 10/26 01:00
win4104: 刀 隱形女妖滅國 10/26 01:00
art1: 目前 AI 需要的就是單純化的指標,不需要去考慮到太細 10/26 01:00
win4104: 或是照理來講應該能完勝的部隊在推進時被少量機動部隊換 10/26 01:01
win4104: 家 10/26 01:01
win4104: 數字依據終究只能作為參考 沒辦法當作評價局勢的重要依據 10/26 01:01
art1: 建築物也是需要花掉資源,所以少量機動部隊抄家就是達成高的 10/26 01:02
art1: 資源交換比 10/26 01:02
win4104: 如果只用這些單純的數字當指標 我相信AI會被多變的戰術耍 10/26 01:02
win4104: 的團團轉 10/26 01:02
win4104: 所以你要怎麼評價這個行動能不能得到更高的交換比 10/26 01:03
win4104: 對方可能在正面 可能不是 如果是 我推進能打贏 如果不是 10/26 01:04
win4104: 我推進有可能被換家 10/26 01:04
win4104: 那推進這個選項的評價是什麼 10/26 01:04
art1: 靠深度學習的演算法,在經過大量訓練之後,電腦能找出最佳參 10/26 01:05
art1: 數,以實現資源量、資源交換比的最大化 10/26 01:05
win4104: 那個簡單指標怎麼定義就是我說的問題所在 10/26 01:06
win4104: Deepmind嘗試過讓AI以遊戲分數作為指標 結果AI從頭到尾只 10/26 01:06
win4104: 會採礦 10/26 01:06
yoyun10121: 最難的就是怎樣去定義出最好的指標呀.. 10/26 01:09
yoyun10121: 即時戰略會影響勝負的指標比圍棋多太多了 10/26 01:10
enjoytbook: 呵呵 10/26 01:13
art1: 如果你知道資源量、資源交換比跟勝率有正相關,為什麼不想以 10/26 01:17
art1: 這兩個為簡單指標呢? 10/26 01:17
art1: 你是用局勢跟那兩者有關 10/26 01:18
win4104: 資源交換比跟勝率有正相關這也是必須參考其他情境分析 10/26 01:33
win4104: 不適用於所有情境 10/26 01:33
yoyun10121: 有正相關不代表相關性就夠高.. 10/26 01:50
art1: 所以簡單指標必須適用於所有情境? 這是找指標的前提嗎? 10/26 06:03
WrongHole: 10/26 07:17
win4104: 如果你的指標代表性不夠 那就不是個好的指標 10/26 09:24
win4104: 目標是要贏 如果達成指標卻沒能提高勝率 那要這個指標何 10/26 09:25
win4104: 用 10/26 09:25
miname: 圍棋一樣沒辦法知道每一步的優劣啊,AGZ是用蒙地卡羅搜尋 10/26 10:11
miname: 不同落子點的勝率來做訓練的 10/26 10:11
win4104: http://tinyurl.com/GoAISCII 10/26 10:46
win4104: 已經不是了 10/26 10:47
k1k1832002: 關於推文提到的一些問題,其實總歸就是把人類行為規則 10/26 11:42
k1k1832002: 找出來而已,目前各類自動化工程都類似這個狀況,所以 10/26 11:42
k1k1832002: 近年AI突破一個階段就是神經學有所發展導致的,知道 10/26 11:43
k1k1832002: 規則怎麼跑,AI最簡單的其中一項目標就是複製人類行為 10/26 11:43
k1k1832002: 所以有些問題不是問題 10/26 11:44
art1: 什麼時候已經證明資源量、資源交換比這兩個指標無法提高勝率 10/26 12:36
win4104: 同樣一個問題反過來問你呢? 10/26 12:40
win4104: 如果這些指標這麼有效 Deepmind會沒想到? 10/26 12:40
win4104: 會出現只會飛基地追求和局 跟只採礦追求分數這兩種狀況? 10/26 12:41
win4104: 這兩個是Deepmind目前研究已經發生的狀況 10/26 12:41
art1: 出現的那兩種狀況有註明說是用了哪些指標? 10/26 12:50
art1: 我是不知道他們有沒有想到那兩個指標,因為他們沒說 10/26 12:51
art1: 所以我不會當成他們已經想過了 10/26 12:51
win4104: 第一個是勝利 第二個是星海本身的遊戲積分機制 10/26 12:57
win4104: 再問個問題 是優勢造成交換比上升 還是交換比上升造成優 10/26 12:59
win4104: 勢? 根本的原因是什麼 還是看到的只是結果 10/26 12:59
win4104: 資源 有效操作EPM 跟戰損比 都是星海系統自己已經算好給 10/26 13:02
win4104: 你的數字 10/26 13:02
win4104: 連自己另外算都不用 10/26 13:02
win4104: 我不覺的他們會沒試過 10/26 13:02
ghostsun: 居然有人認為坐在ptt前想到的東西 專業研究人員沒想過 10/26 14:11
killerken: 這不就Ptt日常啊 以為自己超會 01/05 15:59