看板 C_Chat 關於我們 聯絡資訊
https://arxiv.org/abs/2504.04395 UT Austin資工系一群研究人員 使用線上對戰遊戲Competitive Pokémon Singles (CPS) 過去15年的真人6v6 pokemon對戰歷史資料共95萬場比賽 以強化學習的方式學習遊戲技巧 (何時攻擊、用啥攻擊、換怪、換啥怪、場地天候因素、考量對手攻擊集氣等,最 多到兩億的參數), 最後把訓練的模型匿名偷偷拿去真人對戰爬積分, 成功爬到前10%的ranking https://imgur.com/DqrgjKj.png
這代表AI也開始進攻Pokemon對戰遊戲了 不過才爬到前10%,代表還有10%的人可以打贏AI 不過這遊戲在台灣好像現在討論不多就是了 ---- 另外  期刊作者順序  作者說是比賽Pokemon決定的.... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 108.31.73.137 (美國) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1745279894.A.C0F.html ※ 編輯: wearytolove (108.31.73.137 美國), 04/22/2025 07:58:34
Wardyal: 2億以模型來說算很多嗎 04/22 08:03
aaaaooo: GPT-1 1.1億 GPT-2 15億 GPT-4 5000億+ 2億是迷你模型 04/22 08:04
qss05: 可是每代的戰術多少有差,太久的也不能參考吧,這要能打到 04/22 08:13
qss05: 1%應該很難,雖然好像部分版本的情況比較單一,不用判斷那 04/22 08:13
qss05: 麼多 04/22 08:13
none049: AI會摸去化石嗎? 04/22 08:13
aaaaooo: 他用強化學習的只要換代時花點時間再訓練就好 只要設備夠 04/22 08:15
aaaaooo: 好很快又能爬上去 04/22 08:16
ClawRage: 反正大多數時間猜守住跟丟硬幣並沒有區別 04/22 08:22
ClawRage: 打大師績分完全OK 04/22 08:23
ClawRage: 只要沒涉及養怪戰術都沒啥研究難度 04/22 08:24
BusterPosey: 所以有得出現在規則哪個神最強嗎? 04/22 08:33
chocoball: 10%也滿強了 至少多數玩家贏不了ai 04/22 08:48
teddy: 2億不大 有顯卡就能跑 04/22 08:50
CYHyen: 10%蠻爛的吧 在認真玩家眼裡可能都有很多明顯的錯誤 04/22 08:59
louie0909: 2億是0.2B?那超迷你模型欸 搞不好手機都能跑 04/22 09:04
whitekyubi: 有包含編隊跟配招嗎? 04/22 09:13
OldYuanshen: 前10%不就是pr90的意思嗎 還是天梯只有前10%才競爭 04/22 09:14
OldYuanshen: 底下很多只是玩自己喜歡的隊伍 04/22 09:14
kramasdia: 圍棋ai都能打世界冠軍了 寶可夢ai只能10%相比之下難免 04/22 09:23
kramasdia: 讓人覺得不足 04/22 09:23
xga00mex: 感覺應該要進3%左右才算強吧 10%感覺就一般熱衷玩家 04/22 09:26
weiman0702: 這還會牽涉對戰環境 04/22 09:27
weiman0702: 某種隊伍太強勢就會有很多人開始針對 04/22 09:27
weiman0702: 如果勝率保持在70%甚至80%以上就非常強了 04/22 09:27
xga00mex: 不過也要看打的場次跟勝率就是了 04/22 09:28
lastphil: LLM 2B模型剛好能給手機跑 04/22 09:31
linzero: 感覺跟圍棋不一樣,組成有可能遇到被針對而輸面較大吧 04/22 09:37
realestate: 好幾篇論文都指出的 對戰類遊戲使用 Enforce Learning 04/22 10:02
realestate: 訓練的話 在初期的學習曲線會飆很快 但很快在接近人類 04/22 10:02
realestate: 頂尖水平時就會停滯不前 最終無論訓練參數多大 都無法 04/22 10:02
realestate: 突破人類極限 04/22 10:02
BSpowerx: 看天梯排名沒意義吧,這東西終究是勝率別太慘就會越打越 04/22 10:03
BSpowerx: 高,又不是說你勝率90% 04/22 10:03
BSpowerx: 90%玩家根本不會一天24小時泡在天梯上面拼排名 04/22 10:04
qss05: 可是圍棋規則是不變的不是?雖然戰術與時俱進,但是基本邏 04/22 11:00
qss05: 輯都可以通用,但有meta或是系統差異的遊戲,部分參數應該 04/22 11:00
qss05: 是沒用的?實際訓練量應該少很多? 04/22 11:00
alpho: 圍棋規則比較固定 寶可夢從組隊就很吃環境的影響 04/22 11:12
mouscat: 圍棋 西洋棋這種明面上沒有未知資訊的比較適合AI演算? 04/22 11:38
mouscat: 西洋棋的死魚也沒有活人打得贏吧 04/22 11:38