[新聞] Grok 答不出〈柏德之門 3〉問題，馬斯克

作者pl132 (pl132)

看板Tech_Job

標題[新聞] Grok 答不出〈柏德之門 3〉問題，馬斯克

時間Fri Feb 27 19:29:57 2026

Grok 答不出〈柏德之門 3〉問題，馬斯克怒凍模型更新、抽調工程師緊急救火 https://tinyurl.com/26njc4h2 伊隆‧馬斯克（Elon Musk）旗下 AI 公司 xAI 去年曾因聊天機器人 Grok 無法準確回答〈柏德之門〉（Baldur’s Gate）遊戲細節問題，延遲數天推出模型更新。xAI 更緊急抽調多名高級工程師放下手頭項目，專門協助改善 Grok 遊戲知識庫。工程師臨時被抽調遊戲問題觸發內部混亂 Business Insider 深度調查報導披露，Elon Musk 對 Grok 回答〈柏德之門 3〉（ Baldur’s Gate 3）細節問題表現強烈不滿，下令延遲推出相關模型更新。他要求高級工程師放下手頭項目，轉而處理遊戲知識不足問題。部分前 xAI 員工形容公司工作氛圍猶如無休止消防演習。xAI 位於帕羅奧圖（Palo Alto）總部設有多個作戰室，隨時應對各種緊急情況。Elon Musk 對遊戲知識執著程度不只於此。他同時要求工程師提升 Grok 在〈英雄聯盟〉（League of Legends）遊戲能力，目標更是達到最高挑戰者（ Challenger）段位。 Larian Studios 開發〈柏德之門 3〉，以龍與地下城（Dungeons & Dragons）為背景。遊戲劇情複雜且機制豐富，廣受 RPG 玩家好評。由於網路上有大量相關攻略可供參考，業界對 Grok 當時連這款遊戲細節問題也答錯感到相當意外。 Grok 成績大翻身準確率現達 92% 事發後 Grok 於〈柏德之門 3〉相關知識表現明顯改善。TechCrunch 於 2026 年 2 月報導，Grok 現時已能準確回答〈柏德之門〉相關問題。有測試機構以 BaldurBench 為名，向 Grok、ChatGPT、Claude 及 Gemini 各提出 5 條〈柏德之門〉相關問題進行比較。結果顯示 Grok 整體勝任，準確率據報達 92%。四大 AI 風格各異測試結果顯示各 AI 回答遊戲問題時風格截然不同。Grok 偏好以表格形式呈現資料，並大量使用 save-scumming 及 DPS 等玩家術語，不熟悉遊戲用戶較難理解。ChatGPT 傾向以重點列表簡潔作答。Gemini 著重以粗體標示關鍵詞。Claude 則對劇透極為謹慎，建議玩家自行探索遊戲。由於各 AI 大多從相同網上攻略資源汲取知識，回答風格差異比內容差異更為明顯。這次事件突顯 xAI 內部管理混亂。這同時反映 Elon Musk 對 Grok 能力有極高要求，最終讓 Grok 遊戲知識領域能力得到大幅提升。這難道是老馬玩遊戲時候,查詢AI結果得到錯誤答案,所以不爽才叫人修嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.204.190 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1772191799.A.161.html

推 yamakazi: 原本也是用grok，後來Yt影片總結很爛， 49.214.9.95 02/27 20:13

→ yamakazi: 跳槽到Gemini 49.214.9.95 02/27 20:13

推 qk3380888: 不能色色後就沒興趣惹 219.28.247.77 02/27 20:17

推 yamakazi: 影片總結Gemini真的猛，grok自己承認說 49.214.9.95 02/27 20:20

→ yamakazi: 沒字幕檔的都是間接判斷不是直接 49.214.9.95 02/27 20:20

→ dslite: 他是找代玩 36.227.131.147 02/27 22:04

→ yunf: 我不確定他知不知道他自己在幹嘛 101.10.5.167 02/28 01:32

→ yunf: ai就是把玩家的知識水平拉到同一個水位這樣 101.10.5.167 02/28 01:35

→ yunf: 遊戲還有鑑別度嗎？ 101.10.5.167 02/28 01:35

→ yunf: 他該不會以爲他的ai有辦法自己玩遊戲寫攻略 101.10.5.167 02/28 01:38

→ yunf: 吧？ 101.10.5.167 02/28 01:38

推 Masturbate: 所以可以生成影心的色圖了嗎？科 49.216.163.198 02/28 03:52

推 lifeowner: 吱吱：工人智慧 38.71.113.230 02/28 06:26

推 qoo60606: 老闆玩遊戲還要幫他改善體驗太苦了 111.71.212.59 02/28 09:17

推 walter5663: 工人智慧模型 101.10.161.157 02/28 17:09

推 bwnzer: 目前遊戲卡關用Gemini是還算真的 114.140.81.178 02/28 20:14

→ bwnzer: 好用，只差沒地圖 114.140.81.178 02/28 20:14

推 jack70134: 提升grok 在Lol的段位是啥意思叫AI打 27.247.99.12 03/01 10:29

→ jack70134: 遊戲嗎 27.247.99.12 03/01 10:29

推 NexusPrime: 他是hard core玩家當然很重視遊戲知 101.10.75.94 03/01 13:52

→ NexusPrime: 識 101.10.75.94 03/01 13:52

推 aspirev3: faker:下一冠為了人類 1.164.128.127 03/01 22:42

推 hakkacandy: 遊戲太細節了要llm 能回答也太刁難 49.217.196.255 03/02 09:46

→ Killercat: shadowheart的色圖還需要grok去生嗎=_= 57.140.96.30 03/03 13:40