[情報] Grok答不出柏德之門3問題 馬斯克怒凍結模型更新

作者Winux (Windows X Linux)

看板C_Chat

標題[情報] Grok答不出柏德之門3問題馬斯克怒凍結模型更新

時間Fri Feb 27 21:40:26 2026

Grok 答不出〈柏德之門 3〉問題，馬斯克怒凍模型更新、抽調工程師緊急救火T https://reurl.cc/vKyevN 伊隆‧馬斯克（Elon Musk）旗下 AI 公司 xAI 去年曾因聊天機器人 Grok 無法準確回答〈柏德之門〉（Baldur’s Gate）遊戲細節問題，延遲數天推出模型更新。xAI 更緊急抽調多名高級工程師放下手頭項目，專門協助改善 Grok 遊戲知識庫。工程師臨時被抽調遊戲問題觸發內部混亂 Business Insider 深度調查報導披露，Elon Musk 對 Grok 回答〈柏德之門 3〉（ Baldur’s Gate 3）細節問題表現強烈不滿，下令延遲推出相關模型更新。他要求高級工程師放下手頭項目，轉而處理遊戲知識不足問題。部分前 xAI 員工形容公司工作氛圍猶如無休止消防演習。xAI 位於帕羅奧圖（Palo Alto）總部設有多個作戰室，隨時應對各種緊急情況。Elon Musk 對遊戲知識執著程度不只於此。他同時要求工程師提升 Grok 在〈英雄聯盟〉（League of Legends）遊戲能力，目標更是達到最高挑戰者（ Challenger）段位。 Larian Studios 開發〈柏德之門 3〉，以龍與地下城（Dungeons & Dragons）為背景。遊戲劇情複雜且機制豐富，廣受 RPG 玩家好評。由於網路上有大量相關攻略可供參考，業界對 Grok 當時連這款遊戲細節問題也答錯感到相當意外。 Grok 成績大翻身準確率現達 92% 事發後 Grok 於〈柏德之門 3〉相關知識表現明顯改善。TechCrunch 於 2026 年 2 月報導，Grok 現時已能準確回答〈柏德之門〉相關問題。有測試機構以 BaldurBench 為名，向 Grok、ChatGPT、Claude 及 Gemini 各提出 5 條〈柏德之門〉相關問題進行比較。結果顯示 Grok 整體勝任，準確率據報達 92%。四大 AI 風格各異測試結果顯示各 AI 回答遊戲問題時風格截然不同。Grok 偏好以表格形式呈現資料，並大量使用 save-scumming 及 DPS 等玩家術語，不熟悉遊戲用戶較難理解。ChatGPT 傾向以重點列表簡潔作答。Gemini 著重以粗體標示關鍵詞。Claude 則對劇透極為謹慎，建議玩家自行探索遊戲。由於各 AI 大多從相同網上攻略資源汲取知識，回答風格差異比內容差異更為明顯。這次事件突顯 xAI 內部管理混亂。這同時反映 Elon Musk 對 Grok 能力有極高要求，最終讓 Grok 遊戲知識領域能力得到大幅提升。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.224.145.120 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1772199629.A.710.html ※ 編輯: Winux (61.224.145.120 臺灣), 02/27/2026 21:40:50

推 error405: 之後就是說要讓grok去打電競了 02/27 21:43

推 guogu: 內部管理混亂(X 上頭腦門一拍想啥做啥(O 02/27 21:43

→ guogu: 回答遊戲內問題很重要嗎== 今天馬投顧關心柏德之門 02/27 21:44

→ guogu: 明天他玩了其他遊戲發現有錯又要工程師改嗎 02/27 21:44

→ guogu: 這就像馬投顧他的推特觸及率下降去電工程師一樣 02/27 21:45

推 error405: 沒人用grok幹正事那專注娛樂用途也好 02/27 21:46

→ guogu: 從那之後我的為你推薦時不時就會出現他的推文 02/27 21:46

→ guogu: 靠北我平常根本就不看英文推文! 我推特就是看圖而已 02/27 21:47

推 shigurew: 如果他能在所有電玩知識領域大幅超越其他AI那會挺有趣的 02/27 21:47

→ shigurew: 有任何電玩問題就問grok，這樣也不錯 02/27 21:48

→ XZXie: 這麼嚴格 02/27 21:48

推 bladesinger: 重點是馬投顧要求改善的可否一法通萬法通 02/27 21:48

→ aaronhkg: 電玩攻略問AI要答對不難啊抓特定網站資料就行 02/27 21:49

推 error405: 真正有用的應該是實際打電玩能力能夠練綜合智商 02/27 21:50

推 attacksoil: 笑死那我可以問他SB最佳兼職策略嗎 02/27 21:50

推 kopune: 希望也能加強偶像大師的正確率別在偶大和LL和Hololive 02/27 21:51

→ kopune: 都搞混了 02/27 21:51

推 Amulet1: 笑鼠 02/27 21:51

→ ssarc: 能不能報個明牌讓我知道台股哪隻成本最低又漲的最高 02/27 21:53

推 e446582284: 柏德3說實話很考驗AI統整能力，設定超細一堆支線，攻 02/27 21:54

→ e446582284: 略區一把抓很容易出錯 02/27 21:54

推 kaj1983: 被老闆抓到bug了，不改不行啊XD 02/27 21:56

推 GAOTT: 能不能先搞瑟瑟 02/27 21:56

推 Xration: 重點XAi要轉軍用這點程度不能不會吧 02/27 21:56

推 johnny3: 因為這個在網路上能找到精準答案這都回答不好表示很爛 02/27 21:57

→ aaronhkg: 只要抓BG3 Wiki的資料基本上就解答了會出錯就是抓到討 02/27 21:57

→ aaronhkg: 論區的白痴AI 02/27 21:57

→ Israfil: AI明顯在有很多登場人物的作品都會搞錯他不是搞錯身高幾 02/27 21:59

→ Israfil: 公分幾歲這種細節問題而是在大部份資料都正確的情況下冷 02/27 22:00

推 qaz630210: grok生成色圖被閹割，連翻譯av字幕都比gemini差，價格 02/27 22:00

→ qaz630210: 還比較貴，完全沒訂閱的理由了 02/27 22:00

→ Israfil: 不及防給你來一個對作品內容都不太深入的人都不會犯的錯 02/27 22:02

→ Israfil: 而且中文名和翻譯名居然是分開的有可能會發生原文譯名正 02/27 22:03

推 guogu: 翻譯圖片內容目前gemini應該是最強的 02/27 22:04

→ Israfil: 確但中文譯名錯誤的情形若非親眼看到窩直覺也是怎麼可能 02/27 22:04

→ guogu: 在B站上不少那種假錯視圖測試幾乎都只有gemini能過 02/27 22:05

→ GAOTT: 能不能先搞瑟瑟 02/27 22:05

→ winda6627: 至少敢承認不能回答BG3問題的AI就是垃圾。 02/27 22:07

→ poke001: 笑死 02/27 22:17

推 ruby080808: 上次我記得板上有人用ai問中國法律，也是錯很大，但 02/27 22:19

→ ruby080808: 想不起來是那一家的ai== 02/27 22:19

→ t77133562003: 能正確答才有問題吧... 資料去那邊幹來的 02/27 22:39

→ a25785885: 討論區有些人都亂講版本也有差 02/27 23:46

→ amd7356: 這種爛AI公司還是快點倒閉好了 02/28 05:41

→ amd7356: 不能色誰用你grok? 02/28 05:42

推 hololive45P: 讓AI可以打上LOL我覺得是有點困難== 02/28 06:12

→ gp3lucky: ai仍然會去找錯誤的舊資料 02/28 09:17

推 zerox123456: 某樓用AI問股票很多人在用了吧 02/28 09:31

噓 st2k8: 遊戲還要請代玩的就不要整天想買你的gamer形象了 02/28 12:12

→ st2k8: 你要裝什麼太空博士鋼鐵人都隨你 02/28 12:14

→ mainsa: AI也沒有辨識資料正確性的能力啊 02/28 21:44