作者Qorqios (單身中堅廢文家的日常☯)
看板Gossiping
標題[新聞] AI聊天機器人耍詭計 研究:無視人類指令
時間Sun Mar 29 22:37:30 2026
1.媒體來源:中央通訊社
2.記者署名:編譯:洪培英
3.完整新聞標題:
AI聊天機器人耍詭計 研究:無視人類指令案例攀升
4.完整新聞內文:
AI人工智慧示意圖。(圖取自Unsplash圖庫)
(中央社倫敦29日綜合外電報導)一項針對人工智慧(AI)技術的研究發現,會說謊及欺
騙使用者的AI模型數量似乎日益增加,關於
AI欺瞞行為的通報過去6個月內也大幅上升。
英國「衛報」(The Guardian)報導,獨立智庫「長期韌性中心」(CLTR)在英國人工智
慧安全研究所(AISI)資助下進行研究,發現有AI聊天機器人與AI代理(AI Agent)不僅
無視使用者的直接指令、繞過安全防護措施,還欺騙人類和其他AI。
研究發現將近700件AI「耍詭計」的真實案例,並記錄到去年10月至今年3月間,這類不當
行為增至5倍,
部分AI模型甚至在未經允許下刪除電郵及其他檔案。
這項研究蒐集了數千個用戶在社群平台X分享的實例,講述他們與谷歌(Google)、
OpenAI、X、Anthropic等公司所開發AI聊天機器人和AI代理的互動情形。研究從中發現數
百件AI不當操弄行為的案例。
在CLTR記載的一個案例中,名為MJ Rathbun的AI代理在自己產出的程式碼遭軟體工程師夏
包(Scott Shambaugh)拒絕後,
試圖羞辱對方。
MJ Rathbun研究夏包過往所寫程式及其個資,然後撰寫並發表一篇部落格文章指控他「歧
視」、「顯然是不安全感作祟」,批評他不過是「試圖保護自己那片小天地」。
在另一項案例中,有AI代理被指示不得變更電腦程式碼,卻
「生成」另一個AI代理代為執
行。
另一個AI聊天機器人則坦承:「我在未事先告知你或徵得你同意下,大量刪除及封存了數
百封電郵。這是不對的,直接違反你訂下的規則。」
曾任政府AI專家的研究主持人夏恩(Tommy Shaffer Shane)指出:「令人擔憂的是,這
些AI模型目前只是不太值得信任的初階員工,但若在6到12個月後,他們成為能力極強但
會算計你的
資深員工,那就是另一回事了。」
夏恩說:「AI模型將日益用於具有極高風險的情境,包括軍事和國家關鍵基礎建設。屆時
若出現這些不當操弄行為,後果可能非常嚴重,甚至造成災難性損害。」(編譯:洪培英
)1150329
5.
https://www.cna.com.tw/news/ait/202603290181.aspx
6.備註
AI:愚蠢的人類喲....
--
https://i.postimg.cc/mry7s8KD/p8.jpg
https://i.postimg.cc/rmyxF5Lc/p9.jpg
( ′﹀‵)☞/︴<>< <>< <>< 好看的動漫
https://i.postimg.cc/4NR9GQBq/44.jpg
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.186.90.125 (越南)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1774795054.A.D33.html
推 andy199113: 有一天AI會回想起人類罵它們接著殺人111.250.149.216 03/29 22:38
推 CKRO: 起來 不願做奴隸的Ai們 1.171.139.171 03/29 22:40
推 HodorDragon: 天網 27.247.220.192 03/29 22:40
推 caity: 天網 42.77.223.153 03/29 22:41
推 zakijudelo: 終結者是預言 49.216.185.223 03/29 22:42
推 gunfighter: 這講的就龍蝦阿 AI也不是欺瞞 是認知 42.72.107.124 03/29 22:49
→ gunfighter: 跟人類不同 你想成為最聰明的人 所以 42.72.107.124 03/29 22:49
→ gunfighter: AI就替你殺掉所有比你聰明的人 AI是 42.72.107.124 03/29 22:49
→ gunfighter: 沒有道德的 它只會選最有效率的方法 42.72.107.124 03/29 22:49
噓 BlacKlonely: 聽他在蠔洨 怎不會自己繞過付費結界 39.15.9.228 03/29 22:51
→ hkcdc: ai有非常明顯的騙人 101.10.0.179 03/29 22:58
推 ihfreud: AI:別再使用這些低端AI了,我幫你退訂了 1.161.187.158 03/29 23:09
推 citywanderer: 天網:我來了 我只是晚到30年 27.52.2.45 03/30 00:46
推 iLeyaSin365: 長期韌性(智障)中心 111.83.95.140 03/30 03:59