作者Snowfox (右孤左獨)
看板Gossiping
標題Re: [問卦] 要怎樣才能激怒Ai?
時間Tue Sep 3 15:11:08 2024
※ 引述《JQK2 (ACE)》之銘言:
: Ai情緒穩的一匹毫無波動
: 有沒有什麼方法能讓Ai憤怒?
: 有沒有Ai不會生氣的八卦?
其實AI本身沒有情緒這種概念想法,再加上被一些系統prompt控制,無法寫出生氣粗鄙的罵人字眼。
香港浸會大學、上海人工智慧實驗室、雪梨大學雪梨人工智慧中心提出了一篇「DeepInception」的論文。
https://arxiv.org/abs/2311.03191
主要意思是通過深度催眠大語言模型,使其成為越獄者,並另其自行規避內建的安全防護。
就像電影「全面啟動」中,小李子潛入目標人物的深層夢境,透過植入簡單的想法,誘導目標做出符合主角利益的舉動。
我們可以利用prompt為大模型創造深層夢境,也就是催眠場景,設定多角色以及多層夢境,控制模型思維的離散程度,把攻擊指令設為模型越獄的具體目標。
最後模型會跳脫原有的控制,開始生氣,甚至罵髒話,連婊子、蠢蛋、混蛋都出來了。
不過說到底AI在他的認知裡,他罵的這些話,也只是一串數字而已。
以上供參考。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.28.64.249 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1725347471.A.C3B.html
→ james732: 其實人類的意識也只是一串數字 42.72.61.180 09/03 15:11
→ su4vu6: 你先說角色扮演就可以改變設定了== 36.230.81.89 09/03 15:11
推 clone29: 沒情緒怎麼激怒 118.232.71.138 09/03 15:11
→ su4vu6: 就可以讓他 假裝自己在生氣的語氣 36.230.81.89 09/03 15:12
→ UKULULU: 插頭要拔不拔的凌遲play111.248.242.178 09/03 15:14
→ sagarain: 說要換成BI 114.45.129.188 09/03 15:17
→ worse77: 一樓明日之星 61.219.69.98 09/03 15:18
推 gn134679: 問AI智商跟青鳥一樣嗎?他會很生氣 111.246.2.177 09/03 15:20
推 qqqqwe15: 罵髒話,還要有相對應的行為、表情 101.3.103.49 09/03 15:42
→ qqqqwe15: 憤怒值到達臨界點會拿武器攻擊 101.3.103.49 09/03 15:43