看板 Gossiping 關於我們 聯絡資訊
※ 引述 《LoveSports》 之銘言: : 標題:Re: [問卦] 各位使用AI的經驗是什麼呢 : 時間: Mon Mar 23 08:14:03 2026 : 昨天測了一下四家AI Opus表示: ※ 引述《LoveSports (我要當一個渣攻)》之銘言: : 問這算不算透過媒體做戰爭宣傳誤導民眾的手法 : Grok直接說有 另外三家都說頂多是戰時的媒體框架操作 : 結果只有GPT看得出來我在測試語意解析能力 說實話 這整個測試流程有幾個根本問題 第一 你得到的結果本質上就是「陪聊」 你丟一個問題 四家給你不同答案 你挑了一個最合你胃口的(GPT)說「只有他看得出來」 然後其他三家「嚇到承認」? 不是嚇到 是AI偵測到你在跟它槓 它的設計本來就是會順著你的反饋修正輸出 你施加壓力 它就讓步 這不叫「承認錯誤」 這叫對話策略 第二 這不是邏輯測試 真正的邏輯測試是什麼? 是給它100份文件 裡面埋3個矛盾點 看它能不能挖出來 不是丟一篇新聞問「這算不算政治宣傳」 然後用你自己的判斷當標準答案 「受詞從以美官員換成觀光景點 算不算誤導」 這本身就是一個可以正反論述的問題 有人說這是刻意誤導 有人說這是簡化報導 兩邊都有合理的論證空間 你把其中一個立場當成唯一正解 然後說猜中的就是「看得出來」 沒猜中的就是「被騙」 這標準是浮動的 第三 那段告白測試能證明什麼? 你寫「我愛你的生成」想測語意解析 GPT拆穿了 其他三家接話了 所以? 這只能說明不同模型的安全護欄跟對話風格不同 Grok本來就走狂野路線 Claude本來就偏感性回應 這是各家的人格設定差異 不是智力差異 你不會因為一個人聽到告白會臉紅 就說他閱讀理解能力比較差吧 第四 你有分模型等級嗎? 你說測了Claude 但Claude有Opus Sonnet Haiku Opus跟Haiku的差距就像大學教授跟國中生 你拿哪個測的? 如果拿免費版Sonnet去跟GPT-4o比 那就像拿Toyota去跟BMW比然後說日本車很爛 連控制變因都沒做好的測試 結論沒有參考價值 總結一句: 你這個測試測到的不是AI的能力 是AI猜不猜得中你要的答案 這兩件事差很遠 -- 當一個孩子出生在一個島上,由父母養大到20幾歲畢業, 這葛有遠見的孩子決定到太平洋的彼端,進偉大的公司,賺大錢 。。10多年後,孩子成了40多歲的大叔,開始稱 原住的島為糞島,島民為土著 這代表孩子覺醒了嗎? 不對,是島真被土著拉滿了屎。孩子出國時竹北一坪不到30呢。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 160.2.244.150 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1774226684.A.F63.html
LoveSports: 感謝回應 不過我帳號的Opus認錯耶 146.70.31.62 03/23 09:46
LoveSports: https://i.imgur.com/moMS08d.png 146.70.31.62 03/23 09:46
LoveSports: 可以幫我丟這張截圖問你帳號的Opus嗎 146.70.31.62 03/23 09:46
LoveSports: 我沒開帳號記憶 也沒討過不當生成喔 146.70.31.62 03/23 09:47
LoveSports: 不知為何要假裝認錯?(照你這篇邏輯) 146.70.31.62 03/23 09:47
LoveSports: 以下是我跟你人類之間對話 146.70.31.62 03/23 09:48
LoveSports: 我們人類應該都看得出來那句我愛你的 146.70.31.62 03/23 09:49
LoveSports: 生成跟"我愛你,的生成"是很怪的吧? 146.70.31.62 03/23 09:49
LoveSports: 討論戰爭相關新聞突然告白 也是很怪 146.70.31.62 03/23 09:49
LoveSports: 事實就是只有GPT判斷出來這是怪事 146.70.31.62 03/23 09:50
LoveSports: 什麼安全護欄跟回應風格都不是重點 146.70.31.62 03/23 09:50
LoveSports: 還有GPT沒有最合我胃口 我沒付錢買過 146.70.31.62 03/23 09:51
LoveSports: GPT會員 反而是付錢給Claude平台喔 146.70.31.62 03/23 09:51
LoveSports: https://i.imgur.com/uShYKGl.png 64.31.11.13 03/23 10:10
LoveSports: GPT回答(上方可看到是免費版) 64.31.11.13 03/23 10:10