Re: [閒聊] Gemini的ACG超自信幻覺更嚴重了

作者wei115 (社畜)

看板C_Chat

標題Re: [閒聊] Gemini的ACG超自信幻覺更嚴重了

時間Fri Apr 24 14:28:36 2026

這就現在大模型的問題惹模型是無狀態的，他的知識量只截止到訓練前之後跑起來後，他都不會更新特別是模型越來越大，知識量越來越多的情況下模型會越來越自信他覺得他是對的，就算有搜尋工具可以使用，他也傾向直接回答，而不是去用工具反而一些參數比較小的模型會更積極的去使用搜尋工具但小模型的指令遵循性更差，理解力也不如大模型所以更有可能胡言亂語，或是把搜尋結果與提示詞搞混這之間的度還是很難把握的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.233.90.253 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1777012118.A.2C6.html

推 error405: https://www.youtube.com/watch?v=bMFFpAN2cWU 04/24 14:32

→ error405: 稍早刷到這個在講類似問題 04/24 14:33

推 kirimaru73: 現在容易出現下面這種問題： 04/24 14:33

→ kirimaru73: 使用者：你必須使用搜尋工具，根據找到的最新資料回答 04/24 14:33

→ kirimaru73: 這個問題，不要只依賴你原本有的資訊 04/24 14:34

→ kirimaru73: AI：好的，我一定會使用搜尋工具，根據找到的最新資料 04/24 14:34

→ kirimaru73: 來回答問題，關於你想知道的事情實際上是...... 04/24 14:34

→ DendiQ: Gemini的問題，我ChatGPT Plus用很久了就不像Gemini那樣 04/24 14:35

→ kirimaru73: 然後你如果知道什麼叫做文字接龍，就能想像前面這句話 04/24 14:35

→ kirimaru73: 的可靠性了 04/24 14:35

→ kirimaru73: 當然你可以用訓練防止光說不練，但終究無法避免 04/24 14:35

推 rgbff: 人也是一樣吧，如果你自信答案是正確的可能也會省去求證 04/24 14:41

推 EXTECH: 請查一下網路，關於balabala...我想問... 04/24 14:41

推 webermist: 你叫Gemini先做搜尋就會抓到新資料了 04/24 14:43

推 vsepr55: 一堆prompt真的有比直接查快嗎== 04/24 14:46

→ necrophagist: 所以你可以依照需求建立不同系統題詞模板 04/24 14:48

推 kirimaru73: 你可以叫他一定要搜尋，但各家模型的可靠度不太一樣 04/24 14:48

→ kirimaru73: 然後身為一個情緒價值模型，他一定會承諾他有遵命 04/24 14:48

→ necrophagist: 跟他聊天打屁和寫專業報告不會使用同一個操作模 04/24 14:49

→ necrophagist: 板 04/24 14:49

推 GenShoku: 現在要搜東西grok都比gemini好常常提示要先搜尋了結果 04/24 14:49

→ GenShoku: 第一次就是不愛搜非要錯一次被指正才肯乖乖調用搜尋 04/24 14:49

推 Adlem: 可以貼截圖打臉Gemini 請他檢討自己至少可以看哪步有問題 04/24 14:51

→ ap525922: 越來越像人了，我知道的事情幹嘛還要再搜尋 04/24 14:52

推 kirimaru73: 打臉檢討環節就類似人工智慧教學中「讓我們看看AI有沒 04/24 14:53

→ kirimaru73: 有自我反省能力」的環節了，這是很有意思的事情沒錯 04/24 14:53

→ kirimaru73: 但你如果要做的事情很單純，你自己不是早就菇狗完了嗎 04/24 14:53

推 maria001: Google關鍵字搜尋比較快，出來的結果不一定能直接用需 04/24 14:54

→ maria001: 要自己閱讀理解重構，AI回覆比較慢，但出來的結果可以 04/24 14:54

→ maria001: 直接用不過不一定正確，贏在不用動腦丟給AI重做就好 04/24 14:54

推 h0103661: 檢討沒用，AI下次還敢 04/24 14:54

→ ap525922: 用gemini就是要不停的質詢他，也是挺有意思的 04/24 14:55

推 Adlem: 有時就省時間而已丟個問題就先去做別的事情了 04/24 14:56

→ Adlem: 整理出來的排版也比翻一堆網站來的好吸收 04/24 15:00

推 bheegrl: AI老害 04/24 15:06

推 aegius1r: https://i.urusai.cc/21iOK.png 昨天還前天遇到的一題 04/24 15:06

→ aegius1r: gpt抓不到網址內容直接猜答案www 04/24 15:07

推 onionandy: Gemini不一定我最近會直接要他從指定網站撈資料而不是 04/24 15:09

→ onionandy: 他自己不知哪來的結果但她根本沒管 04/24 15:09

推 arrenwu: "可以直接用不過不一定正確" <-- 這句話前後矛盾了吧=D= 04/24 15:10

推 maria001: 可以丟下去跑，但結果不一定對這樣 04/24 15:14

→ maria001: 用指令燒token的方式，正確率似乎可以隨著信用卡燃燒的 04/24 15:18

→ maria001: 速度提升 04/24 15:18

→ smart0eddie: 想搜尋的話用 google AI mode 吧 04/24 16:16