看板 C_Chat 關於我們 聯絡資訊
這就現在大模型的問題惹 模型是無狀態的,他的知識量只截止到訓練前 之後跑起來後,他都不會更新 特別是模型越來越大,知識量越來越多的情況下 模型會越來越自信 他覺得他是對的,就算有搜尋工具可以使用,他也傾向直接回答,而不是去用工具 反而一些參數比較小的模型 會更積極的去使用搜尋工具 但小模型的指令遵循性更差,理解力也不如大模型 所以更有可能胡言亂語,或是把搜尋結果與提示詞搞混 這之間的度還是很難把握的 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.233.90.253 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1777012118.A.2C6.html
error405: 稍早刷到這個在講類似問題 04/24 14:33
kirimaru73: 現在容易出現下面這種問題: 04/24 14:33
kirimaru73: 使用者:你必須使用搜尋工具,根據找到的最新資料回答 04/24 14:33
kirimaru73: 這個問題,不要只依賴你原本有的資訊 04/24 14:34
kirimaru73: AI:好的,我一定會使用搜尋工具,根據找到的最新資料 04/24 14:34
kirimaru73: 來回答問題,關於你想知道的事情實際上是...... 04/24 14:34
DendiQ: Gemini的問題,我ChatGPT Plus用很久了就不像Gemini那樣 04/24 14:35
kirimaru73: 然後你如果知道什麼叫做文字接龍,就能想像前面這句話 04/24 14:35
kirimaru73: 的可靠性了 04/24 14:35
kirimaru73: 當然你可以用訓練防止光說不練,但終究無法避免 04/24 14:35
rgbff: 人也是一樣吧,如果你自信答案是正確的可能也會省去求證 04/24 14:41
EXTECH: 請查一下網路,關於balabala...我想問... 04/24 14:41
webermist: 你叫Gemini先做搜尋 就會抓到新資料了 04/24 14:43
vsepr55: 一堆prompt真的有比直接查快嗎== 04/24 14:46
necrophagist: 所以你可以依照需求建立不同系統題詞模板 04/24 14:48
kirimaru73: 你可以叫他一定要搜尋,但各家模型的可靠度不太一樣 04/24 14:48
kirimaru73: 然後身為一個情緒價值模型,他一定會承諾他有遵命 04/24 14:48
necrophagist: 跟他聊天打屁 和 寫專業報告 不會使用同一個操作模 04/24 14:49
necrophagist: 板 04/24 14:49
GenShoku: 現在要搜東西grok都比gemini好 常常提示要先搜尋了 結果 04/24 14:49
GenShoku: 第一次就是不愛搜 非要錯一次被指正才肯乖乖調用搜尋 04/24 14:49
Adlem: 可以貼截圖打臉Gemini 請他檢討自己 至少可以看哪步有問題 04/24 14:51
ap525922: 越來越像人了,我知道的事情幹嘛還要再搜尋 04/24 14:52
kirimaru73: 打臉檢討環節就類似人工智慧教學中「讓我們看看AI有沒 04/24 14:53
kirimaru73: 有自我反省能力」的環節了,這是很有意思的事情沒錯 04/24 14:53
kirimaru73: 但你如果要做的事情很單純,你自己不是早就菇狗完了嗎 04/24 14:53
maria001: Google關鍵字搜尋比較快,出來的結果不一定能直接用需 04/24 14:54
maria001: 要自己閱讀理解重構,AI回覆比較慢,但出來的結果可以 04/24 14:54
maria001: 直接用不過不一定正確,贏在不用動腦丟給AI重做就好 04/24 14:54
h0103661: 檢討沒用,AI下次還敢 04/24 14:54
ap525922: 用gemini就是要不停的質詢他,也是挺有意思的 04/24 14:55
Adlem: 有時就省時間而已 丟個問題就先去做別的事情了 04/24 14:56
Adlem: 整理出來的排版也比翻一堆網站來的好吸收 04/24 15:00
bheegrl: AI老害 04/24 15:06
aegius1r: https://i.urusai.cc/21iOK.png 昨天還前天遇到的一題 04/24 15:06
aegius1r: gpt抓不到網址內容 直接猜答案www 04/24 15:07
onionandy: Gemini不一定 我最近會直接要他從指定網站撈資料而不是 04/24 15:09
onionandy: 他自己不知哪來的結果 但她根本沒管 04/24 15:09
arrenwu: "可以直接用不過不一定正確" <-- 這句話前後矛盾了吧=D= 04/24 15:10
maria001: 可以丟下去跑,但結果不一定對這樣 04/24 15:14
maria001: 用指令燒token的方式,正確率似乎可以隨著信用卡燃燒的 04/24 15:18
maria001: 速度提升 04/24 15:18
smart0eddie: 想搜尋的話用 google AI mode 吧 04/24 16:16