看板 Gossiping 關於我們 聯絡資訊
最近覺得chatGPT開始變笨了, 雖然回答速度變快, 但正確率直線下降。 甚至很多題目都是一眼望知的亂回答。 連最簡單的數字都會算錯。 https://meee.com.tw/xKLtNTG.jpg
17852*4875=87028500 才是正確的。 怎麼連這麼基礎用計算機算都不會錯的問題。 它也會答錯? 那讓我想到那個經典的笑話。 主考官:你有什麼能力? 面試者:我算數學很快。 主考官:12345*54321=多少? 面試者:4798921 主考官:錯,是670592745。 面試者:但我算得很快啊 @@s -- 我還沒說完吶~~ 夠多了夠多了,回家吃藥了啦~!     \ /     ○     ︵ \○╱/|     . . ﹎ ﹍﹍ ╱ ̄﹚╱> -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.119.40 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1753326094.A.F0D.html
su4vu6: AI會根據使用者習慣改變回答方式 111.248.65.81 07/24 11:02
這是數學題耶。 它自己都把算式列出來了,答案還會錯。
railman: 付費會不會好一些?223.137.103.100 07/24 11:02
※ 編輯: chirex (36.234.119.40 臺灣), 07/24/2025 11:03:16
ianlin1216: 你沒付錢對不對 42.73.101.173 07/24 11:03
Benetnasch: 完了 開始制裁免費仔了 111.82.182.31 07/24 11:03
z842657913: 人家是語言模型 不要再叫人家算數學了 101.10.61.164 07/24 11:03
nekoares: 因為花一堆資源算你這種無聊事情沒意義 111.248.74.75 07/24 11:04
我只是隨便問他一個簡單的問題而已。 像我上次問他魔物獵人荒野何時上市的?發售至今銷量多少? 結果他回我今天2025年7月22日,魔物獵人荒野仍未上市。 我:???
simon0529: 還好我改用Grok了 111.248.100.24 07/24 11:04
※ 編輯: chirex (36.234.119.40 臺灣), 07/24/2025 11:06:48
ofpurity: 你沒付錢還想白嫖阿 36.235.234.49 07/24 11:05
b9513227: 你先說484免費仔 42.72.79.211 07/24 11:05
intointo: 有替代的嗎?222.250.103.121 07/24 11:07
Benetnasch: …..語言模型不能算數學?笑死人 111.82.182.31 07/24 11:07
ahg: 笨蛋的人太多了 122.99.14.228 07/24 11:08
owen777: 記憶中數學題一直都不准啊126.166.245.119 07/24 11:09
PeikangShin: 他會說他是生成式AI 理由伯 這時223.141.178.164 07/24 11:09
PeikangShin: 候就要噹他223.141.178.164 07/24 11:09
a401: 他就只是一個會幫你統整資料的搜尋引擎而已 118.232.8.190 07/24 11:10
a401: 萬一他找到的資料是錯的 噴出來的答案也會 118.232.8.190 07/24 11:10
a401: 是錯的 118.232.8.190 07/24 11:10
nekoares: 事實查核類你用Perplexity比較好用 111.248.74.75 07/24 11:11
chirex: 而且你說他錯,他還會解釋得理所當然 36.234.119.40 07/24 11:12
chirex: 直到你指正錯誤在那,他才開始道歉 36.234.119.40 07/24 11:12
chirex: 然後下次再犯同樣的錯誤 36.234.119.40 07/24 11:12
djyunjie: 付費仔有感 他近期很常理解錯誤 1.165.217.135 07/24 11:13
chirex: 我也有付錢,而且我還不只用一個AI 36.234.119.40 07/24 11:14
chirex: grok跟gemini我都有訂閱 36.234.119.40 07/24 11:14
nekoares: 事實查核與其要求他的正確性,不如要他 111.248.74.75 07/24 11:14
nekoares: 快速給出大量的資料來源 邏輯跟搜尋一樣 111.248.74.75 07/24 11:15
chirex: grok跟gemini一樣常犯錯。只是錯法不一樣 36.234.119.40 07/24 11:15
nekoares: 查Wiki或上網找答案也是有錯誤的可能 111.248.74.75 07/24 11:15
nekoares: 現代人直接把wiki當作真相才是最大的 111.248.74.75 07/24 11:16
nekoares: hallucination 111.248.74.75 07/24 11:16
seysem: 現在用戶越來越多 難免把AI訓練到更笨了 60.250.48.70 07/24 11:17
tsubasawolfy: 因為最近開放Agent 今天還下放到20 163.15.167.119 07/24 11:41
tsubasawolfy: 美用戶。每次這種新功能上線就是資 163.15.167.119 07/24 11:42
tsubasawolfy: 源分配重新調整。照慣例變笨一個里 163.15.167.119 07/24 11:42
tsubasawolfy: 禮拜 163.15.167.119 07/24 11:42
Supasizeit: https://i.imgur.com/rVIkZSH.jpeg203.204.195.174 07/24 12:22
Cactusman: 沒付錢 42.70.149.103 07/24 12:36
tony88037: 人工智障啊 101.12.147.230 07/24 13:08
meowlike: 換模型R 114.136.195.61 07/24 19:28
ImHoluCan: 有感覺,不過很多Ai可以ㄧ起分析 111.71.214.7 07/24 19:38
ImHoluCan: DeepSeek grok3 google 一起分析 111.71.214.7 07/24 19:38
ILoveAMD: grok廢話太多 27.52.96.68 07/24 23:05
vindiesl2000: 只會頭頭是道地胡說八道的垃圾118.168.193.248 07/24 23:12
zaqimon: 你沒繼續問 確定答案是正確的嗎123.194.151.171 07/24 23:35
sa0128: 真的錯誤率太高 拿來當翻譯軟體還 42.73.28.204 07/25 08:39
sa0128: 行 42.73.28.204 07/25 08:39