[問卦] ChatGPT是不是開始變笨了？

作者chirex (不含銅鋰鋅)

看板Gossiping

標題[問卦] ChatGPT是不是開始變笨了？

時間Thu Jul 24 11:01:30 2025

最近覺得chatGPT開始變笨了，雖然回答速度變快，但正確率直線下降。甚至很多題目都是一眼望知的亂回答。連最簡單的數字都會算錯。 https://meee.com.tw/xKLtNTG.jpg

17852*4875=87028500 才是正確的。怎麼連這麼基礎用計算機算都不會錯的問題。它也會答錯？那讓我想到那個經典的笑話。主考官：你有什麼能力？面試者：我算數學很快。主考官：12345*54321=多少？面試者：4798921 主考官：錯，是670592745。面試者：但我算得很快啊 @@s -- 我還沒說完吶~~ 夠多了夠多了，回家吃藥了啦~! 　　　 \ / 　　　 ○ 　　　︵ \○╱/| 　　　 . . ﹎﹍﹍ ╱￣﹚╱＞ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.119.40 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1753326094.A.F0D.html

→ su4vu6: AI會根據使用者習慣改變回答方式 111.248.65.81 07/24 11:02

這是數學題耶。它自己都把算式列出來了，答案還會錯。

推 railman: 付費會不會好一些？223.137.103.100 07/24 11:02

※ 編輯: chirex (36.234.119.40 臺灣), 07/24/2025 11:03:16

推 ianlin1216: 你沒付錢對不對 42.73.101.173 07/24 11:03

→ Benetnasch: 完了開始制裁免費仔了 111.82.182.31 07/24 11:03

→ z842657913: 人家是語言模型不要再叫人家算數學了 101.10.61.164 07/24 11:03

→ nekoares: 因為花一堆資源算你這種無聊事情沒意義 111.248.74.75 07/24 11:04

我只是隨便問他一個簡單的問題而已。像我上次問他魔物獵人荒野何時上市的？發售至今銷量多少？結果他回我今天2025年7月22日，魔物獵人荒野仍未上市。我：？？？

推 simon0529: 還好我改用Grok了 111.248.100.24 07/24 11:04

※ 編輯: chirex (36.234.119.40 臺灣), 07/24/2025 11:06:48

推 ofpurity: 你沒付錢還想白嫖阿 36.235.234.49 07/24 11:05

→ b9513227: 你先說484免費仔 42.72.79.211 07/24 11:05

→ intointo: 有替代的嗎？222.250.103.121 07/24 11:07

→ Benetnasch: …..語言模型不能算數學？笑死人 111.82.182.31 07/24 11:07

→ ahg: 笨蛋的人太多了 122.99.14.228 07/24 11:08

推 owen777: 記憶中數學題一直都不准啊126.166.245.119 07/24 11:09

推 PeikangShin: 他會說他是生成式AI 理由伯這時223.141.178.164 07/24 11:09

→ PeikangShin: 候就要噹他223.141.178.164 07/24 11:09

→ a401: 他就只是一個會幫你統整資料的搜尋引擎而已 118.232.8.190 07/24 11:10

→ a401: 萬一他找到的資料是錯的噴出來的答案也會 118.232.8.190 07/24 11:10

→ a401: 是錯的 118.232.8.190 07/24 11:10

→ nekoares: 事實查核類你用Perplexity比較好用 111.248.74.75 07/24 11:11

→ chirex: 而且你說他錯，他還會解釋得理所當然 36.234.119.40 07/24 11:12

→ chirex: 直到你指正錯誤在那，他才開始道歉 36.234.119.40 07/24 11:12

→ chirex: 然後下次再犯同樣的錯誤 36.234.119.40 07/24 11:12

推 djyunjie: 付費仔有感他近期很常理解錯誤 1.165.217.135 07/24 11:13

→ chirex: 我也有付錢，而且我還不只用一個AI 36.234.119.40 07/24 11:14

→ chirex: grok跟gemini我都有訂閱 36.234.119.40 07/24 11:14

→ nekoares: 事實查核與其要求他的正確性，不如要他 111.248.74.75 07/24 11:14

→ nekoares: 快速給出大量的資料來源邏輯跟搜尋一樣 111.248.74.75 07/24 11:15

→ chirex: grok跟gemini一樣常犯錯。只是錯法不一樣 36.234.119.40 07/24 11:15

→ nekoares: 查Wiki或上網找答案也是有錯誤的可能 111.248.74.75 07/24 11:15

→ nekoares: 現代人直接把wiki當作真相才是最大的 111.248.74.75 07/24 11:16

→ nekoares: hallucination 111.248.74.75 07/24 11:16

推 seysem: 現在用戶越來越多難免把AI訓練到更笨了 60.250.48.70 07/24 11:17

推 tsubasawolfy: 因為最近開放Agent 今天還下放到20 163.15.167.119 07/24 11:41

→ tsubasawolfy: 美用戶。每次這種新功能上線就是資 163.15.167.119 07/24 11:42

→ tsubasawolfy: 源分配重新調整。照慣例變笨一個里 163.15.167.119 07/24 11:42

→ tsubasawolfy: 禮拜 163.15.167.119 07/24 11:42

推 Supasizeit: https://i.imgur.com/rVIkZSH.jpeg203.204.195.174 07/24 12:22

→ Cactusman: 沒付錢 42.70.149.103 07/24 12:36

推 tony88037: 人工智障啊 101.12.147.230 07/24 13:08

→ meowlike: 換模型R 114.136.195.61 07/24 19:28

推 ImHoluCan: 有感覺，不過很多Ai可以ㄧ起分析 111.71.214.7 07/24 19:38

→ ImHoluCan: DeepSeek grok3 google 一起分析 111.71.214.7 07/24 19:38

推 ILoveAMD: grok廢話太多 27.52.96.68 07/24 23:05

推 vindiesl2000: 只會頭頭是道地胡說八道的垃圾118.168.193.248 07/24 23:12

推 zaqimon: 你沒繼續問確定答案是正確的嗎123.194.151.171 07/24 23:35

推 sa0128: 真的錯誤率太高拿來當翻譯軟體還 42.73.28.204 07/25 08:39

→ sa0128: 行 42.73.28.204 07/25 08:39