Re: [新聞] ChatGPT-5波折超乎想象！奧特曼急回應：

作者strlen (strlen)

看板Stock

標題Re: [新聞] ChatGPT-5波折超乎想象！奧特曼急回應：

時間Sun Aug 10 15:11:20 2025

放大假閒來無事正好一堆AI公司推新品無職碼農就再來測試測試半年前DS之亂時測過讓各家AI寫一個註冊頁現在我把同樣提示詞再讓各家AI做一次看看有多少進步 Gemini 2.5 pro: https://thelonesomeera.com/signuptest/gemini.html ChatGPT 5 thinking: https://thelonesomeera.com/signuptest/chatgpt.html Claude sonnet 4: https://thelonesomeera.com/signuptest/claude.html Grok 4 Heavy: https://thelonesomeera.com/signuptest/grok.html Deepseek R1: https://thelonesomeera.com/signuptest/deepseek.html Qwen: https://thelonesomeera.com/signuptest/qwen.html 以上提示詞都完全一樣各家表現大差不差但多多少少都有些小bug 這部份就算大家都進步到差不多的程度既然過了半年那就要有相對應更進階的測試對吧？所以這次追加了以下提示詞「請使用 HTML 前端技術製作一個模擬太陽系的網頁相關程式請集中在一個 html 檔案」 Gemini 2.5 pro: https://thelonesomeera.com/solarsystem/gemini.html ChatGPT 5 thinking: https://thelonesomeera.com/solarsystem/chatgpt.html Claude sonnet 4: https://thelonesomeera.com/solarsystem/claude.html Grok 4 Heavy: https://thelonesomeera.com/solarsystem/grok.html Deepseek R1: https://thelonesomeera.com/solarsystem/deepseek.html Qwen: https://thelonesomeera.com/solarsystem/qwen.html 喔喔喔這個需求就蠻有鑑別度了大家可以自己比較一下呵呵方便瀏覽的集成頁： https://thelonesomeera.com/ai-hub.html 最後是股點這樣測下來有點讓我想出掉狗家股票勒狗狗加油好唄？嗯..... 備註：以上網頁完全沒有寫到任何一行程式碼全都是複製貼上應該說我連看都沒看... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.12.18 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1754809899.A.9AD.html ※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 15:15:12

推 lianli1024 : 狗家在幹嘛笑死 08/10 15:15

→ LDPC : QQ 好強大大 08/10 15:17

碼農吃飽太閒而已不強 QQ ※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 15:19:27

推 ga0952briel : 狗家還以為是太陽要把大家吃掉XD 08/10 15:20

推 sdbb : 好強，謝謝，好險上週沒有加碼googl 08/10 15:21

→ sdbb : 或說各家各有擅長 08/10 15:22

→ LDPC : 前陣子西洋棋大賽狗狗被grok幹掉了QQ 08/10 15:22

→ LDPC : https://reurl.cc/axLEaD 08/10 15:23

推 capssan : 我覺得辦比賽一定是未來AI的看點之一 08/10 15:35

→ capssan : 問題就是要辦什麼比賽了 08/10 15:35

推 sdbb : Ani跳啦啦隊大賽 08/10 15:38

噓 KANGTA23 : 臭谷狗就是噓而已沒啥好說了，比柵欄仔還不如 08/10 15:39

哥狗我也有持骨齁...

推 TaiwanUp : GPT的還是最完整軌道可以縮放只是太陽大小不會變 08/10 16:02

→ TaiwanUp : 軌道縮太小會像是類地行星都被太陽包覆 08/10 16:03

→ TaiwanUp : GPTc96u.3 08/10 16:03

→ TaiwanUp : GPT還有時間冥王星勾選 08/10 16:05

→ TaiwanUp : 能用GPT>Claude 堪用DS>Grok 不能用Qwen>Gemini 08/10 16:08

※ 編輯: strlen (1.160.12.18 臺灣), 08/10/2025 16:09:53

→ TaiwanUp : 我看到的Qwen永遠九星連珠 08/10 16:10

→ lavign : 棋類完全資訊遊戲都有先手優勢，不讓子或雙循環根 08/10 16:22

→ lavign : 本不準 08/10 16:22

→ eemail : 就出一題而已 08/10 16:28

→ tw19930419 : 到時候Google又有更強模型出來，然後配他的全家桶 08/10 16:31

→ tw19930419 : 你只能哭在路邊 08/10 16:31

→ watashino : 用同一個prompt不一定是個好主意能看看具體的promp 08/10 16:39

→ watashino : t嗎 08/10 16:39

→ TaiwanUp : 只有GPT軌道稍微正確其他的九軌道都等距不合理 08/10 16:45

推 mamorui : 我現在用Cloude 08/10 16:58

→ qxpbyd : Gemini2.5pro你是用AI Studio的還是Gemini版的? 08/10 17:03

噓 champion0922: 一直撞一直爽 08/10 17:03

→ qxpbyd : 我用你的prompt 太陽系不會錯成那樣 08/10 17:03

推 stepnight : 窩只能說寫Code，Gemini 就是一坨 08/10 17:07

推 jerrychuang : 可是notebooklm很好用耶 08/10 17:22

推 TameFoxx : Gemini強項就不在coding 08/10 18:18

噓 maplefff : 這種題目沒有辦法體現Gemini 2.5 Pro 1M上下文優勢 08/10 18:24

→ maplefff : 等到你的專案足夠複雜, 足夠大, 其他模型如同不停 08/10 18:25

→ maplefff : 失憶的新人, 必須反覆閱讀技術文檔, 你就知道差距了 08/10 18:25

→ lavign : 有限空間解的問題測試才能知道基本推理能力的強弱 08/10 18:30

→ maplefff : 這種問題等於考99x99乘法表來考驗哈佛,劍橋,史丹佛 08/10 18:34

→ maplefff : 數學博士生的數學能力. 除了顯示誰99x99乘法表背得 08/10 18:34

→ maplefff : 熟以外, 跟數學能力根本無關 08/10 18:35

推 Adrian : Gemini 畫圖很不錯其他爛爛的 08/10 19:11

→ Atwo : 很有趣耶讓我想試做看看托勒密的地心說模型 08/10 20:05

推 KTFGU : 寫程式不要用google 08/10 21:34

→ medama : 沒有冥王星嗎 08/11 00:46

推 donkilu : Gemini真的很搞 08/11 02:37

推 Toge : Gemini喔，去 reddit 找一堆崩潰圖，還會給你刪 co 08/11 07:27

→ Toge : de 呵呵 08/11 07:27

推 Toge : 之前用它還直接給我 git reset --hard，幹 08/11 07:31

推 cvn21 : Gemini 適合做大量重複無聊的工作，比如說提取超長 08/11 09:10

→ cvn21 : 文中出現多次，不同但有一定特徵的資料 08/11 09:10

→ cvn21 : 這種用GPT 都會偷懶，找個三四個就開始瞎掰 08/11 09:10

→ cvn21 : 用在研究上把亂七八糟raw data轉換成表格還行，這種 08/11 09:12

→ cvn21 : 超無聊的工作用GPT從來沒弄好過 08/11 09:12

推 staytuned74 : 你把題目換成解微積分給他pdf 考古題，最強可能就 08/11 11:16

→ staytuned74 : 變成pro2.5了 08/11 11:16

→ staytuned74 : 其他家可能解兩題就開始像上面講的偷懶不解了 08/11 11:18

→ staytuned74 : 然後gpt5 現在糟糕到吃不進去非文字解析pdf 其他家 08/11 11:19

→ staytuned74 : 都可，就知道出多大包了 08/11 11:19