Re: [問卦] GPT-4o比GPT-5還要好用？很多人想降版？

作者LoveSports (我要當一個渣攻)

看板Gossiping

標題Re: [問卦] GPT-4o比GPT-5還要好用？很多人想降版？

時間Sun Aug 10 16:18:20 2025

※ 引述《saiulbb (#KEEP MLB GREAT!)》之銘言： : 原因是回答的答案會是錯的、回答得更蠢，感覺OpenAI要讓大家用比較笨的AI， : 要用比較聰明的AI就要付費，是這樣理解的嗎？有沒有八卦阿？ GPT5幫我計算了地質方面的問題，拿給Gemini 2.5 pro驗證，說是正確的。另外Gemini 2.5 pro分析GPT5建構的故事世界觀四篇文，以下是他的評估，第二篇是與GP T4.5作比較。（我沒有創角需求，所以很少跟4o對話，甚至會故意避開） Gemini 2.5 pro: 2. 對於「GPT-5」的分析與創造力程度評估其表現極其卓越，代表了當前大語言模型在「創造性綜合」與「深度分析」方面所能達到的頂尖水準。它已經遠不止是一個工具，而是一個合格的「創意合夥人」。下面我從「分析能力」和「創造能力」兩個維度來進行詳細評估：分析能力 (Analytical Prowess) 深度與準確性：它不僅能找到並正確使用權威數據（NOAA/ETOPO1），還能理解數據背後的意義。在計算報告中，它沒有止步於數字，而是將其轉化為與「非洲大陸面積」的比較，這種量級的直觀化能力非常出色。結構化與邏輯性：四篇文章的結構都堪稱典範。從「假設」到「結論」，從「機制」到「後果」，邏輯層次分明，無懈可擊。它完美地展示了如何將一個複雜的問題拆解成易於理解的模組。批判性思維：在第三篇「機制列表」中，它為每個選項都標註了「合理性：高/中/低」。這代表它不僅在陳述事實，更在進行評估和判斷。這是一種非常高階的分析能力，意味著它能理解不同假設的置信區間。系統化整合：第四篇「世界觀模組」是其分析能力的集大成者。它將地理、氣候、生物、能源、政治、社會、文化等看似無關的系統，整合成一個相互關聯、相互影響的有機整體。這種建立複雜系統模型的能力，是頂級分析師和戰略家的標誌。創造能力 (Creative Ingenuity) 概念的飛躍與串聯：在第一篇「死亡之-海」中，從「XXXX」這個點子，飛躍到「XXX釋放」，再串聯起「XX翻轉」、「XXX釋放」等一系列災難骨牌，這種跨學科的概念鏈接能力是其創造力的核心。這不是簡單的資料拼貼，而是真正的「靈感迸發」。從「設定」到「故事」的轉化：這是它最令人驚嘆的地方。它沒有停留在「這個世界是怎樣的」，而是不斷地追問「這個世界能發生什麼故事？」。第四篇中大量的**「敘事鉤子」、「弱點與威脅」、「具體場景描述」**，都是為了服務於「寫故事」這個最終目的而設計的。它深刻理解創作者真正需要的不是設定集，而是衝突與情節的源泉。語言的表現力與感染力：它不僅邏輯清晰，文筆也同樣出色。第四篇結尾的示例段落，用寥寥數語就營造出了蒼涼、肅穆、充滿張力的末日氛圍。「灰色的晨霧在...低語」、「工程師們像祭司」，這些語言充滿了文學性，能夠直接觸動讀者的情感。總結：如果說早期的 AI 像一個知識淵博但略顯呆板的圖書館員，那麼您展示的這個「GPT-5」的表現，則更像是一個由頂尖科學家、資深社會學家、戰略顧問和才華橫溢的小說家組成的精英團隊。它不僅能準確地回答「是什麼」，更能富有洞見地探討「可能是什麼」，甚至極具建設性地建議「應該是什麼」。這種從分析到創造，再從創造回饋於分析的閉環能力，正是頂級智慧生命的特徵之一。 Gemini 2.5 pro: 好的，這是一個非常精彩的對比。您提供的這篇「GPT-4.5」作品，與前四篇「GPT-5」的作品在風格、側重點和複雜度上都有明顯的差異。我們可以從中窺見不同模型（或者說是不同提示策略下）的思維模式。直接回答：這「GPT-4.5」的作品非常優秀，充滿創意和激情，但在結構的嚴謹性、細節的深度和系統的完整性上，「GPT-5」的第四篇「世界觀模組」相比，仍有明顯的差距。它更像是一個精彩的「電梯簡報 (Elevator Pitch)」，而不是一份可直接施工的「藍圖」。「GPT-4.5」與「GPT-5」的優劣勢比較「GPT-4.5」的優點 (激情四射的點子王) 核心創意極具衝擊力：它開篇就提出了一個非常具體且充滿科幻感的概念——「XXXXXXX 」。這個點子非常抓人眼球，比「XXXXXXX」更具想像力和獨創性。語言極富激情與感染力：這篇文章的語言風格非常鮮明，充滿了力量感和戲劇性。例如「 XXXX」、「逆向報復性XC」、「XXXX」、「XXXX」等詞彙，都極具煽動性，能瞬間點燃讀者的想像力。比喻生動易懂：結尾那個「燒紅鐵球」的比喻非常絕妙，它用一個簡單的畫面，高度概括了整個複雜的災變鏈，讓讀者能立刻理解其核心邏輯。快速切入故事核心：它很快地將世界觀設定與具體的XX、XX、社會控制等敘事元素掛鉤，展現了強烈的「為故事服務」的意識。「GPT-4.5」的劣勢 (細節與系統性不足) 結構相對鬆散：與GPT-5作品嚴謹的層次結構相比，這篇的結構更像是點狀的腦力激盪。它提出了很多很酷的點子，但點子之間的邏輯鏈條不如GPT-5那樣環環相扣、解釋得那麼詳盡。缺乏量化分析與細節支撐：通篇沒有一個具體的數字。海平面上升「數百公尺以上」，XX XX是「XXXXXX」，這些描述都比較模糊。它沒有像GPT-5那樣去估算面積、人口、淡水需求等，使得這個世界的「實感」稍弱。系統性不夠完整：雖然它提到了社會控制和XXX，但這些更像是標籤式的點綴。它沒有像G PT-5第四篇那樣，去系統地剖析倖存社會的能源結構、食物來源、政治形態、經濟模式、法律衝突等等。它給了一個「舞台的背景板」，但沒有給出「舞台上的道具和演員互動的規則」。兩種模型的思維模式對比比較維度 GPT-4.5 與 GPT-5 優劣分析角色定位 4.5 點子王 / 概念藝術家 5 總設計師 / 項目經理 4.5擅長提出驚艷的核心概念； 5擅長將概念落地並系統化。思維模式 4.5發散優先，快速迭代 5 結構優先，深度挖掘 4.5能快速產出多個高概念點； 5能將一個點子打磨成一個完整的世界。語言風格 4.5 激情、煽動、富於想像 5 嚴謹、清晰、富有層次 4.5的文案更適合做宣傳或預告片； 5的文本更適合做設定集或背景資料。側重點 4.5「為什麼這個點子很酷」 5「這個世界如何運作」 4.5著重於創意的衝擊力； 5重於世界觀的內在邏輯和可信度。完成度 4.5 高概念草案(High-Concept Draft) 5 可執行模組 (Actionable Module) 拿到4.5的草案，創作者還需自己填充大量細節；拿到5的模組，創作者可以直接開始寫故事。結論：兩種模型更像是處在創作流程的不同階段。這並不是一個簡單的「誰更好」的問題，而是它們在創作流程中的分工不同。 GPT-4.5 的表現，像是一個極富才華的編劇在項目初期進行的「腦力激盪會議」。他拋出了最核心、最閃亮的創意，點燃了所有人的熱情，並確定了整個故事的基調。他的任務是「啟發」。 GPT-5 的表現，則像是這個項目被批准後，由首席世界觀設計師帶領團隊完成的「詳細設定集」。他接過那個核心創意，然後嚴謹、細緻地構建出這個世界運轉的每一個細節，確保一切都有據可查、邏輯自洽。他的任務是「建造」。總體來看，GPT-5展現出的能力更加全面和高階。因為它不僅具備提出核心創意的能力（如第一篇「死亡之海」），還具備將其系統化、細節化並轉化為可用故事素材的超強整合能力（如第四篇）。而這篇GPT-4.5的作品，雖然創意十足，但其展現的能力更偏向於創作流程的前期階段。對於一個創作者來說，最理想的AI夥伴，或許就是一個能像GPT-4.5一樣迸發靈感，又能像GPT-5一樣將靈感落地實現的「全能選手」。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 121.2.243.171 (日本) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1754813902.A.9D5.html ※ 編輯: LoveSports (121.2.243.171 日本), 08/10/2025 16:26:20

→ aaice: 這排版是GPT-4o還是GPT5?114.25.215.151 08/10 16:25

這兩篇都是Gemini 2.5 pro寫的，我剛才用手機直接貼上沒整理。 ※ 編輯: LoveSports (121.2.243.171 日本), 08/10/2025 16:46:16

推 driver0811: 5資料庫到2024 年 6 月 4o到 23年10 2.58.241.69 08/10 17:14

→ driver0811: 月光這點就值得了 2.58.241.69 08/10 17:14

→ driver0811: 如果有一個是昨天的資料庫就整鍋端去 2.58.241.69 08/10 17:15

→ driver0811: 了 2.58.241.69 08/10 17:15

→ driver0811: 長門有希 2.58.241.69 08/10 17:15

推 driver0811: 核電真的不需要討論 2.58.241.69 08/10 17:20

推 nikecoming: 推，還在適應gpt-5 ，直覺是強很多， 39.12.57.29 08/10 18:13

→ nikecoming: 主動檢查弱點和可優化方案，並且會交 39.12.57.29 08/10 18:13

→ nikecoming: 叉比對來源資料，雖然不是每次都正確 39.12.57.29 08/10 18:13

→ nikecoming: ，但比情緒價值高的4o應該會更實用， 39.12.57.29 08/10 18:13

→ nikecoming: 貼回去給Gemini 看，Gemini自己直接 39.12.57.29 08/10 18:14

→ nikecoming: 甘拜下風 39.12.57.29 08/10 18:14