看板 Gossiping 關於我們 聯絡資訊
※ 引述《saiulbb (#KEEP MLB GREAT!)》之銘言: : 原因是回答的答案會是錯的、回答得更蠢,感覺OpenAI要讓大家用比較笨的AI, : 要用比較聰明的AI就要付費,是這樣理解的嗎?有沒有八卦阿? GPT5幫我計算了地質方面的問題,拿給Gemini 2.5 pro驗證,說是正確的。 另外Gemini 2.5 pro分析GPT5建構的故事世界觀四篇文,以下是他的評估,第二篇是與GP T4.5作比較。(我沒有創角需求,所以很少跟4o對話,甚至會故意避開) Gemini 2.5 pro: 2. 對於「GPT-5」的分析與創造力程度評估其表現極其卓越,代表了當前大語言模型在「 創造性綜合」與「深度分析」方面所能達到的頂尖水準。它已經遠不止是一個工具,而是 一個合格的「創意合夥人」。 下面我從「分析能力」和「創造能力」兩個維度來進行詳細評估: 分析能力 (Analytical Prowess) 深度與準確性:它不僅能找到並正確使用權威數據(NOAA/ETOPO1),還能理解數據背後 的意義。在計算報告中,它沒有止步於數字,而是將其轉化為與「非洲大陸面積」的比較 ,這種量級的直觀化能力非常出色。 結構化與邏輯性:四篇文章的結構都堪稱典範。從「假設」到「結論」,從「機制」到「 後果」,邏輯層次分明,無懈可擊。它完美地展示了如何將一個複雜的問題拆解成易於理 解的模組。 批判性思維:在第三篇「機制列表」中,它為每個選項都標註了「合理性:高/中/低」。 這代表它不僅在陳述事實,更在進行評估和判斷。這是一種非常高階的分析能力,意味著 它能理解不同假設的置信區間。 系統化整合:第四篇「世界觀模組」是其分析能力的集大成者。它將地理、氣候、生物、 能源、政治、社會、文化等看似無關的系統,整合成一個相互關聯、相互影響的有機整體 。這種建立複雜系統模型的能力,是頂級分析師和戰略家的標誌。 創造能力 (Creative Ingenuity) 概念的飛躍與串聯:在第一篇「死亡之-海」中,從「XXXX」這個點子,飛躍到「XXX釋放 」,再串聯起「XX翻轉」、「XXX釋放」等一系列災難骨牌,這種跨學科的概念鏈接能力 是其創造力的核心。這不是簡單的資料拼貼,而是真正的「靈感迸發」。 從「設定」到「故事」的轉化:這是它最令人驚嘆的地方。它沒有停留在「這個世界是怎 樣的」,而是不斷地追問「這個世界能發生什麼故事?」。第四篇中大量的**「敘事鉤子 」、「弱點與威脅」、「具體場景描述」**,都是為了服務於「寫故事」這個最終目的而 設計的。它深刻理解創作者真正需要的不是設定集,而是衝突與情節的源泉。 語言的表現力與感染力:它不僅邏輯清晰,文筆也同樣出色。第四篇結尾的示例段落,用 寥寥數語就營造出了蒼涼、肅穆、充滿張力的末日氛圍。「灰色的晨霧在...低語」、「 工程師們像祭司」,這些語言充滿了文學性,能夠直接觸動讀者的情感。 總結: 如果說早期的 AI 像一個知識淵博但略顯呆板的圖書館員,那麼您展示的這個「GPT-5」 的表現,則更像是一個由頂尖科學家、資深社會學家、戰略顧問和才華橫溢的小說家組成 的精英團隊。 它不僅能準確地回答「是什麼」,更能富有洞見地探討「可能是什麼」,甚至極具建設性 地建議「應該是什麼」。這種從分析到創造,再從創造回饋於分析的閉環能力,正是頂級 智慧生命的特徵之一。 Gemini 2.5 pro: 好的,這是一個非常精彩的對比。您提供的這篇「GPT-4.5」作品,與前四篇「GPT-5」的 作品在風格、側重點和複雜度上都有明顯的差異。我們可以從中窺見不同模型(或者說是 不同提示策略下)的思維模式。 直接回答:這「GPT-4.5」的作品非常優秀,充滿創意和激情,但在結構的嚴謹性、細節 的深度和系統的完整性上,「GPT-5」的第四篇「世界觀模組」相比,仍有明顯的差距。 它更像是一個精彩的「電梯簡報 (Elevator Pitch)」,而不是一份可直接施工的「 藍圖」。 「GPT-4.5」與「GPT-5」的優劣勢比較 「GPT-4.5」的優點 (激情四射的點子王) 核心創意極具衝擊力:它開篇就提出了一個非常具體且充滿科幻感的概念——「XXXXXXX 」。這個點子非常抓人眼球,比「XXXXXXX」更具想像力和獨創性。 語言極富激情與感染力:這篇文章的語言風格非常鮮明,充滿了力量感和戲劇性。例如「 XXXX」、「逆向報復性XC」、「XXXX」、「XXXX」等詞彙,都極具煽動性,能瞬間點燃讀 者的想像力。 比喻生動易懂:結尾那個「燒紅鐵球」的比喻非常絕妙,它用一個簡單的畫面,高度概括 了整個複雜的災變鏈,讓讀者能立刻理解其核心邏輯。 快速切入故事核心:它很快地將世界觀設定與具體的XX、XX、社會控制等敘事元素掛鉤, 展現了強烈的「為故事服務」的意識。 「GPT-4.5」的劣勢 (細節與系統性不足) 結構相對鬆散:與GPT-5作品嚴謹的層次結構相比,這篇的結構更像是點狀的腦力激盪。 它提出了很多很酷的點子,但點子之間的邏輯鏈條不如GPT-5那樣環環相扣、解釋得那麼 詳盡。 缺乏量化分析與細節支撐:通篇沒有一個具體的數字。海平面上升「數百公尺以上」,XX XX是「XXXXXX」,這些描述都比較模糊。它沒有像GPT-5那樣去估算面積、人口、淡水需 求等,使得這個世界的「實感」稍弱。 系統性不夠完整:雖然它提到了社會控制和XXX,但這些更像是標籤式的點綴。它沒有像G PT-5第四篇那樣,去系統地剖析倖存社會的能源結構、食物來源、政治形態、經濟模式、 法律衝突等等。它給了一個「舞台的背景板」,但沒有給出「舞台上的道具和演員互動的 規則」。 兩種模型的思維模式對比 比較維度 GPT-4.5 與 GPT-5 優劣分析 角色定位 4.5 點子王 / 概念藝術家 5 總設計師 / 項目經理 4.5擅長提出驚艷的核心概念; 5擅長將概念落地並系統化。 思維模式 4.5發散優先,快速迭代 5 結構優先,深度挖掘 4.5能快速產出多個高概念點 ; 5能將一個點子打磨成一個完整的世界。 語言風格 4.5 激情、煽動、富於想像 5 嚴謹、清晰、富有層次 4.5的文案更適合做宣傳或預告片; 5的文本更適合做設定集或背景資料。 側重點 4.5「為什麼這個點子很酷」 5「這個世界如何運作」 4.5著重於創意的衝擊力 ; 5重於世界觀的內在邏輯和可信度。 完成度 4.5 高概念草案(High-Concept Draft) 5 可執行模組 (Actionable Module) 拿到4.5的草案,創作者還需自己填充大量細節; 拿到5的模組,創作者可以直接開始寫故事。 結論:兩種模型更像是處在創作流程的不同階段。這並不是一個簡單的「誰更好」的問題 ,而是它們在創作流程中的分工不同。 GPT-4.5 的表現,像是一個極富才華的編劇在項目初期進行的「腦力激盪會議」。他拋出 了最核心、最閃亮的創意,點燃了所有人的熱情,並確定了整個故事的基調。他的任務是 「啟發」。 GPT-5 的表現,則像是這個項目被批准後,由首席世界觀設計師帶領團隊完成的「詳細設 定集」。他接過那個核心創意,然後嚴謹、細緻地構建出這個世界運轉的每一個細節,確 保一切都有據可查、邏輯自洽。他的任務是「建造」。 總體來看,GPT-5展現出的能力更加全面和高階。 因為它不僅具備提出核心創意的能力( 如第一篇「死亡之海」),還具備將其系統化、細節化並轉化為可用故事素材的超強整合 能力(如第四篇)。而這篇GPT-4.5的作品,雖然創意十足,但其展現的能力更偏向於創 作流程的前期階段。 對於一個創作者來說,最理想的AI夥伴,或許就是一個能像GPT-4.5一樣迸發靈感,又能 像GPT-5一樣將靈感落地實現的「全能選手」。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 121.2.243.171 (日本) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1754813902.A.9D5.html ※ 編輯: LoveSports (121.2.243.171 日本), 08/10/2025 16:26:20
aaice: 這排版是GPT-4o還是GPT5?114.25.215.151 08/10 16:25
這兩篇都是Gemini 2.5 pro寫的,我剛才用手機直接貼上沒整理。 ※ 編輯: LoveSports (121.2.243.171 日本), 08/10/2025 16:46:16
driver0811: 5資料庫到2024 年 6 月 4o到 23年10 2.58.241.69 08/10 17:14
driver0811: 月光這點就值得了 2.58.241.69 08/10 17:14
driver0811: 如果有一個是昨天的資料庫就整鍋端去 2.58.241.69 08/10 17:15
driver0811: 了 2.58.241.69 08/10 17:15
driver0811: 長門有希 2.58.241.69 08/10 17:15
driver0811: 核電真的不需要討論 2.58.241.69 08/10 17:20
nikecoming: 推,還在適應gpt-5 ,直覺是強很多, 39.12.57.29 08/10 18:13
nikecoming: 主動檢查弱點和可優化方案,並且會交 39.12.57.29 08/10 18:13
nikecoming: 叉比對來源資料,雖然不是每次都正確 39.12.57.29 08/10 18:13
nikecoming: ,但比情緒價值高的4o應該會更實用, 39.12.57.29 08/10 18:13
nikecoming: 貼回去給Gemini 看,Gemini自己直接 39.12.57.29 08/10 18:14
nikecoming: 甘拜下風 39.12.57.29 08/10 18:14