[閒聊] GPT Image 1.5 評測摘要

作者error405 (流河=L)

看板AI_Art

標題[閒聊] GPT Image 1.5 評測摘要

時間Wed Dec 17 12:02:42 2025

https://www.youtube.com/watch?v=75b_5Y_jipg

這部影片主要評測了 OpenAI 最新發布的圖像生成模型 GPT Image 1.5，並將其與目前被認為是最強的圖像模型 Nano Banana Pro（根據影片內容推測指 Google Imagen 3）進行了詳細的對比測試。以下是影片的重點摘要： 1. 核心介紹 GPT Image 1.5：OpenAI 的最新圖像生成模型（可能是 DALL-E 3 的升級版）。特點：免費開放給所有用戶（包括免費用戶），消除了前代模型常見的「黃色色調 (Yellow tinge)」，文字渲染能力提升。 Nano Banana Pro：影片中作為對比的標竿模型（YouTuber 稱其為目前最強，且影片結尾提到「Google set the bar way too high」，推測指 Google Imagen 3）。 2. 對比測試結果影片透過多個高難度提示詞（Prompt）進行了殘酷的對決，結果如下： GPT Image 1.5 勝出的項目 (：表情與情緒：在描繪複雜情緒（如寬慰、期待、嫉妒、懷舊）時，GPT Image 1.5 的表現比對手更精準生動。數學作業 (手寫字)：能用逼真的手寫字跡解出數學題，且未隨意更改背景，效果優於對手。介面生成 (UI)：在生成 YouTube 搜尋結果頁面時，拼字錯誤較少，縮圖和排版更準確。可訪問性：完全免費，使用門檻低。 Nano Banana Pro (Google Imagen 3) 勝出的項目 ()：世界知識與真實度：在生成特定生物（如罕見青蛙）、知名人物（名人/富豪）以及遊戲畫面（如 Starcraft）時，準確度遠高於 GPT。GPT 常有「守門員 (Guardrails)」限制或生成錯誤特徵。空間與技術理解：室內設計：能準確還原房間照片的平面圖（Floor plan），GPT 則完全搞錯空間配置。圖表與數據：能將複雜的表格截圖精準轉換為統計圖表（Bar chart），並正確計算比例，展現了強大的邏輯與視覺理解能力。科學圖像：在生成熱成像圖（Thermal map）、深度圖（Depth map）和分割圖時，準確度顯著領先。漫畫翻譯/上色：在保留原漫畫細節的同時進行翻譯和上色，效果優於 GPT 。圖解原理：在繪製神經網絡架構圖（Transformer diagram）時，結構正確且清晰，GPT 則生成了錯誤的圖表。平手或皆失敗：大家來找碴 (Where's Waldo)：兩者生成的臉部細節都崩壞，任務失敗。時鐘與液體：生成「11:15 的時鐘與倒滿的酒杯」，兩者都有小瑕疵。復古遊戲重製：將舊遊戲畫面轉為高清重製版，兩者表現相當。 3. 總結評價 GPT Image 1.5 是一個巨大的進步，修正了前代的色偏問題，文字和表情生成能力很強，且免費可用，是很好的入門選擇。 Nano Banana Pro (Google Imagen 3) 仍然是目前的圖像生成王者 (King)。它在真實感、世界知識、空間邏輯以及處理複雜數據圖表的能力上，依然難以被超越。 4. 使用資訊 GPT Image 1.5 已經向所有 ChatGPT 用戶推送（包括免費用戶）。支援最高 1.5K 解析度，需透過提示詞指定長寬比（如 Horizontal/Vertical）。 -- gemini整理 gpt終於擺脫奇怪的黃色了嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.245.116 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1765944164.A.6CB.html

推 Bustycat: GPT Image 1.5在Design Arena四個榜單的三個奪冠， 12/17 12:37

→ Bustycat: 僅修圖屈居第二；LMArena文生圖也奪冠，然而在修圖 12/17 12:37

→ Bustycat: 方面是ChatGPT用的版本第一、API接入的掉在第四 12/17 12:37

→ error405: 看了範例不覺得它該第一嗯時間會證明 12/17 12:39

推 Bustycat: ChatGPT目前生圖都是1.5了，丟到檢測工具都是和1不 12/17 12:39

→ Bustycat: 同結果 12/17 12:39

→ error405: https://www.youtube.com/watch?v=ADqxZY5rpHg 別家測試 12/17 17:26

→ error405: https://i.meee.com.tw/JlEaHeU.png 12/17 17:27

推 Bustycat: 這篇似乎不知道Imagen是另一系列模型、並非Gemini？ 12/17 21:19

推 Supasizeit: 用AI翻譯AI生成的內容幻覺加成 12/17 21:55

推 Athly: 審查嚴格程度比對手高太多了，不堪用 12/19 00:55

推 Athly: 然後上面那篇文章提到的 imagen3 其實一年前的google老生 12/19 00:58

→ Athly: 圖模型，也是我最愛用的一個。質感，尺度都大勝現在的image 12/19 00:58

→ Athly: n4, 但是已經被google下架了，就算在imageFX也沒得用 12/19 00:58

→ error405: https://www.youtube.com/watch?v=aMBS3EbrWH8 12/23 08:25