看板 AI_Art 關於我們 聯絡資訊
https://www.youtube.com/watch?v=75b_5Y_jipg
這部影片主要評測了 OpenAI 最新發布的圖像生成模型 GPT Image 1.5,並將其與目前被 認為是最強的圖像模型 Nano Banana Pro(根據影片內容推測指 Google Imagen 3)進行 了詳細的對比測試。 以下是影片的重點摘要: 1. 核心介紹 GPT Image 1.5:OpenAI 的最新圖像生成模型(可能是 DALL-E 3 的升級版)。 特點:免費開放給所有用戶(包括免費用戶),消除了前代模型常見的「黃色色 調 (Yellow tinge)」,文字渲染能力提升。 Nano Banana Pro:影片中作為對比的標竿模型(YouTuber 稱其為目前最強,且影片 結尾提到「Google set the bar way too high」,推測指 Google Imagen 3)。 2. 對比測試結果 影片透過多個高難度提示詞(Prompt)進行了殘酷的對決,結果如下: GPT Image 1.5 勝出的項目 (: 表情與情緒:在描繪複雜情緒(如寬慰、期待、嫉妒、懷舊)時,GPT Image 1.5 的表現比對手更精準生動。 數學作業 (手寫字):能用逼真的手寫字跡解出數學題,且未隨意更改背景,效 果優於對手。 介面生成 (UI):在生成 YouTube 搜尋結果頁面時,拼字錯誤較少,縮圖和排版 更準確。 可訪問性:完全免費,使用門檻低。 Nano Banana Pro (Google Imagen 3) 勝出的項目 (): 世界知識與真實度:在生成特定生物(如罕見青蛙)、知名人物(名人/富豪) 以及遊戲畫面(如 Starcraft)時,準確度遠高於 GPT。GPT 常有「守門員 (Guardrails)」限制或生成錯誤特徵。 空間與技術理解: 室內設計:能準確還原房間照片的平面圖(Floor plan),GPT 則完全搞錯 空間配置。 圖表與數據:能將複雜的表格截圖精準轉換為統計圖表(Bar chart),並 正確計算比例,展現了強大的邏輯與視覺理解能力。 科學圖像:在生成熱成像圖(Thermal map)、深度圖(Depth map)和分割 圖時,準確度顯著領先。 漫畫翻譯/上色:在保留原漫畫細節的同時進行翻譯和上色,效果優於 GPT 。 圖解原理:在繪製神經網絡架構圖(Transformer diagram)時,結構正確且清 晰,GPT 則生成了錯誤的圖表。 平手或皆失敗: 大家來找碴 (Where's Waldo):兩者生成的臉部細節都崩壞,任務失敗。 時鐘與液體:生成「11:15 的時鐘與倒滿的酒杯」,兩者都有小瑕疵。 復古遊戲重製:將舊遊戲畫面轉為高清重製版,兩者表現相當。 3. 總結評價 GPT Image 1.5 是一個巨大的進步,修正了前代的色偏問題,文字和表情生成能力很 強,且免費可用,是很好的入門選擇。 Nano Banana Pro (Google Imagen 3) 仍然是目前的圖像生成王者 (King)。它在真 實感、世界知識、空間邏輯以及處理複雜數據圖表的能力上,依然難以被超越。 4. 使用資訊 GPT Image 1.5 已經向所有 ChatGPT 用戶推送(包括免費用戶)。 支援最高 1.5K 解析度,需透過提示詞指定長寬比(如 Horizontal/Vertical)。 -- gemini整理 gpt終於擺脫奇怪的黃色了嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.245.116 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1765944164.A.6CB.html
Bustycat: GPT Image 1.5在Design Arena四個榜單的三個奪冠, 12/17 12:37
Bustycat: 僅修圖屈居第二;LMArena文生圖也奪冠,然而在修圖 12/17 12:37
Bustycat: 方面是ChatGPT用的版本第一、API接入的掉在第四 12/17 12:37
error405: 看了範例不覺得它該第一 嗯時間會證明 12/17 12:39
Bustycat: ChatGPT目前生圖都是1.5了,丟到檢測工具都是和1不 12/17 12:39
Bustycat: 同結果 12/17 12:39
error405: https://www.youtube.com/watch?v=ADqxZY5rpHg 別家測試 12/17 17:26
error405: https://i.meee.com.tw/JlEaHeU.png 12/17 17:27
Bustycat: 這篇似乎不知道Imagen是另一系列模型、並非Gemini? 12/17 21:19
Supasizeit: 用AI翻譯AI生成的內容 幻覺加成 12/17 21:55
Athly: 審查嚴格程度比對手高太多了,不堪用 12/19 00:55
Athly: 然後上面那篇文章提到的 imagen3 其實一年前的google老生 12/19 00:58
Athly: 圖模型,也是我最愛用的一個。質感,尺度都大勝現在的image 12/19 00:58
Athly: n4, 但是已經被google下架了,就算在imageFX也沒得用 12/19 00:58