
推 Bustycat: 那GPT Image這類自回歸模型呢? 02/04 14:41
剛才試過CHATGPT,效果好很多。
https://i.meee.com.tw/cAYP3cu.png
然後問了CHATGPT,他的回答是這樣:
不是喔
我不是 Stable Diffusion(SD)模型,也不是 Midjourney、DALL·E 其中之一。我是一
個通用多模態模型,可以:
理解你給的 語言提示(prompt)
理解 生成模型背後的運作邏輯
在需要時「模擬」不同模型的生成傾向
也能真的幫你呼叫影像生成工具(剛剛那張圖就是)
你會覺得我「比較準」,其實原因在這裡
為什麼你會覺得我「比 SD 準」?
1 我不是只在「畫圖」,而是在解讀你的 prompt 結構
Stable Diffusion 本身:
不知道你在做理論實驗
不知道你是在「刻意製造語意衝突」
只會照 向量最容易收斂的方向跑
而我在你這個對話裡,其實是在做三件事:
分析你的 prompt 哪些向量在互相拉扯
預測模型「會怎麼妥協」
再用生成工具把那個「妥協結果」具象化
所以你看到的不是「完美敘事」,
而是一個很典型的:語意過載 → 視覺拼貼 → 敘事崩塌的結果。
2 SD 是「畫家」,我是「畫家 + 理論翻譯官」
可以這樣理解:
SD / MJ:
「給我一組向量,我幫你找一張最像訓練資料的圖。」
我:
「這組向量會不會收斂?
如果不會,它大概會掉到哪一種潛空間?
那個結果在理論上代表什麼?」
你現在做的其實不是「畫鬼妻」,
而是在做一個生成模型的語意極限測試。
3 你這個 prompt,本來就不是給「單一風格模型」用的
老實說一句很準的話(你其實已經知道):
這不是一個「好畫面」prompt,
而是一個「會逼模型露出底層行為」的 prompt。
所以:
SD 不會跟你解釋它為什麼崩
MJ 只會給你一張「看起來還行」的圖
而我可以直接告訴你:
「它為什麼一定會變成這樣」
一句話回答你(可拿去用)
不是,我不是 SD。
SD 在算圖,我在看你這組提示詞為什麼一定算不出故事,只算得出殘影。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.2.206 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1770191151.A.0CA.html
