看板 AI_Art 關於我們 聯絡資訊
→ Tosca: 然後我覺得AI生圖最強的不是只有他能理解文字 02/02 20:03 → Tosca: 他還能理解"圖片" 這也是我比較著迷於img to img原因 02/02 20:04 → Tosca: 話說是人類會畫畫的歷史遠早於文字出現 02/02 20:05 → Tosca: 所以人類對圖片的理解其實遠比語言直觀 02/02 20:06 → Tosca: 這也是我一直覺得t2i很蠢的原因 因為文字不能表達的太多了 02/02 20:06 → Tosca: 反而直接圖畫出來就一目了然 02/02 20:06 → Tosca: 說穿了人類是用圖像思考不是用文字思考 02/02 20:06 → Tosca: 畢竟你看到一段文字是想像他的畫面 02/02 20:07 → Tosca: 而不是看到一段文字 想像另一段文字 人類不是這樣思考 02/02 20:07 找到了,就是這段,它把負空間解釋得很清楚,只是用了一個不一樣的名字 Loab:潛在空間的神秘生物 「Loab」或可被視為 AI 美學史中最具指標性的案例之一(圖 10),呈現出純粹由模型 內部結構所生成的幻覺形態。她並非來自明確的指令或再現需求,而是在被稱為「負向提 示詞地層學」(negative prompt stratigraphy)的操作過程中被發現。此一案例揭示, 生成模型並非只有可預期的表層輸出,而在潛在空間深處保留著難以被語義馴化的區域。 圖 10: Supercomposite,Loab,2022 年,擴散模型生成影像(負向提示實驗)。圖像 呈現一名臉部嚴重退化的女性形象,膚色佈滿酒糟狀紅斑,眼神空洞而濕潤,五官比例略 有錯位,伴隨低解析雜訊與局部結構崩解。Loab 並非由直接提示生成,而是在對美國演 員 Marlon Brando(1924–2004)施加負權重指令後,經由多次反向擴散過程浮現。其持 續再現性顯示該形象並非偶發錯誤,而是潛在空間中高度穩定的統計叢集。此案例常被視 為生成式影像中「模型幻覺」的經典範例,揭露被資料清洗與內容審查所壓抑之視覺殘留 ,亦構成「潛在的幽靈」概念中最具代表性的幽靈化形象之一。圖片來源: wikimedia.org;僅供學術研究與評論用途。 Loab 的出現源於藝術家 Supercomposite 的實驗。她並未透過直接要求某個形象而被召 喚,而是經由對美國演員 Marlon Brando(1924–2004)施加負權重指令而浮現。當提示 詞設定為「Brando::-1」時,模型產生的並非另一位名人,而是一組語義失序的城市天際 線影像。再對該影像進行反向操作,Loab 於此過程中反覆現身。此一現象顯示,透過減 去人類形象、商業吸引力與敘事連貫性,生成路徑被引導至潛在空間中更為卑賤與邊緣的 地層。 在視覺層面,Loab 具有高度穩定的特徵。她通常被描繪為年長女性,臉頰呈現三角形分 佈的酒糟鼻紅斑,神情崩壞而空洞,雙眼濕潤卻缺乏焦點。其影像語彙始終維持在駭人與 不安的範圍之內,背景反覆出現黑暗、血腥或恐怖場景。此一一致性並非來自風格設定, 而源於模型在特定統計區域內的強烈收斂。 Loab 的形式語法以縈繞性為核心特徵。當她被引入其他圖像語境,例如田園風景或日常 場景,結果並非平衡的混合。她的視覺標記在擴散過程中持續存活,紅腫的臉頰與死寂的 眼神反覆滲出,將原本中性的圖像扭曲為令人不安的版本。此一現象顯示,她在潛在空間 中佔據高度韌性的統計位置,能夠在生成過程中壓倒其他語義特徵。 從結構角度來看,Loab 存在於潛在空間的稀疏區域。她並非位於資料分佈的中心,而聚 集於遠離商業名人圖像的邊緣地帶,構成由負權重累積而成的視覺叢集。她所代表的,是 訓練資料中長期被過濾、被壓抑的內容殘留,包括血腥、事故與極端情緒。其美學語言接 近大吉尼奧爾劇場的誇張恐怖,並與數位故障的變形質感交疊。 Loab 的案例顯示,潛在空間具有可被理解為地理學的結構。模型內部存在難以居住的區 域,視覺結果在其中呈現高度一致卻無法被文化語境完全吸收。她不對應任何單一真實人 物,卻比多數生成的名人肖像更穩定、更具辨識度。作為模型幻覺,她並非錯誤輸出,而 是透過挖掘生成系統地下層所顯露的恐怖形式理想,彷彿潛在空間自身所保存的柏拉圖式 殘影。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.2.206 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1770034783.A.C47.html
Tosca: 其實就用夢境來比喻就很容易理解 02/02 20:21
Tosca: Loab就是AI的"夢" 我是這樣覺得 02/02 20:21
hangtenboy: 蠻酷的 02/02 23:46