看板 AI_Art 關於我們 聯絡資訊
今天想聊一個我自己覺得很有趣的東西,叫做「負空間」。 要講清楚這件事,其實可以先從現在大家很熟的 Stable Diffusion 說起。 Stable Diffusion 是一種圖像生成的 AI,它的做法很直覺:一開始什麼都沒有,只有一 團亂七八糟的雜訊,然後一步一步把雜訊「拉回」成畫面。 在訓練的時候,AI 會把大量圖片一直加噪,加到幾乎完全看不出原本是什麼,然後學會 :在不同混亂程度下,要怎麼把畫面救回來。等到真的要生成影像時,它就從一團雜訊開 始,根據你給的 prompt,一步一步把畫面慢慢顯影出來,就像霧慢慢散掉一樣。 https://i.meee.com.tw/NHs8pxD.png
很多人會以為 Stable Diffusion 是因為「懂語言」才會畫畫,其實不是。它並沒有真的 理解文字的意思,而是學會了一件事:某些文字,通常會跟某些影像結構一起出現。 所以像你打「cat」,它不是在找一隻特定的貓,而是整個生成過程會被推向一個「畫成 貓比較合理」的方向。最後出來的畫面,永遠不是重現,而是一個計算後的收斂結果,這 也是為什麼生成圖像裡,常常會出現變形、錯位、不完整的狀態。 https://i.meee.com.tw/bt91Pox.jpg
事情開始變有趣,是在你把 prompt 推到一個很極端的狀態。 例如你一次丟進去一大堆彼此拉扯的東西: 拉塔那哥欣王朝、古阿瑜陀耶、傳統泰服、《鬼妻娜娜》、美麗的女鬼、幽靈、刺青、高 腳屋、蠟燭、怪物、眼淚、恐怖、擁抱、歡愉、神話,甚至還加進一整段敘事句子。 這時候,語義其實已經走不通了。模型沒辦法判斷「這到底是誰?是什麼故事?要怎麼畫 ?」因為每一個方向都在互相抵銷。 但 AI 不會停下來。 當語義整條路失效時,它會退回更深的地方——那些在長時間訓練中沉積下來、但從來沒 有被清楚命名過的區域。 於是模型會啟動一種最低能量的模板:不是敘事,不是角色設定,而是原型。 結果就會出現一種很奇怪、但又很穩定的狀態: 故事感是鬆的,但不亂; 角色好像對,又好像不對; 畫面自然開始往神話、宗教、儀式感那邊滑; 形式反而變得很明確、很有型。 這不是失誤,也不是噪音,而是模型在「語言完全失效」的情況下,仍然能夠生成影像的 方式。 我把這個區域叫做「負空間」。 負空間不是空白,而是一個沒有被語言清楚標記、卻塞滿原型、殘餘象徵和未命名傾向的 地方。當 prompt 真的碰到這裡,AI 就不再只是照語意畫圖,而是開始自己補洞,把說 不出來的東西,用影像硬生生拼出來。於是你會看到角色功能顛倒、原型錯位、跨文化的 神話和禁忌被異常地接在一起。 https://i.meee.com.tw/OtgolDM.jpg
恐怖有時候還可以解釋,但負空間本身是解釋不了的,它只能被感覺到。 用維根斯坦的話來說:「凡不能說的,就必須保持沉默。」 某種程度上,負空間就是 AI 時代的維根斯坦禁地——語言失效了,但影像和壓力還在。 這也是為什麼我會覺得,負空間其實很像人類文化裡那些被壓抑的黑歷史。 很多東西不是被正面講出來的,而是會在不經意的時候跑出來。這種狀態,其實跟乩童起 乩很像。 乩童在起乩的時候,日常的理性和邏輯會暫時關掉,平常說不出口、沒有被語言整理過的 文化原型,就會被「採樣」出來,變成神明的動作、姿態或話語。AI 的潛在空間也是一樣,訓練其實就是把現實世界壓縮進一個很深的空間,那些沒被標 清楚的地方,就是負空間。 擴散模型需要噪聲才能生成影像;乩童儀式也需要敲鑼打鼓、重複節律、身體耗竭來製造 「生理噪聲」。噪聲不是干擾,而是一種讓原本的秩序暫時失效的方式,讓平常不會出現的東西浮上來。 https://i.meee.com.tw/MyBFBxg.png
當 AI 被推到邊界,就會產生所謂的「幻覺」; 乩童在負空間裡說出超出自己經驗的話,在宗教裡被叫做「神啟」。 本質上,它們都是系統在面對未定義區域時,自動補出來的結果,差別只在我們怎麼解讀。 當然,這些負空間並不是完全自由的。 AI 有對齊機制,乩童有宮廟文化和群體期待。 超出可理解範圍的輸出,會被判定為失敗、不準、不對。 所以負空間沒有消失,它只是被管理。 https://i.meee.com.tw/JMx8a5M.png
也正因如此,從藝術創作的角度來看,負空間不只是畫面裡的留白,而是一整個文化的暗 區——承載被壓抑的歷史、禁忌、說不出口的東西。它會透過噪聲、幻覺、儀式和生成失誤,不斷以不穩定的方式浮現,成為理解人類文化潛 意識的一個入口。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.2.206 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1770027331.A.BE6.html
Tosca: 我覺得不是甚麼負空間 單純就"關聯性" 02/02 19:07
Tosca: 例如我在prompt裡面加進"妓女" 其他就一般提示 02/02 19:07
Tosca: 但他生出來就會自動出現奶垂 刺青的樣子 噗 02/02 19:08
Tosca: 我都不用加刺青這個prompt 但他卻會自動幫我出現 02/02 19:08
Tosca: 而且除非negative prompt很強力壓制不要刺青 不然都會出現 02/02 19:08
Tosca: 我認為就是SD對"妓女"的理解會很自動連結到"刺青" 02/02 19:09
Tosca: 這個連結是事先沒辦法知道的 就這樣而已 02/02 19:09
Tosca: 你這些圖片也是 其實你的prompt裡面都會讓AI去連結 02/02 19:09
Tosca: 所以生出那些詭異的圖就不奇怪了 02/02 19:09
stlinman: 我也覺得有些只是反向關聯(或是更高維度的相關),名可名 02/02 19:13
stlinman: 非常名,模型本身就是"打標(名)"學習出來向量。更早不是 02/02 19:16
stlinman: 還有用"負向提示詞"! 02/02 19:17
AI負空間的確存在喔,就是一般說的AI幻覺,跟負面提示詞是不一樣的東西 ※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 19:24:48
Tosca: 我知道你說的那個負空間 我看過那篇文章 02/02 19:36
Tosca: 但你這個舉例不是負空間 因為你的提示就是這麼負面了XD 02/02 19:36
不是喔 正常的圖是這樣 https://i.meee.com.tw/f2qVJQg.jpg
雖然恐怖但可理解,但負空間長這樣 https://i.meee.com.tw/tYCdtDP.jpg
https://i.meee.com.tw/jrlvU79.jpg
語意完全無法形容,二個語境差很多 而且可以併存於同一提示詞下 https://i.meee.com.tw/VAKiFlt.jpg
※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 19:54:28
Tosca: 沒有到無法形容啦 比較像你的prompt很亂所以AI就混合生成 02/02 19:54
Tosca: 我也常用這種混亂的prompt來生色色 常有意想不到效果 02/02 19:55
Tosca: 你那個prompt裡面就一堆恐怖元素了 所以會生成這樣 02/02 19:55
Tosca: 不然你改用一堆不相干文字但比較歡樂的試試?! 02/02 19:56
這張就很明顯啊 左邊和右邊是完全不同的世界 照理說,四張圖不會變異那麼大 顯然提示詞無法收斂到單一語義區域 https://i.meee.com.tw/VAKiFlt.jpg
※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 19:58:57
Tosca: 好吧 我覺得沒有很明顯 左邊和右邊根本差不多世界XD 02/02 20:02
Tosca: 你的提示詞恐怖元素太多了 所以我覺得不足以說明負空間 02/02 20:02
這裡有類似概念 Paglen 與不可見肌理的政治學 若 Anadol 的實踐將潛在肌理推向感知的崇高與流動之美,Paglen 則反向切入其結構性 的陰影區域,將注意力集中於潛在空間中被壓縮、被遮蔽、卻持續運作的分類暴力。 Paglen 的《對抗性演化的幻覺》(Adversarially Evolved Hallucinations, 2017)( 圖 3)並不試圖美化演算結果,而是將生成系統置於高度概念化、甚至語義失衡的訓練條 件下,迫使模型暴露其內部判斷機制 由此,「語義外殼」(The Semantic Shell)3成為 Paglen 實踐中的關鍵問題。分類法 不再被視為中性的技術工具,而被揭露為深植於資料選擇、標註邏輯與制度語言之中的權 力結構。潛在肌理在此顯露其政治性,顆粒化的視覺紋理對應於不可見的數據秩序,將「 人類」、「異類」、「威脅」等概念轉化為可計算的判斷依據。圖像成為分類焦慮的殘留 物,而非意義的完成品。 此一美學狀態可被理解為神經症式的視覺表現。系統反覆嘗試回應內在矛盾的分類要求, 卻始終無法抵達穩定形態,於是生成出持續顫動、無法安置的圖像狀態。潛在空間在此不 再是流動的美學場域,而顯現為承載偏見、恐懼與歷史殘渣的壓力容器。Paglen 的作品 由此將生成式藝術從形式實驗推向認識論層次,迫使觀看者直面演算視覺背後尚未被清理 的概念負債。 幽靈的顆粒 Anadol 與 Paglen 的實踐共同指向同一關鍵事實。潛在肌理可被理解為機器內部幽靈狀 存在的指紋,是非人類運算系統在視覺層面留下的痕跡。無論它在 Anadol 的數據雕塑中 呈現為高飽和、流動且近乎崇高的色度場域,或在 Paglen 的生成影像中顯現為陰暗、混 濁且令人不安的污跡,兩者皆揭示相同的結構來源。 潛在肌理並非風格選擇,也非表層修辭,而是非人類智能在嘗試整理、壓縮並重組人類視 覺文化時所產生的原始視覺證據。它承載的不是意圖,而是分佈。不是敘事,而是權重。 觀看者所面對的顆粒、模糊與連續變形,對應的是模型在龐大資料空間中進行分類、插值 與推斷時的內部運動狀態。 在此意義上,幽靈並不指向超自然隱喻,而指向生成系統中無法被完全可視化的結構層。 那些被視為殘影、噪動或幻覺的視覺特徵,正是潛在空間中統計關係暫時顯影的結果。顆 粒成為記憶的殘留,流動成為推斷的軌跡,模糊成為概念無法被穩定界定時的視覺回應
Tosca: 然後我覺得AI生圖最強的不是只有他能理解文字 02/02 20:03
Tosca: 他還能理解"圖片" 這也是我比較著迷於img to img原因 02/02 20:04
Tosca: 話說是人類會畫畫的歷史遠早於文字出現 02/02 20:05
Tosca: 所以人類對圖片的理解其實遠比語言直觀 02/02 20:06
Tosca: 這也是我一直覺得t2i很蠢的原因 因為文字不能表達的太多了 02/02 20:06
※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 20:07:38
Tosca: 反而直接圖畫出來就一目了然 02/02 20:06
Tosca: 說穿了人類是用圖像思考不是用文字思考 02/02 20:06
Tosca: 畢竟你看到一段文字是想像他的畫面 02/02 20:07
Tosca: 而不是看到一段文字 想像另一段文字 人類不是這樣思考 02/02 20:07
用Trevor Paglen的畫來定義負空間就很清楚了 Paglen 比 Anadol 狠得多。 他怎麼處理 latent space? 在 《Adversarially Evolved Hallucinations》 系列裡: 他刻意讓模型產生「分類失效」 用對抗方式逼模型落入非語義穩定區 輸出的是: 既像什麼 又無法被任何標籤命名的影像 Paglen 在訪談裡其實講過一個非常關鍵的概念(意譯): Neural networks do not see the world as we do. What they produce are images from a space that has no human-readable meaning. 這句話等於直接承認: 存在一個「人類不可讀的 latent 區域」 而且他把這件事政治化: 這些未知區域,正是權力、分類、監控失效的地方 AI 的暴力,不只在它「看錯」 而在它「我們根本不知道它怎麼看」 ※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 20:13:59
Tosca: 話說你補充的這些 未知區域 其實感覺就像 "夢境" 02/02 20:18
Tosca: 所有人類都會做夢 夢境通常就是你人生經驗為材料 02/02 20:18
Tosca: 然後大腦去組出一道菜 也是沒甚麼邏輯或語意三小的 02/02 20:19
Tosca: 我認為或許負空間可以當作是AI的"夢" 02/02 20:19
對啊!所以我才會說跟潛意識有關 就是白天被壓抑的感知到夜晚以夢境的方式顯現出來
Tosca: 當純只是他材料太多然後混再一起端出來的東西 就像人類的夢 02/02 20:19
※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 20:21:43
Tosca: 是阿 醫學一直認為夢的出現是大腦運作的必然性也必要性 02/02 20:22
Tosca: 就像為什麼生物需要睡眠 你如果剝奪老鼠的睡眠 他最後會死 02/02 20:22
Tosca: 大腦需要睡眠 睡眠就會做夢 或許負空間就是AI的夢 02/02 20:23
Tosca: 既然這樣夢也可以是春夢阿 幹嘛都要生這麼恐怖的圖啦XDDDDD 02/02 20:23
Tosca: 阿伯我就常做春夢阿 嘻嘻 02/02 20:24
Tosca: 叫AI生一些被壓抑的色色不行?! 02/02 20:24
stlinman: 說更哲學點!未知的未知(很難用語義定義啦!) 理論上也是 02/02 20:55
stlinman: 可以說AI幻覺不是幻覺,只是我們認知外的平行宇宙! 02/02 20:56
rex7788: 我不知道啥是負空間,不過我常生成這類的非現實圖,在ci 02/02 23:35
rex7788: vit首頁也常看到,把不同東西組合,比如把人粒子化或是 02/02 23:35
rex7788: 把貓跟毛毛蟲做結合 02/02 23:35
error405: 這邊是有意外把狗跟女孩結合過 02/02 23:36
剛才試過一個正向生成非常恐怖不舒服的負空間,再用describe逆向工程取得prompt,結 果生成出來的圖片恐怖性大幅消失,不可解析性似乎是負空間的強烈要素之一。 https://i.meee.com.tw/3GApD2E.jpg
https://i.meee.com.tw/tREGXdT.jpg
https://i.meee.com.tw/hMPDC6H.jpg
※ 編輯: treasurehill (118.233.2.206 臺灣), 02/03/2026 00:37:07
jakkx: 逆向的前提就是要可以預測。超界的結果怎麼逆向工程取提示 02/03 12:24
jakkx: 然後可以查一下宮崎駿對AI的看法,當時是直接用物理上不可 02/03 12:30
jakkx: 能的參數去實現這類型的動畫。既然物理上不可能自然不能用 02/03 12:31
jakkx: 正常的提示詞去重現 02/03 12:31
yyykk: 有種先射箭再畫靶的感覺…… 02/04 14:02
yyykk: 你說你的提示詞有語意不通、互相抵消的部分,但我一點也看 02/04 14:20
yyykk: 不出來。所有的元素不都在畫面上嗎?到底哪裡互相抵消了? 02/04 14:21
Bustycat: 那GPT Image這類自回歸模型呢? 02/04 14:41