[閒聊] 負空間的由來

作者treasurehill (寶藏巖公社，你還未夠班S)

看板AI_Art

標題[閒聊] 負空間的由來

時間Mon Feb 2 18:15:28 2026

今天想聊一個我自己覺得很有趣的東西，叫做「負空間」。要講清楚這件事，其實可以先從現在大家很熟的 Stable Diffusion 說起。 Stable Diffusion 是一種圖像生成的 AI，它的做法很直覺：一開始什麼都沒有，只有一團亂七八糟的雜訊，然後一步一步把雜訊「拉回」成畫面。在訓練的時候，AI 會把大量圖片一直加噪，加到幾乎完全看不出原本是什麼，然後學會：在不同混亂程度下，要怎麼把畫面救回來。等到真的要生成影像時，它就從一團雜訊開始，根據你給的 prompt，一步一步把畫面慢慢顯影出來，就像霧慢慢散掉一樣。 https://i.meee.com.tw/NHs8pxD.png

很多人會以為 Stable Diffusion 是因為「懂語言」才會畫畫，其實不是。它並沒有真的理解文字的意思，而是學會了一件事：某些文字，通常會跟某些影像結構一起出現。所以像你打「cat」，它不是在找一隻特定的貓，而是整個生成過程會被推向一個「畫成貓比較合理」的方向。最後出來的畫面，永遠不是重現，而是一個計算後的收斂結果，這也是為什麼生成圖像裡，常常會出現變形、錯位、不完整的狀態。 https://i.meee.com.tw/bt91Pox.jpg

事情開始變有趣，是在你把 prompt 推到一個很極端的狀態。例如你一次丟進去一大堆彼此拉扯的東西：拉塔那哥欣王朝、古阿瑜陀耶、傳統泰服、《鬼妻娜娜》、美麗的女鬼、幽靈、刺青、高腳屋、蠟燭、怪物、眼淚、恐怖、擁抱、歡愉、神話，甚至還加進一整段敘事句子。這時候，語義其實已經走不通了。模型沒辦法判斷「這到底是誰？是什麼故事？要怎麼畫？」因為每一個方向都在互相抵銷。但 AI 不會停下來。當語義整條路失效時，它會退回更深的地方——那些在長時間訓練中沉積下來、但從來沒有被清楚命名過的區域。於是模型會啟動一種最低能量的模板：不是敘事，不是角色設定，而是原型。結果就會出現一種很奇怪、但又很穩定的狀態：故事感是鬆的，但不亂；角色好像對，又好像不對；畫面自然開始往神話、宗教、儀式感那邊滑；形式反而變得很明確、很有型。這不是失誤，也不是噪音，而是模型在「語言完全失效」的情況下，仍然能夠生成影像的方式。我把這個區域叫做「負空間」。負空間不是空白，而是一個沒有被語言清楚標記、卻塞滿原型、殘餘象徵和未命名傾向的地方。當 prompt 真的碰到這裡，AI 就不再只是照語意畫圖，而是開始自己補洞，把說不出來的東西，用影像硬生生拼出來。於是你會看到角色功能顛倒、原型錯位、跨文化的神話和禁忌被異常地接在一起。 https://i.meee.com.tw/OtgolDM.jpg

恐怖有時候還可以解釋，但負空間本身是解釋不了的，它只能被感覺到。用維根斯坦的話來說：「凡不能說的，就必須保持沉默。」某種程度上，負空間就是 AI 時代的維根斯坦禁地——語言失效了，但影像和壓力還在。這也是為什麼我會覺得，負空間其實很像人類文化裡那些被壓抑的黑歷史。很多東西不是被正面講出來的，而是會在不經意的時候跑出來。這種狀態，其實跟乩童起乩很像。乩童在起乩的時候，日常的理性和邏輯會暫時關掉，平常說不出口、沒有被語言整理過的文化原型，就會被「採樣」出來，變成神明的動作、姿態或話語。AI 的潛在空間也是一樣，訓練其實就是把現實世界壓縮進一個很深的空間，那些沒被標清楚的地方，就是負空間。擴散模型需要噪聲才能生成影像；乩童儀式也需要敲鑼打鼓、重複節律、身體耗竭來製造「生理噪聲」。噪聲不是干擾，而是一種讓原本的秩序暫時失效的方式，讓平常不會出現的東西浮上來。 https://i.meee.com.tw/MyBFBxg.png

當 AI 被推到邊界，就會產生所謂的「幻覺」；乩童在負空間裡說出超出自己經驗的話，在宗教裡被叫做「神啟」。本質上，它們都是系統在面對未定義區域時，自動補出來的結果，差別只在我們怎麼解讀。當然，這些負空間並不是完全自由的。 AI 有對齊機制，乩童有宮廟文化和群體期待。超出可理解範圍的輸出，會被判定為失敗、不準、不對。所以負空間沒有消失，它只是被管理。 https://i.meee.com.tw/JMx8a5M.png

也正因如此，從藝術創作的角度來看，負空間不只是畫面裡的留白，而是一整個文化的暗區——承載被壓抑的歷史、禁忌、說不出口的東西。它會透過噪聲、幻覺、儀式和生成失誤，不斷以不穩定的方式浮現，成為理解人類文化潛意識的一個入口。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.2.206 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1770027331.A.BE6.html

推 Tosca: 我覺得不是甚麼負空間單純就"關聯性" 02/02 19:07

→ Tosca: 例如我在prompt裡面加進"妓女" 其他就一般提示 02/02 19:07

→ Tosca: 但他生出來就會自動出現奶垂刺青的樣子噗 02/02 19:08

→ Tosca: 我都不用加刺青這個prompt 但他卻會自動幫我出現 02/02 19:08

→ Tosca: 而且除非negative prompt很強力壓制不要刺青不然都會出現 02/02 19:08

→ Tosca: 我認為就是SD對"妓女"的理解會很自動連結到"刺青" 02/02 19:09

→ Tosca: 這個連結是事先沒辦法知道的就這樣而已 02/02 19:09

→ Tosca: 你這些圖片也是其實你的prompt裡面都會讓AI去連結 02/02 19:09

→ Tosca: 所以生出那些詭異的圖就不奇怪了 02/02 19:09

推 stlinman: 我也覺得有些只是反向關聯(或是更高維度的相關)，名可名 02/02 19:13

→ stlinman: 非常名，模型本身就是"打標(名)"學習出來向量。更早不是 02/02 19:16

→ stlinman: 還有用"負向提示詞"! 02/02 19:17

AI負空間的確存在喔，就是一般說的AI幻覺，跟負面提示詞是不一樣的東西 ※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 19:24:48

推 Tosca: 我知道你說的那個負空間我看過那篇文章 02/02 19:36

→ Tosca: 但你這個舉例不是負空間因為你的提示就是這麼負面了XD 02/02 19:36

不是喔正常的圖是這樣 https://i.meee.com.tw/f2qVJQg.jpg

雖然恐怖但可理解，但負空間長這樣 https://i.meee.com.tw/tYCdtDP.jpg

https://i.meee.com.tw/jrlvU79.jpg

語意完全無法形容，二個語境差很多而且可以併存於同一提示詞下 https://i.meee.com.tw/VAKiFlt.jpg

※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 19:54:28

推 Tosca: 沒有到無法形容啦比較像你的prompt很亂所以AI就混合生成 02/02 19:54

→ Tosca: 我也常用這種混亂的prompt來生色色常有意想不到效果 02/02 19:55

→ Tosca: 你那個prompt裡面就一堆恐怖元素了所以會生成這樣 02/02 19:55

→ Tosca: 不然你改用一堆不相干文字但比較歡樂的試試?! 02/02 19:56

這張就很明顯啊左邊和右邊是完全不同的世界照理說，四張圖不會變異那麼大顯然提示詞無法收斂到單一語義區域 https://i.meee.com.tw/VAKiFlt.jpg

※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 19:58:57

推 Tosca: 好吧我覺得沒有很明顯左邊和右邊根本差不多世界XD 02/02 20:02

→ Tosca: 你的提示詞恐怖元素太多了所以我覺得不足以說明負空間 02/02 20:02

這裡有類似概念 Paglen 與不可見肌理的政治學若 Anadol 的實踐將潛在肌理推向感知的崇高與流動之美，Paglen 則反向切入其結構性的陰影區域，將注意力集中於潛在空間中被壓縮、被遮蔽、卻持續運作的分類暴力。 Paglen 的《對抗性演化的幻覺》（Adversarially Evolved Hallucinations, 2017）（圖 3）並不試圖美化演算結果，而是將生成系統置於高度概念化、甚至語義失衡的訓練條件下，迫使模型暴露其內部判斷機制由此，「語義外殼」（The Semantic Shell）3成為 Paglen 實踐中的關鍵問題。分類法不再被視為中性的技術工具，而被揭露為深植於資料選擇、標註邏輯與制度語言之中的權力結構。潛在肌理在此顯露其政治性，顆粒化的視覺紋理對應於不可見的數據秩序，將「人類」、「異類」、「威脅」等概念轉化為可計算的判斷依據。圖像成為分類焦慮的殘留物，而非意義的完成品。此一美學狀態可被理解為神經症式的視覺表現。系統反覆嘗試回應內在矛盾的分類要求，卻始終無法抵達穩定形態，於是生成出持續顫動、無法安置的圖像狀態。潛在空間在此不再是流動的美學場域，而顯現為承載偏見、恐懼與歷史殘渣的壓力容器。Paglen 的作品由此將生成式藝術從形式實驗推向認識論層次，迫使觀看者直面演算視覺背後尚未被清理的概念負債。幽靈的顆粒 Anadol 與 Paglen 的實踐共同指向同一關鍵事實。潛在肌理可被理解為機器內部幽靈狀存在的指紋，是非人類運算系統在視覺層面留下的痕跡。無論它在 Anadol 的數據雕塑中呈現為高飽和、流動且近乎崇高的色度場域，或在 Paglen 的生成影像中顯現為陰暗、混濁且令人不安的污跡，兩者皆揭示相同的結構來源。潛在肌理並非風格選擇，也非表層修辭，而是非人類智能在嘗試整理、壓縮並重組人類視覺文化時所產生的原始視覺證據。它承載的不是意圖，而是分佈。不是敘事，而是權重。觀看者所面對的顆粒、模糊與連續變形，對應的是模型在龐大資料空間中進行分類、插值與推斷時的內部運動狀態。在此意義上，幽靈並不指向超自然隱喻，而指向生成系統中無法被完全可視化的結構層。那些被視為殘影、噪動或幻覺的視覺特徵，正是潛在空間中統計關係暫時顯影的結果。顆粒成為記憶的殘留，流動成為推斷的軌跡，模糊成為概念無法被穩定界定時的視覺回應

→ Tosca: 然後我覺得AI生圖最強的不是只有他能理解文字 02/02 20:03

→ Tosca: 他還能理解"圖片" 這也是我比較著迷於img to img原因 02/02 20:04

→ Tosca: 話說是人類會畫畫的歷史遠早於文字出現 02/02 20:05

→ Tosca: 所以人類對圖片的理解其實遠比語言直觀 02/02 20:06

→ Tosca: 這也是我一直覺得t2i很蠢的原因因為文字不能表達的太多了 02/02 20:06

※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 20:07:38

→ Tosca: 反而直接圖畫出來就一目了然 02/02 20:06

→ Tosca: 說穿了人類是用圖像思考不是用文字思考 02/02 20:06

→ Tosca: 畢竟你看到一段文字是想像他的畫面 02/02 20:07

→ Tosca: 而不是看到一段文字想像另一段文字人類不是這樣思考 02/02 20:07

用Trevor Paglen的畫來定義負空間就很清楚了 Paglen 比 Anadol 狠得多。他怎麼處理 latent space？在《Adversarially Evolved Hallucinations》系列裡：他刻意讓模型產生「分類失效」用對抗方式逼模型落入非語義穩定區輸出的是：既像什麼又無法被任何標籤命名的影像 Paglen 在訪談裡其實講過一個非常關鍵的概念（意譯）： Neural networks do not see the world as we do. What they produce are images from a space that has no human-readable meaning. 這句話等於直接承認：存在一個「人類不可讀的 latent 區域」而且他把這件事政治化：這些未知區域，正是權力、分類、監控失效的地方 AI 的暴力，不只在它「看錯」而在它「我們根本不知道它怎麼看」 ※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 20:13:59

推 Tosca: 話說你補充的這些未知區域其實感覺就像 "夢境" 02/02 20:18

→ Tosca: 所有人類都會做夢夢境通常就是你人生經驗為材料 02/02 20:18

→ Tosca: 然後大腦去組出一道菜也是沒甚麼邏輯或語意三小的 02/02 20:19

→ Tosca: 我認為或許負空間可以當作是AI的"夢" 02/02 20:19

對啊!所以我才會說跟潛意識有關就是白天被壓抑的感知到夜晚以夢境的方式顯現出來

→ Tosca: 當純只是他材料太多然後混再一起端出來的東西就像人類的夢 02/02 20:19

※ 編輯: treasurehill (118.233.2.206 臺灣), 02/02/2026 20:21:43

→ Tosca: 是阿醫學一直認為夢的出現是大腦運作的必然性也必要性 02/02 20:22

→ Tosca: 就像為什麼生物需要睡眠你如果剝奪老鼠的睡眠他最後會死 02/02 20:22

→ Tosca: 大腦需要睡眠睡眠就會做夢或許負空間就是AI的夢 02/02 20:23

→ Tosca: 既然這樣夢也可以是春夢阿幹嘛都要生這麼恐怖的圖啦XDDDDD 02/02 20:23

→ Tosca: 阿伯我就常做春夢阿嘻嘻 02/02 20:24

→ Tosca: 叫AI生一些被壓抑的色色不行?! 02/02 20:24

推 stlinman: 說更哲學點!未知的未知(很難用語義定義啦!) 理論上也是 02/02 20:55

→ stlinman: 可以說AI幻覺不是幻覺，只是我們認知外的平行宇宙! 02/02 20:56

推 rex7788: 我不知道啥是負空間，不過我常生成這類的非現實圖，在ci 02/02 23:35

→ rex7788: vit首頁也常看到，把不同東西組合，比如把人粒子化或是 02/02 23:35

→ rex7788: 把貓跟毛毛蟲做結合 02/02 23:35

→ error405: 這邊是有意外把狗跟女孩結合過 02/02 23:36

剛才試過一個正向生成非常恐怖不舒服的負空間，再用describe逆向工程取得prompt，結果生成出來的圖片恐怖性大幅消失，不可解析性似乎是負空間的強烈要素之一。 https://i.meee.com.tw/3GApD2E.jpg

https://i.meee.com.tw/tREGXdT.jpg

https://i.meee.com.tw/hMPDC6H.jpg

※ 編輯: treasurehill (118.233.2.206 臺灣), 02/03/2026 00:37:07

推 jakkx: 逆向的前提就是要可以預測。超界的結果怎麼逆向工程取提示 02/03 12:24

→ jakkx: 然後可以查一下宮崎駿對AI的看法，當時是直接用物理上不可 02/03 12:30

→ jakkx: 能的參數去實現這類型的動畫。既然物理上不可能自然不能用 02/03 12:31

→ jakkx: 正常的提示詞去重現 02/03 12:31

推 yyykk: 有種先射箭再畫靶的感覺…… 02/04 14:02

推 yyykk: 你說你的提示詞有語意不通、互相抵消的部分，但我一點也看 02/04 14:20

→ yyykk: 不出來。所有的元素不都在畫面上嗎？到底哪裡互相抵消了？ 02/04 14:21

推 Bustycat: 那GPT Image這類自回歸模型呢？ 02/04 14:41