精華區beta C_Chat 關於我們 聯絡資訊
我嘗試來簡單圖解一下 AI生成圖的概念 因為 1. 想要簡單解釋 2. 我不是本科生 請板上各位高手不吝指教 不過別太嚴格 見圖一 首先,我想要從向量空間開始講起 假設你有一張圖 只有兩個像素 1 x 2 那你可以把第一個像素當成 x 第二個當成 y 這圖就是一個(x,y)向量 (見下圖) 假如有 3個像素 1 x 3 就是(x,y,z)三維向量 同理, nx x ny 像素的圖 就是一個nx x ny 維度的向量 https://i.imgur.com/5QxQiV2.jpg 圖一 見圖二 理解這個想法後 我們把圖像的高維空間畫成二維方便表示 以ACG圖為例 那被人類接受的ACG圖就是一個高維空間中的分佈 簡單理解就是一個範圍內的圖,會被視為可接受的ACG圖 在那個範圍外的空間包含相片 雜訊 古典藝術 支離破碎的圖 生成模型的目的,就是從範圍內的樣本(下圖紅點)建立一個模型 這個模型學習到這個範圍,而模型可以生成也只會生成在範圍內的點 https://i.imgur.com/NfUyIAg.jpg 圖二 這裡有兩點值得注意 1. 模型並沒有儲存紅色樣本點的資訊,而是學到讓點落在那個範圍內的方法 2. 雖然理想上是要學習被人類接受的ACG圖的範圍,但是能學到的範圍受到樣本的限制 例如:未來會出現的畫風照道理說也在範圍內,但是沒有樣本,理論上學不到 又或者你的樣本內沒有一張圖出現耳機,模型就生不出戴耳機的妹子 基本上這機器學習的概念和人類有像,就是看很多存在的圖理解什麼算ACG圖 怎樣畫才是合格的ACG圖 但是 1.模型缺乏人類的先驗知識,例如我們知道耳機長怎樣,即使沒看過耳機的ACG圖 2.缺乏人類的創造力,因為人所能接受的ACG圖範圍一定比現在大得多, 缺乏人類的經驗知識或本能,以現在的做法機器無法拓展新的創作範圍 接下來簡單講一下,我所理解的主流生成模型 1. 生成對抗網路 這是兩個模型 一個機器評鑑家 和一個機器創作者 機器評鑑家不斷的學習分辨真正的人類創造 和 機器創作者造出的膺品 機器創作者則是不斷學著越畫越像人 騙過評鑑家 一個模型學習界定範圍 另一個學習讓生成的點在範圍內 2. Diffusion model (見圖三) 這個東西就是現在主流的這些動漫圖生成器的原理 這東西比較不直觀 數學也很複雜 簡單來說, 在訓練這模型時,先讓原本那些樣本點隨機擴散 最後變成一個高斯分佈 (ACG圖退化成雜訊) 同時紀錄擴散過程 之後再訓練一個模型學習逆擴散,把高斯分佈還原回ACG圖範圍 之後你高斯分佈取一點(丟一張雜訊給模型) 模型就會自動把你的圖推回去那範圍(變成ACG圖了) https://i.imgur.com/zdnQPmj.jpg 這樣大致解釋一下,你覺得是拼貼嗎 ----- Sent from JPTT on my iPad -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.96.90.228 (美國) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1665034221.A.E97.html
newwu: 哭啊 打到一半就有人解釋了 我在幹嘛… 10/06 13:32
lsd25968: 沒事 有手繪解說給你推QQ 10/06 13:33
smart0eddie: 訓練學到的convolution filter 會像是小塊pattern 10/06 13:33
smart0eddie: 根據activation 強度會在輸出圖上出現相應的pattern 10/06 13:33
smart0eddie: 一層一層疊起來 10/06 13:33
smart0eddie: 硬要凹是拼貼也沒說錯 10/06 13:33
guogu: 圖文並茂 很棒啊 10/06 13:34
mic73528: 你講那麼多文組哪懂,看起來像就說拼貼阿 10/06 13:35
oasis404: 沒關係,你講的比較簡單好懂一點 10/06 13:35
andy0481: 透過運算把圖拆解 然後透過運算把圖產出來 算拼貼嗎 10/06 13:35
Koyomiiii: 手繪的 你的分數更高啦 10/06 13:35
emptie: 你的圖說蠻清楚的耶 10/06 13:37
cybermeow: 我那篇只是複製貼上啦ww 10/06 13:37
naya7415963: 推推 你的說明也很棒 10/06 13:37
Splatoon: 文組繼續說拼貼抄襲 10/06 13:37
BwDragonfly: 寫得很清楚 10/06 13:38
qd6590: 其實我覺得這篇沒有比上一篇好懂 不過推用心 10/06 13:39
newwu: 我只是想有人解釋就懶得解釋了 10/06 13:39
cornsoup: 手繪贏了 10/06 13:41
yiwangneko: 我懂ㄌ 謝了 10/06 13:41
wei115: 有沒有專門用來解釋AI的AI 10/06 13:41
yiwangneko: 你的圖很清楚 10/06 13:41
asdfg0612: 這問題就在把東西推到不同維度去做拼貼叫不叫拼貼 10/06 13:43
miyazakisun2: 數學我頭好痛= = 10/06 13:43
inte629l: 推解說 10/06 13:43
inte629l: 很好奇擴散手法的發想w 無奈數學不夠好 10/06 13:44
※ 編輯: newwu (73.96.90.228 美國), 10/06/2022 13:47:15
starsheep013: 圖解w 10/06 13:45
guogu: 他沒有儲存原始資料能算拼貼嗎? 10/06 13:48
說到這個, 假如有人亂玩過GAN就知道 train壞的GAN會認為生成在範圍內的最好方法就是 直接生成樣本點XD
Vulpix: Diffusion的概念就是拓樸啊。感覺應該要建立距離概念,那 10/06 13:48
※ 編輯: newwu (73.96.90.228 美國), 10/06/2022 13:50:52
Vulpix: 就應該是賦距的拓樸。有一點類似這樣:給全世界所有人都打 10/06 13:49
Vulpix: 上一個等級,數字越接近零的才是你的朋友。數字很大的那些 10/06 13:50
Vulpix: 可能因為社經或物理上距離你遙遠而數字太大。 10/06 13:50
BwDragonfly: 他把"圖轉成雜訊又把雜訊還原成圖"的參數記下 10/06 13:52
BwDragonfly: 把那個參數用在全新的雜訊圖上就是拼貼的時機 10/06 13:54
問題是人類也是阿 哪個繪師的身體各部位畫法 不是看其他人的圖學來的 不同點是人類有其他知識經驗 電腦只有偽隨機數 和 比人類多更多的閱覽描圖量
asdfg0612: 而且那種瞎雞巴大的模型隨便train一下就overfitting了 10/06 13:55
vios10009: 如果這樣還硬要說是拼貼的話,那人在構思圖案的動作在 10/06 13:58
vios10009: 他們的思考邏輯上也是拼貼了 10/06 13:58
DeeperOcean: 人的作畫又難以一概而論了,很多人在動筆畫畫的當下 10/06 14:01
DeeperOcean: 腦裡是沒有畫面的,只有想畫的題材,看到自己畫出的 10/06 14:01
DeeperOcean: 線條或顏色之後才有接下來的想法,至少跟AI的過程完 10/06 14:01
DeeperOcean: 全不同 10/06 14:01
BwDragonfly: 沒說人類不是拼貼,人類就是站在巨人的肩膀上 10/06 14:01
BwDragonfly: 就如你所說,人類有其他經驗,可以在圖畫上混合 10/06 14:02
jimmyVanClef: 不管啦像素級的拼貼還是拼貼啦都是抄襲啦抄像素也 10/06 14:02
jimmyVanClef: 是抄襲啦不管啦幹 10/06 14:02
BwDragonfly: 人可以做到 其他事物混圖,但是AI只有 圖混圖 10/06 14:02
andy0481: 達文西學人體畫法是自己去解剖學來的 哪邊學其他人圖 10/06 14:02
andy0481: 實際上就是 目前的AI拆解半天 還是只有拆解別人的圖 10/06 14:03
BwDragonfly: 人類就可以把現實實景混上前輩的畫法 10/06 14:03
BwDragonfly: 但AI只有 前輩的畫法混前輩的畫法 10/06 14:03
※ 編輯: newwu (73.96.90.228 美國), 10/06/2022 14:05:18
andy0481: 現在問題就是 AI從A畫家得到的A算式 B畫家得到的B算式 10/06 14:04
andy0481: 這些算式能說是AI自產的嗎 10/06 14:05
BwDragonfly: 人類混太多前輩的畫法 混到不能分辨時一樣是侵權啦 10/06 14:06
guogu: 誰說的 那是novelai只用圖片 一堆其他的照片之類的都丟進去 10/06 14:06
asdfg0612: 丟一堆進去 學的方法跟學到的概念也沒變啊 10/06 14:08
newwu: 真的那你訓練AI時多加幾張自己拍的照片進去 這樣就不算拼圖 10/06 14:10
newwu: 了嗎 10/06 14:10
newwu: 倒頭來是哲學問題嘛 10/06 14:10
asdfg0612: 那只是拼圖能拼的材料變多 10/06 14:11
undeadmask: 看起來就是在從樣本分析出來的模型範圍內,慢慢把符 10/06 14:11
undeadmask: 合條件的像素填進去,我玩拼圖也是這樣玩的。 10/06 14:11
vios10009: 除非你是盲人畫師,不然只要有眼睛看的到在那些人的邏 10/06 14:12
vios10009: 輯眼中就是抄襲了。 10/06 14:12
newwu: 在電腦上架個攝影機 影響直通模型追加訓練 這還不夠仿人類 10/06 14:12
newwu: 嗎 10/06 14:12
newwu: 人類不也是揉合前輩和個人經驗來創造 10/06 14:12
guogu: 我記得很像有漫畫家說過類似人只畫的出看過的東西這種話 10/06 14:12
andy0481: 別再跟人類一樣了 人類還有自我感知跟想像的功能 == 10/06 14:13
guogu: ai:我也會加噪點阿== 10/06 14:13
andy0481: 你給AI看再多 不給他看雷太的畫 不給他看妖精 他是無法 10/06 14:14
andy0481: 憑空創造出一個噪點跟公式畫出源賴光或長耳朵妖精 10/06 14:14
newwu: 電腦有隨機數! 10/06 14:14
kinghamb: 那就只是AI看得還不夠多阿 10/06 14:14
andy0481: 但人類可以 而今天這個看雷太畫產的公式 雷太有著作權嗎 10/06 14:15
andy0481: 目前的隨機數要用人為操控去調整給權重阿 離產圖還遠的 10/06 14:15
acininder: 人類沒看過也畫不出雷太畫風啊 你想說啥 10/06 14:16
andy0481: 不是看不夠多的問題 你給他看再多三次元都產不出長耳朵 10/06 14:16
asdfg0612: 你回去看看你的隨機噪點是怎麼被轉成圖片的 10/06 14:16
guogu: 你人類沒看過人沒看過比較長的耳朵就畫的出妖精? 10/06 14:16
vios10009: 你大概忘了有一大部份被人類嫌棄淘汰的AI圖都是AI自己 10/06 14:16
vios10009: 算出來的,這些圖卻不被歸類為AI自己想像的 10/06 14:16
BwDragonfly: 確實 看得夠多的話就能降低和特定畫家相似的可能性 10/06 14:17
BwDragonfly: 就變成抓不到 10/06 14:17
andy0481: 我知道AI會算出人為淘汰的圖阿 所以你還是要用人為去調 10/06 14:18
andy0481: 教成人類想要的東西 這過程是有價值的沒錯 10/06 14:18
undeadmask: 不是吧,印象派你還可以說是畫家近視太深,看起來都 10/06 14:18
undeadmask: 糊糊的,但野獸派、立體派的畫風在被創造出來以前要 10/06 14:18
newwu: 我就覺得這是哲學問題 才以問句做結 模型再強也會被這樣質 10/06 14:18
undeadmask: 去哪裡看來學?水墨畫、浮世繪中許多線條的型態跟透 10/06 14:18
undeadmask: 視法也不是人眼能捕捉到的形象 10/06 14:18
newwu: 疑 10/06 14:18
newwu: 這問題被推到這地步,跟完美強AI是在模仿人類還是真有意識 10/06 14:18
newwu: 根本一樣 10/06 14:18
acininder: 有個有趣的事情大家可以想想 danbooru2021 dataset 接 10/06 14:18
acininder: 近5TB 而diffusion model則只有4GB 10/06 14:18
andy0481: 今天問題是餵他吃A畫家的圖得到A畫家公式 用A畫家當tag 10/06 14:19
vios10009: 一直在不斷告知AI該怎麼畫的過程,難道就不是教嗎? 10/06 14:19
andy0481: 就會套上這公式去算 那這公式能說不是吃A畫家圖來的嗎 10/06 14:19
acininder: 什麼是學會 就是很哲學的東西了 10/06 14:19
asdfg0612: 對啊 就像有人可以靠背考高分 有人靠理解原理跟邏輯 10/06 14:20
undeadmask: 因為AI沒有自我意識能夠定義出風格,不管是被人為選 10/06 14:20
undeadmask: 中和淘汰的,對它來說都是符合條件的圖 10/06 14:20
andy0481: 人類的學會很哲學 但AI的學會還是一串串的公式代碼 10/06 14:21
BwDragonfly: 告知AI這件事,準確說是調整機器達到預期的目標 10/06 14:21
guogu: novelai不能用繪師當關鍵字就是了 10/06 14:22
BwDragonfly: 所以才把硬教人類學習的行為,形容成機器人 10/06 14:22
BwDragonfly: 例如考試機器人 10/06 14:22
vios10009: 人們在模仿賽璐璐畫風的同時,不也是以此為目標嗎? 10/06 14:23
asdfg0612: 還有對繪畫的認知跟對AI數學概念 實際運作的認知也很 10/06 14:23
asdfg0612: 影響這個問題的結論 10/06 14:23
guogu: 我覺得ai不是不能產生風格 而是審美的是人 10/06 14:23
guogu: 它的風格你可能只會覺得這個ai練壞了 10/06 14:23
opppoo123: 感謝講解,diffusion 原來是這個意思 10/06 14:29
vios10009: 把賽璐璐畫風當作圍棋來看待,人類能走過的棋,AI肯定 10/06 14:29
vios10009: 也會走過來甚至超越,現在還只是AlphaGO,等到變成Alp 10/06 14:29
vios10009: haZero那樣,那就沒有任何繪師能超越AI的畫風了,因為 10/06 14:29
vios10009: 它能無中生有產出比目前畫風更引人注目的畫風 10/06 14:29
newwu: 當然 難的是產生人可以接受的新風格 10/06 14:30
andy0481: 現在問題就是 產生對於AI來說早就不難了 但AI沒辦法靠自 10/06 14:30
andy0481: 己明白畫的是不是人要的東西 10/06 14:31
newwu: 還是跟強化學習不同 10/06 14:32
newwu: 圍棋有規則有明確可定義的目標,可是產圖要懂的是人心 10/06 14:32
likeyousmile: 推 10/06 14:36
vios10009: 目前最大的區別是人類的審美觀其實已經鎖定AI畫圖的局 10/06 14:37
vios10009: 限性,所以在怎麼強化也還是AlphaGO等級,要跳到Alpha 10/06 14:37
vios10009: Zero然後人類還能接受的畫風還有一段路要走 10/06 14:37
vios10009: 一個目標是贏,另一個的目標是討好人類的審美觀 10/06 14:38
vios10009: 畫的很厲害很複雜沒有畫師能辦到,人類不喜歡也沒有用 10/06 14:39
undeadmask: 今天如果把一些被淘汰奇形怪狀的圖撿起來說你看這些 10/06 14:39
undeadmask: 都是AI畫的,可能會很新奇沒錯,但實際上卻也是經過 10/06 14:39
undeadmask: 人為主觀判斷挑選後出來的圖,你以為的AI風格其實還 10/06 14:39
undeadmask: 是人為定義的。讓不同的人來選結果可能都不會一樣 10/06 14:39
vios10009: 我可以說繪師不會完全被取代,但不該因此排擠AI,就像 10/06 14:41
vios10009: 你不會因為照相機會取代畫肖像畫的人就不用相機一樣 10/06 14:41
vios10009: 相機的誕生在兩百年前也是顛覆當時的美術,但事實上兩 10/06 14:46
vios10009: 邊都能夠共存到現在 10/06 14:46
gintom7835: 人畫不出沒看過的東西?那那些奇幻故事的各種種族是怎 10/06 14:47
gintom7835: 麼來的? 10/06 14:47
jimmyVanClef: ai靠一串串公式跟代碼,人類也一樣啊用語言文字教 10/06 14:47
jimmyVanClef: 你公式教你怎麼做 10/06 14:47
jimmyVanClef: 公式的部分自不必說,代碼就只是機器語言,溝通用 10/06 14:47
jimmyVanClef: 的東西而已 10/06 14:47
andy0481: 但是有個差距 你腦內的東西是你的這在法律跟道德上沒問 10/06 14:49
undeadmask: 相機的衝擊,促使人類的繪畫創作脫離了早期注重光影 10/06 14:49
undeadmask: 寫實比例的刻畫,朝向新的方向去發展,這說明了人類 10/06 14:49
undeadmask: 的審美觀並不是固定的,除非AI有意識,能為自己的風 10/06 14:50
undeadmask: 格定義出標準,不然終究還是只能作為工具,依附在人 10/06 14:50
undeadmask: 類的喜好之下 10/06 14:50
andy0481: 題 但AI的公式代碼如果是靠別人的圖來的 請問這些東西能 10/06 14:50
andy0481: 算是AI擁有者擁有的嗎 10/06 14:50
SALEENS7LM: 人類最主要的差異就是自我意識吧,就算學習也是自我 10/06 14:53
SALEENS7LM: 去思考見解取捨吸收融合之後依照自己的想法去畫出想 10/06 14:53
SALEENS7LM: 畫的東西,用手畫出腦內的想法或創意,就是這樣才有 10/06 14:53
SALEENS7LM: 很多現實不存在的奇幻生物之類的被創作出來 10/06 14:53
vios10009: 那樣的話有問題的也是那些拿盜圖來餵的人,不是AI 10/06 14:54
naya7415963: 現實不存在的奇幻生物的概念也是從現實動物而來的啊 10/06 14:59
naya7415963: 人類的思想仍然無法超脫自身所生存的世界概念,所謂 10/06 14:59
naya7415963: 的創意仍然是從生命經驗而來。而為了特定目的訓練的 10/06 14:59
naya7415963: AI都餵同類型的圖,自然也只能製造出範圍內的圖,甚 10/06 14:59
naya7415963: 至超出範圍會被人類判定為不合格 10/06 14:59
vios10009: NovelAI如果是盜圖,那應該譴責他們,但AI是無辜的, 10/06 15:00
vios10009: 不能一竿子打翻一船AI,其他拿公開無版權圖案練習的AI 10/06 15:00
vios10009: 不該因此被推上處刑台 10/06 15:00
BwDragonfly: 有問題一直都是盜圖的人,如果是自己畫圖餵給AI,哪 10/06 15:03
BwDragonfly: 有問題 10/06 15:03
SALEENS7LM: 人類懂得把現實被認知到的概念用思想去融合或以此為 10/06 15:04
SALEENS7LM: 底魔改成一種新的本身就是在用自我意識去創造了啊 10/06 15:04
TSMKDAsa: 為什麼一直有人譴責NovelAi用盜版網站資料 但是卻沒見過 10/06 15:06
TSMKDAsa: 幾個人去譴責danbooru本身啊 它才是萬惡根源不是ㄇ 10/06 15:06
Koyomiiii: 因為嘴danbooru高機率像上面那篇被曬www 10/06 15:07
guogu: ai也很會融阿 安價串不就融出一堆鬼東西 10/06 15:07
naya7415963: 那像之前有人發文眼睛長奶子的難道就不算創造嗎? 10/06 15:09
naya7415963: 我覺得前提是觀看者知道作者是人類或AI,才因此產生 10/06 15:09
naya7415963: 出觀感差異 10/06 15:09
undeadmask: 問題就在人類創意由來的生命經驗不光來自外在形象的 10/06 15:10
undeadmask: 臨摹而已 10/06 15:10
jay920314: 推 好多熟悉的名詞,但我沒學好都看無 10/06 15:16
SALEENS7LM: 那是它經過思考理解之後想像得出的東西嗎? 10/06 15:21
naya7415963: 樓上上說的能否舉例呢?有點抽象不太理解你的意思 10/06 15:21
naya7415963: 對,我覺得重點在「作者的思考與理解」,人類繪師的 10/06 15:23
naya7415963: 價值就在於.....他是人類。 10/06 15:23
naya7415963: 因為我們是群居動物,天生有交流的需求,所以能夠理 10/06 15:23
naya7415963: 解繪師思想的畫作比起AI隨機產圖還要有價值 10/06 15:23
naya7415963: (不過價值可能因人而異就是了) 10/06 15:24
naya7415963: 並不是「因為是人類才能畫的出這樣的圖」,而是「因 10/06 15:25
naya7415963: 為是人類畫出這樣的圖才有意義」 10/06 15:25
naya7415963: 依照圖本身的用途不同,有些不需要作者這層意義的就 10/06 15:26
naya7415963: 會被AI取代 10/06 15:26
undeadmask: 現在的AI算圖的局限在於你的取材樣本終究來自於分析 10/06 15:39
undeadmask: 其他人已經創作出的圖像作品,但是人類的創作靈感有 10/06 15:39
undeadmask: 時候不單單來自於眼睛所見到的事物,夢境、記憶、感 10/06 15:39
undeadmask: 情、經驗,甚至味覺嗅覺等等都能成為題材養分,透過 10/06 15:39
undeadmask: 人的主觀意識形塑成作品,甚至在不同的精神情緒狀態 10/06 15:39
undeadmask: 也會有不一樣的結果。 10/06 15:39
qwerasd158: 專業推 10/06 15:41
undeadmask: 當然用AI學習運算可以在視覺結果上無限的接近,但我 10/06 15:43
undeadmask: 認為過程還是有不小的差異 10/06 15:43
Mike821018: 所以簡單說就是AI先看一幅畫怎麽被揉成垃圾 10/06 17:35
Mike821018: 再嘗試把另一坨垃圾攤開變成一幅畫 10/06 17:35
lonelygroup: 寫得挺好&有插圖 推 10/06 18:07