Re: [閒聊] AI畫圖是不是大數據拼圖？

作者newwu (說不定我一生涓滴廢文)

看板C_Chat

標題Re: [閒聊] AI畫圖是不是大數據拼圖？

時間Thu Oct 6 13:30:15 2022

我嘗試來簡單圖解一下ＡＩ生成圖的概念因為 1. 想要簡單解釋 2. 我不是本科生請板上各位高手不吝指教不過別太嚴格見圖一首先，我想要從向量空間開始講起假設你有一張圖只有兩個像素 1 x 2 那你可以把第一個像素當成 x 第二個當成 y 這圖就是一個(x,y)向量（見下圖）假如有 3個像素 1 x 3 就是(x,y,z)三維向量同理， nx x ny 像素的圖就是一個nx x ny 維度的向量 https://i.imgur.com/5QxQiV2.jpg 圖一見圖二理解這個想法後我們把圖像的高維空間畫成二維方便表示以ＡＣＧ圖為例那被人類接受的ＡＣＧ圖就是一個高維空間中的分佈簡單理解就是一個範圍內的圖，會被視為可接受的ＡＣＧ圖在那個範圍外的空間包含相片雜訊古典藝術支離破碎的圖生成模型的目的，就是從範圍內的樣本（下圖紅點）建立一個模型這個模型學習到這個範圍，而模型可以生成也只會生成在範圍內的點 https://i.imgur.com/NfUyIAg.jpg 圖二這裡有兩點值得注意 1. 模型並沒有儲存紅色樣本點的資訊，而是學到讓點落在那個範圍內的方法 2. 雖然理想上是要學習被人類接受的ＡＣＧ圖的範圍，但是能學到的範圍受到樣本的限制例如：未來會出現的畫風照道理說也在範圍內，但是沒有樣本，理論上學不到又或者你的樣本內沒有一張圖出現耳機，模型就生不出戴耳機的妹子基本上這機器學習的概念和人類有像，就是看很多存在的圖理解什麼算ＡＣＧ圖怎樣畫才是合格的ＡＣＧ圖但是 1.模型缺乏人類的先驗知識，例如我們知道耳機長怎樣，即使沒看過耳機的ＡＣＧ圖 2.缺乏人類的創造力，因為人所能接受的ＡＣＧ圖範圍一定比現在大得多，缺乏人類的經驗知識或本能，以現在的做法機器無法拓展新的創作範圍接下來簡單講一下，我所理解的主流生成模型 1. 生成對抗網路這是兩個模型一個機器評鑑家和一個機器創作者機器評鑑家不斷的學習分辨真正的人類創造和機器創作者造出的膺品機器創作者則是不斷學著越畫越像人騙過評鑑家一個模型學習界定範圍另一個學習讓生成的點在範圍內 2. Diffusion model （見圖三）這個東西就是現在主流的這些動漫圖生成器的原理這東西比較不直觀數學也很複雜簡單來說，在訓練這模型時，先讓原本那些樣本點隨機擴散最後變成一個高斯分佈（ＡＣＧ圖退化成雜訊）同時紀錄擴散過程之後再訓練一個模型學習逆擴散，把高斯分佈還原回ＡＣＧ圖範圍之後你高斯分佈取一點（丟一張雜訊給模型）模型就會自動把你的圖推回去那範圍（變成ＡＣＧ圖了） https://i.imgur.com/zdnQPmj.jpg 這樣大致解釋一下，你覺得是拼貼嗎 ----- Sent from JPTT on my iPad -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.96.90.228 (美國) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1665034221.A.E97.html

→ newwu: 哭啊打到一半就有人解釋了我在幹嘛… 10/06 13:32

推 lsd25968: 沒事有手繪解說給你推QQ 10/06 13:33

推 smart0eddie: 訓練學到的convolution filter 會像是小塊pattern 10/06 13:33

→ smart0eddie: 根據activation 強度會在輸出圖上出現相應的pattern 10/06 13:33

→ smart0eddie: 一層一層疊起來 10/06 13:33

→ smart0eddie: 硬要凹是拼貼也沒說錯 10/06 13:33

推 guogu: 圖文並茂很棒啊 10/06 13:34

→ mic73528: 你講那麼多文組哪懂,看起來像就說拼貼阿 10/06 13:35

推 oasis404: 沒關係，你講的比較簡單好懂一點 10/06 13:35

推 andy0481: 透過運算把圖拆解然後透過運算把圖產出來算拼貼嗎 10/06 13:35

→ Koyomiiii: 手繪的你的分數更高啦 10/06 13:35

推 emptie: 你的圖說蠻清楚的耶 10/06 13:37

推 cybermeow: 我那篇只是複製貼上啦ww 10/06 13:37

推 naya7415963: 推推你的說明也很棒 10/06 13:37

推 Splatoon: 文組繼續說拼貼抄襲 10/06 13:37

推 BwDragonfly: 寫得很清楚 10/06 13:38

推 qd6590: 其實我覺得這篇沒有比上一篇好懂不過推用心 10/06 13:39

→ newwu: 我只是想有人解釋就懶得解釋了 10/06 13:39

推 cornsoup: 手繪贏了 10/06 13:41

推 yiwangneko: 我懂ㄌ謝了 10/06 13:41

→ wei115: 有沒有專門用來解釋AI的AI 10/06 13:41

→ yiwangneko: 你的圖很清楚 10/06 13:41

→ asdfg0612: 這問題就在把東西推到不同維度去做拼貼叫不叫拼貼 10/06 13:43

推 miyazakisun2: 數學我頭好痛= = 10/06 13:43

推 inte629l: 推解說 10/06 13:43

→ inte629l: 很好奇擴散手法的發想w 無奈數學不夠好 10/06 13:44

※ 編輯: newwu (73.96.90.228 美國), 10/06/2022 13:47:15

推 starsheep013: 圖解w 10/06 13:45

推 guogu: 他沒有儲存原始資料能算拼貼嗎? 10/06 13:48

說到這個，假如有人亂玩過GAN就知道 train壞的GAN會認為生成在範圍內的最好方法就是直接生成樣本點XD

推 Vulpix: Diffusion的概念就是拓樸啊。感覺應該要建立距離概念，那 10/06 13:48

※ 編輯: newwu (73.96.90.228 美國), 10/06/2022 13:50:52

→ Vulpix: 就應該是賦距的拓樸。有一點類似這樣：給全世界所有人都打 10/06 13:49

→ Vulpix: 上一個等級，數字越接近零的才是你的朋友。數字很大的那些 10/06 13:50

→ Vulpix: 可能因為社經或物理上距離你遙遠而數字太大。 10/06 13:50

→ BwDragonfly: 他把"圖轉成雜訊又把雜訊還原成圖"的參數記下 10/06 13:52

→ BwDragonfly: 把那個參數用在全新的雜訊圖上就是拼貼的時機 10/06 13:54

問題是人類也是阿哪個繪師的身體各部位畫法不是看其他人的圖學來的不同點是人類有其他知識經驗電腦只有偽隨機數和比人類多更多的閱覽描圖量

→ asdfg0612: 而且那種瞎雞巴大的模型隨便train一下就overfitting了 10/06 13:55

推 vios10009: 如果這樣還硬要說是拼貼的話，那人在構思圖案的動作在 10/06 13:58

→ vios10009: 他們的思考邏輯上也是拼貼了 10/06 13:58

→ DeeperOcean: 人的作畫又難以一概而論了，很多人在動筆畫畫的當下 10/06 14:01

→ DeeperOcean: 腦裡是沒有畫面的，只有想畫的題材，看到自己畫出的 10/06 14:01

→ DeeperOcean: 線條或顏色之後才有接下來的想法，至少跟AI的過程完 10/06 14:01

→ DeeperOcean: 全不同 10/06 14:01

→ BwDragonfly: 沒說人類不是拼貼，人類就是站在巨人的肩膀上 10/06 14:01

→ BwDragonfly: 就如你所說，人類有其他經驗，可以在圖畫上混合 10/06 14:02

推 jimmyVanClef: 不管啦像素級的拼貼還是拼貼啦都是抄襲啦抄像素也 10/06 14:02

→ jimmyVanClef: 是抄襲啦不管啦幹 10/06 14:02

→ BwDragonfly: 人可以做到其他事物混圖，但是AI只有圖混圖 10/06 14:02

推 andy0481: 達文西學人體畫法是自己去解剖學來的哪邊學其他人圖 10/06 14:02

→ andy0481: 實際上就是目前的AI拆解半天還是只有拆解別人的圖 10/06 14:03

→ BwDragonfly: 人類就可以把現實實景混上前輩的畫法 10/06 14:03

→ BwDragonfly: 但AI只有前輩的畫法混前輩的畫法 10/06 14:03

※ 編輯: newwu (73.96.90.228 美國), 10/06/2022 14:05:18

→ andy0481: 現在問題就是 AI從A畫家得到的A算式 B畫家得到的B算式 10/06 14:04

→ andy0481: 這些算式能說是AI自產的嗎 10/06 14:05

→ BwDragonfly: 人類混太多前輩的畫法混到不能分辨時一樣是侵權啦 10/06 14:06

推 guogu: 誰說的那是novelai只用圖片一堆其他的照片之類的都丟進去 10/06 14:06

→ asdfg0612: 丟一堆進去學的方法跟學到的概念也沒變啊 10/06 14:08

→ newwu: 真的那你訓練AI時多加幾張自己拍的照片進去這樣就不算拼圖 10/06 14:10

→ newwu: 了嗎 10/06 14:10

→ newwu: 倒頭來是哲學問題嘛 10/06 14:10

→ asdfg0612: 那只是拼圖能拼的材料變多 10/06 14:11

推 undeadmask: 看起來就是在從樣本分析出來的模型範圍內，慢慢把符 10/06 14:11

→ undeadmask: 合條件的像素填進去，我玩拼圖也是這樣玩的。 10/06 14:11

推 vios10009: 除非你是盲人畫師，不然只要有眼睛看的到在那些人的邏 10/06 14:12

→ vios10009: 輯眼中就是抄襲了。 10/06 14:12

→ newwu: 在電腦上架個攝影機影響直通模型追加訓練這還不夠仿人類 10/06 14:12

→ newwu: 嗎 10/06 14:12

→ newwu: 人類不也是揉合前輩和個人經驗來創造 10/06 14:12

推 guogu: 我記得很像有漫畫家說過類似人只畫的出看過的東西這種話 10/06 14:12

推 andy0481: 別再跟人類一樣了人類還有自我感知跟想像的功能 == 10/06 14:13

→ guogu: ai:我也會加噪點阿== 10/06 14:13

→ andy0481: 你給AI看再多不給他看雷太的畫不給他看妖精他是無法 10/06 14:14

→ andy0481: 憑空創造出一個噪點跟公式畫出源賴光或長耳朵妖精 10/06 14:14

→ newwu: 電腦有隨機數! 10/06 14:14

推 kinghamb: 那就只是AI看得還不夠多阿 10/06 14:14

→ andy0481: 但人類可以而今天這個看雷太畫產的公式雷太有著作權嗎 10/06 14:15

→ andy0481: 目前的隨機數要用人為操控去調整給權重阿離產圖還遠的 10/06 14:15

推 acininder: 人類沒看過也畫不出雷太畫風啊你想說啥 10/06 14:16

→ andy0481: 不是看不夠多的問題你給他看再多三次元都產不出長耳朵 10/06 14:16

→ asdfg0612: 你回去看看你的隨機噪點是怎麼被轉成圖片的 10/06 14:16

推 guogu: 你人類沒看過人沒看過比較長的耳朵就畫的出妖精? 10/06 14:16

推 vios10009: 你大概忘了有一大部份被人類嫌棄淘汰的AI圖都是AI自己 10/06 14:16

→ vios10009: 算出來的，這些圖卻不被歸類為AI自己想像的 10/06 14:16

推 BwDragonfly: 確實看得夠多的話就能降低和特定畫家相似的可能性 10/06 14:17

→ BwDragonfly: 就變成抓不到 10/06 14:17

→ andy0481: 我知道AI會算出人為淘汰的圖阿所以你還是要用人為去調 10/06 14:18

→ andy0481: 教成人類想要的東西這過程是有價值的沒錯 10/06 14:18

→ undeadmask: 不是吧，印象派你還可以說是畫家近視太深，看起來都 10/06 14:18

→ undeadmask: 糊糊的，但野獸派、立體派的畫風在被創造出來以前要 10/06 14:18

→ newwu: 我就覺得這是哲學問題才以問句做結模型再強也會被這樣質 10/06 14:18

→ undeadmask: 去哪裡看來學？水墨畫、浮世繪中許多線條的型態跟透 10/06 14:18

→ undeadmask: 視法也不是人眼能捕捉到的形象 10/06 14:18

→ newwu: 疑 10/06 14:18

→ newwu: 這問題被推到這地步，跟完美強AI是在模仿人類還是真有意識 10/06 14:18

→ newwu: 根本一樣 10/06 14:18

→ acininder: 有個有趣的事情大家可以想想 danbooru2021 dataset 接 10/06 14:18

→ acininder: 近5TB 而diffusion model則只有4GB 10/06 14:18

→ andy0481: 今天問題是餵他吃A畫家的圖得到A畫家公式用A畫家當tag 10/06 14:19

推 vios10009: 一直在不斷告知AI該怎麼畫的過程，難道就不是教嗎？ 10/06 14:19

→ andy0481: 就會套上這公式去算那這公式能說不是吃A畫家圖來的嗎 10/06 14:19

→ acininder: 什麼是學會就是很哲學的東西了 10/06 14:19

→ asdfg0612: 對啊就像有人可以靠背考高分有人靠理解原理跟邏輯 10/06 14:20

→ undeadmask: 因為AI沒有自我意識能夠定義出風格，不管是被人為選 10/06 14:20

→ undeadmask: 中和淘汰的，對它來說都是符合條件的圖 10/06 14:20

→ andy0481: 人類的學會很哲學但AI的學會還是一串串的公式代碼 10/06 14:21

→ BwDragonfly: 告知AI這件事，準確說是調整機器達到預期的目標 10/06 14:21

→ guogu: novelai不能用繪師當關鍵字就是了 10/06 14:22

→ BwDragonfly: 所以才把硬教人類學習的行為，形容成機器人 10/06 14:22

→ BwDragonfly: 例如考試機器人 10/06 14:22

推 vios10009: 人們在模仿賽璐璐畫風的同時，不也是以此為目標嗎？ 10/06 14:23

→ asdfg0612: 還有對繪畫的認知跟對AI數學概念實際運作的認知也很 10/06 14:23

→ asdfg0612: 影響這個問題的結論 10/06 14:23

→ guogu: 我覺得ai不是不能產生風格而是審美的是人 10/06 14:23

→ guogu: 它的風格你可能只會覺得這個ai練壞了 10/06 14:23

推 opppoo123: 感謝講解，diffusion 原來是這個意思 10/06 14:29

推 vios10009: 把賽璐璐畫風當作圍棋來看待，人類能走過的棋，AI肯定 10/06 14:29

→ vios10009: 也會走過來甚至超越，現在還只是AlphaGO，等到變成Alp 10/06 14:29

→ vios10009: haZero那樣，那就沒有任何繪師能超越AI的畫風了，因為 10/06 14:29

→ vios10009: 它能無中生有產出比目前畫風更引人注目的畫風 10/06 14:29

→ newwu: 當然難的是產生人可以接受的新風格 10/06 14:30

推 andy0481: 現在問題就是產生對於AI來說早就不難了但AI沒辦法靠自 10/06 14:30

→ andy0481: 己明白畫的是不是人要的東西 10/06 14:31

→ newwu: 還是跟強化學習不同 10/06 14:32

→ newwu: 圍棋有規則有明確可定義的目標，可是產圖要懂的是人心 10/06 14:32

推 likeyousmile: 推 10/06 14:36

推 vios10009: 目前最大的區別是人類的審美觀其實已經鎖定AI畫圖的局 10/06 14:37

→ vios10009: 限性，所以在怎麼強化也還是AlphaGO等級，要跳到Alpha 10/06 14:37

→ vios10009: Zero然後人類還能接受的畫風還有一段路要走 10/06 14:37

→ vios10009: 一個目標是贏，另一個的目標是討好人類的審美觀 10/06 14:38

→ vios10009: 畫的很厲害很複雜沒有畫師能辦到，人類不喜歡也沒有用 10/06 14:39

→ undeadmask: 今天如果把一些被淘汰奇形怪狀的圖撿起來說你看這些 10/06 14:39

→ undeadmask: 都是AI畫的，可能會很新奇沒錯，但實際上卻也是經過 10/06 14:39

→ undeadmask: 人為主觀判斷挑選後出來的圖，你以為的AI風格其實還 10/06 14:39

→ undeadmask: 是人為定義的。讓不同的人來選結果可能都不會一樣 10/06 14:39

→ vios10009: 我可以說繪師不會完全被取代，但不該因此排擠AI，就像 10/06 14:41

→ vios10009: 你不會因為照相機會取代畫肖像畫的人就不用相機一樣 10/06 14:41

推 vios10009: 相機的誕生在兩百年前也是顛覆當時的美術，但事實上兩 10/06 14:46

→ vios10009: 邊都能夠共存到現在 10/06 14:46

推 gintom7835: 人畫不出沒看過的東西？那那些奇幻故事的各種種族是怎 10/06 14:47

→ gintom7835: 麼來的？ 10/06 14:47

推 jimmyVanClef: ai靠一串串公式跟代碼，人類也一樣啊用語言文字教 10/06 14:47

→ jimmyVanClef: 你公式教你怎麼做 10/06 14:47

→ jimmyVanClef: 公式的部分自不必說，代碼就只是機器語言，溝通用 10/06 14:47

→ jimmyVanClef: 的東西而已 10/06 14:47

推 andy0481: 但是有個差距你腦內的東西是你的這在法律跟道德上沒問 10/06 14:49

推 undeadmask: 相機的衝擊，促使人類的繪畫創作脫離了早期注重光影 10/06 14:49

→ undeadmask: 寫實比例的刻畫，朝向新的方向去發展，這說明了人類 10/06 14:49

→ undeadmask: 的審美觀並不是固定的，除非AI有意識，能為自己的風 10/06 14:50

→ undeadmask: 格定義出標準，不然終究還是只能作為工具，依附在人 10/06 14:50

→ undeadmask: 類的喜好之下 10/06 14:50

→ andy0481: 題但AI的公式代碼如果是靠別人的圖來的請問這些東西能 10/06 14:50

→ andy0481: 算是AI擁有者擁有的嗎 10/06 14:50

推 SALEENS7LM: 人類最主要的差異就是自我意識吧，就算學習也是自我 10/06 14:53

→ SALEENS7LM: 去思考見解取捨吸收融合之後依照自己的想法去畫出想 10/06 14:53

→ SALEENS7LM: 畫的東西，用手畫出腦內的想法或創意，就是這樣才有 10/06 14:53

→ SALEENS7LM: 很多現實不存在的奇幻生物之類的被創作出來 10/06 14:53

推 vios10009: 那樣的話有問題的也是那些拿盜圖來餵的人，不是AI 10/06 14:54

→ naya7415963: 現實不存在的奇幻生物的概念也是從現實動物而來的啊 10/06 14:59

→ naya7415963: 人類的思想仍然無法超脫自身所生存的世界概念，所謂 10/06 14:59

→ naya7415963: 的創意仍然是從生命經驗而來。而為了特定目的訓練的 10/06 14:59

→ naya7415963: AI都餵同類型的圖，自然也只能製造出範圍內的圖，甚 10/06 14:59

→ naya7415963: 至超出範圍會被人類判定為不合格 10/06 14:59

推 vios10009: NovelAI如果是盜圖，那應該譴責他們，但AI是無辜的， 10/06 15:00

→ vios10009: 不能一竿子打翻一船AI，其他拿公開無版權圖案練習的AI 10/06 15:00

→ vios10009: 不該因此被推上處刑台 10/06 15:00

→ BwDragonfly: 有問題一直都是盜圖的人，如果是自己畫圖餵給AI，哪 10/06 15:03

→ BwDragonfly: 有問題 10/06 15:03

推 SALEENS7LM: 人類懂得把現實被認知到的概念用思想去融合或以此為 10/06 15:04

→ SALEENS7LM: 底魔改成一種新的本身就是在用自我意識去創造了啊 10/06 15:04

推 TSMKDAsa: 為什麼一直有人譴責NovelAi用盜版網站資料但是卻沒見過 10/06 15:06

→ TSMKDAsa: 幾個人去譴責danbooru本身啊它才是萬惡根源不是ㄇ 10/06 15:06

→ Koyomiiii: 因為嘴danbooru高機率像上面那篇被曬www 10/06 15:07

推 guogu: ai也很會融阿安價串不就融出一堆鬼東西 10/06 15:07

推 naya7415963: 那像之前有人發文眼睛長奶子的難道就不算創造嗎？ 10/06 15:09

→ naya7415963: 我覺得前提是觀看者知道作者是人類或AI，才因此產生 10/06 15:09

→ naya7415963: 出觀感差異 10/06 15:09

推 undeadmask: 問題就在人類創意由來的生命經驗不光來自外在形象的 10/06 15:10

→ undeadmask: 臨摹而已 10/06 15:10

推 jay920314: 推好多熟悉的名詞，但我沒學好都看無 10/06 15:16

→ SALEENS7LM: 那是它經過思考理解之後想像得出的東西嗎？ 10/06 15:21

→ naya7415963: 樓上上說的能否舉例呢？有點抽象不太理解你的意思 10/06 15:21

→ naya7415963: 對，我覺得重點在「作者的思考與理解」，人類繪師的 10/06 15:23

→ naya7415963: 價值就在於.....他是人類。 10/06 15:23

→ naya7415963: 因為我們是群居動物，天生有交流的需求，所以能夠理 10/06 15:23

→ naya7415963: 解繪師思想的畫作比起AI隨機產圖還要有價值 10/06 15:23

→ naya7415963: (不過價值可能因人而異就是了) 10/06 15:24

→ naya7415963: 並不是「因為是人類才能畫的出這樣的圖」，而是「因 10/06 15:25

→ naya7415963: 為是人類畫出這樣的圖才有意義」 10/06 15:25

→ naya7415963: 依照圖本身的用途不同，有些不需要作者這層意義的就 10/06 15:26

→ naya7415963: 會被AI取代 10/06 15:26

推 undeadmask: 現在的AI算圖的局限在於你的取材樣本終究來自於分析 10/06 15:39

→ undeadmask: 其他人已經創作出的圖像作品，但是人類的創作靈感有 10/06 15:39

→ undeadmask: 時候不單單來自於眼睛所見到的事物，夢境、記憶、感 10/06 15:39

→ undeadmask: 情、經驗，甚至味覺嗅覺等等都能成為題材養分，透過 10/06 15:39

→ undeadmask: 人的主觀意識形塑成作品，甚至在不同的精神情緒狀態 10/06 15:39

→ undeadmask: 也會有不一樣的結果。 10/06 15:39

推 qwerasd158: 專業推 10/06 15:41

→ undeadmask: 當然用AI學習運算可以在視覺結果上無限的接近，但我 10/06 15:43

→ undeadmask: 認為過程還是有不小的差異 10/06 15:43

推 Mike821018: 所以簡單說就是AI先看一幅畫怎麽被揉成垃圾 10/06 17:35

→ Mike821018: 再嘗試把另一坨垃圾攤開變成一幅畫 10/06 17:35

推 lonelygroup: 寫得挺好&有插圖推 10/06 18:07