Re: [閒聊] 各位覺得AI是否無法自創畫風？

作者sxy67230 (charlesgg)

看板C_Chat

標題Re: [閒聊] 各位覺得AI是否無法自創畫風？

時間Thu Apr 3 09:02:22 2025

※ 引述《sxy67230》之銘言： : 噓 leo125160909: 目前雜訊生成的方式只能生出跟訓練資料相似的東西， 04/02 16:18 : → leo125160909: 無法無中生有 04/02 16:18 : → leo125160909: AI畫手指畫成一朵花、畫拉麵用手抓，說明AI生圖跟人 04/02 16:21 : → leo125160909: 類畫圖的邏輯根本上不同，除非AGI能結合邏輯思考生 04/02 16:21 : → leo125160909: 圖，不然目前的AI仍然只是精巧的模仿而已 04/02 16:21 這邊早上才看到，所以想說用回覆的。這邊說的是diffusion based的model，但這次OpenAI展示的其實可能不是基於這種diffusio n based model，這邊要說到一個問題就是傳統diffusion model有一個問題就是要做到scal ing up非常不容易，模型越大越不好做擴散過程（效率慢計算資源消耗大），這導致diffus ion model通常大小不會太大。雖然說目前確實證實了LDM確實存在縮放法則但真的做到跟LL M相同尺寸的根本還不存在。然後這邊要說的是去年字節跳動跟北大的一篇新研究Vision autoregressive model（雖然作者後來被字節跳動告了，主要原因是因為他不滿公司資源調派，Hacking公司同事的機器破壞同事的工作。本來字節是惜才不想鬧大後來作者自己鬧大被字節提告），這篇有拿到Ne uraIPS 2024的最佳論文獎，主要的想法是直接拿現在LLM的自回歸架構來訓練圖片生成，然後採用了多尺度逐Token預測避免了之前Vision AR模型做不太起來的問題，這樣就把很多計算問題解掉可以像大語言模型一樣Scaling擴大到70B的參數以上，研究也發現超過現有主流擴散模型，而且也發現像傳統LDM出現的繪圖細節瑕疵在VAR上是可以大機率被避免掉的。而且VAR真正開啟的可能是我們可以像LLM一樣訓練VAR對齊人類偏好跟做圖片推理鏈，這應該是未來3-5年很有可能發生的。可能未來繪師口中的靈魂跟繪畫溫度只存在提示詞中。以上 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.105.9 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1743642144.A.E71.html

→ Xavy: 求這篇翻譯我看起來像聽君一席話 04/03 09:04

※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 09:05:05 ※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 09:05:40

推 melzard: 翻譯過來就是未來能做到自創或者說讓你看起來像是自創04/03 09:06

推 error405: 新技術越大張細節越準確的意思嗎04/03 09:06

→ melzard: 我甚至不懷疑有AI公司將來會策劃用純AI去假冒真人繪師去 04/03 09:07

→ melzard: 接案日常畫圖最終公布真實身份 04/03 09:07

※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 09:08:27

→ dlam002: http://i.imgur.com/a0FrcaN.jpg Can you? 04/03 09:09

→ melzard: 等到了那一天再也沒人會在乎推特上誰是真人誰是AI 04/03 09:11

推 Innofance: AI可以空手套白狼的特性，中國、日本主流的繪圖接案網 04/03 09:14

→ Innofance: 站都是明令禁止AI就是 04/03 09:14

推 melzard: 那對Ai公司反而無所謂甚至更好因為等於利用這些網站來背04/03 09:16

→ melzard: 書他們的AI多強能騙過這些禁止AI的網站 04/03 09:16

→ Innofance: 目前為止AI還是一看圖層就破功的程度04/03 09:16

→ Innofance: 好個雞八，純詐騙而已04/03 09:17

→ melzard: 因為AI公司的主要客戶肯定不會是這些接案網站成功創造04/03 09:18

→ melzard: 出擬人AI商機也遠大於和這些網站訴訟的小錢04/03 09:18

→ pikachu2421: 日本沒有都禁啊 skeb有禁AI pixiv沒有禁04/03 09:18

推 egg781: 是不是有點哲學問題?人類也是通過學習,AI只是因為學超快04/03 09:18

→ melzard: 現在還騙不過以後就越來越難說04/03 09:18

→ Innofance: Pixiv盈利禁AI好不好==04/03 09:19

→ error405: 前幾天產的色圖丟pixiv現在破50follow惹 04/03 09:20

→ pikachu2421: pixiv只有fanbox有禁AI喔 pixiv本身和booth都沒禁04/03 09:20

→ bnn: 因為主要賣錢的都是人類偏好你牆上貼一根香蕉真的很多人買嗎04/03 09:21

→ bnn: 還是你放一個馬桶或排排放campbell罐頭比較常放家裡當裝飾畫 04/03 09:22

推 driftcreator: openai有出paper, 他們不是使用當前主流的堆疊方式04/03 09:22

目前只有blog跟一些片段資訊維持過往closeAI不透露模型架構細節，但從中推測很有可能類似去年字節那套VAR的方法也就是讓圖片是天然跟語言一起學習的，這樣生成出來的東西理論上是更具備潛力而且可以透過多輪指令遵循改進圖片生成結果。

推 melzard: 牆上貼香蕉真的挺好笑的 04/03 09:22

→ bnn: 而當你有那個創意後你扔這個創意去AI也可以幫你畫完 04/03 09:23

→ bnn: 如果你要立體的香蕉市場買一根或是大費周章3D列印一個塑膠04/03 09:24

→ bnn: 不過如果你把藝術當成裝逼吸引貴婦包養用的爬窗戶手段那沒了04/03 09:25

→ bnn: 以前的各種畫舔大公或是取悅資助者的畫就是人類偏好 04/03 09:26

→ Innofance: Booth沒禁，但是Pixiv是禁止AI盈利的，自己去翻條文唄04/03 09:27

→ pikachu2421: pixiv上便都能找到AI開request的 pixiv也沒在管就是04/03 09:28

→ pikachu2421: *隨便04/03 09:28

→ Innofance: 管是有在管，但只能說管不過來就是，畢竟開Request不04/03 09:30

→ Innofance: 用審核。就連有審核制度的米畫師都混一堆進去了04/03 09:30

→ bnn: 順便一提版畫這個當年也被說沒有手繪的靈魂和溫度04/03 09:31

→ bnn: 後來也變成每一張都有其獨特的耗損和特色版印到壞了就沒了04/03 09:31

推 driftcreator: 目前影像生成的新代模型, 閉源OpenAI跟Google領頭04/03 09:33

→ pikachu2421: pixiv request禁止行為和禁止商品都沒寫到AI 04/03 09:35

→ pikachu2421: 是寫在哪裡啊沒找到...04/03 09:35

→ pikachu2421: 搜尋了一下好像只寫在一篇公告但是規約沒有寫...04/03 09:44

→ Innofance: pixivリクエスト　クリエイターガイド 04/03 09:49

→ Innofance: 規約的話，寫在「リクエスト機能個別規約」04/03 09:50

→ pikachu2421: https://www.pixiv.net/request/policy 04/03 09:57

→ pikachu2421: 這個頁面的規約沒更新難怪沒看到... 04/03 09:57

推 Innofance: 他規約其實沒有寫明，但是內容可以引導到ガイドライン04/03 09:59

※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 10:01:05

推 tsubasawolfy: 當年照相機出來也被畫肖像畫的說那不是藝術 04/03 11:45

→ bluejark: 就很很多人還在反智 ai生圖只是一影像生成技術 04/03 18:20

→ bluejark: 這概念與傳統繪圖是兩回事要模仿的像是本身的技術需要 04/03 18:23

→ bluejark: 至於怎麼使用工具才是人的問題 04/03 18:25

→ bluejark: 有人使用ai做原創有人自己畫二創不誰才侵害版權? 04/03 18:25

→ Meuf: 所以現在的進展比較偏向提升關鍵字生成目標圖像的準確度嗎 04/06 18:42