看板 C_Chat 關於我們 聯絡資訊
※ 引述 《sxy67230》 之銘言: : 噓 leo125160909: 目前雜訊生成的方式只能生出跟訓練資料相似的東西, 04/02 16:18 : → leo125160909: 無法無中生有 04/02 16:18 : → leo125160909: AI畫手指畫成一朵花、畫拉麵用手抓,說明AI生圖跟人 04/02 16:21 : → leo125160909: 類畫圖的邏輯根本上不同,除非AGI能結合邏輯思考生 04/02 16:21 : → leo125160909: 圖,不然目前的AI仍然只是精巧的模仿而已 04/02 16:21 這邊早上才看到,所以想說用回覆的。 這邊說的是diffusion based的model,但這次OpenAI展示的其實可能不是基於這種diffusio n based model,這邊要說到一個問題就是傳統diffusion model有一個問題就是要做到scal ing up非常不容易,模型越大越不好做擴散過程(效率慢計算資源消耗大),這導致diffus ion model通常大小不會太大。雖然說目前確實證實了LDM確實存在縮放法則但真的做到跟LL M相同尺寸的根本還不存在。 然後這邊要說的是去年字節跳動跟北大的一篇新研究Vision autoregressive model(雖然 作者後來被字節跳動告了,主要原因是因為他不滿公司資源調派,Hacking公司同事的機器 破壞同事的工作。本來字節是惜才不想鬧大後來作者自己鬧大被字節提告),這篇有拿到Ne uraIPS 2024的最佳論文獎,主要的想法是直接拿現在LLM的自回歸架構來訓練圖片生成,然 後採用了多尺度逐Token預測避免了之前Vision AR模型做不太起來的問題,這樣就把很多計 算問題解掉可以像大語言模型一樣Scaling擴大到70B的參數以上,研究也發現超過現有主流 擴散模型,而且也發現像傳統LDM出現的繪圖細節瑕疵在VAR上是可以大機率被避免掉的。 而且VAR真正開啟的可能是我們可以像LLM一樣訓練VAR對齊人類偏好跟做圖片推理鏈,這應 該是未來3-5年很有可能發生的。 可能未來繪師口中的靈魂跟繪畫溫度只存在提示詞中。 以上 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.105.9 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1743642144.A.E71.html
Xavy: 求這篇翻譯 我看起來像聽君一席話 04/03 09:04
※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 09:05:05 ※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 09:05:40
melzard: 翻譯過來就是未來能做到自創 或者說讓你看起來像是自創04/03 09:06
error405: 新技術越大張細節越準確的意思嗎04/03 09:06
melzard: 我甚至不懷疑有AI公司將來會策劃用純AI去假冒真人繪師去 04/03 09:07
melzard: 接案 日常畫圖 最終公布真實身份 04/03 09:07
※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 09:08:27
dlam002: http://i.imgur.com/a0FrcaN.jpg Can you? 04/03 09:09
melzard: 等到了那一天 再也沒人會在乎推特上誰是真人誰是AI 04/03 09:11
Innofance: AI可以空手套白狼的特性,中國、日本主流的繪圖接案網 04/03 09:14
Innofance: 站都是明令禁止AI就是 04/03 09:14
melzard: 那對Ai公司反而無所謂甚至更好 因為等於利用這些網站來背04/03 09:16
melzard: 書他們的AI多強 能騙過這些禁止AI的網站 04/03 09:16
Innofance: 目前為止AI還是一看圖層就破功的程度04/03 09:16
Innofance: 好個雞八,純詐騙而已04/03 09:17
melzard: 因為AI公司的主要客戶肯定不會是這些接案網站 成功創造04/03 09:18
melzard: 出擬人AI商機也遠大於和這些網站訴訟的小錢04/03 09:18
pikachu2421: 日本沒有都禁啊 skeb有禁AI pixiv沒有禁04/03 09:18
egg781: 是不是有點哲學問題?人類也是通過學習,AI只是因為學超快04/03 09:18
melzard: 現在還騙不過 以後就越來越難說04/03 09:18
Innofance: Pixiv盈利禁AI好不好==04/03 09:19
error405: 前幾天產的色圖丟pixiv現在破50follow惹 04/03 09:20
pikachu2421: pixiv只有fanbox有禁AI喔 pixiv本身和booth都沒禁04/03 09:20
bnn: 因為主要賣錢的都是人類偏好 你牆上貼一根香蕉真的很多人買嗎04/03 09:21
bnn: 還是你放一個馬桶或排排放campbell罐頭比較常放家裡當裝飾畫 04/03 09:22
driftcreator: openai有出paper, 他們不是使用當前主流的堆疊方式04/03 09:22
目前只有blog跟一些片段資訊維持過往closeAI不透露模型架構細節,但從中推測很有可能 類似去年字節那套VAR的方法也就是讓圖片是天然跟語言一起學習的,這樣生成出來的東西 理論上是更具備潛力而且可以透過多輪指令遵循改進圖片生成結果。
melzard: 牆上貼香蕉真的挺好笑的 04/03 09:22
bnn: 而當你有那個創意後 你扔這個創意去AI也可以幫你畫完 04/03 09:23
bnn: 如果你要立體的香蕉 市場買一根 或是大費周章3D列印一個塑膠04/03 09:24
bnn: 不過如果你把藝術當成裝逼吸引貴婦包養用的爬窗戶手段 那沒了04/03 09:25
bnn: 以前的各種畫舔大公或是取悅資助者的畫 就是人類偏好 04/03 09:26
Innofance: Booth沒禁,但是Pixiv是禁止AI盈利的,自己去翻條文唄04/03 09:27
pikachu2421: pixiv上便都能找到AI開request的 pixiv也沒在管就是04/03 09:28
pikachu2421: *隨便04/03 09:28
Innofance: 管是有在管,但只能說管不過來就是,畢竟開Request不04/03 09:30
Innofance: 用審核。就連有審核制度的米畫師都混一堆進去了04/03 09:30
bnn: 順便一提 版畫這個當年也被說沒有手繪的靈魂和溫度04/03 09:31
bnn: 後來也變成每一張都有其獨特的耗損和特色 版印到壞了就沒了04/03 09:31
driftcreator: 目前影像生成的新代模型, 閉源OpenAI跟Google領頭04/03 09:33
pikachu2421: pixiv request禁止行為和禁止商品都沒寫到AI 04/03 09:35
pikachu2421: 是寫在哪裡啊 沒找到...04/03 09:35
pikachu2421: 搜尋了一下好像只寫在一篇公告 但是規約沒有寫...04/03 09:44
Innofance: pixivリクエスト クリエイターガイド 04/03 09:49
Innofance: 規約的話,寫在「リクエスト機能個別規約」04/03 09:50
pikachu2421: https://www.pixiv.net/request/policy 04/03 09:57
pikachu2421: 這個頁面的規約沒更新 難怪沒看到... 04/03 09:57
Innofance: 他規約其實沒有寫明,但是內容可以引導到ガイドライン04/03 09:59
※ 編輯: sxy67230 (49.216.105.9 臺灣), 04/03/2025 10:01:05
tsubasawolfy: 當年照相機出來也被畫肖像畫的說那不是藝術 04/03 11:45
bluejark: 就很很多人還在反智 ai生圖只是一影像生成技術 04/03 18:20
bluejark: 這概念與傳統繪圖是兩回事 要模仿的像是本身的技術需要 04/03 18:23
bluejark: 至於怎麼使用工具才是人的問題 04/03 18:25
bluejark: 有人使用ai做原創 有人自己畫二創不 誰才侵害版權? 04/03 18:25
Meuf: 所以現在的進展比較偏向提升關鍵字生成目標圖像的準確度嗎 04/06 18:42