作者ayachyan (ayachyan)
看板C_Chat
標題[情報] Google發表全新AI生成工具「Genie 2」
時間Sun Dec 8 10:04:24 2024
Google 發表全新 AI 生成工具「Genie 2」 能以單張圖像建構可遊玩的 3D 遊戲世界
https://gnn.gamer.com.tw/detail.php?sn=277788
網路巨擘 Google 旗下的人工智慧公司 Google DeepMind 日前發表了一種全新 AI 人工智
慧生成工具「Genie 2」,能透過 AI 從單一圖像產生出可以讓使用者即時操控角色進行探
索與互動的 3D 環境。
https://p2.bahamut.com.tw/B/2KU/82/44d8a94916b99e4cd5567c7b4b1se725.WEBP
Genie 2 是一種大規模基礎世界模型,能基於單一提示圖像產生無數種可操作、可遊玩的 3
D 環境。用於訓練和評估虛擬助理,協助藝術家或設計師快速製作原型,引導環境設計的創
意過程,進一步加速研究。
Genie 2 可以透過使用者輸入的提示圖像來產生出對應主題的虛擬世界並動態模擬,即時呈
現出各種行動的結果,如跳躍、游泳等。具備建模、複雜角色動畫、物件互動、物理模擬、
預測其他 AI 代理行為的能力。
Genie 2 能從提示圖像中正確辨識出主體角色,即時回應鍵盤按鍵輸入所採取的動作,並依
照操作輸入從當下畫格中即時產生出無數種軌跡變化的影像。過程中會記錄下所有先前產生
過、但當下已經不可見的場景,以便在回頭探索時能一致重現,最長可以產生出 1 分鐘保
持一致主題的世界,還能以不同的視角呈現。
Genie 2 能識別 3D 結構並產生複雜的 3D 視覺場景。能模擬各種物件的互動,如氣球爆裂
、開門或是點燃炸藥桶等。能替執行不同活動的各種類型角色製作對應的動畫。能建立其他
AI 代理(NPC)的模型甚至與之進行複雜的互動。能提供物理模擬效果,像是水體、煙霧
、重力、光照、反射、泛光、彩色照明等。
更多資訊可參考 Google DeepMind 官方部落格介紹:
https://bit.ly/4gnXb6x
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.200.138.67 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1733623467.A.EE7.html
※ 編輯: ayachyan (1.200.138.67 臺灣), 12/08/2024 10:05:22
推 pal1231: 一分鐘的遊戲是能玩什麼 主要還是影片生成吧 12/08 11:54
→ BOARAY: 不能搞瑟瑟就沒用了 12/08 12:01
推 cybermeow: 沒人認真回 推個 目前顯然還在prototyping階段但把這 12/08 16:38
→ cybermeow: 種control套到成熟的video model潛力無限 是不是最好 12/08 16:38
→ cybermeow: 的做法另外說就是 像是背後放world labs那種3d 之後配 12/08 16:38
→ cybermeow: 合runway那些v2v之類的也是另一種手段 不過即時render 12/08 16:38
→ cybermeow: ing也有額外的痛點 一般diffusion可以全部時間一起生 12/08 16:38
→ cybermeow: 成 即使rendering要auto regressive 所以consistency 12/08 16:38
→ cybermeow: 更容易出問題 最近NVIDIA有一篇從bidirectional disti 12/08 16:38
→ cybermeow: ll到causal 試圖解決這個問題 12/08 16:38
→ cybermeow: 一般人可能對這種看起來還不怎麼樣的技術不感興趣 但 12/08 16:39
→ cybermeow: 它們到看起來怎麼樣需要的時間其實可能沒有很長 12/08 16:39
→ cybermeow: 喔上面說那篇是adobe不是nv 12/08 16:44