作者error405 (流河=L)
看板AI_Art
標題[閒聊] viduQ3影片動畫生成模型 日本關注
時間Tue Feb 3 08:49:23 2026
https://www.itmedia.co.jp/aiplus/articles/2602/02/news075.html
以下是 Vidu Q3 的相關資訊整理(基於文章 + 最新公開資訊,截至2026年2月):基本
資訊開發公司:ShengShu Technology(中國 AI 初創,與清華大學等有合作背景)。
發布時間:2026年2月初(文章於2月2日報導,屬於近期新模型,作為 Vidu 系列的 Q3
版本)。
官方平台:Vidu AI 官網(vidu.com),支援 Web 服務 + API。
核心賣點:業界首個在單一生成流程中同時輸出原生音訊 + 影片的長影片模型(native
audio-video generation),不再需要後製配音。
主要功能與規格影片長度:最長 16 秒(業界領先,多數模型如前代僅 2-8 秒)。
輸入方式:文字提示(Text-to-Video)、圖片輸入(Image-to-Video)、多模態。
音訊支援:直接生成語音旁白 + 唇形同步(lip-sync),支援日語、英語、中文等多語
言。日語表現特別突出,尤其是「動漫聲」(anime voice)品質高、讀起來自然,口型
同步違和感低。
畫質與格式:Web 端輸出 1080p(可選 16:9、9:16、1:1 等比例),支援 2K/4K 升級(
部分功能)。
進階控制:提示可指定鏡頭運動(pan、tilt、dolly 等)、切換鏡頭(multi-shot / 智
能分鏡)、轉場。
其他特色:物理模擬更強、畫面一致性高、支援字幕內嵌生成(非後製)。
與其他模型比較(文章與網路印象)優於 OpenAI Sora 2:提示追隨度更好(尤其是鏡頭
運動與切換),lip-sync 更自然。
整體被視為 Sora、Kling、Runway、Luma、Veo 等競爭對手中的強勁新秀,尤其在音畫同
步與日語/動漫風格上領先。
缺點:生成時間較長(8-10 秒影片可能需數分鐘到 10 分鐘),有時需排隊。
日本走紅原因日本 X 用戶大量分享用 Vidu Q3 生成的動漫風格影片,日語發音 + 動漫
聲優般的語調讓人驚艷,唇形同步自然。
文章作者親測後也認同:「日本語読み上げの精度は高く、特に“アニメ声”のクオリテ
ィーは高い」「リップシンクも違和感が少なく」。
動漫、Vtuber、輕小說相關創作者特別感興趣,因為能快速做出帶聲音的短動畫片段,省
去配音麻煩。
官方也有日文社群(如 @vidujapan
),並在 PR 中強調適合日本創作者。
使用與價格Web 端:直接上 vidu.com 註冊使用(有免費額度或試用)。
API 價格:1080p 約 $0.16 / 秒(非高峰期可能半價),支援更低解析度。
許多第三方平台(如 fal.ai、Dzine、Media.io、Pollo AI 等)也整合 Vidu Q3 模型,
可免費或低成本試玩。
--
以上grok整理
以下轉5ch
https://www.youtube.com/watch?v=XDvyLTlOaKY
https://reurl.cc/dqMA58
https://reurl.cc/jmno5Z
https://reurl.cc/QVvx7p
https://reurl.cc/Vmdl35
https://reurl.cc/qKl6mn
https://reurl.cc/aMWA57
至少在日文配音這部分算是有一定實力
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.217.153 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1770079768.A.54B.html
※ 編輯: error405 (114.36.217.153 臺灣), 02/03/2026 08:54:37
推 AoWsL: 效果確實比Q2進步蠻多的..不過要摸熟 還是選最高方案吧 02/03 12:11
→ AoWsL: 一個月兩三千那個 02/03 12:11
→ AoWsL: 2/1速度 02/03 12:14
→ AoWsL: 生一張費用90~150點(最長16秒) 02/03 12:15
→ AoWsL: 沒有錯峰模式 所以... 打出來的影片都是真金白銀 02/03 12:19
→ AoWsL: 你連結好像都是壞掉的 02/03 12:28
https://greta.5ch.net/test/read.cgi/poverty/1770024160/
縮址也不行那我放原討論串
※ 編輯: error405 (114.36.217.153 臺灣), 02/03/2026 12:38:26
推 ZMTL: 但我不太確定哪邊是t2v哪邊是i2v,但sora2的i2v理論上是倒數 02/03 15:56
推 ZMTL: 的 02/03 15:56
→ AoWsL: Artificial Analysis 02/03 16:06
→ AoWsL: 右邊T2V 。不錯了啦...I2V確實沒Kling強 Kling要出3.0了 02/03 16:07
→ error405: LMArena資料還沒更新 02/03 16:12