看板 AI_Art 關於我們 聯絡資訊
https://www.itmedia.co.jp/aiplus/articles/2602/02/news075.html 以下是 Vidu Q3 的相關資訊整理(基於文章 + 最新公開資訊,截至2026年2月):基本 資訊開發公司:ShengShu Technology(中國 AI 初創,與清華大學等有合作背景)。 發布時間:2026年2月初(文章於2月2日報導,屬於近期新模型,作為 Vidu 系列的 Q3 版本)。 官方平台:Vidu AI 官網(vidu.com),支援 Web 服務 + API。 核心賣點:業界首個在單一生成流程中同時輸出原生音訊 + 影片的長影片模型(native audio-video generation),不再需要後製配音。 主要功能與規格影片長度:最長 16 秒(業界領先,多數模型如前代僅 2-8 秒)。 輸入方式:文字提示(Text-to-Video)、圖片輸入(Image-to-Video)、多模態。 音訊支援:直接生成語音旁白 + 唇形同步(lip-sync),支援日語、英語、中文等多語 言。日語表現特別突出,尤其是「動漫聲」(anime voice)品質高、讀起來自然,口型 同步違和感低。 畫質與格式:Web 端輸出 1080p(可選 16:9、9:16、1:1 等比例),支援 2K/4K 升級( 部分功能)。 進階控制:提示可指定鏡頭運動(pan、tilt、dolly 等)、切換鏡頭(multi-shot / 智 能分鏡)、轉場。 其他特色:物理模擬更強、畫面一致性高、支援字幕內嵌生成(非後製)。 與其他模型比較(文章與網路印象)優於 OpenAI Sora 2:提示追隨度更好(尤其是鏡頭 運動與切換),lip-sync 更自然。 整體被視為 Sora、Kling、Runway、Luma、Veo 等競爭對手中的強勁新秀,尤其在音畫同 步與日語/動漫風格上領先。 缺點:生成時間較長(8-10 秒影片可能需數分鐘到 10 分鐘),有時需排隊。 日本走紅原因日本 X 用戶大量分享用 Vidu Q3 生成的動漫風格影片,日語發音 + 動漫 聲優般的語調讓人驚艷,唇形同步自然。 文章作者親測後也認同:「日本語読み上げの精度は高く、特に“アニメ声”のクオリテ ィーは高い」「リップシンクも違和感が少なく」。 動漫、Vtuber、輕小說相關創作者特別感興趣,因為能快速做出帶聲音的短動畫片段,省 去配音麻煩。 官方也有日文社群(如 @vidujapan ),並在 PR 中強調適合日本創作者。 使用與價格Web 端:直接上 vidu.com 註冊使用(有免費額度或試用)。 API 價格:1080p 約 $0.16 / 秒(非高峰期可能半價),支援更低解析度。 許多第三方平台(如 fal.ai、Dzine、Media.io、Pollo AI 等)也整合 Vidu Q3 模型, 可免費或低成本試玩。 -- 以上grok整理 以下轉5ch https://www.youtube.com/watch?v=XDvyLTlOaKY
https://reurl.cc/dqMA58 https://reurl.cc/jmno5Z https://reurl.cc/QVvx7p https://reurl.cc/Vmdl35 https://reurl.cc/qKl6mn https://reurl.cc/aMWA57 至少在日文配音這部分算是有一定實力 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.217.153 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1770079768.A.54B.html ※ 編輯: error405 (114.36.217.153 臺灣), 02/03/2026 08:54:37
AoWsL: 效果確實比Q2進步蠻多的..不過要摸熟 還是選最高方案吧 02/03 12:11
AoWsL: 一個月兩三千那個 02/03 12:11
AoWsL: 2/1速度 02/03 12:14
AoWsL: https://i.urusai.cc/3nNRf.gif 02/03 12:14
AoWsL: 生一張費用90~150點(最長16秒) 02/03 12:15
AoWsL: 沒有錯峰模式 所以... 打出來的影片都是真金白銀 02/03 12:19
AoWsL: https://i.urusai.cc/clOIs.gif 02/03 12:27
AoWsL: 你連結好像都是壞掉的 02/03 12:28
https://greta.5ch.net/test/read.cgi/poverty/1770024160/ 縮址也不行那我放原討論串 ※ 編輯: error405 (114.36.217.153 臺灣), 02/03/2026 12:38:26
ZMTL: https://i.imgur.com/Wgg6Gy8.jpeg 今天看到的 02/03 15:56
ZMTL: 但我不太確定哪邊是t2v哪邊是i2v,但sora2的i2v理論上是倒數 02/03 15:56
ZMTL: 的 02/03 15:56
AoWsL: Artificial Analysis 02/03 16:06
AoWsL: 右邊T2V 。不錯了啦...I2V確實沒Kling強 Kling要出3.0了 02/03 16:07
AoWsL: http://i.imgur.com/FisD2Yh.jpg 02/03 16:11
AoWsL: http://i.imgur.com/MdAijuZ.jpg 02/03 16:11
error405: LMArena資料還沒更新 02/03 16:12
AoWsL: http://i.imgur.com/mEdR4w8.jpg 02/03 16:40
error405: https://x.com/search?q=Vidu%20Q3 02/03 22:10