「Wan2.1-VACE」登場！動画生成AIの新星、SoraやLumaを超える性能とは？

アリババが発表した「Wan2.1-VACE」は、動画生成と編集を一体化したAIモデルで、参照動画からの生成、動画編集、マスクされた動画の編集など、多様なタスクに対応しています。

マルチモーダル入力により、動画生成の制御性が向上し、統一されたモデルで一貫したソリューションを提供します。
モデルサイズは1.3Bと14Bの2種類があり、Apache-2.0ライセンスのもとで提供されています。GitHub、HuggingFace、ModelScope、Alibaba CloudのAPIサービスなどで利用可能です。

Wan2.1との違いは？
Wan2.1はテキスト・画像からの動画生成（T2V・I2V）に特化していたのに対し、Wan2.1-VACEは動画編集（V2V・MV2V）機能も統合したオールインワンモデルである。
単一モデルで複数タスクを一貫処理でき、マルチモーダル入力に対応することで、より細かい制御と高度な映像制作が可能となった。

ACNコメットブースター

🚀 ピッタリなヒューマン
動画制作に携わるクリエイター、映像編集者、マーケティング担当者など、動画コンテンツを活用するすべてのプロフェッショナル。
🛠 使えるシナリオ
プロモーションビデオの制作、SNS向けショート動画の作成、教育コンテンツの開発、映像作品の編集など、多岐にわたる用途で活用可能。
⚔️ 対抗馬との違い
1. Sora — 高品質な動画生成に特化しているが、編集機能は限定的。
2. Luma — リアルな映像生成が可能だが、マルチモーダル入力や編集機能は未対応。
3. Pika — 軽量で高速な動画生成が可能だが、機能の幅は限定的。

🔭 ACN視点のインサイト
Wan2.1-VACEは、従来のWan2.1が持っていた生成特化モデルという枠を超え、「生成」と「編集」の全工程を一元管理するプロダクションレベルの統合AIである。
これにより、映像制作のワークフローが根本から変わる。従来は複数ツールを連携させていた作業が、単一モデル内で完結するため、手間・コスト・学習コストのすべてを圧縮できる。

これは、単なる技術進化ではなく、映像制作というプロセスそのものの再定義である。コンテンツ制作のスピードと精度を両立しつつ、表現の自由度を飛躍的に高める点で、SoraやLumaといった競合とは本質的に設計思想が異なる。

🛰 元ネタリンク
https://x.com/Alibaba_Wan/status/1922655324919779604

✨ All in One, Wan for All✨
We are excited to introduce our latest model to our talented community creators: Wan2.1-VACE, All-in-One Video Creation and Editing model.
Model size: 1.3B, 14B
License: Apache-2.0
📌 Wan2.1-VACE provides solutions for various tasks, including… pic.twitter.com/yiQRVhXpop
— Wan (@Alibaba_Wan) May 14, 2025

If we are in Wan Day, what will it be like? pic.twitter.com/CSgdeO5Uxe
— Wan (@Alibaba_Wan) May 14, 2025

Trending now