Wan2.2リリース! ComfyUIはゼロデイ対応を発表! アリババクラウドにはプロ版APIも

Wan2.2がComfyUIに Day 0対応で登場！

2025年7月28日、次世代動画生成モデル Wan2.2 がリリースされました。
https://wan.video/welcome
そしてComfy Orgからはリリース当日(Day0)からComfyUIのネイティブ対応を発表しました！

Ready to be amazed? 🚀
Our new concept film is out! See how Wan2.2 makes life bloom in every frame.
See it for yourself! 👇 pic.twitter.com/RnDAVld5Z1
— Wan (@Alibaba_Wan) July 28, 2025

Wan2.2の注目ポイント

・MoE（Mixture of Experts）アーキテクチャによるデュアルノイズ専門モデル：MoEエキスパートモデルアーキテクチャ。高ノイズエキスパートが全体のレイアウトを、低ノイズエキスパートが細部を洗練させます。

・シネマティック・エステティック・コントロール：プロフェッショナルなカメラ言語で、ライティング、カラー、構図といった多次元的なビジュアルコントロールをサポートします。

・大規模で複雑なモーション：様々な複雑なモーションをスムーズに再現し、動きの制御性と自然さを向上させます。

・正確なセマンティック・アドハーレンス：複雑なシーンを理解し、複数のオブジェクトを生成し、クリエイティブな意図をより正確に再現します。

・効率的な圧縮技術：バージョン2.1と比較して、データが大幅にアップグレードされました。5Bバージョンは、高圧縮VAEと最適化されたVRAM使用量を特徴としています。

・Apache 2.0ライセンス下で完全オープンソース、商用利用も可能！

・VAEの高圧縮化・VRAM最適化により、5Bモデルは8GB VRAMで動作可能に！

提供されるモデル（ComfyUI内で選択可能）

Wan2.2-TI2V-5B: テキスト・画像→動画 FP16

T2V-A14Bモデルは、480Pと720Pの両方の解像度で5秒の動画生成をサポートします。Mixture-of-Experts（MoE）アーキテクチャを採用し、卓越した動画生成品質を実現します。当社の最新ベンチマークWan-Bench 2.0では、このモデルは主要な商用モデルをほぼすべての主要な評価項目で上回りました。

Wan2.2-I2V-14B: 画像→動画 FP16 / FP8

画像から動画を生成するために設計されたI2V-A14Bモデルは、480Pと720Pの両方の解像度をサポートします。Mixture-of-Experts（MoE）アーキテクチャを採用し、非現実的なカメラの動きを低減し、より安定した動画合成を実現し、多様なスタイルシーンへの対応を強化しています。

Wan2.2-T2V-14B: テキスト→動画 FP16 / FP8

TI2V-5Bモデルは、16×16×4の圧縮率を実現する先進のWan2.2-VAEを搭載しています。このモデルは、720P解像度で24fpsのテキストから動画への変換と、画像から動画への変換の両方をサポートし、4090などのコンシューマーグレードのGPUを1つ搭載することで動作します。720P@24fpsのモデルとしては最速クラスであり、産業用途と学術研究の両方のニーズを満たします。

サービス提供者による提供

Wan.videoでいますぐはじめる

https://wan.video/explore

Alibaba Cloud Model StudioにはPro版APIのリリースも！

オープン版とは別に wan2.2-t2v-plus、wan2.2-i2v-plusというモデルがリリースされています。こちらはWan.videoで提供されているものと同様で、オープン版とは異なるモーション安定性があるようです。

気になるAPI料金は？

wan2.2-t2v-plus 480P: $0.02/second 1080P: $0.10/second
wan2.2-i2v-plus 480P: $0.02/second 1080P: $0.10/second

アカウント作成から180日は50秒まで無償生成できるそうです

Vadoo AI

インドで人気の動画生成サービスです

Most models give you output.
WAN 2.2 gives you control.

🎬 Cinematic precision
🔄 Smooth complex motion
🧠 Real scene understanding

Unlimited generation. $99.

For creators in the director's chair.
👉 https://t.co/pmSrWNPa33 @Alibaba_Wan pic.twitter.com/PvXeneZMKZ
— Vadoo AI (@vadooai) July 28, 2025

ComfyUIで無料で始めるには？

☆編集部注：7/28執筆時点の最新Desktopバージョン0.4.57 (250721oojrf13ui)にはまだ配信されていませんでした。7/29の最新Desktop版に配信開始となりました。

ComfyUIまたはComfyUI Desktopを最新版にアップデート
メニューから「Workflow → Browse Templates → Video」を選択
以下からテンプレートを選ぶ
1. Wan 2.2 Text to Video
2. Wan 2.2 Image to Video
3. Wan 2.2 5B Video Generation

ポップアップに従ってモデルをダウンロード
テンプレートを実行！

詳細な使い方・解説はこちら
Comfy Orgによる公式ドキュメントとブログ記事
ワークフローはこちらから

https://docs.comfy.org/tutorials/video/wan/wan2_2#wan2-2-14b-t2v-text-to-video-workflow-example

インストールについてはAICUでも紹介していきます！

以下公式のツイートギャラリーより

Wan2.2 is now natively supported in ComfyUI on Day 0!

🔹 A next-gen video model with MoE (Mixture of Experts) architecture with dual noise experts, under Apache 2.0 license!
- Cinematic-level Aesthetic Control
- Large-scale Complex Motion
- Precise Semantic Compliance

📚… pic.twitter.com/9ifwJRSnZo
— ComfyUI (@ComfyUI) July 28, 2025

全てのライトを把握

https://x.com/ComfyUI/status/1949802347905048769

プロのカメラ用語を理解

Professional Camera Language pic.twitter.com/9p7A6GOOYd
— ComfyUI (@ComfyUI) July 28, 2025

より進んだカメラ動作

Advanced Camera Movement pic.twitter.com/s8ibqFGZxw
— ComfyUI (@ComfyUI) July 28, 2025

すべての感情を表現

Capture Every Emotion pic.twitter.com/0nahfYZepm
— ComfyUI (@ComfyUI) July 28, 2025

複雑な動き、自然な流れ

Complex Motion, Natural Flow pic.twitter.com/Gesfylgvow
— ComfyUI (@ComfyUI) July 28, 2025

無限のアート表現

Unlimited Artistic Expression pic.twitter.com/ui1QibS4Ru
— ComfyUI (@ComfyUI) July 28, 2025

画像からの動画

Image to Video 1/2 pic.twitter.com/nrnmdR1MAN
— ComfyUI (@ComfyUI) July 28, 2025

コンテンツ制作:
@Yo9oTatara / @SyntaxDiffusion / @PurzBeats / @ComfyUIWiki

配布が始まっているVACEや量子化モデル

さらに軽量版やVACE、そして色の問題があるようで公式アップデートもありそうです。未確認情報が多いので興味がある方だけに紹介します。

—

この記事の続きはこちらから https://note.com/aicu/n/ne8edd1b29f68

Originally published at note.com/aicu on July 28, 2025.

Wan