AICU

Wan2.2リリース! ComfyUIはゼロデイ対応を発表! アリババクラウドにはプロ版APIも

作成者: AICU Japan|2025/08/01 20:14:36 Z

Wan2.2がComfyUIに Day 0対応で登場!

2025年7月28日、次世代動画生成モデル Wan2.2 がリリースされました。
https://wan.video/welcome
そしてComfy Orgからはリリース当日(Day0)からComfyUIのネイティブ対応を発表しました! 

 

Wan2.2の注目ポイント

MoE(Mixture of Experts)アーキテクチャによるデュアルノイズ専門モデル:MoEエキスパートモデルアーキテクチャ。高ノイズエキスパートが全体のレイアウトを、低ノイズエキスパートが細部を洗練させます。

・シネマティック・エステティック・コントロール:プロフェッショナルなカメラ言語で、ライティング、カラー、構図といった多次元的なビジュアルコントロールをサポートします。

・大規模で複雑なモーション:様々な複雑なモーションをスムーズに再現し、動きの制御性と自然さを向上させます。

・正確なセマンティック・アドハーレンス:複雑なシーンを理解し、複数のオブジェクトを生成し、クリエイティブな意図をより正確に再現します。

・効率的な圧縮技術:バージョン2.1と比較して、データが大幅にアップグレードされました。5Bバージョンは、高圧縮VAEと最適化されたVRAM使用量を特徴としています。

・Apache 2.0ライセンス下で完全オープンソース、商用利用も可能!

・VAEの高圧縮化・VRAM最適化により、5Bモデルは8GB VRAMで動作可能に!

提供されるモデル(ComfyUI内で選択可能)

Wan2.2-TI2V-5B: テキスト・画像→動画 FP16

T2V-A14Bモデルは、480Pと720Pの両方の解像度で5秒の動画生成をサポートします。Mixture-of-Experts(MoE)アーキテクチャを採用し、卓越した動画生成品質を実現します。当社の最新ベンチマークWan-Bench 2.0では、このモデルは主要な商用モデルをほぼすべての主要な評価項目で上回りました。

Wan2.2-I2V-14B: 画像→動画 FP16 / FP8

画像から動画を生成するために設計されたI2V-A14Bモデルは、480Pと720Pの両方の解像度をサポートします。Mixture-of-Experts(MoE)アーキテクチャを採用し、非現実的なカメラの動きを低減し、より安定した動画合成を実現し、多様なスタイルシーンへの対応を強化しています。

Wan2.2-T2V-14B: テキスト→動画 FP16 / FP8

TI2V-5Bモデルは、16×16×4の圧縮率を実現する先進のWan2.2-VAEを搭載しています。このモデルは、720P解像度で24fpsのテキストから動画への変換と、画像から動画への変換の両方をサポートし、4090などのコンシューマーグレードのGPUを1つ搭載することで動作します。720P@24fpsのモデルとしては最速クラスであり、産業用途と学術研究の両方のニーズを満たします。

サービス提供者による提供

Wan.videoでいますぐはじめる

https://wan.video/explore

Alibaba Cloud Model StudioにはPro版APIのリリースも!

オープン版とは別に wan2.2-t2v-plus、wan2.2-i2v-plusというモデルがリリースされています。こちらはWan.videoで提供されているものと同様で、オープン版とは異なるモーション安定性があるようです。

気になるAPI料金は?

  • wan2.2-t2v-plus  480P: $0.02/second 1080P: $0.10/second

  • wan2.2-i2v-plus  480P: $0.02/second 1080P: $0.10/second

アカウント作成から180日は50秒まで無償生成できるそうです

Vadoo AI

インドで人気の動画生成サービスです

 

ComfyUIで無料で始めるには?

☆編集部注:7/28執筆時点の最新Desktopバージョン0.4.57 (250721oojrf13ui)にはまだ配信されていませんでした。7/29の最新Desktop版に配信開始となりました。

  1. ComfyUIまたはComfyUI Desktopを最新版にアップデート

  2. メニューから「Workflow → Browse Templates → Video」を選択

  3. 以下からテンプレートを選ぶ

    1. Wan 2.2 Text to Video

    2. Wan 2.2 Image to Video

    3. Wan 2.2 5B Video Generation

  1. ポップアップに従ってモデルをダウンロード

  2. テンプレートを実行!

 詳細な使い方・解説はこちら
Comfy Orgによる公式ドキュメントブログ記事
ワークフローはこちらから

https://docs.comfy.org/tutorials/video/wan/wan2_2#wan2-2-14b-t2v-text-to-video-workflow-example

インストールについてはAICUでも紹介していきます!

以下公式のツイートギャラリーより

 

全てのライトを把握

https://x.com/ComfyUI/status/1949802347905048769

プロのカメラ用語を理解

 

より進んだカメラ動作

 

すべての感情を表現

 

複雑な動き、自然な流れ

 

無限のアート表現

 

画像からの動画

 

コンテンツ制作:
@Yo9oTatara / @SyntaxDiffusion / @PurzBeats / @ComfyUIWiki

配布が始まっているVACEや量子化モデル

さらに軽量版やVACE、そして色の問題があるようで公式アップデートもありそうです。未確認情報が多いので興味がある方だけに紹介します。

この記事の続きはこちらから https://note.com/aicu/n/ne8edd1b29f68

Originally published at note.com/aicu on July 28, 2025.