【最新】ついに発表!Wan2.2で映画のような映像を作ろう!ワークフローも大公開【ComfyUI】

少年
少年

Wan2.2 がリリースされたみたいですよ!

ティール
ティール

この記事で「Wan2.2」についてしっかり解説するね!

👇️この記事は、このような方に向けて書いています👇️

  • Wan2.2ってなに?
  • Wan2.2ってどんな特徴があるの?
  • Wan2.2のワークフローが知りたい

Wan2.2 とは

引用:https://huggingface.co/Wan-AI/Wan2.2-T2V-A14B

Wan2.2とは、WAN AIが開発した、最先端のオープンソース動画生成モデルです。
映画のような美しさと、自然な動きのある高品質な映像が特徴となっています。

Wan2.2 の特徴

1. 映画のように美しい映像を表現できる

Wan 2.2は、映像の見た目に関わる細かな情報をしっかり学習しています。
そのため、「照明・色彩・構図」などを高度に制御することができます。

2. 自然で滑らかな動きを表現できる

Wan 2.2 は、過去のモデルよりも大幅に多くの画像と動画で学習されています
そのため、人や物の動きがとても自然でリアルに表現できます。

  • 画像:従来のモデルよりも、約1.65倍の画像を使って学習しています
  • 動画:従来のモデルよりも、約1.83倍の映像を使って学習しています

3. 高精度な意味の理解度と表現力

Wan 2.2は、入力されたテキストや画像の意味を正しく読み取ることができます。
つまり、「こんなシーンにしたい!」というユーザーの意図を、
正しく読み取って映像にしてくれます。

Wan2.2 のパフォーマンス

こちらの画像は、「Wan2.2-T2V-A14B」と他の動画生成モデルの性能を比較したグラフです。
最近公開された「Seedance 1.0」のスコアも掲載されていますね。

Wan2.2-T2V-A14Bは、
ほぼすべての指標で他の動画生成モデルを上回っており、
現時点でトップクラスの性能を持っていることが分かります。

Wan2.2 のバリエーション

Wan 2.2には、3つのバリエーションが用意されています。

モデルタイプモデルネーム説明
Hybrid ModelWan2.2-TI2V-5Bテキストでも画像でもOK!
どちらの入力にも対応する
万能で軽量なモデル。
Text to VideoWan2.2-T2V-A14B文章から映像を作るならこれ!
意味理解力が高く、
映画のような映像を作れる。
Image to VideoWan2.2-I2V-A14B静止画を動かしたいならこれ!
画像の世界観を、
そのまま映像にできる

【Web】Wan.video で Wan2.2 Plus がリリース

Wan.video では、「Wan2.2 Plus」というモデルがリリースされています。
こちらは、オープン版とは異なるモーション安定性があるみたいです。

Wan2.2 Plus を無料で生成する方法

Wan.video であれば、Wan2.2 Plus を無料で試すことができます!

「Relax mode」であれば、
消費クレジットが「0」で、無制限に生成することができます。
ただし、生成時間がかなり長いのが難点です・・・

  • 三本線のマークをクリックする
  • 「Generate with Credits」のチェックを外す

Wan2.2 Plus を試してみた!

Wan2.2 Plus の「Fast mode」で、
フォトリアルなアニメの画像を動画にしてみました。

映像はキレイで、破綻することもなく、滑らかに動いてくれました😆👍️

  • 消費クレジットは「10」
  • 生成時間は2分~3分
Wan2.2 Plus の生成結果

Wan.video のサブスクリプションの料金

プラン料金獲得クレジット消費クレジット生成できる動画
Pro6.5$300クレジット1個の動画につき
10クレジット
30個
Premium26$1200クレジット1個の動画につき
10クレジット
120個

【ComfyUI】Wan2.2 のダウンロード

Wan2.2 の Diffusion Model

1. Diffusion Model をダウンロードする

Diffusion Model は、以下のリンクからダウンロードできます。
「high_noise_model」と「low_noise_model」モデルが用意されています。

2. Diffusion Model をフォルダに配置する

Diffusion Model を以下のフォルダに配置します。

「ComfyUI/models/diffusion_models」

Wan2.2 の VAE

1. VAE をダウンロードする

VAE は、以下のリンクからダウンロードできます。
注意点として、使用するモデルによって「VAE」が変わるみたいです。

  • T2V-A14B → wan_2.1_vae.safetensors
  • I2V-A14B → wan_2.1_vae.safetensors
  • TI2V-5B → wan2.2_vae.safetensors

2. VAE をフォルダに配置する

VAE を以下のフォルダに配置してください。

「ComfyUI/models/vae」

Wan2.2 の Text Encoder

1. Text Encoder をダウンロードする

以下のリンクから、Text Encoder をダウンロードしてください。

2. Text Encoder をフォルダに配置する

Text Encoder を、以下のフォルダに配置してください。

「ComfyUI/models/text_encoders」

【ComfyUI】Wan2.2 の始め方

方法1:ワークフローテンプレートを選択する

Wan2.2 の公式のワークフローは、
ComfyUI の「Browse Templates」で公開されています。

  • ComfyUIを起動する
  • 「Workflow」のタブから「Browse Templates」を選択する
  • 「Video」の項目から、「Wan2.2」を選択する

方法2:ワークフローをダウンロードしてドラッグ&ドロップする

こちらは、Wan2.2のワークフローのファイルです。
以下の手順で進めていただくと、ComfyUIにワークフローが読み込めます。

  • 「ダウンロード」ボタンをクリックする
  • JSONファイルをComfyUIの画面にドラッグ&ドロップする

Wan2.2 T2V-A14B のワークフロー

Wan2.2 I2V-A14B のワークフロー

Wan2.2 TI2V-5B のワークフロー

【API】Alibaba Cloud Model Studio では API がリリース

Alibaba Cloud Model Studio では、
「Wan2.2-T2V-Plus」と「Wan2.2-I2V-Plus」というモデルがリリースされています。
アカウントを作成してから180日は、50秒まで無料で生成できるみたいです。

モデル1秒の動画の料金5秒の動画の料金
Wan2.2-T2V-Plus 480P1秒につき0.02$5秒につき0.10$
Wan2.2-I2V-Plus 1080P1秒につき0.10$5秒につき0.50$
Wan2.2-I2V-Plus 480P1秒につき0.02$5秒につき0.10$
Wan2.2-I2V-Plus 1080P1秒につき0.10$5秒につき0.50$

まとめ

いかがでしたでしょうか。
この記事では、Wan2.2 について解説しました。

Wan2.2は、映画のように美しく、滑らかな動きを再現してる最先端の動画生成モデルです。
革新的なMoE構造とオープンライセンス、そしてComfyUIとの高い互換性があります。

Wan2.2のリリースにより、映像制作のハードルを劇的に下げることができるでしょう。
まだまだ、WanVideoの進化に目が離せませんね!

この記事が、あなたのお役に立てればとても嬉しいです。
最後まで読んでいただき、ありがとうございました。

コメント

タイトルとURLをコピーしました