画像生成AIの世界では、日々新しいモデルが登場し、それぞれが独自の「解釈」を持っています。今回はAiCutyプロジェクトのキャラクター「Elena Bloom(エレナ・ブルーム)」を題材に、ComfyUI APIを活用して8種類のモデルを同一プロンプトで徹底比較しました。ローカル環境で動作する最新モデルから、クラウド経由のAPIモデルまで、その表現力の違いを浮き彫りにします。
ゼロから学ぶ「ComfyUI」
https://note.com/aicu/m/md2f2e57c0f3c
検証の概要と実施手法
今回の実験では、キャラクターの再現性とモデルごとの「味」を公平に評価するため、ComfyUIのAPI機能をフル活用しました。具体的には、UI上のエディタではなく、Pythonから直接JSON形式のワークフローを叩くことで、シード値やプロンプトを完全に同期させたバッチ実行環境を構築しています。
比較対象は、AiCuty公式プロンプトにある WAI-illustrious + LoRA、さらに元祖とも言える SDXL Base 1.0、OpenAIの GPT Image、Googleの Gemini 3 Pro といった大手API勢に加え、アニメ特化の ANIMAGINE XL 4.0、実写に強い FLUX.1 Schnell や爆速生成を誇る Z-Image-Turbo、独特の質感を持つ Mellow Pencil XL の計8種です。
共通プロンプトの設定
すべてのモデルに対し、以下の詳細な指示を与えました。
ポジティブプロンプトの要点:中心に立つ甘く優しいアニメアイドル、ピンクのツインテールと大きなリボン、輝くピンクの瞳。衣装は女神をイメージしたパステルピンクと白のドレスで、フューチャリスティックな光沢と繊細なゴールドのアクセントを加えています。背景は清潔感のあるスタジオの白背景、ライティングは左上からのソフトな指向性ライトに統一。
ネガティブプロンプトの要点:低品質、デフォルメされた顔や手足、重複した衣装、テキストやウォーターマークの排除を徹底。
各モデルの生成結果と考察
WAI-illustrious + LoRA
Illustriousベースに「Niji anime」と「Enchanting Eyes」の2つのLoRAを重ねがけしました。特筆すべきは瞳の輝きで、キャラクターの「可愛らしさ」を一段引き上げる華やかな仕上がりです。
SDXL Base 1.0
まずは基準となるSDXLのバニラモデルです。解像度832×1216、28ステップで生成。アニメスタイルへの適応は限定的ですが、すべての基礎となる安定感があります。
GPT Image (OpenAI)
OpenAIのAPI(gpt-image-1)を経由した生成です。解像度は1024×1536と高めで、独自の解釈によりアニメ調というよりは「洗練されたデジタルイラスト」に近い、リッチな質感で出力されました。
Gemini 3 Pro (Google)
Googleの最新画像生成モデルいわゆるNano Banana Proです。色彩の鮮やかさが際立っており、プロンプトへの忠実度が非常に高いのが特徴です。肌の透明感や光の表現に強みを感じます。
一方で、Nano Banana Proっぽい雰囲気に「見慣れてしまう」というリスクがあります。他の個性的なモデルも継続的に探求していきましょう。
ANIMAGINE XL 4.0 Opt
アニメキャラクター生成において、現在最も信頼できるモデルの一つです。衣装の細部、髪のグラデーション、アイドルのポージングなど、プロンプトの意図を最も正確に汲み取った仕上がりとなりました。
指がちょっと惜しいですね。
FLUX.1 Schnell
Black Forest Labsの高速モデル。わずか4ステップでの生成ですが、その表現力は驚異的です。アニメ専用ではありませんが、独特の空気感とディテールの密度を両立しています。
Mellow Pencil XL
その名の通り、鉛筆画や柔らかいイラスト風の質感を持つモデルです。他のモデルとは一線を画す「手描き感」があり、優しい世界観の表現に最適です。
Z-Image-Turbo
Comfy-Org公式の高速モデル。AuraFlowベースの技術を採用し、4ステップで実用レベルの画像を出力します。ややリアル寄りの質感を残しつつ、圧倒的な生成スピードが武器となります。
ComfyUI APIによる自動化
今回の検証で最も重要なポイントは、「人間が1枚ずつ生成ボタンを押さない」という点です。ComfyUIの「API形式(実行用JSON)」と「UI形式(保存用JSON)」の違いを整理し、Pythonによる自動ランナーを開発しました。
API形式では、ノード情報がリンクベースではなくIDベースのオブジェクトとして管理されます。開発したスクリプトでは、外部のテキストファイルからプロンプトを読み込み、シード値を動的に注入して全モデルを連続実行します。これにより、モデル間の比較だけでなく、将来的な大量生成やA/Bテストも容易になります。
結論と今後の展望
比較の結果、アニメキャラクターとしての完成度は ANIMAGINE XL 4.0 と WAI-illustrious が抜きん出ていました。一方で、Gemini 3 Pro の色彩感覚や FLUX.1 の生成速度など、用途に応じた使い分けの重要性も再確認できました。ComfyUIを単なるツールとして使うのではなく、APIを通じて「システム」として組み込むことで、クリエイティブの検証効率は飛躍的に向上します。
購読者限定:Pythonランナー&ワークフローソースコード
ここからは、今回の検証で使用したPythonスクリプトおよび各モデルのAPI用JSONワークフローを公開します。ご自身の環境で同様の比較実験を行いたい方は、ぜひ活用してください。
※ソースコード・設定ファイル一式は以下からダウンロード/コピー可能です。
# run_elena.py (Snippet)
import json
import requests
import argparse
# ワークフローにプロンプトとシードを注入して実行するコアロジック
def queue_prompt(prompt_workflow):
p = {"prompt": prompt_workflow}
data = json.dumps(p).encode('utf-8')
requests.post("http://127.0.0.1:8188/prompt", data=data)
# (以下、フルコードは有料エリアにて...)
今回の検証で使用した全8モデルのAPI JSONファイル一式は以下に続きます
---
この記事の続きはこちら https://www.aicu.jp/post/260215
Originally published at note.com/aicu on Feb 15, 2026.

Comments