今回は、画像生成AIの老舗「Stability AI」が提供する StabilityAI REST API (v2beta) を使った商用利用可能な高品質な画像生成AIをComfyUIで使用する方法を初心者にもわかりやすく解説します。API の概要や認証、各エンドポイントの特徴、利用例(コードサンプル)を交えながら、ComfyUI 上でどのようにカスタムノードとして使えるのかを理解していきます。
1. Stability AI APIの概要
StabilityAI REST API (v2beta) は、最新のテキストから画像・3D、ビデオ生成、画像のアップスケール・編集など多彩な機能を提供しています。
従来の v2alpha などのバージョンも引き続き利用可能ですが、新機能やパラメータは v2beta にのみ追加されるため、最新機能を使いたい場合は v2beta の URL に切り替えるのがおすすめです。
[PR] Stability AI APIを使った画像生成の詳細についてはColoso講座「生成AIクリエイティブ AICU・超入門:Stable Diffusionではじめる画像生成AI」がオススメです。
主な機能
-
Stable Image
テキストプロンプトから画像生成。フォトリアリスティックな「Ultra」モード、アイデア出しに適した「Core」モード、さらには SD3/3.5 モデルを利用した生成が可能です。 -
Upscale
低解像度画像を、Fast / Conservative / Creative といったオプションで高解像度に変換します。 -
Edit
画像の不要な部分を消去したり(Erase)、外側を拡張したり(Outpaint)、指定領域の再生成(Inpaint)など、画像編集の高度な機能を提供。 -
Control
スケッチや構造、スタイル情報を活かして、入力画像の特徴を保持・操作した生成を実現します。 -
Results
非同期生成の場合、生成状況や結果をポーリングするためのエンドポイントがあります。 -
3D & Video
単一の画像から高品質な 3D アセットや、画像からビデオを生成する実験的な機能も備えています。
機能が広範にあるため、こちらの解説もオススメです。
https://note.com/aicu/n/n4eda1d7ffcdf
2. Stability AIアカウント作成とAPIキーの取得方法
このAPIを使用するには、APIキーが必要になります。API キーは、Stability のアカウントページから取得します。
まずは、Stability AIのアカウントが必要なため、以下にアクセスし、アカウント作成を進めます。
https://platform.stability.ai/

Stability AI Developer Platformにアクセスすると、以下のような画面が表示されます。右上の「Login」をクリックします。
ログイン画面が表示されます。ここで、画面下部にある「Sign up」をクリックします。

サインアップ画面に切り替わるので、メールアドレス、パスワードを入力し、「Continue」をクリックします。

次に、登録したメールアドレス宛に確認メールが届くので、メール本文中の「Confirm my account」をクリックしてください。

Stability AI Developer Platformから、あなたのStability AIアカウントへのアクセス許可を求められるので、「Accept」をクリックし、アクセスを許可します。

そうすると、Developer Platformのトップページに戻ります。この時点でログイン済みになっているので、右上のアイコンをクリックします。

自身のプロファイル画面が開きます。左のメニューから「API Keys」を選ぶと、以下のようにAPIキー一覧画面が表示されます。ここでは、標準で既にAPIキーが1つ生成されています。新たにAPIキーを生成する場合は、「Create API Key」をクリックしてください。APIキーを使用する場合は、一覧の中のAPIキーの右側にあるコピーボタンをクリックしてください。

補足
APIの使用は、10秒間に 150 リクエストに制限されています。超過すると 429 エラーが返され、60 秒間タイムアウトするので注意!
3. 各エンドポイントの使い方と特徴
以下、主要なエンドポイントについて、仕様のポイントと利用例を紹介します。
3.1 Stable Image Ultra
-
エンドポイント: POST /v2beta/stable-image/generate/ultra
-
特徴:
-
フォトリアリスティックな画像生成に最適
-
プロンプトは必須。オプションで初期画像やアスペクト比、乱数シードなどを指定可能
-
1 メガピクセル(1024×1024)出力
-
成功時は 8 クレジット消費
-
3.2 Stable Image Core / SD3
-
エンドポイント:
-
Core: `POST /v2beta/stable-image/generate/core`
-
SD3: `POST /v2beta/stable-image/generate/sd3`
-
-
特徴:
-
Core は高速でコンセプト検証向け
-
SD3 は最新モデルを利用、生成速度と品質のバランスが良好
-
オプションパラメータにより、出力のクオリティやプロンプトへの忠実度を調整可能
-
生成ごとのクレジット消費は、Core が 3 クレジット、SD3 が 6.5~4 クレジット程度
-
3.3 Upscale(画像の高解像度化)
Stability AI APIでのUpscaleには、Conservative / Creative / Fastの3種類の方法があります。
-
エンドポイント例:
-
Conservative: `POST /v2beta/stable-image/upscale/conservative`
-
Fast: `POST /v2beta/stable-image/upscale/fast`
-
-
特徴:
-
Conservative は変更を最小限にしながら大幅に拡大
-
Fast は約1秒で処理、1 クレジットと低価格
-
Creative は劣化画像向けに、独自の創造的再構築を実施
-
画像、プロンプト、オプションパラメータで細かく調整できます
-
3.4 Edit(画像編集)
-
主な機能:
-
Erase: 不要なオブジェクトを削除
-
Inpaint: マスク指定で特定領域を修正
-
Outpaint: 画像の枠外を拡張して背景を追加
-
Search and Replace/Recolor: プロンプトで指定したオブジェクトの置換や色変更
-
Remove Background: 背景を正確に除去
-
-
使い方のポイント:
-
マスクは、別画像として渡すか、画像のアルファチャンネルから自動抽出可能
-
生成される画像は 4 メガピクセル。クレジット消費は機能によって異なります(例:Erase は 3 クレジット)
-
3.5 Control(入力画像の特徴を活かす生成)
-
主な機能:
-
Sketch: 手描きスケッチから洗練した画像にアップグレード
-
Structure: 入力画像の構造(輪郭・形状)を保持して生成
-
Style: 入力画像のスタイルを抽出し、同じ雰囲気の画像を生成
-
-
ポイント:
-
各エンドポイントとも、`prompt` と `image`(コントロール画像)は必須
-
`control_strength` で、入力画像が結果に与える影響度を調整できます
-
出力は入力と同じ解像度となるため、オリジナルの品質を保ちたい場合に有効です
-
3.6 Results(非同期生成の結果取得)
-
エンドポイント: `GET /v2beta/results/{id}`
-
特徴:
-
非同期生成の場合、生成後にこのエンドポイントで結果を取得
-
ステータスコード 202 は「進行中」、200 で「完了」
-
結果は生成後24時間保存されるので、その間に取得してください
-
3.7 3D生成
-
Stable Fast 3D や Stable Point Aware 3D のエンドポイントにより、単一の画像から高品質な 3D アセットを生成できます。
-
ポイント:
-
出力は glTF (GLB) 形式の 3D モデル
-
オプションパラメータでテクスチャ解像度、リメッシュ方法、頂点数などを調整可能
-
利用クレジットは低価格(例:Stable Fast 3D は 2 クレジット)
-
3.8 Image-to-Video
-
開始エンドポイント: `POST /v2beta/image-to-video`
-
結果取得: `GET /v2beta/image-to-video/result/{id}`
-
特徴:
-
初期画像とオプションパラメータ(seed, cfg_scale, motion_bucket_id)をもとに短いビデオを生成
-
結果は MP4 形式などで受け取れる
-
入力できる画像サイズは、1024x576、576x1024、768x768のみ
-
生成成功ごとに 20 クレジット消費
-
4. カスタムノード使用準備
今回は、以下の特製カスタムノード(comfyui-stability-ai-api)を使用します。このカスタムノードは、ComfyUI上でStability AI APIを実行し、その結果を画像や動画で出力するノードです。ライセンスはMIT Licenseです。
https://github.com/yhayano-ponotech/comfyui-stability-ai-api
このカスタムノードは、ComfyUI Managerよりインストール可能です。インストール時にバージョン選択が表示されますが、ここではnightlyを選択してください。

このカスタムノードが提供する各種ノードには、APIキーを設定するウィジェット「api_key」が用意されています。ここにAPIキーを設定することで、Stability AI APIを使用可能になります。
この場合、ComfyUIのワークフローは、ブラウザのローカルストレージに保存されるため、APIキーもローカルストレージに保存されることに注意してください。気になる方は使用後にブラウザのキャッシュをクリアすることをお勧めします。

それ以外のAPIキーの設定方法として、「ComfyUI/custom_nodes/comfyui-stability-ai-api/config.ini」の「api_key」にStability AIのAPIキーを入力することでも設定可能になります。「config.ini」を開くと、初期状態では以下のように記載されているので、"your_api_key_here"を置換する形でAPIキーを入力してください。
[stability]
api_key = your_api_key_here
5. ワークフローの実行
それでは、Stability AI APIをComfyUI上で実行していきます。ワークフローは、以下のGitHubリポジトリに格納されているので、こちらよりダウンロードし、ComfyUIにロードしてください。
workflow_stability-ultra-image-generation_i2i.json
Stable Image 生成系
ここでは、Stability Ultra Image Generation、Stability Core Image Generation、Stability SD3 Image Generationノードについて解説します。
これらのノードは、それぞれStable Image Ultra、Stable Image Core / SD3を実行するノードです。それぞれtext2imageが可能で、Stability Ultra Image GenerationとStability SD3 Image Generationノードでは、image2imageの実行も可能です。
今回は、Stability Ultra Image Generationノードでimage2imageを行ってみました。以下のように男性の画像を入力し、プロンプトに「a man with afro hair」を設定し、実行すると、アフロヘアーの男性が出力されました。ControlNetなしでのimage2imageなので、顔や背景も変化してしまっていますが、入力画像とプロンプトだけで、これだけの制御が可能です。

(作成した画像はサーバーから削除することをおすすめします)
前編はここまでです。
続いてアップスケール、Edit(画像編集)、Erase、inpaint、outpaint、search-and-replace、search-and-recolor、Control(画像制御)、Sketch、Structure、Style、Image-to-Videoについて学んでいきます。
7. まとめ
Stability AI の REST API (v2beta) は、テキストから画像・3D・ビデオ生成、画像編集・アップスケールなど、さまざまなクリエイティブツールを提供しています。各エンドポイントのパラメータやレスポンスの仕様を正しく理解することで、ComfyUI のカスタムノードとして利用した際にも、柔軟かつ高品質な生成処理を実現できます。
GPU等不要で高品質高画質、商用利用できるAPIであるだけでなく、今回紹介したComfyUIだけでなく、Google Slidesなどでも利用できますので、その特性や使い方を学んでおくことは大変有益です。
この記事では、API の全体像と主要なエンドポイントの使い方、注意点について解説しました。ぜひ、実際に API キーを取得し、サンプルコードを試しながら自分のプロジェクトに組み込んでみてください!
AICUもColosoやStability AIと協力して、日本語での解説動画を作っておりますので、ぜひこちらの講座も覗いてみてください!
AICU Japan株式会社について
AICUは「つくる人をつくる」をビジョンに掲げ、最新の生成AI、クリエイティブAI技術を皆さまにお届けしています。
📝noteでは、生成AIに関する最新情報や使い方の解説を発信しています。ぜひフォローして、最新情報をチェックしてください!
https://note.com/aicu
📩メールマガジン「週刊AICU通信」では、AI関連のニュースやトレンド、イベント情報などを毎週お届けしています。購読登録はこちらから!
https://corp.aicu.ai/ja
【月刊AICUマガジン】「つくる人をつくる」クリエイティブAI専門誌、毎月魅力的な特集や深掘りお送りします[Kindle Unlimitedで無料]
【書籍化】「ComfyUIマスターガイド」
Xでも情報発信中!フォローしてね😉
https://x.com/AICUai
#生成AI #StableDiffusion #画像生成AI #AI画像生成 #プロンプト #ComfyUI #SDXL #StableDiffusionWebUI #AIイラスト #生成 #Diffusers #AnimagineXL #CagliostroResearchLab #アニメイラスト
「共有ComfyUI」オープンベータ実施中!
こちらのフォーム、もしくは下のURLでウェイトリストに登録することができます。
https://share.hsforms.com/2IfeHZPwASyin8_6BuJyHwAq3r78
2025年2月17日まで利用可能な無償招待コードをお送りします。
既にお試しいただいている方も、遠慮なく申し込んでください!
※noteのComfyUIマスタープランと、上記の「共有ComfyUI」はしばらく並列に運営していきます。他にもたくさんサービスを開発していきますので応援よろしくお願いいたします!
【書籍化】「ComfyUIマスターガイド」
http://j.aicu.ai/comfysb
【今すぐ使えるComfyUI】
https://aicu.jp/comfyui
【月刊AICUマガジン】「つくる人をつくる」クリエイティブAI専門誌、毎月魅力的な特集や深掘りお送りします[Kindle Unlimitedで無料]
https://j.aicu.ai/kindle
この記事の続きはこちらから https://note.com/aicu/n/nbe75746520e3
Originally published at https://note.com on Feb 18, 2025.
Comments