前回は既にセットアップしたForgeの環境とモデル「waiIllustriousSDXL_v160.safetensors」を使って、AIキャラクターデザインのプロンプトの書き方の基礎から、品質向上のテクニック、よく使う表現、生成した画像からプロンプトを抽出する実践的なテクニックを詳しく解説しました。今回はForgeをさらに極める Stable Diffusion生成結果のSeedを使った調整とパラメーターの極意について解説していきます。
https://note.com/aicu/n/n28319ee6ff9c
基本的な画像生成ができるようになったら、次はパラメータの微調整で、より理想的な画像を作り上げましょう。
「なんか思い通りの絵にならない」「品質がイマイチ」と感じたとき、実はパラメータをほんの少し変えるだけで劇的に結果が変わることがあります。
難しそうに見えますが、各パラメータには明確な役割があるので、ひとつずつ理解していけば自然と使いこなせるようになりますよ。最初は推奨値をそのまま使いながら、少しずつ自分好みに調整していきましょう。
このセクションでは、各種パラメータの詳細な使い方から、高解像度化、崩れた部分の修正方法まで、実践的なテクニックを詳しく解説します。
生成結果の品質を細かく調整できる主要なパラメータを解説します。
Stable Diffusionには、生成の質に影響する「パラメータ」が複数あります。これらは最初から全部覚える必要はありません。まずは「Steps・CFG Scale・Seed値」の3つを押さえておくだけで、たいていの生成作業はカバーできますよ。
各種パラメータの役割と性質を把握していくことで、狙ったイメージの画像を自在に生成できるようになりますので、少しずつで良いので各種設定項目についての理解を深めていきましょう。
以下、この画像を例にして、各種パラメーター設定における出力の変化と調整のコツついて具体的に詳しく解説していきます。
設定項目:指定/入力値
Checkpointモデル:sierunami_v1
VAEモデル:sdxlVAE_sdxlVAE.safetensors
サンプラー:DPM++ 2M SDE
Steps:30
CFG Scale:5.0
Seed値:2909047553
解像度(縦横比):832x1216
プロンプト:
female,solo,(hair detail:1.2),facial detail,long blonde hair,blue eyes,
(ahoge:1.2),(glossy hair:1.3),upper_body,Smile,Happy,blue sky,white clouds,casual,summer outfits,(close-up:0.8),(full body:1.2),full_shot,(fisheye:0.5),dynamic_angle,squatting,garden,holding a watering can with both hands,looking_away,
ネガティブプロンプト:
Watermark,Text,censored,deformed,bad anatomy,disfigured,poorly drawn face,mutated,extra limb,ugly,poorly drawn hands,missing limb,floating limbs,disconnected limbs,disconnected head,malformed hands,long neck,mutated hands and fingers,bad hands,missing fingers,cropped,worst quality,low quality,mutation,poorly drawn,huge calf,bad hands,fused hand,missing hand,disappearing arms,disappearing thigh,disappearing calf,disappearing legs,missing fingers,fused fingers,abnormal eye proportion,Abnormal hands,abnormal legs,abnormal feet,abnormal fingers,
「Step数を増やせば増やすほど良い絵になる」というのは半分正解で半分誤解です。
Step数とは、AIが「ノイズ」から絵を描き起こす「繰り返し回数」のことで、多いほど細部まで「丁寧に」描き込まれます、しかしその反面生成時間も比例して長くなっていきます。
逆に生成速度を優先しStep数を下げていくとすると、今度は「丁寧さ」が足りず、その結果絵が破綻する要因になりやすいので、生成環境に合わせて生成結果の品質と生成速度のバランスの良い所を探って思考錯誤すると良いと思います。
一般的にStep数は20〜30程度が品質と速度のバランスが取れた推奨範囲です。50以上の数値にしてより高品質な出力を狙うのも良いですが、品質向上の効果的にはあまり変わらないことも多いので、むやみに増やすのは時間のムダになることもあると覚えておきましょう。
役割
推奨値
テスト・下書き:
推奨Steps 10〜15 速い
品質 低〜中
通常生成:
推奨Steps 20〜30 普通
品質 中〜高
高品質生成:
推奨Steps 30〜50 遅い
品質 高
<注意点>
Step数 5~50での出力結果の比較
以下は同じ「Seed値」で、異なるStepで生成した比較表です。だいたい「20以降」のStep数で品質が落ち着いてきているのがお判り頂けますでしょうか。
Step数 1~104での出力結果の比較
さらに、以下同様に同じ「Seed値」でStep数を「1~104」で生成した比較表です。
CFG Scaleは「AIがどれだけプロンプトに忠実に絵を描くか」を調整するパラメータです。低くするとAIがフワ~っと、自由な発想で描いてくれますが、曖昧で意図しない絵になりやすく、逆に高くするとプロンプト通りの絵になりますが、値を上げすぎると過度に強調されて不自然になることもあります。
一般的に5〜9の範囲がバランスよく、初心者には6くらいからスタートするのがおすすめです。「なんか色が濃すぎる」「絵が崩れる」というときは、CFG Scaleを少し下げてみましょう。
役割
推奨値
CFG Scale 3〜5:
特徴 創造的・柔らかい表現
用途 抽象的なアート、実験的な生成
CFG Scale 6〜9:
特徴 バランスが良い(推奨)
用途 一般的な画像生成
CFG Scale 10〜15:
特徴 プロンプトの忠実度を強化
用途 細かい指定を反映させたい場合Step数が足りないと破綻しやすい
CFG Scale15以上:
特徴 過度に強調・色が濃くなる
用途 非推奨(崩れやすい)Step数を比例して上げると少し安定
おすすめ設定
CFG Scale 1~15での出力結果の比較
以下は同じ「Seed値」とStep数「30」で、異なるCFG Scaleで生成した比較表です。この場合「5~7」の値で品質が落ち着いてきているのがお判り頂けますでしょうか。
各Step数とCFG Scale 値の出力結果の比較
以下は同様に同じ「Seed値」で「Step数」を「20~50」に設定したそれぞれに対してCFG Scaleを「3.0~15.0」で生成した結果の比較表です。
Step数にもよりますがCFG Scaleは「7以上」は過剰気味に影響を与えるような印象が強くなっていっている様子がお判り頂けると思います。
Seed値は「画像生成のランダム性を制御する数値」で、同じSeed値を使えば同じ画像を何度でも再現することができます。
普段は「-1(ランダム)」のままで問題ありませんが、「この画像をベースにプロンプトだけ変えて比較したい」「気に入った絵をもう一度生成したい」というときにSeed値の固定がとても役立ちます。
気に入った絵が生成されたら、まずSeed値をメモしておく習慣をつけておくと、後から何かと便利ですよ。また「PNG Info」のタブで得る生成情報から取得する方法もあります。
※「PNG Info」については3-4の「生成した画像からプロンプトを抽出する方法」で紹介
活用方法としては、パラメータのテストとしてSeed値を固定して、CFG ScaleやStepsを少しずつ変更しベースの条件を同じにすることで、パラメータの効果を正確に比較することができます。
また、プロンプトの改良の軸としても使えます、気に入った画像のSeed値を固定して、プロンプトだけを変更して比較という使い方も良いでしょう。
その他にも、シリーズ生成としてSeed値を少しずつ変えて、似た雰囲気の画像を量産するということもできます。
役割
画像生成のランダム性を制御
同じSeed値を使えば、同じ画像を再生成できる
使い方
Seed値 -1:
動作 ランダムで生成(毎回違う画像)
操作 サイコロのアイコンをクリック
用途 通常の生成
Seed値 固定値:
動作 同じ画像を再生成
操作 リサイクルマークのアイコンをクリック
用途 微調整・比較実験
活用例
サンプラーは「AIがノイズから画像を描き出す計算方式」のことです。どのサンプラーを選ぶかで主に、「生成スピード」や「絵の質感や描写」が変化します。
種類が多くて最初は戸惑うかもしれませんが、全部覚える必要はありません。まずは「DPM++ 2M SDE」を選んでおけば、ほとんどの用途で問題なく使えますので、
慣れてきたら目的に合わせて、他のサンプラーを試してみましょう。
下記、Forge WebUI Classicのサンプラー一覧から主要なものをいくつか紹介します。
役割
主要なサンプラー比較
DPM++ 2M:
速度 速い
品質 高
特徴 バランス最高(推奨)
推奨Steps 20〜30
DPM++ SDE:
速度 普通
品質 最高
特徴 高品質・細部が綺麗
推奨Steps 25〜40
Euler a:
速度 非常に速い
品質 中
特徴 テスト用・やや創造的
推奨Steps 20〜30
Euler:
速度 非常に速い
品質 中
特徴 シンプル・安定
推奨Steps 20〜30
DDIM:
速度 速い
品質 中
特徴 古いモデルと互換性◎
推奨Steps 30〜50
UniPC:
速度 超高速
品質 中
特徴 最速(品質はやや劣る)
推奨Steps 10〜20
おすすめ設定:
Stable Diffusion XLは、基本的に「1024×1024」ピクセルを基準に学習されています。推奨解像度から外れると、画質が低下したり、構図が崩れたりすることがあります。
解像度は「大きければ大きいほど良い」ということはなく、SDXLには学習時に使用される「得意な解像度の範囲」があります。その範囲内に収めることで、AIが本来の実力を発揮できます。
また、解像度は「64の倍数」で指定する必要がある点も忘れずに。縦横比を変えるときも、下の一覧から選ぶようにしておくと失敗を少なくできますよ。
推奨解像度(Stable Diffusion XL)
メガピクセルでの近似例
正方形(汎用):
Width × Height 1024 × 1024
比率 1:1
メガピクセル 1.05 MP
縦長(ポートレート):
Width × Height 832 × 1216
比率 2:3
メガピクセル 1.01 MP
横長(風景):
Width × Height 1216 × 832
比率 3:2
メガピクセル 1.01 MP
縦長(書籍):
Width × Height 896 × 1152
比率 3:4
メガピクセル 1.03 MP
横長(風景):
Width × Height 1152 × 896
比率 4:3
メガピクセル 1.03 MP
スマホ縦(SNS用):
Width × Height 768 × 1344
比率 9:16
メガピクセル 1.03 MP
モニター横(動画素材):
Width × Height 1344 × 768
比率 16:9
メガピクセル 1.03 MP
超縦長(Webサイト):
Width × Height 640 × 1536
比率 9:21
メガピクセル 0.98 MP
超横長(パノラマ):
Width × Height 1536 × 640
比率 21:9
メガピクセル 0.98 MP
ポイント:
以下の様な縦横比の解像度設定は極端な例ですが、64の倍数且つ1,048,576ピクセル程度に収まっていれば、大きく破綻せずに画像を生成する事も可能です。
---
この記事の続きはこちら https://note.com/aicu/n/n8220f0060183
Originally published at note.com/aicu on Jun 16, 2026.