AUTOMATIC1111 v1.10.xリリース – SD3Mをサポート

AUTOMATIC1111 v1.10.xリリース – SD3Mをサポート

2024年7月28日に、Stable Diffusion WebUI「AUTOMATIC1111」の最新版 v1.10.0 がリリースされました。
すでに7月6日にリリースされていた「v1.10.0-RC」でも公開されていましたが、最新の画像生成AIモデルの一つである Stable Diffusion 3 Medium (SD3M) が公式にサポートとなりました。

https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases/tag/v1.10.0

他にもパフォーマンスの改善やモバイルでのコンテキストメニューの表示など、様々な機能があります。
リリースノートの日本語訳は文末に掲載します。

Stability Matrixでのサポートは?

ローカルPC/Mac等で画像生成を簡単にセットアップできる「Stability Matrix」では現状の最新版 v.2.11.4以降で AUTOMATIC1111 v.1.10.0 をサポートしています。

https://huggingface.co/stabilityai/stable-diffusion-3-medium

画像

気になるGoogle Colab での対応状況は?

気になる #SD黄色本 「画像生成 AI Stable Diffusion スタートガイド」で中心的に利用している Google Colabでの対応状況ですが、現在は「対応済み・解決」になっております。

原作である TheLastBen版は更新が入り、動作確認できましたので、対応が進みました。

https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast_stable_diffusion_AUTOMATIC1111.ipynb

長期サポートを可能にするための解説についてはこちら

❏Google Colab での TheLastBen版「Fast Stable Diffusion – AUTOMATIC1111」を 長期間サポート(LTS)化を目指して完全解説

https://ja.aicu.ai/faststablediffusion20240728/

Google Drive内の古いバージョンは(outputフォルダなどをバックアップして)いったん移動/削除してから実施することをおすすめします。

スマホ上で Generateボタン を2本指タップするとコンテキストメニュー「Generate forever」(無限に生成)が表示できています。

画像

※最新版の v1.10.1 がインストールされています。

Stable Diffusion 3 Medium はどうやってインストールするの?

さて、話題の「Stable Diffusion 3 Medium (SD3M)」ですが、こちらも 以下の手順で、Stability Matrixを使用して、NVIDIA GeForce RTX4050 Laptop GPU (VRAM5921MB)で動作確認ができています。

(Stability Matrixを最新の状態に更新)

sd3_medium.safetensors
→ Data/Models/StableDiffusion に配置します

sd3_medium_incl_clips_t5xxlfp8.safetensors
→ Data/Models/CLIP に配置します

Low VRAMモードでは起動できません(モデルのロード時にエラーになります)。

・Sampler を Euler にする
・出力解像度を 1024 x 1024 にする
・CFG Scale を 5

文字も描けてます!

画像
画像
画像

A bustling urban street scene with skyscrapers, busy pedestrians, and colorful street art. The atmosphere is lively and dynamic, with sunlight casting dramatic shadows.
Negative prompt: Avoid elements like excessive clutter, overly dark shadows, or underexposed areas. Exclude dull or washed-out colors, empty or lifeless streets, graffiti with inappropriate content, and chaotic or confusing compositions.
Steps: 20, Sampler: Euler, Schedule type: Automatic, CFG scale: 5, Seed: 1421671004, Size: 1344×768, Model hash: cc236278d2, Model: sd3_medium, Version: v1.10.0
Time taken: 16 min. 3.3 sec.

その他の設定はこちらをご参照ください。

https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/16030

AUTOMATIC1111/stable-diffusion-webui バージョン 1.10.0 リリースノート

コミットハッシュ c19d044 

新機能:

  • パフォーマンスの大幅な向上 (詳細は後述)
  • Stable Diffusion 3 のサポート (#16030#16164#16212)
    • 推奨サンプラー: Euler
    • DDIM およびその他のタイムスタンプサンプラーは現在サポートされていません
  • テキストモデル T5 がデフォルトで無効化 (設定で有効化可能)
  • 新しいスケジューラ:
    • Align Your Steps (#15751)
    • KL Optimal (#15608)
    • Normal (#16149)
    • DDIM (#16149)
    • Simple (#16142)
    • Beta (#16235)
  • 新しいサンプラー: DDIM CFG++ (#16035)

細かい変更:

  • 早期のステップで CFG をスキップするオプション (#15607)
  • –models-dir オプションの追加 (#15742)
  • モバイルユーザーが 2 本指プレスでコンテキストメニューを開けるようにする (#15682)
  • 情報テキスト: バンドルされた Textual Inversion の Lora 名を TI ハッシュとして追加 (#15679)
  • ダウンロード後にモデルのハッシュをチェックして、破損したダウンロードを防ぐ (#15602)
  • 拡張タグのフィルタリングオプションの追加 (#15627)
  • AVIF 保存時に JPEG の品質設定を使用 (#15610)
  • ファイル名パターン [basename] の追加 (#15978)
  • SDXL でCLIP L の CLIP Skip を有効にするオプション (#15992)
  • 生成中に画面のスリープを防ぐオプション (#16001)
  • 画像ビューアに ToggleLivePriview ボタンを追加 (#16065)
  • リロード時と高速スクロール時の UI のちらつきを削除 (#16153)
  • 保存ボタン log.csv を無効にするオプション (#16242)

拡張機能と API:

  • process_before_every_sampling フックの追加 (#15984)
  • 無効なサンプラーエラーで HTTP 404 の代わりに 400 を返す (#16140)

パフォーマンス:

  • [パフォーマンス 1/6] use_checkpoint = False (#15803)
  • [パフォーマンス 2/6] einops.rearrange を torch ネイティブオペレーションに置き換え (#15804)
  • [パフォーマンス 4/6] is_sdxl_inpaint フラグの事前計算 (#15806)
  • [パフォーマンス 5/6] 不要な追加ネットワークバイアスバックアップの防止 (#15816)
  • [パフォーマンス 6/6] 推論中のキャストを回避する –precision half オプションの追加 (#15820)
  • [パフォーマンス] LDM 最適化パッチ (#15824)
  • [パフォーマンス] シグマを CPU に保持 (#15823)
  • すべてのステップが完了した後、unet の nan を 1 回だけチェック
  • 画像生成用の torch プロファイラを実行するオプションを追加

バグ修正:

  • 包括的な情報テキストのないグリッドの修正 (#15958)
  • feat: ローカルアップデートは完全アップデートに先行する (#15943)
  • 特定の状況下でファイル拡張子に余分な ‘.’ が付くバグを修正 (#15893)
  • 破損したモデルの初期ロードループを修正 (#15600)
  • API で古いサンプラー名を使用できるようにする (#15656)
  • 古いサンプラースケジューラの互換性の向上 (#15681)
  • Hypertile xyz を修正 (#15831)
  • XYZ CSV skipinitialspace (#15832)
  • mps および xpu、torch_utils.float64 でのソフトインペイントを修正 (#15815)
  • メインブランチにない場合の拡張機能の更新を修正 (#15797)
  • pickle の安全なファイル名を更新
  • webui-assets css に相対パスを使用 (#15757)
  • 仮想環境の作成時に webui.bat/webui.sh の pip をアップグレード (#15750)
  • AttributeError を修正 (#15738)
  • launch_utils で webui ルートに script_path を使用 (#15705)
  • バッチモードの P 透明度の追加を修正 (#15664)
  • css で gradio テーマカラーを使用 (#15680)
  • プロンプト入力内のテキストのドラッグを修正 (#15657)
  • .mjs ファイルに正しい MIME タイプを追加 (#15654)
  • QOL 項目 – SD モデル、Lora、埋め込みのメタデータの問題をよりクリーンに処理 (#15632)
  • wsl-open を wslpath および explorer.exe に置き換え (#15968)
  • SDXL インペイントを修正 (#15976)
  • マルチサイズグリッド (#15988)
  • プレビューの置換を修正 (#16118)
  • 重み分解におけるスケールの誤りの修正 (#16151)
  • Mac および Linux で venv からの python の使用を保証 (#16116)
  • Linux および Mac で python3.10 と python3 の両方が利用可能な場合、python3.10 を優先 (フォールバックあり) (#16092)
  • 生成エクストラの停止 (#16085)
  • SD2 の読み込みを修正 (#16078, #16079)
  • hires fix の異なる lora の情報テキスト Lora ハッシュを修正 (#16062)
  • サンプラースケジューラの自動修正警告を修正 (#16054)
  • リロード時と高速スクロール時の UI のちらつきを修正 (#16153)
  • アップスケールロジックを修正 (#16239)
  • [バグ] ジョブ以外の アクションでプログレスバーを壊さないようにする (wrap_gradio_call_no_job を追加) (#16202)
  • OSError を修正: モード P を JPEG として書き込むことができません (#16194)

その他:

  • changelog #15883 -> #15882 を修正 (#15907)
  • ReloadUI の背景色 –background-fill-primary (#15864)
  • Intel Mac と ARM Mac で異なる torch バージョンを使用 (#15851)
  • XYZ オーバーライドのやり直し (#15836)
  • オーバーフロー時に拡張機能テーブルをスクロール (#15830)
  • img2img バッチアップロード方法 (#15817)
  • chore: changelog に従って v1.8.0 パッケージを同期 (#15783)
  • MIME タイプの定義に AVIF MIME タイプのサポートを追加 (#15739)
  • imageviewer.js を更新 (#15730)
  • no-referrer (#15641)
  • .gitignore trace.json (#15980)
  • spandrel を 0.3.4 にバンプ (#16144)
  • 使われなくなった –max-batch-count (#16119)
  • docs: bug_report.yml を更新 (#16102)
  • アップグレードを必要とせずに Python 3.9 ユーザーのプロジェクトの互換性を維持 (#16088, #16169, #16192)
  • ARM Mac の torch を 2.3.1 に更新 (#16059)
  • 非推奨の設定 dont_fix_second_order_samplers_schedule を削除 (#16061)
  • chore: タイプミスを修正 (#16060)
  • コンソールログで shlex.join launch args を実行 (#16170)
  • venv .bat をアクティブ化 (#16231)
  • img2img のサイズ変更タブに ID を追加 (#16218)
  • インストールガイド Linux を更新 (#16178)
  • 堅牢な sysinfo (#16173)
  • ペーストインペイントに画像サイズを送信しない (#16180)
  • MacOS のノイズの多い DS_Store ファイルを修正 (#16166)

Originally published at https://note.com on July 28, 2024.

AICU Japan

AICU Inc. AIDX Lab - Koto

Comments

Related posts

Search Difyで使う Stability AI API – 10分でつくる「漫画ジェネレーターSAI」
Google Colab での TheLastBen版「Fast Stable Diffusion – AUTOMATIC1111」を 長期間サポート(LTS)化を目指して完全解説 Search