おかげさまで2024年3月の発売より大好評をいただいております 通称 #SD黄色本 「画像生成AI Stable Diffusionスタートガイド」(SBクリエイティブ刊)についてのアップデートをお送りします。
先日のキャンペーンへのご応募ありがとうございました!
【先着10名!!】「画像生成Stable Diffusionスタートガイド」プレゼント!#SD黄色本 増刷感謝祭!生成AI×クリエイティブの未来を読み解く新刊10冊
https://corp.aicu.ai/ja/books-2024
現在、サイン本の製作と発送準備に入っております。
https://corp.aicu.ai/ja/books-2024
第3刷の出荷が開始しました!
初版発行より8ヶ月が経過し、初版第1刷にマイナーな改訂を実施した第2刷が流通しておりましたが、このたび、第3刷の出荷が開始しました。
祝・重版出来!
第3刷・気になる改訂箇所は…?
このたびは大型のアップデートがございます。
既にご購入いただいた方や、大学・専門学校等での教科書としてお使いいただいているケースもあると存じますので、初版・第2刷と第3刷の差分を明記し、このブログで詳細を解説しつつお届けします。
まず人気のLoRA編(第6章, p.155-172)を改訂いたしました。
<出版社のサポートページ> https://www.sbcr.jp/product/4815624569/
あたらしいLoRA学習スクリプトへの移行
初版で使用していたLoRA学習スクリプト https://j.aicu.ai/SDLoRA1x
はLinaqruf版「Kohya Trainer」をベースにしていましたが、その後、メンテナンスの都合から、Google Colabでの動作が難しい状況が一時期ございました。
AICUでは代替のスクリプトとして、より安定して動作し、設定項目も少ない「Lora Trainer by Hollowstrawberry」をオンラインで解説してまいりました。このたび、第3刷の改訂をもって正式版として移行していきたいと考えております。
https://note.com/aicu/n/n96c10dd1249b
「画像生成AI Stable Diffusion スタートガイド」第3刷をご購入いただいた方は新しいリンクで記載されておりますが、初版・第2刷の方のサポートも考えて、オープンに公開することといたしました。
6.3 自分の画風のLoRAを作る Ver.20241118
https://j.aicu.ai/SDLoRA2
ぜひとも書籍の方もご購入いただけましたら幸いです。
ご推薦やAmazonでの高評価も大変ありがたいです。
原作となったKohyaさん「sd_scripts」の初期の原作や解説はこちら。
https://note.com/kohya_ss/n/nbf7ce8d80f29
https://note.com/kohya_ss/n/nb20c5187e15a
日本から世界にLoRAの活用法を発信されているKohya氏に敬意を表すとともに、興味のある方むけの情報として紹介させていただきます。
「Lora Trainer by Hollowstrawberry」とuYouUsさん作「sd-scripts」
上記の2024年4月の段階からさらに最近のアップデートとして、Hollowstrawberry氏のsd-scriptsがKohya氏のオリジナルのスクリプトではなく、uYouUs氏のリポジトリに変更されていることに追従しています。
具体的な変更点は以下になります。
必要とする環境の変更
この既刊で必要とされる requirementsが変更されました
最新のスクリプトは以下のとおりです。
より最新のtransformers, diffusersを使い、xformersに関するバージョンもパッチではなくGoogle Colab標準対応バージョンとなりました。
Google Colabの環境は常に更新されているので、今後も大きく環境が動いた場合はメンテナンスを実行します。
以下は、将来のメンテナンスに備えた作業メモです。
「画像生成AI Stable Diffusion スタートガイド」第3刷
6.3 自分の画風のLoRAを作る https://j.aicu.ai/SDLoRA2
Ver.20241118
サンプルデータは過去と同様 1024px × 1024px にトリミングした画像40枚を用意してあります。このスクリプトでの学習はSD1.5系なので 512 x 512 で行うことをおすすめしますが、設定を変えて 1024 x 1024 で実施することも可能です(綺麗です)。その場合、時間はだいたい T4 GPUで 1エポックあたり15分以上かかります
スクリプト内の解説も日本語訳と推奨値を更新しています。
例えばbatch sizeについて
batch_sizeのポイントとしては同時に学習する数が多いほど画像の細部の特徴が反映されにくく、少ないほど細部まで学習されるようになります。
かつてのバージョンでは「このことから画風を学習する場合は4~8、キャラクターを学習させるなら2~6を設定することをおすすめします。」」と記載されていましたが、最新版は上記の通り「2もしくは3を設定することをおすすめします」としております。
ComfyUIでの利用
AUTOMATIC1111と同様、
checkpoints/anyloraCheckpoint_bakedvaeBlessedFp16.safetensors
models/loras/
に生成したLoRAファイルを配置することで利用できます。
ComfyUI V1での利用の様子を紹介します。
10epoch, 1024x1024での学習結果を 512x512で生成した例です。
Hollowstrawberryさんの「Lora_Trainer_XL」の原作は、日本人の開発者 Kohyaさん が開発制作した「sd-scripts」を Animagineの開発者でも有る Linaqruf さんが Colab notebook で使用できるようにしたDreambooth形式と呼ばれるLoRA学習スクリプトがベースとなっています。現在は、これを uYouUsさんがメンテして Hollowstrawberryさんが使える状態を維持しています。これらはオープンソースの賜物ともいえます。
また最近では「コピー機LoRA」といった手法も提案されています。コピー機LoRAで使用する教師画像は1枚のみ。LoRAに教師画像の特徴を過学習させることで、どのSeed値でも教師画像に極めて類似した画像以外生成されないLoRAを敢えて作成し、これを混ぜて使うことで制御性の高いキャラクターや特徴を使うといったテクニックです。
AUTOMATIC1111にもメンテナンスが入りました!
書籍の紙面には大きな影響はなかったのですが、この12月末にGoogle ColabとAUTOMATIC1111の不具合に起因したhotfixを実施しました。
https://note.com/aicu/n/n97456571e02e
年末年始で、結構根深い問題だったので、解決に時間がかかってしまいました。この場をお借りしてお詫びいたします。
AICU A1111 TheLastBen on Colab
https://j.aicu.ai/SBXL2
Version20241228
AUTOMATIC1111/Stable-Diffusion-WebUIの本家がバージョン1.10.0以降メンテナンスされない中、コミュニティにおいてTheLastBen氏によるメンテナンスが続いています。また新しいモデルとしてFlux.1がサポートされており、WebUIもバージョン1.10.1になっています(!)、一方で、protobufと関連ライブラリのバージョン維持が複雑になっています。
★今後大きな変更がある場合は、バージョンをフリーズさせる可能性があります。
SD黄色本の応援をありがとうございます!
大好評「画像生成AI Stable Diffusionスタートガイド」最新版は、このようなオープンソースの開発サイクルを取り込みながら、解説を続けています。Kindle等の電子版は自動更新される予定です。最新の紙版書籍はこちらからご購入ください!
勉強会、公式講習会なども予定しております。
X@AICUai と、こちらのTechplayをフォローいただけましたら幸いです。
https://techplay.jp/community/AICU
この記事の続きはこちらから https://note.com/aicu/n/nf04353005dca
Originally published at https://aicu.jp on Jan 1, 2025.
Comments