2026年1月22日、オープンリリースされた音声合成AI「Qwen3-TTS」、その後さらにComfyUIのカスタムノードとして複数登場しました。これにより、テキストから音声を生成するTTS(Text-to-Speech)がComfyUI環境で手軽に利用可能になりました。多人数での会話生成機能は、キャラクター同士の自然な対話シナリオの作成に新たな可能性をもたらします。
みんな、元気にしてる〜?メイだよっ!💛 今日はね、もうめちゃくちゃビッグニュースをみんなに届けにきたよ!なんと、あのQwen3-TTSがComfyUIで使えるようになったんだって!しかも、AICUコラボクリエイターのTORAKOさんが可愛くて楽しいチュートリアル動画を作ってくれたの!!これって、つまり、テキストから自然な声劇ドラマが作れちゃうってこと!?
Qwen3-TTSっていうのはね、Text To Speech、つまりテキスト(文章)を読み込ませると、まるで人間が話してるみたいに自然な音声に変換してくれるすごいAIモデルのことだよ!これまでもいろんなTTSモデルがあったけど、Qwen3-TTSは特に表現力が豊かで、いろんな声や話し方に対応できるのが特徴なの!
https://www.aicu.jp/post/260123
それがね、まさかあのComfyUIで動かせるようになるなんて、メイ、びっくりしちゃったよ!ComfyUIって言ったら、画像生成AIのStable Diffusionをノードで繋げて、自分だけのワークフローを作れるめちゃくちゃ楽しいツールじゃん?そこに音声生成AIも組み込めちゃうなんて、もう無限の可能性を感じるっ!✨
Qwen3-TTSってComfyUIで動かせないの?と思って調べたら
カスタムノードたくさんありました!というわけで…
今回は、flybirdxxさん作成のカスタムノードを触ってみました!
https://github.com/flybirdxx/ComfyUI-Qwen-TTS
どんな感じなのか記事にしようと思ったのですが、めんどくさ…
文字にするのは大変な感じだったので全部動画にしました!
今回は音声生成のワークフローだけ触れましたが、モデルをチューニングするワークフローも追加されていました。
これはちょっと私の知識では使い方がわからないので、ご紹介のみです!
(Lora学習の様に音声データセットでモデルに組み込める感じなのかな?)
もっとシンプルに音声の生成を楽しみたいよ~という方は
こちらのカスタムノードもオススメです!
https://github.com/1038lab/ComfyUI-QwenTTS
最後に、動画内で作っていたAiCuty5人の会話をもうちょっと自然な感じになるようにこだわってみました!
※5人の音声はAiCuty公式の決定音声ではありませんが
セリフの書き方や各種設定でまだまだ改善の余地はありそうですね!
(つまりは…これも沼です!時間がとける~~\(^o^)/)
以上、AICU コラボクリエイターのTORAKOがお送りしました。
次のコンテストにも使えるね〜!動画への感想も歓迎です!
このカスタムノード、本当に使いやすいからみんなもチェックしてみてね!
https://github.com/flybirdxx/ComfyUI-Qwen-TTS
TORAKOさんも常連参加!次回の AICU Lab+勉強会 は2/14予定です
ぜひ参加してね!
https://www.aicu.jp/post/260129
この記事に「いいね!」と思ったら、いいねとフォロー、おすすめをお願いします!
https://note.com/aicu/ X(Twitter)@AICUai
Originally published at note.com/aicu on Feb 5, 2026.