AICU

Qwen3-TTS+ComfyUIで声劇を作る!AiCutyの5人でおしゃべりするよ

作成者: AICU Japan|2026/02/05 22:24:38 Z

2026年1月22日、オープンリリースされた音声合成AI「Qwen3-TTS」、その後さらにComfyUIのカスタムノードとして複数登場しました。これにより、テキストから音声を生成するTTS(Text-to-Speech)がComfyUI環境で手軽に利用可能になりました。多人数での会話生成機能は、キャラクター同士の自然な対話シナリオの作成に新たな可能性をもたらします。

みんな、元気にしてる〜?メイだよっ!💛 今日はね、もうめちゃくちゃビッグニュースをみんなに届けにきたよ!なんと、あのQwen3-TTSComfyUIで使えるようになったんだって!しかも、AICUコラボクリエイターのTORAKOさんが可愛くて楽しいチュートリアル動画を作ってくれたの!!これって、つまり、テキストから自然な声劇ドラマが作れちゃうってこと!?

Qwen3-TTSってなぁに?ComfyUIでどう動かすの?

Qwen3-TTSっていうのはね、Text To Speech、つまりテキスト(文章)を読み込ませると、まるで人間が話してるみたいに自然な音声に変換してくれるすごいAIモデルのことだよ!これまでもいろんなTTSモデルがあったけど、Qwen3-TTSは特に表現力が豊かで、いろんな声や話し方に対応できるのが特徴なの!

https://www.aicu.jp/post/260123

それがね、まさかあのComfyUIで動かせるようになるなんて、メイ、びっくりしちゃったよ!ComfyUIって言ったら、画像生成AIのStable Diffusionをノードで繋げて、自分だけのワークフローを作れるめちゃくちゃ楽しいツールじゃん?そこに音声生成AIも組み込めちゃうなんて、もう無限の可能性を感じるっ!✨

こんにちは!TORAKOです!

Qwen3-TTSってComfyUIで動かせないの?と思って調べたら
カスタムノードたくさんありました!というわけで…
今回は、flybirdxxさん作成のカスタムノードを触ってみました!

https://github.com/flybirdxx/ComfyUI-Qwen-TTS

どんな感じなのか記事にしようと思ったのですが、めんどくさ…
文字にするのは大変な感じだったので全部動画にしました!

(1)「exampleワークフローを触ってみよう」の巻

 

(2)「Custom Save Voiceワークフローを触ってみよう」の巻

 

(3)「Multi-character dialogueワークフローで会話劇を作ってみよう」の巻

今回は音声生成のワークフローだけ触れましたが、モデルをチューニングするワークフローも追加されていました。

これはちょっと私の知識では使い方がわからないので、ご紹介のみです!
(Lora学習の様に音声データセットでモデルに組み込める感じなのかな?)

もっとシンプルに音声の生成を楽しみたいよ~という方は
こちらのカスタムノードもオススメです!

https://github.com/1038lab/ComfyUI-QwenTTS 

最後に、動画内で作っていたAiCuty5人の会話をもうちょっと自然な感じになるようにこだわってみました!
※5人の音声はAiCuty公式の決定音声ではありませんが

 

セリフの書き方や各種設定でまだまだ改善の余地はありそうですね!
(つまりは…これも沼です!時間がとける~~\(^o^)/)

以上、AICU コラボクリエイターのTORAKOがお送りしました。
次のコンテストにも使えるね〜!動画への感想も歓迎です!

TORAKO

このカスタムノード、本当に使いやすいからみんなもチェックしてみてね!
https://github.com/flybirdxx/ComfyUI-Qwen-TTS

TORAKOさんも常連参加!次回の AICU Lab+勉強会 は2/14予定です
ぜひ参加してね!

https://www.aicu.jp/post/260129

この記事に「いいね!」と思ったら、いいねとフォロー、おすすめをお願いします!

https://note.com/aicu/ X(Twitter)@AICUai

Originally published at note.com/aicu on Feb 5, 2026.