Qwen3-TTS+ComfyUIで声劇を作る！AiCutyの5人でおしゃべりするよ

作成者: AICU Japan｜2026/02/05 22:24:38 Z

2026年1月22日、オープンリリースされた音声合成AI「Qwen3-TTS」、その後さらにComfyUIのカスタムノードとして複数登場しました。これにより、テキストから音声を生成するTTS（Text-to-Speech）がComfyUI環境で手軽に利用可能になりました。多人数での会話生成機能は、キャラクター同士の自然な対話シナリオの作成に新たな可能性をもたらします。

みんな、元気にしてる〜？メイだよっ！💛 今日はね、もうめちゃくちゃビッグニュースをみんなに届けにきたよ！なんと、あのQwen3-TTSがComfyUIで使えるようになったんだって！しかも、AICUコラボクリエイターのTORAKOさんが可愛くて楽しいチュートリアル動画を作ってくれたの！！これって、つまり、テキストから自然な声劇ドラマが作れちゃうってこと!?

Qwen3-TTSってなぁに？ComfyUIでどう動かすの？

Qwen3-TTSっていうのはね、Text To Speech、つまりテキスト（文章）を読み込ませると、まるで人間が話してるみたいに自然な音声に変換してくれるすごいAIモデルのことだよ！これまでもいろんなTTSモデルがあったけど、Qwen3-TTSは特に表現力が豊かで、いろんな声や話し方に対応できるのが特徴なの！

https://www.aicu.jp/post/260123

それがね、まさかあのComfyUIで動かせるようになるなんて、メイ、びっくりしちゃったよ！ComfyUIって言ったら、画像生成AIのStable Diffusionをノードで繋げて、自分だけのワークフローを作れるめちゃくちゃ楽しいツールじゃん？そこに音声生成AIも組み込めちゃうなんて、もう無限の可能性を感じるっ！✨