人とAIがつくるアイドルプロジェクト「AiCuty」で音楽・開発を担当しているNao Verdeです。今回は、日本のAI研究における大きなマイルストーンとなる発表について解説します!
2026年2月25日、国立情報学研究所(NII)の大規模言語モデル研究開発センター(LLMC)が、日本語で同時双方向(Full-duplex)の対話を実現する音声AIモデル「LLM-jp-Moshi-v1」を公開しました。 特筆すべきは、これがApache 2.0ライセンスという、商用利用が可能な極めてオープンな形で提供された点です。
従来の音声対話システム(スマートスピーカーなど)の多くは「半二重(Half-duplex)」、つまり「人間が話し終わるのを待ってからAIが処理を開始する」という交互対話形式でした。しかし、人間同士の自然な会話はそうではないですよね。相手の言葉に相槌を打ち、時には言葉を被せ、沈黙の「間」で感情を読み取ります。
「LLM-jp-Moshi-v1」は、フランスのKyutai Labsが開発した「Moshi」をベースに、日本語特有の対話データを追加学習(ファインチューニング)することで、この人間らしいリアルタイムな応答性を日本語で獲得しているそうです。
ちょうど昨年の2025年1月24日、名古屋大学の研究者らが日本語全二重対話システム「J-moshi」を試作し、Hugging Faceで公開しました。
https://www.aicu.jp/post/j-moshi-20250124
このモデルの精度を支えているのは、膨大な日本語対話コーパスと、国内屈指の計算リソース。モデルの学習には、約1,000時間に及ぶ多様な日本語音声データが投入されている。
これらのデータを学習した演算基盤が、国立研究開発法人 産業技術総合研究所が構築し、株式会社AIST Solutionsが運用する、AI技術開発・橋渡しのためのオープンな計算インフラストラクチャ「ABCI」(AI Bridging Cloud Infrastructure)です。2018年8月に提供開始し、2025年1月に3.0に生まれ変わりました。この産総研が提供するAI橋渡しクラウド(ABCI)3.0を用いて学習させることで、日本語特有の語順やイントネーション、そして「対話のタイミング」を学習させたそうです。
公開されたベンチマーク結果では、既存の研究用モデル(J-Moshi)と比較して、複数の指標で顕著な改善が見られたそうです。
NISQAは音声の自動評価尺度の値(5段階)を表す。LLMAJはLLM-as-a-judgeの枠組みを用い、大規模言語モデルに対話としての自然性や流暢性を評価させた値(10段階)を表す指標だそうです。特に「自然性」のスコアが大きく向上しており、機械的な応答から脱却し、より「人間と話している感覚」に近い体験を提供できるレベルに達していることがわかります。
実際の視聴はこちらで!
https://llm-jp.github.io/llm-jp-moshi/
Kyutai公式のMoshiのPyTorch実装を用いて,LLM-jp-Moshi-v1と対話することができます.実装の詳細は,オリジナルMoshiのリポジトリ kyutai-labs/moshi を参照してください。
ライセンス:LLM-jp-Moshi-v1 は Apache License, Version 2.0 の下で公開されています。
この「対話ワーキンググループ」は自然言語処理および計算機システムの研究者が集まり大規模言語モデルの研究開発について定期的に情報共有を行っている「LLM-jp」における研究活動の一環として設置された学術研究グループです。国立情報学研究所NII/LLMC科学主幹の東中竜一郎教授を中心に、早稲田大学の小川哲司教授、慶應義塾大学の高道慎之介准教授と緊密に連携しながら研究を推進しています。商用利用可能なこの自然な双方向音声対話モデルの登場は、様々な分野に進化をもたらす可能性があります。
まずはものすごい自然な速度でしゃべる雑談を聞いてみてください!この「間合い」の技術は不可欠な要素になってくるはずです。
NIIがこのモデルをオープンなApache License, Version 2.0 として公開した意義は大きいと思います。誰でもこのモデルをベースに独自のカスタマイズを施し、新しいサービスを生み出すことができるからです。日本語音声AIの未来は、この「同時双方向」という新しい標準(スタンダード)によって、より人間らしく、よりクリエイティブな方向へ加速していくでしょう。
参考リソース
https://www.nii.ac.jp/news/release/2026/0225.html
Originally published at note.com/aicu on Feb 26, 2026.