AICU

NotebookLMで多言語解説動画を作ってみる

作成者: AICU Japan|2025/05/09 20:17:29 Z

「いつか読もう」と思っている論文、YouTube動画、そしてPDFファイルなどで溺れていませんか?2025年4月30日、GoogleのNotebookLMに大型アップデートが実施され、ポッドキャスト風の対話音声に変換する「音声概要」機能が日本語を含む多言語に対応しました。

 

このアップデートにより、NotebookLM の設定に新しく「出力言語」が追加され、音声やチャットの応答言語をいつでも自由に変更できます。これにより、必要に応じて多言語のコンテンツを作成したり、外国語で教材を学習したりすることも可能になります。
https://notebooklm.google/

右上の「設定」から「出力言語」を切り替えることができます。

また2025年5月3日、NotebookLMの内部の言語モデルが「Gemini 2.0 Flash」から「Gemini 2.5 Flash」にアップデートされました。
(音声概要機能はGemini 2.0 Flashが使われているようです)

実用レベルをチェック!

明日から開催のSusHi Tech Tokyo 2025についての解説動画を多言語で作ってみました。画像はStability AI API で生成しています。

 
 
 

カスタマイズ

NotebookLMの音声概要は「カスタマイズ」によってさらにフォーカスを変えることができます。

言語やカスタマイズを変えた場合は、音声概要を一度削除して生成しなおします。音声の長さの指定などは制御できるわけではないようですが、品質の高い会話が生成されます。

生成された音声ファイル(wav)と、生成した画像(png)をffmpegを使ってこんな感じのコマンドで合体できます。

ffmpeg -loop 1 -i image.png -i audio.wav -c:v libx264 -tune stillimage -c:a aac -b:a 192k -pix_fmt yuv420p -shortest output.mp4

 
 

YouTubeへのアップロードもできますね!

注意(公式より)

音声概要は、ソースの主要なトピックの要約を、活発な「掘り下げた」ディスカッション形式にした試験運用中の機能です。ご利用にあたっては以下の注意事項をご確認ください。

  • 音声概要(音声を含む)は AI によって生成されるため、不正確な情報や音声の乱れが含まれる場合があります。

  • 音声概要は、トピックの包括的な見解や客観的な見解ではなく、単にソースを反映したものです。

  • 音声概要は、ノートブックの [設定] で選択した出力言語で生成されます。

  • 音声概要の生成には数分かかることがあります(生成中に他の操作を行っても問題ありません)。

  • 音声概要を生成または削除するには、ノートブックの編集権限が必要です。

  • 高評価 / 低評価ボタンで音声概要に対するフィードバックを共有できます。

 

Originally published at note.com/aicu on May 7, 2025.