音声をAIで生成する方法はいくつか登場してきています。ただ、「ElevenLabs」を代表とするクラウド型サービスでは、月額料金がかかってしまう点がネックになっていた方も多いのではないでしょうか。 そんな中、Alibaba Cloudが「Qwen3 TTS」という音声生成AIモデルをオープンソースとして公開し、SNSを中心に大きな話題になりました。このモデルは、わずか数秒の音声サンプルから声のクロ ...
「Google Colab」で「T5Gemma-TTS」を試したので、まとめました。 1. T5Gemma-TTS 「T5Gemma-TTS」は、小型ながら高品質で、感情表現に強いTTSモデルです。文章理解用と音声生成用の「2B規模モデル」を2つ組み合わせた構成になっています。そのおかげで、文章の意味や ...
論文紹介動画を自動生成し、 YouTube Shorts に投稿する「論文紹介Bot」のアップデートについて解説します。 運用中のBotはこちらです。 今回は、論文紹介Botの「声」をどう作るかというテーマです。 自動生成した台本を読み上げるTTS(Text-to-Speech)エンジンを ...