Visual Bank株式会社は、高品質な音声合成(TTS)モデルの学習や自動音声認識(ASR)の精度向上、および自然言語処理(NLP)の研究に最適化された、「日本語・1話者の文学朗読音声データセット」の提供を開始します。 本データセットは、日本文学や小説作品 ...
音声をAIで生成する方法はいくつか登場してきています。ただ、「ElevenLabs」を代表とするクラウド型サービスでは、月額料金がかかってしまう点がネックになっていた方も多いのではないでしょうか。 そんな中、Alibaba Cloudが「Qwen3 TTS」という音声生成AIモデルをオープンソースとして公開し、SNSを中心に大きな話題になりました。このモデルは、わずか数秒の音声サンプルから声のクロ ...
I’ve been fortunate to invest in several AI funding rounds—from pre-seed to Series B to F—and to see up close how billions have flowed into ...