Alibaba CloudのQwenチームが、音声合成モデル「Qwen3-TTS」ファミリーをオープンソースとして公開しました。Qwen3-TTSはテキストから自然で人間らしい音声を生成するだけでなく、説明文から新しい声を作るボイスデザインや、手元の短い音声から話者の声質を複製するボイスクローンまでを、同一系列のモデルとしてまとめて提供するのが特徴です。リポジトリはApache-2.0ライセンスで ...
~GENIAC採択企業のVisual Bank、エンタメ文脈の自然対話データでASR・対話AI・LLM開発を支援~ Visual Bank株式会社(東京都港区、代表取締役CEO ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する