先週、「つくよみちゃんコーパス」がリリースされました。 そこで、「NVIDIA/tacotron2」で日本語の音声合成に挑戦してみ ...
「Tacotron2」は、Googleで開発されたテキストをメルスペクトログラムに変換するためのアルゴリズムです。「Tacotron2」でテキストをメルスペクトログラムに変換後、「WaveNet」または「WaveGlow」(WaveNetの改良版)でメルスペクトログラムを音声に変換することで ...
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
人工知能(AI)が、人間の声を完璧に再現する水準に至ろうとしている。昨年12月中旬、グーグルがオンライン論文共有サイト「アーカイブ(arXiv)」に公開した報告書によると、囲碁AI「アルファ碁」で知られるグーグル・ディープマインドが開発した文字 ...
Abstract: Compared with traditional speech synthesis systems, end-to-end speech synthesis systems based on deep learning (such as DeepVoice3, Tacotron2) not only reduce the requirements for linguistic ...
このモデルを使用して作成されたモデルには、このモデルを使用した旨を表示する義務があります 表示例:このモデルは ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する