スポンサーリンク

日本語を含む10言語に対応した音声生成モデル「Qwen3-TTS」ファミリーがオープンソース化

Alibaba CloudのQwenチームが、音声合成モデル「Qwen3-TTS」ファミリーをオープンソースとして公開しました。Qwen3-TTSはテキストから自然で人間らしい音声を生成するだけでなく、説明文から新しい声を作るボイスデザインや、手元の短い音声から話者の声質を複製するボイスクローンまでを、同一系列のモデルとしてまとめて提供するのが特徴です。リポジトリはApache-2.0ライセンスで…

このサイトの記事を見る

通知を有効にしますか? OK! No...
タイトルとURLをコピーしました