Qwen3-TTS 升级:多样化声音让语音合成更自然

AI行业资讯2小时前发布本文共计594个字,预计阅读时长2分钟。 墨白
4.7K 0 0

Qwen3-TTS 语音合成模型于近日完成全面升级,凭借其卓越性能成为该领域引人注目的新进展。新版模型在音色多样性、多语言与方言支持、语音自然度等方面均有显著提升,用户可通过 Qwen API 便捷接入该功能。

Qwen3-TTS 升级:多样化声音让语音合成更自然

Qwen3-TTS 此次大幅增加了音色选择,目前已提供超过 49 种高品质音色,涵盖不同性别、年龄和地域特征,满足多样化场景应用。用户可选用包括活泼撒娇的“茉兔”、温暖陪伴的“小野杏”、严肃专业的“墨讲师”在内的多种风格音色,丰富的声音库有效增强了语音的情感表现力。

在语言支持方面,Qwen3-TTS 实现重要突破,现已支持中文、英文、德语、法语等十种主要语言,并在多语言测试中词错误率(WER)表现优于多数同类模型。同时,该模型还支持普通话、粤语、闽南语等多种方言音色生成,能够较好还原地方语言特色,满足更广泛用户需求。

语音自然度上,Qwen3-TTS 通过增强的自适应调节机制,可依据文本内容自动调整语速与韵律,拟人化水平已接近真人发音效果,为用户提供更自然流畅的听觉体验。

为方便开发者使用,Qwen3-TTS 提供了简洁易用的 API 接口,仅需少量代码即可快速实现高质量的语音合成功能,显著降低了技术应用门槛,让更多用户能够享受到先进的语音合成服务。

主要更新亮点

  • 新增超过 49 种高品质音色,适应不同场景需求
  • 支持 10 种主要语言及多种方言,贴近地域语言特色
  • 语音自然度显著提升,拟人化效果接近真人水平
© 版权声明

相关文章