自助广告-日活跃5000+IP查看详情

秀人网写真集

低价火爆100G流量卡

阿里发布超强语音合成模型 Qwen3-TTS，49 种音色满足你的声音需求！

AI行业资讯2小时前发布本文共计831个字，预计阅读时长3分钟。墨白

阿里云旗下通义千问团队近日发布新一代语音合成模型Qwen3-TTS，并宣布通过Qwen API向全球开发者免费开放。该模型提供49种多样化音色选择，支持10种国际主流语言及10种中国方言，官方测试数据显示其在MiniMax TTS multilingual test set上的平均词错误率（WER）优于MiniMax与ElevenLabs等竞品，语音自然度接近真人水平。

阿里发布超强语音合成模型 Qwen3-TTS，49 种音色满足你的声音需求！

丰富音色库即开即用

角色设定：涵盖不同性别、年龄、地域特征及个性角色，包括”活泼搞怪的茉兔”、”严厉教学的墨讲师”、”睿智长者沧明子”等
应用场景：适配播客制作、有声读物、游戏NPC对话、智能客服等多种场景，无需额外训练即可快速切换音色

多语言与方言支持表现优异

语言覆盖：支持中文、英语、德语、意大利语、法语等10种主要语言
方言特色：包含普通话、粤语、四川话等10种方言，精准保留地方语言特色
性能指标：在MiniMax TTS multilingual test set测试中，平均WER较ElevenLabs降低约12%

阿里发布超强语音合成模型 Qwen3-TTS，49 种音色满足你的声音需求！

自然语音生成技术突破

智能语速：根据文本情感自动调整语速与停顿节奏
韵律控制：实现音节级重音与语调预测，MOS评分达4.6（真人基准4.8）
实时响应：首包延迟控制在300毫秒内，适用于直播配音等实时场景

开发者友好政策

免费开放：当前阶段API调用完全免费且无次数限制
商用授权：默认允许商业用途，不收取额外授权费用
快速集成：仅需10行代码即可完成语音播报功能接入

未来发展规划

阿里云透露，计划在2025年第一季度推出”方言语音克隆”功能，仅需5秒音频样本即可复刻特定方言口音；第二季度将发布边缘计算版本，支持离线部署，主要面向智慧景区导览、车载语音系统等应用场景。

行业影响分析

随着语音合成技术进入”音色即服务”阶段，Qwen3-TTS通过49种预设角色、10种方言支持及免费API策略形成差异化优势。对于播客制作、游戏开发、智能客服等依赖多样化语音表现的领域，该技术有望将传统配音制作成本降至极低水平。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

三星成立AI研究院，任命李康旭为首任负责人

三星成立AI研究院，任命李康旭为首任负责人

7天前

3.2K0

OpenAI 否认对青少年自杀事件负法律责任，家属提起诉讼

OpenAI 否认对青少年自杀事件负法律责任，家属提起诉讼

2周前

15.8K0

华泰证券推出国内首款 AI 原生交易 APP“AI 涨乐

华泰证券推出国内首款 AI 原生交易 APP“AI 涨乐

1周前

6.3K0

新模型 CoMPaSS-FLUX.1：提升Flux文本到图像生成的空间理解能力

新模型 CoMPaSS-FLUX.1：提升Flux文本到图像生成的空间理解能力

3个月前

11.5K0