智谱AI近日正式推出新一代GLM-ASR系列语音识别模型,并宣布全面开源。该系列包含云端大模型与轻量化端侧模型,同步发布的还有集成该技术的“智谱AI输入法”桌面端产品,致力于为用户提供更高效、便捷的语音交互体验。
GLM-ASR系列:双模型覆盖云与端场景
- GLM-ASR-2512 作为云端主力模型,支持实时语音转文本,在复杂真实环境中字符错误率(CER)低至0.0717,在多语种、多口音环境下仍保持行业领先的识别精度。
- GLM-ASR-Nano-2512 为轻量化开源模型,参数量仅为1.5B,不仅在本类别中达到SOTA性能,部分测试结果甚至优于闭源模型。其端侧运行能力在保障识别质量的同时,也强化了隐私保护并降低交互延迟。
智谱AI输入法:语音驱动的高效创作工具
基于GLM-ASR系列模型,智谱AI输入法实现了语音转文字、实时翻译与文本润饰等多项功能,形成“语音即指令”的流畅操作体验。该输入法目前已向所有用户开放,新注册用户可获赠2000积分,并享受28天免费使用时长。
资源获取
- 开源模型GLM-ASR-Nano-2512已在Hugging Face平台发布:https://huggingface.co/zai-org/GLM-ASR-Nano-2512
- 智谱AI输入法下载地址:https://autoglm.zhipuai.cn/autotyper/
核心亮点
🌟 GLM-ASR系列语音识别模型开源,涵盖云端高精度与端侧轻量化双版本。
🛠️ 智谱AI输入法集成语音转写、翻译与文本改写功能,优化PC端语音输入体验。
🎁 新用户可获2000积分并享受28天免费时长,零门槛体验智能输入。
© 版权声明
文章版权归作者所有,未经允许请勿转载。