智谱 AI 输入法全新发布,语音识别技术同步开源!

AI行业资讯38分钟前更新本文共计686个字,预计阅读时长3分钟。 墨白
9.4K 0 0

智谱AI近日正式推出新一代GLM-ASR系列语音识别模型,并宣布全面开源。该系列包含云端大模型与轻量化端侧模型,同步发布的还有集成该技术的“智谱AI输入法”桌面端产品,致力于为用户提供更高效、便捷的语音交互体验。

智谱 AI 输入法全新发布,语音识别技术同步开源!

GLM-ASR系列:双模型覆盖云与端场景

  • GLM-ASR-2512​ 作为云端主力模型,支持实时语音转文本,在复杂真实环境中字符错误率(CER)低至0.0717,在多语种、多口音环境下仍保持行业领先的识别精度。
  • GLM-ASR-Nano-2512​ 为轻量化开源模型,参数量仅为1.5B,不仅在本类别中达到SOTA性能,部分测试结果甚至优于闭源模型。其端侧运行能力在保障识别质量的同时,也强化了隐私保护并降低交互延迟。

智谱AI输入法:语音驱动的高效创作工具

基于GLM-ASR系列模型,智谱AI输入法实现了语音转文字、实时翻译与文本润饰等多项功能,形成“语音即指令”的流畅操作体验。该输入法目前已向所有用户开放,新注册用户可获赠2000积分,并享受28天免费使用时长。

资源获取

  • 开源模型GLM-ASR-Nano-2512已在Hugging Face平台发布:https://huggingface.co/zai-org/GLM-ASR-Nano-2512
  • 智谱AI输入法下载地址:https://autoglm.zhipuai.cn/autotyper/

核心亮点

🌟 GLM-ASR系列语音识别模型开源,涵盖云端高精度与端侧轻量化双版本。

🛠️ 智谱AI输入法集成语音转写、翻译与文本改写功能,优化PC端语音输入体验。

🎁 新用户可获2000积分并享受28天免费时长,零门槛体验智能输入。

© 版权声明

相关文章