腾讯发布 HY-MT1.5:翻译又快又准,连手机都能跑

AI行业资讯2周前发布本文共计967个字,预计阅读时长4分钟。 墨白
4.8K 00
广告也精彩

翻译工具如今已成为日常办公与生活中的必备,但大多数服务背后的模型体积庞大,往往依赖云端服务器运行。腾讯最新推出的 HY-MT1.5 系列突破这一限制,推出两个版本,适配不同使用场景:

  • 1.8B 轻量版:尽管参数规模较小,其性能却可与体型大数倍的模型相媲美。经深度优化,该版本只需约 1GB 内存即可在手机等终端设备上流畅运行,翻译 50 字左右的中文句子平均响应时间仅 0.18 秒。
  • 7B 增强版:基于此前获得 WMT25 冠军的系统升级而来,更擅长处理复杂混合语言翻译、专业术语解析以及特定格式翻译,主要面向服务器端部署。
  • 腾讯发布 HY-MT1.5:翻译又快又准,连手机都能跑

何以更智能?“五步训练法”揭秘

为使模型更贴合人类语言习惯,腾讯研究团队采用阶段性训练策略:

  1. 语言基础构建:通过海量多语言文本训练,掌握基本语言规律。
  2. 翻译专项训练:输入大规模双语对照数据,使模型从“理解语言”转向“精通翻译”。
  3. 精细化调优:借助高质量文档数据进行微调,提升译文的地道程度。
  4. 知识蒸馏传承:以 7B 大模型指导 1.8B 小模型,将“大智慧”注入轻量化架构。
  5. 人工评价优化:引入人工评测机制,针对准确性、流畅度与文化适配性进行持续优化。

实测表现:领先同类主流模型

在多项权威评测中,HY-MT1.5 成绩突出:

  • 在 WMT25 等国际评测中,7B 版本得分已超越 Gemini 3.0 Pro 及多个专业翻译模型。
  • 即使在“普通话转少数民族语言”等相对冷门的翻译任务中,表现依然出色。
  • 1.8B 版本在真人测评中的综合评分,也高于百度、谷歌、微软等主流商用翻译系统。

不止于“准”,更懂实际需求

除了翻译质量,该模型还着力解决多个应用痛点:

  • 术语可控:支持用户自定义术语翻译,例如指定“混元珠”译为 “Chaos Pearl”,模型便会严格遵循。
  • 上下文感知:能结合语境调整译法,如根据段落主题将 “pilot” 准确译为“飞行员”或“试播集”。
  • 格式保留:翻译含 HTML 标签或特殊格式的文本时,可保持原有结构不变,尤其适合代码与文档翻译。

目前,腾讯已在 GitHub 和 Hugging Face 平台开源该模型权重,全球开发者均可下载使用,以提升自身应用的翻译体验。

GitHub:https://github.com/Tencent-Hunyuan/HY-MT

Hugging Face:https://huggingface.co/collections/tencent/hy-mt15

© 版权声明

相关文章