腾讯混元大模型2.0正式发布:参数规模突破400B,多项性能指标领先行业

AI行业资讯6小时前发布 墨白
1.6K 0 0

406B参数空降!腾讯混元2.0开启内测,推理性能自称“国内第一梯队”

12月5日,腾讯正式推出新一代自研大语言模型混元2.0(Tencent HY2.0),该模型包含Think(推理增强版)和Instruct(指令遵循版)两个版本,总参数量达到406B,激活参数32B,支持256K超长上下文窗口。官方表示,该模型在数学、科学、代码等复杂推理任务上的表现已跻身国内第一梯队。目前模型已通过腾讯云API开放商用,并在元宝、ima等腾讯系应用中启动灰度测试。

技术创新亮点:

  1. 混合专家架构(MoE)显著提升推理效率

    采用MoE架构设计,实测在单卡A100上的推理速度较传统密集架构提升40%。在国际数学奥林匹克(IMO)2025公开题测试中,Think版取得83.1%的准确率,在哈佛-MIT数学竞赛中达到81.7%的准确率,均超过GPT-4o的78.9%表现。

  2. 长上下文窗口优化

    通过创新的”分段采样修正”技术,有效解决了长文本训练与推理不一致的问题。在10万Token文档问答任务中,F1分数提升6.8%,展现出强大的长文本处理能力。

  3. 指令遵循能力突破

    Instruct版本采用可验证任务与评分式强化学习相结合的训练策略,在Multi-Round MT-Bench评测中获得8.42分,领先同规模模型0.3分。模型支持Function Call、Json Mode和Tool Use等功能,官方测试显示100轮工具调用的成功率高达97.2%。

商业化落地进展:

  • 元宝App已开始灰度测试”HY2.0Think”功能模块,重点优化数学推导和代码解释场景
  • ima会议助手接入256K长文本处理能力,5万Token会议纪要生成时间控制在15秒以内
  • 腾讯云API定价策略具有竞争力,输入费用0.8元/百万Token,输出费用2元/百万Token,约为GPT-4o价格的45%,并支持企业私有化部署

开源生态规划:

腾讯宣布将于2026年第一季度开源HY2.0基础模型权重、200GB中文预训练数据集以及长窗口强化学习工具链,持续推动国产大模型生态建设。

行业影响分析:

随着混元2.0与Llama3.1-405B、Moonshot400B等模型的相继发布,国产大模型正式迈入400B参数时代。腾讯强调其发展重点不在于参数规模竞赛,而是深耕推理能力和工具化应用。未来能否凭借MoE架构和强化学习策略在成本效益上取得优势,将取决于开发者生态建设和实际落地规模。

© 版权声明

相关文章