自助广告-日活跃5000+IP查看详情

秀人网写真集

低价火爆100G流量卡

腾讯混元大模型2.0正式发布：参数规模突破400B，多项性能指标领先行业

AI行业资讯6小时前发布墨白

406B参数空降！腾讯混元2.0开启内测，推理性能自称“国内第一梯队”

12月5日，腾讯正式推出新一代自研大语言模型混元2.0（Tencent HY2.0），该模型包含Think（推理增强版）和Instruct（指令遵循版）两个版本，总参数量达到406B，激活参数32B，支持256K超长上下文窗口。官方表示，该模型在数学、科学、代码等复杂推理任务上的表现已跻身国内第一梯队。目前模型已通过腾讯云API开放商用，并在元宝、ima等腾讯系应用中启动灰度测试。

技术创新亮点：

混合专家架构（MoE）显著提升推理效率
采用MoE架构设计，实测在单卡A100上的推理速度较传统密集架构提升40%。在国际数学奥林匹克（IMO）2025公开题测试中，Think版取得83.1%的准确率，在哈佛-MIT数学竞赛中达到81.7%的准确率，均超过GPT-4o的78.9%表现。
长上下文窗口优化
通过创新的”分段采样修正”技术，有效解决了长文本训练与推理不一致的问题。在10万Token文档问答任务中，F1分数提升6.8%，展现出强大的长文本处理能力。
指令遵循能力突破
Instruct版本采用可验证任务与评分式强化学习相结合的训练策略，在Multi-Round MT-Bench评测中获得8.42分，领先同规模模型0.3分。模型支持Function Call、Json Mode和Tool Use等功能，官方测试显示100轮工具调用的成功率高达97.2%。

商业化落地进展：

元宝App已开始灰度测试”HY2.0Think”功能模块，重点优化数学推导和代码解释场景
ima会议助手接入256K长文本处理能力，5万Token会议纪要生成时间控制在15秒以内
腾讯云API定价策略具有竞争力，输入费用0.8元/百万Token，输出费用2元/百万Token，约为GPT-4o价格的45%，并支持企业私有化部署

开源生态规划：

腾讯宣布将于2026年第一季度开源HY2.0基础模型权重、200GB中文预训练数据集以及长窗口强化学习工具链，持续推动国产大模型生态建设。

行业影响分析：

随着混元2.0与Llama3.1-405B、Moonshot400B等模型的相继发布，国产大模型正式迈入400B参数时代。腾讯强调其发展重点不在于参数规模竞赛，而是深耕推理能力和工具化应用。未来能否凭借MoE架构和强化学习策略在成本效益上取得优势，将取决于开发者生态建设和实际落地规模。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

腾讯：现在去谈AI对用户行为产生的变化还为时过早

腾讯：现在去谈AI对用户行为产生的变化还为时过早

7个月前

1.8K0

用DeepSeek4天赚了20万元，有人已赚到第一桶金

用DeepSeek4天赚了20万元，有人已赚到第一桶金

AI行业资讯 # DeepSeek

10个月前

1.9K0

AI行情高低切换，净值偏离曝光基金调仓动向

AI行情高低切换，净值偏离曝光基金调仓动向

AI行业资讯 # AI

11个月前

2K0

2025年“云”展望：AI、出海、下沉市场或迎“黄金期”

2025年“云”展望：AI、出海、下沉市场或迎“黄金期”

10个月前

2.2K0