大模型赛道下半场,腾讯混元如何跑出加速度
编辑 | 虞尔湖
出品 | 于见专栏
2025年的中国大模型市场可以用热闹来形容。
字节跳动的豆包以压倒性优势拿下国内最大AI应用的位置,DeepSeek凭借开源策略席卷开发者社区,阿里通义千问在国际评测榜单上频频亮相。
在这一片喧嚣中,腾讯混元似乎一直给人一种慢半拍的印象。
然而进入2026年,情况正在发生变化。4月23日,混元3.0正式上线,采用MoE混合专家架构,支持三级推理模式,上下文窗口达到262K。在SWE-Bench编程能力评测中,混元3.0得分74.4%,较前代53.0%的成绩提升超过四成。
在中国大模型市场规模预计2026年突破700亿元的背景下,混元正在经历从跟随者到并行竞争者的角色转换。
混元3.0标志能力跃迁
混元3.0最大的变化在于研发体系的重建。
2025年12月,前OpenAI科学家姚顺雨加入腾讯,担任首席AI科学家,直接向总裁刘炽平汇报。
随后腾讯对AI研发团队进行了大规模调整,撤销成立近十年的AI Lab,将核心人员并入混元团队,并新成立AI Infra部、AI Data部及数据计算平台部。
这一系列动作表明,腾讯正在将大模型研发从分散探索转向集中攻坚。
混元3.0采用MoE混合专家架构,总参数量约300亿,强调低部署成本而非参数规模竞赛。
这种务实的技术路线在当前算力受限的环境下具有现实意义。相比一味追求参数量,混元3.0选择在推理效率和实际可用性上做文章。实测生成速度达到23 Token每秒,首次响应速度较前代提升54%,平均完成时间缩短47%。
这些指标直接关系到用户体验,也是大模型从实验室走向生产环境的关键门槛。
在多模态能力方面,混元图像3.0曾在LMArena评测平台登顶全球第一,混元视频生成模型以130亿参数量成为当前最大的开源视频生成模型。
混元3D系列模型在开源社区的下载量已突破300万次。这些成绩说明,混元在视觉生成领域已经形成了自己的技术壁垒。
对于开发者群体而言,混元3.0最吸引人的可能是编程能力的跃升。
在SWE-Bench基准测试中,混元3.0得分74.4%,接近GLM-4.7的水平,虽然距离Opus 4.6等行业顶尖模型仍有差距,但40%以上的提升幅度足以改变开发者的使用偏好。
CodeBuddy作为腾讯推出的编程Agent产品,已经深度集成混元3.0,支持多种IDE环境。
值得注意的一个细节是,腾讯在2026年一季度财报中首次单独披露了AI新产品的财务影响。
当季AI新产品对经营盈利的拖累约为88亿元,这一数字基本符合腾讯加大AI投入的预期节奏。瑞银预测腾讯2026年资本开支将达到1700亿元,远超2025年的792亿元。
这种激进的投入姿态,某种程度上反映了腾讯管理层对混元技术路线的信心。
超级入口的AI化改造
衡量一个大模型是否成功,最终要看用户用脚投票的结果。
腾讯元宝2025年全年的月活跃用户从第一季度的2358万稳步爬升,至第四季度已突破4000万大关,在原生APP月活排行榜上稳居第三位。
进入2026年,在春节10亿元红包引流和元宝派社交玩法的带动下,元宝月活正式突破1亿,日活达到1800万,跻身国内AI原生应用Top3。
元宝的增长策略有其独特性,不同于豆包依靠抖音流量分发,也不同于DeepSeek凭借口碑自然传播,元宝选择深度绑定微信生态。用户可以直接在微信聊天中调用元宝进行AI搜索、图片理解和文本生成,这种无缝衔接的体验降低了用户切换成本。
马化腾在财报会上提到,元宝与普通AI聊天产品最大的不同在于有活人感,更像一个模拟助理,拥有个性和记忆。
除了元宝,混元的能力已经渗透到腾讯产品的各个角落。
AI工作台ima的月活超过1300万,知识库文件数量突破4.2亿,成为知识管理领域的一匹黑马。QQ浏览器推出全场景AI服务,累计服务用户超过1.3亿。
搜狗输入法的AI用户数突破1亿,移动端月活达到6.7亿,位居AI输入法行业第一。
这种多产品线协同的布局,构成了腾讯在AI时代的独特优势。当其他厂商还在单一产品层面竞争时,腾讯已经将AI能力编织进一张覆盖社交、办公、搜索、输入法的网络。
每个产品既是混元能力的消费者,也是用户数据的贡献者。这种飞轮效应一旦运转起来,会形成难以复制的护城河。
Agent化是2026年腾讯AI战略的关键词,QClaw支持远程操控电脑执行任务,WorkBuddy面向企业办公场景,CodeBuddy服务开发者群体,QbotClaw则是一款AI原生浏览器。
加上微信内正在内测的智能体功能,腾讯正在构建从个人助理到企业服务的完整Agent矩阵。
刘炽平对此的表述是,微信内已具备完善的商业环境,只要智能体能为用户和小程序带来交易和流量,就能自然融入现有商业模式。
开源策略和微信底座的组合打法
2024年11月,腾讯混元宣布开源混元Large语言模型和混元3D生成模型,总参数量3890亿的MoE架构模型直接对标Llama 3.1 405B。
此后,混元文生图、文生视频、3D生成等多模态能力陆续开源。混元A13B模型凭借130亿激活参数达到千亿级模型的效果,引发Flash Attention作者Tri Dao的公开点赞。在Hugging Face平台,混元模型相关下载量迅速攀升至同类前三。
开源策略的价值不仅在于技术展示,更在于生态位的抢占。
当开发者在GitHub上克隆混元代码、在Hugging Face上下载模型权重时,他们实际上正在融入腾讯的技术生态。
这些开发者未来很可能成为腾讯云的客户、腾讯API的调用者、腾讯AI产品的布道者。从商业角度看,开源是一种前置获客成本,换取长期生态收益的精明打法。
如果说开源是腾讯AI生态的外延,那么微信就是其内核。
14亿月活用户的超级应用,加上小程序、支付、企业微信等配套设施,构成了全球独一无二的商业基础设施。刘炽平在财报会上透露,微信内正在打造一款可直接内嵌的AI智能体,未来用户无需跳出微信即可完成复杂的任务执行和交易闭环。
这种生态优势是其他大模型厂商难以企及的,豆包有抖音的流量,但缺乏完整的商业闭环。DeepSeek有技术口碑,但缺少超级应用作为载体。
阿里有云计算和企业客户,但在C端用户触达上存在短板。腾讯的打法可以概括为模型能力加产品矩阵加微信生态的三位一体,每一环都在为其他环节输送弹药。
当然,挑战同样存在。腾讯内部也有员工反馈,混元模型在某些场景下的表现仍不及Claude、GLM等竞品,强制内部使用混元的做法引发了一些争议。这说明技术能力的差距尚未完全弥合,生态优势不能替代产品体验。
如何在保持生态协同的同时快速提升模型硬实力,是混元团队需要平衡的课题。
结语
回望混元的发展轨迹,2025年是一个关键转折点。
全年180亿元的投入、姚顺雨的加入、组织架构的重构、元宝月活破亿、混元3.0的发布,这些事件串联起来,勾勒出一幅加速追赶的图景。
2026年一季度319亿元的资本开支,以及AI新产品至少翻倍的投入承诺,表明这种加速态势还将持续。
大模型赛道的竞争远未结束,当前的市场格局更像是一场马拉松的前十公里,领先者未必能笑到最后,后发者也有机会通过节奏调整实现超越。
腾讯的优势在于它不需要在单点技术上击败所有对手,它只需要让混元足够好用,然后借助微信和产品矩阵完成用户的自然转化。这种打法并不华丽,但可能很有效。
对于关注AI行业的投资者和从业者来说,混元值得持续跟踪。它的技术迭代速度、产品用户留存率、以及微信智能体的上线进展,都是判断腾讯AI战略成败的关键指标。
在大模型从概念验证走向规模商用的转折期,混元的每一步进击,都会影响中国AI产业的终局形态。
加载中,请稍侯......