×

AI大模型 国产AI 技术路线 市场竞争 应用创新

2026马年春节:国产大模型阵营集体亮剑,路线对垒谁能赢?

阿木 阿木 发表于2026-02-20 23:45:23 浏览32 评论0

抢沙发发表评论

今年春节期间,百度拿出5亿,腾讯投入10亿,阿里掏出30亿,表面来看是红包混战的局面,而实际上是国产大模型首次进行集体“亮剑”,每一家都在进行一场赌博,赌的是未来两年里用户和开发者真正彼此离不开的模型到底会是怎样的面貌。

字节跳动视频生成模型意外破圈

2月7日,字节跳动不存在发布会以及通稿,仅仅于飞书文档当中留下了一句“Kill the game”,之后发布的视频生成模型2.0刹那之间点燃行业。

《黑神话》的制作人是冯骥,他作出直接的称许,把它说成是“地表最强的视频生成模型,不存在其他能与之相比的情况”。

这意味着,视频生成不再单单是Sora所独有的,中国的大型企业不但追赶上了进程,而且达成了超越。

字节成为了中国玩家,是继其他之后的第二个,使得硅谷感受到了“技术代差焦虑”。

即在上线仅仅两天之后,梦就匆忙且迫不及待地紧急实行对真人图生视频该功能的限制举措,当造假所需付出的成本逐渐向零靠近之时,监管那犹如高悬的达摩克利斯剑一般的威慑作用随时都很有可能降临落下来。

在这一仗之中,所打出的结论,是非常清晰的,那就是国产模型在视频生成这个赛道之上,已经具备了全球的竞争力。

阿里Qwen35瞄准原生视觉基座

2月9日,Face页面之上,Qwen3.5提交代码合并的PR悄然现身,开发者于其中挖掘出关键信息,全新混合注意力机制出现,极有可能是原生视觉语言模型,且计划开源2B密集版,还有35B - A3B的MoE版。

此前千问系列虽强,但始终是“纯文本学霸”。

一旦以原生VLM形态亮相展现面貌,这就意味着阿里下定了决心,要将视觉理解全然直接放入基座之中,而不是如同多数厂商那般,靠着“视觉编码器加上大语言模型”来进行拼凑。

要是落地能够顺利达成,那么这将会成为国产开源模型在多模态原生能力方面的一回关键卡位,进而使得模型切实“看得懂世界”。

百度稳守入口不急于发布新模型

今年春节,最早砸红包的玩家是百度,投入了5亿,还是北京台春晚首席AI合作伙伴,攻势极为猛烈。

但这透露了其核心的逻辑,并非着急去发布新的模型来展示实力,而是要坚守住拥有两亿月活跃用户的文心助手,进而将百度APP打造成人工智能时代的超级入口。

在字节、阿里、腾讯纷纷为“入口”大肆投入资金之际,百度手中原本就紧握着一款国民级应用。

到底是针对新模型开展训练,还是对搜索体验予以重构举动,又或者是在为Agent应用进行酝酿呢,O计划?

整个行业,都在翘首以盼,等待这个神秘的黑盒被开启,想要瞧瞧百度会怎样,把流量方面所具备的优势,转化成为处于AI时代的竞争壁垒。

腾讯深潜上下文学习布局长远

当对春节档展开盘点之际,极易出现把腾讯遗漏的情况,元宝的红包大战看起来仿佛仅仅是在“跟牌”。

然而,知晓内情的人,把目光聚焦在了另外一件事情上,那就是,人工智能领域的杰出人物姚顺雨,在加入腾讯之后,首次带领团队公布了研究所得出的成果。

2月3日,上线了腾讯混元技术博客,其团队经研究发现,在“从上下文中学习新知识”这项能力上面,全球前十的语言模型平均解决率仅有17.2%。

这意味着顶级做题家其实根本不会利用上下文。

极为野心勃勃的愿景被姚顺雨给出,那就是,未来竞争的关键要点并非是谁能够把模型训练得更为出色,而是在于谁能够为任务供给最为丰富同时也是最为相关的上下文。

要是CL - bench变为行业达成一致的评估基准,那么腾讯便掌控住了下一代模型进行迭代的方向盘。

智谱M25用成本优势押注Agent工程

创业公司的牌桌上只剩下纯粹的模型硬仗。

智谱给这一代的模型重新去定义角色,这个角色并非是对话助手,而是“系统架构师!”。

有开发者用它做出横版解谜游戏,另一个做出论文版“抖音”。

智谱所押宝的是这样一种情况,在2026年的时候,大模型必然要紧跟着从“写代码”这个阶段逐步演进进而发展到“写工程”这个阶段。

那成本,才是真正能叫行业为之侧目不已的,成本是什么呢,成本是1万美元,在理论层面上它能够支撑4个Agent持续不断地工作一整年。

创始人是闫俊杰,其逻辑清晰着,Agent进行规模化部署时,最大瓶颈从来都不是能力方面,而是成本方面。

将M2.5的推理速度提升至主流模型的两倍,把价格降低到为数几分之一那般,这举措是在为Agent经济构建道路。

与Kimi各自死磕长文本与多模态

整个春节档,没有任何官方发布,却在用户端“被更新”。

有网友察觉到,回复风格出现了变动,上下文窗口由128K急剧飙升到了1M,知识库也已更新至2025年5月。

这依旧是那家执拗的公司,它不开展多模态业务,而是将文本推理与长代码理解钻研到了极点。

Kimi Code在同一时间上线了,并且已经完成了集成,对于开发者而言,能够直接把一张UI设计图投放进去,从而让AI依据此来进行代码编写。

这是目前国内把“视觉理解→编程执行”链路跑得最顺的产品。

以前者的情况而言,是坚守着长文本所占据的高地,去赌复杂推理具备着不可被替代的特性,而后者呢,则是打通了多模态原生的路径,去赌开发者手头所使用的工具。

回看这二十多天里的密集出牌行为,一个清晰的图景逐渐呈现出来,那就是大模型行业已经告别了大一统的幻想。

智谱全身心投入到Agent工程之中,执着地深究推理成本,Kimi成功打通多模态原生这一路径,坚守长文本领域,腾讯深度钻研上下文学习——每一家都在为不同的未来而押注。

烟火消散之后,遗留在场地之上的,仅仅会是这般些个,切实能够将自身卷入到工作流程之内、嵌入进生产线路之中、对成本结构予以重新构建的厉害人物。

你看好哪家公司的赌注?

评论区聊聊你的判断,点赞分享让更多人参与讨论。