要理解中国移动这张订单的分量,先得明白英伟达CUDA曾经意味着什么。
CUDA不只是一套编程工具,你可以理解为它是AI世界的「普通话」。过去十几年,全球几乎所有科技公司训练AI模型,写的代码底层走的都是CUDA,你用的每一行PyTorch代码、你跑的每一个TensorFlow模型,底层都系在英伟达的这套生态上。这套生态护城河,比任何硬件专利都更难逾越。
2023年英伟达数据中心业务的毛利率超过70%,市值突破万亿美元,靠的不只是GPU的物理性能,而是CUDA生态的收税权:每一家AI公司,每训练一个模型,都要向英伟达交过路费。
可以说,天下苦CUDA久矣。
这么看的话,中国移动这次这个采购决定有点「揭竿而起」的味道了。
中国移动这次采购6208张AI加速卡,折合776套超节点设备,采购金额超过20亿元,在技术规格中明确指定采用华为CANN(神经网络异构计算架构)生态方案。中标的五家企业——河南昆仑、长江计算、华鲲振宇、宝德计算机、华启智慧全部基于华为昇腾系列芯片构建。
据了解,在2025年的AI推理服务器集采中,CANN生态设备的金额占比已经达到70%。这次超节点采购,是在这个基础上更进一层,从推理走向训练,从单点走向全流程覆盖。量变正在引发质变。
一次国产AI加速卡的采购,撼动不了CUDA的生态地位。但是,当我们同时具备以下三点之后,局面可能就不一样了。
首先是芯片可用。在高端GPU对华出口持续受限的背景下,华为昇腾系列芯片是国内市场唯一能提供规模化AI算力的成熟选项之一。尤其是昇腾910系列和最新的950PR产品,已经在多个头部大模型训练任务中完成了验证。能用这道坎,国产芯片算是跨过去了。
其次是软件就绪。 2024年8月,华为宣布CANN全面开源开放;2025年,PyTorch、TensorFlow等主流框架已完成与昇腾的深度适配,MindSpore作为华为自研框架也在快速迭代。这意味着在软件层面,CANN生态已经基本解决了有没有人用的问题,用的人多了,工具链自然成熟,踩坑的人少了,开发者信心自然就会建立起来。
最后一点是需求。中国移动的九天大模型矩阵已布局超过50款行业模型,AI化产品的客户规模接近2亿户。对于这样一个体量的玩家来说,自主可控已经是大势所趋。三个条件,现在,它们凑齐了。国产算力爆发的节点真的要来了!
节点来临
中国移动的这张订单里最显眼的事实就一个,一张英伟达的卡都没有。
这并非中国移动刻意排斥英伟达,而是地缘政治大逻辑下的必然结果。但结果就是结果,在中国最大运营商的AI基础设施版图中,CUDA的渗透率,在可预见的未来,将从无处不在慢慢减少。
中国移动这6208张卡,会在2026年到2027年间陆续上线部署。776套超节点构成的智算集群,将成为中国运营商体系内规模最大的AI训练基础设施之一。
这只是开始。运营商的采购具有极强的示范效应,当中国最大的移动通信运营商完成了AI基础设施的国产化底座建设,其他行业、其他客户跟进的速度会大幅加快。像一条我们高速公路,一旦第一个服务区建好了,整条线路的商业生态就会跟着跑起来。
当然,差距我们也得正视。目前CANN生态面临的挑战依然真实存在,例如,在开发者社区的厚度与CUDA相比仍有差距,工具链的成熟度还需要更多场景验证,极限性能与英伟达最新GPU的差距也不是一年两年能追平的。但这些是快慢的问题,而不是有无的问题。
再者说,算力版图的重划,从来不是某一天突然发生的。它是一次次招标、一张张订单、一行行代码的累积,最终在某个节点汇成一次可以被清晰感知的变化。