在美国发布AI禁令后,特朗普随即宣布了一项预算高达5000亿美元的AGI计划——星际之门,以保证其在AI领域的领先地位。而在大洋彼岸的中国,一家名为Deepseek的中国创业公司,只用了2048块显卡,就训练出了一个能与顶级模型相媲美的Deepseek-V3模型。Deepseek最引人注目的并不只是它的技术指标,而是其所代表的效率革命,仅依靠少量的硬件配置和几十名年轻的博士生,就打破了美国的AI资源限制,完成了跨越式的技术突破。更重要的是,Deepseek选择了完全开源的路线,将代码、模型权重和训练日志全部公开。没有人会忘记开源的力量,虽然定义智能手机的是iOS,但安卓才是那个让手机行业真正繁荣,普惠深入世界各个角落的人。正如Perplexity CEO Aravind Srinivas所说:历史告诉我们,一旦开源追上甚至超越闭源软件,所有开发者都会转向开源。以此为转折点,DeepSeek不仅改变了AI原有的竞争规则,也让美国和中国的AI路线走向了不同的两个方向:巨额投入与追求效率、封闭与开源。
/ 01 /
DeepSeek突破的三层意义
之所以DeepSeek能够引起如此广泛的讨论,不仅在于其技术指标,更在于其对于AI行业的重要意义。首先,DeepSeek重新定义了大模型的竞争壁垒。过去两年里,OpenAI每年要花费上百亿美金,来维持自己在AI领域的优势地位。而现在游戏规则变了。“DeepSeek”证明,数千万美元的投资也能取得显著成果。不久前,UC伯克利博士生潘家怡和另两位研究人员,在CountDown游戏中复现了DeepSeek R1-Zero。实验中,团队验证了通过强化学习RL,3B的基础语言模型也能够自我验证和搜索。更夸张的是,整个实现成本仅不到30美金(约217元)。这意味着,低成本构建具备推理能力的模型已成为可能,预训练模型的巨额投入不再是必需。这背后也引出了一个深层次的问题:当一家公司能在缺乏顶级芯片的情况下,以极低成本建立突破性的 AI 模型时,我们不得不重新思考:那些投入的数千亿美元资本支出,真的物有所值吗?这是OpenAI需要回答的问题。其次,与OpenAI的闭源路线不同,DeepSeek选择完全开源的路线,将代码、模型权重和训练日志全部公开。当开源模型性能媲美市场上最强大的模型,甚至在部分领域有所超越时,会吸引越来越多的开发者参与。原因很简单,开源软件成本低廉,成本越低,开发者的吸引力就越大。因为这将大大降低构建应用程序的成本。这有点像苹果和安卓的故事。回顾移动互联网时代,定义智能机0到1的是iOS,但让手机行业真正繁荣普惠深入世界各个角落的是安卓。在Meta 副总裁兼首席人工智能科学家杨立昆看来,DeepSeek的成功,与其说是”中国超越美国”,倒不如说是开源模型正在超越专有模型。第三,Deepseek的技术突破,背后是AI研发开放性的胜利,这与美国的AI封锁形成了鲜明对比。具体来说,在一个被GPU短缺和芯片禁运困扰的环境中,一家从未被计入中国“AI 六小龙”的量化基金公司,用少量的硬件配置和几十名年轻的博士生,就完成了跨越式的技术突破。作为一个后来者,Deepseek的突破虽然离不开自身的努力,但更重要的是,开放的技术交流环境,包括论文、开源代码和各种正式或非正式的人才交流,为创新突破创造了条件。这揭示了AI行业的另一个关键特性:模型研发具有很强的外部性。特别是在蒸馏与合成数据等技术存在的情况下,后来者的追赶和学习效应异常强劲。这种内卷加外卷的结果,也是模型能力变好,而成本快速下降的原因。英伟达科学家Jim Fan也提到了开放性对于AI发展的影响:不管你喜欢与否,AI的未来不会是被“安全委员会”控制的瓶中精灵。每个互联网用户都将能在他们的“烤面包机笔记本”上运行高阶模型。这是历史潮流,我们应该顺势而为,而不是逆流而上。当美国不断强化AI技术封锁的当下,Deepseek的突破又何尝不是对于美国AI制裁的一种“反噬”。
在美国发布AI禁令后,特朗普随即宣布了一项预算高达5000亿美元的AGI计划——星际之门,以保证其在AI领域的领先地位。而在大洋彼岸的中国,一家名为Deepseek的中国创业公司,只用了2048块显卡,就训练出了一个能与顶级模型相媲美的Deepseek-V3模型。Deepseek最引人注目的并不只是它的技术指标,而是其所代表的效率革命,仅依靠少量的硬件配置和几十名年轻的博士生,就打破了美国的AI资源限制,完成了跨越式的技术突破。更重要的是,Deepseek选择了完全开源的路线,将代码、模型权重和训练日志全部公开。没有人会忘记开源的力量,虽然定义智能手机的是iOS,但安卓才是那个让手机行业真正繁荣,普惠深入世界各个角落的人。正如Perplexity CEO Aravind Srinivas所说:历史告诉我们,一旦开源追上甚至超越闭源软件,所有开发者都会转向开源。以此为转折点,DeepSeek不仅改变了AI原有的竞争规则,也让美国和中国的AI路线走向了不同的两个方向:巨额投入与追求效率、封闭与开源。
/ 01 /
DeepSeek突破的三层意义
之所以DeepSeek能够引起如此广泛的讨论,不仅在于其技术指标,更在于其对于AI行业的重要意义。首先,DeepSeek重新定义了大模型的竞争壁垒。过去两年里,OpenAI每年要花费上百亿美金,来维持自己在AI领域的优势地位。而现在游戏规则变了。“DeepSeek”证明,数千万美元的投资也能取得显著成果。不久前,UC伯克利博士生潘家怡和另两位研究人员,在CountDown游戏中复现了DeepSeek R1-Zero。实验中,团队验证了通过强化学习RL,3B的基础语言模型也能够自我验证和搜索。更夸张的是,整个实现成本仅不到30美金(约217元)。这意味着,低成本构建具备推理能力的模型已成为可能,预训练模型的巨额投入不再是必需。这背后也引出了一个深层次的问题:当一家公司能在缺乏顶级芯片的情况下,以极低成本建立突破性的 AI 模型时,我们不得不重新思考:那些投入的数千亿美元资本支出,真的物有所值吗?这是OpenAI需要回答的问题。其次,与OpenAI的闭源路线不同,DeepSeek选择完全开源的路线,将代码、模型权重和训练日志全部公开。当开源模型性能媲美市场上最强大的模型,甚至在部分领域有所超越时,会吸引越来越多的开发者参与。原因很简单,开源软件成本低廉,成本越低,开发者的吸引力就越大。因为这将大大降低构建应用程序的成本。这有点像苹果和安卓的故事。回顾移动互联网时代,定义智能机0到1的是iOS,但让手机行业真正繁荣普惠深入世界各个角落的是安卓。在Meta 副总裁兼首席人工智能科学家杨立昆看来,DeepSeek的成功,与其说是”中国超越美国”,倒不如说是开源模型正在超越专有模型。第三,Deepseek的技术突破,背后是AI研发开放性的胜利,这与美国的AI封锁形成了鲜明对比。具体来说,在一个被GPU短缺和芯片禁运困扰的环境中,一家从未被计入中国“AI 六小龙”的量化基金公司,用少量的硬件配置和几十名年轻的博士生,就完成了跨越式的技术突破。作为一个后来者,Deepseek的突破虽然离不开自身的努力,但更重要的是,开放的技术交流环境,包括论文、开源代码和各种正式或非正式的人才交流,为创新突破创造了条件。这揭示了AI行业的另一个关键特性:模型研发具有很强的外部性。特别是在蒸馏与合成数据等技术存在的情况下,后来者的追赶和学习效应异常强劲。这种内卷加外卷的结果,也是模型能力变好,而成本快速下降的原因。英伟达科学家Jim Fan也提到了开放性对于AI发展的影响:不管你喜欢与否,AI的未来不会是被“安全委员会”控制的瓶中精灵。每个互联网用户都将能在他们的“烤面包机笔记本”上运行高阶模型。这是历史潮流,我们应该顺势而为,而不是逆流而上。当美国不断强化AI技术封锁的当下,Deepseek的突破又何尝不是对于美国AI制裁的一种“反噬”。