DeepSeek 的冲击何时平息?斯坦福吴恩达教授撰文:先想清这几点

管理智慧

6小时前

算力的祛魅时刻。...文章仅代表作者本人观点。...曾几何时,"模型规模即真理"的叙事犹如AI领域的圣杯传说,让无数资本在算力竞赛的中狂奔。...我认为,DeepSeek的现象让很多人开始重新思考以下几点:。

作者|AI工作坊

来源 |AI深度研究员   管理智慧

咨询合作| 13699120588

文章仅代表作者本人观点

DeepSeek本周引发的行业震动,犹如一面棱镜折射出三大显性趋势的璀璨光芒:首先,中国在生成式AI领域正以燎原之势追赶美国,这必将重构全球AI供应链版图;其次,开源模型正在将基础模型层转化为普惠资源,如同普罗米修斯的火种,为应用开发者开启创新之门;再者,突破算力桎梏的算法革命正以指数级速度降低训练成本,昭示着AI进化已突破单一依赖算力堆砌的旧范式。

约大约一周前,中国的 DeepSeek公司发布了名为 DeepSeek-R1的新模型,其在基准测试中的表现几乎能与 OpenAI’s o1媲美。而且,他们以宽松的 MIT license公开了这款开源权重模型。上周,我在 Davos时,许多没有技术背景的商业领袖也对这款模型表现出了浓厚兴趣。本周一更是在资本市场激起千层浪:英伟达等多家美国科技巨头股价应声重挫(截至撰稿时部分有所回升)。

我认为,DeepSeek的现象让很多人开始重新思考以下几点:

01

全球AI版图的重构

中国在生成式AI上的惊人崛起,正以前所未有的速度缩小与 美国之间的差距。回想 2022 年 11 月 ChatGPT 初登场时,美国还在生成式AI 上大幅领先中国,而许多人的思维定式也让这个印象根深蒂固。然而,短短两年,随着 Qwen (我的团队已使用数月)、 Kimi 、 InternVL 以及 DeepSeek 等多款“中国智造”不断涌现,中国在视频生成等关键领域甚至已数度抢占国际前沿位置,让世界为之震撼。

令我异常振奋的是, DeepSeek-R1 采用开源模型形式与全球共享,并附带详尽的技术文档,这与中国科技界"大道至简,开源为公"的胸怀形成璀璨辉映。反观部分美国公司,却借助宣传“人类灭绝”等夸大的 AI 危机,力图通过监管抑制开源。事实证明, 开源模型对于全球 AI供应链至关重要:众多企业都将依赖它们。若美国继续在这一领域设置障碍,中国就有望在全球供应链中占据核心地位,从而使更多企业转向中国企业而非美国企业的技术方案。

02

开源生态的博弈

开源模型正在将 基础模型层商品化。正如我之前所说, LLM token 的价格已经迅速下降,开源促成了这一趋势,并为开发者提供了更多选择。OpenAI的o1每百万输出token定价60美元,而DeepSeek R1以2.19美元的价格断崖式击穿行业认知。30倍价差的惊雷,炸醒了仍在算力迷宫中徘徊的观望者。

与此同时,单纯依靠训练基础模型并向外销售 API 访问的商业模式难度不小,许多公司仍在寻找收回巨额研发投入的方法。换句话说,  基础模型训练的竞赛如同攀登AI领域的珠穆朗玛——纵然风光无限,沿途却布满耗尽资源的骸骨(红杉资本《AI的6000亿美元之问》已深刻剖析此困境)。而真正的金矿,正蕴藏在应用层的熔岩之中:当他人已经在模型训练上投入了数十亿资金时,我们只需花费少量成本,就能把这些模型用来开发客服机器人、邮件摘要、 AI 医疗、法律文档助手等多种服务。

03

算力的祛魅时刻

曾几何时,"模型规模即真理"的叙事犹如AI领域的圣杯传说,让无数资本在算力竞赛的中狂奔。仅仅依靠规模并非通往 AI 突飞猛进的唯一道路。眼下有关扩大模型规模能带来革命性突破的说法可谓沸沸扬扬。公平而言,我曾经也是这种“大规模”思路的早期拥护者。曾有不少企业以“加大资金投入就能(i)把规模做大、(ii)并且实现预期中的性能提升”为口号,吸引到数十亿美元资金。结果,整个行业一度过于痴迷规模,而忽视了其他灵活多样的创新思路。在当美国芯片禁运的压力下,来自中国的 DeepSeek 团队反倒迸发出强大的研发创造力,通过一系列技术优化,成功使模型能够在性能较弱的 H800 GPUs(而非 H100s)上运行,并且在不计研究成本的前提下,训练总费用仍控制在 600 万美元以内,可谓一次令人惊叹的“低成本高效奇迹”。证明硅基文明的进化论从不只有"大力出奇迹"这单一章节。

历史总在演绎辩证的轮回:当每个计算单元的成本坍缩,往往激发出更磅礴的需求浪潮。就像蒸汽机点燃工业革命后,人类对动力的渴求反而几何级增长。至于这种模式是否会真正降低对算力的需求,现在还言之尚早。有时,单个“产品”更便宜,反而会刺激整体采购量增加。我相信,从长远来看,人类对智能和算力的需求几乎无上限,因此即便算力成本下降,也不会削弱我们对它的追求,反而会让其应用场景更加繁盛。

在X平台的舆论场域,DeepSeek-R1犹如一面棱镜,折射出观察者们潜意识的认知光谱:有人看见地缘政治棋局的量子纠缠,有人预见应用生态的寒武纪大爆发。于我而言,。正如我所带领的团队已经开始构思的一系列新项目——一旦能够接触到这样的开放式高级推理模型,我们便能构建过去想都不敢想的创新应用。

面向未来,机遇与挑战并存,而我们拥有无限可能。就像在茫茫海洋上远眺灯塔一般, AI 的发展正在为全行业指明新航向。每一位投身其中的从业者,都有机会为这场新时代的变革添砖加瓦、作出贡献。我相信,只要我们秉持远见,坚守创新精神,就必能在这场智力与技术的浪潮中不断前行,实现更广泛的社会价值与行业引领。

参考资料:https://www.deeplearning.ai/the-batch/issue-286/

END

华夏基石AI战略领导力特训营2025年第四期开始报名!

抓住数字智能时代的机遇,团报即可享受优惠!

机会难得,名额有限,别错过!

报名及咨询:柳老师15202171854

喜欢这篇文章

请为我点赞和在看

算力的祛魅时刻。...文章仅代表作者本人观点。...曾几何时,"模型规模即真理"的叙事犹如AI领域的圣杯传说,让无数资本在算力竞赛的中狂奔。...我认为,DeepSeek的现象让很多人开始重新思考以下几点:。

作者|AI工作坊

来源 |AI深度研究员   管理智慧

咨询合作| 13699120588

文章仅代表作者本人观点

DeepSeek本周引发的行业震动,犹如一面棱镜折射出三大显性趋势的璀璨光芒:首先,中国在生成式AI领域正以燎原之势追赶美国,这必将重构全球AI供应链版图;其次,开源模型正在将基础模型层转化为普惠资源,如同普罗米修斯的火种,为应用开发者开启创新之门;再者,突破算力桎梏的算法革命正以指数级速度降低训练成本,昭示着AI进化已突破单一依赖算力堆砌的旧范式。

约大约一周前,中国的 DeepSeek公司发布了名为 DeepSeek-R1的新模型,其在基准测试中的表现几乎能与 OpenAI’s o1媲美。而且,他们以宽松的 MIT license公开了这款开源权重模型。上周,我在 Davos时,许多没有技术背景的商业领袖也对这款模型表现出了浓厚兴趣。本周一更是在资本市场激起千层浪:英伟达等多家美国科技巨头股价应声重挫(截至撰稿时部分有所回升)。

我认为,DeepSeek的现象让很多人开始重新思考以下几点:

01

全球AI版图的重构

中国在生成式AI上的惊人崛起,正以前所未有的速度缩小与 美国之间的差距。回想 2022 年 11 月 ChatGPT 初登场时,美国还在生成式AI 上大幅领先中国,而许多人的思维定式也让这个印象根深蒂固。然而,短短两年,随着 Qwen (我的团队已使用数月)、 Kimi 、 InternVL 以及 DeepSeek 等多款“中国智造”不断涌现,中国在视频生成等关键领域甚至已数度抢占国际前沿位置,让世界为之震撼。

令我异常振奋的是, DeepSeek-R1 采用开源模型形式与全球共享,并附带详尽的技术文档,这与中国科技界"大道至简,开源为公"的胸怀形成璀璨辉映。反观部分美国公司,却借助宣传“人类灭绝”等夸大的 AI 危机,力图通过监管抑制开源。事实证明, 开源模型对于全球 AI供应链至关重要:众多企业都将依赖它们。若美国继续在这一领域设置障碍,中国就有望在全球供应链中占据核心地位,从而使更多企业转向中国企业而非美国企业的技术方案。

02

开源生态的博弈

开源模型正在将 基础模型层商品化。正如我之前所说, LLM token 的价格已经迅速下降,开源促成了这一趋势,并为开发者提供了更多选择。OpenAI的o1每百万输出token定价60美元,而DeepSeek R1以2.19美元的价格断崖式击穿行业认知。30倍价差的惊雷,炸醒了仍在算力迷宫中徘徊的观望者。

与此同时,单纯依靠训练基础模型并向外销售 API 访问的商业模式难度不小,许多公司仍在寻找收回巨额研发投入的方法。换句话说,  基础模型训练的竞赛如同攀登AI领域的珠穆朗玛——纵然风光无限,沿途却布满耗尽资源的骸骨(红杉资本《AI的6000亿美元之问》已深刻剖析此困境)。而真正的金矿,正蕴藏在应用层的熔岩之中:当他人已经在模型训练上投入了数十亿资金时,我们只需花费少量成本,就能把这些模型用来开发客服机器人、邮件摘要、 AI 医疗、法律文档助手等多种服务。

03

算力的祛魅时刻

曾几何时,"模型规模即真理"的叙事犹如AI领域的圣杯传说,让无数资本在算力竞赛的中狂奔。仅仅依靠规模并非通往 AI 突飞猛进的唯一道路。眼下有关扩大模型规模能带来革命性突破的说法可谓沸沸扬扬。公平而言,我曾经也是这种“大规模”思路的早期拥护者。曾有不少企业以“加大资金投入就能(i)把规模做大、(ii)并且实现预期中的性能提升”为口号,吸引到数十亿美元资金。结果,整个行业一度过于痴迷规模,而忽视了其他灵活多样的创新思路。在当美国芯片禁运的压力下,来自中国的 DeepSeek 团队反倒迸发出强大的研发创造力,通过一系列技术优化,成功使模型能够在性能较弱的 H800 GPUs(而非 H100s)上运行,并且在不计研究成本的前提下,训练总费用仍控制在 600 万美元以内,可谓一次令人惊叹的“低成本高效奇迹”。证明硅基文明的进化论从不只有"大力出奇迹"这单一章节。

历史总在演绎辩证的轮回:当每个计算单元的成本坍缩,往往激发出更磅礴的需求浪潮。就像蒸汽机点燃工业革命后,人类对动力的渴求反而几何级增长。至于这种模式是否会真正降低对算力的需求,现在还言之尚早。有时,单个“产品”更便宜,反而会刺激整体采购量增加。我相信,从长远来看,人类对智能和算力的需求几乎无上限,因此即便算力成本下降,也不会削弱我们对它的追求,反而会让其应用场景更加繁盛。

在X平台的舆论场域,DeepSeek-R1犹如一面棱镜,折射出观察者们潜意识的认知光谱:有人看见地缘政治棋局的量子纠缠,有人预见应用生态的寒武纪大爆发。于我而言,。正如我所带领的团队已经开始构思的一系列新项目——一旦能够接触到这样的开放式高级推理模型,我们便能构建过去想都不敢想的创新应用。

面向未来,机遇与挑战并存,而我们拥有无限可能。就像在茫茫海洋上远眺灯塔一般, AI 的发展正在为全行业指明新航向。每一位投身其中的从业者,都有机会为这场新时代的变革添砖加瓦、作出贡献。我相信,只要我们秉持远见,坚守创新精神,就必能在这场智力与技术的浪潮中不断前行,实现更广泛的社会价值与行业引领。

参考资料:https://www.deeplearning.ai/the-batch/issue-286/

END

华夏基石AI战略领导力特训营2025年第四期开始报名!

抓住数字智能时代的机遇,团报即可享受优惠!

机会难得,名额有限,别错过!

报名及咨询:柳老师15202171854

喜欢这篇文章

请为我点赞和在看

展开
打开“财经头条”阅读更多精彩资讯
APP内打开