专题:DeepSeek为何能震动全球AI圈
来源:摩根士丹利 Morgan Stanley
金榮燦Shawn Kim
摩根士丹利亚洲科技行业研究主管
DeepSeek横空出世,其效率超出所有人的预期,这也令投资者质疑持续的人工智能(AI)投资热潮的必要性。人工智能的叙事正在发生转变——更好的投资回报率在哪里?半导体产业是第一阶段的赢家,但或许不是这一新范式的最终受益者。
DeepSeek因何火爆
在输出价格基础上,DeepSeek的API(每百万tokens为2.19美元),比OpenAI的o1模型(每百万60美元)便宜96%,而性能表现相似。并且根据用户的反馈,训练成本降低20倍,推理成本降低10倍,内存减少8倍。
三大主要突破:
在不影响精度的情况下占用更少的内存。DeepSeek使用8位浮点数进行训练,而不是行业标准的32位数字。这里的权衡是8位牺牲了一些精度,但节省了大量内存。在DeepSeek的案例中,它将数字分解为小块,并在网络的关键点使用高计算量,并没有对性能造成太大影响。
节省电力和能源。模型中的“混合专家模型”(MoE)系统在任何给定时间的活动参数都低于6%,从而降低了能源需求,进而降低了总体成本。
围绕MLA(多头潜在注意力)的创新允许模型仅关注和存储重要参数,而不是每个参数计数。通过将推理请求重定向到最能够回答查询或解决任务的较小模型,而不是整个模型,可以在不降低任何性能的情况下完成此操作。其他创新包括压缩KV(键值)缓存,通过仅计算新token的键和值而不必重新计算所有内容,从而实现成本低得多的推理,以及复制现有前沿模型的强化学习。
DeepSeek撼动了什么
采用率上升,降低未来资本支出需求
自上周以来,大型科技公司将其迅速整合到企业AI领域,所有美国超大规模数据中心都在采用。这也正在改变各公司对人工智能许可和迄今为止支付的溢价的看法。现在的问题是,OpenAI推出的o3等新模型是否能够提供足够大的进步,面对希望通过使用开源模型来以更低成本获得更理想结果的客户,能继续获得他们认可并证明其溢价。对于持怀疑态度的人来说,DeepSeek在应用程序下载方面仍然领先,但自上周以来,许多硅谷公司正在下载和部署模型权重。
DeepSeek是开源/开放权重模型,以更少的资源提供高性能,并且可以尽可能以低廉的成本运行大语言模型。如果在本地运行,则不存在与数据相关的安全风险。它是开源的,因此具有适应性和可扩展性,从而可以轻松集成和构建。
DeepSeek可能已经为更快的创新和更新模型的开源社区打开了闸门。拥有更多的计算能力仍然会带来更好的人工智能模型,但大语言模型正在通过开源迅速商品化,而人工智能的使用变得更加便宜,并且在继续以相同的速度增长的基础上,对未来资本支出的需求降低。
人工智能的护城河可能没有那么宽
认为要在人工智能革命中占主导地位并从中获利就必须使用最昂贵和最强大的芯片的观点现在正受到质疑。如果开源大语言模型能够用最少的资源开发前沿模型,就会削弱当前AI半导体企业估值中对未来巨大需求的预测。越来越高效的模型可能会进一步商品化人工智能,并给资本支出要求带来压力。人工智能赋能者面临的关键问题是确定人工智能革命在低成本环境下,能产生多少实际价值。
股市反应过度还是合理?
半导体股票往往会在资本支出上升时重新估值,并在资本支出趋于平缓时下跌(即半导体周期)。DeepSeek的叙事似乎更倾向于后者,挑战了人工智能需要大量资本投资才能实现最佳业绩的假设。市场的潜在担忧是,企业是否会犹豫投资最新的人工智能硬件,从而对利润率和盈利构成风险。反驳的观点是,即使在传统GPU上运行的高效模型越来越多,这些GPU仍然是必要的,而最终,更多的需求也意味着更多的GPU。
基于人工智能的产品现在更加重要
日益低成本的AI市场将大幅扩张。但与此同时,它的盈利能力也可能会下降。人工智能价值链的很大一部分可能会商品化。这不利于一些公司的估值⸺明显面临风险的领域是提供人工智能架构的公司。DeepSeek的高效产出改变了游戏规则,支持在其上构建的人工智能应用程序和代理。利润可能会向AI部署者(例如软件和超大规模云服务商)转移,而最大的受益者是AI的消费者。
股市谁受益,谁落空?
我们不再处于人工智能革命的早期阶段,高投入并不一定保证高利润。在互联网基础设施建设阶段,电信和有线电视提供商向网络基础设施投入了数十亿美元。然而,像亚马逊这样的科技巨头(因为每个token提供者每秒的EC2和S3费用低廉)和创造新商业模式的大型公司抓住了大部分的上涨空间。
自2022年11月ChatGPT崭露头角以来,过去两年的市场表现一直集中在全球范围内的极少数股票(赋能股、基础设施股),似乎显示着投资者已对AI主题将如何发展了然于心。市场似乎高度认可这样的假设:这些公司将成为人工智能革命的长期领导者,实现最大的盈利增长。但是,虽然我们可能正处于向效率转变的重大技术范式转变的风口浪尖,但人工智能的赢家可能不是第一批利用新技术变现的公司,专注于短期盈利能力可能会产生误导。
受益的是AI的用户,在AI上投入资金以增加竞争护城河、提高生产力或创造增长机会的公司有望从更便宜的推理资本支出中受益。这些公司包括云提供商等⸺如果能够实现有利的价格点,这些“平台”将获利;消费大量人工智能的公司,如社交媒体;以及位于应用层的公司,支持人工智能工作负载,如软件公司在顶层提供的服务的AI模型。面临风险的是“铁镐和铁铲”供应商,这些供应商的估值已经大幅重估,并且由于高估值而面临更高的盈利实现门槛。
内容声明:
以上内容是摩根士丹利发布的一般信息,基于文章创作时的相关信息撰写。本文内容不构成摩根士丹利的要约或推介,也不构成任何税务或法律建议。上述内容并未对任何个人的财务状况进行评估,因此并非适合所有接收人。
责任编辑:石秀珍 SF183
专题:DeepSeek为何能震动全球AI圈
来源:摩根士丹利 Morgan Stanley
金榮燦Shawn Kim
摩根士丹利亚洲科技行业研究主管
DeepSeek横空出世,其效率超出所有人的预期,这也令投资者质疑持续的人工智能(AI)投资热潮的必要性。人工智能的叙事正在发生转变——更好的投资回报率在哪里?半导体产业是第一阶段的赢家,但或许不是这一新范式的最终受益者。
DeepSeek因何火爆
在输出价格基础上,DeepSeek的API(每百万tokens为2.19美元),比OpenAI的o1模型(每百万60美元)便宜96%,而性能表现相似。并且根据用户的反馈,训练成本降低20倍,推理成本降低10倍,内存减少8倍。
三大主要突破:
在不影响精度的情况下占用更少的内存。DeepSeek使用8位浮点数进行训练,而不是行业标准的32位数字。这里的权衡是8位牺牲了一些精度,但节省了大量内存。在DeepSeek的案例中,它将数字分解为小块,并在网络的关键点使用高计算量,并没有对性能造成太大影响。
节省电力和能源。模型中的“混合专家模型”(MoE)系统在任何给定时间的活动参数都低于6%,从而降低了能源需求,进而降低了总体成本。
围绕MLA(多头潜在注意力)的创新允许模型仅关注和存储重要参数,而不是每个参数计数。通过将推理请求重定向到最能够回答查询或解决任务的较小模型,而不是整个模型,可以在不降低任何性能的情况下完成此操作。其他创新包括压缩KV(键值)缓存,通过仅计算新token的键和值而不必重新计算所有内容,从而实现成本低得多的推理,以及复制现有前沿模型的强化学习。
DeepSeek撼动了什么
采用率上升,降低未来资本支出需求
自上周以来,大型科技公司将其迅速整合到企业AI领域,所有美国超大规模数据中心都在采用。这也正在改变各公司对人工智能许可和迄今为止支付的溢价的看法。现在的问题是,OpenAI推出的o3等新模型是否能够提供足够大的进步,面对希望通过使用开源模型来以更低成本获得更理想结果的客户,能继续获得他们认可并证明其溢价。对于持怀疑态度的人来说,DeepSeek在应用程序下载方面仍然领先,但自上周以来,许多硅谷公司正在下载和部署模型权重。
DeepSeek是开源/开放权重模型,以更少的资源提供高性能,并且可以尽可能以低廉的成本运行大语言模型。如果在本地运行,则不存在与数据相关的安全风险。它是开源的,因此具有适应性和可扩展性,从而可以轻松集成和构建。
DeepSeek可能已经为更快的创新和更新模型的开源社区打开了闸门。拥有更多的计算能力仍然会带来更好的人工智能模型,但大语言模型正在通过开源迅速商品化,而人工智能的使用变得更加便宜,并且在继续以相同的速度增长的基础上,对未来资本支出的需求降低。
人工智能的护城河可能没有那么宽
认为要在人工智能革命中占主导地位并从中获利就必须使用最昂贵和最强大的芯片的观点现在正受到质疑。如果开源大语言模型能够用最少的资源开发前沿模型,就会削弱当前AI半导体企业估值中对未来巨大需求的预测。越来越高效的模型可能会进一步商品化人工智能,并给资本支出要求带来压力。人工智能赋能者面临的关键问题是确定人工智能革命在低成本环境下,能产生多少实际价值。
股市反应过度还是合理?
半导体股票往往会在资本支出上升时重新估值,并在资本支出趋于平缓时下跌(即半导体周期)。DeepSeek的叙事似乎更倾向于后者,挑战了人工智能需要大量资本投资才能实现最佳业绩的假设。市场的潜在担忧是,企业是否会犹豫投资最新的人工智能硬件,从而对利润率和盈利构成风险。反驳的观点是,即使在传统GPU上运行的高效模型越来越多,这些GPU仍然是必要的,而最终,更多的需求也意味着更多的GPU。
基于人工智能的产品现在更加重要
日益低成本的AI市场将大幅扩张。但与此同时,它的盈利能力也可能会下降。人工智能价值链的很大一部分可能会商品化。这不利于一些公司的估值⸺明显面临风险的领域是提供人工智能架构的公司。DeepSeek的高效产出改变了游戏规则,支持在其上构建的人工智能应用程序和代理。利润可能会向AI部署者(例如软件和超大规模云服务商)转移,而最大的受益者是AI的消费者。
股市谁受益,谁落空?
我们不再处于人工智能革命的早期阶段,高投入并不一定保证高利润。在互联网基础设施建设阶段,电信和有线电视提供商向网络基础设施投入了数十亿美元。然而,像亚马逊这样的科技巨头(因为每个token提供者每秒的EC2和S3费用低廉)和创造新商业模式的大型公司抓住了大部分的上涨空间。
自2022年11月ChatGPT崭露头角以来,过去两年的市场表现一直集中在全球范围内的极少数股票(赋能股、基础设施股),似乎显示着投资者已对AI主题将如何发展了然于心。市场似乎高度认可这样的假设:这些公司将成为人工智能革命的长期领导者,实现最大的盈利增长。但是,虽然我们可能正处于向效率转变的重大技术范式转变的风口浪尖,但人工智能的赢家可能不是第一批利用新技术变现的公司,专注于短期盈利能力可能会产生误导。
受益的是AI的用户,在AI上投入资金以增加竞争护城河、提高生产力或创造增长机会的公司有望从更便宜的推理资本支出中受益。这些公司包括云提供商等⸺如果能够实现有利的价格点,这些“平台”将获利;消费大量人工智能的公司,如社交媒体;以及位于应用层的公司,支持人工智能工作负载,如软件公司在顶层提供的服务的AI模型。面临风险的是“铁镐和铁铲”供应商,这些供应商的估值已经大幅重估,并且由于高估值而面临更高的盈利实现门槛。
内容声明:
以上内容是摩根士丹利发布的一般信息,基于文章创作时的相关信息撰写。本文内容不构成摩根士丹利的要约或推介,也不构成任何税务或法律建议。上述内容并未对任何个人的财务状况进行评估,因此并非适合所有接收人。
责任编辑:石秀珍 SF183