DeepSeek对投资AGI技术革命的范式转变

投资家

1周前

推理模型能力赶上世界第一梯队:o1引领大语言模型在CoT推理范式革命,让AI掌握思考的能力,但主要技术细节因为闭源非常黑箱。...AI技术仍在飞速向前,但AI投资并非一路平坦,需十分警惕途中的风险。
作者 | 投研团队
来源 | 新全球资产配置
DeepSeek做了什么?
  1. 推理模型能力赶上世界第一梯队:o1引领大语言模型在CoT推理范式革命,让AI掌握思考的能力,但主要技术细节因为闭源非常黑箱。R1是经过独立探索,中国研发出的首个性能比肩o1的模型(另一个能比肩o1的模型是gemini flash 2 thinking)。这证明了在数据限制之外,中国企业研发顶级AI模型,特别是推理模型上,掌握真正的know-how
  2. 效率倍数级领先:DeepSeek R1 证明了无需巨额资金和顶级算力也能训练出高性能 AI 大模型。以不到 600 万美元成本和 2048 块 H800 芯片打造出堪比 OpenAI o1 的模型,每百万个 token 查询成本大幅降低,开启了 “极致压缩 + 高效强化训练 + AI 推理算力大幅简化” 的低成本新范式。
    这证明了,美国目前的芯片禁令,未能取得对中国的能力优势,甚至反过来让中国模型运算效率超越美国。但需要注意的是,模型训练成本仅包含模型训练冷启动到后训练结束的运算成本,不包含硬件本身的总体拥有成本、多次尝试、合成数据准备等。作为对比,Anthropic需要筹集数百亿美元来研发和运营模型,但其Claude 3.5 Sonnet的训练成本是在千亿美元水平。尽管短期看效率提升非常惊艳,但过去LLM每年4倍的提效速度下当前仍处于正常的提升范畴。
    图片
    图片
  3. 多模态模型也不落后:目前DeepSeek在其推理模型上未整合多模态能力。但公司近期也发布了多模态的模型Janus-Pro,在部分测试中也展示出优越的效能。多模态能力整合进推理模型中,只是时间问题
图片
图片

我们的核心观点
  1. DeepSeek的出现说明中国企业有能力开发第一梯队的模型,且运算效率当下有倍数级领先。

  2. 美国为了取得竞争优势、营造公平的内部竞争环境,可能在数据和模型管制、芯片禁令等监管政策上加码,封堵离岸算力、芯片走私等漏洞。这会对算力芯片的TAM产生负面影响,但因此减少的海外市场的营收很可能会由美国及其盟友的增量需求弥补。

  3. 英伟达壁垒再受质疑,估值严重承压:Deepseek的两个特点,让市场开始质疑英伟达壁垒的牢固性:

    (1). 模型能快速部署到非英伟达平台进行推理:这是由于模型原本采用的基础算子通用性比较强,这也可能是由于Deepseek团队一早考虑到跨平台的特点。假如换一些更新更独特的模型算子,适配难度就会高很多。同时开源的模式也能第一时间让硬件厂家主动进行适配。

    (2). 所谓训练时抛弃CUDA,其实是部分通信模块直接越过CUDA编写更低级的PTX代码;这是为了充分压榨英伟达的硬件性能,比较耗费人力。而且进行底层开发,反而更难迁移到其他平台。

    但是,以上两点特性不具备普适性,Deepseek在训练上仍围绕英伟达芯片开发。推理层面英伟达本就不是必须。我们认为,Deepseek的推出并未直接改变英伟达的投资逻辑

    但在DeepSeek事件之外,随着AI编程能力的提升,未来有可能直接从底层的低级语言进行模型的开发和迁移,绕过CUDA生态。长期来看,我们需要考虑软件的生态壁垒问题,最终竞争或许回归到芯片的绝对硬件性能上

    短期来看,随着AI走向应用端叙事,可投的AI概念将从英伟达流向更广阔的中下游,市场的资金再分配将造成英伟达估值承压。但我们认为,英伟达过去两年的市值增长更多依赖收入抬升,随着GB200/GB300 NVL的出货问题解决,以及下代Rubin芯片的信息流出,未来股价将重回增长。而且,在AI不断爆发的背景下,目前26-27倍的远期PE并不算贵

  4. 接下来的AI投资机会在哪里?从英伟达跑出来的资金会去哪里?

    非英伟达的AI算力芯片公司值得关注。AI 训练和推理步入低成本新范式,使得 AI ASIC 芯片在算力系统可行性与竞争力方面优势凸显。博通、Marvell 等深耕 AI ASIC 领域的企业,具有较大潜力。

    从产业链角度看,模型竞争激烈,主要冲击应基本被限制在模型厂中。上游因话语权增加而获益,下游因成本下降而增利。而中游的基础设施会显著受益,能以更低成本提供AI服务。所以我们会看到,即便是与模型厂绑定较深的微软,一边跟着OpenAI调查DeepSeek是否存在违规“蒸馏”行为,另一边作为云服务商也主动部署低成本的R1到其平台中。亚马逊由于与模型厂绑定较少,基本没受到本次事件冲击。

    我们仍看好半导体板块的确定性机遇。特别是DeepSeek带来智能模型的小型化,有利于端侧设备部署。当前传统半导体需求仍处于缓慢复苏的周期,配合AI在应用端落地将是强有力的刺激。上游的台积电、下游端侧的苹果,都值得关注

    下游应用层面,我们更看好大中华的机会。特别是中国科技互联网巨头以及端侧供应链上的一些细分领域的龙头,目前在AI上的估值仍然较低。

总的来说,deepseek是AI科技革命中一个重要的里程碑事件。“AI应用潜力巨大,但高估值下脆弱性明显,25年美股或出现30%的回撤”。在目前高估值的环境下,每个人的神经都紧绷着,一点点的分歧都将引发市场的巨震。AI技术仍在飞速向前,但AI投资并非一路平坦,需十分警惕途中的风险!

大型峰会回顾

投资家网·第十三届中国资本年会

投资家网·第十二届股权投资年会

“万物资生 福启未来”第十一届中国股权投资年度峰会

2023上市公司智能产业对接会

2022第十四届中国高新技术产业投资峰会

智者谋远·2021中国股权投资年度峰会

2021第十三届中国高新技术产业投资峰会

涅槃重生——投资家网2020中国股权投资年度峰会

聚势待发——投资家网2019中国股权投资年度峰会

资本破局—2019中国基金合伙人(GPLP)峰会

回归价值投资—2018中国股权投资年度峰会

寻求报道:yangqin6060(微信)
商务合作:yangqin6060(微信)

推理模型能力赶上世界第一梯队:o1引领大语言模型在CoT推理范式革命,让AI掌握思考的能力,但主要技术细节因为闭源非常黑箱。...AI技术仍在飞速向前,但AI投资并非一路平坦,需十分警惕途中的风险。
作者 | 投研团队
来源 | 新全球资产配置
DeepSeek做了什么?
  1. 推理模型能力赶上世界第一梯队:o1引领大语言模型在CoT推理范式革命,让AI掌握思考的能力,但主要技术细节因为闭源非常黑箱。R1是经过独立探索,中国研发出的首个性能比肩o1的模型(另一个能比肩o1的模型是gemini flash 2 thinking)。这证明了在数据限制之外,中国企业研发顶级AI模型,特别是推理模型上,掌握真正的know-how
  2. 效率倍数级领先:DeepSeek R1 证明了无需巨额资金和顶级算力也能训练出高性能 AI 大模型。以不到 600 万美元成本和 2048 块 H800 芯片打造出堪比 OpenAI o1 的模型,每百万个 token 查询成本大幅降低,开启了 “极致压缩 + 高效强化训练 + AI 推理算力大幅简化” 的低成本新范式。
    这证明了,美国目前的芯片禁令,未能取得对中国的能力优势,甚至反过来让中国模型运算效率超越美国。但需要注意的是,模型训练成本仅包含模型训练冷启动到后训练结束的运算成本,不包含硬件本身的总体拥有成本、多次尝试、合成数据准备等。作为对比,Anthropic需要筹集数百亿美元来研发和运营模型,但其Claude 3.5 Sonnet的训练成本是在千亿美元水平。尽管短期看效率提升非常惊艳,但过去LLM每年4倍的提效速度下当前仍处于正常的提升范畴。
    图片
    图片
  3. 多模态模型也不落后:目前DeepSeek在其推理模型上未整合多模态能力。但公司近期也发布了多模态的模型Janus-Pro,在部分测试中也展示出优越的效能。多模态能力整合进推理模型中,只是时间问题
图片
图片

我们的核心观点
  1. DeepSeek的出现说明中国企业有能力开发第一梯队的模型,且运算效率当下有倍数级领先。

  2. 美国为了取得竞争优势、营造公平的内部竞争环境,可能在数据和模型管制、芯片禁令等监管政策上加码,封堵离岸算力、芯片走私等漏洞。这会对算力芯片的TAM产生负面影响,但因此减少的海外市场的营收很可能会由美国及其盟友的增量需求弥补。

  3. 英伟达壁垒再受质疑,估值严重承压:Deepseek的两个特点,让市场开始质疑英伟达壁垒的牢固性:

    (1). 模型能快速部署到非英伟达平台进行推理:这是由于模型原本采用的基础算子通用性比较强,这也可能是由于Deepseek团队一早考虑到跨平台的特点。假如换一些更新更独特的模型算子,适配难度就会高很多。同时开源的模式也能第一时间让硬件厂家主动进行适配。

    (2). 所谓训练时抛弃CUDA,其实是部分通信模块直接越过CUDA编写更低级的PTX代码;这是为了充分压榨英伟达的硬件性能,比较耗费人力。而且进行底层开发,反而更难迁移到其他平台。

    但是,以上两点特性不具备普适性,Deepseek在训练上仍围绕英伟达芯片开发。推理层面英伟达本就不是必须。我们认为,Deepseek的推出并未直接改变英伟达的投资逻辑

    但在DeepSeek事件之外,随着AI编程能力的提升,未来有可能直接从底层的低级语言进行模型的开发和迁移,绕过CUDA生态。长期来看,我们需要考虑软件的生态壁垒问题,最终竞争或许回归到芯片的绝对硬件性能上

    短期来看,随着AI走向应用端叙事,可投的AI概念将从英伟达流向更广阔的中下游,市场的资金再分配将造成英伟达估值承压。但我们认为,英伟达过去两年的市值增长更多依赖收入抬升,随着GB200/GB300 NVL的出货问题解决,以及下代Rubin芯片的信息流出,未来股价将重回增长。而且,在AI不断爆发的背景下,目前26-27倍的远期PE并不算贵

  4. 接下来的AI投资机会在哪里?从英伟达跑出来的资金会去哪里?

    非英伟达的AI算力芯片公司值得关注。AI 训练和推理步入低成本新范式,使得 AI ASIC 芯片在算力系统可行性与竞争力方面优势凸显。博通、Marvell 等深耕 AI ASIC 领域的企业,具有较大潜力。

    从产业链角度看,模型竞争激烈,主要冲击应基本被限制在模型厂中。上游因话语权增加而获益,下游因成本下降而增利。而中游的基础设施会显著受益,能以更低成本提供AI服务。所以我们会看到,即便是与模型厂绑定较深的微软,一边跟着OpenAI调查DeepSeek是否存在违规“蒸馏”行为,另一边作为云服务商也主动部署低成本的R1到其平台中。亚马逊由于与模型厂绑定较少,基本没受到本次事件冲击。

    我们仍看好半导体板块的确定性机遇。特别是DeepSeek带来智能模型的小型化,有利于端侧设备部署。当前传统半导体需求仍处于缓慢复苏的周期,配合AI在应用端落地将是强有力的刺激。上游的台积电、下游端侧的苹果,都值得关注

    下游应用层面,我们更看好大中华的机会。特别是中国科技互联网巨头以及端侧供应链上的一些细分领域的龙头,目前在AI上的估值仍然较低。

总的来说,deepseek是AI科技革命中一个重要的里程碑事件。“AI应用潜力巨大,但高估值下脆弱性明显,25年美股或出现30%的回撤”。在目前高估值的环境下,每个人的神经都紧绷着,一点点的分歧都将引发市场的巨震。AI技术仍在飞速向前,但AI投资并非一路平坦,需十分警惕途中的风险!

大型峰会回顾

投资家网·第十三届中国资本年会

投资家网·第十二届股权投资年会

“万物资生 福启未来”第十一届中国股权投资年度峰会

2023上市公司智能产业对接会

2022第十四届中国高新技术产业投资峰会

智者谋远·2021中国股权投资年度峰会

2021第十三届中国高新技术产业投资峰会

涅槃重生——投资家网2020中国股权投资年度峰会

聚势待发——投资家网2019中国股权投资年度峰会

资本破局—2019中国基金合伙人(GPLP)峰会

回归价值投资—2018中国股权投资年度峰会

寻求报道:yangqin6060(微信)
商务合作:yangqin6060(微信)

展开
打开“财经头条”阅读更多精彩资讯
APP内打开