从Deep Seek开始,中概股开始价值重估?

20社

6小时前

作者|贾阳罗立璇。...一位国内头部AI公司人士表示,春节前老板在评估了R1的影响力后,开始犹豫是不是还要继续大模型上的投资。...在大洋彼案,DeepSeek“现象级”崛起,同样引发了市场对于美国AI主题股票的价值重估。

DeepSeek之所以成功的路径和土壤,不是神秘事件,而是可供我们做题家参考的成功模版。

全文共 3694 字,阅读大约需要 10 分钟

作者 | 贾阳  罗立璇

苹果选择阿里提供AI支持,在意料之外,又在情理之中。

这其中当然有很多考量,比如相较最近风头最盛的DeepSeek,阿里有更强的稳定运营能力。但最基本的原因还是,阿里的AI能力能够满足需求。

许多人一恍然,发现阿里在过去半个月,已经悄然而迅猛地估值修复,市值20日内已经上涨40%。

DeepSeek不是单点的奇兵,而是中国AI产业里跑得最快的一批中的佼佼者。DeepSeek,用最丝滑的系统性的工程创新,做出顶尖模型,把高性能显卡被锁这个不可战胜的困境,在心理层面打破了。

DeepSeek的成绩本身,就意味着很多事,它为整个国内AI产业的共识,引入了一种新的范式,以及最重要的信心。

这个认知,足以改变很多事情。而中国科技公司长久失落的估值,是这个新叙事中最先得到反馈的风向标。

不止有DeepSeeK,还有Qwen

最近DeepSeek呈现了猛烈的破圈势能,但闪光灯最中心以外,通义千问(Qwen)作为开源模型,也是由中国厂商主导的,在海外声誉最好的模型之一。

今年大年初一,阿里发布了他们目前性能最强的大模型Qwen2.5-Max。当日,阿里美股就开启大涨,涨幅6.7%,单日市值增长143.62亿美元。

市场的信心首先来源于,Qwen2.5-Max在各类榜单上,都呈现出卓越性能。

在测试大学水平知识的MMLU-Pro、评估编程能力的LiveCodeBench、全面评估综合能力的LiveBench,以及近似人类偏好的Arena-Hard等主流测评中,Qwen2.5-Max都取得了相对领先的成绩。

在Arena的榜单里,我们可以看到,排在Qwen2.5-Max之前的,就是OpenAI、谷歌和DeepSeek推出最新版本的产品,比如GPT-o1、Gemini2.0,和我们熟悉的DeepSeek R1。

性能以外,在开发者社区,作为少有的性能过硬的开源模型,测试也少不了使用Qwen,是重要的基座模型。

比如李飞飞等斯坦福大学和华盛顿大学研究人员发布的最新研究成果,只用了50美元的云计算费用训练出来的人工智能推理模型S1,就是用了Qwen2.5 32B参数作为基座模型,同时结合Gemini 2.0 Flash提供的1000个问答,微调创造出来的。

S1在数学和编码能力测试中的表现与OpenAl的o1和DeepSeek的R1等尖端推理模型类似,因而引发了热议。但是,如果没有Qwen在背后发挥效能,是训练不出来的。

这同时也说明了,如果进一步训练,Qwen也能够实现比现在水平更高的智能表现。优质参数越多的模型,越好训练,就相当于是训练一个小学生进行思考,还是训练一名博士生进行思考。

而且,和DeepSeek相比,Qwen能够提供的产品模式非常多,且都是开源。Qwen的参数范围从0.5B到72B都有,从手机端到云端都能跑,适配不同开发者的需求,初步具备在手机上实际使用的各项功能。

在过去的3个月,Qwen还陆续开源了推理模型QwQ、多模态推理模型QVQ、数学推理过程奖励模型Qwen2.5-Math-PRM、支持100万Tokens的长文本模型Qwen2.5-1M以及最新一代视觉理解模型Qwen2.5-VL。

以视觉理解模型为例,Qwen2.5-VL直接作为一个视觉智能体,可以推理并动态地使用工具,初步具备了使用电脑和使用手机的能力。

比如,它能理解超过1小时的长视频,在视频中搜索具体事件并总结不同时间段要点。不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局,并且进行相应内容输出。对于发票、表单、表格等数据,Qwen2.5-VL 支持其内容的结构化输出,惠及金融、商业等领域的应用。

换成人话,就是它能帮你识别你拍的照片、上传的资料,然后自动生成视频、表格、PPT。

DeepSeek十分惊艳,但中国AI产业的情况并非长夜中突降紫薇星,而是百舸争流的集群。相较于DeepSeek,Qwen的成本,我们不得而知,但这个同样开源的模型生态,提供了在参数相对齐平的情况下,能够被实际使用的产品结构。

传统的大厂AI商业逻辑被DeepSeek破坏

DeepSeek,用较低的成本达到了接近于GPT-o1的性能。打破了了全球AI产业长期以来“堆算力”的路径依赖,其影响波及了资本市场。

而DeepSeek的颠覆性,对国内以往与海外类似的“堆算力”、闭源搞壁垒的模式,对中国巨头同样是冲击。

比如阿里的技术重投入+投资广撒网重投入,对其以往的成本简直是一记重锤。2023年至2024年,阿里将国内估值超10亿美元的五大AI独角兽(月之暗面、智谱AI、Minimax、零一万物、百川智能)悉数收入囊中,几乎对整个赛道进行了地毯式覆盖。

阿里不差钱,可以不计成本去赌一个确定性。

但国内有中厂已决定撤退。

有媒体报道,去年年底,DeepSeek的最新开源大模型R1正式发布前,关于这个大模型“非常好用”的评价就在工程师之间流传,“如果老板知道了这事儿,恐怕春节大家都得加班”。

R1的发布给业界带来的震撼远超预期。一位国内头部AI公司人士表示,春节前老板在评估了R1的影响力后,开始犹豫是不是还要继续大模型上的投资。

在春节前后,关于DeepSeek的描述是,DeepSeek-R1以十分之一的成本达到了GPT-o1级别的表现。

该人士表示,国外的同行可能更关注开源模型以低得多的成本,达到了闭源模型的表现,而他认为对于国内业界来说,更重要的是,DeepSeek-R1率先实现了媲美OpenAI-o1模型的效果。

“之前国内大模型都达不到OpenAI的效果,但各家水平都差不多,所以大家都还能拿融资,但DeepSeek客观上起到了杀估值的作用,你就再没得可吹了。”

在大洋彼案,DeepSeek“现象级”崛起,同样引发了市场对于美国AI主题股票的价值重估。

R1发布一周后,英伟达股价大跌超过12%,微软、谷歌、Meta和亚马逊股价跌幅在4%至6%,1月27日,美股主要科技公司市值蒸发约上万亿美元。

出于对算力的信仰,微软、谷歌、Meta、亚马逊和特斯拉等美国科技巨头,近年来大手笔增加人工智能相关投资,其中2025年在人工智能领域总共投资预计约2000亿美元,用于数据中心建设,这些巨头企业的市值也水涨船高。

2月3日,大摩有关于2025年投资策略的闭门会中,也认为DeepSeek引发了市场对未来预期的调整,一方面是对于美国相关资产的重新估值,另一方面,是对于中国后发优势可能性的预期。

对于市场来说,美国AI股票已经太贵了,而中国人工智能产业链股票又足够便宜。由于外部环境带来的困难和不存定性,此前大摩给出了中国资产低配的投资建议。

DeepSeek带来了新的市场前景:中国AI将在2025年进入推广期。如果对比智能手机产业的发展,除了上游芯片,接下两个发展阶段会有两类公司受益,一类是包括AI手机、AI PC以及各种AI硬件,之后就是各类软件应用公司(可以对比一下当下的互联网公司)。

“DeepSeek在顷刻间的崛起表明,开发成本更低的强大AI模型是有可能实现的。”瑞士联合私立银行Union Bancaire Privee董事总经理Vey-Sern Ling表示,“这可能会打破整个AI供应链的投资格局,目前整个产业的上下游供应链是由少数超大规模企业的高额支出推动的。”

破而后立的曙光

DeepSeek,用最丝滑的系统性的工程创新,做出顶尖模型,把高性能显卡被锁这个不可战胜的困境,在心理层面打破了。用全本土学科背景的研究团队,把国内人才创新能力不足的刻板恐惧也打破了。

在美国媒体语境中掀起的“斯普特尼克时刻”呼声后,DeepSeek某种程度上扮演了一个大功率广播的角色,把所有人注意力牵引到了中国整个AI产业上来。

DeepSeek去年底接连发布V3、R1 和Janus-Pro模型后,国内其他雄心勃勃的团队也要来争夺闪光灯。而OpenAI o1,正如彼时的特斯拉、苹果,成了等待夺旗的高地。

1月20日,月之暗面发布k1.5多模态思考模型,对标o1正式版;1月22日,字节跳动发布豆包大模型1.5 Pro版本,采用新的MoE架构,降低推理时间和成本,全面提升了多模态能力;1月29日,通义千问旗舰版Qwen2.5-Max发布,在多个性能榜单上比肩DeepSeek-V3和OpenAI o1-mini。而就在2月11日,媒体报道称,苹果签约阿里成为其AI技术合作方。

事实上,在去年大模型价格战开启的过程中,有些团队转换了方向,而仍深耕大模型的团队有着非常相似的研发思路——那就是极尽所能的做工程学优化。改进模型架构、改进算法、优化通信,用一处又一处的小创新,把有限的算力榨干,来提升模型性能。

比如,今天字节发布其全新的稀疏模型架构UltraMem,就是与DeepSeek不约而同的思路,称推理速度相比MoE架构提升2-6倍,推理成本最高可降低83%。

DeepSeek的突破,以及这一波中国AI的春晚式“上桌”,用海豚投研的观点,对整个中概资产起到了“认知纠偏”的重要作用——

以往半导体等硬件创新才是被激励的,但DeepSeek证明硬件落后一定程度上能够从软件找补,软件的先进同样可以形成核心竞争力。

而这体现出的中国民营科技公司在更劣势环境下的生存能力,值得一场认知重估,甚至是比政策转向、宏观改善等外围Beta更有逻辑确定性的东西。

DeepSeek之所以成功的路径和土壤,不是神秘事件,而是可供做题家参考的成功模版。DeepSeek的成绩本身,就意味着很多事,它为国内AI产业的共识,引入了一种新的范式,以及最重要的信心。

而对更泛化的AI产业而言,更便宜、功能更强的模型,无疑将有助于AI应用的进一步开发和普及。

李飞飞团队的S1,简直是为未来小公司/团队应用高水平AI,打了一个样。但无论哪个国家的企业构建了最好和最广泛使用的模型,都将为其经济、国家安全和全球影响力带来回报。

这种叙事的变化直接反映在市场上。中国科技股以往的估值陷阱,一部分原因是缺乏海外资金、缺乏流动性,而今年春节以来,外部投资者对中国科技股的关注明显回升。

阿里市值20日涨幅已达到40%,腾讯20日涨幅达到20%,恒生科技指数的20日涨幅也达到了24%。

瑞士资产管理公司Gam Investment Management投资经理柯尔泰西(Jian Shi Cortesi)表示:“(DeepSeek)重新引起的关注,可能会让投资者对中国大型互联网公司的注意力,从‘更多考虑风险’转向‘更多考虑潜力’。”

德意志银行最新的中国股市策略报告称,DeepSeek是人工智能的“斯普特尼克时刻”,但这更像是中国经济的“斯普特尼克时刻”。中国股票的“估值折价”将消失。

送别你,我的互联网姐姐》

《白月梵星》领跑开年档,为什么品牌CNY营销要选择剧综

作者|贾阳罗立璇。...一位国内头部AI公司人士表示,春节前老板在评估了R1的影响力后,开始犹豫是不是还要继续大模型上的投资。...在大洋彼案,DeepSeek“现象级”崛起,同样引发了市场对于美国AI主题股票的价值重估。

DeepSeek之所以成功的路径和土壤,不是神秘事件,而是可供我们做题家参考的成功模版。

全文共 3694 字,阅读大约需要 10 分钟

作者 | 贾阳  罗立璇

苹果选择阿里提供AI支持,在意料之外,又在情理之中。

这其中当然有很多考量,比如相较最近风头最盛的DeepSeek,阿里有更强的稳定运营能力。但最基本的原因还是,阿里的AI能力能够满足需求。

许多人一恍然,发现阿里在过去半个月,已经悄然而迅猛地估值修复,市值20日内已经上涨40%。

DeepSeek不是单点的奇兵,而是中国AI产业里跑得最快的一批中的佼佼者。DeepSeek,用最丝滑的系统性的工程创新,做出顶尖模型,把高性能显卡被锁这个不可战胜的困境,在心理层面打破了。

DeepSeek的成绩本身,就意味着很多事,它为整个国内AI产业的共识,引入了一种新的范式,以及最重要的信心。

这个认知,足以改变很多事情。而中国科技公司长久失落的估值,是这个新叙事中最先得到反馈的风向标。

不止有DeepSeeK,还有Qwen

最近DeepSeek呈现了猛烈的破圈势能,但闪光灯最中心以外,通义千问(Qwen)作为开源模型,也是由中国厂商主导的,在海外声誉最好的模型之一。

今年大年初一,阿里发布了他们目前性能最强的大模型Qwen2.5-Max。当日,阿里美股就开启大涨,涨幅6.7%,单日市值增长143.62亿美元。

市场的信心首先来源于,Qwen2.5-Max在各类榜单上,都呈现出卓越性能。

在测试大学水平知识的MMLU-Pro、评估编程能力的LiveCodeBench、全面评估综合能力的LiveBench,以及近似人类偏好的Arena-Hard等主流测评中,Qwen2.5-Max都取得了相对领先的成绩。

在Arena的榜单里,我们可以看到,排在Qwen2.5-Max之前的,就是OpenAI、谷歌和DeepSeek推出最新版本的产品,比如GPT-o1、Gemini2.0,和我们熟悉的DeepSeek R1。

性能以外,在开发者社区,作为少有的性能过硬的开源模型,测试也少不了使用Qwen,是重要的基座模型。

比如李飞飞等斯坦福大学和华盛顿大学研究人员发布的最新研究成果,只用了50美元的云计算费用训练出来的人工智能推理模型S1,就是用了Qwen2.5 32B参数作为基座模型,同时结合Gemini 2.0 Flash提供的1000个问答,微调创造出来的。

S1在数学和编码能力测试中的表现与OpenAl的o1和DeepSeek的R1等尖端推理模型类似,因而引发了热议。但是,如果没有Qwen在背后发挥效能,是训练不出来的。

这同时也说明了,如果进一步训练,Qwen也能够实现比现在水平更高的智能表现。优质参数越多的模型,越好训练,就相当于是训练一个小学生进行思考,还是训练一名博士生进行思考。

而且,和DeepSeek相比,Qwen能够提供的产品模式非常多,且都是开源。Qwen的参数范围从0.5B到72B都有,从手机端到云端都能跑,适配不同开发者的需求,初步具备在手机上实际使用的各项功能。

在过去的3个月,Qwen还陆续开源了推理模型QwQ、多模态推理模型QVQ、数学推理过程奖励模型Qwen2.5-Math-PRM、支持100万Tokens的长文本模型Qwen2.5-1M以及最新一代视觉理解模型Qwen2.5-VL。

以视觉理解模型为例,Qwen2.5-VL直接作为一个视觉智能体,可以推理并动态地使用工具,初步具备了使用电脑和使用手机的能力。

比如,它能理解超过1小时的长视频,在视频中搜索具体事件并总结不同时间段要点。不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局,并且进行相应内容输出。对于发票、表单、表格等数据,Qwen2.5-VL 支持其内容的结构化输出,惠及金融、商业等领域的应用。

换成人话,就是它能帮你识别你拍的照片、上传的资料,然后自动生成视频、表格、PPT。

DeepSeek十分惊艳,但中国AI产业的情况并非长夜中突降紫薇星,而是百舸争流的集群。相较于DeepSeek,Qwen的成本,我们不得而知,但这个同样开源的模型生态,提供了在参数相对齐平的情况下,能够被实际使用的产品结构。

传统的大厂AI商业逻辑被DeepSeek破坏

DeepSeek,用较低的成本达到了接近于GPT-o1的性能。打破了了全球AI产业长期以来“堆算力”的路径依赖,其影响波及了资本市场。

而DeepSeek的颠覆性,对国内以往与海外类似的“堆算力”、闭源搞壁垒的模式,对中国巨头同样是冲击。

比如阿里的技术重投入+投资广撒网重投入,对其以往的成本简直是一记重锤。2023年至2024年,阿里将国内估值超10亿美元的五大AI独角兽(月之暗面、智谱AI、Minimax、零一万物、百川智能)悉数收入囊中,几乎对整个赛道进行了地毯式覆盖。

阿里不差钱,可以不计成本去赌一个确定性。

但国内有中厂已决定撤退。

有媒体报道,去年年底,DeepSeek的最新开源大模型R1正式发布前,关于这个大模型“非常好用”的评价就在工程师之间流传,“如果老板知道了这事儿,恐怕春节大家都得加班”。

R1的发布给业界带来的震撼远超预期。一位国内头部AI公司人士表示,春节前老板在评估了R1的影响力后,开始犹豫是不是还要继续大模型上的投资。

在春节前后,关于DeepSeek的描述是,DeepSeek-R1以十分之一的成本达到了GPT-o1级别的表现。

该人士表示,国外的同行可能更关注开源模型以低得多的成本,达到了闭源模型的表现,而他认为对于国内业界来说,更重要的是,DeepSeek-R1率先实现了媲美OpenAI-o1模型的效果。

“之前国内大模型都达不到OpenAI的效果,但各家水平都差不多,所以大家都还能拿融资,但DeepSeek客观上起到了杀估值的作用,你就再没得可吹了。”

在大洋彼案,DeepSeek“现象级”崛起,同样引发了市场对于美国AI主题股票的价值重估。

R1发布一周后,英伟达股价大跌超过12%,微软、谷歌、Meta和亚马逊股价跌幅在4%至6%,1月27日,美股主要科技公司市值蒸发约上万亿美元。

出于对算力的信仰,微软、谷歌、Meta、亚马逊和特斯拉等美国科技巨头,近年来大手笔增加人工智能相关投资,其中2025年在人工智能领域总共投资预计约2000亿美元,用于数据中心建设,这些巨头企业的市值也水涨船高。

2月3日,大摩有关于2025年投资策略的闭门会中,也认为DeepSeek引发了市场对未来预期的调整,一方面是对于美国相关资产的重新估值,另一方面,是对于中国后发优势可能性的预期。

对于市场来说,美国AI股票已经太贵了,而中国人工智能产业链股票又足够便宜。由于外部环境带来的困难和不存定性,此前大摩给出了中国资产低配的投资建议。

DeepSeek带来了新的市场前景:中国AI将在2025年进入推广期。如果对比智能手机产业的发展,除了上游芯片,接下两个发展阶段会有两类公司受益,一类是包括AI手机、AI PC以及各种AI硬件,之后就是各类软件应用公司(可以对比一下当下的互联网公司)。

“DeepSeek在顷刻间的崛起表明,开发成本更低的强大AI模型是有可能实现的。”瑞士联合私立银行Union Bancaire Privee董事总经理Vey-Sern Ling表示,“这可能会打破整个AI供应链的投资格局,目前整个产业的上下游供应链是由少数超大规模企业的高额支出推动的。”

破而后立的曙光

DeepSeek,用最丝滑的系统性的工程创新,做出顶尖模型,把高性能显卡被锁这个不可战胜的困境,在心理层面打破了。用全本土学科背景的研究团队,把国内人才创新能力不足的刻板恐惧也打破了。

在美国媒体语境中掀起的“斯普特尼克时刻”呼声后,DeepSeek某种程度上扮演了一个大功率广播的角色,把所有人注意力牵引到了中国整个AI产业上来。

DeepSeek去年底接连发布V3、R1 和Janus-Pro模型后,国内其他雄心勃勃的团队也要来争夺闪光灯。而OpenAI o1,正如彼时的特斯拉、苹果,成了等待夺旗的高地。

1月20日,月之暗面发布k1.5多模态思考模型,对标o1正式版;1月22日,字节跳动发布豆包大模型1.5 Pro版本,采用新的MoE架构,降低推理时间和成本,全面提升了多模态能力;1月29日,通义千问旗舰版Qwen2.5-Max发布,在多个性能榜单上比肩DeepSeek-V3和OpenAI o1-mini。而就在2月11日,媒体报道称,苹果签约阿里成为其AI技术合作方。

事实上,在去年大模型价格战开启的过程中,有些团队转换了方向,而仍深耕大模型的团队有着非常相似的研发思路——那就是极尽所能的做工程学优化。改进模型架构、改进算法、优化通信,用一处又一处的小创新,把有限的算力榨干,来提升模型性能。

比如,今天字节发布其全新的稀疏模型架构UltraMem,就是与DeepSeek不约而同的思路,称推理速度相比MoE架构提升2-6倍,推理成本最高可降低83%。

DeepSeek的突破,以及这一波中国AI的春晚式“上桌”,用海豚投研的观点,对整个中概资产起到了“认知纠偏”的重要作用——

以往半导体等硬件创新才是被激励的,但DeepSeek证明硬件落后一定程度上能够从软件找补,软件的先进同样可以形成核心竞争力。

而这体现出的中国民营科技公司在更劣势环境下的生存能力,值得一场认知重估,甚至是比政策转向、宏观改善等外围Beta更有逻辑确定性的东西。

DeepSeek之所以成功的路径和土壤,不是神秘事件,而是可供做题家参考的成功模版。DeepSeek的成绩本身,就意味着很多事,它为国内AI产业的共识,引入了一种新的范式,以及最重要的信心。

而对更泛化的AI产业而言,更便宜、功能更强的模型,无疑将有助于AI应用的进一步开发和普及。

李飞飞团队的S1,简直是为未来小公司/团队应用高水平AI,打了一个样。但无论哪个国家的企业构建了最好和最广泛使用的模型,都将为其经济、国家安全和全球影响力带来回报。

这种叙事的变化直接反映在市场上。中国科技股以往的估值陷阱,一部分原因是缺乏海外资金、缺乏流动性,而今年春节以来,外部投资者对中国科技股的关注明显回升。

阿里市值20日涨幅已达到40%,腾讯20日涨幅达到20%,恒生科技指数的20日涨幅也达到了24%。

瑞士资产管理公司Gam Investment Management投资经理柯尔泰西(Jian Shi Cortesi)表示:“(DeepSeek)重新引起的关注,可能会让投资者对中国大型互联网公司的注意力,从‘更多考虑风险’转向‘更多考虑潜力’。”

德意志银行最新的中国股市策略报告称,DeepSeek是人工智能的“斯普特尼克时刻”,但这更像是中国经济的“斯普特尼克时刻”。中国股票的“估值折价”将消失。

送别你,我的互联网姐姐》

《白月梵星》领跑开年档,为什么品牌CNY营销要选择剧综

展开
打开“财经头条”阅读更多精彩资讯
APP内打开