主持:
马嘉悦刘怡鹤
圆桌嘉宾:
上海市数据科学重点实验室主任肖仰华
优刻得董事长季昕华
广发基金国际业务部总经理李耀柱
星石投资副总经理、首席策略投资官方磊
DeepSeek的横空出世,不仅让中国的科技产业为之振奋,还掀起了全球资本重新评估中国科技企业价值的浪潮。对于中国乃至全球AI大模型的发展和应用,DeepSeek的成果和模式有什么重要意义?DeepSeek将如何带动AI产业链上下游,并催生新的投资机遇?是否会系统性重构中国科技资产的估值体系?
本期“上证圆桌”邀请上海市数据科学重点实验室主任肖仰华,优刻得董事长季昕华,广发基金国际业务部总经理李耀柱,星石投资副总经理、首席策略投资官方磊,对上述问题展开探讨。
DeepSeek重塑全球AI产业格局
上海证券报:DeepSeek最核心的创新是什么?为何能引发全球关注?
肖仰华:根据公开技术文档与论文披露,DeepSeek的突破集中在两大维度:
一是低成本架构创新,通过分布式训练优化与算法重构,将大模型训练成本压缩至数百万美元量级,对比OpenAI动辄数亿美元的训练投入,降低了1到2个数量级。
二是强化学习驱动的长思维路径,首创基于强化学习的复杂推理框架,在数学证明、多步决策等任务中达到OpenAI o1的表现,且推理成本显著下降。该技术路径完全区别于OpenAI的监督微调范式。此外,从DeepSeek的生成文本质量来看,DeepSeek在语料工程方面也是可圈可点,尤其是独到的语料工程路径。
DeepSeek的突破,加速了先进AI技术普惠化进程。低成本训练技术使DeepSeek能够推进开源战略,在推广方面全球用户可以免费注册使用,真正意义上实现了全民应用。
季昕华:技术层面,DeepSeek在算法、算力和工程方面实现了极致优化。其自研的多头潜在注意力(MLA)、混合专家模型(MoE)、强化学习(RL)等技术突破了传统架构的瓶颈,DeepSeek-R1在某些性能表现上可媲美闭源模型OpenAI o1,让人们真切意识到中国AI技术的强大实力。
经济层面,DeepSeek主要依托MoE的模型架构进行模型性能优化,从而在训练层面减少了对高性能硬件的依赖,使中小企业创新、传统企业智能化转型能够以更低的成本进行部署运行,并将大量资金和人力成本投入到AI应用的商业化落地和推广,实现模型平权,推动普惠AI。
战略层面,过去外界认为中国的AI进展落后美国2年,但DeepSeek将差距缩短到了3到9个月,中国甚至在某些方面更强。中国在大模型领域的独立技术路径,打破了美国在AI基础技术领域的垄断格局,让全球重新看待中国的AI能力、科技创新能力。
李耀柱:DeepSeek通过硬件层面以及大模型训练方法层面的创新,以相当于同行大约十分之一的成本成功训练出性能对齐OpenAI o1的模型,并且遵循MIT许可证完全开源。随着DeepSeek的成功,“AI大模型训练只是国际巨头的游戏,中国只是跟随者”的认知首次出现松动。此举也改变了开源落后闭源模型,以及AI训练一味追求“暴力堆叠算力出奇迹”的传统思维,促使科技企业重新审视自身发展AI的方式。DeepSeek R1模型还首次打破“安全、好用、低成本”的不可能三角形,降低了普通人使用最先进大模型的门槛。
上海证券报:在模型迭代、加快应用、带动产业链发展等方面,DeepSeek带来了哪些影响?DeepSeek对全球AI大模型的市场竞争格局产生了什么影响?
肖仰华:开创开源模型新纪元。DeepSeek首次实现开源大模型达到闭源商业模型的实用效果,这一突破具有里程碑意义。通过开放技术生态,既降低了AI技术的应用门槛,又保障了核心性能指标,真正推动人工智能技术走向普惠化,也将加速AI技术在各行业的渗透应用。
完善大模型产业生态。DeepSeek标志着我国基本建成从基础算力供给到先进基础模型,再到产业应用的完整生态。此前,我国缺乏国际顶尖先进基础模型。这缺失一环的补足对于健全完整的大模型生态具有全局战略意义。
加速行业落地应用。在DeepSeek的复杂思维能力基础上,有望进一步突破“专业化思维”等大模型行业落地难题。通过模拟各行业专家的决策逻辑和问题解决路径,DeepSeek有望在复杂场景中展现出“类专家”的推理能力。经特定领域优化后,可承担专业顾问角色,从根本上解决大模型行业适配性不足的痛点,为大模型的行业应用扫清障碍。
当前大模型技术正处于突破行业应用瓶颈的关键阶段。尽管此前受限于模型能力不足与部署成本高昂,高价值行业场景的深度应用尚未完全展开,但法律咨询、医疗健康、心理干预等领域已显现明确需求——这些行业普遍存在专家资源稀缺、服务成本居高不下、优质服务供给不足等结构性痛点。在DeepSeek基础模型的基础上,通过聚焦垂直场景的定制化优化与开发,结合知识增强、领域微调等技术手段,可能构建出比传统服务模式更具性价比优势的智能解决方案。这类切实解决产业痛点的应用将成为资本重点关注方向。
季昕华:DeepSeek的技术和开源模式为AI应用落地提供了强有力支持:
一是降低建设成本。通过模型蒸馏和优化,DeepSeek系列模型显著降低了AI模型的部署和运行成本,使更多中小企业能够负担得起AI技术。
二是多场景覆盖。DeepSeek开源版模型和蒸馏版模型可支持从1.5B轻量级到671B的满血版的不同参数量级,能满足智能终端、边缘计算、企业级应用和前沿研究等多种场景的需求。
三是推动行业创新。DeepSeek的开源模型为开发者提供了灵活的工具,使他们能够结合跨行业场景和需求,基于这些模型进行二次开发和创新,从而进一步拓展AI技术的应用边界,提升行业效率。
对于AI产业链而言,DeepSeek大幅降低了训练算力的需求,推动企业将更多预算投入到AI应用创新,推理环节的算力需求和配套的云服务需求将得到激发。DeepSeek大模型“低成本+高效能”的特点,还表明有限算力也能够实现较强的模型能力,有望为国产算力发展带来新机遇。
目前,优刻得已同多家国产芯片厂商完成了对DeepSeek满血版和蒸馏版开源模型的适配工作。从测试的用户结果来看,现在可以用起来了。后续优刻得也会继续同国产芯片公司合作,在“能用”的基础上进行优化,达到“好用”,通过使用量的扩大降低成本,实现“便宜用”,提升全国产的体验。
李耀柱:DeepSeek的崛起标志着AI大模型竞争从“算力驱动”向“效率优化”转变,并且重新审视模型训练算法的优化及数据质量。
中国在高质量数据和产业落地上的优势,使DeepSeek在中文理解和行业应用方面具备竞争力。从市场格局来看,未来AI竞争的核心不再是堆算力,而是更加强调算法的优化和数据质量。未来AI应用落地,推动各个领域提高效率是关键。DeepSeek的成功提升了中国AI产业链的竞争力,同时也推动了全球AI技术的发展,我们相信AI的发展将比想象中更快。
方磊:一方面,DeepSeek的技术突破,可能会加快其他大模型的技术更迭;另一方面,DeepSeek在性价比上具有优势,对垂直领域的AI大模型突破也有推动作用,各行业专用大模型或迎来较大发展。此外,DeepSeek在一定程度上破除了中国AI应用发展在模型能力和算力方面的掣肘,极大地增加了中国企业后续的竞争潜力,DeepSeek等中国企业在AI领域的国际话语权有望逐步增加。
DeepSeek有望带来整个AI产业链的繁荣发展,算力基础建设和应用端都有新的机遇。算力方面,虽然DeepSeek减小了单个产品所需的算力,但算力的需求个体增加,这意味着总需求大概率将持续增加,叠加我国算力基建国产替代有望加速,算力领域将出现新的变化。另一方面,DeepSeek的高性价比增强了应用落地、应用更迭升级及商业化的可能性,应用端有望迸发更多活力。
DeepSeek催生产业链投资新机遇
上海证券报:DeepSeek降低了算力和AI应用的门槛,对一些公司的投资逻辑因此发生了改变。DeepSeek的成果是否会系统性重构中国科技资产的估值体系?
李耀柱:中国科技股的估值重估已经开始,具有数据和用户的公司有望持续受益。中长期来看,中国的云提供商、互联网公司、芯片公司预期未来会有较好的投资机会。
展望未来,可以关注两大方向:第一,推理端算力需求正在扩大。用户调用接口获取模型推理结果,对芯片仍然有需求,但对预训练端高性能GPU的依赖有所降低,这能让中端的半导体公司在推理端芯片市场获取一定的市场份额,但整体市场仍以高端半导体公司为主导。
第二,数据生成端的重要性将进一步提升。模型智能化的前提是使用高质量的数据训练,包括合成数据等多种数据类型,而生成这些数据同样需要高效的芯片支持。当数据积累达到一定规模后,反过来又会增加对预训练算力的需求。在这个动态循环中,市场对算力的长期需求是相对确定的。
这种演化形成了一个“飞轮效应”——越来越多使用AI的企业产出更多高质量数据,然后把这些数据添加至模型训练端,进而促进模型迭代升级、推动模型参数规模的扩大,从而带动更强的算力需求,然后又产生更多高质量数据,这样的“飞轮效应”可以让AI模型持续升级。
在这一过程中,中国的企业在应用落地和强化学习数据生成端展现出了竞争力,能够切入部分市场份额。尤其是中国的互联网公司、科技企业、自动驾驶公司等,依靠深厚的数据积累和业务场景,将更好地利用DeepSeek等AI模型优化内部效率,甚至催生新的商业模式。AI技术在这些企业中的渗透,会进一步推动整个产业链的发展。
方磊:长期以来,以Mag7(7家市值最大的美国科技公司)为首的美国科技股得到全球资金青睐,相较而言,做相似业务的中国企业表现为估值折价。DeepSeek增强了市场对中国科技创新能力和产业发展潜力的信心,有助于推动中国科技资产估值中枢上移,中国科技资产有望从估值折价走向估值平价甚至溢价。
上海证券报:随着大模型能力有了新的提升,AI应用是否会成为算力之后的又一个投资风口?哪些应用方向值得关注?
李耀柱:DeepSeek的横空出世,使大模型训练和推理成本下降成为可能,AI将真正进入产业应用期。AI的投资逻辑正从“算力驱动”向“应用落地”转变,AI应用有望成为新的投资风口。
具体来看,相比早期以数据处理、文本生成为主的1.0阶段,AI正在向2.0迈进,未来核心在于“多模态”能力,如AI如何与物理世界结合,实现自动驾驶、智能机器人、工业智能化等,相关的深层次应用值得关注。
英伟达的COSMOS世界基础模型计划,便是通过模拟现实物理环境,让AI在虚拟世界中学习和优化现实世界的决策,例如优化物流路径、提高自动驾驶系统的训练效率等。这种方式弥补了当前AI依赖书本和数据等单一训练数据的局限,让AI可以在多种数据形态下“感受世界”,从而实现更智能的决策。类似的逻辑也将体现在中国AI与制造、医疗、能源等行业的结合上,带动整个产业链的升级。
方磊:DeepSeek的成功,可能会改变市场对AI细分领域的投资逻辑。降本是科技发展的必由之路,人工智能领域也不例外。DeepSeek坚持开源路线,高性价比增强了应用落地、应用更迭升级及商业化的可能性。
具体到投资机会,随着国内大模型追平世界领先水平,参与门槛的降低意味着国内超大市场和海量数据有望带来应用端的领先优势,AI应用具有较大的发展潜力和成长空间,方向上可以关注数据服务、内容服务以及与其他实体行业融合的垂直应用。
肖仰华:当前人工智能产业在数据、算力、模型三大核心领域仍存在显著投资机遇。其中,数据层面,通过架构创新与数据精选策略,有望以更低成本训练出同等能力的大模型;模型层面,世界模型、垂直领域专业模型(如具备时空推理、因果逻辑能力的科学大模型)正成为技术突破方向。与此同时,大模型的高效推理、低幻觉、安全可控等特性优化,仍是资本关注的技术攻坚重点。
尽管大模型在解决“最后一公里”应用落地上仍需突破,但伴随中国科技公司在多模态、复杂场景理解等领域的快速追赶,AI应用在降本增效、专业场景深化等方面已显现潜力,或将引领下一个投资风口。
警惕相关投资风险
上海证券报:近期市场对于DeepSeek的关注度持续上升,有哪些市场判断需要审慎对待?
李耀柱:首先,市场对于部分没有收益、纯属主题炒作的公司给予太高预期,相关公司蕴含估值虚高的风险。目前DeepSeek和其他大模型仍然基于Transformer大架构,2025年关注的话题是谁可以找到替代Transformer的结构,DeepSeek探索的技术方向值得关注。
其次,关于AI应用在什么领域出现爆款并没有达成共识,所以应用的爆发方向仍然具有不确定性,需要持续跟踪和观察。
再其次,在技术层面,基于强化学习的大模型,本质上是基于规则设计的,未来能否设计出评判模型输出质量的奖励机制是关键。未来,在非数学和非编程等不易于定义结果对错以及不易定义规则的领域,强化学习模型的进一步迭代可能会遇到挑战。因此,技术的迭代还在继续,并没有达到稳态水平。我们认为,深入关注技术的发展方向是未来做好投资的重要因素之一。
最后,市场对DeepSeek在预训练阶段的悲观看法也可能存在一定误解。从DeepSeek的论文可以看出,优化方程仍然希望最小化“经过强化学习调整后的模型”与调整前模型的差距,这代表着DeepSeek希望强化学习所在的后训练阶段仅仅微调模型,前一阶段靠冷启动预训练的基座模型很重要,所以对于算力资源仍然有较大需求。同时,用于冷启动的数据质量非常重要,代表着基座模型和预训练仍然重要。我们认为,未来算力资源和高质量数据的方向仍然有不错的长期投资机会。
方磊:长期来看,DeepSeek对于AI产业链影响较为深远,AI相关投资逻辑有望由海外映射转为国内产业发展驱动,由偏主题炒作转为基本面投资。值得注意的是,当前这种转化还在最初期阶段,目前全球范围内人工智能产业链的商业化途径尚不成熟,A股上市公司与AI相关产品的收入占公司营业收入的占比较低,后续依托DeepSeek模型打造的产品研发和场景落地进度仍具有不确定性。
考虑到股市通常会领先于基本面反应,目前不少AI相关标的已经按照行业具有较成熟产品和盈利模式的标准来进行估值定价。这类资产价格对未来的透支性较大,情绪对股价的影响阶段性放大。在当前环境下,我们认为在关注投资热点的同时,也需要关注投资机会的性价比,尽量选择那些具有更好投资风险收益比的机会。
具体而言,投资者可密切关注AI产业发展趋势,以及AI技术快速迭代带来的基本面变化。重点关注具有真实应用场景、商业化前景和基本面较好的企业,并根据自身的风险偏好和投资能力,进行多元化布局和长期投资。
(文章来源:上海证券报)
主持:
马嘉悦刘怡鹤
圆桌嘉宾:
上海市数据科学重点实验室主任肖仰华
优刻得董事长季昕华
广发基金国际业务部总经理李耀柱
星石投资副总经理、首席策略投资官方磊
DeepSeek的横空出世,不仅让中国的科技产业为之振奋,还掀起了全球资本重新评估中国科技企业价值的浪潮。对于中国乃至全球AI大模型的发展和应用,DeepSeek的成果和模式有什么重要意义?DeepSeek将如何带动AI产业链上下游,并催生新的投资机遇?是否会系统性重构中国科技资产的估值体系?
本期“上证圆桌”邀请上海市数据科学重点实验室主任肖仰华,优刻得董事长季昕华,广发基金国际业务部总经理李耀柱,星石投资副总经理、首席策略投资官方磊,对上述问题展开探讨。
DeepSeek重塑全球AI产业格局
上海证券报:DeepSeek最核心的创新是什么?为何能引发全球关注?
肖仰华:根据公开技术文档与论文披露,DeepSeek的突破集中在两大维度:
一是低成本架构创新,通过分布式训练优化与算法重构,将大模型训练成本压缩至数百万美元量级,对比OpenAI动辄数亿美元的训练投入,降低了1到2个数量级。
二是强化学习驱动的长思维路径,首创基于强化学习的复杂推理框架,在数学证明、多步决策等任务中达到OpenAI o1的表现,且推理成本显著下降。该技术路径完全区别于OpenAI的监督微调范式。此外,从DeepSeek的生成文本质量来看,DeepSeek在语料工程方面也是可圈可点,尤其是独到的语料工程路径。
DeepSeek的突破,加速了先进AI技术普惠化进程。低成本训练技术使DeepSeek能够推进开源战略,在推广方面全球用户可以免费注册使用,真正意义上实现了全民应用。
季昕华:技术层面,DeepSeek在算法、算力和工程方面实现了极致优化。其自研的多头潜在注意力(MLA)、混合专家模型(MoE)、强化学习(RL)等技术突破了传统架构的瓶颈,DeepSeek-R1在某些性能表现上可媲美闭源模型OpenAI o1,让人们真切意识到中国AI技术的强大实力。
经济层面,DeepSeek主要依托MoE的模型架构进行模型性能优化,从而在训练层面减少了对高性能硬件的依赖,使中小企业创新、传统企业智能化转型能够以更低的成本进行部署运行,并将大量资金和人力成本投入到AI应用的商业化落地和推广,实现模型平权,推动普惠AI。
战略层面,过去外界认为中国的AI进展落后美国2年,但DeepSeek将差距缩短到了3到9个月,中国甚至在某些方面更强。中国在大模型领域的独立技术路径,打破了美国在AI基础技术领域的垄断格局,让全球重新看待中国的AI能力、科技创新能力。
李耀柱:DeepSeek通过硬件层面以及大模型训练方法层面的创新,以相当于同行大约十分之一的成本成功训练出性能对齐OpenAI o1的模型,并且遵循MIT许可证完全开源。随着DeepSeek的成功,“AI大模型训练只是国际巨头的游戏,中国只是跟随者”的认知首次出现松动。此举也改变了开源落后闭源模型,以及AI训练一味追求“暴力堆叠算力出奇迹”的传统思维,促使科技企业重新审视自身发展AI的方式。DeepSeek R1模型还首次打破“安全、好用、低成本”的不可能三角形,降低了普通人使用最先进大模型的门槛。
上海证券报:在模型迭代、加快应用、带动产业链发展等方面,DeepSeek带来了哪些影响?DeepSeek对全球AI大模型的市场竞争格局产生了什么影响?
肖仰华:开创开源模型新纪元。DeepSeek首次实现开源大模型达到闭源商业模型的实用效果,这一突破具有里程碑意义。通过开放技术生态,既降低了AI技术的应用门槛,又保障了核心性能指标,真正推动人工智能技术走向普惠化,也将加速AI技术在各行业的渗透应用。
完善大模型产业生态。DeepSeek标志着我国基本建成从基础算力供给到先进基础模型,再到产业应用的完整生态。此前,我国缺乏国际顶尖先进基础模型。这缺失一环的补足对于健全完整的大模型生态具有全局战略意义。
加速行业落地应用。在DeepSeek的复杂思维能力基础上,有望进一步突破“专业化思维”等大模型行业落地难题。通过模拟各行业专家的决策逻辑和问题解决路径,DeepSeek有望在复杂场景中展现出“类专家”的推理能力。经特定领域优化后,可承担专业顾问角色,从根本上解决大模型行业适配性不足的痛点,为大模型的行业应用扫清障碍。
当前大模型技术正处于突破行业应用瓶颈的关键阶段。尽管此前受限于模型能力不足与部署成本高昂,高价值行业场景的深度应用尚未完全展开,但法律咨询、医疗健康、心理干预等领域已显现明确需求——这些行业普遍存在专家资源稀缺、服务成本居高不下、优质服务供给不足等结构性痛点。在DeepSeek基础模型的基础上,通过聚焦垂直场景的定制化优化与开发,结合知识增强、领域微调等技术手段,可能构建出比传统服务模式更具性价比优势的智能解决方案。这类切实解决产业痛点的应用将成为资本重点关注方向。
季昕华:DeepSeek的技术和开源模式为AI应用落地提供了强有力支持:
一是降低建设成本。通过模型蒸馏和优化,DeepSeek系列模型显著降低了AI模型的部署和运行成本,使更多中小企业能够负担得起AI技术。
二是多场景覆盖。DeepSeek开源版模型和蒸馏版模型可支持从1.5B轻量级到671B的满血版的不同参数量级,能满足智能终端、边缘计算、企业级应用和前沿研究等多种场景的需求。
三是推动行业创新。DeepSeek的开源模型为开发者提供了灵活的工具,使他们能够结合跨行业场景和需求,基于这些模型进行二次开发和创新,从而进一步拓展AI技术的应用边界,提升行业效率。
对于AI产业链而言,DeepSeek大幅降低了训练算力的需求,推动企业将更多预算投入到AI应用创新,推理环节的算力需求和配套的云服务需求将得到激发。DeepSeek大模型“低成本+高效能”的特点,还表明有限算力也能够实现较强的模型能力,有望为国产算力发展带来新机遇。
目前,优刻得已同多家国产芯片厂商完成了对DeepSeek满血版和蒸馏版开源模型的适配工作。从测试的用户结果来看,现在可以用起来了。后续优刻得也会继续同国产芯片公司合作,在“能用”的基础上进行优化,达到“好用”,通过使用量的扩大降低成本,实现“便宜用”,提升全国产的体验。
李耀柱:DeepSeek的崛起标志着AI大模型竞争从“算力驱动”向“效率优化”转变,并且重新审视模型训练算法的优化及数据质量。
中国在高质量数据和产业落地上的优势,使DeepSeek在中文理解和行业应用方面具备竞争力。从市场格局来看,未来AI竞争的核心不再是堆算力,而是更加强调算法的优化和数据质量。未来AI应用落地,推动各个领域提高效率是关键。DeepSeek的成功提升了中国AI产业链的竞争力,同时也推动了全球AI技术的发展,我们相信AI的发展将比想象中更快。
方磊:一方面,DeepSeek的技术突破,可能会加快其他大模型的技术更迭;另一方面,DeepSeek在性价比上具有优势,对垂直领域的AI大模型突破也有推动作用,各行业专用大模型或迎来较大发展。此外,DeepSeek在一定程度上破除了中国AI应用发展在模型能力和算力方面的掣肘,极大地增加了中国企业后续的竞争潜力,DeepSeek等中国企业在AI领域的国际话语权有望逐步增加。
DeepSeek有望带来整个AI产业链的繁荣发展,算力基础建设和应用端都有新的机遇。算力方面,虽然DeepSeek减小了单个产品所需的算力,但算力的需求个体增加,这意味着总需求大概率将持续增加,叠加我国算力基建国产替代有望加速,算力领域将出现新的变化。另一方面,DeepSeek的高性价比增强了应用落地、应用更迭升级及商业化的可能性,应用端有望迸发更多活力。
DeepSeek催生产业链投资新机遇
上海证券报:DeepSeek降低了算力和AI应用的门槛,对一些公司的投资逻辑因此发生了改变。DeepSeek的成果是否会系统性重构中国科技资产的估值体系?
李耀柱:中国科技股的估值重估已经开始,具有数据和用户的公司有望持续受益。中长期来看,中国的云提供商、互联网公司、芯片公司预期未来会有较好的投资机会。
展望未来,可以关注两大方向:第一,推理端算力需求正在扩大。用户调用接口获取模型推理结果,对芯片仍然有需求,但对预训练端高性能GPU的依赖有所降低,这能让中端的半导体公司在推理端芯片市场获取一定的市场份额,但整体市场仍以高端半导体公司为主导。
第二,数据生成端的重要性将进一步提升。模型智能化的前提是使用高质量的数据训练,包括合成数据等多种数据类型,而生成这些数据同样需要高效的芯片支持。当数据积累达到一定规模后,反过来又会增加对预训练算力的需求。在这个动态循环中,市场对算力的长期需求是相对确定的。
这种演化形成了一个“飞轮效应”——越来越多使用AI的企业产出更多高质量数据,然后把这些数据添加至模型训练端,进而促进模型迭代升级、推动模型参数规模的扩大,从而带动更强的算力需求,然后又产生更多高质量数据,这样的“飞轮效应”可以让AI模型持续升级。
在这一过程中,中国的企业在应用落地和强化学习数据生成端展现出了竞争力,能够切入部分市场份额。尤其是中国的互联网公司、科技企业、自动驾驶公司等,依靠深厚的数据积累和业务场景,将更好地利用DeepSeek等AI模型优化内部效率,甚至催生新的商业模式。AI技术在这些企业中的渗透,会进一步推动整个产业链的发展。
方磊:长期以来,以Mag7(7家市值最大的美国科技公司)为首的美国科技股得到全球资金青睐,相较而言,做相似业务的中国企业表现为估值折价。DeepSeek增强了市场对中国科技创新能力和产业发展潜力的信心,有助于推动中国科技资产估值中枢上移,中国科技资产有望从估值折价走向估值平价甚至溢价。
上海证券报:随着大模型能力有了新的提升,AI应用是否会成为算力之后的又一个投资风口?哪些应用方向值得关注?
李耀柱:DeepSeek的横空出世,使大模型训练和推理成本下降成为可能,AI将真正进入产业应用期。AI的投资逻辑正从“算力驱动”向“应用落地”转变,AI应用有望成为新的投资风口。
具体来看,相比早期以数据处理、文本生成为主的1.0阶段,AI正在向2.0迈进,未来核心在于“多模态”能力,如AI如何与物理世界结合,实现自动驾驶、智能机器人、工业智能化等,相关的深层次应用值得关注。
英伟达的COSMOS世界基础模型计划,便是通过模拟现实物理环境,让AI在虚拟世界中学习和优化现实世界的决策,例如优化物流路径、提高自动驾驶系统的训练效率等。这种方式弥补了当前AI依赖书本和数据等单一训练数据的局限,让AI可以在多种数据形态下“感受世界”,从而实现更智能的决策。类似的逻辑也将体现在中国AI与制造、医疗、能源等行业的结合上,带动整个产业链的升级。
方磊:DeepSeek的成功,可能会改变市场对AI细分领域的投资逻辑。降本是科技发展的必由之路,人工智能领域也不例外。DeepSeek坚持开源路线,高性价比增强了应用落地、应用更迭升级及商业化的可能性。
具体到投资机会,随着国内大模型追平世界领先水平,参与门槛的降低意味着国内超大市场和海量数据有望带来应用端的领先优势,AI应用具有较大的发展潜力和成长空间,方向上可以关注数据服务、内容服务以及与其他实体行业融合的垂直应用。
肖仰华:当前人工智能产业在数据、算力、模型三大核心领域仍存在显著投资机遇。其中,数据层面,通过架构创新与数据精选策略,有望以更低成本训练出同等能力的大模型;模型层面,世界模型、垂直领域专业模型(如具备时空推理、因果逻辑能力的科学大模型)正成为技术突破方向。与此同时,大模型的高效推理、低幻觉、安全可控等特性优化,仍是资本关注的技术攻坚重点。
尽管大模型在解决“最后一公里”应用落地上仍需突破,但伴随中国科技公司在多模态、复杂场景理解等领域的快速追赶,AI应用在降本增效、专业场景深化等方面已显现潜力,或将引领下一个投资风口。
警惕相关投资风险
上海证券报:近期市场对于DeepSeek的关注度持续上升,有哪些市场判断需要审慎对待?
李耀柱:首先,市场对于部分没有收益、纯属主题炒作的公司给予太高预期,相关公司蕴含估值虚高的风险。目前DeepSeek和其他大模型仍然基于Transformer大架构,2025年关注的话题是谁可以找到替代Transformer的结构,DeepSeek探索的技术方向值得关注。
其次,关于AI应用在什么领域出现爆款并没有达成共识,所以应用的爆发方向仍然具有不确定性,需要持续跟踪和观察。
再其次,在技术层面,基于强化学习的大模型,本质上是基于规则设计的,未来能否设计出评判模型输出质量的奖励机制是关键。未来,在非数学和非编程等不易于定义结果对错以及不易定义规则的领域,强化学习模型的进一步迭代可能会遇到挑战。因此,技术的迭代还在继续,并没有达到稳态水平。我们认为,深入关注技术的发展方向是未来做好投资的重要因素之一。
最后,市场对DeepSeek在预训练阶段的悲观看法也可能存在一定误解。从DeepSeek的论文可以看出,优化方程仍然希望最小化“经过强化学习调整后的模型”与调整前模型的差距,这代表着DeepSeek希望强化学习所在的后训练阶段仅仅微调模型,前一阶段靠冷启动预训练的基座模型很重要,所以对于算力资源仍然有较大需求。同时,用于冷启动的数据质量非常重要,代表着基座模型和预训练仍然重要。我们认为,未来算力资源和高质量数据的方向仍然有不错的长期投资机会。
方磊:长期来看,DeepSeek对于AI产业链影响较为深远,AI相关投资逻辑有望由海外映射转为国内产业发展驱动,由偏主题炒作转为基本面投资。值得注意的是,当前这种转化还在最初期阶段,目前全球范围内人工智能产业链的商业化途径尚不成熟,A股上市公司与AI相关产品的收入占公司营业收入的占比较低,后续依托DeepSeek模型打造的产品研发和场景落地进度仍具有不确定性。
考虑到股市通常会领先于基本面反应,目前不少AI相关标的已经按照行业具有较成熟产品和盈利模式的标准来进行估值定价。这类资产价格对未来的透支性较大,情绪对股价的影响阶段性放大。在当前环境下,我们认为在关注投资热点的同时,也需要关注投资机会的性价比,尽量选择那些具有更好投资风险收益比的机会。
具体而言,投资者可密切关注AI产业发展趋势,以及AI技术快速迭代带来的基本面变化。重点关注具有真实应用场景、商业化前景和基本面较好的企业,并根据自身的风险偏好和投资能力,进行多元化布局和长期投资。
(文章来源:上海证券报)