中信建投:AI产业链硬件和软件同频共振 建议关注AI产业持续变化

东方财富网

5天前

相较于安卓的开放,苹果iOS系统采用封闭式生态,严格把控软件审核环节,一定程度限制了系统的灵活性,但为用户提供了一致且高质量的使用体验。

中信建投研报认为,AI产业链正面临从性能拐点到份额拐点、从技术价值到商业化价值双重变化的转折点,当前AI产业链硬件和软件同频共振,均呈现加速趋势,建议关注AI产业持续变化:1.持续看多大厂资本开支持续下底层算力产业链发展。a)AIDC作为AI产业链底层基座需求持续;b)算力芯片自主可控势在必行;c)模型私有化需求增加,利好一体机、超融合和B端服务外包企业。2.利好行业Know-how及数据积累充分、客户充足、有具体应用场景的B端和C端软件企业。a)OA+ERP成为B端Agent入口的逻辑不变;b)关注B端通用、政府、金融、能源、工业、营销等垂直场景AI落地;c)利好有用户和产品积累的2C公司;3.看好AI产业链配套基础设施建设,建议关注数据处理和大模型安全厂商。

中信建投:站在AI产业商业化加速的拐点

AI产业链正面临从性能拐点到份额拐点、从技术价值到商业化价值双重变化的转折点,当前AI产业链硬件和软件同频共振,均呈现加速趋势,建议关注AI产业持续变化:1)持续看多大厂资本开支持续下底层算力产业链发展。a)AIDC作为AI产业链底层基座需求持续;b)算力芯片自主可控势在必行;c)模型私有化需求增加,利好一体机、超融合和B端服务外包企业。2)利好行业Know-how及数据积累充分、客户充足、有具体应用场景的B端和C端软件企业。a)OA+ERP成为B端Agent入口的逻辑不变;b)关注B端通用、政府、金融、能源、工业、营销等垂直场景AI落地;c)利好有用户和产品积累的2C公司;3)看好AI产业链配套基础设施建设,建议关注数据处理和大模型安全厂商。

开源模型性能比肩闭源模型或标志AI产业份额拐点

安卓与iOS操作系统均于2007年发布,近20年发展下构建了开源和闭源两种截然不同的手机操作系统生态模式。2011年安卓操作系统UI统一管理带来体验改善,份额首超iOS,反应当开源产品的体验或性能达到闭源水平,有望迎来市场份额超越的拐点。当前, DeepSeek为代表的开源模型性能比肩闭源模型,或将加速开源市场份额提升。

效率优化下,可盈利AI商业模型已然跑通

DeepSeek连续开源在训练和推理效率方面的多项技术,公布的成本利润率细节更是构建了可盈利的商业模型。我们对DeepSeek实际利润率进行测算,如果DeepSeek不准备冗余算力,仍能在API调用付费率20%,V3调用占比50%的假设下实现21%的成本利润率水平;如果API调用付费率进一步提升至50%,成本利润率水平将进一步提升至51%。

硬件与软件共振,AI产业加速拐点已至

AI产业链硬件和软件同频共振。硬件侧,大厂对25年资本开支乐观,多家上市公司公布算力大单,单个项目合同金额超过30亿;DeepSeek带动私有化部署需求;RISC-V产业化亦加速AI端侧部署。软件侧,大厂接连接入DeepSeek促进用户量高增,Manus则进一步打开Agent发展趋势,大模型安全需求同步旺盛。硬件与软件共振下,AI产业有望迎来加速。

一、从性能拐点到份额拐点

1.1 他山之石:2011年通过体验改善带动安卓份额超过iOS份额

安卓与iOS操作系统均于2007年发布,近20年发展下构建了截然不同的手机操作系统生态模式:

安卓:Android公司成立于2003年,2005年被Google收购,并在2007年正式推出了Android操作系统。生态上,安卓系统开源开放,允许众多手机厂商基于其底层架构进行定制化开发,使其市场份额从2008年的2.8%提升到2011年的48%,但同时也带来了专利诉讼、软件盗版和系统安全等一系列问题;2011年,Google 推出 Android 4,从此安卓设备逐步正规化、标准化,直至2024年12月,安卓操作系统市场份额已经达到73.49%。

iOS:同样在安卓系统正式发布的2007年,苹果发布了搭载iOS系统的第一代iPhone,开启了智能手机的新时代。相较于安卓的开放,苹果iOS系统采用封闭式生态,严格把控软件审核环节,一定程度限制了系统的灵活性,但为用户提供了一致且高质量的使用体验。从市场份额看,近年来iOS系统的市占率相对稳定,2024年12月市场份额为26.04%,低于2009年1月iOS的市场份额35.56%。

UI统一管理带来体验改善,2011年安卓操作系统份额首超iOS。Android 4.0的推出,结束了三方厂商自定义各种UI界面的时代,同时保证安卓的系统更新可以第一时间推送到用户的手机,带来了更好的用户体验。也正是在2011年8月,安卓操作系统市场份额达到20.6%,首次超过同期iOS操作系统市场份额19.41%。至此,安卓操作系统市场份额持续提升,逐步到今天显著高于iOS市场份额。究其原因,当开源产品的体验或性能达到闭源水平,有望迎来市场份额超越的拐点。

1.2 DeepSeek为代表的开源模型性能比肩闭源模型

开源与闭源模型较大概率会持续共存,性能提升有望促进开源模式市场大于闭源。类比手机操作系统领域,当前AI 产业同样面临开源和闭源之争。其中开源模式能够吸引全球范围的开发者参与AI技术创新,后来者能够基于已有成果快速进行应用开发与产品迭代,从而推动 AI 应用的快速落地,推动AI产业加速发展。Meta、Google、Mistral等海外厂商,以及阿里、DeepSeek、MiniMax等国内厂商,均一直是AI开源生态的积极践行者,其推出的模型亦不断更新,性能逐步向SOTA看齐。

DeepSeek为AI开源生态按下加速键。在美国对中国实施 AI 芯片封锁的背景下,DeepSeek以极低的成本成功训练出跻身全球第一梯队的推理模型 R1。同时,DeepSeek 完全开源了模型权重,所遵循的 MIT License 开源协议极为宽松,允许其他开发者将模型用于商业用途并进行模型蒸馏,被Facebook首席人工智能科学家杨立昆誉为“开源模型对闭源模型的胜利”。受DeepSeek全球热度冲击影响,Sam Altman承认在开源策略上“站在了历史错误的一边”,并表示正在讨论开源部分模型。

除对模型开源外, DeepSeek于2025年2月24日至28日期推出“开源周”,连续五天开源五大核心代码库及相关技术文档,进一步加速AI开源生态。受DeepSeek促进,国内厂商同样积极拥抱开源生态。初创企业中, MiniMax一直是国内开源生态的重要玩家,已于1月15日开源了其最新一代基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01;2月18日,阶跃星辰和吉利汽车集团联合宣布,将向全球开发者开源 Step-Video-T2V 视频生成模型和 Step-Audio 语音模型;2月24日凌晨,Kimi宣布开源其最新技术报告和大模型 Moonlight。而在大厂方面,2月14日,百度宣布未来几个月将陆续推出文心大模型4.5系列,并于6月30日起正式开源;2月25日和3月6日,阿里云分别开源视觉生成基座模型Wan 2.1和推理模型QwQ-23B

开源模型性能追平闭源模型,或将加速开源市场份额提升。DeepSeek-R1之所以会成为开源生态出圈爆火的里程碑,一方面系其作为完全开放权重的开源模型性能接近头部闭源模型o1,一定程度上已经反映了AI平权;另一方面其意味着国内的大模型水平与海外的差距正在加速缩小,民族自信放大了其市场价值。实际上,过去OpenAI的领先更多基于先发优势,当开源模型的性能实现对闭源模型的追赶,全球的团队的研发能力能够使开源模型的性能始终位于前列。参考安卓和iOS操作系统市场份额的变化,大模型的性能拐点或将成为市场份额拐点,大厂对开源的跟进亦将形成正反馈。

二、从技术价值到商业化价值

DeepSeek连续开源,提高训练和推理效率,构建可盈利的商业模型。DeepSeek于2月24日-2月28日连续开源,通过通信、矩阵运算、流水并行、负载均衡等算法大幅优化模型训练和推理过程,提高效率。

第一天:针对 Hopper GPU 优化的高效 MLA 解码内核,专门用于处理可变长度序列的服务FlashMLA。FlashMLA实现了基于 64-block 粒度的分页 KV 缓存,极大地缓解了内存访问瓶颈,网友实测KV压缩率达到 93.3%。同时,它设计了双缓冲预加载机制,在计算当前块的时候,会异步加载下一个块到共享内存,让显存访问和计算过程同步进行,减小延迟开销。DeepSeek在项目中表示,通过FlashMLA,H800可以达到 3000 GB/s 的内存带宽和 580 TFLOPS 的计算性能,已接近H800内存带宽的极限(使用 HBM3 内存下3.35 TB/s)。

第二天:用于 MoE 模型训练和推理的开源 EP 通信库DeepEP。DeepEP是一套用于MoE模型中专家间信息传输的通信系统。针对高吞吐场景(训练和处理输入token),DeepEP可以直接将数据从 NVLink 域转发到 RDMA 域,使得通信带宽最高可以达到 153GB/s,无限接近NVLink最高带宽160GB/s;针对低延迟场景(输出token),DeepEP只使用 RDMA以最小化延迟,在各个专家并行的程度下均达到了微秒级,最高达到了 46GB/s 的带宽(理论极限 50GB/s)。

第三天:FP8 通用矩阵乘法 (GEMM) 库DeepGEMM。DeepGEMM针对Hopper架构GPU,仅使用约300行核心代码实现对矩阵乘法的优化。具体而言,DeepGEMM先用 FP8 进行大批量乘法,再每隔一段时间将乘法结果转成更精确的32位数累加,既提高了计算效率,又能够避免误差积累。在多种常见矩阵形状上,DeepGEMM使性能提升达 1.1x-2.7x。

第四天:双向流水线并行算法DualPipe和用于 MoE 的负载均衡算法EPLB。DualPipe优化正向和反向传播阶段的计算与通信流程,使数据能够同时向前流动(处理输入)和向后流动(反馈更新),尽管参数用量翻倍,但大幅节省了流水线空闲时间。EPLB则包括层级和全局负载均衡,能把专家任务均匀分到GPU上,平衡GPU之间的工作负载,减少跨节点通信开销。据DeepSeek同步开源的PyTorch Profiler性能分析数据库,DualPipe使训练速度提升30%,EPLB提升资源利用率20%以上。

第五天:数据访问文件系统3FS及数据处理框架Smallpond。Fire-Flyer File System (3FS)是一个为 AI 工作负载设计的高性能分布式文件系统,将固态硬盘的带宽性能利用到极致,180节点集群中的聚合读取吞吐量为6.6TiB/s;25节点集群中GraySort基准测试的吞吐量为3.66TiB/分钟;每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。Smallpond则是建立在3FS之上的轻量级数据处理框架,具有高性能、可扩展性和易用性特点,GraySort基准测试上平均吞吐量为3.66TiB/min。

DeepSeek 公布成本利润率细节,理论成本率高达545%,模型厂商盈利模式实现闭环。3 月 1 日,DeepSeek在知乎平台发表题为《DeepSeek-V3/R1 推理系统概览》的首条文章,首次披露了DeepSeek 的理论成本和利润率等关键信息。据介绍,假定 GPU 租赁成本为 2 美元/小时,总成本为 87072 美元/天;统计包括网页、App 和 API 在内的所有负载,如果所有tokens 全部按DeepSeek R1 的定价计算,理论上一天的总收入为 562027 美元/天,成本利润率为 545%。理论DeepSeek 每日净赚 474955 美元。考虑 DeepSeek-V3 定价低于R1;网页端和应用程序免费,只有部分服务有收入;非高峰时段还有夜间折扣,实际收入低于理论收入值。结合DeepSeek创始人梁文锋不贴钱、不暴利的经营理念,DeepSeek或拥有较为可观的利润率,标志着模型厂商的盈利模式已实现闭环,或将推动模型带动模型产业环节进一步繁荣。

根据DeepSeek公布的成本利润率细节,我们对其实际利润率进行测算:

基本情况:满血DeepSeek-R1模型参数量671B,单Token预测激活参数量37B;据DeepSeek统计,24小时输入Token数为608B,输出Token数为168B,合计达到773B,则平均每秒Token调用量为0.09亿,则推理每秒所需理论算力为0.66亿(推理所需理论算力=2*模型参数量*每秒调用Token,NVIDIA、OpenAI);按DeepSeek公布所需的1814张H800 GPU,以及H800单卡580TFLOPS计算, DeepSeek H800单卡利用率高达0.63。

情形1:DeepSeek不准备冗余算力,API调用付费率20%,V3调用占比50%,则DS利润率为21%。

1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率20%,V3调用占比50%,则DeepSeek 24小时API调用收入为76.8万元;

2)24小时成本:按DeepSeek公布所需的1814张H800 GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek 24小时租赁成本为63.49万元;

3)利润率:按上述收入成本测算,DeepSeek利润率为20.96%。

情形2:DeepSeek准备1倍冗余算力,API调用付费率20%,V3调用占比50%,则DS利润率为-40%。

1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率20%,V3调用占比50%,则DeepSeek 24小时API调用收入为76.8万元;

2)24小时成本:DeepSeek为峰值用户准备1倍GPU冗余,则需要3628张H800 GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek 24小时租赁成本为126.98万元;

3)利润率:按上述收入成本测算,DeepSeek利润率为-39.52%。

情形3:DeepSeek不准备冗余算力,API调用付费率50%,V3调用占比50%,则DS利润率为202%。

1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率50%,V3调用占比50%,则DeepSeek 24小时API调用收入为192万元;

2)24小时成本:按DeepSeek公布所需的1814张H800 GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek 24小时租赁成本为63.49万元;

3)利润率:按上述收入成本测算,DeepSeek利润率为202.41%。

情形4:DeepSeek准备1倍冗余算力,API调用付费率50%,V3调用占比50%,则DS利润率为51%。

1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率50%,V3调用占比50%,则DeepSeek 24小时API调用收入为192万元;

2)24小时成本:DeepSeek为峰值用户准备1倍GPU冗余,则需要3628张H800 GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek 24小时租赁成本为126.98万元;

3)利润率:按上述收入成本测算,DeepSeek利润率为51.20%。

根据我们测算,虽然难以达到DeepSeek所公布的545%成本利润率,但如果DeepSeek不准备冗余算力,仍能在API调用付费率20%,V3调用占比50%的假设下实现21%的成本利润率水平;如果API调用付费率进一步提升至50%,成本利润率水平将进一步提升至51%。

阿里发布QwQ-32B,以更低参数实现强劲性能。2025年3月6日,通义千问发布推理模型QwQ-32B,在仅使用320亿参数的前提下性能媲美顶尖推理模型如DeepSeek-R1,远超o1-mini和经过R1蒸馏后的Qwen-32B模型。据通义千问公众号, QwQ-32B在冷启动基础上,针对数学和编程任务、通用能力分别进行了两轮大规模强化学习。前者随着训练轮次的推进,模型的性能均表现出持续的提升;后者则通过少量步骤实现通用能力提升,同时在数学和编程任务上的性能没有显着下降。此外,QwQ-32B 模型还集成了与智能体 Agent 相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

我们认为,DeepSeek公布的成本利润率细节已经验证模型厂商通过算力租赁提供模型API调用服务的商业化路径可行。而阿里QwQ-32B则进一步优化模型部署成本,加速AI普惠化,同时也为厂商打开更大的盈利空间。预计在DeepSeek、阿里等厂商持续开源的引领下,技术价值将逐步演变为商业化价值,推动产业链落地。

三、硬件与软件共振,AI产业加速拐点已至

近期,AI产业链硬件和软件同频共振。硬件侧,大厂对25年资本开支乐观,多家上市公司公布算力大单,单个项目合同金额超过30亿;DeepSeek带动私有化部署需求;RISC-V产业化亦加速AI端侧部署。软件侧,大厂接连接入DeepSeek促进用户量高增,Manus则进一步打开Agent发展趋势,大模型安全需求同步旺盛。

3.1 硬件:大厂资本开支持续下算力大单频现,反映旺盛需求

阿里巴巴2月发布财报,并宣布“计划未来三年将投入至少3,800亿元人民币,用于建设云计算和AI的基础设施”,引发市场对AI资本开支的想象。近期腾讯、联通、移动相继公布业绩,均对AI战略做出部署:

腾讯:AI战略进入重投入期,24Q4资本开支超过阿里。3月19日,腾讯控股正式发布2024年第四季度及全年业绩报告,2024年全年收入为6602.57亿人民币,同比增长8%,净利润为1940.73亿人民币,同比增长68%;第四季度收入为1724.46亿,同比增长11%,净利润为513.24亿人民币,同比增长90%。

资本开支方面,腾讯24Q4资本开支为365.78亿元,环比增长114%,同比增长386%,超过阿里同期资本开支318亿元;2024年全年资本开支为767亿元,同比增长221%,创历史新高,同样超过阿里同期资本开支725亿元,其中AI相关研发投入为707亿元。年报媒体沟通会上,腾讯管理层计划在2025年进一步增加资本支出,预期资本支出占收入的比例为低两位数百分比(24年资本支出占收入比重约12%)。

中国联通:全面拥抱人工智能,算力投资预计同比增28%。3月18日,中国联通公告2024年报,实现营收3895.89亿元,同比增长4.6%;实现归母净利润90.29亿元,同比增长10.5%。中国联通2024年资本开支为613.7亿元,同比下降17%。其中,算力投资逆势同比上升19%。中国联通预计,2025年固定资产投资在550亿元左右,其中算力投资同比增长28%;此外,公司还为人工智能重点基础设施和重大工程专项作了特别预算安排。

中国移动:25年算力资本开支373亿元,推理算力投资不设上限。3月20日,中国移动公告2024年报,实现营收10408亿元,同比增长3.1%;实现归母净利润1384亿元,同比增长5.0%。2024年,中国移动智算规模达到29.2EFLOPS,净增19.1EFLOPS,呼和浩特、哈尔滨万卡级超大规模智算中心上线提供服务;公司计划2025年通算规模(FP32)累计达到8.9 EFLOPS,智算规模(FP16) 超34 EFLOPS。而在当日举行的业绩说明会上,执行董事兼首席执行官何飚进一步介绍,2025年中国移动在算力领域的资本开支将为373亿元,占比将提升至25%,其中年报公布的超34 EFLOPS智算计划主要以预训练资源为主,而对推理资源投资不设上限。

算力大单频现,应用落地加速趋势下景气度持续。随着人工智能技术持续发展,尤其DeepSeek带动AI平权下,算力需求持续旺盛,近期相关大单频频落地。3月5日,海南华铁全资子公司华铁大黄蜂与杭州某公司签订了《算力服务协议》,服务期5年,预计合同总金额为36.9亿元(含税),预计平均每年产生营业收入约7亿元;同日,蓝耘科技全资子公司算优科技与某公司签署《算力云服务协议》,合同总金额(含税)为37.07亿元,服务期为5年(注:3月7日公司公告称双方就该合同进行紧急磋商);3月8日,协创数据公告,拟向多家供应商采购服务器,并签署相关采购合同,采购合同总金额预计不超过人民币30亿元。当前,国产开源大模型性能已达到第一梯队水平,预计B端及C端应用将呈现加速落地趋势,以正反馈的形式进一步拉升算力需求。

私有化部署供需匹配,一体机市场全面铺开。从供给侧看,DeepSeek发布以来国产芯片迅速完成适配,据智东西统计,截止2月14日已有24家国产AI芯片企业相继宣布适配或上架DeepSeek模型服务,为DeepSeek等国产模型本地化部署提供了基础,对应至少有60家企业宣布发布DeepSeek一体机或完成其AI一体机对DeepSeek的适配;而从需求侧看,相较于C端用户更能接受调用第三方云厂商API, B端企业更倾向于将模型私有化部署至自有服务器,既彻底杜绝数据外流风险,又能基于业务数据进行领域微调,打造专属智能引擎,这种部署方式尤其在金融、医疗等高合规要求行业更为关键。私有化部署的供需匹配,有望促进一体机市场的全面铺开,促进G端及B端AI场景商业化发展。

RISC-V产业化进程加速,玄铁C930发布助力AI端侧部署。RISC-V技术凭借开源优势,正成为AI时代全球加速布局的关键领域。其中,欧洲高性能计算 (HPC) 联合企业启动了一项 2.4 亿欧元的项目,用于开发AI RISC-V芯片和软件,以避免欧洲超级计算基础设施对非欧洲的硬件和软件解决方案的依赖;而国内更是已经成为RISC-V芯片的主要市场,智研数据显示2023年全球RISC-V芯片出货量超100亿颗,中国厂商占比超过50%。

2025年2月28日,在第三届阿里达摩院玄铁RISC-V生态大会上,中科院软件所表示基于玄铁C920处理器的AI PC概念机已经跑通Llama、Qwen、DeepSeek等开源模型,打通硬件架构、操作系统、AI模型的“开源AI全链路”,单位计算能耗降低30%;同时,达摩院玄铁推出新一代旗舰服务器级处理器C930,将通用高性能算力与 AI 算力原生结合,将于3月陆续开启交付。

随着技术优化打破大模型高算力路径依赖,CPU凭借通用性强、易于调度的特点有望大幅降低算力需求并发挥同构计算的优势,助力边缘和端侧设备单机部署高性能模型。而RISC-V处理器已完成DeepSeek-R1系列蒸馏模型的适配,有望推动数十亿物联网终端加速向AI化转变。此外,RISC-V还具备较强的灵活性和可扩展性,允许开发者根据具体需求定制指令集,更能支持各种应用场景。

3.2 软件:应用及Agent生态逐步完善,大模型安全需求同步提升

大厂接入DeepSeek促进用户量高增,应用生态逐步完善。DeepSeek发布以来,国内大厂加速接入,其中百度于2月16日宣布在百度搜索中全面接入DeepSeek,同时文心智能体平台的开发者也能用DeepSeek模型创建调优智能体;腾讯同样“All in” DeepSeek,元宝、微信、ima、腾讯文档、QQ浏览器等超十四款产品均适配DeepSeek-R1,甚至元宝还支持DeepSeek-R1本身缺失的读图功能;字节同样将旗下飞书、火山引擎、悟空浏览器、即梦、Coze等产品接入DeepSeek,完善产品AI能力。

从新增用户看,据量子位智库统计,仅在AI智能助手赛道,豆包、DeepSeek、Kimi日新增用户即达到50万以上;腾讯元宝、文小言、智谱清言、AI Mate Pro等产品的新增日活超过5万;通义、讯飞星火、天工AI的新增日活也超过1万;从Web端月度流量看,2月各AI智能助手产品月活用户普遍增长,其中元宝增速超7倍,通义千问增速也接近6倍。我们认为,DeepSeek强化了大众对AI产品的认知,有望为AI产品普惠化赋能,从而加速完善AI应用生态。

AI技术持续迭代,Agent赋能千行百业。随着AI技术的深度融合与场景化创新,除企业端应用外,AI Agent亦逐步向政务、医疗、金融、能源、法律及教育等垂直领域加速渗透,推动行业效率与服务模式革新。例如,在政务领域,深圳福田区推出70名基于DeepSeek开发的AI数智员工,定制化开发了覆盖240个场景的个性化智能体,进一步驱动政务效能全面跃升;而在网安领域,启明星辰安恒信息亚信安全等企业均推出了安全智能体,实现对告警信息的自动化研判;在医疗领域,个人、医生及临床诊断助力均能带来智能化健康护理体验;金融与法律领域,财税AI Agent助力企业实现智能开票、风险检测等场景降本增效,百度法律智能体“法行宝”则依托知识图谱与大模型技术,降低专业法律援助门槛。

Manus 带来通用场景Agent想象空间。3月6日凌晨,Monica.im发布其首款AI Agent Manus,在GAIA基准测试(评估通用AI助手解决真实世界问题的能力)中取得所有难度级别的SOTA 表现,引发全网热议。具体而言,官方发布视频中演示了筛选简历、遴选房产、股票价格分析三个案例,Manus能根据用户需求,自主分解任务流程并分步完成,直接交付用户所需的结果。我们认为,Manus在演示视频中主要展现了以下特点,大幅提升了可用性:1)运行在独立虚拟机中,可以在虚拟环境编写代码、浏览网页、调用工具等,支持完全后台操作,用户甚至可以在下达任务后关闭电脑;2)具备记忆能力,能够根据用户反馈优化在类似任务的回答。3)自主对数据交叉验证,降低模型幻觉,大幅提升在B端场景的可用性。

Manus通过极致工程化大幅提升用户体验,OpenAI则推出开发套件供用户自主构建Agent。Manus发布后风评多次反转,一方面部分用户质疑Manus为多款AI工具套壳,缺乏技术含量,更多为营销炒作;另一方面Manus向海外博主开放邀请码,得到包括多位技术大拿在内的良好反馈。3月11日,Manus和阿里通义达成战略合作,更进一步实际证明了套壳类产品的应用价值。同时,3月12日凌晨OpenAI发布Agent工具包和API,降低Agent创建门槛,有望进一步推动Agent发展趋势。我们认为,Manus出圈的重要意义在于提高了大众对于AI Agent的认识,能够加速Agent从B端场景向C端应用的渗透。此外,Manus的爆火也凸显了用户体验的价值,预计工程化将成为后续AI产品迭代的关键。

国家安全中心通报Ollama风险,重视开源趋势下大模型安全需求。3月3日,国家网络安全通报中心通报大模型工具Ollama存在安全风险,攻击者可利用Ollama框架历史漏洞直接调用模型接口实施数据投毒、参数窃取、恶意文件上传及关键组件删除等操作,造成模型服务的核心数据、算法完整性和运行稳定性面临安全风险。实际上,大模型安全已经成为AI时代重要挑战之一,对外需要防范投毒、指令、窃取、对抗等多种攻击方式,对内需要避免大模型内容中可能存在的伦理、偏见等风险。随着AI产业链进一步景气,应用和用户数量将同步提升,尤其开源趋势下大模型和数据安全的重要性有望进一步凸显。

四、投资建议

技术迭代下开源模型性能已逐步追平闭源模型,有望迎来份额拐点;同时,AI技术发展下应用成本进一步降低,商业化价值已然显现,建议关注AI产业持续变化:

1)持续看多大厂资本开支持续下底层算力产业链发展。

2)利好行业Know-how及数据积累充分、客户充足、有具体应用场景的B端和C端软件企业。

3)看好AI产业链配套基础设施建设,建议关注数据处理和大模型安全厂商。

(1)AI产业商业化落地不及预期:目前各环节AI 产品的商业化模式尚处于探索阶段,如果各环节产品的推进节奏不及预期,或对相关企业业绩造成不利影响;(2)市场竞争风险:海外 AI 厂商凭借先发优势,以及较强的技术积累,在竞争中处于优势地位,如果国内 AI 厂商技术迭代不及预期,经营状况或将受到影响;同时,目前国内已有众多企业投入AI产品研发,后续可能存在同质化竞争风险,进而影响相关企业的收入;(3)政策风险:AI技术的发展直接受各国政策和监管影响。随着AI在各个领域的渗透,政府可能会进一步出台相应的监管政策以规范其发展。如果企业未能及时适应和遵守相关政策,可能面临相应处罚,甚至被迫调整业务策略。此外,政策的不确定性也可能导致企业战略规划和投资决策的错误,增加运营的不确定性;(4)地缘政治风险:在全球地缘政治环境的波动下,尤其美国对中国的出口限制或将直接影响国内企业算力芯片的获取,进而影响其产品研发和市场竞争力。同时,地缘政治风险也可能导致 AI 产品开拓海外市场面临障碍,影响相关企业的营收情况。

(文章来源:人民财讯)

(原标题:中信建投:AI产业链硬件和软件同频共振 建议关注AI产业持续变化)

(责任编辑:70)

相较于安卓的开放,苹果iOS系统采用封闭式生态,严格把控软件审核环节,一定程度限制了系统的灵活性,但为用户提供了一致且高质量的使用体验。

中信建投研报认为,AI产业链正面临从性能拐点到份额拐点、从技术价值到商业化价值双重变化的转折点,当前AI产业链硬件和软件同频共振,均呈现加速趋势,建议关注AI产业持续变化:1.持续看多大厂资本开支持续下底层算力产业链发展。a)AIDC作为AI产业链底层基座需求持续;b)算力芯片自主可控势在必行;c)模型私有化需求增加,利好一体机、超融合和B端服务外包企业。2.利好行业Know-how及数据积累充分、客户充足、有具体应用场景的B端和C端软件企业。a)OA+ERP成为B端Agent入口的逻辑不变;b)关注B端通用、政府、金融、能源、工业、营销等垂直场景AI落地;c)利好有用户和产品积累的2C公司;3.看好AI产业链配套基础设施建设,建议关注数据处理和大模型安全厂商。

中信建投:站在AI产业商业化加速的拐点

AI产业链正面临从性能拐点到份额拐点、从技术价值到商业化价值双重变化的转折点,当前AI产业链硬件和软件同频共振,均呈现加速趋势,建议关注AI产业持续变化:1)持续看多大厂资本开支持续下底层算力产业链发展。a)AIDC作为AI产业链底层基座需求持续;b)算力芯片自主可控势在必行;c)模型私有化需求增加,利好一体机、超融合和B端服务外包企业。2)利好行业Know-how及数据积累充分、客户充足、有具体应用场景的B端和C端软件企业。a)OA+ERP成为B端Agent入口的逻辑不变;b)关注B端通用、政府、金融、能源、工业、营销等垂直场景AI落地;c)利好有用户和产品积累的2C公司;3)看好AI产业链配套基础设施建设,建议关注数据处理和大模型安全厂商。

开源模型性能比肩闭源模型或标志AI产业份额拐点

安卓与iOS操作系统均于2007年发布,近20年发展下构建了开源和闭源两种截然不同的手机操作系统生态模式。2011年安卓操作系统UI统一管理带来体验改善,份额首超iOS,反应当开源产品的体验或性能达到闭源水平,有望迎来市场份额超越的拐点。当前, DeepSeek为代表的开源模型性能比肩闭源模型,或将加速开源市场份额提升。

效率优化下,可盈利AI商业模型已然跑通

DeepSeek连续开源在训练和推理效率方面的多项技术,公布的成本利润率细节更是构建了可盈利的商业模型。我们对DeepSeek实际利润率进行测算,如果DeepSeek不准备冗余算力,仍能在API调用付费率20%,V3调用占比50%的假设下实现21%的成本利润率水平;如果API调用付费率进一步提升至50%,成本利润率水平将进一步提升至51%。

硬件与软件共振,AI产业加速拐点已至

AI产业链硬件和软件同频共振。硬件侧,大厂对25年资本开支乐观,多家上市公司公布算力大单,单个项目合同金额超过30亿;DeepSeek带动私有化部署需求;RISC-V产业化亦加速AI端侧部署。软件侧,大厂接连接入DeepSeek促进用户量高增,Manus则进一步打开Agent发展趋势,大模型安全需求同步旺盛。硬件与软件共振下,AI产业有望迎来加速。

一、从性能拐点到份额拐点

1.1 他山之石:2011年通过体验改善带动安卓份额超过iOS份额

安卓与iOS操作系统均于2007年发布,近20年发展下构建了截然不同的手机操作系统生态模式:

安卓:Android公司成立于2003年,2005年被Google收购,并在2007年正式推出了Android操作系统。生态上,安卓系统开源开放,允许众多手机厂商基于其底层架构进行定制化开发,使其市场份额从2008年的2.8%提升到2011年的48%,但同时也带来了专利诉讼、软件盗版和系统安全等一系列问题;2011年,Google 推出 Android 4,从此安卓设备逐步正规化、标准化,直至2024年12月,安卓操作系统市场份额已经达到73.49%。

iOS:同样在安卓系统正式发布的2007年,苹果发布了搭载iOS系统的第一代iPhone,开启了智能手机的新时代。相较于安卓的开放,苹果iOS系统采用封闭式生态,严格把控软件审核环节,一定程度限制了系统的灵活性,但为用户提供了一致且高质量的使用体验。从市场份额看,近年来iOS系统的市占率相对稳定,2024年12月市场份额为26.04%,低于2009年1月iOS的市场份额35.56%。

UI统一管理带来体验改善,2011年安卓操作系统份额首超iOS。Android 4.0的推出,结束了三方厂商自定义各种UI界面的时代,同时保证安卓的系统更新可以第一时间推送到用户的手机,带来了更好的用户体验。也正是在2011年8月,安卓操作系统市场份额达到20.6%,首次超过同期iOS操作系统市场份额19.41%。至此,安卓操作系统市场份额持续提升,逐步到今天显著高于iOS市场份额。究其原因,当开源产品的体验或性能达到闭源水平,有望迎来市场份额超越的拐点。

1.2 DeepSeek为代表的开源模型性能比肩闭源模型

开源与闭源模型较大概率会持续共存,性能提升有望促进开源模式市场大于闭源。类比手机操作系统领域,当前AI 产业同样面临开源和闭源之争。其中开源模式能够吸引全球范围的开发者参与AI技术创新,后来者能够基于已有成果快速进行应用开发与产品迭代,从而推动 AI 应用的快速落地,推动AI产业加速发展。Meta、Google、Mistral等海外厂商,以及阿里、DeepSeek、MiniMax等国内厂商,均一直是AI开源生态的积极践行者,其推出的模型亦不断更新,性能逐步向SOTA看齐。

DeepSeek为AI开源生态按下加速键。在美国对中国实施 AI 芯片封锁的背景下,DeepSeek以极低的成本成功训练出跻身全球第一梯队的推理模型 R1。同时,DeepSeek 完全开源了模型权重,所遵循的 MIT License 开源协议极为宽松,允许其他开发者将模型用于商业用途并进行模型蒸馏,被Facebook首席人工智能科学家杨立昆誉为“开源模型对闭源模型的胜利”。受DeepSeek全球热度冲击影响,Sam Altman承认在开源策略上“站在了历史错误的一边”,并表示正在讨论开源部分模型。

除对模型开源外, DeepSeek于2025年2月24日至28日期推出“开源周”,连续五天开源五大核心代码库及相关技术文档,进一步加速AI开源生态。受DeepSeek促进,国内厂商同样积极拥抱开源生态。初创企业中, MiniMax一直是国内开源生态的重要玩家,已于1月15日开源了其最新一代基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01;2月18日,阶跃星辰和吉利汽车集团联合宣布,将向全球开发者开源 Step-Video-T2V 视频生成模型和 Step-Audio 语音模型;2月24日凌晨,Kimi宣布开源其最新技术报告和大模型 Moonlight。而在大厂方面,2月14日,百度宣布未来几个月将陆续推出文心大模型4.5系列,并于6月30日起正式开源;2月25日和3月6日,阿里云分别开源视觉生成基座模型Wan 2.1和推理模型QwQ-23B

开源模型性能追平闭源模型,或将加速开源市场份额提升。DeepSeek-R1之所以会成为开源生态出圈爆火的里程碑,一方面系其作为完全开放权重的开源模型性能接近头部闭源模型o1,一定程度上已经反映了AI平权;另一方面其意味着国内的大模型水平与海外的差距正在加速缩小,民族自信放大了其市场价值。实际上,过去OpenAI的领先更多基于先发优势,当开源模型的性能实现对闭源模型的追赶,全球的团队的研发能力能够使开源模型的性能始终位于前列。参考安卓和iOS操作系统市场份额的变化,大模型的性能拐点或将成为市场份额拐点,大厂对开源的跟进亦将形成正反馈。

二、从技术价值到商业化价值

DeepSeek连续开源,提高训练和推理效率,构建可盈利的商业模型。DeepSeek于2月24日-2月28日连续开源,通过通信、矩阵运算、流水并行、负载均衡等算法大幅优化模型训练和推理过程,提高效率。

第一天:针对 Hopper GPU 优化的高效 MLA 解码内核,专门用于处理可变长度序列的服务FlashMLA。FlashMLA实现了基于 64-block 粒度的分页 KV 缓存,极大地缓解了内存访问瓶颈,网友实测KV压缩率达到 93.3%。同时,它设计了双缓冲预加载机制,在计算当前块的时候,会异步加载下一个块到共享内存,让显存访问和计算过程同步进行,减小延迟开销。DeepSeek在项目中表示,通过FlashMLA,H800可以达到 3000 GB/s 的内存带宽和 580 TFLOPS 的计算性能,已接近H800内存带宽的极限(使用 HBM3 内存下3.35 TB/s)。

第二天:用于 MoE 模型训练和推理的开源 EP 通信库DeepEP。DeepEP是一套用于MoE模型中专家间信息传输的通信系统。针对高吞吐场景(训练和处理输入token),DeepEP可以直接将数据从 NVLink 域转发到 RDMA 域,使得通信带宽最高可以达到 153GB/s,无限接近NVLink最高带宽160GB/s;针对低延迟场景(输出token),DeepEP只使用 RDMA以最小化延迟,在各个专家并行的程度下均达到了微秒级,最高达到了 46GB/s 的带宽(理论极限 50GB/s)。

第三天:FP8 通用矩阵乘法 (GEMM) 库DeepGEMM。DeepGEMM针对Hopper架构GPU,仅使用约300行核心代码实现对矩阵乘法的优化。具体而言,DeepGEMM先用 FP8 进行大批量乘法,再每隔一段时间将乘法结果转成更精确的32位数累加,既提高了计算效率,又能够避免误差积累。在多种常见矩阵形状上,DeepGEMM使性能提升达 1.1x-2.7x。

第四天:双向流水线并行算法DualPipe和用于 MoE 的负载均衡算法EPLB。DualPipe优化正向和反向传播阶段的计算与通信流程,使数据能够同时向前流动(处理输入)和向后流动(反馈更新),尽管参数用量翻倍,但大幅节省了流水线空闲时间。EPLB则包括层级和全局负载均衡,能把专家任务均匀分到GPU上,平衡GPU之间的工作负载,减少跨节点通信开销。据DeepSeek同步开源的PyTorch Profiler性能分析数据库,DualPipe使训练速度提升30%,EPLB提升资源利用率20%以上。

第五天:数据访问文件系统3FS及数据处理框架Smallpond。Fire-Flyer File System (3FS)是一个为 AI 工作负载设计的高性能分布式文件系统,将固态硬盘的带宽性能利用到极致,180节点集群中的聚合读取吞吐量为6.6TiB/s;25节点集群中GraySort基准测试的吞吐量为3.66TiB/分钟;每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。Smallpond则是建立在3FS之上的轻量级数据处理框架,具有高性能、可扩展性和易用性特点,GraySort基准测试上平均吞吐量为3.66TiB/min。

DeepSeek 公布成本利润率细节,理论成本率高达545%,模型厂商盈利模式实现闭环。3 月 1 日,DeepSeek在知乎平台发表题为《DeepSeek-V3/R1 推理系统概览》的首条文章,首次披露了DeepSeek 的理论成本和利润率等关键信息。据介绍,假定 GPU 租赁成本为 2 美元/小时,总成本为 87072 美元/天;统计包括网页、App 和 API 在内的所有负载,如果所有tokens 全部按DeepSeek R1 的定价计算,理论上一天的总收入为 562027 美元/天,成本利润率为 545%。理论DeepSeek 每日净赚 474955 美元。考虑 DeepSeek-V3 定价低于R1;网页端和应用程序免费,只有部分服务有收入;非高峰时段还有夜间折扣,实际收入低于理论收入值。结合DeepSeek创始人梁文锋不贴钱、不暴利的经营理念,DeepSeek或拥有较为可观的利润率,标志着模型厂商的盈利模式已实现闭环,或将推动模型带动模型产业环节进一步繁荣。

根据DeepSeek公布的成本利润率细节,我们对其实际利润率进行测算:

基本情况:满血DeepSeek-R1模型参数量671B,单Token预测激活参数量37B;据DeepSeek统计,24小时输入Token数为608B,输出Token数为168B,合计达到773B,则平均每秒Token调用量为0.09亿,则推理每秒所需理论算力为0.66亿(推理所需理论算力=2*模型参数量*每秒调用Token,NVIDIA、OpenAI);按DeepSeek公布所需的1814张H800 GPU,以及H800单卡580TFLOPS计算, DeepSeek H800单卡利用率高达0.63。

情形1:DeepSeek不准备冗余算力,API调用付费率20%,V3调用占比50%,则DS利润率为21%。

1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率20%,V3调用占比50%,则DeepSeek 24小时API调用收入为76.8万元;

2)24小时成本:按DeepSeek公布所需的1814张H800 GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek 24小时租赁成本为63.49万元;

3)利润率:按上述收入成本测算,DeepSeek利润率为20.96%。

情形2:DeepSeek准备1倍冗余算力,API调用付费率20%,V3调用占比50%,则DS利润率为-40%。

1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率20%,V3调用占比50%,则DeepSeek 24小时API调用收入为76.8万元;

2)24小时成本:DeepSeek为峰值用户准备1倍GPU冗余,则需要3628张H800 GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek 24小时租赁成本为126.98万元;

3)利润率:按上述收入成本测算,DeepSeek利润率为-39.52%。

情形3:DeepSeek不准备冗余算力,API调用付费率50%,V3调用占比50%,则DS利润率为202%。

1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率50%,V3调用占比50%,则DeepSeek 24小时API调用收入为192万元;

2)24小时成本:按DeepSeek公布所需的1814张H800 GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek 24小时租赁成本为63.49万元;

3)利润率:按上述收入成本测算,DeepSeek利润率为202.41%。

情形4:DeepSeek准备1倍冗余算力,API调用付费率50%,V3调用占比50%,则DS利润率为51%。

1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率50%,V3调用占比50%,则DeepSeek 24小时API调用收入为192万元;

2)24小时成本:DeepSeek为峰值用户准备1倍GPU冗余,则需要3628张H800 GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek 24小时租赁成本为126.98万元;

3)利润率:按上述收入成本测算,DeepSeek利润率为51.20%。

根据我们测算,虽然难以达到DeepSeek所公布的545%成本利润率,但如果DeepSeek不准备冗余算力,仍能在API调用付费率20%,V3调用占比50%的假设下实现21%的成本利润率水平;如果API调用付费率进一步提升至50%,成本利润率水平将进一步提升至51%。

阿里发布QwQ-32B,以更低参数实现强劲性能。2025年3月6日,通义千问发布推理模型QwQ-32B,在仅使用320亿参数的前提下性能媲美顶尖推理模型如DeepSeek-R1,远超o1-mini和经过R1蒸馏后的Qwen-32B模型。据通义千问公众号, QwQ-32B在冷启动基础上,针对数学和编程任务、通用能力分别进行了两轮大规模强化学习。前者随着训练轮次的推进,模型的性能均表现出持续的提升;后者则通过少量步骤实现通用能力提升,同时在数学和编程任务上的性能没有显着下降。此外,QwQ-32B 模型还集成了与智能体 Agent 相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

我们认为,DeepSeek公布的成本利润率细节已经验证模型厂商通过算力租赁提供模型API调用服务的商业化路径可行。而阿里QwQ-32B则进一步优化模型部署成本,加速AI普惠化,同时也为厂商打开更大的盈利空间。预计在DeepSeek、阿里等厂商持续开源的引领下,技术价值将逐步演变为商业化价值,推动产业链落地。

三、硬件与软件共振,AI产业加速拐点已至

近期,AI产业链硬件和软件同频共振。硬件侧,大厂对25年资本开支乐观,多家上市公司公布算力大单,单个项目合同金额超过30亿;DeepSeek带动私有化部署需求;RISC-V产业化亦加速AI端侧部署。软件侧,大厂接连接入DeepSeek促进用户量高增,Manus则进一步打开Agent发展趋势,大模型安全需求同步旺盛。

3.1 硬件:大厂资本开支持续下算力大单频现,反映旺盛需求

阿里巴巴2月发布财报,并宣布“计划未来三年将投入至少3,800亿元人民币,用于建设云计算和AI的基础设施”,引发市场对AI资本开支的想象。近期腾讯、联通、移动相继公布业绩,均对AI战略做出部署:

腾讯:AI战略进入重投入期,24Q4资本开支超过阿里。3月19日,腾讯控股正式发布2024年第四季度及全年业绩报告,2024年全年收入为6602.57亿人民币,同比增长8%,净利润为1940.73亿人民币,同比增长68%;第四季度收入为1724.46亿,同比增长11%,净利润为513.24亿人民币,同比增长90%。

资本开支方面,腾讯24Q4资本开支为365.78亿元,环比增长114%,同比增长386%,超过阿里同期资本开支318亿元;2024年全年资本开支为767亿元,同比增长221%,创历史新高,同样超过阿里同期资本开支725亿元,其中AI相关研发投入为707亿元。年报媒体沟通会上,腾讯管理层计划在2025年进一步增加资本支出,预期资本支出占收入的比例为低两位数百分比(24年资本支出占收入比重约12%)。

中国联通:全面拥抱人工智能,算力投资预计同比增28%。3月18日,中国联通公告2024年报,实现营收3895.89亿元,同比增长4.6%;实现归母净利润90.29亿元,同比增长10.5%。中国联通2024年资本开支为613.7亿元,同比下降17%。其中,算力投资逆势同比上升19%。中国联通预计,2025年固定资产投资在550亿元左右,其中算力投资同比增长28%;此外,公司还为人工智能重点基础设施和重大工程专项作了特别预算安排。

中国移动:25年算力资本开支373亿元,推理算力投资不设上限。3月20日,中国移动公告2024年报,实现营收10408亿元,同比增长3.1%;实现归母净利润1384亿元,同比增长5.0%。2024年,中国移动智算规模达到29.2EFLOPS,净增19.1EFLOPS,呼和浩特、哈尔滨万卡级超大规模智算中心上线提供服务;公司计划2025年通算规模(FP32)累计达到8.9 EFLOPS,智算规模(FP16) 超34 EFLOPS。而在当日举行的业绩说明会上,执行董事兼首席执行官何飚进一步介绍,2025年中国移动在算力领域的资本开支将为373亿元,占比将提升至25%,其中年报公布的超34 EFLOPS智算计划主要以预训练资源为主,而对推理资源投资不设上限。

算力大单频现,应用落地加速趋势下景气度持续。随着人工智能技术持续发展,尤其DeepSeek带动AI平权下,算力需求持续旺盛,近期相关大单频频落地。3月5日,海南华铁全资子公司华铁大黄蜂与杭州某公司签订了《算力服务协议》,服务期5年,预计合同总金额为36.9亿元(含税),预计平均每年产生营业收入约7亿元;同日,蓝耘科技全资子公司算优科技与某公司签署《算力云服务协议》,合同总金额(含税)为37.07亿元,服务期为5年(注:3月7日公司公告称双方就该合同进行紧急磋商);3月8日,协创数据公告,拟向多家供应商采购服务器,并签署相关采购合同,采购合同总金额预计不超过人民币30亿元。当前,国产开源大模型性能已达到第一梯队水平,预计B端及C端应用将呈现加速落地趋势,以正反馈的形式进一步拉升算力需求。

私有化部署供需匹配,一体机市场全面铺开。从供给侧看,DeepSeek发布以来国产芯片迅速完成适配,据智东西统计,截止2月14日已有24家国产AI芯片企业相继宣布适配或上架DeepSeek模型服务,为DeepSeek等国产模型本地化部署提供了基础,对应至少有60家企业宣布发布DeepSeek一体机或完成其AI一体机对DeepSeek的适配;而从需求侧看,相较于C端用户更能接受调用第三方云厂商API, B端企业更倾向于将模型私有化部署至自有服务器,既彻底杜绝数据外流风险,又能基于业务数据进行领域微调,打造专属智能引擎,这种部署方式尤其在金融、医疗等高合规要求行业更为关键。私有化部署的供需匹配,有望促进一体机市场的全面铺开,促进G端及B端AI场景商业化发展。

RISC-V产业化进程加速,玄铁C930发布助力AI端侧部署。RISC-V技术凭借开源优势,正成为AI时代全球加速布局的关键领域。其中,欧洲高性能计算 (HPC) 联合企业启动了一项 2.4 亿欧元的项目,用于开发AI RISC-V芯片和软件,以避免欧洲超级计算基础设施对非欧洲的硬件和软件解决方案的依赖;而国内更是已经成为RISC-V芯片的主要市场,智研数据显示2023年全球RISC-V芯片出货量超100亿颗,中国厂商占比超过50%。

2025年2月28日,在第三届阿里达摩院玄铁RISC-V生态大会上,中科院软件所表示基于玄铁C920处理器的AI PC概念机已经跑通Llama、Qwen、DeepSeek等开源模型,打通硬件架构、操作系统、AI模型的“开源AI全链路”,单位计算能耗降低30%;同时,达摩院玄铁推出新一代旗舰服务器级处理器C930,将通用高性能算力与 AI 算力原生结合,将于3月陆续开启交付。

随着技术优化打破大模型高算力路径依赖,CPU凭借通用性强、易于调度的特点有望大幅降低算力需求并发挥同构计算的优势,助力边缘和端侧设备单机部署高性能模型。而RISC-V处理器已完成DeepSeek-R1系列蒸馏模型的适配,有望推动数十亿物联网终端加速向AI化转变。此外,RISC-V还具备较强的灵活性和可扩展性,允许开发者根据具体需求定制指令集,更能支持各种应用场景。

3.2 软件:应用及Agent生态逐步完善,大模型安全需求同步提升

大厂接入DeepSeek促进用户量高增,应用生态逐步完善。DeepSeek发布以来,国内大厂加速接入,其中百度于2月16日宣布在百度搜索中全面接入DeepSeek,同时文心智能体平台的开发者也能用DeepSeek模型创建调优智能体;腾讯同样“All in” DeepSeek,元宝、微信、ima、腾讯文档、QQ浏览器等超十四款产品均适配DeepSeek-R1,甚至元宝还支持DeepSeek-R1本身缺失的读图功能;字节同样将旗下飞书、火山引擎、悟空浏览器、即梦、Coze等产品接入DeepSeek,完善产品AI能力。

从新增用户看,据量子位智库统计,仅在AI智能助手赛道,豆包、DeepSeek、Kimi日新增用户即达到50万以上;腾讯元宝、文小言、智谱清言、AI Mate Pro等产品的新增日活超过5万;通义、讯飞星火、天工AI的新增日活也超过1万;从Web端月度流量看,2月各AI智能助手产品月活用户普遍增长,其中元宝增速超7倍,通义千问增速也接近6倍。我们认为,DeepSeek强化了大众对AI产品的认知,有望为AI产品普惠化赋能,从而加速完善AI应用生态。

AI技术持续迭代,Agent赋能千行百业。随着AI技术的深度融合与场景化创新,除企业端应用外,AI Agent亦逐步向政务、医疗、金融、能源、法律及教育等垂直领域加速渗透,推动行业效率与服务模式革新。例如,在政务领域,深圳福田区推出70名基于DeepSeek开发的AI数智员工,定制化开发了覆盖240个场景的个性化智能体,进一步驱动政务效能全面跃升;而在网安领域,启明星辰安恒信息亚信安全等企业均推出了安全智能体,实现对告警信息的自动化研判;在医疗领域,个人、医生及临床诊断助力均能带来智能化健康护理体验;金融与法律领域,财税AI Agent助力企业实现智能开票、风险检测等场景降本增效,百度法律智能体“法行宝”则依托知识图谱与大模型技术,降低专业法律援助门槛。

Manus 带来通用场景Agent想象空间。3月6日凌晨,Monica.im发布其首款AI Agent Manus,在GAIA基准测试(评估通用AI助手解决真实世界问题的能力)中取得所有难度级别的SOTA 表现,引发全网热议。具体而言,官方发布视频中演示了筛选简历、遴选房产、股票价格分析三个案例,Manus能根据用户需求,自主分解任务流程并分步完成,直接交付用户所需的结果。我们认为,Manus在演示视频中主要展现了以下特点,大幅提升了可用性:1)运行在独立虚拟机中,可以在虚拟环境编写代码、浏览网页、调用工具等,支持完全后台操作,用户甚至可以在下达任务后关闭电脑;2)具备记忆能力,能够根据用户反馈优化在类似任务的回答。3)自主对数据交叉验证,降低模型幻觉,大幅提升在B端场景的可用性。

Manus通过极致工程化大幅提升用户体验,OpenAI则推出开发套件供用户自主构建Agent。Manus发布后风评多次反转,一方面部分用户质疑Manus为多款AI工具套壳,缺乏技术含量,更多为营销炒作;另一方面Manus向海外博主开放邀请码,得到包括多位技术大拿在内的良好反馈。3月11日,Manus和阿里通义达成战略合作,更进一步实际证明了套壳类产品的应用价值。同时,3月12日凌晨OpenAI发布Agent工具包和API,降低Agent创建门槛,有望进一步推动Agent发展趋势。我们认为,Manus出圈的重要意义在于提高了大众对于AI Agent的认识,能够加速Agent从B端场景向C端应用的渗透。此外,Manus的爆火也凸显了用户体验的价值,预计工程化将成为后续AI产品迭代的关键。

国家安全中心通报Ollama风险,重视开源趋势下大模型安全需求。3月3日,国家网络安全通报中心通报大模型工具Ollama存在安全风险,攻击者可利用Ollama框架历史漏洞直接调用模型接口实施数据投毒、参数窃取、恶意文件上传及关键组件删除等操作,造成模型服务的核心数据、算法完整性和运行稳定性面临安全风险。实际上,大模型安全已经成为AI时代重要挑战之一,对外需要防范投毒、指令、窃取、对抗等多种攻击方式,对内需要避免大模型内容中可能存在的伦理、偏见等风险。随着AI产业链进一步景气,应用和用户数量将同步提升,尤其开源趋势下大模型和数据安全的重要性有望进一步凸显。

四、投资建议

技术迭代下开源模型性能已逐步追平闭源模型,有望迎来份额拐点;同时,AI技术发展下应用成本进一步降低,商业化价值已然显现,建议关注AI产业持续变化:

1)持续看多大厂资本开支持续下底层算力产业链发展。

2)利好行业Know-how及数据积累充分、客户充足、有具体应用场景的B端和C端软件企业。

3)看好AI产业链配套基础设施建设,建议关注数据处理和大模型安全厂商。

(1)AI产业商业化落地不及预期:目前各环节AI 产品的商业化模式尚处于探索阶段,如果各环节产品的推进节奏不及预期,或对相关企业业绩造成不利影响;(2)市场竞争风险:海外 AI 厂商凭借先发优势,以及较强的技术积累,在竞争中处于优势地位,如果国内 AI 厂商技术迭代不及预期,经营状况或将受到影响;同时,目前国内已有众多企业投入AI产品研发,后续可能存在同质化竞争风险,进而影响相关企业的收入;(3)政策风险:AI技术的发展直接受各国政策和监管影响。随着AI在各个领域的渗透,政府可能会进一步出台相应的监管政策以规范其发展。如果企业未能及时适应和遵守相关政策,可能面临相应处罚,甚至被迫调整业务策略。此外,政策的不确定性也可能导致企业战略规划和投资决策的错误,增加运营的不确定性;(4)地缘政治风险:在全球地缘政治环境的波动下,尤其美国对中国的出口限制或将直接影响国内企业算力芯片的获取,进而影响其产品研发和市场竞争力。同时,地缘政治风险也可能导致 AI 产品开拓海外市场面临障碍,影响相关企业的营收情况。

(文章来源:人民财讯)

(原标题:中信建投:AI产业链硬件和软件同频共振 建议关注AI产业持续变化)

(责任编辑:70)

展开
打开“财经头条”阅读更多精彩资讯
APP内打开