人工智能产业正经历从训练向推理的关键跨越。昔日模型多局限于基础问答,如今已进化出文档解析、代码编写乃至复杂任务的自主规划能力,这种质变直接引爆了底层算力消耗,呈现指数级增长。面对激增的需求,全球算力硬件采购成本水涨船高,各大云服务厂商纷纷上调算力租用及模型调用价格。
从发展路径看,英伟达GTC 2026大会揭示了AI演进的三段论:始于以ChatGPT为代表的生成式AI,计算架构从检索转向生成;进阶至以o1/o3为代表的推理AI,模型具备反思与规划能力,Token消耗量激增,推理拐点显现;最终迈向以Claude Code为代表的代理AI,模型能自主执行文件读写、代码编译与迭代,英伟达内部已全员启用AI代理辅助编程,传统软件工程格局正在重塑。过去两年,计算需求暴涨约1万倍,实际使用量增长百倍,推理需求已渗透至应用末梢。
Token调用量是算力饥渴的最直接镜像
以OpenClaw为代表的AI智能体,单次互动Token消耗可达传统AI的10至100倍,视频生成等场景更成新消耗大户。国内字节跳动火山引擎披露,豆包大模型2026年3月日均Token调用量突破120万亿,三个月翻番,较2024年5月增长高达1000倍。海外Anthropic的Claude Opus 4.6及Code工具需求井喷,2026年4月年度经常性收入飙至300亿美元,单季增长超三倍,其代理工具已深入软件工程、后台自动化及金融会计等实体产业。
国产大模型在海外表现尤为亮眼
OpenRouter数据显示,2026年3月底至4月中旬,全球周调用量Top 6甚至Top 9的大模型中,中国模型占据绝对主导,已连续六周超越美国。Kimi海外收入在2026年2月反超国内,近20天内收入超过2025年全年,估值三月翻四倍达180亿美元;MiniMax 2025年海外收入占比达73%。依托国内11.25亿网民和6.02亿生成式AI用户的庞大市场,国产模型的技术实力与商业化能力已获全球验证。
算力租赁企业正重构AI基础设施服务模式
以CoreWeave为例,其通过三层架构提供服务:基础设施层提供裸金属GPU租赁,利用InfiniBand网络消除虚拟化损耗,专攻高强度训练与渲染;管理层提供预配置托管环境,利用BlueField 3 DPU实现网络隔离加速;应用层集成推理加速与实时监控。收费以2-5年期承诺制合同为主,按“每GPU每小时”计费,签约预付15%-25%款项,按需付费作为补充。业务初期需承担机房租金、电费及设备折旧,进入稳态运营后,长期利润率可达25%-30%。随着服务器折旧完成,后期租金将大部分转化为净利润,呈现“前低后高”的利润阶梯式增长。值得注意的是,老旧显卡因在推理和部分训练场景中仍具极高性价比,其折旧期满后的残值面临重估。
供需严重失衡引爆全球算力涨价潮
SemiAnalysis数据显示,2026年Q1,LPDDR5和DDR5合同价同比暴涨4倍和5倍。服务器厂商为转嫁成本,大幅上调AI服务器售价,涨幅远超组件成本增幅,导致部分运营商推迟部署计划。GPU租赁价格不降反升:尽管市场曾预期Blackwell架构量产会导致Hopper(H100/H200)价格下跌,但爆款应用带来的需求激增完全抵消了供给增加。H100一年期租约价格从2025年10月的1.70美元/小时涨至2026年3月的2.35美元/小时,涨幅近40%,按需租赁容量全线售罄。
国内云厂商集体调价印证行业共识
腾讯云3月13日起,GLM 5、MiniMax 2.5、Kimi 2.5结束免费公测转为商用,混元系列模型价格涨幅超400%;5月9日起,AI算力及存储产品上调5%-30%。阿里云4月18日起,平头哥算力卡涨价5%-34%,CPFS智算存储涨30%;5月15日起,部分模型服务涨价2%-7%。百度云4月18日起,AI算力相关产品上调5%-30%,并行文件存储涨约30%。
面对算力稀缺与价格上行,国内头部企业正利用资金优势加速卡位。协创数据2025年授信额度不超515亿元,2026年已申请500亿元,并推进H股上市;宏景科技2025年授信200亿元,2026年拟申请600亿元,拟定增12.9亿元(9.9亿元用于算力集群建设);盛视科技2026年授信不超230亿元;利通电子拟注册发行不超5亿元超短期融资券及5亿元中期票据,已发行2亿元科创债专项购设备;智微智能2025年授信不超90亿元,2026年申请140亿元。
巨额资本开支印证需求刚性
北美五大云厂(谷歌、微软、亚马逊、Meta、甲骨文)合计资本开支:2024年2611亿美元(+62%),2025年4490亿美元(+72%),预计2026年达7295亿美元(+62%)。国内三大云厂(腾讯、阿里、字节)合计资本开支:2024年3523亿元(+54%),2025年4244亿元(+20%)。这些资金主要投向AI基础设施,为算力租赁行业提供了确定性的长期需求支撑。
算力租赁相关公司
世纪华通:算力租赁业务由控股子公司上海世纪珑腾数据承担,提供IDC运维与算力租赁服务,并与腾讯、华为等合作。
超讯通信:主营智算与信通业务,算力租赁通过自建多个算力中心,提供机柜租赁与定制化算力服务。
南兴股份:算力租赁业务包括建设绿色数据中心(拥有超4000个机柜)及运营覆盖18个省的数据中心节点。
002***:旗下兆瀚AI算力中心提供算力租赁服务,覆盖大模型训练等场景。
301***:核心业务为算力租赁(占比超90%),覆盖大模型训练、科学计算等场景。
... ...
扫码回复“8-算力租赁”查看行业公司介绍,并可免费诊股,还可咨询实操指导服务!
作者:于晓明 执业证书编号:A0680622030012
人工智能产业正经历从训练向推理的关键跨越。昔日模型多局限于基础问答,如今已进化出文档解析、代码编写乃至复杂任务的自主规划能力,这种质变直接引爆了底层算力消耗,呈现指数级增长。面对激增的需求,全球算力硬件采购成本水涨船高,各大云服务厂商纷纷上调算力租用及模型调用价格。
从发展路径看,英伟达GTC 2026大会揭示了AI演进的三段论:始于以ChatGPT为代表的生成式AI,计算架构从检索转向生成;进阶至以o1/o3为代表的推理AI,模型具备反思与规划能力,Token消耗量激增,推理拐点显现;最终迈向以Claude Code为代表的代理AI,模型能自主执行文件读写、代码编译与迭代,英伟达内部已全员启用AI代理辅助编程,传统软件工程格局正在重塑。过去两年,计算需求暴涨约1万倍,实际使用量增长百倍,推理需求已渗透至应用末梢。
Token调用量是算力饥渴的最直接镜像
以OpenClaw为代表的AI智能体,单次互动Token消耗可达传统AI的10至100倍,视频生成等场景更成新消耗大户。国内字节跳动火山引擎披露,豆包大模型2026年3月日均Token调用量突破120万亿,三个月翻番,较2024年5月增长高达1000倍。海外Anthropic的Claude Opus 4.6及Code工具需求井喷,2026年4月年度经常性收入飙至300亿美元,单季增长超三倍,其代理工具已深入软件工程、后台自动化及金融会计等实体产业。
国产大模型在海外表现尤为亮眼
OpenRouter数据显示,2026年3月底至4月中旬,全球周调用量Top 6甚至Top 9的大模型中,中国模型占据绝对主导,已连续六周超越美国。Kimi海外收入在2026年2月反超国内,近20天内收入超过2025年全年,估值三月翻四倍达180亿美元;MiniMax 2025年海外收入占比达73%。依托国内11.25亿网民和6.02亿生成式AI用户的庞大市场,国产模型的技术实力与商业化能力已获全球验证。
算力租赁企业正重构AI基础设施服务模式
以CoreWeave为例,其通过三层架构提供服务:基础设施层提供裸金属GPU租赁,利用InfiniBand网络消除虚拟化损耗,专攻高强度训练与渲染;管理层提供预配置托管环境,利用BlueField 3 DPU实现网络隔离加速;应用层集成推理加速与实时监控。收费以2-5年期承诺制合同为主,按“每GPU每小时”计费,签约预付15%-25%款项,按需付费作为补充。业务初期需承担机房租金、电费及设备折旧,进入稳态运营后,长期利润率可达25%-30%。随着服务器折旧完成,后期租金将大部分转化为净利润,呈现“前低后高”的利润阶梯式增长。值得注意的是,老旧显卡因在推理和部分训练场景中仍具极高性价比,其折旧期满后的残值面临重估。
供需严重失衡引爆全球算力涨价潮
SemiAnalysis数据显示,2026年Q1,LPDDR5和DDR5合同价同比暴涨4倍和5倍。服务器厂商为转嫁成本,大幅上调AI服务器售价,涨幅远超组件成本增幅,导致部分运营商推迟部署计划。GPU租赁价格不降反升:尽管市场曾预期Blackwell架构量产会导致Hopper(H100/H200)价格下跌,但爆款应用带来的需求激增完全抵消了供给增加。H100一年期租约价格从2025年10月的1.70美元/小时涨至2026年3月的2.35美元/小时,涨幅近40%,按需租赁容量全线售罄。
国内云厂商集体调价印证行业共识
腾讯云3月13日起,GLM 5、MiniMax 2.5、Kimi 2.5结束免费公测转为商用,混元系列模型价格涨幅超400%;5月9日起,AI算力及存储产品上调5%-30%。阿里云4月18日起,平头哥算力卡涨价5%-34%,CPFS智算存储涨30%;5月15日起,部分模型服务涨价2%-7%。百度云4月18日起,AI算力相关产品上调5%-30%,并行文件存储涨约30%。
面对算力稀缺与价格上行,国内头部企业正利用资金优势加速卡位。协创数据2025年授信额度不超515亿元,2026年已申请500亿元,并推进H股上市;宏景科技2025年授信200亿元,2026年拟申请600亿元,拟定增12.9亿元(9.9亿元用于算力集群建设);盛视科技2026年授信不超230亿元;利通电子拟注册发行不超5亿元超短期融资券及5亿元中期票据,已发行2亿元科创债专项购设备;智微智能2025年授信不超90亿元,2026年申请140亿元。
巨额资本开支印证需求刚性
北美五大云厂(谷歌、微软、亚马逊、Meta、甲骨文)合计资本开支:2024年2611亿美元(+62%),2025年4490亿美元(+72%),预计2026年达7295亿美元(+62%)。国内三大云厂(腾讯、阿里、字节)合计资本开支:2024年3523亿元(+54%),2025年4244亿元(+20%)。这些资金主要投向AI基础设施,为算力租赁行业提供了确定性的长期需求支撑。
算力租赁相关公司
世纪华通:算力租赁业务由控股子公司上海世纪珑腾数据承担,提供IDC运维与算力租赁服务,并与腾讯、华为等合作。
超讯通信:主营智算与信通业务,算力租赁通过自建多个算力中心,提供机柜租赁与定制化算力服务。
南兴股份:算力租赁业务包括建设绿色数据中心(拥有超4000个机柜)及运营覆盖18个省的数据中心节点。
002***:旗下兆瀚AI算力中心提供算力租赁服务,覆盖大模型训练等场景。
301***:核心业务为算力租赁(占比超90%),覆盖大模型训练、科学计算等场景。
... ...
扫码回复“8-算力租赁”查看行业公司介绍,并可免费诊股,还可咨询实操指导服务!
作者:于晓明 执业证书编号:A0680622030012