未来智造局 | 透视大模型“出海”热:“Token经济”渐行渐近

新华财经

9小时前

这使得在同款芯片上部署的大模型,可实现单位算力生产Token的数量更多、更高效,从而为全球开发者提供了更高性价比的产品API(应用编程接口)服务。

未来智造局 logo.jpeg

新华财经上海3月22日电(记者 杜康)最近一周,OpenRouter全球榜单上,三款中国大模型依然占据Token调用前五位。OpenRouter是海外重要的多模型聚合与分发平台之一,也是观察全球大模型调用热度的重要窗口。与此同时,围绕AI服务的价格与收费方式,国内外厂商也在加快调整。

AI时代,Token是指词元,即模型处理和生成信息的基本单位,可以是一个词、一段代码,甚至是图像与视频中的一个像素区块。调用增长与价格变化并行,显示大模型竞争正由“拼发布、拼榜单”转向更关注真实使用、持续消耗和可计费能力。随着围绕Token形成的调用、计量、定价和变现链条逐步清晰,“Token经济”正在加速崛起。

中国大模型海外调用量持续走高

OpenRouter平台数据显示,2026年2月16日至22日,中国人工智能大模型周度Tokens调用量曾达到5.16万亿,三周内大涨127%,占平台头部模型总调用量约61%,高于同期美国大模型的占比。

进入3月后,中国大模型继续保持较高热度,包括MiniMax M2.5、Kimi K2.5、GLM-5、DeepSeekV3.2等国产大模型多次位列平台调用量前五。

从任务结构看,中国大模型的海外使用方式也在发生变化。OpenRouter报告显示,在中国开源大模型的任务分布中,编程与技术类任务合计占比已达39%。这表明,国产大模型的应用正更多进入代码生成、技术支持和基础设施相关场景,而不再主要停留在创意生成等轻量任务。

价格端的变化同样值得关注。2月12日,智谱发布新一代旗舰模型 GLM-5,并同步上调了 GLM Coding Plan 套餐和 API 价格。据测算,GLM-5 相对 GLM-4.7 平均涨价约 50%。3月16日,智谱又发布 GLM-5-Turbo,并再次同步调价,相对 GLM-5 再涨约20%。腾讯云智能体开发平台近日也宣布对部分大模型计费策略进行优化,混元系列部分服务价格上调。

作为大模型处理文本的基本计量单位,Token调用量比单纯用户数更能反映大模型使用强度、黏性和潜在商业价值。种种趋势显示,大模型厂商已具备将算力资源与产品能力打包为可持续收入的能力,也标志着国内大模型商业化从“用户尝鲜”进入“刚性付费”阶段。

从“会聊天”到“会干活”  Agent拉长Token消耗链条

中国大模型为何在此时“爆火”?一个重要原因在于,国产大模型已经足够“好用”。根据Artificial Analysis主流大模型智能水平评测数据显示,多个国产大模型性能跻身全球第一梯队,在可编程、多模态、长上下文推理上与国际头部模型差距持续收窄。

更直接的推动力,则来自Agent(智能体)的应用落地,让国产大模型的高性价比优势进一步凸显。

MiniMax在OpenRouter上连续几周调用量居首位。关于这一波中国大模型热,MiniMax副总裁严奕骏表示,近期以“小龙虾”为代表的Agent工具兴起,推动大模型加快进入编程、办公等高频场景。“任务链更长、调用更连续、记忆需求更多,都会带来Token消耗大幅增长。”

OpenRouter去年12月份发布的报告指出,全球关于大模型的使用正从单轮生成转向多步任务和Agent式推理。大模型调用不再只是一次性问答,而是越来越多嵌入更长链条的执行流程。这一变化直接推高了Token消耗,也对模型成本、稳定性和更新速度提出了更高要求。

全球知名市场咨询机构高德纳(Gartner)研究总监闫斌提到,Agent应用推广落地,对于Token需求大增的同时,用户对于价格的敏感度明显上升。普通聊天机器人(Chatbot)完成一次简短对话只需消耗数百Token,而Agent在执行编程、检索、调用工具、反复校验等长链条任务时,Token消耗可能达到数百万级。有海外用户表示,“小龙虾”一周的Token花费高达1500美元。

“中国大模型的Token价格仅为部分海外大模型的十分之一,这对于全球开发者来说,无疑具有很大吸引力。”闫斌表示。

低价优势背后,是推理效率和工程能力的持续提升。严奕骏解释称,得益于算法优化,截至2026年2月,M2系列文本模型每百万Token的推理算力成本较2025年12月下降超过50%,海螺视频生成模型推理延迟同期下降超过30%。

硅基流动作为 OpenRouter上的AI推理服务供应商,提供了极具竞争力的Token价格。其业务负责人表示,“我们的定价优势源于算法、系统与硬件的工程协同优化。通过自研的推理加速引擎与异构算力纳管平台,硅基流动对热门开源大模型进行了深度适配与优化,最大化提升算力效率。这使得在同款芯片上部署的大模型,可实现单位算力生产Token的数量更多、更高效,从而为全球开发者提供了更高性价比的产品API(应用编程接口) 服务。”

大模型厂商“拼变现”  Token经济走向台前

Token用量攀升,也让大模型商业化拥有了更具体的观察指标。

过去,市场更多依据参数规模、测评成绩、融资金额和用户声量判断大模型公司。如今,Token持续调用能力、付费转化能力以及收入兑现情况,正成为更贴近商业现实的指标。

不过,Token调用量的增长,并不能等同于企业实现商业化盈利。上海市数字企业出海服务协会副秘书长郑茂宽表示,大模型成本构成多元,既包括推理计算成本,也涵盖前期模型研发、训练、电力消耗及工程运维等全链条投入。仅从推理环节来看,在当前部分定价机制下,部分大模型服务未必亏损;但若将训练与研发等前期投入纳入全成本核算,绝大多数企业仍处于持续投入阶段。

智源研究院战略研究中心资深行业研究员陈泓伊表示,Token消耗仍是当前大模型企业最主要的变现基础,但在不同市场,其表现形式并不一致。在个人消费者市场,更多体现为订阅费和工具付费;在企业端市场,则更多体现为API调用、私有部署及配套工程服务。不同厂商之间的成本差异,也与算力来源、部署方式和交付模式密切相关。

值得注意的是,尽管行业尚未形成统一的Token定价体系,但围绕Token的分层定价思路已越来越清晰。随着模型大小、上下文长度、响应速度和服务稳定性不同,企业对Token的定价也开始呈现出明显分层趋势。

英伟达创始人黄仁勋近期在演讲中提到,未来企业围绕AI产生的Token开销,可能会像电脑、软件一样,成为单独列支的预算项目。这一判断的背后,是AI正从实验工具变成基础生产力工具,而Token则逐渐成为衡量这类生产力消耗的基本单位。

整体看,Token经济已现雏形,但距离稳定、成熟的商业闭环仍有距离。对于当下的大模型厂商而言,能否持续迭代模型能力、稳住调用规模、提升付费转化,仍将决定其能否留在下一轮竞争的“牌桌”上。

“大模型时代,建立平台优势或者生态优势变得更难。大模型几乎以三个月一更新的速度不断往前迭代,落后一两代,用户就可能转身离开。所以必须不断奔跑。”有行业人士对记者表示。

编辑:李一帆

声明:新华财经(中国金融信息网)为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115

这使得在同款芯片上部署的大模型,可实现单位算力生产Token的数量更多、更高效,从而为全球开发者提供了更高性价比的产品API(应用编程接口)服务。

未来智造局 logo.jpeg

新华财经上海3月22日电(记者 杜康)最近一周,OpenRouter全球榜单上,三款中国大模型依然占据Token调用前五位。OpenRouter是海外重要的多模型聚合与分发平台之一,也是观察全球大模型调用热度的重要窗口。与此同时,围绕AI服务的价格与收费方式,国内外厂商也在加快调整。

AI时代,Token是指词元,即模型处理和生成信息的基本单位,可以是一个词、一段代码,甚至是图像与视频中的一个像素区块。调用增长与价格变化并行,显示大模型竞争正由“拼发布、拼榜单”转向更关注真实使用、持续消耗和可计费能力。随着围绕Token形成的调用、计量、定价和变现链条逐步清晰,“Token经济”正在加速崛起。

中国大模型海外调用量持续走高

OpenRouter平台数据显示,2026年2月16日至22日,中国人工智能大模型周度Tokens调用量曾达到5.16万亿,三周内大涨127%,占平台头部模型总调用量约61%,高于同期美国大模型的占比。

进入3月后,中国大模型继续保持较高热度,包括MiniMax M2.5、Kimi K2.5、GLM-5、DeepSeekV3.2等国产大模型多次位列平台调用量前五。

从任务结构看,中国大模型的海外使用方式也在发生变化。OpenRouter报告显示,在中国开源大模型的任务分布中,编程与技术类任务合计占比已达39%。这表明,国产大模型的应用正更多进入代码生成、技术支持和基础设施相关场景,而不再主要停留在创意生成等轻量任务。

价格端的变化同样值得关注。2月12日,智谱发布新一代旗舰模型 GLM-5,并同步上调了 GLM Coding Plan 套餐和 API 价格。据测算,GLM-5 相对 GLM-4.7 平均涨价约 50%。3月16日,智谱又发布 GLM-5-Turbo,并再次同步调价,相对 GLM-5 再涨约20%。腾讯云智能体开发平台近日也宣布对部分大模型计费策略进行优化,混元系列部分服务价格上调。

作为大模型处理文本的基本计量单位,Token调用量比单纯用户数更能反映大模型使用强度、黏性和潜在商业价值。种种趋势显示,大模型厂商已具备将算力资源与产品能力打包为可持续收入的能力,也标志着国内大模型商业化从“用户尝鲜”进入“刚性付费”阶段。

从“会聊天”到“会干活”  Agent拉长Token消耗链条

中国大模型为何在此时“爆火”?一个重要原因在于,国产大模型已经足够“好用”。根据Artificial Analysis主流大模型智能水平评测数据显示,多个国产大模型性能跻身全球第一梯队,在可编程、多模态、长上下文推理上与国际头部模型差距持续收窄。

更直接的推动力,则来自Agent(智能体)的应用落地,让国产大模型的高性价比优势进一步凸显。

MiniMax在OpenRouter上连续几周调用量居首位。关于这一波中国大模型热,MiniMax副总裁严奕骏表示,近期以“小龙虾”为代表的Agent工具兴起,推动大模型加快进入编程、办公等高频场景。“任务链更长、调用更连续、记忆需求更多,都会带来Token消耗大幅增长。”

OpenRouter去年12月份发布的报告指出,全球关于大模型的使用正从单轮生成转向多步任务和Agent式推理。大模型调用不再只是一次性问答,而是越来越多嵌入更长链条的执行流程。这一变化直接推高了Token消耗,也对模型成本、稳定性和更新速度提出了更高要求。

全球知名市场咨询机构高德纳(Gartner)研究总监闫斌提到,Agent应用推广落地,对于Token需求大增的同时,用户对于价格的敏感度明显上升。普通聊天机器人(Chatbot)完成一次简短对话只需消耗数百Token,而Agent在执行编程、检索、调用工具、反复校验等长链条任务时,Token消耗可能达到数百万级。有海外用户表示,“小龙虾”一周的Token花费高达1500美元。

“中国大模型的Token价格仅为部分海外大模型的十分之一,这对于全球开发者来说,无疑具有很大吸引力。”闫斌表示。

低价优势背后,是推理效率和工程能力的持续提升。严奕骏解释称,得益于算法优化,截至2026年2月,M2系列文本模型每百万Token的推理算力成本较2025年12月下降超过50%,海螺视频生成模型推理延迟同期下降超过30%。

硅基流动作为 OpenRouter上的AI推理服务供应商,提供了极具竞争力的Token价格。其业务负责人表示,“我们的定价优势源于算法、系统与硬件的工程协同优化。通过自研的推理加速引擎与异构算力纳管平台,硅基流动对热门开源大模型进行了深度适配与优化,最大化提升算力效率。这使得在同款芯片上部署的大模型,可实现单位算力生产Token的数量更多、更高效,从而为全球开发者提供了更高性价比的产品API(应用编程接口) 服务。”

大模型厂商“拼变现”  Token经济走向台前

Token用量攀升,也让大模型商业化拥有了更具体的观察指标。

过去,市场更多依据参数规模、测评成绩、融资金额和用户声量判断大模型公司。如今,Token持续调用能力、付费转化能力以及收入兑现情况,正成为更贴近商业现实的指标。

不过,Token调用量的增长,并不能等同于企业实现商业化盈利。上海市数字企业出海服务协会副秘书长郑茂宽表示,大模型成本构成多元,既包括推理计算成本,也涵盖前期模型研发、训练、电力消耗及工程运维等全链条投入。仅从推理环节来看,在当前部分定价机制下,部分大模型服务未必亏损;但若将训练与研发等前期投入纳入全成本核算,绝大多数企业仍处于持续投入阶段。

智源研究院战略研究中心资深行业研究员陈泓伊表示,Token消耗仍是当前大模型企业最主要的变现基础,但在不同市场,其表现形式并不一致。在个人消费者市场,更多体现为订阅费和工具付费;在企业端市场,则更多体现为API调用、私有部署及配套工程服务。不同厂商之间的成本差异,也与算力来源、部署方式和交付模式密切相关。

值得注意的是,尽管行业尚未形成统一的Token定价体系,但围绕Token的分层定价思路已越来越清晰。随着模型大小、上下文长度、响应速度和服务稳定性不同,企业对Token的定价也开始呈现出明显分层趋势。

英伟达创始人黄仁勋近期在演讲中提到,未来企业围绕AI产生的Token开销,可能会像电脑、软件一样,成为单独列支的预算项目。这一判断的背后,是AI正从实验工具变成基础生产力工具,而Token则逐渐成为衡量这类生产力消耗的基本单位。

整体看,Token经济已现雏形,但距离稳定、成熟的商业闭环仍有距离。对于当下的大模型厂商而言,能否持续迭代模型能力、稳住调用规模、提升付费转化,仍将决定其能否留在下一轮竞争的“牌桌”上。

“大模型时代,建立平台优势或者生态优势变得更难。大模型几乎以三个月一更新的速度不断往前迭代,落后一两代,用户就可能转身离开。所以必须不断奔跑。”有行业人士对记者表示。

编辑:李一帆

声明:新华财经(中国金融信息网)为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115

展开
打开“财经头条”阅读更多精彩资讯
APP内打开