未来智造局 | 透视大模型“出海”热：“Token经济”渐行渐近

财经头条

提升一亿中产阶级阅读效率

打开

新华财经

9小时前

这使得在同款芯片上部署的大模型，可实现单位算力生产Token的数量更多、更高效，从而为全球开发者提供了更高性价比的产品API（应用编程接口）服务。

未来智造局 logo.jpeg

新华财经上海3月22日电（记者杜康）最近一周，OpenRouter全球榜单上，三款中国大模型依然占据Token调用前五位。OpenRouter是海外重要的多模型聚合与分发平台之一，也是观察全球大模型调用热度的重要窗口。与此同时，围绕AI服务的价格与收费方式，国内外厂商也在加快调整。

AI时代，Token是指词元，即模型处理和生成信息的基本单位，可以是一个词、一段代码，甚至是图像与视频中的一个像素区块。调用增长与价格变化并行，显示大模型竞争正由“拼发布、拼榜单”转向更关注真实使用、持续消耗和可计费能力。随着围绕Token形成的调用、计量、定价和变现链条逐步清晰，“Token经济”正在加速崛起。

中国大模型海外调用量持续走高

OpenRouter平台数据显示，2026年2月16日至22日，中国人工智能大模型周度Tokens调用量曾达到5.16万亿，三周内大涨127%，占平台头部模型总调用量约61%，高于同期美国大模型的占比。

进入3月后，中国大模型继续保持较高热度，包括MiniMax M2.5、Kimi K2.5、GLM-5、DeepSeekV3.2等国产大模型多次位列平台调用量前五。

从任务结构看，中国大模型的海外使用方式也在发生变化。OpenRouter报告显示，在中国开源大模型的任务分布中，编程与技术类任务合计占比已达39%。这表明，国产大模型的应用正更多进入代码生成、技术支持和基础设施相关场景，而不再主要停留在创意生成等轻量任务。

价格端的变化同样值得关注。2月12日，智谱发布新一代旗舰模型 GLM-5，并同步上调了 GLM Coding Plan 套餐和 API 价格。据测算，GLM-5 相对 GLM-4.7 平均涨价约 50%。3月16日，智谱又发布 GLM-5-Turbo，并再次同步调价，相对 GLM-5 再涨约20%。腾讯云智能体开发平台近日也宣布对部分大模型计费策略进行优化，混元系列部分服务价格上调。

作为大模型处理文本的基本计量单位，Token调用量比单纯用户数更能反映大模型使用强度、黏性和潜在商业价值。种种趋势显示，大模型厂商已具备将算力资源与产品能力打包为可持续收入的能力，也标志着国内大模型商业化从“用户尝鲜”进入“刚性付费”阶段。

从“会聊天”到“会干活” Agent拉长Token消耗链条

中国大模型为何在此时“爆火”？一个重要原因在于，国产大模型已经足够“好用”。根据Artificial Analysis主流大模型智能水平评测数据显示，多个国产大模型性能跻身全球第一梯队，在可编程、多模态、长上下文推理上与国际头部模型差距持续收窄。

更直接的推动力，则来自Agent（智能体）的应用落地，让国产大模型的高性价比优势进一步凸显。

MiniMax在OpenRouter上连续几周调用量居首位。关于这一波中国大模型热，MiniMax副总裁严奕骏表示，近期以“小龙虾”为代表的Agent工具兴起，推动大模型加快进入编程、办公等高频场景。“任务链更长、调用更连续、记忆需求更多，都会带来Token消耗大幅增长。”

OpenRouter去年12月份发布的报告指出，全球关于大模型的使用正从单轮生成转向多步任务和Agent式推理。大模型调用不再只是一次性问答，而是越来越多嵌入更长链条的执行流程。这一变化直接推高了Token消耗，也对模型成本、稳定性和更新速度提出了更高要求。

全球知名市场咨询机构高德纳（Gartner）研究总监闫斌提到，Agent应用推广落地，对于Token需求大增的同时，用户对于价格的敏感度明显上升。普通聊天机器人（Chatbot）完成一次简短对话只需消耗数百Token，而Agent在执行编程、检索、调用工具、反复校验等长链条任务时，Token消耗可能达到数百万级。有海外用户表示，“小龙虾”一周的Token花费高达1500美元。

“中国大模型的Token价格仅为部分海外大模型的十分之一，这对于全球开发者来说，无疑具有很大吸引力。”闫斌表示。

低价优势背后，是推理效率和工程能力的持续提升。严奕骏解释称，得益于算法优化，截至2026年2月，M2系列文本模型每百万Token的推理算力成本较2025年12月下降超过50%，海螺视频生成模型推理延迟同期下降超过30%。

硅基流动作为 OpenRouter上的AI推理服务供应商，提供了极具竞争力的Token价格。其业务负责人表示，“我们的定价优势源于算法、系统与硬件的工程协同优化。通过自研的推理加速引擎与异构算力纳管平台，硅基流动对热门开源大模型进行了深度适配与优化，最大化提升算力效率。这使得在同款芯片上部署的大模型，可实现单位算力生产Token的数量更多、更高效，从而为全球开发者提供了更高性价比的产品API（应用编程接口）服务。”

大模型厂商“拼变现” Token经济走向台前

Token用量攀升，也让大模型商业化拥有了更具体的观察指标。

过去，市场更多依据参数规模、测评成绩、融资金额和用户声量判断大模型公司。如今，Token持续调用能力、付费转化能力以及收入兑现情况，正成为更贴近商业现实的指标。

不过，Token调用量的增长，并不能等同于企业实现商业化盈利。上海市数字企业出海服务协会副秘书长郑茂宽表示，大模型成本构成多元，既包括推理计算成本，也涵盖前期模型研发、训练、电力消耗及工程运维等全链条投入。仅从推理环节来看，在当前部分定价机制下，部分大模型服务未必亏损；但若将训练与研发等前期投入纳入全成本核算，绝大多数企业仍处于持续投入阶段。

智源研究院战略研究中心资深行业研究员陈泓伊表示，Token消耗仍是当前大模型企业最主要的变现基础，但在不同市场，其表现形式并不一致。在个人消费者市场，更多体现为订阅费和工具付费；在企业端市场，则更多体现为API调用、私有部署及配套工程服务。不同厂商之间的成本差异，也与算力来源、部署方式和交付模式密切相关。

值得注意的是，尽管行业尚未形成统一的Token定价体系，但围绕Token的分层定价思路已越来越清晰。随着模型大小、上下文长度、响应速度和服务稳定性不同，企业对Token的定价也开始呈现出明显分层趋势。

英伟达创始人黄仁勋近期在演讲中提到，未来企业围绕AI产生的Token开销，可能会像电脑、软件一样，成为单独列支的预算项目。这一判断的背后，是AI正从实验工具变成基础生产力工具，而Token则逐渐成为衡量这类生产力消耗的基本单位。

整体看，Token经济已现雏形，但距离稳定、成熟的商业闭环仍有距离。对于当下的大模型厂商而言，能否持续迭代模型能力、稳住调用规模、提升付费转化，仍将决定其能否留在下一轮竞争的“牌桌”上。

“大模型时代，建立平台优势或者生态优势变得更难。大模型几乎以三个月一更新的速度不断往前迭代，落后一两代，用户就可能转身离开。所以必须不断奔跑。”有行业人士对记者表示。

编辑：李一帆

声明：新华财经（中国金融信息网）为新华社承建的国家金融信息平台。任何情况下，本平台所发布的信息均不构成投资建议。如有问题，请联系客服：400-6123115