“ 英伟达的 GPU 一直是训练大型语言模型的黄金标准。 ”
作者 | RichardSaintvilus
编译 | 华尔街大事件
人工智能刚刚进入一个新时代。OpenAI 发布了新的 o3 模型,该模型在臭名昭著的ARC-AGI-Pub 基准测试中获得了惊人的75.7% 的分数,代表了人工智能能力的一次巨大飞跃。这不仅仅是另一个增量收益(在 GPT-4 的突破性发布后我们已经习惯了),而是一个革命性事件,改变了我们对智能机器能做什么的理解。多年来,高级 LLM(大型语言模型)一直在努力执行真正新颖的任务。事实上,GPT-3 在 ARC-AGI 的适应性基准测量中得分为 0%,而 GPT-4 几乎没有提高。
OpenAI 的 o3 模型几乎是突然之间打破了这些假设,并表明真正强大、灵活的即时推理不再是遥不可及的梦想,而是现实。这一发现最令人震惊的方面是,o 系列测试时间计算模型在很大程度上仍处于起步阶段,这意味着这些模型的未来迭代可能会比 o3 表现得更好。然而,伴随着这种兴奋而来的是新的挑战。o3 的突破是由大规模测试时间计算驱动的。
o3 不是简单地通过扩大预训练规模来训练更大的模型,而是在推理时需要更多的计算能力。每个查询不仅仅是快速查找,而是在巨大的“程序空间”中进行搜索,这需要数千万个标记和惊人的 GPU 周期来解决单个复杂任务。这种新模式将需要对推理芯片的需求呈指数级增长,以及价值数十亿美元的额外加速器容量。更重要的是,扩展测试时间计算的有效性仍然没有明确的终点,因此需求只能从现在开始呈指数级增长。
在这一重大转变中,英伟达(NASDAQ:NVDA)脱颖而出,在构建下一代 AI 基础设施方面占据独特地位。长期以来,英伟达的 GPU 一直是训练大型语言模型的黄金标准。现在,随着 o3 引领未来,而未来很可能由测试时间计算定义,英伟达 无与伦比的协调复杂全球 AI 供应链的能力为其带来了巨大的战略优势。通过按需提供由数千个 GPU、DPU、专用内存和网络设备组成的 AI“工厂”,英伟达已经做好准备,为 o3 级模型及其他模型所需的前所未有的推理能力提供硬件。
o3 模型彻底打破了 ARC 基准测试的先前记录。
多年来,大型语言模型凭借真正先进的模式识别给我们留下了深刻的印象,但在需要真正新颖性的问题上却表现糟糕。例如,GPT-4 和其他同等基础模型(如 Claude 或 Gemini)能够在已知任务和基准上取得世界级的成果,但在应对真正新的挑战时却举步维艰。“越来越大的模型”会不断转化为更智能的模型这一假设已经遭遇挫折。
OpenAI 的 o 系列模型承诺,一种不同的方法(涉及密集的测试时间搜索、推理链和自适应解决方案生成)可以突破这一障碍。虽然 o1 的结果很有希望,但它并没有像 o3 的结果那样真正打破预期。然而,这一新突破意味着推理将不再是廉价和琐碎的,而是密集和探索性的。OpenAI 的 o3 现在可以协调复杂的推理过程,而不是在推理时快速运行静态、预先烘焙的模型,这些过程每个查询会消耗大量的 GPU 周期。这意味着需要有越来越大的推理集群大小,以适应“即时搜索”工作负载。
以下是 ARC 测试中的一些任务。
人工智能对硬件的需求增长历来是由训练更大的语言模型推动的。经过训练后,这些基础模型的推理成本相对可预测且稳定。然而,o3 的成功表明,测试时间计算即将爆发。想象一个世界,每个复杂的问题都会触发一个极其复杂和复杂的标记搜索,涵盖数十亿甚至数万亿个参数。随着人工智能越来越多地嵌入到企业工作流程、消费者服务甚至主权数据中心,此类查询的数量可能会呈指数级飙升。
这种新模式有一个重要的组成部分,投资者应该明白:测试时间扩展还没有明显的上限。这意味着,只要用户想要更聪明、更能感知环境、推理能力堪比人类专家的人工智能,推理的计算强度就会继续呈指数级增长。每一代新模型几乎肯定会进一步推动这一进程,从而需要更多的 GPU。
如果给予更长的“思考”时间,o3 的表现实际上甚至能够比前面提到的 75.7% 更好。
鉴于其覆盖范围、关系和供应链掌控力,英伟达目前是唯一一家能够满足爆炸式推理需求的公司。要满足这种不断变化的形势,仅仅制造 GPU 已经不够了。相反,一家公司必须控制一条全球管道,提供先进的内存、高速网络、专用连接器、DPU、机架、冷却系统以及连接所有这些部分的软件堆栈。英伟达 数十年的生态系统建设,加上其与供应商的深厚合作关系,使其比 AMD等竞争对手具有巨大的战略优势。英伟达与美光、InfiniBand、Spectrum-X 等供应商的牢固关系是其供应链优势的重要原因。
在测试时间计算范式下,推理不再是一项轻量级活动,云提供商、AI 公司和企业可能会竞相部署严重依赖 英伟达 的代理 AI 和基础模型。他们将需要大量 GPU 集群来处理连续、自适应的推理负载。英伟达 的供应链主导地位确保它能够快速、大规模地建立这些数据中心,并实现最佳配置。事实上,英伟达 最近流行了“AI 工厂”一词来描述其提供预包装 AI 数据中心的能力。即使 英伟达 无法完全满足需求,它仍可能比竞争对手拥有巨大的优势。
我们正在进入一个数据中心开始演变为 英伟达 首席执行官黄仁勋所称的“AI 工厂”的世界,即不断生产和改进智能的专用基础设施。英伟达 的目标是成为这些工厂的实际供应者,考虑到该公司的全栈方法,这是有道理的。这就是其 GPU、DPU、NVLink、Grace CPU、软件框架和合作伙伴生态系统允许交钥匙 AI 工厂,旨在处理 o3 级测试时间扩展中存在的高计算负载。虽然竞争对手可能能够匹配不同组件的单个规格,但没有一家能够像 英伟达 那样集成 AI 数据中心的所有部分。
以下是“人工智能工厂”的直观呈现。
英伟达未来成功的关键在于,扩展仍有很长的路要走。虽然由于数据限制,预训练扩展遇到了瓶颈,但测试时计算扩展仍处于早期阶段。随着以推理为中心的模型激增,我们没有理由不继续推动每个查询进行更复杂的推理。真正的推理模型所带来的生产力提升将证明运行此类查询所带来的巨大成本是合理的。
随着每一个测试推理边界的新模型的出现,英伟达完全有能力提供更大的计算集群、更快的网络和更先进的编排软件。即使是编码层也由 英伟达 的 CUDA 框架主导,这再次使该公司与竞争对手相比具有巨大优势。
英伟达最近的财务业绩已经非常出色,该公司报告称2025 财年第三季度的收入为 351 亿美元。这意味着同比增长率高达 94%,这对于一家规模如此之大的公司来说是闻所未闻的。由 o3 的表现推动的测试时间计算革命将通过大幅扩大其总目标市场来增强英伟达的增长。尽管每次推理的成本最初会飙升,但英伟达的规模和运营实力使其能够协商出更优惠的价格并不断提高系统效率。
英伟达巨大的现金创造能力,加上公司的流动性和供应链杠杆,将使该公司能够投资新架构、构建数据中心原型等。所有这些活动都需要数百亿美元,而英伟达的绝大多数竞争对手,尤其是规模较小的初创公司,都将无法实现这一目标。
尽管英伟达的前景乐观,但该公司未来仍面临一些重大风险。英伟达不仅面临来自 AMD 和英特尔等传统加速器供应商的激烈竞争,还面临来自亚马逊、谷歌和微软等超大规模企业的竞争。这些云计算巨头正拼命想摆脱英伟达的控制,考虑到他们的 AI 业务很大程度上依赖于英伟达的 GPU,这是有道理的。因此,英伟达基本上拥有所有主要的科技巨头和传统加速器供应商,这给其利润率带来了下行压力。
英伟达还面临着不确定的研究方向。虽然目前的趋势表明推理扩展没有尽头,但革命性的新方法(如更高效的模型架构或混合量子经典系统)可能会降低计算强度。如果研究人员找到大幅降低推理成本同时保持 o3 级能力的方法,那么对英伟达硬件的需求可能会大幅下降。
随着 o3 迎来无限推理扩展的时代,这对英伟达的影响是深远的。英伟达的市值已经达到 3.2 万亿美元,随着 OpenAI 的新模型类别带来的测试时间计算革命,该公司有望看到更大的上升空间。对于投资者来说,英伟达在这个新范式中的角色是显而易见的;没有其他公司比英伟达更有能力抓住这场革命的需求增长,因为没有其他公司拥有英伟达所拥有的整体方法和最先进的技术。
【如需和我们交流可后台回复“进群”加社群】
“ 英伟达的 GPU 一直是训练大型语言模型的黄金标准。 ”
作者 | RichardSaintvilus
编译 | 华尔街大事件
人工智能刚刚进入一个新时代。OpenAI 发布了新的 o3 模型,该模型在臭名昭著的ARC-AGI-Pub 基准测试中获得了惊人的75.7% 的分数,代表了人工智能能力的一次巨大飞跃。这不仅仅是另一个增量收益(在 GPT-4 的突破性发布后我们已经习惯了),而是一个革命性事件,改变了我们对智能机器能做什么的理解。多年来,高级 LLM(大型语言模型)一直在努力执行真正新颖的任务。事实上,GPT-3 在 ARC-AGI 的适应性基准测量中得分为 0%,而 GPT-4 几乎没有提高。
OpenAI 的 o3 模型几乎是突然之间打破了这些假设,并表明真正强大、灵活的即时推理不再是遥不可及的梦想,而是现实。这一发现最令人震惊的方面是,o 系列测试时间计算模型在很大程度上仍处于起步阶段,这意味着这些模型的未来迭代可能会比 o3 表现得更好。然而,伴随着这种兴奋而来的是新的挑战。o3 的突破是由大规模测试时间计算驱动的。
o3 不是简单地通过扩大预训练规模来训练更大的模型,而是在推理时需要更多的计算能力。每个查询不仅仅是快速查找,而是在巨大的“程序空间”中进行搜索,这需要数千万个标记和惊人的 GPU 周期来解决单个复杂任务。这种新模式将需要对推理芯片的需求呈指数级增长,以及价值数十亿美元的额外加速器容量。更重要的是,扩展测试时间计算的有效性仍然没有明确的终点,因此需求只能从现在开始呈指数级增长。
在这一重大转变中,英伟达(NASDAQ:NVDA)脱颖而出,在构建下一代 AI 基础设施方面占据独特地位。长期以来,英伟达的 GPU 一直是训练大型语言模型的黄金标准。现在,随着 o3 引领未来,而未来很可能由测试时间计算定义,英伟达 无与伦比的协调复杂全球 AI 供应链的能力为其带来了巨大的战略优势。通过按需提供由数千个 GPU、DPU、专用内存和网络设备组成的 AI“工厂”,英伟达已经做好准备,为 o3 级模型及其他模型所需的前所未有的推理能力提供硬件。
o3 模型彻底打破了 ARC 基准测试的先前记录。
多年来,大型语言模型凭借真正先进的模式识别给我们留下了深刻的印象,但在需要真正新颖性的问题上却表现糟糕。例如,GPT-4 和其他同等基础模型(如 Claude 或 Gemini)能够在已知任务和基准上取得世界级的成果,但在应对真正新的挑战时却举步维艰。“越来越大的模型”会不断转化为更智能的模型这一假设已经遭遇挫折。
OpenAI 的 o 系列模型承诺,一种不同的方法(涉及密集的测试时间搜索、推理链和自适应解决方案生成)可以突破这一障碍。虽然 o1 的结果很有希望,但它并没有像 o3 的结果那样真正打破预期。然而,这一新突破意味着推理将不再是廉价和琐碎的,而是密集和探索性的。OpenAI 的 o3 现在可以协调复杂的推理过程,而不是在推理时快速运行静态、预先烘焙的模型,这些过程每个查询会消耗大量的 GPU 周期。这意味着需要有越来越大的推理集群大小,以适应“即时搜索”工作负载。
以下是 ARC 测试中的一些任务。
人工智能对硬件的需求增长历来是由训练更大的语言模型推动的。经过训练后,这些基础模型的推理成本相对可预测且稳定。然而,o3 的成功表明,测试时间计算即将爆发。想象一个世界,每个复杂的问题都会触发一个极其复杂和复杂的标记搜索,涵盖数十亿甚至数万亿个参数。随着人工智能越来越多地嵌入到企业工作流程、消费者服务甚至主权数据中心,此类查询的数量可能会呈指数级飙升。
这种新模式有一个重要的组成部分,投资者应该明白:测试时间扩展还没有明显的上限。这意味着,只要用户想要更聪明、更能感知环境、推理能力堪比人类专家的人工智能,推理的计算强度就会继续呈指数级增长。每一代新模型几乎肯定会进一步推动这一进程,从而需要更多的 GPU。
如果给予更长的“思考”时间,o3 的表现实际上甚至能够比前面提到的 75.7% 更好。
鉴于其覆盖范围、关系和供应链掌控力,英伟达目前是唯一一家能够满足爆炸式推理需求的公司。要满足这种不断变化的形势,仅仅制造 GPU 已经不够了。相反,一家公司必须控制一条全球管道,提供先进的内存、高速网络、专用连接器、DPU、机架、冷却系统以及连接所有这些部分的软件堆栈。英伟达 数十年的生态系统建设,加上其与供应商的深厚合作关系,使其比 AMD等竞争对手具有巨大的战略优势。英伟达与美光、InfiniBand、Spectrum-X 等供应商的牢固关系是其供应链优势的重要原因。
在测试时间计算范式下,推理不再是一项轻量级活动,云提供商、AI 公司和企业可能会竞相部署严重依赖 英伟达 的代理 AI 和基础模型。他们将需要大量 GPU 集群来处理连续、自适应的推理负载。英伟达 的供应链主导地位确保它能够快速、大规模地建立这些数据中心,并实现最佳配置。事实上,英伟达 最近流行了“AI 工厂”一词来描述其提供预包装 AI 数据中心的能力。即使 英伟达 无法完全满足需求,它仍可能比竞争对手拥有巨大的优势。
我们正在进入一个数据中心开始演变为 英伟达 首席执行官黄仁勋所称的“AI 工厂”的世界,即不断生产和改进智能的专用基础设施。英伟达 的目标是成为这些工厂的实际供应者,考虑到该公司的全栈方法,这是有道理的。这就是其 GPU、DPU、NVLink、Grace CPU、软件框架和合作伙伴生态系统允许交钥匙 AI 工厂,旨在处理 o3 级测试时间扩展中存在的高计算负载。虽然竞争对手可能能够匹配不同组件的单个规格,但没有一家能够像 英伟达 那样集成 AI 数据中心的所有部分。
以下是“人工智能工厂”的直观呈现。
英伟达未来成功的关键在于,扩展仍有很长的路要走。虽然由于数据限制,预训练扩展遇到了瓶颈,但测试时计算扩展仍处于早期阶段。随着以推理为中心的模型激增,我们没有理由不继续推动每个查询进行更复杂的推理。真正的推理模型所带来的生产力提升将证明运行此类查询所带来的巨大成本是合理的。
随着每一个测试推理边界的新模型的出现,英伟达完全有能力提供更大的计算集群、更快的网络和更先进的编排软件。即使是编码层也由 英伟达 的 CUDA 框架主导,这再次使该公司与竞争对手相比具有巨大优势。
英伟达最近的财务业绩已经非常出色,该公司报告称2025 财年第三季度的收入为 351 亿美元。这意味着同比增长率高达 94%,这对于一家规模如此之大的公司来说是闻所未闻的。由 o3 的表现推动的测试时间计算革命将通过大幅扩大其总目标市场来增强英伟达的增长。尽管每次推理的成本最初会飙升,但英伟达的规模和运营实力使其能够协商出更优惠的价格并不断提高系统效率。
英伟达巨大的现金创造能力,加上公司的流动性和供应链杠杆,将使该公司能够投资新架构、构建数据中心原型等。所有这些活动都需要数百亿美元,而英伟达的绝大多数竞争对手,尤其是规模较小的初创公司,都将无法实现这一目标。
尽管英伟达的前景乐观,但该公司未来仍面临一些重大风险。英伟达不仅面临来自 AMD 和英特尔等传统加速器供应商的激烈竞争,还面临来自亚马逊、谷歌和微软等超大规模企业的竞争。这些云计算巨头正拼命想摆脱英伟达的控制,考虑到他们的 AI 业务很大程度上依赖于英伟达的 GPU,这是有道理的。因此,英伟达基本上拥有所有主要的科技巨头和传统加速器供应商,这给其利润率带来了下行压力。
英伟达还面临着不确定的研究方向。虽然目前的趋势表明推理扩展没有尽头,但革命性的新方法(如更高效的模型架构或混合量子经典系统)可能会降低计算强度。如果研究人员找到大幅降低推理成本同时保持 o3 级能力的方法,那么对英伟达硬件的需求可能会大幅下降。
随着 o3 迎来无限推理扩展的时代,这对英伟达的影响是深远的。英伟达的市值已经达到 3.2 万亿美元,随着 OpenAI 的新模型类别带来的测试时间计算革命,该公司有望看到更大的上升空间。对于投资者来说,英伟达在这个新范式中的角色是显而易见的;没有其他公司比英伟达更有能力抓住这场革命的需求增长,因为没有其他公司拥有英伟达所拥有的整体方法和最先进的技术。
【如需和我们交流可后台回复“进群”加社群】