马斯克发布地表最聪明AI，号称超越DeepSeek R1

财经头条

提升一亿中产阶级阅读效率

打开

虎嗅APP

3天前

Grok一上来就遭遇了连续两次的翻车，连马斯克回头看了屏幕上糟糕的演示环节，也不免尴尬地发出了一句“ohman”。...简直是徒增大家对语音模式的期待，马斯克在发布会召开前就已经宣布语音模式只会在一周内推出，这也意味着无缘演示环节。

本文来自微信公众号：APPSO （ID：appsolution），作者：appso，原文标题：《马斯克发布地表最聪明 AI！号称超越 DeepSeek R1，20 万张卡砸出的“奇迹”》，题图来自：xAI

“聪明得可怕”，这是马斯克预告Grok 3时的说法，以至于今天一大早，全网都是下面这个样子：

在全网蹲点发布会时，App Store先一步更新了。而在发布会进行过程中，Grok网页版也一度火到崩溃。

可以，看着很有信心的样子。

Grok 3不是一个简单的产品迭代，在此之前，是马斯克大手笔建设的数据中心、豪气的显卡配置，采用最佳的预训练模型并继续使用强化学习进行训练，堪称“富养”出来的新一代。

要点提炼如下：

美区账号已经可以更新，英区、欧洲2.28推出。

推出SuperGrok高级订阅计划，月费为30美元，年费为300美元，提供额外的推理和DeepSearch查询功能，包含了无限量的图像生成服务。

Grok 3推理能力领先DeepSeek R1

在Chatbot竞技场之称的LMSYS盲测中，Grok 3在代码、指令响应等各个方面排名第一。

作为诞生于20万张显卡的产物，Grok 3断层级别的表现证明了Scaling Law仍在生效。

相比于DeepSeek以低成本创造高收益，Grok 3主打一个“大力出奇迹”。

这次，引入推理能力的Grok 3的重点在于更灵活地进行实时计算资源分配，在保证推理质量的同时，最聪明的使用计算资源。

曾经Grok 2就已经达到过当时的SOTA水平。在经过多次迭代之后，模型的泛化能力有大幅提升。Grok 3在最新的AIME竞赛中则再次刷新了自己的纪录。

不过，仅仅只是推理能力强显然是不够的，快、狠、准才能参与大模型内卷。发布会现场，工程团队展示了两个案例。

一个是请求生成一个从地球发射到火星并返回地球的3D动画代码，Grok思考了19秒，详细描述了其思考过程，包括使用Python进行绘图，以及使用NumPy进行计算。

另一个则是试图让Grok将《俄罗斯方块》和《宝石迷阵》这两款游戏结合起来，创造出一个新的游戏。

很遗憾，Grok一上来就遭遇了连续两次的翻车，连马斯克回头看了屏幕上糟糕的演示环节，也不免尴尬地发出了一句“oh man”。

不过，后续演示中，也端上了正常的案例（该不会准备好的demo吧）。

而一些幸运的网友已经玩上Grok 3了。

图片来自X网友@jesselaunz

DeepSearch登场，要革搜索引擎的命

作为这次更新的重磅产品，Grok 3加持的DeepSearch号称是下一代搜索引擎。模型将自主像agent一样运作，并且理解用户提问背后的意图，省下在Google花的时间。

现场展示的环节里，工程师给Grok 3出了一道有趣的题：预测NCAA“疯狂三月”的胜负数，也就是所有层级里的比赛结果。

这是巴菲特在2014年发起的一个活动，赌注高达十亿美元，赌的就是让巴菲特破产。历史上无人成功，甚至无人接近，因为即使专家预测，前几轮后也会出现大量错误。

2023年NCAA对阵图

当年这就是一个营销活动，毕竟赢下的概率之小，几乎是千千亿分之一的概率，基本等于不可能。把这个问题甩给Grok 3，不可谓不大胆。

返送的答案中，除了援引的材料，还做了结构化处理。开头介绍、背景知识、分析图表、总结陈词，相当完整。

检索的重点在于，如何交叉核实各个信息源。Grok 3通过设计一个子任务面板来完成这个工作，用户可以自己实时监测正在进行的任务，从而保证答案是可用的、可靠的。

在这个基础上，agent自主检索十分钟，抵掉自己摸索一小时，才是有效减少工作量。

最终Grok 3也给出了它认为的2025年NCAA冠军，三月还没来，让我们拭目以待它的“神预言”会不会成真。

至于Grok 3的体验方式，官方说了，X的Premium+订阅用户将率先体验，而其他高级功能则被纳入xAI推出的新计划——SuperGrok中。

SuperGrok的月费为30美元，年费为300美元，仅提供额外的推理和DeepSearch查询功能，还包含了无限量的图像生成服务。

贾维斯来了？还没完全来

就在昨晚，Shivon Zilis路透了她和有Grok 3加持的人工智能助理Ara的对谈，并称这是生命中最意想不到的收获。

简直是徒增大家对语音模式的期待，马斯克在发布会召开前就已经宣布语音模式只会在一周内推出，这也意味着无缘演示环节。

不过，在现场直播环节，马斯克也表示这将是Grok最好的体验之一，在发布会的尾声，语音模型也放出了一个男声，听着倒是挺有人味的。

这一点点的路透，激起了极大的好奇，到了QA环节关于语音模式的提问涌上来。

当然，还有现在必不可少的灵魂拷问：“开源否”。

我们节选了一部分：

问：Grok语音模式什么时候推出；是基于文本转语音，还是能理解人类说话并直接回应的模型？

答：Grok基本上会理解人类所说的话，预计在一周内发布早期版本，后续将迅速迭代更新。

问：什么时候推出Grok API？

答：将在接下来的几周内推出，包含推理模型和深度研究功能。

问：Grok能记住互动的谈话内容吗？

答：正在努力开发这个功能，不过目前还没有完全完成。

问：是否还会开源Grok模型

答：当Grok 3成熟稳定之后，大概几个月将会开源Grok 2。

问：做这个项目最困难的部分是什么？

答：最大的挑战是让整个模型在海量的H100上进行训练，并保持一致性。

本文来自微信公众号：APPSO （ID：appsolution），作者：appso

本内容为作者独立观点，不代表虎嗅立场。未经允许不得转载，授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉，请联系tougao@huxiu.com

End

想涨知识关注虎嗅视频号！