马斯克狂吹Grok 3，吊打梁文锋DeepSeek-R1！用了20万块英伟达GPU

财经头条

提升一亿中产阶级阅读效率

打开

深蓝财经

5天前

当地时间2月17日18时，即北京时间2月18日12点，埃隆•马斯克（ElonMusk）的AI公司xAI正式推出最新的Grok3模型，并称其是目前“地球上最聪明的AI”。

■花1700亿搞AI，如今却被群嘲，百度到底冤不冤？

■哪吒破117亿背后，成都的野心藏不住了

来源 | TechWire

马斯克口中“地球上最聪明的AI”终于来了！

当地时间2月17日18时，即北京时间2月18日12点，埃隆•马斯克（Elon Musk）的AI公司xAI正式推出最新的Grok 3模型，并称其是目前“地球上最聪明的AI”。

在不久前的迪拜世界政府峰会上，马斯克就给Grok 3的发布做了预告。他表示：Grok 3具有非常强大的推理能力。在我们迄今为止进行的测试中，Grok 3的表现优于我们所知的任何发布的产品。

“实际上，有时我认为Grok 3聪明得有些可怕。”

据xAI表示，他们今天将推出 Grok 3，首先从 X 上的 Premium+订阅者开始，他们将是第一批获得访问权限的人。

那它到底有多聪明？能不能证明黎曼假设？

去年11月，xAI工程师“玩梗”爆料称Grok 3刚刚证明了黎曼猜想。

多项测试超Open AI、DeepSeek等主流大模型

首先，没有悬念的，马斯克的直播又迟到了。全网等了足足20分钟，在线观看人数达到100万时，直播开终于开始。

一开始，xAI就直接放出数字，直接对比Grok 3的能力。

据马斯克披露的数据，在全球知名大模型竞技场排行榜 Chatbot Arena中，Grok 3的成绩已经达到了1400分，超过了所有主流大模型，位居第一。

万众瞩目的DeepSeek-R1只能排在区区第五。

此外，Grok 3和Grok 3 mini在数学、科学和编程基准测试上超越了所有主流模型，包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。

推理能力方面，具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning也超越了DeepSeek-R1和OpenAI的o3 mini等的推理模型。

甚至还能编程，不仅能生成一个地球发射、火星着陆以及下一次发射窗口返回地球的动画3D代码，并且还能直接运行。有研究人员检查后发现，Grok 3给出的答案完全正确！

还能根据输入者要求，制作游戏。xAI现场输入要求，制作一个俄罗斯方块结合宝石迷阵的游戏，界面虽然简洁，但游戏完全运行流畅，没有问题。

同时，发布会还推出Grok 3的第一代智能体，DeepSearch，能够在互联网上进行更深入的搜索。它不仅可以搜索网页，查找现有资料，还可以“推测用户的真正意图”并加以思考，在经过交叉对比不同信源后，确保“能够返回正确的信息”。

从上面一堆数据来看，可以说，迄今为止最强推理模型，全部败给了Grok 3，从这点来说，Grok 3确实是“地球上最聪明的AI”。

到底有多聪明？

Grok 3上手体验

吹得如此强悍，甚至还能直接编程运行，这让不少科技爱好者开始搓手，想要亲自上手体验了。

那到底何时可以体验Grok 3？据xAI表示，他们今天将推出 Grok 3，首先从 X 上的 Premium+订阅者开始，他们将是第一批获得访问权限的人。

Grok的忠实粉丝则可以单独订阅SuperGrok，从而解锁深度搜索和思考模型等先进功能，并成为早体验新特性的那一波。

TechWire也在第一时间到X上，上手进行了体验，看看它究竟到底如何“聪明得可怕”，能不能证明黎曼猜想？

在发布会刚结束时，X上的Grok 版本仍是Grok 2。不过很快，TechWire就发现，Grok 3 beta上线了。

为了对比Grok 2与Grok 3，TechWire提出同一个问题，对比二者的回答。

从答案可以明显看到，Grok 2 的回答虽然条理清晰，但显得有些“机械”和死板。

相比之下，Grok 3 的回答就更加的灵活，不仅有正面的夸奖，还带有一些批评，有更多的思考，看起来“人味更重”。

TechWire还体验了Grok 3的图片功能，让它给我生成一张马斯克和特朗普跳舞的照片。得出的四张图片，从人物面部细节都挺不错，不过有两张细节看起来和真实人物不像贴合，不过其中第三张图片尤其像真实人物。

不过在手指细节部分，几乎每张图片都出现了AI作图经典的“多手指变形”问题。

马斯克补充称：“如果你想要一个更完善的版本，可能要等待一周，但每天都会有所改进。我们还在开发语音交互功能，我认为这将是 Grok 3 最好的体验之一。”

并表示，几个月之后会对Grok-3进行全面的开源。

消耗20万张GPU

向奥特曼上演“复仇之战”

Grok 3发布后，不少人将其拿来和最近在全球科技圈刷屏的DeepSeek对比。按照DeepSeek结论来看，两者各有优势。不过，就训练成本上，Grok 3确实要比DeepSeek高出不少。

Grok 3能取得如此优异的表现，源于前所未有为的训练投入。xAI介绍，Grok 3的训练量比Grok 2多10倍。“Grok 3在训练过程中调用了10万块英伟达H100 GPU，提供了超过2亿GPU小时的计算资源，较前代产品Grok 2使用的1万5千块实现了数倍的跨越式提升。这个训练规模是前所未有的。”

目前，Grok 3使用的Colossus超级计算机，GPU数量已经扩大到20万块！这一过程，只用了92天。

需要关注的是，马斯克创建xAI的目的，就是为了与OpenAI展开竞争。

而目前，xAI还在继续丰富粮仓弹药。

资金方面，据外媒此前报道，马斯克的人工智能（AI）公司xAI正在接洽潜在投资者，计划筹集约100亿美元资金，此轮融资可能使该公司估值达到约750亿美元。

设备方面，知情人士称，xAI考虑从戴尔购买价值超过50亿美元的服务器，以支持包括Grok系列模型人工智能技术的研发。相关谈判已处于后期阶段。

而另一边，OpenAI也正进行高达400亿美元的融资，将使其估值超过3000亿美元。

近年来，马斯克针对Open AI，先后提出诉讼、竞购手段，阻止其转型为营利性企业。如今，Grok 3的推出，意味着两者的竞争将进入全新阶段。

更多精彩内容，欢迎关注?