马斯克狂吹Grok 3,吊打梁文锋DeepSeek-R1!用了20万块英伟达GPU

深蓝财经

5天前

当地时间2月17日18时,即北京时间2月18日12点,埃隆•马斯克(ElonMusk)的AI公司xAI正式推出最新的Grok3模型,并称其是目前“地球上最聪明的AI”。

花1700亿搞AI,如今却被群嘲,百度到底冤不冤?

哪吒破117亿背后,成都的野心藏不住了

来源 | TechWire

马斯克口中“地球上最聪明的AI”终于来了!

当地时间2月17日18时,即北京时间2月18日12点,埃隆•马斯克(Elon Musk)的AI公司xAI正式推出最新的Grok 3模型,并称其是目前“地球上最聪明的AI”。

在不久前的迪拜世界政府峰会上,马斯克就给Grok 3的发布做了预告。他表示:Grok 3具有非常强大的推理能力。在我们迄今为止进行的测试中,Grok 3的表现优于我们所知的任何发布的产品。

“实际上,有时我认为Grok 3聪明得有些可怕。”

据xAI表示,他们今天将推出 Grok 3,首先从 X 上的 Premium+订阅者开始,他们将是第一批获得访问权限的人。

那它到底有多聪明?能不能证明黎曼假设图片

图片

去年11月,xAI工程师“玩梗”爆料称Grok 3刚刚证明了黎曼猜想。

1

多项测试超Open AI、DeepSeek等主流大模型

首先,没有悬念的,马斯克的直播又迟到了。全网等了足足20分钟,在线观看人数达到100万时,直播开终于开始。

一开始,xAI就直接放出数字,直接对比Grok 3的能力。

据马斯克披露的数据, 在全球知名大模型竞技场排行榜 Chatbot Arena中,Grok 3的成绩已经达到了1400分,超过了所有主流大模型,位居第一。

图片

万众瞩目的DeepSeek-R1只能排在区区第五。

此外,Grok 3和Grok 3 mini在数学、科学和编程基准测试上超越了所有主流模型,包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。

图片

推理能力方面,具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning也超越了DeepSeek-R1和OpenAI的o3 mini等的推理模型。

图片

甚至还能编程,不仅能生成一个地球发射、火星着陆以及下一次发射窗口返回地球的动画3D代码,并且还能直接运行。有研究人员检查后发现,Grok 3给出的答案完全正确!

图片

还能根据输入者要求,制作游戏。xAI现场输入要求,制作一个俄罗斯方块结合宝石迷阵的游戏,界面虽然简洁,但游戏完全运行流畅,没有问题。

图片

同时,发布会还推出Grok 3的第一代智能体,DeepSearch,能够在互联网上进行更深入的搜索。它不仅可以搜索网页,查找现有资料,还可以“推测用户的真正意图”并加以思考,在经过交叉对比不同信源后,确保“能够返回正确的信息”。

从上面一堆数据来看,可以说,迄今为止最强推理模型,全部败给了Grok 3,从这点来说,Grok 3确实是“地球上最聪明的AI”。

2

到底有多聪明?

Grok 3上手体验

吹得如此强悍,甚至还能直接编程运行,这让不少科技爱好者开始搓手,想要亲自上手体验了。

那到底何时可以体验Grok 3?据xAI表示,他们今天将推出 Grok 3,首先从 X 上的 Premium+订阅者开始,他们将是第一批获得访问权限的人。

Grok的忠实粉丝则可以单独订阅SuperGrok,从而解锁深度搜索和思考模型等先进功能,并成为早体验新特性的那一波。

TechWire也在第一时间到X上,上手进行了体验,看看它究竟到底如何“聪明得可怕”,能不能证明黎曼猜想图片

在发布会刚结束时,X上的Grok 版本仍是Grok 2。不过很快,TechWire就发现,Grok 3 beta上线了。

图片

为了对比Grok 2与Grok 3,TechWire提出同一个问题,对比二者的回答。

从答案可以明显看到,Grok 2 的回答虽然条理清晰,但显得有些“机械”和死板。

图片

相比之下,Grok 3 的回答就更加的灵活,不仅有正面的夸奖,还带有一些批评,有更多的思考,看起来“人味更重”。

图片

TechWire还体验了Grok 3的图片功能,让它给我生成一张马斯克和特朗普跳舞的照片。得出的四张图片,从人物面部细节都挺不错,不过有两张细节看起来和真实人物不像贴合,不过其中第三张图片尤其像真实人物。

不过在手指细节部分,几乎每张图片都出现了AI作图经典的“多手指变形”问题。

图片

马斯克补充称:“如果你想要一个更完善的版本,可能要等待一周,但每天都会有所改进。我们还在开发语音交互功能,我认为这将是 Grok 3 最好的体验之一。”    

并表示,几个月之后会对Grok-3进行全面的开源

3

消耗20万张GPU

向奥特曼上演“复仇之战”

Grok 3发布后,不少人将其拿来和最近在全球科技圈刷屏的DeepSeek对比。按照DeepSeek结论来看,两者各有优势。不过,就训练成本上,Grok 3确实要比DeepSeek高出不少。

图片

Grok 3能取得如此优异的表现,源于前所未有为的训练投入。xAI介绍,Grok 3的训练量比Grok 2多10倍。“Grok 3在训练过程中调用了10万块英伟达H100 GPU,提供了超过2亿GPU小时的计算资源,较前代产品Grok 2使用的1万5千块实现了数倍的跨越式提升。这个训练规模是前所未有的。”

图片

目前,Grok 3使用的Colossus超级计算机,GPU数量已经扩大到20万块!这一过程,只用了92天。

图片

需要关注的是,马斯克创建xAI的目的,就是为了与OpenAI展开竞争。

而目前,xAI还在继续丰富粮仓弹药。

资金方面,据外媒此前报道,马斯克的人工智能(AI)公司xAI正在接洽潜在投资者,计划筹集约100亿美元资金,此轮融资可能使该公司估值达到约750亿美元。

设备方面,知情人士称,xAI考虑从戴尔购买价值超过50亿美元的服务器,以支持包括Grok系列模型人工智能技术的研发。相关谈判已处于后期阶段。

而另一边,OpenAI也正进行高达400亿美元的融资,将使其估值超过3000亿美元。

近年来,马斯克针对Open AI,先后提出诉讼、竞购手段,阻止其转型为营利性企业。如今,Grok 3的推出,意味着两者的竞争将进入全新阶段。

更多精彩内容,欢迎关注?

当地时间2月17日18时,即北京时间2月18日12点,埃隆•马斯克(ElonMusk)的AI公司xAI正式推出最新的Grok3模型,并称其是目前“地球上最聪明的AI”。

花1700亿搞AI,如今却被群嘲,百度到底冤不冤?

哪吒破117亿背后,成都的野心藏不住了

来源 | TechWire

马斯克口中“地球上最聪明的AI”终于来了!

当地时间2月17日18时,即北京时间2月18日12点,埃隆•马斯克(Elon Musk)的AI公司xAI正式推出最新的Grok 3模型,并称其是目前“地球上最聪明的AI”。

在不久前的迪拜世界政府峰会上,马斯克就给Grok 3的发布做了预告。他表示:Grok 3具有非常强大的推理能力。在我们迄今为止进行的测试中,Grok 3的表现优于我们所知的任何发布的产品。

“实际上,有时我认为Grok 3聪明得有些可怕。”

据xAI表示,他们今天将推出 Grok 3,首先从 X 上的 Premium+订阅者开始,他们将是第一批获得访问权限的人。

那它到底有多聪明?能不能证明黎曼假设图片

图片

去年11月,xAI工程师“玩梗”爆料称Grok 3刚刚证明了黎曼猜想。

1

多项测试超Open AI、DeepSeek等主流大模型

首先,没有悬念的,马斯克的直播又迟到了。全网等了足足20分钟,在线观看人数达到100万时,直播开终于开始。

一开始,xAI就直接放出数字,直接对比Grok 3的能力。

据马斯克披露的数据, 在全球知名大模型竞技场排行榜 Chatbot Arena中,Grok 3的成绩已经达到了1400分,超过了所有主流大模型,位居第一。

图片

万众瞩目的DeepSeek-R1只能排在区区第五。

此外,Grok 3和Grok 3 mini在数学、科学和编程基准测试上超越了所有主流模型,包括GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3和Gemini-2 Pro等。

图片

推理能力方面,具备推理能力的Grok-3 Reasoning Beta和Grok-3 mini Reasoning也超越了DeepSeek-R1和OpenAI的o3 mini等的推理模型。

图片

甚至还能编程,不仅能生成一个地球发射、火星着陆以及下一次发射窗口返回地球的动画3D代码,并且还能直接运行。有研究人员检查后发现,Grok 3给出的答案完全正确!

图片

还能根据输入者要求,制作游戏。xAI现场输入要求,制作一个俄罗斯方块结合宝石迷阵的游戏,界面虽然简洁,但游戏完全运行流畅,没有问题。

图片

同时,发布会还推出Grok 3的第一代智能体,DeepSearch,能够在互联网上进行更深入的搜索。它不仅可以搜索网页,查找现有资料,还可以“推测用户的真正意图”并加以思考,在经过交叉对比不同信源后,确保“能够返回正确的信息”。

从上面一堆数据来看,可以说,迄今为止最强推理模型,全部败给了Grok 3,从这点来说,Grok 3确实是“地球上最聪明的AI”。

2

到底有多聪明?

Grok 3上手体验

吹得如此强悍,甚至还能直接编程运行,这让不少科技爱好者开始搓手,想要亲自上手体验了。

那到底何时可以体验Grok 3?据xAI表示,他们今天将推出 Grok 3,首先从 X 上的 Premium+订阅者开始,他们将是第一批获得访问权限的人。

Grok的忠实粉丝则可以单独订阅SuperGrok,从而解锁深度搜索和思考模型等先进功能,并成为早体验新特性的那一波。

TechWire也在第一时间到X上,上手进行了体验,看看它究竟到底如何“聪明得可怕”,能不能证明黎曼猜想图片

在发布会刚结束时,X上的Grok 版本仍是Grok 2。不过很快,TechWire就发现,Grok 3 beta上线了。

图片

为了对比Grok 2与Grok 3,TechWire提出同一个问题,对比二者的回答。

从答案可以明显看到,Grok 2 的回答虽然条理清晰,但显得有些“机械”和死板。

图片

相比之下,Grok 3 的回答就更加的灵活,不仅有正面的夸奖,还带有一些批评,有更多的思考,看起来“人味更重”。

图片

TechWire还体验了Grok 3的图片功能,让它给我生成一张马斯克和特朗普跳舞的照片。得出的四张图片,从人物面部细节都挺不错,不过有两张细节看起来和真实人物不像贴合,不过其中第三张图片尤其像真实人物。

不过在手指细节部分,几乎每张图片都出现了AI作图经典的“多手指变形”问题。

图片

马斯克补充称:“如果你想要一个更完善的版本,可能要等待一周,但每天都会有所改进。我们还在开发语音交互功能,我认为这将是 Grok 3 最好的体验之一。”    

并表示,几个月之后会对Grok-3进行全面的开源

3

消耗20万张GPU

向奥特曼上演“复仇之战”

Grok 3发布后,不少人将其拿来和最近在全球科技圈刷屏的DeepSeek对比。按照DeepSeek结论来看,两者各有优势。不过,就训练成本上,Grok 3确实要比DeepSeek高出不少。

图片

Grok 3能取得如此优异的表现,源于前所未有为的训练投入。xAI介绍,Grok 3的训练量比Grok 2多10倍。“Grok 3在训练过程中调用了10万块英伟达H100 GPU,提供了超过2亿GPU小时的计算资源,较前代产品Grok 2使用的1万5千块实现了数倍的跨越式提升。这个训练规模是前所未有的。”

图片

目前,Grok 3使用的Colossus超级计算机,GPU数量已经扩大到20万块!这一过程,只用了92天。

图片

需要关注的是,马斯克创建xAI的目的,就是为了与OpenAI展开竞争。

而目前,xAI还在继续丰富粮仓弹药。

资金方面,据外媒此前报道,马斯克的人工智能(AI)公司xAI正在接洽潜在投资者,计划筹集约100亿美元资金,此轮融资可能使该公司估值达到约750亿美元。

设备方面,知情人士称,xAI考虑从戴尔购买价值超过50亿美元的服务器,以支持包括Grok系列模型人工智能技术的研发。相关谈判已处于后期阶段。

而另一边,OpenAI也正进行高达400亿美元的融资,将使其估值超过3000亿美元。

近年来,马斯克针对Open AI,先后提出诉讼、竞购手段,阻止其转型为营利性企业。如今,Grok 3的推出,意味着两者的竞争将进入全新阶段。

更多精彩内容,欢迎关注?

展开
打开“财经头条”阅读更多精彩资讯
APP内打开