本文来自微信公众号:APPSO (ID:appsolution),作者:appso,原文标题:《马斯克发布地表最聪明 AI!号称超越 DeepSeek R1,20 万张卡砸出的“奇迹”》,题图来自:xAI
“聪明得可怕”,这是马斯克预告Grok 3时的说法,以至于今天一大早,全网都是下面这个样子:
在全网蹲点发布会时,App Store先一步更新了。而在发布会进行过程中,Grok网页版也一度火到崩溃。
可以,看着很有信心的样子。
Grok 3不是一个简单的产品迭代,在此之前,是马斯克大手笔建设的数据中心、豪气的显卡配置,采用最佳的预训练模型并继续使用强化学习进行训练,堪称“富养”出来的新一代。
要点提炼如下:
美区账号已经可以更新,英区、欧洲2.28推出。
推出SuperGrok高级订阅计划,月费为30美元,年费为300美元,提供额外的推理和DeepSearch查询功能,包含了无限量的图像生成服务。
Grok 3推理能力领先DeepSeek R1
在Chatbot竞技场之称的LMSYS盲测中,Grok 3在代码、指令响应等各个方面排名第一。
作为诞生于20万张显卡的产物,Grok 3断层级别的表现证明了Scaling Law仍在生效。
相比于DeepSeek以低成本创造高收益,Grok 3主打一个“大力出奇迹”。
这次,引入推理能力的Grok 3的重点在于更灵活地进行实时计算资源分配,在保证推理质量的同时,最聪明的使用计算资源。
曾经Grok 2就已经达到过当时的SOTA水平。在经过多次迭代之后,模型的泛化能力有大幅提升。Grok 3在最新的AIME竞赛中则再次刷新了自己的纪录。
不过,仅仅只是推理能力强显然是不够的,快、狠、准才能参与大模型内卷。发布会现场,工程团队展示了两个案例。
一个是请求生成一个从地球发射到火星并返回地球的3D动画代码,Grok思考了19秒,详细描述了其思考过程,包括使用Python进行绘图,以及使用NumPy进行计算。
另一个则是试图让Grok将《俄罗斯方块》和《宝石迷阵》这两款游戏结合起来,创造出一个新的游戏。
很遗憾,Grok一上来就遭遇了连续两次的翻车,连马斯克回头看了屏幕上糟糕的演示环节,也不免尴尬地发出了一句“oh man”。
不过,后续演示中,也端上了正常的案例(该不会准备好的demo吧)。
而一些幸运的网友已经玩上Grok 3了。
图片来自X网友@jesselaunz
DeepSearch登场,要革搜索引擎的命
作为这次更新的重磅产品,Grok 3加持的DeepSearch号称是下一代搜索引擎。模型将自主像agent一样运作,并且理解用户提问背后的意图,省下在Google花的时间。
现场展示的环节里,工程师给Grok 3出了一道有趣的题:预测NCAA“疯狂三月”的胜负数,也就是所有层级里的比赛结果。
这是巴菲特在2014年发起的一个活动,赌注高达十亿美元,赌的就是让巴菲特破产。历史上无人成功,甚至无人接近,因为即使专家预测,前几轮后也会出现大量错误。
2023年NCAA对阵图
当年这就是一个营销活动,毕竟赢下的概率之小,几乎是千千亿分之一的概率,基本等于不可能。把这个问题甩给Grok 3,不可谓不大胆。
返送的答案中,除了援引的材料,还做了结构化处理。开头介绍、背景知识、分析图表、总结陈词,相当完整。
检索的重点在于,如何交叉核实各个信息源。Grok 3通过设计一个子任务面板来完成这个工作,用户可以自己实时监测正在进行的任务,从而保证答案是可用的、可靠的。
在这个基础上,agent自主检索十分钟,抵掉自己摸索一小时,才是有效减少工作量。
最终Grok 3也给出了它认为的2025年NCAA冠军,三月还没来,让我们拭目以待它的“神预言”会不会成真。
至于Grok 3的体验方式,官方说了,X的Premium+订阅用户将率先体验,而其他高级功能则被纳入xAI推出的新计划——SuperGrok中。
SuperGrok的月费为30美元,年费为300美元,仅提供额外的推理和DeepSearch查询功能,还包含了无限量的图像生成服务。
贾维斯来了?还没完全来
就在昨晚,Shivon Zilis路透了她和有Grok 3加持的人工智能助理Ara的对谈,并称这是生命中最意想不到的收获。
简直是徒增大家对语音模式的期待,马斯克在发布会召开前就已经宣布语音模式只会在一周内推出,这也意味着无缘演示环节。
不过,在现场直播环节,马斯克也表示这将是Grok最好的体验之一,在发布会的尾声,语音模型也放出了一个男声,听着倒是挺有人味的。
这一点点的路透,激起了极大的好奇,到了QA环节关于语音模式的提问涌上来。
当然,还有现在必不可少的灵魂拷问:“开源否”。
我们节选了一部分:
QA
问:Grok语音模式什么时候推出;是基于文本转语音,还是能理解人类说话并直接回应的模型?
答:Grok基本上会理解人类所说的话,预计在一周内发布早期版本,后续将迅速迭代更新。
问:什么时候推出Grok API?
答:将在接下来的几周内推出,包含推理模型和深度研究功能。
问:Grok能记住互动的谈话内容吗?
答:正在努力开发这个功能,不过目前还没有完全完成。
问:是否还会开源Grok模型
答:当Grok 3成熟稳定之后,大概几个月将会开源Grok 2。
问:做这个项目最困难的部分是什么?
答:最大的挑战是让整个模型在海量的H100上进行训练,并保持一致性。
本文来自微信公众号:APPSO (ID:appsolution),作者:appso
本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
End
想涨知识 关注虎嗅视频号!
本文来自微信公众号:APPSO (ID:appsolution),作者:appso,原文标题:《马斯克发布地表最聪明 AI!号称超越 DeepSeek R1,20 万张卡砸出的“奇迹”》,题图来自:xAI
“聪明得可怕”,这是马斯克预告Grok 3时的说法,以至于今天一大早,全网都是下面这个样子:
在全网蹲点发布会时,App Store先一步更新了。而在发布会进行过程中,Grok网页版也一度火到崩溃。
可以,看着很有信心的样子。
Grok 3不是一个简单的产品迭代,在此之前,是马斯克大手笔建设的数据中心、豪气的显卡配置,采用最佳的预训练模型并继续使用强化学习进行训练,堪称“富养”出来的新一代。
要点提炼如下:
美区账号已经可以更新,英区、欧洲2.28推出。
推出SuperGrok高级订阅计划,月费为30美元,年费为300美元,提供额外的推理和DeepSearch查询功能,包含了无限量的图像生成服务。
Grok 3推理能力领先DeepSeek R1
在Chatbot竞技场之称的LMSYS盲测中,Grok 3在代码、指令响应等各个方面排名第一。
作为诞生于20万张显卡的产物,Grok 3断层级别的表现证明了Scaling Law仍在生效。
相比于DeepSeek以低成本创造高收益,Grok 3主打一个“大力出奇迹”。
这次,引入推理能力的Grok 3的重点在于更灵活地进行实时计算资源分配,在保证推理质量的同时,最聪明的使用计算资源。
曾经Grok 2就已经达到过当时的SOTA水平。在经过多次迭代之后,模型的泛化能力有大幅提升。Grok 3在最新的AIME竞赛中则再次刷新了自己的纪录。
不过,仅仅只是推理能力强显然是不够的,快、狠、准才能参与大模型内卷。发布会现场,工程团队展示了两个案例。
一个是请求生成一个从地球发射到火星并返回地球的3D动画代码,Grok思考了19秒,详细描述了其思考过程,包括使用Python进行绘图,以及使用NumPy进行计算。
另一个则是试图让Grok将《俄罗斯方块》和《宝石迷阵》这两款游戏结合起来,创造出一个新的游戏。
很遗憾,Grok一上来就遭遇了连续两次的翻车,连马斯克回头看了屏幕上糟糕的演示环节,也不免尴尬地发出了一句“oh man”。
不过,后续演示中,也端上了正常的案例(该不会准备好的demo吧)。
而一些幸运的网友已经玩上Grok 3了。
图片来自X网友@jesselaunz
DeepSearch登场,要革搜索引擎的命
作为这次更新的重磅产品,Grok 3加持的DeepSearch号称是下一代搜索引擎。模型将自主像agent一样运作,并且理解用户提问背后的意图,省下在Google花的时间。
现场展示的环节里,工程师给Grok 3出了一道有趣的题:预测NCAA“疯狂三月”的胜负数,也就是所有层级里的比赛结果。
这是巴菲特在2014年发起的一个活动,赌注高达十亿美元,赌的就是让巴菲特破产。历史上无人成功,甚至无人接近,因为即使专家预测,前几轮后也会出现大量错误。
2023年NCAA对阵图
当年这就是一个营销活动,毕竟赢下的概率之小,几乎是千千亿分之一的概率,基本等于不可能。把这个问题甩给Grok 3,不可谓不大胆。
返送的答案中,除了援引的材料,还做了结构化处理。开头介绍、背景知识、分析图表、总结陈词,相当完整。
检索的重点在于,如何交叉核实各个信息源。Grok 3通过设计一个子任务面板来完成这个工作,用户可以自己实时监测正在进行的任务,从而保证答案是可用的、可靠的。
在这个基础上,agent自主检索十分钟,抵掉自己摸索一小时,才是有效减少工作量。
最终Grok 3也给出了它认为的2025年NCAA冠军,三月还没来,让我们拭目以待它的“神预言”会不会成真。
至于Grok 3的体验方式,官方说了,X的Premium+订阅用户将率先体验,而其他高级功能则被纳入xAI推出的新计划——SuperGrok中。
SuperGrok的月费为30美元,年费为300美元,仅提供额外的推理和DeepSearch查询功能,还包含了无限量的图像生成服务。
贾维斯来了?还没完全来
就在昨晚,Shivon Zilis路透了她和有Grok 3加持的人工智能助理Ara的对谈,并称这是生命中最意想不到的收获。
简直是徒增大家对语音模式的期待,马斯克在发布会召开前就已经宣布语音模式只会在一周内推出,这也意味着无缘演示环节。
不过,在现场直播环节,马斯克也表示这将是Grok最好的体验之一,在发布会的尾声,语音模型也放出了一个男声,听着倒是挺有人味的。
这一点点的路透,激起了极大的好奇,到了QA环节关于语音模式的提问涌上来。
当然,还有现在必不可少的灵魂拷问:“开源否”。
我们节选了一部分:
QA
问:Grok语音模式什么时候推出;是基于文本转语音,还是能理解人类说话并直接回应的模型?
答:Grok基本上会理解人类所说的话,预计在一周内发布早期版本,后续将迅速迭代更新。
问:什么时候推出Grok API?
答:将在接下来的几周内推出,包含推理模型和深度研究功能。
问:Grok能记住互动的谈话内容吗?
答:正在努力开发这个功能,不过目前还没有完全完成。
问:是否还会开源Grok模型
答:当Grok 3成熟稳定之后,大概几个月将会开源Grok 2。
问:做这个项目最困难的部分是什么?
答:最大的挑战是让整个模型在海量的H100上进行训练,并保持一致性。
本文来自微信公众号:APPSO (ID:appsolution),作者:appso
本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
End
想涨知识 关注虎嗅视频号!