马斯克发布Grok 3大模型,称超越DeepSeek

芥末堆官网

3天前

北京时间2月18日12时,马斯克在X平台直播,宣布其AI公司xAI发布最新版的旗舰AI大模型Grok3。

1.png

图源:Grok 3发布会直播截图

北京时间2月18日12时,马斯克在X平台直播,宣布其AI公司xAI发布最新版的旗舰AI大模型Grok 3。这场直播的在线观看人数超200万。

马斯克此前称Grok 3是“地球上最聪明的人工智能”。

Grok 3大模型包括Grok 3和Grok 3 mini两个版本。两者的区别是Grok 3 mini回答问题的速度更快,但准确性逊色一些。

6.png

xAI团队首先展示了Grok 3与其他大模型的比赛结果。xAI称,Grok 3在AIME、GPQA和LCB的基准测试中胜过GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3、Gemini-2 Pro等模型,这意味着Grok 3在数学、科学和代码等数据集上更胜一筹。

5.png

xAI还表示,Grok 3的早期版本chocolate在Chatbot Arena中的分数也更高。Chatbot Arena是由国际开放研究组织LMSYS Or推出的一款大模型竞技场。

据xAI官方介绍,Grok 3的训练计算量是Grok 2的10倍多。

Grok 3支持推理能力,解锁了测试时计算(test-time compute)能力。当使用更多测试时间计算时,Grok 3 Reasoning和Grok 3 mini Reasoning的表现超过了高配版o3 mini、o1和DeepSeek-R1等其他模型。

4.png

Grok 3和Grok 3 mini有DeepSearch、Think、BigBrain三个主要的功能按钮,支持研究、头脑风暴、数据分析、图像生成和代码生成多个功能。

使用Think模式,Grok 3和Grok 3 mini可以仔细地思考问题,这个功能类似于OpenAI的o3 mini和DeepSeek-R1等的推理模型。用户可以通过Grok的应用程序访问Grok 3。

遇到更难的问题时,可以使用Big Brain模式进行更全面、更仔细的推理。xAI表示,这个模式最适合解决数学、科学和编程的相关问题。

同时,马斯克指出,Grok 3将部分推理过程模糊化,以防止被蒸馏。蒸馏指的是AI模型开发人员从另一个模型中提取知识。

值得注意的是,Grok新增了DeepSearch的新功能,对标OpenAI的DeepResearch等功能。DeepSearch可以用于深度搜索,扫描互联网和X平台,分析信息,并提供摘要回答用户的问题。

2.png

X Premium+的订阅用户能优先使用Grok 3,要想访问其他功能,还需要订阅SuperGrok。SuperGrok的价格为每月30美元或每年300美元,用户能解锁更多的推理和深度搜索查询功能,并无限访问图像生成功能。

马斯克说,在未来,或许大约一周后,Grok将增加语音模式。几周后,Grok 3模型将与DeepSearch功能一起出现在xAI的企业API中。几个月后,Grok 3的上一个版本Grok2将开源。

“我们通常会在下一个版本完全发布时,开源上一个版本。”马斯克说。“当Grok 3成熟且稳定时,可能在几个月内,我们将开源Grok 2。”

基于xAI介绍的Grok 3的种种功能,预计Grok 3在教育方面的应用效果将比此前的版本更胜一筹。至于Grok 3的效果是否比其他公司研发的模型更强,还需要等待市场和用户的检验。

但可以肯定的是,日益激烈的AI军备竞赛正在为教育带来愈发深远的影响。

  • 教育
  • 马斯克
  • AI
1、本文是 芥末堆网原创文章,转载可点击 芥末堆内容合作 了解详情,未经授权拒绝一切形式转载,违者必究;
2、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。
来源: 芥末堆
芥末堆商务合作:王老师 18710003484
北京时间2月18日12时,马斯克在X平台直播,宣布其AI公司xAI发布最新版的旗舰AI大模型Grok3。

1.png

图源:Grok 3发布会直播截图

北京时间2月18日12时,马斯克在X平台直播,宣布其AI公司xAI发布最新版的旗舰AI大模型Grok 3。这场直播的在线观看人数超200万。

马斯克此前称Grok 3是“地球上最聪明的人工智能”。

Grok 3大模型包括Grok 3和Grok 3 mini两个版本。两者的区别是Grok 3 mini回答问题的速度更快,但准确性逊色一些。

6.png

xAI团队首先展示了Grok 3与其他大模型的比赛结果。xAI称,Grok 3在AIME、GPQA和LCB的基准测试中胜过GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3、Gemini-2 Pro等模型,这意味着Grok 3在数学、科学和代码等数据集上更胜一筹。

5.png

xAI还表示,Grok 3的早期版本chocolate在Chatbot Arena中的分数也更高。Chatbot Arena是由国际开放研究组织LMSYS Or推出的一款大模型竞技场。

据xAI官方介绍,Grok 3的训练计算量是Grok 2的10倍多。

Grok 3支持推理能力,解锁了测试时计算(test-time compute)能力。当使用更多测试时间计算时,Grok 3 Reasoning和Grok 3 mini Reasoning的表现超过了高配版o3 mini、o1和DeepSeek-R1等其他模型。

4.png

Grok 3和Grok 3 mini有DeepSearch、Think、BigBrain三个主要的功能按钮,支持研究、头脑风暴、数据分析、图像生成和代码生成多个功能。

使用Think模式,Grok 3和Grok 3 mini可以仔细地思考问题,这个功能类似于OpenAI的o3 mini和DeepSeek-R1等的推理模型。用户可以通过Grok的应用程序访问Grok 3。

遇到更难的问题时,可以使用Big Brain模式进行更全面、更仔细的推理。xAI表示,这个模式最适合解决数学、科学和编程的相关问题。

同时,马斯克指出,Grok 3将部分推理过程模糊化,以防止被蒸馏。蒸馏指的是AI模型开发人员从另一个模型中提取知识。

值得注意的是,Grok新增了DeepSearch的新功能,对标OpenAI的DeepResearch等功能。DeepSearch可以用于深度搜索,扫描互联网和X平台,分析信息,并提供摘要回答用户的问题。

2.png

X Premium+的订阅用户能优先使用Grok 3,要想访问其他功能,还需要订阅SuperGrok。SuperGrok的价格为每月30美元或每年300美元,用户能解锁更多的推理和深度搜索查询功能,并无限访问图像生成功能。

马斯克说,在未来,或许大约一周后,Grok将增加语音模式。几周后,Grok 3模型将与DeepSearch功能一起出现在xAI的企业API中。几个月后,Grok 3的上一个版本Grok2将开源。

“我们通常会在下一个版本完全发布时,开源上一个版本。”马斯克说。“当Grok 3成熟且稳定时,可能在几个月内,我们将开源Grok 2。”

基于xAI介绍的Grok 3的种种功能,预计Grok 3在教育方面的应用效果将比此前的版本更胜一筹。至于Grok 3的效果是否比其他公司研发的模型更强,还需要等待市场和用户的检验。

但可以肯定的是,日益激烈的AI军备竞赛正在为教育带来愈发深远的影响。

  • 教育
  • 马斯克
  • AI
1、本文是 芥末堆网原创文章,转载可点击 芥末堆内容合作 了解详情,未经授权拒绝一切形式转载,违者必究;
2、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。
来源: 芥末堆
芥末堆商务合作:王老师 18710003484
展开
打开“财经头条”阅读更多精彩资讯
APP内打开