马斯克发布Grok 3大模型，称超越DeepSeek

芥末堆官网

3天前

北京时间2月18日12时，马斯克在X平台直播，宣布其AI公司xAI发布最新版的旗舰AI大模型Grok3。

北京时间2月18日12时，马斯克在X平台直播，宣布其AI公司xAI发布最新版的旗舰AI大模型Grok 3。这场直播的在线观看人数超200万。

马斯克此前称Grok 3是“地球上最聪明的人工智能”。

Grok 3大模型包括Grok 3和Grok 3 mini两个版本。两者的区别是Grok 3 mini回答问题的速度更快，但准确性逊色一些。

xAI团队首先展示了Grok 3与其他大模型的比赛结果。xAI称，Grok 3在AIME、GPQA和LCB的基准测试中胜过GPT-4o、Claude 3.5 Sonnet、DeepSeek-V3、Gemini-2 Pro等模型，这意味着Grok 3在数学、科学和代码等数据集上更胜一筹。

xAI还表示，Grok 3的早期版本chocolate在Chatbot Arena中的分数也更高。Chatbot Arena是由国际开放研究组织LMSYS Or推出的一款大模型竞技场。

据xAI官方介绍，Grok 3的训练计算量是Grok 2的10倍多。

Grok 3支持推理能力，解锁了测试时计算（test-time compute）能力。当使用更多测试时间计算时，Grok 3 Reasoning和Grok 3 mini Reasoning的表现超过了高配版o3 mini、o1和DeepSeek-R1等其他模型。

Grok 3和Grok 3 mini有DeepSearch、Think、BigBrain三个主要的功能按钮，支持研究、头脑风暴、数据分析、图像生成和代码生成多个功能。

使用Think模式，Grok 3和Grok 3 mini可以仔细地思考问题，这个功能类似于OpenAI的o3 mini和DeepSeek-R1等的推理模型。用户可以通过Grok的应用程序访问Grok 3。

遇到更难的问题时，可以使用Big Brain模式进行更全面、更仔细的推理。xAI表示，这个模式最适合解决数学、科学和编程的相关问题。

同时，马斯克指出，Grok 3将部分推理过程模糊化，以防止被蒸馏。蒸馏指的是AI模型开发人员从另一个模型中提取知识。

值得注意的是，Grok新增了DeepSearch的新功能，对标OpenAI的DeepResearch等功能。DeepSearch可以用于深度搜索，扫描互联网和X平台，分析信息，并提供摘要回答用户的问题。

X Premium+的订阅用户能优先使用Grok 3，要想访问其他功能，还需要订阅SuperGrok。SuperGrok的价格为每月30美元或每年300美元，用户能解锁更多的推理和深度搜索查询功能，并无限访问图像生成功能。

马斯克说，在未来，或许大约一周后，Grok将增加语音模式。几周后，Grok 3模型将与DeepSearch功能一起出现在xAI的企业API中。几个月后，Grok 3的上一个版本Grok2将开源。

“我们通常会在下一个版本完全发布时，开源上一个版本。”马斯克说。“当Grok 3成熟且稳定时，可能在几个月内，我们将开源Grok 2。”

基于xAI介绍的Grok 3的种种功能，预计Grok 3在教育方面的应用效果将比此前的版本更胜一筹。至于Grok 3的效果是否比其他公司研发的模型更强，还需要等待市场和用户的检验。

但可以肯定的是，日益激烈的AI军备竞赛正在为教育带来愈发深远的影响。

1、本文是芥末堆网原创文章，转载可点击芥末堆内容合作了解详情，未经授权拒绝一切形式转载，违者必究；
2、如果你也从事教育，并希望被芥末堆报道，请您填写信息告诉我们。

来源：芥末堆

芥末堆商务合作：王老师 18710003484