OpenAI发布最强AI模型!

智车科技

2天前

在编程测试Codeforces中,也比前代模型有了不小的提升。...简单来说,o3-pro是o3推理模型的加强版。

没等来GPT-5,却等来了OpenAI悄悄发布的「o3-pro」。

我们一起看看这个声称 “最强AI模型” 的o3-pro,有哪些亮点?适合哪些人使用?

1 什么是o3-pro?

简单来说,o3-pro是o3推理模型的加强版。官方介绍它是目前推理能力最强的一代。

具体来说,o3-pro是专门为复杂问题设计的:它不追求快,而是强调“想得清楚”。像数学、科学、编程、写作、教育类任务,它处理得更有条理,输出内容更准确、结构更清晰。 

2 性能表现亮眼

先来上成绩单。

在专家评估中,o3-pro比o3得到了更多认可。

在OpenAI内部的测试数据中,o3-pro表现相当亮眼:

在数学测试AIME 2024中,超过了谷歌的 Gemini 2.5 Pro。

在GPQA Diamond(博士级科学知识评测)中,胜过了Anthropic家的 Claude 4 Opus。

在编程测试Codeforces中,也比前代模型有了不小的提升。

这些测试都是针对逻辑严谨性和知识深度的高难度评估。能在这里脱颖而出,确实说明了OpenAI在思考推理能力上的进步。 

此外,OpenAI还用 “4/4可靠性评估” 来证明了o3-pro的可靠性(4次回答全部正确才被视为成功)。

3 价格如何?

来看下API调用的价格:

输入:$20/百万token

输出:$80/百万token

相较于普通o3,价格贵了10倍......

4 最强也有局限性

再强的模型,也不是十全十美。

OpenAI列出了目前o3-pro存在的一些局限:

速度比前代慢,输出时间更长;

暂不支持图像生成;

暂时不兼容Canvas功能;

ChatGPT中无法使用“临时对话”功能。

不过这些问题对大多数文字为主的使用场景来说,影响不大。但如果你要的是深度和准确性,那就得接受慢工出细活儿。

目前,o3-pro已经面向ChatGPT Pro和Team用户开放,企业和教育用户下周可用。

如果你日常对AI回答的质量、准确率有较高要求,不妨试试看。

原文标题 : OpenAI发布最强AI模型!

在编程测试Codeforces中,也比前代模型有了不小的提升。...简单来说,o3-pro是o3推理模型的加强版。

没等来GPT-5,却等来了OpenAI悄悄发布的「o3-pro」。

我们一起看看这个声称 “最强AI模型” 的o3-pro,有哪些亮点?适合哪些人使用?

1 什么是o3-pro?

简单来说,o3-pro是o3推理模型的加强版。官方介绍它是目前推理能力最强的一代。

具体来说,o3-pro是专门为复杂问题设计的:它不追求快,而是强调“想得清楚”。像数学、科学、编程、写作、教育类任务,它处理得更有条理,输出内容更准确、结构更清晰。 

2 性能表现亮眼

先来上成绩单。

在专家评估中,o3-pro比o3得到了更多认可。

在OpenAI内部的测试数据中,o3-pro表现相当亮眼:

在数学测试AIME 2024中,超过了谷歌的 Gemini 2.5 Pro。

在GPQA Diamond(博士级科学知识评测)中,胜过了Anthropic家的 Claude 4 Opus。

在编程测试Codeforces中,也比前代模型有了不小的提升。

这些测试都是针对逻辑严谨性和知识深度的高难度评估。能在这里脱颖而出,确实说明了OpenAI在思考推理能力上的进步。 

此外,OpenAI还用 “4/4可靠性评估” 来证明了o3-pro的可靠性(4次回答全部正确才被视为成功)。

3 价格如何?

来看下API调用的价格:

输入:$20/百万token

输出:$80/百万token

相较于普通o3,价格贵了10倍......

4 最强也有局限性

再强的模型,也不是十全十美。

OpenAI列出了目前o3-pro存在的一些局限:

速度比前代慢,输出时间更长;

暂不支持图像生成;

暂时不兼容Canvas功能;

ChatGPT中无法使用“临时对话”功能。

不过这些问题对大多数文字为主的使用场景来说,影响不大。但如果你要的是深度和准确性,那就得接受慢工出细活儿。

目前,o3-pro已经面向ChatGPT Pro和Team用户开放,企业和教育用户下周可用。

如果你日常对AI回答的质量、准确率有较高要求,不妨试试看。

原文标题 : OpenAI发布最强AI模型!

展开
打开“财经头条”阅读更多精彩资讯
APP内打开