没等来GPT-5,却等来了OpenAI悄悄发布的「o3-pro」。
我们一起看看这个声称 “最强AI模型” 的o3-pro,有哪些亮点?适合哪些人使用?
1 什么是o3-pro?
简单来说,o3-pro是o3推理模型的加强版。官方介绍它是目前推理能力最强的一代。
具体来说,o3-pro是专门为复杂问题设计的:它不追求快,而是强调“想得清楚”。像数学、科学、编程、写作、教育类任务,它处理得更有条理,输出内容更准确、结构更清晰。
2 性能表现亮眼
先来上成绩单。
在专家评估中,o3-pro比o3得到了更多认可。
在OpenAI内部的测试数据中,o3-pro表现相当亮眼:
在数学测试AIME 2024中,超过了谷歌的 Gemini 2.5 Pro。
在GPQA Diamond(博士级科学知识评测)中,胜过了Anthropic家的 Claude 4 Opus。
在编程测试Codeforces中,也比前代模型有了不小的提升。
这些测试都是针对逻辑严谨性和知识深度的高难度评估。能在这里脱颖而出,确实说明了OpenAI在思考推理能力上的进步。
此外,OpenAI还用 “4/4可靠性评估” 来证明了o3-pro的可靠性(4次回答全部正确才被视为成功)。
3 价格如何?
来看下API调用的价格:
输入:$20/百万token
输出:$80/百万token
相较于普通o3,价格贵了10倍......
4 最强也有局限性
再强的模型,也不是十全十美。
OpenAI列出了目前o3-pro存在的一些局限:
速度比前代慢,输出时间更长;
暂不支持图像生成;
暂时不兼容Canvas功能;
ChatGPT中无法使用“临时对话”功能。
不过这些问题对大多数文字为主的使用场景来说,影响不大。但如果你要的是深度和准确性,那就得接受慢工出细活儿。
目前,o3-pro已经面向ChatGPT Pro和Team用户开放,企业和教育用户下周可用。
如果你日常对AI回答的质量、准确率有较高要求,不妨试试看。
原文标题 : OpenAI发布最强AI模型!
没等来GPT-5,却等来了OpenAI悄悄发布的「o3-pro」。
我们一起看看这个声称 “最强AI模型” 的o3-pro,有哪些亮点?适合哪些人使用?
1 什么是o3-pro?
简单来说,o3-pro是o3推理模型的加强版。官方介绍它是目前推理能力最强的一代。
具体来说,o3-pro是专门为复杂问题设计的:它不追求快,而是强调“想得清楚”。像数学、科学、编程、写作、教育类任务,它处理得更有条理,输出内容更准确、结构更清晰。
2 性能表现亮眼
先来上成绩单。
在专家评估中,o3-pro比o3得到了更多认可。
在OpenAI内部的测试数据中,o3-pro表现相当亮眼:
在数学测试AIME 2024中,超过了谷歌的 Gemini 2.5 Pro。
在GPQA Diamond(博士级科学知识评测)中,胜过了Anthropic家的 Claude 4 Opus。
在编程测试Codeforces中,也比前代模型有了不小的提升。
这些测试都是针对逻辑严谨性和知识深度的高难度评估。能在这里脱颖而出,确实说明了OpenAI在思考推理能力上的进步。
此外,OpenAI还用 “4/4可靠性评估” 来证明了o3-pro的可靠性(4次回答全部正确才被视为成功)。
3 价格如何?
来看下API调用的价格:
输入:$20/百万token
输出:$80/百万token
相较于普通o3,价格贵了10倍......
4 最强也有局限性
再强的模型,也不是十全十美。
OpenAI列出了目前o3-pro存在的一些局限:
速度比前代慢,输出时间更长;
暂不支持图像生成;
暂时不兼容Canvas功能;
ChatGPT中无法使用“临时对话”功能。
不过这些问题对大多数文字为主的使用场景来说,影响不大。但如果你要的是深度和准确性,那就得接受慢工出细活儿。
目前,o3-pro已经面向ChatGPT Pro和Team用户开放,企业和教育用户下周可用。
如果你日常对AI回答的质量、准确率有较高要求,不妨试试看。
原文标题 : OpenAI发布最强AI模型!