今天凌晨3点,OpenAI正式发布了新模型o3-mini,可在ChatGPT和API中可用。
Pro用户可无限使用o3-mini,Plus和Team用户的速率限制将是o1-mini的3倍。免费版ChatGPT用户可以免费使用o3-mini,但有次数限制。
此外,o3-mini可以执行网络搜索功能,并展示完整的深度思考过程。遗憾的是,o3-mini不支持视觉推理。
o3-mini也是 OpenAI 首款支持多项开发者需求特性的小型推理模型,包括函数调用、结构化输出和开发者消息,无需额外调整可直接应用于实际环境中。
o3-mini和OpenAI o1-mini、OpenAI o1-preview 一样,也支持流式传输。开发者还能根据具体应用场景,在低、中、高三种推理强度选项中灵活选择:面对复杂难题时,可选择高推理强度让模型深入思考;面对延迟敏感问题时,可选择低推理强度优先保证速度。
在性能表现方面,OpenAI o3-mini 针对 STEM 推理进行了优化。在数学、编码和科学领域,中等推理强度的o3-mini 性能与OpenAI o1相当,但响应速度更快。专家评估发现,o3-mini给出的答案比OpenAI o1-mini更准确、清晰,推理能力更强。
在美国数学竞赛(AIME2024)中,低推理强度时o3-mini 与 o1-mini 表现相近,中等推理强度时与o1相当,高推理强度时则超越 o1-mini 和 o1;在博士水平科学问题测试中,不同推理强度的 o3-mini 表现同样出色。
在研究级数学测试里,高推理强度的 o3-mini 表现优于其前代模型;在竞赛编程中,o3-mini 随着推理强度增加,Elo评分逐步提高,均超过 o1-mini,中等推理强度时与o1表现相当;
在软件工程测试中,o3-mini 是表现最佳的模型。在速度上,o3-mini 平均响应时间为7.7秒,比 o1-mini的10.16秒快了24%。
在OpenAI发布新模型之后,网友上来就是灵魂发问,这个会比Deepseek的R1更好吗?
感谢新增网络搜索功能,非常喜欢这个。
功能请求:请在 ChatGPT 中添加一个选项,允许选择 DeepSeek R1作为模型,类似于 Perplexity AI。谢谢!
虽然不支持视觉功能,o3仍然遛的起飞。
在评估 o3-mini 后,到目前为止我对它很满意。很高兴它现在可以在处理我那庞大的代码库时展示其思考过程。注意到 DeepSeek 的影响,这很好,简单的功能就能带来很好的体验,帮助用户保持参与并获得新想法。
o3-mini高推理模式,Plus用户每周只有50条消息?
到目前为止我印象不错,本来可以更好,但实际上o3-mini已经很好了。
(举报)
今天凌晨3点,OpenAI正式发布了新模型o3-mini,可在ChatGPT和API中可用。
Pro用户可无限使用o3-mini,Plus和Team用户的速率限制将是o1-mini的3倍。免费版ChatGPT用户可以免费使用o3-mini,但有次数限制。
此外,o3-mini可以执行网络搜索功能,并展示完整的深度思考过程。遗憾的是,o3-mini不支持视觉推理。
o3-mini也是 OpenAI 首款支持多项开发者需求特性的小型推理模型,包括函数调用、结构化输出和开发者消息,无需额外调整可直接应用于实际环境中。
o3-mini和OpenAI o1-mini、OpenAI o1-preview 一样,也支持流式传输。开发者还能根据具体应用场景,在低、中、高三种推理强度选项中灵活选择:面对复杂难题时,可选择高推理强度让模型深入思考;面对延迟敏感问题时,可选择低推理强度优先保证速度。
在性能表现方面,OpenAI o3-mini 针对 STEM 推理进行了优化。在数学、编码和科学领域,中等推理强度的o3-mini 性能与OpenAI o1相当,但响应速度更快。专家评估发现,o3-mini给出的答案比OpenAI o1-mini更准确、清晰,推理能力更强。
在美国数学竞赛(AIME2024)中,低推理强度时o3-mini 与 o1-mini 表现相近,中等推理强度时与o1相当,高推理强度时则超越 o1-mini 和 o1;在博士水平科学问题测试中,不同推理强度的 o3-mini 表现同样出色。
在研究级数学测试里,高推理强度的 o3-mini 表现优于其前代模型;在竞赛编程中,o3-mini 随着推理强度增加,Elo评分逐步提高,均超过 o1-mini,中等推理强度时与o1表现相当;
在软件工程测试中,o3-mini 是表现最佳的模型。在速度上,o3-mini 平均响应时间为7.7秒,比 o1-mini的10.16秒快了24%。
在OpenAI发布新模型之后,网友上来就是灵魂发问,这个会比Deepseek的R1更好吗?
感谢新增网络搜索功能,非常喜欢这个。
功能请求:请在 ChatGPT 中添加一个选项,允许选择 DeepSeek R1作为模型,类似于 Perplexity AI。谢谢!
虽然不支持视觉功能,o3仍然遛的起飞。
在评估 o3-mini 后,到目前为止我对它很满意。很高兴它现在可以在处理我那庞大的代码库时展示其思考过程。注意到 DeepSeek 的影响,这很好,简单的功能就能带来很好的体验,帮助用户保持参与并获得新想法。
o3-mini高推理模式,Plus用户每周只有50条消息?
到目前为止我印象不错,本来可以更好,但实际上o3-mini已经很好了。
(举报)