PC6下载站

分类分类

刚刚,OpenAI发布o3-mini,可免费使用、3大推理模式

关注+2025-02-02作者:路西蓝

今天凌晨3点,OpenAI正式发布了新模型o3-mini,可在ChatGPT和API中可用。

Pro用户可无限使用o3-mini,Plus和Team用户的速率限制将是o1-mini的3倍。免费版ChatGPT用户可以免费使用o3-mini,但有次数限制。

此外,o3-mini可以执行网络搜索功能,并展示完整的深度思考过程。遗憾的是,o3-mini不支持视觉推理

VRiaM8kGogImicqpohqEA/640?wx_fmt=png&from=appmsg" data-type="png" data-w="554" data-original-="" data-index="1" src="http://pic.chinaz.com/2025/0201/2025020116230481510.jpg" _width="554px" alt="图片" data-fail="0" style="margin: 0px auto; padding: 0px; box-sizing: border-box; outline: 0px; border: 1px solid rgb(238, 238, 238); --tw-shadow: 0 0 #0000; --tw-ring-inset: var(--tw-empty, ); --tw-ring-offset-width: 0px; --tw-ring-offset-color: #fff; --tw-ring-color: rgba(41, 110, 228, 0.5); --tw-ring-offset-shadow: 0 0 #0000; --tw-ring-shadow: 0 0 #0000; max-width: 700px; background: url("../img/bglogo2.svg") center center no-repeat rgb(247, 248, 249); box-shadow: rgba(27, 95, 160, 0.1) 0px 1px 3px; display: inline-block;"/>

o3-mini也是 OpenAI 首款支持多项开发者需求特性的小型推理模型,包括函数调用、结构化输出和开发者消息,无需额外调整可直接应用于实际环境中。

o3-mini和OpenAI o1-mini、OpenAI o1-preview 一样,也支持流式传输开发者还能根据具体应用场景,在低、中、高三种推理强度选项中灵活选择:面对复杂难题时,可选择高推理强度让模型深入思考;面对延迟敏感问题时,可选择低推理强度优先保证速度。

在性能表现方面,OpenAI o3-mini 针对 STEM 推理进行了优化。在数学、编码和科学领域,中等推理强度的o3-mini 性能与OpenAI o1相当,但响应速度更快。专家评估发现,o3-mini给出的答案比OpenAI o1-mini更准确、清晰,推理能力更强。

在美国数学竞赛(AIME2024)中,低推理强度时o3-mini 与 o1-mini 表现相近,中等推理强度时与o1相当,高推理强度时则超越 o1-mini 和 o1;在博士水平科学问题测试中,不同推理强度的 o3-mini 表现同样出色。

FMt=png&from=appmsg" data-type="png" data-w="554" data-original-="" data-index="2" src="http://pic.chinaz.com/2025/0201/2025020116230481511.jpg" _width="554px" alt="图片" data-fail="0" style="margin: 0px auto; padding: 0px; box-sizing: border-box; outline: 0px; border: 1px solid rgb(238, 238, 238); --tw-shadow: 0 0 #0000; --tw-ring-inset: var(--tw-empty, ); --tw-ring-offset-width: 0px; --tw-ring-offset-color: #fff; --tw-ring-color: rgba(41, 110, 228, 0.5); --tw-ring-offset-shadow: 0 0 #0000; --tw-ring-shadow: 0 0 #0000; max-width: 700px; background: url("../img/bglogo2.svg") center center no-repeat rgb(247, 248, 249); box-shadow: rgba(27, 95, 160, 0.1) 0px 1px 3px; display: inline-block;"/>

在研究级数学测试里,高推理强度的 o3-mini 表现优于其前代模型;在竞赛编程中,o3-mini 随着推理强度增加,Elo评分逐步提高,均超过 o1-mini,中等推理强度时与o1表现相当;

在软件工程测试中,o3-mini 是表现最佳的模型。在速度上,o3-mini 平均响应时间为7.7秒,比 o1-mini的10.16秒快了24%

rssraLeNic0c7t0N712ww/640?wx_fmt=png&from=appmsg" data-type="png" data-w="554" data-original-="" data-index="3" src="http://pic.chinaz.com/2025/0201/2025020116230481512.jpg" _width="554px" alt="图片" data-fail="0" style="margin: 0px auto; padding: 0px; box-sizing: border-box; outline: 0px; border: 1px solid rgb(238, 238, 238); --tw-shadow: 0 0 #0000; --tw-ring-inset: var(--tw-empty, ); --tw-ring-offset-width: 0px; --tw-ring-offset-color: #fff; --tw-ring-color: rgba(41, 110, 228, 0.5); --tw-ring-offset-shadow: 0 0 #0000; --tw-ring-shadow: 0 0 #0000; max-width: 700px; background: url("../img/bglogo2.svg") center center no-repeat rgb(247, 248, 249); box-shadow: rgba(27, 95, 160, 0.1) 0px 1px 3px; display: inline-block;"/>

在OpenAI发布新模型之后,网友上来就是灵魂发问,这个会比Deepseek的R1更好吗?

图片

感谢新增网络搜索功能,非常喜欢这个。

图片

功能请求:请在 ChatGPT 中添加一个选项,允许选择 DeepSeek R1作为模型,类似于 PERPlexity AI。谢谢!

图片

虽然不支持视觉功能,o3仍然遛的起飞。

图片

在评估 o3-mini 后,到目前为止我对它很满意。很高兴它现在可以在处理我那庞大的代码库时展示其思考过程。注意到 DeepSeek 的影响,这很好,简单的功能就能带来很好的体验,帮助用户保持参与并获得新想法。

图片

o3-mini高推理模式,Plus用户每周只有50条消息?

图片

到目前为止我印象不错,本来可以更好,但实际上o3-mini已经很好了。

图片


展开全部

相关文章

更多+相同厂商

热门推荐

  • 最新排行
  • 最热排行
  • 评分最高
排行榜

    点击查看更多

      点击查看更多

        点击查看更多

        说两句网友评论

          我要评论...
          取消