35|o3登场:慢慢接近AGI的下一代推理模型
李冬梅

你好,这里是极客头条。
OpenAI 12 天的马拉松式发布活动,终于迎来了尾声。在这长达两个多星期的系列发布期间,谷歌连续放出两款王炸大模型 Gemini 2.0 Flash 以及专攻推理的 Gemini 2.0 Flash Thinking,这种情况下,OpenAI 如果再不拿出点看家本领恐怕有些说不过去了。
在前几天无关痛痒的新功能推出后,人们都在期待 OpenAI 能放出点“猛料”。别急,“猛料”来了…
以下是正文:
👇👇👇
OpenAI 发布 o3 和 o3 mini 大模型
OpenAI 宣布推出两款前沿模型:o3 和 o3-mini。它们是本月初刚刚全面发布的 o1 和 o1 mini 模型的继任者,更准确地说,o3 是一个像 o1 一样的模型系列,o3-mini 是一个更小、更精简的模型,针对特定任务进行了微调。OpenAI 正在慢慢邀请选定的用户测试这套新的推理模型。
早在今天直播之前,OpenAI CEO Sam Altman 就在 X 平台上发布推文暗示了新 AI 模型 GPT-o3 的发布。Altman 的推文中包含了“呵呵呵,明天见”和“找到线索,应该会说哦哦哦”等短语,暗示了 o3 模型即将发布。推文中“o”和“h”的反复使用被视为即将发布的预兆。

此次发布恰逢 OpenAI 的“OpenAI 12 天”活动的最后一天。在过去的 11 天里,OpenAI 发布了功能齐全的 o1 模型并推出了相关 API。此外,该公司还升级了各种功能,包括函数调用、结构化输出、推理工作量控制、开发人员消息传递和视觉输入功能。
公开
同步至部落
取消
完成
0/2000
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结

1. OpenAI发布了o3和o3-mini大模型,o3是o1的继任者,o3-mini是更小、更精简的模型,针对特定任务进行了微调。 2. o3模型在编码方面表现出色,具有卓越的编码性能和数学科学掌握能力,以及在推理能力上有了非常大的改进。 3. o3模型能够有效地自我核实事实,具有事实核查过程,但需要更长的时间才能得出解决方案。 4. o3模型具有新功能,能够调整推理时间,设置为低、中或高计算时间,计算时间越长,o3在任务上的表现就越好。 5. OpenAI加强了对安全和对齐的承诺,表示正在使用一种新技术“审议性对齐”,使o3等模型与其安全原则保持一致。 6. o3模型在ARC-AGI测试中表现出色,但高计算设置的成本较高。 7. o3在编程任务基准SWE-Bench Verified上表现优异,获得了高分。 8. 推理模型成为大势所趋,引发了竞争对手AI公司的推理模型发布。 9. o3的发布引发了广泛讨论,有用户对其性能表示期待和认可。 10. OpenAI的技术先进,但也存在贵为的问题,同时科学家Alec Radford离职从事独立研究。
该试读文章来自《极客头条》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论