35｜o3登场：慢慢接近AGI的下一代推理模型

李冬梅

你好，这里是极客头条。
OpenAI 12 天的马拉松式发布活动，终于迎来了尾声。在这长达两个多星期的系列发布期间，谷歌连续放出两款王炸大模型 Gemini 2.0 Flash 以及专攻推理的 Gemini 2.0 Flash Thinking，这种情况下，OpenAI 如果再不拿出点看家本领恐怕有些说不过去了。
在前几天无关痛痒的新功能推出后，人们都在期待 OpenAI 能放出点“猛料”。别急，“猛料”来了…
以下是正文：
👇👇👇
OpenAI 发布 o3 和 o3 mini 大模型OpenAI 宣布推出两款前沿模型：o3 和 o3-mini。它们是本月初刚刚全面发布的 o1 和 o1 mini 模型的继任者，更准确地说，o3 是一个像 o1 一样的模型系列，o3-mini 是一个更小、更精简的模型，针对特定任务进行了微调。OpenAI 正在慢慢邀请选定的用户测试这套新的推理模型。
早在今天直播之前，OpenAI CEO Sam Altman 就在 X 平台上发布推文暗示了新 AI 模型 GPT-o3 的发布。Altman 的推文中包含了“呵呵呵，明天见”和“找到线索，应该会说哦哦哦”等短语，暗示了 o3 模型即将发布。推文中“o”和“h”的反复使用被视为即将发布的预兆。
此次发布恰逢 OpenAI 的“OpenAI 12 天”活动的最后一天。在过去的 11 天里，OpenAI 发布了功能齐全的 o1 模型并推出了相关 API。此外，该公司还升级了各种功能，包括函数调用、结构化输出、推理工作量控制、开发人员消息传递和视觉输入功能。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
法语
德语
日语
韩语
俄语
西班牙语
解释
总结

1. OpenAI发布了o3和o3-mini大模型，o3是o1的继任者，o3-mini是更小、更精简的模型，针对特定任务进行了微调。 2. o3模型在编码方面表现出色，具有卓越的编码性能和数学科学掌握能力，以及在推理能力上有了非常大的改进。 3. o3模型能够有效地自我核实事实，具有事实核查过程，但需要更长的时间才能得出解决方案。 4. o3模型具有新功能，能够调整推理时间，设置为低、中或高计算时间，计算时间越长，o3在任务上的表现就越好。 5. OpenAI加强了对安全和对齐的承诺，表示正在使用一种新技术“审议性对齐”，使o3等模型与其安全原则保持一致。 6. o3模型在ARC-AGI测试中表现出色，但高计算设置的成本较高。 7. o3在编程任务基准SWE-Bench Verified上表现优异，获得了高分。 8. 推理模型成为大势所趋，引发了竞争对手AI公司的推理模型发布。 9. o3的发布引发了广泛讨论，有用户对其性能表示期待和认可。 10. OpenAI的技术先进，但也存在贵为的问题，同时科学家Alec Radford离职从事独立研究。

该试读文章来自《极客头条》，如需阅读全部文章，
请先领取课程

免费领取

登录后留言

精选留言

由作者筛选后的优质留言将会公开显示，欢迎踊跃留言。

收起评论