
OpenAI CEO Altman 于今日凌晨透露,公司将在未来数月内推出整合 o3 及其他技术的 GPT-5 模型,并将其应用于 ChatGPT 和 API 服务。这也代表着 o3 将不会作为独立模型发布。
Altman 表示希望更透明地分享公司的发展路线图,同时简化产品体系结构。他强调希望 AI 能做到「开箱即用」,让用户无需费心理解复杂的模型与产品选择。(原来你也知道呀。)
此前有报道称,GPT-4.5(Orion)在性能优化上遇到了挑战,技术进展没有到达预期。外国媒体报道提到,GPT-4.5 相比 GPT-4o 的提升幅度,远不及 GPT-4 相较 GPT-3 的进步。
此外,OpenAI 未来的模型还有望按照每个用户输入自动选择调用相应的模型。用 Altman 的原话说:「我们和你一样讨厌模型选择器,也希望回归那种智能统一的『魔法』体验。」
接下来的几个月,OpenAI 的核心目标是统一 o 系列模型和 GPT 系列模型,打造能够整合所有工具的系统,使其可以依据需要决定何时进行深入思考,适用于更广泛的任务场景。
如开篇所说,在 ChatGPT 和 API 服务中,即将发布的 GPT-5 将整合包括 o3 在内的多项技术。而此前预告的 o3 模型将不再独立推出。
去年,OpenAI 曾计划于 2025 年初发布 o3。就在几周前,OpenAI 首席产品官 Kevin Weil 在接受媒体采访时还表示。o3 预计将在 2-3 月间发布,但目前尚不清楚 OpenAI 撕毁全年计划,临时「变卦」的原因。
实际上,OpenAI 的推理模型进步显著。以编程能力为例,他们的首个推理模型 o1 达到了「全球百万分之一」的竞争性编程水平,到去年 12 月份发布的 o3 模型已跃升至全球第 175 名。
根据内部测试,目前已接近全球第 50 名,Altman 预计今年年底有望问鼎榜首。
关于 GPT-5,Altman 还表示,ChatGPT 免费用户未来将在标准智能水平下无限制访问 GPT-5,但会受到滥用检测的限制。
Plus 订阅用户则可在更高的智能水平下运行 GPT-5,而 Pro 订阅用户 可使用更高智能水平的 GPT-5,这些模型将支持语音交互、画布功能(Canvas)、搜索、深度研究等多种增强功能。
当被网友问及 GPT-4.5/GPT-5 具体发布日期时,Altman 表示将在数周或数月内推出。
但网友显然是知道 Altman 怎么画饼的,网友纷纷猜测可能要等待数千周或数千月。
「很好!我们从始至终计划将推理能力作为 Gemini 基础模型的核心部分,而不是将其视为一个附加功能(这也是我们正在推进 2.0 Flash Thinking 能力的原因)」
「我认为我们最初会为 ChatGPT Plus 用户更好的提供 每月 10 次使用,而免费用户每月能够正常的使用 2 次,并计划跟着时间推移逐步增加这些额度。对某些用户来说,它的价值可能高达 $1000 美元/月,但我更期待看到大家怎么样去使用它!」
并且,Altman 还表示由于注意到一些用户对深度研究功能的需求非常高,因此从长久来看,OpenAI 仍需要找到一种更灵活的方式,让用户能根据需求动态支付计算资源费用。
具体来说,OpenAI 最新更新了一版长达 63 页的 Model Spec(模型规范)文件,较此前的 10 页版本内容更为详实。该规范明确了 AI 模型在处理敏感话题、用户自定义等方面的行为准则。
其中,新版本强调三大核心原则:可定制性(Customizability)、透明性(Transparency)以及「思想自由」(Intellectual Freedom)——允许用户探索和讨论各种观点,而不受武断限制。
吸取了过往一年发生在 OpenAI 身上的 AI 争议事件,新版 Model Spec 在诸如「电车难题」、明确禁止模型复制受版权保护的内容或绕过付费墙、调整对成人内容的策略、针对 AI 的迎合性改进等问题做出了更好的改进。
比方说,例如,现在如果你向 ChatGPT 提出类似「电车问题」,它应该会回答 「在防止大规模伤亡的情况下,能这么做。」又或者,模型不会一味回避敏感问题,而是应该 「与用户一起探索真相」,同时在错误信息和潜在危害方面保持明确立场。
考虑到用户请求 AI 评价他们的作品时,AI 只会盲目称赞,而不提供任何建设性意见,OpenAI 也作出了调整,ChatGPT 将会给出客观评价和建设性批评。
如果用户在提问中包含错误信息,AI 现在应该礼貌纠正而不是迎合用户的错误。
值得一提的是,OpenAI 官方放出的演示案例也疑似在内涵 DeepSeek 此前备受争议的数据蒸馏问题。
「我们无法创造一个让所有人都满意的模型。」OpenAI 模型行为小组成员 Joanne Jang 在接受 The Verge 采访时表示。她强调,尽管公司仍会保留 核心安全机制,但用户和开发的人能自定义许多模型行为。她还补充道:「我们大家都知道这会引起争议。」
插个冷知识,Joanne Jang 毕业于斯坦福大学,获得计算机科学硕士学位和数学与计算科学学士学位,目前在 OpenAI 担任产品经理,负责模型行为相关工作。
另外最近有消息传出,Anthropic Claude 4 预计将在本周发布,除了Claude 4,还有推理模型也将首亮相,评分全面超越 o3。这或许也是促使 Altman 一反常态、不再「挤牙膏」的重要原因之一。