OpenAI推出新的“01”模型，表现优于ChatGPT-4o

OpenAI推出了一系列新模型，并于周四在其付费ChatGPT Plus订阅层面上提供了这些模型，声称这些模型在性能和推理能力方面有重大改进。

“我们介绍OpenAI o1，这是一个新的大型语言模型，经过强化学习训练，能够进行复杂的推理”，OpenAI在一篇官方博客文章中说，“o1在回答之前会先思考。” AI行业观察者们预计这家顶尖AI开发商将部署一个新的“草莓”模型已有数周之久，尽管不同的正在开发中的模型之间的区别并未公开披露。

OpenAI将这一新系列模型描述为一个重大飞跃，以至于他们改变了他们通常的命名方案，跳出了ChatGPT-3、ChatGPT-3.5和ChatGPT-4o系列。

“对于复杂的推理任务，这是一个重大的进步，代表了人工智能能力的一个新水平”，OpenAI 表示，“鉴于此，我们将计数器重置为一，并将这个系列命名为OpenAI o1。”

这些新模型运行的关键在于它们“花时间”思考后再行动，公司指出，并使用“思维链”推理使它们在复杂任务上极其有效。

值得注意的是，即使是这一新系列中最小的模型在几个关键领域也超过了顶级的GPT-4o，根据OpenAI分享的人工智能测试基准，特别是OpenAI在被认为具有博士级复杂性挑战的比较中。

新发布的模型强调了OpenAI所称的“深思熟虑的推理”，即系统在内部处理其回答时需要额外的时间。这一过程旨在产生更加周到、连贯的答案，特别是在推理密集型任务中。

OpenAI还发布了内部测试结果，显示在编码、微积分和数据分析等任务中，OpenAI o1相比GPT-4o有所改进。然而，公司披露，OpenAI o1在创造性任务如创意写作方面的改进并不那么显著。（我们自己的主观测试将OpenAI的产品在这些领域放在了Claude AI之后。）尽管如此，其新模型的结果在整体上得到了人类评估者的良好评价。

正如所指出的，新模型的能力实现了推理过程中的思维链AI。简而言之，这意味着该模型使用分段方法逐步推理问题，然后提供最终结果，这也是用户最终看到的。

“o1模型系列经过大规模强化学习训练，使用思维链进行推理，”OpenAI在o1系列的系统卡片中表示。“训练模型在回答之前加入思维链的过程有潜力带来实质性的好处，同时也增加了源自增强智能的潜在风险。”

这一广泛的断言为技术观察者留下了对该模型架构真正创新性的讨论空间。OpenAI并未阐明这一过程与基于标记的生成有何不同：它是真正的资源分配给推理，还是一个隐藏的思维链命令，或者可能是两种技术的混合？

之前的一个名为Reflection的开源AI模型曾尝试过类似的推理密集型方法，但因缺乏透明度而受到批评。该模型使用标签来区分其推理步骤，据其开发人员称，这导致了对传统模型输出的改进。

将更多指导方针嵌入到思维链过程中不仅使模型更准确，而且更不容易受到越狱技术的影响，因为它有更多的时间和步骤来捕捉潜在的有害结果。

越狱社区似乎一如既往地高效，找到了绕过AI安全控制的方法，OpenAI 01发布后不久就传出了首次成功的越狱。

目前尚不清楚这种深思熟虑的推理方法是否能够有效地应用于需要快速响应时间的实时应用。与此同时，OpenAI表示打算扩展模型的功能，包括网络搜索功能和改进的多模态交互。

该模型将随着时间的推移进行调整，以满足OpenAI在安全性、防越狱和自主性方面的最低标准。

该模型原定于今天推出，但可能会分阶段发布，因为一些用户报告称他们尚无法测试该模型。

最小版本最终将免费提供，并且根据OpenAI的公告，API访问将比OpenAI o1-preview便宜80%。但不要过于兴奋：目前每周只能测试30条01-preview消息和50条o1-mini消息，因此要明智地选择您的提示。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

OpenAI推出新的“01”模型，表现优于ChatGPT-4o

Decrypt的精选文章

目录

相关文章