OpenAI计划发布具有推理能力的“开放权重”模型

AI爱好者们，你们的祈祷得到了回应。

OpenAI首席执行官萨姆·阿尔特曼周一表示，OpenAI计划在未来几个月内发布一个强大的开放权重语言模型，该模型具备推理能力，重新回到开放技术AI领域。

阿尔特曼在X上的一篇帖子中写道：“我们计划发布自GPT-2以来的第一个开放权重语言模型。我们考虑这个问题已经很长时间了，但其他优先事项占据了首位。现在感觉这样做很重要。”

这一公告是在OpenAI面临来自竞争对手的日益激烈的竞争之际发布的，这些竞争对手包括Meta及其Llama系列开源模型；谷歌的Gemma，具备多模态能力；以及中国AI实验室DeepSeek，后者最近发布了一种开源推理模型， reportedly 超过了OpenAI的o1。

当开发者与公众分享有关模型的所有信息时，该模型就是开源的——用户可以访问代码、训练数据集和架构等内容。

这使得用户能够修改和重新分发该模型。开放权重模型的开放程度较低：用户可以对其进行微调，但无法从头构建，因为他们无法访问关键元素，如训练数据集或架构。

为了收集开发者实际想要的反馈，OpenAI在其网站上发布了一个反馈表单，并宣布计划在几周内在旧金山举行开发者活动，随后在欧洲和亚太地区举行会议。

该公司在公告中表示：“我们很高兴能与开发者、研究人员和更广泛的社区合作，收集意见，使这个模型尽可能有用。”

在OpenAI API团队工作的史蒂文·海德尔也分享说，这个模型将能够在本地运行：“我们今年将发布一个可以在您自己的硬件上运行的模型。”

他没有具体说明该模型将具有多少参数、令牌上下文窗口、数据集、训练中使用的技术或发布许可证，这可能会限制在特定国家的逆向工程或微调等操作。

今天的公告标志着OpenAI最近将其最先进模型锁定在API后面的策略的重大转变。

这也与阿尔特曼在Reddit问答中最近的评论一致，他首次表示公司正在考虑发布一个完整的开源模型的想法。

阿尔特曼写道：“是的，我们正在讨论（发布一些模型权重和发布一些研究）。” “我个人认为我们在历史上走错了方向，需要找出一种不同的开源策略；并不是OpenAI的每个人都持有这种观点，这也不是我们当前的最高优先事项。”

根据阿尔特曼的帖子，即将发布的模型将具备与OpenAI的o3-mini相当的推理能力。这将使其成为迄今为止最强大的开放推理模型，超越DeepSeek R1。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

Decrypt的精选文章