OpenAI计划发布具有推理能力的“开放权重”模型

CN
Decrypt
关注
1天前

AI爱好者们,你们的祈祷得到了回应。

OpenAI首席执行官萨姆·阿尔特曼周一表示,OpenAI计划在未来几个月内发布一个强大的开放权重语言模型,该模型具备推理能力,重新回到开放技术AI领域。

阿尔特曼在X上的一篇帖子中写道:“我们计划发布自GPT-2以来的第一个开放权重语言模型。我们考虑这个问题已经很长时间了,但其他优先事项占据了首位。现在感觉这样做很重要。”

这一公告是在OpenAI面临来自竞争对手的日益激烈的竞争之际发布的,这些竞争对手包括Meta及其Llama系列开源模型;谷歌的Gemma,具备多模态能力;以及中国AI实验室DeepSeek,后者最近发布了一种开源推理模型, reportedly 超过了OpenAI的o1。

当开发者与公众分享有关模型的所有信息时,该模型就是开源的——用户可以访问代码、训练数据集和架构等内容。

这使得用户能够修改和重新分发该模型。开放权重模型的开放程度较低:用户可以对其进行微调,但无法从头构建,因为他们无法访问关键元素,如训练数据集或架构。

为了收集开发者实际想要的反馈,OpenAI在其网站上发布了一个反馈表单,并宣布计划在几周内在旧金山举行开发者活动,随后在欧洲和亚太地区举行会议。

该公司在公告中表示:“我们很高兴能与开发者、研究人员和更广泛的社区合作,收集意见,使这个模型尽可能有用。”

在OpenAI API团队工作的史蒂文·海德尔也分享说,这个模型将能够在本地运行:“我们今年将发布一个可以在您自己的硬件上运行的模型。”

他没有具体说明该模型将具有多少参数、令牌上下文窗口、数据集、训练中使用的技术或发布许可证,这可能会限制在特定国家的逆向工程或微调等操作。

今天的公告标志着OpenAI最近将其最先进模型锁定在API后面的策略的重大转变。

这也与阿尔特曼在Reddit问答中最近的评论一致,他首次表示公司正在考虑发布一个完整的开源模型的想法。

阿尔特曼写道:“是的,我们正在讨论(发布一些模型权重和发布一些研究)。” “我个人认为我们在历史上走错了方向,需要找出一种不同的开源策略;并不是OpenAI的每个人都持有这种观点,这也不是我们当前的最高优先事项。”

根据阿尔特曼的帖子,即将发布的模型将具备与OpenAI的o3-mini相当的推理能力。这将使其成为迄今为止最强大的开放推理模型,超越DeepSeek R1。

编辑:塞巴斯蒂安·辛克莱乔什·奎特纳

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

Bitget:注册返10%, 送$100
广告
分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接