OpenAI发布GPT-4.1:为什么这个超级强大的AI模型将取代GPT-4.5

CN
Decrypt
关注
1天前

OpenAI在周一发布了GPT-4.1,这是三款新的AI模型,具有高达一百万个标记的上下文窗口——足以一次性处理整个代码库或小型小说。该系列包括标准的GPT-4.1、Mini和Nano变体,所有这些都针对开发者。

该公司的最新产品发布仅在几周前推出了GPT-4.5,形成的时间线与《星球大战》电影的发布顺序一样让人费解。“将这些命名为4.1的决定是有意为之。我是说,这不仅仅是因为我们不擅长命名,”OpenAI产品负责人Kevin Weil在发布会上表示——但我们仍在努力找出这些意图是什么。

GPT-4.1展现了相当有趣的能力。根据OpenAI的说法,它在SWEBench编码基准测试中达到了55%的准确率(比GPT-4o的33%有所提升),同时成本降低了26%。新的Nano变体被称为公司“有史以来最小、最快、最便宜的模型”,每百万个标记的运行成本仅为12美分。

此外,OpenAI不会对处理大文档和实际使用一百万个标记的上下文收取额外费用。“长上下文没有价格上涨,”Kevin强调道。

新模型展现了令人印象深刻的性能提升。在一次现场演示中,GPT-4.1生成了一个完整的Web应用程序,能够分析1995年的一个450,000个标记的NASA服务器日志文件。openAI声称该模型在这一测试中以接近100%的准确率通过,即使在一百万个标记的上下文中。

OpenAI的后训练研究负责人Michelle还展示了模型增强的指令遵循能力。“模型完全遵循你的所有指令,”她说,GPT-4.1忠实地遵循复杂的格式要求,没有通常AI“创造性解释”指令的倾向。

如何不计数:OpenAI的模型命名指南

在GPT-4.1发布后,GPT-4.5的发布感觉就像看着某人面不改色地数“5, 6, 4, 7”。这是OpenAI奇怪版本控制传奇的最新篇章。

在发布GPT-4后,它升级了该模型,增加了多模态能力。公司决定将这个新模型称为GPT-4o(“o”代表“全能”),这个名字在不同字体下也可以被解读为“四零”。

然后,OpenAI推出了一个以推理为重点的模型,直接称为“o”。但不要将OpenAI的GPT-4o与OpenAI的o混淆,因为它们并不相同。没有人知道他们为什么选择这个名字,但一般来说,GPT-4o是一个“正常”的LLM,而OpenAI o1是一个推理模型。

在OpenAI o1发布几个月后,出现了OpenAI o3

但o2呢?——这个模型从未存在过。

“你可能会逻辑上认为(我们的新模型)应该叫o2,但出于对我们在Telefonica的朋友的尊重——以及OpenAI在命名方面确实很糟糕的传统——它将被称为o3,”Sam Altman在模型发布时

该系列进一步细分,出现了正常的o3变体和一个更小、更高效的版本,称为o3 mini。然而,他们还发布了一个名为“OpenAI o3 mini-high”的模型,这将两个绝对反义词放在一起,因为AI可以做出奇迹。从本质上讲,OpenAI o3 mini-high是比o3 mini更强大的版本,但不如OpenAI o3强大——在OpenAI的一张图表中被称为“o3(中等)”,这也是应该的。目前,ChatGPT用户可以选择OpenAI o3 mini或OpenAI o3 mini high。正常版本则无处可寻。


图片:OpenAI

此外,我们不想再让你困惑,但OpenAI已经宣布计划很快发布o4。但当然,不要将o4与4o混淆,因为它们绝对不是同一个:o4是推理的——而4o则不是。

现在,让我们回到新发布的GPT-4.1。这个模型非常出色,它将很快取代GPT-4.5,使该模型成为ChatGPT历史上寿命最短的LLM。“我们宣布将会在API中弃用GPT-4.5,”Kevin宣称,给开发者三个月的时间进行切换。“我们确实需要那些GPU回来,”他补充道,确认即使是OpenAI也无法逃脱困扰整个行业的硅短缺。

以这种速度,我们注定会在年底之前看到GPT-π或GPT-4.√2——但嘿,至少无论名字如何,它们随着时间的推移会变得更好。

这些模型已经可以通过API和OpenAI的游乐场使用,但在用户友好的ChatGPT界面中尚不可用——至少目前还不行。

编辑:James Rubin

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

币安:注册返10%、领$600
链接:https://accounts.suitechsui.blue/zh-CN/register?ref=FRV6ZPAF&return_to=aHR0cHM6Ly93d3cuc3VpdGVjaHN1aS5hY2FkZW15L3poLUNOL2pvaW4_cmVmPUZSVjZaUEFG
广告
分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接