作者:Carl Franzen
编译:深潮 TechFlow
就在几天前,只有最专业的极客们(作为其中一员,我这样说)才听说过DeepSeek,这是一家中国AI公司,是同样具有独特名字的High-Flyer Capital Management(一家于2015年成立的量化分析公司)的子公司。然而在过去的几天里,它可能成为了硅谷最受关注的公司。
这主要归功于DeepSeek-R1的发布,这是一个新的大语言模型(LLM),它能够进行类似于OpenAI当前最佳模型o1的"推理"——在回答困难问题和解决复杂问题时需要花费数秒或数分钟,通过步骤式或"思维链"的方式对自身的分析进行反思。
不仅如此,DeepSeek-R1在各种第三方基准测试(用于测量AI在各种主题上回答问题的性能的测试)中的得分与OpenAI的o1持平或更高,而且据报道其训练成本仅为约500万美元,使用的图形处理器(GPU)数量也远远少于美国(OpenAI的大本营)严格禁运的数量。
但与o1不同的是,o1只向付费的ChatGPT Plus级别订阅者(每月20美元)和更高级别的订阅者(如每月200美元的Pro级别)开放,而DeepSeek-R1是作为完全开源模型发布的,这也解释了为什么它迅速攀升至AI代码共享社区Hugging Face最受欢迎和最活跃模型的榜首。
而且,由于它是完全开源的,人们已经对该模型进行了多种微调和训练,以适应不同的特定任务,比如使其小到可以在移动设备上运行,或者与其他开源模型结合使用。即使你想将其用于开发目的,DeepSeek的API成本也比OpenAI的同等o1模型低90%以上。
最令人印象深刻的是,你甚至不需要是软件工程师就能使用它:DeepSeek为美国用户提供了免费的网站和移动应用,其R1驱动的聊天机器人界面与OpenAI的ChatGPT非常相似。不过,DeepSeek再次通过将这个强大的推理模型与网络搜索连接起来超越了OpenAI——这是OpenAI目前还没有实现的(网络搜索目前只在功能较弱的GPT系列模型上可用)。
一个显而易见的讽刺
考虑到OpenAI最初致力于为大众民主化AI的目标,这里存在着一个相当有趣,或者说令人不安的讽刺。正如Nvidia高级研究经理Jim Fan在X上所说:"我们正生活在这样一个时间线里:一家非美国公司正在延续着OpenAI的原始使命——真正开放的前沿研究,赋能所有人。这说不通。但最有趣的结果往往就是最可能发生的。"
又如X用户@SuspendedRobot所说(引用了有关DeepSeek似乎是在ChatGPT生成的问答输出和其他数据上训练的报道):"OpenAI从整个互联网窃取数据来让自己变得更富有,而DeepSeek从他们那里窃取后又免费回馈给大众,这让我想起了一个英国民间故事。"
Meta陷入危机,因开源Llama落后?
但不只是Fan注意到了DeepSeek的成功。基于我与各种工程师、思想家和领导者的交谈和阅读,DeepSeek-R1的开源可用性、其高性能表现,以及它似乎"突然冒出来"就挑战了前生成式AI领导者的事实,在整个硅谷及其他地方引起了震动。如果不是像我夸张的标题所说的"所有人"都在为之疯狂,它至少是科技和商业圈子里的热门话题。
一条发布在Blind(硅谷匿名八卦分享应用)上的消息正在广泛传播,暗示Meta因DeepSeek的成功而陷入危机,因为它如此迅速地超越了Meta自身通过Llama模型成为开源AI之王的努力。
“这改变了整个游戏规则”
X用户@tphuang发表了令人信服的观点:"DeepSeek已经在最顶级之外实现了AI的商品化。第一张图片让我豁然开朗。R1比美国的劳动力成本低得多,这意味着未来5年内许多工作将被自动化取代。"他后来还指出了为什么DeepSeek的R1比OpenAI的o1对用户更具吸引力:
"o1有3个巨大问题:
1)太慢
2)太贵
3)最终用户缺乏控制权/过度依赖OpenAI。
R1解决了所有这些问题。公司可以购买自己的Nvidia GPU来运行这些模型,不用担心额外成本或OpenAI服务器反应慢/不响应的问题。"
@tphaung还提出了一个发人深省的类比问题:"DeepSeek会成为LLM领域的Android吗?"
网络企业家Arnaud Bertrand在X上直言不讳地谈到了DeepSeek成功的惊人影响:"这对整个游戏规则的改变程度怎么强调都不过分。这不仅关系到AI,也是对美国试图阻止中国技术发展这一误导性尝试的巨大讽刺,如果没有这种限制,DeepSeek可能就不会出现(正如谚语所说,需求是发明之母)。"
审查问题
然而,也有人对DeepSeek的快速崛起提出警告,认为作为一家在中国运营的初创公司,它必然要遵守该国的法律和内容审查要求。事实上,在我本人在美国使用iOS版DeepSeek时就发现,它不会回答某些问题。
作为新闻媒体的一员,我当然非常重视言论和表达自由,这是我坚定支持的最基本的理念之一。
然而,我也不得不指出,OpenAI的模型和产品(包括ChatGPT)同样会拒绝回答一系列问题——特别是涉及人类性行为和成人/NSFW内容的问题,即使这些问题很普通。
当然,这不是一个完全对等的比较。对某些人来说,对依赖外国技术的抵触会让他们对DeepSeek的最终价值和实用性持怀疑态度。但其性能和低成本是无可否认的。
在美国16.5%的商品都从中国进口的时代,我很难仅仅基于审查担忧或安全风险来警告不要使用DeepSeek-R1——特别是当模型代码可以免费下载、离线使用、在安全环境中设备上运行,并且可以随意微调的情况下。
我确实察觉到围绕DeepSeek的热烈讨论中有一些关于"西方衰落"和"中国崛起"的存在主义危机思维。有人已经将此与美国用户在TikTok短暂被禁时加入小红书(Xiaohongshu)app的情况联系起来,当时他们对在那里分享的视频中展示的中国生活质量感到惊讶。DeepSeek-R1的出现就发生在这样的叙事背景下——在这个背景下,中国看起来(且在许多指标上确实)正在崛起,而美国看起来(且在许多指标上也确实)在衰落。
第一个但绝非最后一个震撼世界的中国AI模型
这也不会是最后一个威胁硅谷巨头主导地位的中国AI模型——即使这些巨头像OpenAI一样,正在为其开发通用人工智能(AGI,即在大多数具有经济价值的工作中超越人类的程序)筹集比以往更多的资金。
就在昨天,另一个来自TikTok母公司字节跳动的中国模型——Doubao-1.5-pro发布,其在第三方基准测试中的表现与OpenAI的非推理型GPT-4o模型相当,但成本仅为后者的1/50。
中国模型发展得如此之快、如此之好,以至于连科技行业之外的人也注意到了:《经济学人》杂志刚刚发表了一篇关于DeepSeek的成功和其他中国AI努力的文章,政治评论员Matt Bruenig在X上发文称:"我已经使用Gemini、ChatGPT和Claude进行NLRB文档总结将近一年了。Deepseek在这方面比它们都要好。它的聊天机器人版本是免费的。使用其API的价格比OpenAI的API低99.5%。[耸肩表情]"
OpenAI如何应对?
难怪OpenAI联合创始人兼CEO Sam Altman今天表示,公司将把尚未发布的第二代推理模型系列o3引入ChatGPT,甚至免费用户也可以使用。OpenAI似乎仍在通过更专有和先进的模型开辟自己的道路——设定行业标准。
但问题在于:随着DeepSeek、字节跳动和其他中国AI公司紧随其后,OpenAI还能在制作和发布新的前沿AI模型方面保持领先多久?如果它真的落后了,其衰落会有多快、多严重?
不过,OpenAI确实有另一个历史先例可以借鉴。如果DeepSeek和中国AI模型确实像谷歌的开源Android之于移动领域那样——在一段时间内占据了市场的大部分份额——你只需要看看苹果iPhone是如何通过其封闭、专有、全内部的方法占据了市场的高端部分,并从那里稳步向下扩张,特别是在美国,以至于现在拥有近60%的国内智能手机市场份额。
尽管如此,对于所有正在花大价钱使用领先实验室AI模型的人来说,DeepSeek表明,相同的功能可能以更低的价格获得,并且能获得更大的控制权。在企业环境中,这可能足以赢得胜利。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。