Vibe编码真的有效吗?我们与Claude一起制作了一款游戏——结果如何

CN
Decrypt
關注
2 天前

在人工智能爱好者中,有一种新的趋势,而这并不是聊天机器人或代理。我们所说的是“氛围编码”——一个人简单地与人工智能交谈,给出他们想要构建的东西的想法,并开始与模型迭代,要求它在此过程中修复和改进事物。

这据说就像与朋友交谈一样简单,甚至对于技术水平极其有限的外行人来说也足够简单。

我在这里写过关于它的内容。但为了超越炒作,我想看看氛围编码是否真的能产生一些有用的东西。

氛围编码一个有用的应用?

我选择了Claude 3.7 Sonnet作为我的人工智能伙伴,因为Decrypt的测试显示它在编码任务中甚至超过了Grok-3

我的软件项目相当简单:我想构建一个打字游戏,单词从屏幕上方落下,玩家需要在它们到达底部之前打出这些单词以生存。

我们从最基本的提示开始:“写一个美丽、放松的游戏,我必须快速打出单词才能活下去。单词正在下落,每个字母在我打字时都有消失效果。”

几分钟内,Claude输出了看起来像是完整游戏的东西……但当我尝试运行时,什么也没发生。开始按钮失灵了。我向Claude提到这个错误,它开始工作,向我保证它找到了错误并正在修复它。

Claude完成了,新的游戏展现在我们面前。我尝试了一下,但不行……仍然坏掉了。与其自己深入代码(那不是氛围编码!),我只是告诉Claude:“不行。当我点击按钮时什么也没有发生。游戏从未开始。”

人工智能又回去工作,它的第二次尝试实际上启动了。我也稍微作弊了一下,检查了代码,注意到另一个问题:游戏只使用了大约10个不同的单词,这会很快变得重复。与其要求完整的词典集成,我让Claude将真实单词与虚构单词混合——这是一个实用的解决方案,保持了代码的简单性。

我继续与Claude进行这种反复沟通,通过自然语言而不是代码编辑进行精炼。经过十四次迭代,我得到了一个足够令人满意的东西,可以分享而不感到羞愧。

当我的同事们测试完成的游戏时,反应大多是积极的。一位记者甚至打破了我的高分(我得分很低),而其他人则提出了改进的想法。他们发现的唯一“错误”实际上是故意的限制:随机生成的单词,但没有移动设备支持。

你可以在这里尝试这个游戏。截至目前,Ryan Gladwin以2830分保持记录,但希望我能很快夺回我的王座。

经验教训

经过这一切和其他实验,这里有一些对那些愿意尝试氛围编码的人可能有用的事情:

  1. 快速原型制作有效:我们迅速从概念转变为可玩游戏,技术输入最小。这对技术能力有限的新手来说非常好。然而,这可能也是经验丰富的编码者需要一个粗略草稿以开始迭代的好技术。

2. 迭代是关键:第一次尝试很少能完美成功。成功来自于对话的精炼和清晰的反馈。在这个阶段,经验丰富的编码者可能会放弃氛围编码,转而进行正常的调试,利用人工智能作为数字助手来帮助他们完成这个过程。然而,那些愿意全心投入氛围编码的人可能会受益于使用非常具体和详细的语言。你的提示越丰富、结构越好,得到的结果就会越好。

3. 不要急于求成:知道何时简化需求有助于更快地实现可用产品。理想情况下,不要要求模型一次性完成所有事情。相反,考虑将体验视为在粗略结构上添加不同的层次。从基础开始,然后要求模型修复一个小错误,再修复另一个,然后添加你想看到的具体内容——然后再继续。

4. 质量是有限的:虽然我们创建了一个功能性和愉快的游戏,但它缺乏专业开发软件的打磨和优化。不要指望用Grok开发出《上古卷轴5:天际》。

5. 调试是对话式的:与其在代码中寻找问题,我们只是描述了什么不工作,让人工智能找出如何修复。这种方法效果很好,但当然,专家可以通过检查代码或与模型讨论技术细节而不是预期结果来加快进程。

总体而言,如果你有足够的耐心引导人工智能进行多次迭代,氛围编码确实可以产生功能性软件。它是生产级别的代码吗?绝对不是。你仍然需要适当的调试、优化和各种专业工具来构建真正专业的应用程序。

但话说回来,制作《Flappy Bird》的那个人凭借一个简单的游戏赚了数百万,而不需要华丽的架构或复杂的系统。有时候,你所需要的只是一个好主意,也许——只是也许——与人工智能一起“共振”,直到你开始赚取数百万。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接