AI Agent 框架是补全拼图的最后一角?框架的“波粒二象性”如何解读?

CN
3天前
用「波粒二象性」的视角去评价 Agent 框架或许是确保走在正确方向上的前提。

撰文:Kevin,the Researcher at BlockBooster

AI Agent 框架作为行业发展的关键拼图,可能蕴藏着推动技术落地与生态成熟的双重潜力。市场中热议的框架有:Eliza, Rig, Swarms, ZerePy 等等。这些框架通过 Github Repo 吸引开发者,建立声望。以「库」发币的形式让这些框架,和光同时具备波和粒子的特质类似,Agent 框架同时具备严肃外部性和 Memecoin 的特性。本文将重点解读框架的「波粒二象性」以及 Agent 框架为什么能成为最后一角。

Agent 框架带来的外部性能够在泡沫消退后留下春芽

从 GOAT 诞生开始,Agent 叙事冲击市场的力度不断上升,如同一位功夫大师,左拳「Memecoin」,右掌「行业希望」,你总会在其中一招里败下阵来。其实,AI Agent 的应用场景并未严格区分,平台、框架与具体应用之间界限模糊,但根据代币或协议的偏好仍可大致分类。但是,根据代币或者协议的发展偏好还是可以分为以下几类:

  • Launchpad:资产发型平台。Base 链上的 Virtuals Protocol 和 clanker,Solana 链的 Dasha。

  • AI Agent 应用:游离于 Agent 和 Memecoin 之间,在记忆内存的配置上有出彩的地方,比如 GOAT,aixbt 等。这些应用一般来说是单向输出的,输入条件非常有限。

  • AI Agent 引擎:Solana 链的 griffain 以及 base 链的 Spectre AI。griffain 可以做到从读写模式进化到读、写、行动的模式;Spectre AI 是 RAG 引擎,链上搜索。

  • AI Agent 框架:对于框架平台来说,Agent 本身就是资产,所以 Agent 框架是 Agent 的资产发行平台,是 Agent 的 Launchpad。目前具有代表性的项目有 ai16,Zerebro , ARC 和这两天热议的 Swarms。

  • 其他小方向:综合型 Agent Simmi;AgentFi 协议 Mode;证伪类 Agent Seraph;实时 API Agent Creator.Bid。

进一步讨论 Agent 框架,可以看出它具有充分的外部性。不同于各大公链和协议的开发者只能在不同开发语言环境中选择,而行业内总的开发者规模并没有呈现对应市值增速的增长。Github Repo 是 Web2 和 Web3 开发者建立共识的之所,在这里建立开发者社区,比任何一个协议单独开发出来的「一插即用」包对 Web2 开发者的吸引力和影响力更强大。

本文提到的 4 种框架都已开源:ai16z 的 Eliza 框架获得 6200 颗星;Zerebro 的 ZerePy 框架获得 191 颗星;ARC 的 RIG 框架获得 1700 颗星;Swarms 的 Swarms 框架获得 2100 颗星。目前,Eliza 框架被广泛用于各种 Agent 应用,是覆盖面最广的框架。ZerePy 的开发程度不算高,发展方向主要在 X 上,尚且不支持本地 LLM 和集成内存。 RIG 的相对开发难度最高,但是能给开发者最大限度实现性能优化的自由。Swarms 除了团队推出 mcs 之外还没有其他用例,但是 Swarms 可以集成不同框架,有较大想象空间。

此外,上述分类中,把 Agent 引擎和框架分割开来,或许或造成疑惑。但我认为二者是有区别的。首先,为什么是引擎?联想现实生活中的搜索引擎来类比是相对契合的。不同于同质化的 Agent 应用,Agent 引擎的性能在其之上,但同时是完全封装的,通过 api 接口来调整的黑盒。用户可以以 fork 的形式来体验 Agent 引擎的性能,但是又不能像基础框架那样掌握全貌和定制自由。每个用户的引擎就像在调教好的 Agent 上生成一个镜像,是对镜像做交互。而框架本质上是为了适配链,因为在 Agent 做 Agent 框架,最终目的都是和对应的链有整合,怎样定义数据交互方式,怎样定义数据验证方式,怎样定义区块大小,怎样平衡共识和性能,这些是框架需要考虑的事情。而引擎呢?只需要在某一个方向,充分微调模型和设置数据交互还有内存之间的关系就行,性能是唯一评价标准,而框架则不然。

用「波粒二象性」的视角去评价 Agent 框架或许是确保走在正确方向上的前提

Agent 执行一次输入输出的生命周期中,需要三个部分。首先是底层模型决定了思考深度和方式,然后内存是自定义的地方,在基础模型有了输出之后,根据内存再修改,最后在不同的客户端上完成输出操作。

来源:@SuhailKakar

为了证实 Agent 框架具有「波粒二象性」,「波」具有「Memecoin」的特征,代表社区文化和开发者活跃度,强调 Agent 的吸引力和传播能力;「粒」代表「行业预期」的特征,代表底层性能、实际用例和技术深度。我会分别从两个方面结合三个框架的开发教程为例进行说明:

快速拼接式的 Eliza 框架

1.设置环境

来源:@SuhailKakar

2. 安装 Eliza

来源:@SuhailKakar

3.配置文件

来源:@SuhailKakar

4.设置 Agent 性格

来源:@SuhailKakar

Eliza 的框架相对来说,易于上手。它是基于 TypeScript,这是大多数 Web 和 Web3 开发者都熟悉的语言。框架简洁,没有过度抽象,让开发者能够轻松地添加自己想要的功能。通过步骤 3,看到 Eliza 可以多客户端集成,可以将其理解为多客户端集成的组装器。Eliza 支持 DC, TG 和 X 等平台,还支持多种大语言模型,可以通过上述社交媒体实现输入,LLM 模型来输出,并且支持内置记忆管理,可以让任意习惯的开发者快速部署 AI Agent。

由于框架的简洁性和接口的丰富性,Eliza 大大降低了接入的门槛,实现了相对统一的接口标准。

一键使用式的 ZerePy 框架

1.Fork ZerePy 的库

来源: https://replit.com/@blormdev/ZerePy?v=1

2.配置 X 和 GPT

来源: https://replit.com/@blormdev/ZerePy?v=1

3.设置 Agent 性格

来源: https://replit.com/@blormdev/ZerePy?v=1

性能优化式的 Rig 框架

以构建 RAG( 检索增强生成 ) Agent 为例:

1.配置环境和 OpenAI key

来源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

2.设置 OpenAI 客户端并使用 Chunking 进行 PDF 处理

来源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

3.设置文档结构和嵌入

来源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

4.创建向量存储和 RAG agent

来源:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

Rig(ARC)是一个基于 Rust 语言面向 LLM 工作流引擎的 AI 系统构建框架,它要解决更底层的性能优化问题,换句话说,ARC 是一个 AI 引擎「工具箱」,提供 AI 调用、性能优化、数据存储、异常处理等后台支撑服务。

Rig 要解决的是「调用」问题,以帮助开发者更好选择 LLM,更好优化提示词,更有效管理 token,以及如何处理并发处理、管理资源、降低延迟等,其侧重点在于 AI LLM 模型和 AI Agent 系统协作过程中如何「用好它」。

Rig 是一个开源 Rust 库,旨在简化 LLM 驱动的应用(包括 RAG Agent)的开发。因为 Rig 开放的程度更深,因此对开发者要求更高,对 Rust 和 Agent 的理解要求也更高。 这里的教程是最基础的 RAG Agent 的配置流程,RAG 通过将 LLM 与外部知识检索相结合来增强 LLM。在官网的其他 DEMO 中,可以看到 Rig 具备以下特征:

  • LLM 接口统一:支持不同 LLM provider 的一致 api,简化集成。

  • 抽象工作流:预构建的模块化组件让 Rig 可以承接复杂 AI 系统的设计。

  • 集成向量存储:内置对裁体存储的支持,在 RAG Agent 等相似的搜索类 Agent 中提供高效性能。

  • 嵌入灵活:提供易于使用的 API,用于处理嵌入,在 RAG Agent 等相似的搜索类 Agent 开发时,降低语义理解的难度。

可以看出相比 Eliza,Rig 为开发者提供了额外的性能优化的空间,帮助开发者更好地调试 LLM 和 Agent 的调用和协作优化。Rig 以 Rust 驱动性的性能、利用 Rust 优势零成本抽象和内存安全、高性能、低延迟的 LLM 操作。能够在底层层面上,提供更丰富的自由度。

分解组合式的 Swarms 框架

Swarms 旨在提供企业级生产级多 Agent 编排框架,官网提供了几十种 workflow 和 Agent 并行串行架构,这里介绍其中一小部分。

Sequential Workflow

来源:https://docs.swarms.world

顺序 Swarm 架构以线性顺序处理任务。每个 Agent 在将结果传递给链中的下一个 Agent 之前完成其任务。此架构可确保有序处理,并且在任务具有依赖关系时非常有用。

用例:

  • 工作流程中的每个步骤都依赖于前一个步骤,例如装配线或顺序数据处理。

  • 需要严格按照操作顺序的场景。

层次化架构:

来源:https://docs.swarms.world

实现自上而下的控制,由上级 Agent 协调各下级 Agent 之间的任务。其中 Agent 同时执行任务,然后将其结果反馈到循环中进行最终聚合。这对于高度可并行化的任务非常有用。

电子表格式架构:

来源:https://docs.swarms.world

用于管理同时工作的多个代理的大规模群体架构。可同时管理数千个代理,每个代理都在自己的线程上运行。它是监督大规模代理输出的理想选择。

Swarms 不仅是 Agent 框架,还可以兼容上述 Eliza, ZerePy 和 Rig 框架,以模块化的思想,在不同工作流和架构中最大化释放 Agent 性能,以解决对应问题。Swarms 的构思和开发者社区进展都没问题。

  • Eliza:易用性最强,适合初学者和快速原型开发,尤其适合社交媒体平台的 AI 交互。框架简洁,便于快速集成和修改,适合不需要过度性能优化的场景。

  • ZerePy:一键式部署,适合快速开发 Web3 和社交平台的 AI Agent 应用。适合轻量级 AI 应用,框架简单,配置灵活,适用于快速搭建和迭代。

  • Rig:侧重性能优化,尤其在高并发和高性能任务中表现出色,适用于需要细致控制和优化的开发者。框架较为复杂,需要一定的 Rust 知识,适合更有经验的开发者。

  • Swarms:适合企业级应用,支持多 Agent 协作和复杂任务管理。框架灵活,支持大规模并行处理,并提供多种架构配置,但由于其复杂性,可能需要更强的技术背景来有效应用。

总体来说,Eliza 和 ZerePy 在易用性和快速开发方面具有优势,而 Rig 和 Swarms 更适合需要高性能和大规模处理的专业开发者或企业应用。

这就是 Agent 框架具有「行业希望」特性的原因,上述框架还处于早期阶段,当务之急是抢占先发优势并建立活跃的开发者社区。框架本身的性能高低以及相对 Web2 流行应用来说是否落后都不是主要矛盾。只有源源不断涌入开发者的框架才能最终胜出,因为 Web3 行业始终需要吸引市场的注意力,框架性能再强,基本面再雄厚,如果难以上手导致无人问津,则本末倒置。在能够框架自身能够吸引开发者的前提,具有更成熟和更完整的代币经济模型的框架会脱颖而出。

而 Agent 框架有着「Memecoin」特性这一点,则非常好理解。上述框架代币都没有合理的代币经济设计,代币没有用例或者用例非常单一,没有经过验证的商业模式,也没有行之有效的代币飞轮,框架仅仅是框架,和代币之间没有完成有机结合,代币价格的增长除了 FOMO 之外,难以获得基本面上的助力,没有足够的护城河来确保稳定且持久的价值增长。同时,上述的框架自身也显得比较粗糙,其实际价值和当前市值并不匹配,因此有着强烈的「Memecoin」的特性。

值得注意的是,Agent 框架的「波粒二象性」并不是缺点,不能将其粗暴的理解为既不是纯粹的 Memecoin,又没有代币用例的半罐水。正如我在上一篇文章中提到的观点:轻量化的 Agent 覆盖着模棱两可的 Memecoin 面纱,社区文化和基本面不会再成为矛盾,一种新的资产发展路径在逐渐浮出水面;尽管 Agent 框架初期存在泡沫与不确定性,但其吸引开发者和推动应用落地的潜力不容忽视。未来,具备完善代币经济模型和强大开发者生态的框架,或将成为这一赛道的关键支柱。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接