打脸 Meta 还获得英伟达加持?被解散的原 Meta AI 蛋白质团队最新融资 1.42 亿美元

CN
2天前
生物学的「ChatGPT」时代有望开启?

撰文:元宇宙之心

生物学前沿人工智能研究实验室 EvolutionaryScale 近日宣布获得超 1.42 亿美元种子轮融资,同时发布里程碑式 AI 模型 ESM3。这家成立仅一年的公司在 AI 生命科学领域有着怎样独特的理念?全新的蛋白质大模型又有着怎样的技术突破?

一周前,在 Meta 如火如荼地卷文生视频赛道的时候,那个被它解散的蛋白质团队 EvolutionaryScale 获得了超 1.42 亿美元的种子轮融资,这个融资额在整个生物技术领域都可以说是高得离谱

去年八月,Meta 官宣旗下的蛋白质折叠团队 Meta-FAIR 解散。这个纯粹的「科学 +AI」项目并不能让 Meta 快速获得收益,Meta 专注商业化 AI 的决定看似也是情理之中

然而,这个不被看好的团队竟用仅仅一年的时间就打了 Meta 的脸。他们最新推出的 ESM3 被认为是生物学领域具有里程碑意义的生成式 AI 模型,为生物学编程开创了新的可能性。

01. 1 分钟项目速览

1.项目名称:EvolutionaryScale

2.成立时间:2023 年 7 月

3.产品简介

开发用于创造新型蛋白质和其他生物系统的大型语言模型——ESM,目前已迭代到 ESM-3

4.创始人团队

  • 首席科学家:Alexander Rives (纽约大学计算机科学博士、前 Facebook AI 科学家)

  • Tom Sercu

  • Sal Candido

5.融资情况

2024 年 6 月 25 日完成了高达 1.42 亿美元的种子轮融资。本次融资由 Nat Friedman 和 Daniel Gross 以及 Lux Capital 领投,亚马逊、NVentures(英伟达的风险投资部门)和天使投资人参投。

02.团队协同一致的理念追求

人工智能的进步为生物科学研究创造了前所未有的机会,包括设计功能性生物分子,尤其是蛋白质。将人工智能运用于蛋白质设计,不仅可以提升蛋白质设计的效率及成功率,还通过快速应对传染病爆发等方式,来帮助人类解决一些正在面临的挑战

Alexander Rives 等人正是看到了蛋白质设计方面的缺口,决定开发基于深度学习的大模型,从而推动产业级蛋白质设计进入「全自动智能生成时代」

于是,EvolutionaryScale 应运而生。它是一家专注于生物科学领域的前沿 AI 研究实验室,致力于推出生物学前沿的语言大模型。

有意思的是,该公司创始团队的八位成员全都来自于 Meta 的 FAIR(基础人工智能研究)部门。尽管在世界级的社交媒介巨头那里吃了瘪,但初始团队的核心人员都没有放弃,反而快速地投入新战地,开始在原有团队成果的基础上开发下一代模型

EvolutionaryScale 的大模型支持健康、环境科学等领域的研究与开发,不停探索生物学的扩展性,为突破性的科学研究提供动力。其中最显著的成果就是蛋白质折叠技术的突破,ESM 模型揭示了数亿个宏基因组蛋白质的结构,帮助世界各地的科学家来模拟和理解蛋白质。

EvolutionaryScale 旨在通过开放、安全的研究方式,来指导蛋白质设计领域的人工智能技术开发

在此基础上,该公司作为签署方,引领了超 160 位来自学术界、政府以及民间的全球利益相关者,共同发展这项技术,确保其安全可靠,从而达成造福人类健康和社会的愿景。

正是由于怀着引领生物学界先进 AI 技术的责任感,Alexander Rives 和他的团队从未停止脚步。

此前,EvolutionaryScale 曾发布过大型语言模型 ESM1,这被认为是第一个用于蛋白质的 transformer 语言模型,由 EvolutionaryScale 的创始团队在 Meta 的 FAIR 部门工作期间所构建。作为 ESM1 升级模型的 ESM2 拥有 1500 万个参数,并且相较于旧模型 ESM1b(拥有 6.5 亿个参数)表现更佳。

上周,EvolutionaryScale 发布了最新的 ESM3 AI 模型,这是朝着生物学的未来所迈进的一大步。凭借这种模型的能力,有可能会加速广泛应用的发现,有利于创造有助于捕获碳的蛋白质,从而开发出新的癌症治疗方法

03.AI 在生物学应用的先驱

ESM3 是一个生成式的 AI 模型,主要功能是生成新型蛋白质。该模型通过深度学习技术,使用大量的蛋白质数据进行训练,从而学习蛋白质的序列、结构和功能之间的关系。

ESM3 的训练使用了超过 1 万亿 teraflops 的计算能力,这是目前已知生物学领域中最大的计算规模。它在地球上自然多样性的 27.8 亿种蛋白质数据集上进行了训练,使其能够同时对蛋白质的序列、结构和功能进行推理。

ESM3 的主要工作流程可简略为以下四个步骤:

  • 数据收集与处理:EvolutionaryScale 首先会从各种来源收集大量的生物学数据,包括基因序列、蛋白质结构、功能注释等。这些数据会经过清洗、标准化和格式化处理,以便于后续的分析和应用。

  • 模型训练:使用深度学习算法和大量的计算资源,EvolutionaryScale 会对处理后的数据进行训练,构建出能够理解和预测生物学规律的大型语言模型。这些模型不仅具有高度的准确性,还能够处理复杂的生物学问题。

  • 生成新蛋白质:通过交互式提示,ESM3 能够生成新的蛋白质,这些蛋白质可能在自然界中需要数亿年才能进化出来。

  • 科学验证:生成的新型蛋白质将通过科学实验进行验证,以确定其功能和潜在应用。

目前,ESM3 最引人注目的使用案例之一是生成了一种新的绿色荧光蛋白(GFP)

GFP 是自然界中最美丽和独特的蛋白质之一,负责水母的发光和珊瑚的鲜艳荧光色。ESM3 通过一系列思考过程,跨越了 5 亿年的进化,创造了这种新的荧光蛋白。这一过程在自然进化中可能需要超过 5 亿年,而 ESM3 通过计算方法实现了这一飞跃

ESM3 的发布也为药物发现和合成生物学领域带来了革命性的变化

在药物发现方面,ESM3 能够生成具有特定生物活性的新型蛋白质,为药物筛选和优化提供了更多的候选分子。同时,ESM3 还能够预测和优化药物与靶点的相互作用机制,为药物的设计和开发提供更加科学的依据。

在合成生物学方面,ESM3 能够生成具有特定功能的生物系统,为生物制造和生物能源等领域提供了新的解决方案。例如,ESM3 可以生成出将二氧化碳高效转化为有机物的酶系统,为碳捕获和利用提供了新的途径。

EvolutionaryScale 的 ESM3 模型代表了 AI 在生物学领域的新里程碑。通过其强大的生成能力和与行业领导者的合作,ESM3 有望加速新型蛋白质的发现和生物系统的设计,为未来的药物开发、材料科学和环境科学等领域带来革命性的影响

04.生物学领域创新之旅

合成生物学:编程生命

合成生物学是 EvolutionaryScale 未来发展的一个重要方向。通过设计和合成新的基因电路和生物路径等方式,科学家们可以创建具有特定功能的生物体。

  • 基因电路类似于电子电路,但它们在细胞中控制生物学过程。

基因电路能够在细胞内实现对特定基因表达的精确控制。例如,可以设计一个基因电路,使其在细胞检测到特定信号(如某种化学物质或环境变化)时启动或关闭特定基因的表达。

  • 合成生物路径涉及多种酶和代谢途径的组合,用于生产有价值的化合物。

通过 AI 分析和设计,科学家可以创建新的代谢途径,使生物体能够合成天然条件下无法产生的化合物。例如,通过重新设计微生物的代谢路径,微生物可以生产出医药中间体、生物燃料或工业化学品。

  • 细胞工厂是通过基因工程手段改造微生物,使其在工业条件下高效生产目标产品的生物系统。

通过 AI 辅助设计,科学家可以改造微生物的基因组,使其在特定条件下表现出优异的生产性能。例如,通过编辑酵母或细菌的基因,科学家可以使这些微生物高效生产抗生素、酶或其他生物制品。

若此项技术能继续发展,不仅将推动科学研究的前沿发展,还能为医药、环境保护和农业等领域带来重要的应用前景

数据驱动的个性化医疗

EvolutionaryScale 正通过 AI 和大数据分析技术推动个性化医疗的进步,为患者提供更加精准和高效的医疗服务

个性化医疗是基于每个患者的独特生物学信息和临床数据,量身定制最合适的治疗方案。其中一个关键领域是基因组分析。通过对患者的基因组进行全面测序和分析,科学家可以识别出与疾病相关的基因变异。

EvolutionaryScale 利用 AI 技术,快速准确地解析大量基因组数据,从中发现潜在的疾病风险因素。

这种方法可以帮助医生在疾病的早期阶段做出诊断,并采取预防措施。例如,通过分析乳腺癌患者的 BRCA1 和 BRCA2 基因突变,可以预测其患病风险,从而进行早期筛查和干预。

如今,EvolutionaryScale 正站在生物学与人工智能融合的前沿,通过不断创新和探索,致力于实现生物系统的编程和优化。后续或将实现更多技术性的突破,为人类开创一个更加智能和健康的未来。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享