在过去两年中,机器学彻底改变了蛋白质结构预测。现在,《科学》杂志上的3篇论文描述了蛋白质设计方面的革命:华盛顿大学医学院生物学家的研究表明,机器学可比以前更准确、更快速地创建蛋白质分子。科学家们希望这一进步将带来更多新的疫苗、疗法、碳捕获工具和可持续生物材料。

论文资深作者、华盛顿大学医学院生物化学教授、2021年生命科学突破奖获得者大卫·贝克表示,蛋白质是整个生物学的基础,但迄今在每种植物、动物和微生物中发现的蛋白质,远不到所有可能蛋白质的百分之一。有了这些新的软件工具,研究人员应该能够找到解决医学、能源和技术方面长期挑战的方案。

蛋白质常被称为“生命基石”,因为它们对于所有生物的结构和功能都是必不可少的。蛋白质中的氨基酸序列决定了它的三维形状,这种复杂的形状对于蛋白质的功能至关重要。

为了超越自然界中发现的蛋白质,贝克团队成员将蛋白质设计的挑战分解为3个部分,并为每个部分使用新的软件解决方案。

首先,必须生成新的蛋白质形状。在《科学》杂志上稍早发表的论文中,该团队设计AI通过两种方式生成新的蛋白质形状:第一种称为“幻觉”,类似于基于简单提示就能产生输出的工具;第二种称为“修复”,类似于现代搜索栏中的自动完成功能。

其次,为加快这一过程,团队设计了一种生成氨基酸序列的新算法。15日发表的论文描述了这个名为ProteinMPNN的工具,运行时间约为1秒,比以前最好的软件快200多倍。它不但结果优于以前的工具,还不需要专家定制即可运行。

第三,该团队使用“深度思维”公司开发的“阿尔法折叠”来独立评估他们提出的氨基酸序列是否可能折叠成预期的形状。

研究人员表示,预测蛋白质结构的软件是解决方案的一部分,但它本身无法提出任何新的东西。ProteinMPNN之于蛋白质设计,就像“阿尔法折叠”之于蛋白质结构预测。

在另一篇论文中,贝克实验室的一个团队证实,新机器学工具的组合能可靠地生成在实验室中起作用的新蛋白质。

研究发现,新制造的蛋白质更有可能按预期折叠,因此可使用这一方法创建非常复杂的蛋白质组装体。“这是蛋白质设计中机器学的开端。”贝克说。

总编辑圈点:

作为复杂的大分子,蛋白质结构相关研究难度颇高。而人工智能的出场,可以大大提升蛋白质结构相关研究的效率,为生命科学领域的科学家们帮上大忙。几年前推出的“阿尔法折叠”,可以利用人工智能预测蛋白质的结构,曾一度震动生命科学界。如今,这项最新研究可以利用人工智能设计全新的蛋白质,更进一步彰显了人工智能在生命科学领域的巨大潜能。(科技日报记者 张梦然)

推荐内容