(资料图)
设计蛋白质生物材料的可视化示例。 图片来源:马库斯·比勒/《应用物理学杂志》
美国麻省理工学院研究人员在新一期《应用物理学杂志》发表的论文中,将注意力神经网络与图神经网络相结合,以更好地理解和设计蛋白质。该方法将几何深度学习与语言模型的两种优势结合起来,不仅可预测现有蛋白质特性,还可设想自然界尚未设计出的新蛋白质。
蛋白质通过构建块的独特排列来执行大量生物任务。将这个几乎无限的排列库转化为各自的功能,就可让研究人员设计用于特定用途的定制蛋白质。
但蛋白质一直难以建模,尤其是人们想要“反向操作”——将所需的功能转化为蛋白质结构,更是一个高难度挑战。
此次新模型就可通过对基本原理建模,将大自然发明的一切作为基础,重新组合了这些自然构建块,能实现新功能并解决多类型任务。
新建模型将数字、描述、任务和其他元素转化为符号供神经网络使用。团队首先训练模型,根据不同蛋白质的功能来预测它们的序列、溶解度和氨基酸组成部分。然后,在收到新蛋白质功能的初始参数后,教它发挥创造力并生成全新的结构。
这种方法能创造出以前必须溶解在水中的固体抗菌蛋白。在另一个例子中,团队采用了一种天然存在的丝蛋白,并将其进化成各种新形式,包括赋予其螺旋形状或褶皱结构,让其具有弹力和韧性。
研究人员表示,该技术的广泛性意味着这一模型能应用于蛋白质设计之外的许多领域,如设计具有特定失效模式的材料。
【总编辑圈点】
蛋白质,生命的物质基础,它一直是生命科学领域的研究重点和热点。人们孜孜不倦,想要了解它、改造它甚至创造它。人工智能已成为蛋白质研究的“黄金搭档”之一,它被用来做蛋白质结构预测,创建蛋白质分子。此次,深度学习和语言模型结合,新的蛋白质应运而生。先设定蛋白质的功能,再生成蛋白质的结构,知道想要什么,便可以创造什么。这种蛋白质能解决现实问题,执行特定任务。尽管提需求吧,剩下的交给神经网络去完成。(张梦然)