人工智能首次成功解析蛋白质结构
2020-12-31 03:02

图中蓝色为计算机预测的蛋白质结构,绿
色为实验验证结果,二者相似度非常高。

   生物学界最大的挑战之一——蛋白质三维结构解析如今有望被破解。谷歌旗下人工智能公司DeepMind开发的深度学习程序AlphaFold能够精确预测其三维形状。

   蛋白质是生命活动的主要承担者,其工作方式和作用取决于它的高级结构,即“结构即功能”,它倾向于仅在受物理定律的指导下形成相应结构。

   几十年来,实验室一直是解析蛋白质结构的主要途径。从20世纪50年代开始,利用X单晶衍射法首次确定了蛋白质的完整结构。在过去的十年中,冷冻电镜已经成为许多结构生物学实验室所青睐的技术。

   长期以来,科学家们一直想知道一级的氨基酸序列是如何折叠成各种构型的蛋白质三级结构。在20世纪80年代和90年代,就有利用计算机预测蛋白质结构的尝试,但是最终结果都不理想。

   2020年11月30日,在蛋白质预测结构挑战赛CASP上,英国DeepMind公司研究人员创建的AlphaFold程序在百余支队伍中脱颖而出。AlphaFold程序在比赛中的中位分数达92.4(满分100分,90分以上被认为预测方法可与实验方法相媲美),预测最具挑战性的蛋白质结构的平均得分为87,比最接近它的竞争对手领先了25分。

   将深度学习与张力控制算法结合,并应用于结构和遗传数据,该深度学习网络利用目前已知的17万种解析完毕的蛋白质进行了训练。现阶段AlphaFold系统可能需要几天的时间才能得出预测的结构,其中包括对蛋白质不同区域可靠性的评估。DeepMind有关研发团队表示,还将继续对AlphaFold展开训练,以便更好地解析更复杂的蛋白质结构。

   AlphaFold目前虽不太可能取代冷冻电镜等相关解析蛋白结构的实验手段,但它的出现意味着,生物学家们可以将计算方法预测蛋白结构作为科学研究的工具之一。另外,在现有的繁杂的基因组数据中,新一代分子生物学家如何针对数据转换为蛋白结构解析提供帮助,是AI技术在结构生物学发展中的难题。■

 

 

《科学新闻》 (科学新闻2021年2月增刊 聚焦)

分享到:

0