理想的光亮-张林分享 http://blog.sciencenet.cn/u/Zhanglincn 理想是一种明知不能得到但却必须要有的东西。

博文

我们不知道答案的125个科学问题(58)蛋白质折叠 精选

已有 5746 次阅读 2023-10-12 09:38 |个人分类:科学教育|系统分类:科普集锦

58. 我们能预言蛋白质如何折叠吗?
Can we predict how proteins will fold?

这个问题现在的答案是:可以(Yes),也就是该问题从某种意义上已经获得了解决。该结论来自近年来人工智能或机器学习在蛋白质折叠预测方面的进步(e.g. Deep Learning and Deep Mind),主要的结论是发表在科学和自然杂志(Science, 373:871-876,2021; Nature, 596: 583-589, 2021)上的两篇论文给出的。下面我们通过介绍这个科学问题的前世和今生,来理解解决这个问题的重要意义。

canvas.png

蛋白质是生命体中最为重要的功能性物质,是生物体生命活动的主要承担者。比如大家熟悉的输送氧气的血红蛋白、负责催化各种生物化学反应的酶、负责免疫清理工作的免疫球蛋白,以及具有收缩能力从而产生运动功能的肌蛋白等等。所以蛋白质负责了生物体的分解、合成、催化、调节、运输、运动、免疫等等的全部工作,对生命的正常运行起着关键作用。

蛋白质不同的功能决定于蛋白质的种类和结构。蛋白质是由氨基酸组成的一种高分子聚合物,氨基酸是组成蛋白质的最基本的单元,它是由碳、氢、氧、氮、硫、磷这六种元素组成的小分子,并且具有相类似的结构(如图1所示),组成蛋白质的氨基酸共有20种,其中9种氨基酸必须从食物中获取,其他的氨基酸人类可以自己合成。

图1肽链.jpg

1 氨基酸和氨基酸经过脱水后的肽键连接成的肽链

从氨基酸出发,蛋白质的结构主要可分为四个层次。首先不同的氨基酸分子通过肽键(共价键)相互联接起来会形成肽链(肽是两个或两个以上的氨基酸以肽键相连的化合物,比如由两个氨基酸组成二肽,三个氨基酸组成三肽,如此等等,那么由多个氨基酸组成一定长度的肽分子称为多肽链,这里不用区分多肽和肽链的差别,统称肽链),这个就构成了蛋白质的初级结构(如图1所示)。然后随着多肽链的增长肽链之间通过氢键形成α螺旋结构或β折皱形成二级结构(R-基团分布于螺旋或折皱的外侧),这些螺旋或折皱的二级结构再经过静电相互作用(盐桥)、范德瓦尔斯力、疏水相互作用、氢键等相互缠绕堆砌形成蛋白质的三级结构,最后不同的三级结构相互组合堆积缠绕最后形成三维立体的四级结构(如图2所示)

图2蛋白质四级结构.jpg

图2 蛋白质的四维结构层次

简单来说,蛋白质其实就是具有一定长度的多肽链上的分子通过相互作用(非共价键)经过弯曲折叠缠绕最后形成具有某种空间构型的高分子物质,而由多肽链最终形成蛋白质三维构型的过程就被称为蛋白质的折叠,图3给出了蛋白质肽链经过折叠之后的构像。而蛋白质的折叠问题就是:对某种蛋白质所对应的具有一定氨基酸序列的肽链如何折叠形成其天然构象的问题,也就是我们能否根据蛋白质所对应的特定肽链来预言蛋白质如何折叠形成其天然构象?

图3 蛋白质图.jpg

图3 蛋白质折叠后的构象

1972年,安芬森因证明蛋白质的氨基酸序列与其三维结构之间的联系而获得诺贝尔化学奖。自此,从氨基酸序列信息预测蛋白质结构便成为一个长期存在的挑战,自1994年以来,科学家们每过两年会进行一次关于蛋白质折叠的结构预测关键性评估(CASP)来推动蛋白质折叠研究的发展。对于特定的蛋白质,多肽链上的氨基酸序列是确定的,而这个氨基酸序列是由DNA分子上的基因序列来确定的。人体可以合成至少2万种蛋白质,而每一种蛋白质具有自己独特的氨基酸序列,而这个氨基酸序列形成的肽链经过生物体合成折叠后将对应于唯一的一种空间结构。然而这个对生物体似乎是非常自然的事情,却在科学家看来是不可思议的,因为一条肽链的折叠构型存在非常高的自由度选择,其折叠的方式将随肽链长度的增长呈几何级数增加,所以我们面临的问题是:在几乎无限种可能的折叠方式中,蛋白质自己只需要几十微秒就能选择出一种构型,而同样的任务对人类而言却需要用计算机计算整整30年。

AlphaGo.gif

图4 利用人工智能AlphaFold模拟的蛋白质折叠动画过程

所以蛋白质折叠问题似乎成为检验计算机运算能力的问题,能否在最快的时间内找到特定肽链在某种环境中具有最低能量的折叠构型,成为蛋白质折叠研究方向的重要问题。目前蛋白质折叠研究主要包含三个方面: (1) 折叠的物理机制: 一维氨基酸序列的分子间的相互作用如何唯一决定蛋白质的三维天然结构? (2) 折叠机制: 蛋白质如何在多肽链不计其数的可能构象中迅速确定出一种折叠构型? (3) 蛋白质结构预测: 找到一种计算机算法, 根据蛋白质的氨基酸序列来预测蛋白质的结构? 而计算机得到的蛋白质结构可以和实验上得到的蛋白质结构进行比较,从而用来检验这种算法的有效性和内在原理。目前实验上解析蛋白质结构的方法也有三种:X-射线晶体衍射、核磁共振以及电子显微镜。而能否准确通过计算机预测蛋白质的实验构型,就是本科学问题所要研究的内容,目前的答案是:Yes

最后我们回到文章的开头,现在人类利用AI技术可以非常准确并快速地计算出蛋白质的实际构型(图4所示)。然而关于蛋白质折叠的问题难道都解决了吗?从上面对该问题的介绍来看,如果人类还无法准确人工合成高纯度的蛋白质,那么这个问题就依然没有最终完结,因为AI虽然给我们提供了一个蛋白质的准确构型结果,但到底AI的网络构层中到底发生了什么,我们其实并不能完全知道。



https://m.sciencenet.cn/blog-318012-1405612.html

上一篇:我们不知道答案的125个科学问题(57)手性之谜
下一篇:我们不知道答案的125个科学问题(59)蛋白质的种类

8 许培扬 崔锦华 张坤 池德龙 杨正瓴 史仍飞 杨顺楷 李升伟

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 18:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部