WuLiXueBao的个人博客分享 http://blog.sciencenet.cn/u/WuLiXueBao

博文

专题 | 生物分子模拟中的机器学习 (I)

已有 342 次阅读 2024-1-3 16:20 |系统分类:论文交流

640 (5).jpg

编 者 按

分子模拟技术是人们从分子层次探究生命现象物理原理的重要手段,被广泛应用于蛋白质等生物大分子的结构与动力学研究。自从 20世纪 70年代 Karplus 等科学家首次将分子动力学模拟应用于蛋白质研究以来,分子模拟技术在生物分子体系研究中的应用范围不断扩展,深刻影响了生物物理学与分子生物学研究的基本范式。生物大分子的结构动力学涉及皮秒到毫秒甚至更长时间尺度,如何精确表征具有复杂能量面特征的生物大分子结构与动力学的多尺度特性是生物分子模拟领域的核心难题。通过物理、化学以及计算机科学等多个领域科学家近 50年的不懈努力,人们在生物分子力场准确度提升、各种相互作用的准确描述和计算、增强采样与自由能计算、高维分子模拟数据信息挖掘以及多尺度理论模拟算法构建等方面取得了多个突破。目前,人们不仅能够实现对一些蛋白质分子体系毫秒时间尺度的折叠全过程进行分子模拟,而且能够实现对病毒颗粒、细胞质、甚至染色质等超大分子体系进行分子模拟,在推动生命科学研究向定量化转变中发挥了重要作用。近年来,机器学习技术的突飞猛进为解决生物分子模拟中的挑战难题提供了新思路。人们开始广泛利用深度学习技术构建高精度分子力场、增强分子模拟采样效率、分析高维复杂的分子模拟数据、提取结构及动力学特征等,取得了一系列重要进展。结合机器学习算法的分子模拟技术已经在生物物理机制探究、药物设计、结构与动力学预测等基础与应用研究中展现出其实用性与巨大发展潜力。

鉴于机器学习算法在推动生物分子模拟技术发展和生物物理研究中的关键作用,《物理学报》特组织本专题,邀请国内部分活跃在该领域前沿的学者撰稿,深入探讨生物分子模拟与机器学习融合应用的最新研究成果,并对该领域当前面临的重要挑战及未来研究中可能的突破方向进行综述和展望。相关论文涵盖了基于机器学习算法的蛋白质分子模拟构象空间搜索、RNA扭转角预测、蛋白质等生物大分子 pKa值预测、生物大分子构象过渡态搜索、蛋白质结构模型质量评估、靶标特异性药物筛选、蛋白质分子设计、高分子塌缩相变和临界吸附相变以及分子体系高维自由能地貌图构建等十余篇研究和综述论文,分两期刊出。这些研究论文和综述从不同的角度展示了国内外该领域的最新进展和研究现状。希望本专题有助于读者了解该领域的前沿研究课题,并能对促进国内生物分子模拟学术交流发挥作用。本专题讨论的研究领域涉及多个学科的交叉融合,且突破性的研究成果不断涌现,因此本专题所涵盖的代表性成果和前沿进展介绍难免有所遗漏,不足之处敬请谅解。

客座编辑微信图片_20240103161414.png

李文飞,南京大学物理学院教授。1999年—2004年在中国科学院近代物理研究所硕博连读,获“粒子物理与原子核物理”专业博士学位。2004年—2006年在南京大学物理学院做博士后,开展理论与计算生物物理研究。2006年起在南京大学物理学院任讲师、副教授、教授。2008年—2010年和2017年—2018年期间分别在日本京都大学和美国国立卫生研究院(NIH)任访问学者。主要从事生物大分子体系组装与功能动力学的理论与计算机模拟研究,包括:1)生物大分子多尺度分子模拟理论和计算方法;2)生物大分子组装与相变的理论与计算模拟;3)蛋白分子机器功能动力学物理机制;4) 染色质结构动力学与表观遗传等。

微信图片_20240103161443.jpg

王  炜,南京大学物理学院教授。1999年被聘为教育部长江学者奖励计划特聘教授(理论物理),1996年度获国家杰出青年基金,1997年获香港求是基金会-杰出青年研究奖(物理学),科技部两项973项目首席科学家(2007-2011,2013-2017)。从事凝聚态物理及其生物交叉学科的研究,主要包括:蛋白质折叠、聚集和功能运动物理特性和动力学,生物网络系统信息过程的物理机制和动力学特性,以及复杂相互作用下生物分子材料微结构和力学特性等课题的研究。

微信图片_20240103161451.jpg

周  昕,中国科学院大学物理科学学院长聘教授。历任日本东京工业大学JSPS Fellow、德国马普高分子研究所Humboldt Fellow、美国洛斯阿拉莫斯国家实验室研究助理,韩国亚太理论物理中心研究组负责人和韩国浦项工业大学兼职教授;入选中国科学院海外优秀人才,Chinese Physics B及《物理学报》编委。主要从事水的性质与相变,活性物质结构与动力学,低维、纳米系统的平衡和非平衡统计物理,软物质与生物分子多尺度建模和模拟等方面的研究。在NatureJACS 等发表90多篇研究论文。

专题文章

生物分子模拟中的机器学习专题编者按

物理学报.2023, 72 (24): 240101.

doi: 10.7498/aps.72.240101

原文链接    PDF

研究论文

靶向PD-L1蛋白的计算机辅助药物筛选

林开东,林晓倩,林绪波

物理学报.2023, 72 (24): 240501.

doi: 10.7498/aps.72.20231068

原文链接    PDF

摘要:针对PD-1/PD-L1免疫检查点的单克隆抗体抑制剂逐渐进入市场并在多种类型的肿瘤治疗中取得一定的积极效果。然而,随着应用范围的不断扩展,抗体药物的局限性以及过多同质化研究等问题逐渐显现出来,小分子化合物抑制剂成为了研究者们关注的新焦点。本文旨在利用基于配体和基于结构的结合活性预测方法实现针对PD-L1靶点的小分子化合物虚拟筛选,从而帮助加速小分子药物的开发。通过从相关研究文献及专利收集PD-L1小分子抑制活性数据集,根据不同分子表征方法和算法构建机器学习活性判定分类模型和活性强度预测回归模型,两类模型从大型类药小分子库(ZINC15)中筛选获得68种高PD-L1抑制活性候选化合物。其中10种化合物不仅具备良好的药物相似性和药代动力学,还在分子对接中与已报道的热点化合物表现出同等水平的结合强度和相似的作用机制,这一现象在后续分子动力学模拟和结合自由能估计中得到进一步验证。本文提出了一个融合基于配体方法和基于结构方法的计算机辅助药物研发工作流程,其在大型化合物数据库中有效筛选出有潜力的PD-L1小分子抑制剂,有望助力加速肿瘤免疫治疗的应用。

高分子塌缩相变和临界吸附相变的计算机模拟和机器学习

罗启睿,沈一凡,罗孟波

物理学报.2023, 72 (24): 240502.

doi: 10.7498/aps.72.20231058

原文链接    PDF

摘要:高分子的塌缩和临界吸附是高分子科学中的两个重要相变现象,两者均伴随着高分子构象的显著变化 。本文利用朗之万动力学方法和动力学Monte Carlo方法分别模拟了高分子的塌缩和临界吸附,同时获得了不同温度下大量的高分子构象数据。机器学习方法利用模拟得到的大量伸展无规线团态和塌缩液滴态、脱附态和吸附态构象数据训练神经网络,学习高分子不同状态的特征,快速准确地分析不同温度的高分子构象信息,得到对应的塌缩相变温度和临界吸附温度。结果表明机器学习能正确给出高分子体系的相变温度,这为机器学习技术研究高分子的相变提供了新的思路和方法。

RNA扭转角预测的深度学习方法

欧秀娟,肖奕

物理学报.2023, 72 (24): 248703.

doi: 10.7498/aps.72.20231069

原文链接    PDF

摘要:RNA分子三级结构模建是分子生物物理学研究的基本问题之一,对理解RNA的功能和设计新的结构有重要意义。RNA三级结构主要由主链和侧链上的7个扭转角确定,准确预测这些扭转角是RNA分子三级结构模建的基础。目前只有个别采用深度学习模型预测RNA分子扭转角的方法,要用于模建RNA分子的三级结构其预测精度还有待进一步提高。本文提出了一种预测RNA分子扭转角的深度学习方法1dRNA,采用了考虑相邻核苷酸的卷积模型(DRCNN)和考虑全链核苷酸的超长短期记忆模型(DHLSTM)两种不同的深度学习模型。结果显示,与现有方法相比,这两种模型都能提高RNA分子大部分扭转角的预测精度,DRCNN预测精度提高在5%到28%之间,DHLSTM预测精度提高在6%到15%之间。结果还显示,αγ角是最难预测的,环区扭转角比螺旋区的扭转角难预测,模型对预测序列长度的变化不敏感,模型预测角度与decoys的角度偏差可用于模型质量评估。

使用中间层受监督的自编码器探索蛋白质的构象空间

陈光临,张志勇

物理学报.2023, 72 (24): 248705.

doi: 10.7498/aps.72.20231060

原文链接    PDF

摘要:蛋白质的功能往往与其结构和动态变化密切相关。分子动力学模拟是研究蛋白质结构变化的有效方法,然而使用分子动力学模拟对蛋白质的构象空间进行采样需要花费很长的时间。近年来的一些研究表明,使用简单的机器学习模型——自编码器及其改进型,可以在有限采样的情况下,快速完成对蛋白质构象空间的探索。该模型通过训练神经网络,完成对隐变量的提取,同时根据其产生构象,但是由于提取出的隐变量没有直观的含义,探索构象空间的方向会受到影响。本工作通过引入反应坐标(如质心距离等),建立了一个中间层受监督的自编码器模型,以解决上述问题。该模型应用于噬菌体T4溶菌酶和腺苷酸激酶两个蛋白质分子,结果表明,仅使用短时间分子动力学模拟作为训练数据,就可以探索到这两种蛋白分子的多种典型构象。有监督(合理的反应坐标或者实验数据等)的自编码器模型有望成为探索蛋白质构象空间的有效工具。

综   述

生物大分子过渡态搜索算法及其中的机器学习

杨建宇,席昆,竺立哲

物理学报.2023, 72 (24): 248701.

doi: 10.7498/aps.72.20231319

原文链接     PDF

摘要:过渡态是物理化学家理解和调控生物大分子相关功能微观机制的关键。因其存在时间极短,难以被实验手段捕捉,全面刻画其结构必须通过物理定律驱动的模拟计算搜索予以实现。然而,与化学反应过程只涉及少量原子不同,生物大分子的功能性构象变化所涉的原子和坐标数量巨大,搜索其过渡态将不可避免地遭遇维数灾难,即反应坐标问题,因而催生了多种应对策略和算法。同时,随着近年来新型机器学习算法的大量涌现和日臻成熟,融入机器学习范式的过渡态搜索算法也已出现。本文首先回顾和梳理过渡态搜索代表性算法的设计思想,包括依赖集合变量的温和爬升动力学(gentlest ascent dynamics,GAD)、有限温度弦方法(finite temperature string,FTS)、快速断层扫描法(fast tomographic)、基于旅行商的自动路径搜索算法TAPS,以及过渡路径采样法(transition path sampling,TPS)。然后,重点介绍TPS与强化学习融合而成的新型路径采样算法,解析强化学习在其中的作用,并厘清其适用场景。最后,我们提出一种将降维算法与GAD深度融合的新构想,讨论研发可保留过渡态信息的新型降维算法的必要性及可行性。

蛋白质结构模型质量评估方法综述

刘栋,崔新月,王浩东,张贵军

物理学报.2023, 72 (24): 248702.

doi: 10.7498/aps.72.20231071

原文链接    PDF

摘要:蛋白质模型质量评估方法是蛋白质结构预测的关键技术,自CASP7以来一直是结构生物信息学领域的研究热点。模型质量评估方法不仅可以指导蛋白质结构模型的精修,还能够从多个候选构象中筛选出最佳模型,具有重要的生物学研究和实际应用价值。本文首先回顾了国际蛋白质结构预测关键评估竞赛(CASP)、全球持续蛋白质结构预测竞赛(CAMEO)以及单体蛋白和复合物的模型评估指标,主要梳理了近5年来包括共识方法(多模型方法)、准单模型方法和单模型方法在内的模型质量评估方法的发展历程,并介绍CASP15中的复合物模型评估方法;鉴于深度学习在蛋白质预测领域所取得的巨大进展,重点分析了深度学习在单模型方法数据集生成、蛋白质特征提取以及网络架构构建方面的深入应用,并进一步介绍了本课题组近年来在模型质量评估方面开展的工作;最后,总结分析了目前蛋白质模型质量评估技术的局限性及所面临的挑战,并对未来发展趋势进行了展望。

蛋白质pKa预测模型研究进展

罗方芳,蔡志涛,黄艳东

物理学报.2023, 72 (24): 248704.

doi: 10.7498/aps.72.20231356

原文链接    PDF

摘要:pH表征溶液的酸碱性,是许多与人类重大疾病密切相关的生命活动的调控因子。pKa决定可滴定基团在一定pH条件下的去质子化平衡,是研究pH调控的生物化学过程的重要参量。然而,由于蛋白质结构的复杂性以及实验条件的限制,蛋白质pKa通常需要借助理论预测。近30年,研究者们开发了各种基于先验知识的pKa预测模型。随着近几年人工智能技术的快速发展,人们开始尝试将人工智能算法应用于蛋白质pKa预测工具的开发。本文介绍pKa理论预测近年来的一些重要研究进展,主要包括恒定pH分子动力学以及基于泊松-玻尔兹曼方程、经验函数和机器学习的pKa预测模型。在此基础上,讨论蛋白质pKa预测模型的未来发展方向和应用前景。

生物分子模拟中的机器学习方法

管星悦,黄恒焱,彭华祺,刘彦航,李文飞,王炜

物理学报.2023, 72 (24): 248708.

doi: 10.7498/aps.72.20231624

原文链接    PDF

摘要:分子模拟技术已成为人们从分子层次探究生命原理的强有力工具。经过近50年的发展,生物分子模拟能够实现对蛋白折叠、构象运动和蛋白-蛋白分子相互作用等复杂分子体系的生物过程的动力学和热力学性质进行定量表征。近年来,以深度学习为代表的机器学习算法的应用进一步推动了生物分子模拟技术的发展。本文对生物分子模拟中的机器学习方法进行综述,重点讨论机器学习算法在提高生物分子力场精度、分子模拟构象采样效率、以及高维生物分子模拟数据处理等方面取得的重要进展。在此基础上,对未来研究中基于机器学习技术进一步克服生物分子模拟的精度和效率瓶颈、扩展生物分子模拟适用范围、实现计算模拟与实验测量的深度融合做了展望。

专题文章网站链接:

http://wulixb.iphy.ac.cn/custom/topics

640.jpg

《物理学报》2020—2023年电子期刊,点击下图即可阅读。

640 (1).jpg

专题精选

(上下滑动浏览)

庆祝《物理学报》创刊九十周年

缺陷与掺杂对物性的调控(I)

拓扑量子输运和器件(II)

磁约束等离子体中的高能量粒子

华南师范大学建校暨物理学科建立90周年专题

阿秒物理

国防科技大学建校70周年专题

虚拟专题磁学与磁性材料(I) 

高能重离子碰撞过程的自旋与手征效应( II )

非线性系统理论及其前沿应用(I)

功能氧化物薄膜新奇物理性质(I)

拓扑量子输运和器件(I)

高能重离子碰撞过程的自旋与手征效应( I ) 

二维转角莫尔超晶格(I)

阿秒物理(II)

量子计算新进展:硬件、算法和软件(II)

阿秒物理(I)

低维材料的新奇物性(II) 

非厄米物理前沿(II)

面向类脑计算的物理电子学 (I)

非厄米物理前沿 (I) 

低维材料的新奇物性 (I) 

二维材料的宏观制备

固态单量子体系的调控与应用 

纳米工程和热物理(II)

微纳光电子与激光

太赫兹生物物理

非平衡量子多体系统(I)

纳米工程和热物理(I)

量子计算与量子信息

热电材料及应用物理

原子制造: 基础研究与前沿探索(III)

等离子体物理及其材料处理超短超强激光等离子体物理原子制造: 基础研究与前沿探索(II)原子制造: 基础研究与前沿探索(I)超导及其应用固态电池中的物理问题百岁铁电: 新材料、新应用太赫兹自旋光电子低维材料非线性光学与器件柔性电子光学超构材料电介质材料和物理超材料探索凝聚态中的马约拉纳粒子载能离子束技术统计物理和复杂系统非线性物理拓扑物理前沿与应用纪念黄昆先生诞辰百年拓扑经典波动磁斯格明子专题

多铁性:物理,材料及器件专题

精密测量物理专题

铁基高温超导发现十周年

软物质研究进展水科学重大关切问题研究量子相干和量子存储研究进展冷原子-分子物理等离激元增强光与物质相互作用钙钛矿光电器件与物理超导和关联体系研究进展新型太阳能电池太赫兹物理软物质研究进展超快强激光驱动的原子分子过程拓扑绝缘体高压下物质的新结构与新性质研究进展光纤传感电磁波衍射极限非晶物理研究进展与硅技术融合的石墨烯类材料及其器件研究硅基光电子物理和器件计算物理的近期发展和应用量子精密计量与操控液晶光学及应用庆祝南京大学物理学科成立100周年表面低维结构的电子态调控癌症生物物理

特邀综述精选

(上下滑动浏览)

单分子磁镊旋转操控和基因转录调控动力学

基元构筑的功能材料皮米尺度结构

磁子学中的拓扑物态与量子效应

聚偏氟乙烯基复合材料储能特性优化策略 

理论先行四十载 新篇再作八旬后——记杨振宁先生和冷原子物理

稳态微聚束加速器光源

钠离子层状氧化物材料相变及其对性能的影响

人工微纳结构增强长波及甚长波红外探测器

后摩尔时代的碳基电子技术:进展、应用与挑战

凝聚态体系中激发态载流子动力学研究

基于石英增强光声光谱的气体传感技术研究进展

齿鲸生物声呐目标探测研究综述

褶皱状蜂窝结构的单层二维材料研究进展

从“魔角”石墨烯到摩尔超晶格量子模拟器

石墨烯在金属表面防腐中的应用

从高质量半导体/超导体纳米线到马约拉纳零能模

霍尔天平材料的多场调控

飞秒光纤激光相干合成技术最新进展

磁场中拓扑物态的量子输运

转录机器: 绳上舞者

论材料非晶形成中的焓与熵: 竞争亦或协同?

二维材料热传导研究进展

齿鲸生物声呐发射特性与波束调控研究

自组织结构的控制: 从平衡过程到非平衡过程

层状手性拓扑磁材料Cr1/3NbS2的磁学特性

膜间相互作用、开弦对产生和增强效应及其可能的实验探测

基于深紫外激光-光发射电子显微技术的高分辨率磁畴成像研究

非晶态物质原子局域连接度与弛豫动力学

Verwey相变处Fe3O4的结构、磁性和电输运特性

纳米光学辐射传热: 从热辐射增强理论到辐射制冷应用

拓扑材料中的超导

基于聚焦离子束纳米剪纸/折纸形变的三维微纳制造技术及其光学应用

腔自旋波混合系统的研究进展

微纳尺度体点导热的拓扑优化

声学超构材料及其物理效应的研究进展

基于二维纳米材料的超快脉冲激光器

重费米子材料与物理

在人工拓扑超导体磁通涡旋中寻找Majorana零能模

具有变革性特征的红外光电探测器

二维极化激元学近场研究进展

化学气相沉积石墨烯薄膜的洁净转移

复杂声学环境中人耳附近空间有源降噪研究

利用光谱和质谱成像技术实现指纹痕量检测

类KBe2BO3F2结构硼酸盐深紫外非线性光学材料的研究进展

中远红外非线性光学晶体研究进展

二维有机拓扑绝缘体的研究进展

核壳结构磁性复合纳米材料的可控合成与性能

高温压电材料、器件与应用

无衍射光束的产生及其应用

基于光量子态避错及容错传输的量子通信

双连续型乳液凝胶(Bijel)的研究进展

基于第一性原理的新型非线性光学晶体探索

观点和展望精选

  量子计算纠错取得突破性进展  硅基半导体量子计算研究进展  相互作用费米子的量子模拟  钒基笼目超导体  当代理论物理发展趋势之我见

青年科学评述精选

(上下滑动浏览)

面向先进光源线站等大科学装置的低温X射线能谱仪原理及应用进展

基于过渡金属硫族化合物同质结的光电探测器

里德堡原子多体相互作用的研究进展

液相外延层层浸渍组装金属-有机框架薄膜及其物理性能

自旋轨道耦合量子气体中的一些新进展

过渡金属硫族化合物柔性基底体系的模型与应用

新型助熔剂助力铁基超导1111体系单晶生长和物理研究

《物理学报》在淘宝店和微店上线,扫码即可购买过刊和现刊。

640 (2).jpg       640 (3).jpg

640 (4).jpg



https://m.sciencenet.cn/blog-3427348-1416521.html

上一篇:庆祝《物理学报》创刊九十周年
下一篇:拓扑量子输运和器件(II) 《物理学报》专题

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 23:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部