许培扬博客分享 http://blog.sciencenet.cn/u/xupeiyang 跟踪国际前沿 服务国内科研

博文

药物虚拟筛选 机器学习算法 中美、印度研究热点

已有 1058 次阅读 2022-6-17 06:11 |个人分类:信息分析|系统分类:论文交流



参考文献

基于机器学习技术的药物虚拟筛选方法研究

来自 万方医学 

  

阅读量:

16

摘要:

作为药物研发的起点,苗头化合物的发现对整个研发过程至关重要.虚拟筛选是苗头化合物发现中的一项重要技术,它利用计算机从海量化合物中快速筛选出特定靶标的候选活性分子,大幅减少在生物化学实验阶段受试化合物数量.随着越来越多的蛋白晶体三维结构被解析,苗头化合物发现研究中基于结构的虚拟筛选方法显示出越来越明显的优势.基于结构的虚拟筛选方法依赖分子对接技术.然而,现有分子对接理论本身存在诸多缺陷,并且众多的对接程序性能各异,仅使用分子对接程序的对接及评分功能对化合物进行排序和筛选,在实际使用中往往无法达到稳定且较好的效果.因此,优化分子对接程序,制定筛选方案对提高基于结构的虚拟筛选方法的成功率具有极其重要的意义. 本研究利用机器学习技术对虚拟筛选方案进行优化,从三个方面共同提升苗头化合物发现的成功率和效率.一是改进分子对接方法,模拟小分子和靶标蛋白的结合构象;二是建立化合物活性分类方法,预测小分子的活性,针对模拟出的小分子构象进行初步筛选;三是构建蛋白质-配体结合亲和力预测模型,用于预测初步筛选出的小分子与靶标蛋白的结合强度,进行精细筛选.对此三个方面,本文的主要研究工作如下: 1.提出一种基于烟花算法的构象搜索方法.首先明确分子对接中构象搜索过程的优化问题表示;其次,设计了烟花算法应用在分子对接问题上的核心策略,如爆炸算子,变异算子以及烟花选择策略等;再次,根据文化基因算法理论,将烟花算法与BFGS拟牛顿搜索算法相结合,利用烟花算法作为全局优化器在搜索空间中快速定位有希望的区域,BFGS拟牛顿搜索算法在局部进行精细搜索,从而加快收敛速度,以及增加找到最优解的机会;最后,将该方法在AutodockVina的框架上予以实现,编写了分子对接程序FWAVina,并且在标准测试数据集上对FWAVina进行测试,结果显示,与经典对接程序AutodockVina相比,FWAVina具有更快的收敛速度及更高的分子对接准确性. 2.提出一种基于集成学习技术及Spark平台的化合物活性分类方法ENS-VS.首先,通过集成学习技术将蛋白质-配体相互作用特征和配体结构特征进行特征融合,集成支持向量机,朴素贝叶斯及决策树三种分类算法,提高该方法在不同靶标蛋白上的适用性及稳定性,同时解决活性化合物与非活性化合物样本数量严重不平衡的问题.其次,在Spark平台上实现本方法的并行加速,提高从海量化合物中进行活性化合物筛选的执行效率.最后,基于DUD-E标准数据库分别构建蛋白家族特异性模型,靶标特异性模型与通用模型,总结出模型适用标准:当靶标已知的活性化合物较多时,宜采用靶标特异性模型;当靶标已知的活性化合物较少时,宜采用蛋白家族特异性模型;当出现新的靶标蛋白时可采用通用模型.实验结果表明,对比经典的分子对接程序,ENS-VS方法能有效提高活性化合物筛选的命中率,并且ENS-VS方法可以与任意分子对接程序联合使用. 3.提出一种基于图注意力网络的蛋白质-配体结合亲和力预测模型Complex-Net.首先,采用图论中的图结构来表示分子结构数据,旨在从原子水平上自动学习特征.其次,本研究在图注意力网络的基础上做出如下改进:一是在图注意力网络中设计了节点动态特征机制,将边信息动态加入节点特征,每个节点特征随聚合节点的不同而动态变化,解决图注意力网络无法处理边信息的问题;二是引入虚拟超级节点作为图级特征聚合机制,将节点级特征表示转换为图级特征表示,使该网络模型能用于图级的预测问题.再次,模型中引入隐层参数硬共享的多任务学习机制,以配体诱铒构象与晶体三维结构的均方根距离(RMSD)预测作为辅助任务,扩大数据集,以提高Complex-Net的泛化性能.最后,采用四种方案对模型性能进行测试,结果表明,在四种方案中Complex-Net预测结果的Pearson相关系数和Spearman相关系数两个指标均优于基准方法RF-Score及基于卷积神网络的代表方法Pafnucy. 本文利用机器学习技术改进分子对接程序,建立化合物活性分类方法以及蛋白质-配体亲和力预测模型,从配体结合构象预测,初步筛选和精细筛选三个方面共同提升药物虚拟筛选方法性能.

收起

关键词:

分子对接 烟花算法 亲和力预测 药物虚拟筛选 机器学习

年份:

2021

收藏 引用 批量引用  分享

全部来源求助全文

 万方医学

相似文献



文献分析

http://www.pubmedplus.cn/P/SearchQuickResult?wd=ed5f2cbd-9cea-43ed-b754-ffd3f2a1ceae

01.20226 篇6.818%
02.202123 篇26.136%
03.202011 篇12.500%
04.201914 篇15.909%
05.201812 篇13.636%
06.20177 篇7.955%
07.20167 篇7.955%
08.20158 篇9.091%
01.j chem inf model10 篇11.364%
02.mol divers8 篇9.091%
03.mol inform7 篇7.955%
04.molecules7 篇7.955%
05.int j mol sci5 篇5.682%
06.expert opin drug discov4 篇4.545%
07.future med chem3 篇3.409%
08.sar qsar environ res3 篇3.409%
09.bioorg med chem2 篇2.273%
10.brief bioinform2 篇2.273%
01.美国14 篇15.909%
02.中国12 篇13.636%
03.印度10 篇11.364%
04.法国6 篇6.818%
05.英国6 篇6.818%
06.巴西5 篇5.682%
07.德国4 篇4.545%
08.日本4 篇4.545%
09.瑞士4 篇4.545%
10.波兰3 篇3.409%
01.中国北京2 篇2.273%
02.中国南京2 篇2.273%
03.中国临汾1 篇1.136%
04.中国长春1 篇1.136%
05.中国上海1 篇1.136%
06.中国无锡1 篇1.136%
07.中国常州1 篇1.136%
08.中国苏州1 篇1.136%
09.中国杭州1 篇1.136%
10.中国广州1 篇1.136%
01.Drug Discovery88 篇100.000%
02.Machine Learning88 篇100.000%
03.Humans52 篇59.091%
04.Ligands27 篇30.682%
05.Molecular Docking Simulation25 篇28.409%
06.Algorithms24 篇27.273%
07.Drug Design17 篇19.318%
08.Quantitative Structure-Activity Relationship16 篇18.182%
09.Drug Evaluation, Preclinical15 篇17.045%
10.Protein Binding15 篇17.045%




https://m.sciencenet.cn/blog-280034-1343300.html

上一篇:唐诗如何继承发展?
下一篇:干细胞治疗黄斑变性 美国 英国研究热点

1 杨学祥

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-2 14:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部