科学网

 找回密码
  注册

tag 标签: 药物设计

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

计算机辅助药物设计专业的工作情况
热度 6 chemicalbond 2012-6-20 01:29
时常有网友问起我计算机辅助药物设计(Computer-aided drug design, CADD)专业的情况,尤其是如何进入这个领域,工作机会如何? 这里简单讲点个人的体会,也许对某些感兴趣的网友会有所帮助。 CADD目前的工作机会还算可以。在美国制药公司,现在是哀声一片,四面楚歌的时代,然而,CADD领域的工作机会却还不少,显然强过药物(有机)化学专业,比如默克现在就有好几个工作机会。当然这些通常都是需要一定工业界的工作经验,但是也不能经验太多,因为工资也高,3-5年工作经验的人应该会有不少机会。具体可以参考 http://www.ccl.net/cca/jobs/joblist.html 在中国,这个领域算是刚开始,也就是研发外包公司(CRO)不断地招人,使得大家对这领域开始熟悉。目前,各大外包公司也是时常有新的机会,好几家跨国制药公司都在招收海外博士学位,外加5年以上工作经验的人。。另外,国内的民企也对新药研发加大了投入,一些公司已经开始有了CADD人员的参与。未来3-5年,这个领域的机会应该还会增长。毕竟,离开了CADD,新药研发是很困难的事。大家都知道目前国内制药界的新药研发还基本处在刀耕火种的阶段,而政府也是非常的重视,给不少科研机构及公司砸进去不少银子:这个领域的泡沫会有吗?也许有,但是泡沫应该还没有开始产生。 不过,一般的学术机构(大学,或者研究所)都没有这个专业,很多在这个领域找工作的人也不一定有着足够的训练。对于刚毕业的学生,最对口的专业应该是理论化学或者计算化学专业的硕士,最好是博士,研究的项目涉及过蛋白的结构。而实际上,很多学生都是药学专业的,甚至是生物专业的,所以目前在国内很难找到合适的人选。我个人觉得,一个优秀的候选员工,应该有这些领域的基础训练:普通化学,有机化学,物理化学尤其是统计热力学和分子结构,生物化学。技能方面需要熟悉简单的script编程(如Perl)和Linux操作系统,熟悉常用的分子模拟软件。要是做过的课题中涉及蛋白和小分子相互作用(结构),还用过任何量子化学软件解决问题,那就更好了。即便如此,刚上班也不定就能掌握要领,很多细节需要在工作中慢慢地积累。不过,要是真正对药物设计感兴趣的人,这些都不会是障碍。 值得一提的是,工作环境尤其是跟什么样的人合作,那绝对会是差别很大的事。我觉得一个好的环境应该给年轻人很多学习和锻炼的机会,“年老人”(如我自己)和年轻人一起平等地干活(做项目),外加一些经验丰富乐意合作的药物化学家。要是读到这里,你有点心动了,愿意加入我们小组,那就请赶紧跟我联系吧。 谢谢阅读。
个人分类: 科普与新知|10454 次阅读|16 个评论
遭遇猎头
chemicalbond 2012-5-31 00:34
今天有个陌生人的电话,原来是上海的一个猎头,说那边有个公司在招人,问我是否感兴趣,或者是否有朋友可以推荐。 在我们这个行当,还真是不容易找到合适的人选。一方面,本土的人士经验都非常欠缺,语言上更是有障碍;而美国那边的就业机会要比化学其它专业强,一般人都不愿意回归。据说上海的另一家公司招聘了一年多,那个位置还是空的。而目前至少有3-4家大公司在寻找有海外博士学位和工业界经验的计算机辅助药物设计人士。可见这个供求关系还是很明显。 如果读者里面有这方面背景的,可以私信交流:免收信息资源费。
个人分类: 社会观察|1985 次阅读|0 个评论
南京分子模拟会议杂记
热度 4 chemicalbond 2012-5-16 23:07
昨天结束了在南京召开的第六届分子模拟与信息技术会议。以前也在博文中提及过【1】。 感觉有些东西值得记录下来。也算是与本领域的同行做点会后的交流。 首先,感觉这是个SHOW-OFF的会议。好几个院士出席会议,没有一个人做学术报告,也没看到他们参与会议中的讨论。可是他们占用会议的时间就好象某些学霸占用经费一样一点都不嫌多。学术会议其实是不需要开模式的,让院士们一个个上去讲一桶废话,不如把一些报告的时间加长一点。【我就觉得自己在第二天的15分钟报告时间太短,最后连观众提问的时间都没有。】药科大学的领导也上去SHOW-OFF了一把,把前一天就分发的宣传药科大学的材料又几乎原文不动地读了一遍。 拜托,这种领导怎么能混下去?中国难道就没有人了? 除了院士和领导,有好几个教授在报告中也充分地利用了时间SHOW-OFF了一把,这里不好意思点名。他们的报告有个主题,那就是想方设法地让听众加强印象:俺是在这个领域发表了无数SCI的! 在那里不断地播放着发表的文章,却罕见他们分析一些具体的问题,也很难看到他们的工作和前人工作相比有啥独到的地方。感觉很大程度是在重复或者模仿,很少有原创的成分。据说有些教授自从知道了分子动力学模拟(MD)之类的科研工具发文章容易之后就把它们当成机器不断地印刷SCI,就跟11公老师领导的晶体结构印刷机似的。 当然,不少科研机构老师的工作还是非常的前沿,也很有意思。这里就不列举了,否则怕是有拍马的嫌疑。 由于会务主要是由软件公司赞助和承办的,讨论软件不免成了一个主题。 更多的人都在使用昂贵的进口软件,绘制出一张张漂亮的图片,但是罕见有人谈及软件或者方法本身的问题和局限性。这个方面我的报告大概算是个异类,因此我也就用了一些滑稽的语调,其实是在自我调侃。我谈的一个主题是计算蛋白与小分子结合自由能的打分函数。一开始,我就引用了本领域里面很多人都抱怨的话,那就是通常的打分函数都是没有太多用途的,一般的药物设计者也很少看那些结果,因为计算结果和实验的相关性太差。我开玩笑说自己研究了好几年的打分函数,头发都算白了,可是一篇相关的文章都没有发。【因为在小公司干技术活是很难会有发表机会的:太好了就会把别人教会了,太差了就无法忽悠别人了 】。 不过,我还是谈了些问题,通过大量的具体实例说明了问题的复杂性,并且给同行们建议了可能改进的方向-----因为我自己已经没有时间做这些工作了。我也告诫一些初学者,需要留心蛋白的结构:很多所谓的实验结构都是有问题的;晶体结构大牛的实验室都可能把苯环的结构整成环己烷呢。 我费力地列出了不少有问题的PDB代码,不知道有多少听众回去以后会去下载那些结构,看看我是否在胡说八道。 众多教授里面有一位特别值得尊敬的,那就是北京工业大学的王存新老师。老人家68年就开始做相关的研究,象我等都还没有投胎呢。虽然年纪大,学术地位也有了,但是他从头到尾认真参加了会议,包括做报告,提问题,坚持到了最后。他做的工作也很有意思。正是有这种学者的参与,这个会议才有了学术价值,否则就象某位老兄说的:过来就图混个脸熟。 【1】 http://blog.sciencenet.cn/blog-437346-557051.html
个人分类: 科技会议|3876 次阅读|7 个评论
药物发现升级版:计算机辅助设计提高了成功的机会
chemicalbond 2012-4-20 22:55
华尔街邮报文章: http://online.wsj.com/article/SB10001424052702304692804577281463426711158.html?mod=ITP_thejournalreport_1goback=%2Egde_2310941_member_109069621 相关的研究论文: http://pubs.acs.org/doi/abs/10.1021/jm2007613 相关结构: http://www.rcsb.org/pdb/explore/explore.do?structureId=2wgj http://www.rcsb.org/pdb/explore/explore.do?structureId=2xp2
个人分类: 科普与新知|3487 次阅读|0 个评论
为什么化学信息学和药物设计的优秀开源软件很少?
热度 3 rasin 2012-1-28 23:44
南开大学乔园园老师的文章《化学信息学与药物发现研究的开放性》(计算机与应用化学,2006,23:1283)和《化学信息学和生物信息学开放性比较》(化学进展,2007,19:624)对比了生物信息学和化学信息学的开放性,讨论了其成因,建议开展开源软件的使用和开发。 我也对于这种现象的成因谈谈自己的看法,造成化学信息学和药物设计软件开源较少的原因有3点: 1、历史条件:化学信息学软件出现较早,虽然没有文献溯源,估计对化学信息的计算机处理应在60年代之前,CA登记号索引系统最早是1965年开始引入的。当时应该是线性编码的时代,在思想上没有开源的概念;在条件上,当时各个机构的计算机硬件和软件系统相差较大(甚至两个系统间没有统一的编程语言),不具备开源发布的条件;当时也没有方便的网络作为发布渠道,所以即便开源,可能的影响和用户数量也很少。所以,此时化学信息学软件处于列国混战时代,各自为政。 2、学科对象:生物信息学的研究对象主要是DNA、RNA、蛋白质序列以及序列间的关系,数据类型和结构简单,采用纯文本以及简单的图论方法即可处理。(当然复杂的生物学问题,需要更多数据的引入)。而化学信息学的研究对象是化学信息,包含分子结构、动态变化、电子布居、能量、图谱、文献等等,数据类型和关系复杂。这一点从两者的数据文件类型即可看出,生物信息学的序列文件种类较为有限,而表示化学分子结构的文件格式可能有数百种之多,各种格式文件其包含的信息内容不尽相同,格式间转换可能会引起信息的丢失。 3、商业利益:化学信息学和药物设计软件的用户主要是各制药公司,因此,化学软件公司的利润有市场保证。相对来说,生物学科产业化要落后于化学工业,生物信息学研究目前以学术单位为主,本身即是软件的开发者也是使用者,市场没有成熟。不过现在这种情况正在发生变化,随着各类新兴公司的加入,药物发现软件的许可价格正逐年下降;而不少生物信息学商业软件投入市场,价格不菲。 如果说多年前,从事理论研究的一个困难是高昂的计算机硬件和软件许可,那么现在真的是理论研究的黄金时刻。计算机软硬件价格都在下降,EMBL-EBI、PubChem、BindingDB等活性数据更是免费获取。关键是能否有好的想法、思路,对这些数据进行分析处理。
个人分类: 科研随笔|8139 次阅读|6 个评论
药物设计
biophysicalchem 2011-10-26 09:09
一个药物筛选大项目面临断奶,可以看出美国的经济情况正在影响这一些科研项目。 原文见: NATIONAL INSTITUTES OF HEALTH Drug-Screening Program Looking for a Home Jocelyn Kaiser http://www.sciencemag.org/content/334/6054/299.full
个人分类: 药物设计|2883 次阅读|0 个评论
药物设计研讨会 & 工作机会
chemicalbond 2011-10-21 05:58
http://bioevent.bioon.net/meetinghome.asp?id=D56A7A1D-5B94-465F-868E-0C83695D0C34 星期六和星期天在上海举行。这是我回国工作后第一次参加国内的专业会议,希望会有所收获。另一个计划是约好去上海见一些应聘者。在上海的有志于从事计算机辅助药物设计的网友,无论是否有工作经验,都欢迎在会议休息时间去会场找我,谢谢。 本领域一般希望有博士学位,但是对于优秀的硕士生,经过在本组工作中的训练与学习,1-2年下来,应该是可以胜过那些被没有做过真正的新药研发的博导放羊的博士生;所以说,那些希望尽快进入药物研发战场的人,就不要等了(比尔盖子不是神马学位都没有吗:-)),很多项目等着你我一起来努力攻克。 本博主能为你提供的是几个先进的国内工业界甚至全国都没有人拥有的新药研发软件,1个拥有很多经验丰富的药物化学海龟的和谐的工作环境,还有一位时刻都在工作的合作者-----即非领导;当然不要求你也这般奉献,连博客长草都不管了。但是,如果你也符合上面2+1个边界条件,那就请通知一下,我跟你干得了 :-)
个人分类: 科技会议|2149 次阅读|1 个评论
招兵买马
热度 4 chemicalbond 2011-5-28 20:23
工作地点:北京 工作内容:分子模拟,小分子药物设计 职位要求:(1)计算化学,理论化学,物理有机化学,生物物理等专业博士学位毕业,或者硕士毕业并有多年工作经验者;(2)熟悉常用分子模拟软件;(3)熟悉有机化学,生物化学,小分子药物与靶体的基本作用原理;(4)熟悉UNIX/LINUX操作系统,有一定的编程能力;(5)较强的分析问题和解决问题的能力;(6)独立思考能力,团队精神,吃苦耐劳精神;(7)乐于学习新知识新方法。 其它:2-3个职位;欢迎国内外有志于新药研发的人士申请;欲知详情,请用实名发短消息联系。谢谢阅读
个人分类: 其它|213 次阅读|4 个评论
pick模块 2011-01-13
csxyllx 2011-1-14 18:59
marshal和pickle可以用来转换并储存python对象 pickle.dump(obj, file )   序列化对象,并将结果数据流写入到文件对象中。参数protocol是序列化模式,默认值为0,表示以文本的形式序列化。protocol的值还可以是1或2,表示以二进制的形式序列化。 pickle.load(file)   反序列化对象。将文件中的数据解析为一个Python对象。
个人分类: data mining|0 个评论
2011年戈登会议CADD(计算机辅助药物设计)议程
热度 1 chemicalbond 2010-12-7 21:59
两周前的更新,看上去有很多实际应用的例子,值得参加。 计算机辅助药物设计是个很重要的领域,是新药研发中的一项重要技术。不过,作为一个学科,它的发展面临很多问题,也就是说近年来很少看到新进展,因此大家的注意力都放在应用上了。也许这次会议上能听到一些新的思路。 我前后一共参加过三次这方面(CADD)的会议,遗憾的是没有见到过一个来自国内的代表。国内那么多相关的研究人员对这么重要廉价的会议竟然无动于衷,有点不可思议。 附:会议信息 Gordon Research Conference Computer Aided Drug Design (CADD) The Impact of Computational Sciences along the Drug Discovery Process http://www.grc.org/programs.aspx?year=2011program=cadd July 17-22, 2011 Mount Snow Resort West Dover, VT SUNDAY 2:00 pm - 9:00 pm Arrival and Check-in (Office Closed 6:00 pm - 7:00 pm) 6:00 pm Dinner 7:30 pm - 7:45 pm Introductory Comments by GRC Site Staff / Welcome by the GRC Conference Chair 7:45 pm - 9:30 pm Case Studies in Drug Design I: Elaborating Fragments Discussion Leader: Catherine E. Peishoff (GSK, Collegeville, PA, USA) 7:45 pm - 8:00 pm Introduction by the discussion leader 8:00 pm - 8:30 pm Nicolas Foloppe (Vernalis, Cambridge, UK) Structure-based Discovery and Elaboration of Inhibitors of the Chk1 Kinase: From Fragment to a Candidate Series 8:30 pm - 8:45 pm Discussion 8:45 pm - 9:15 pm Gianni Chessari (Astex, Cambridge, UK) Progression of Fragment Hits into Lead Molecules 9:15 pm - 9:30 pm Discussion MONDAY 7:30 am - 8:30 am Breakfast 9:00 am - 12:30 pm Case Studies in Drug Design II: What Works, What Doesn't? Discussion Leader: Catherine E. Peishoff (GSK, Collegeville, PA, USA) 9:00 am - 9:25 am Georgia McGaughey (Merck, West Point, USA) Conformational Studies of Small Molecules and Applications to Lead Optimization 9:25 am - 9:35 am Discussion 9:35 am - 10:00 am Veer Shanmugasundaram (Pfizer, Groton, USA) A Tale of Two Receptors - On AR, ER and Targeting Switches in NHRs 10:00 am - 10:10 am Discussion 10:10 am - 10:40 am Coffee Break 10:40 am - 11:05 am Pascal Furet (Novartis, Basel, Switzerland) Structure-based Design of a New Class of Potent Non Peptide Inhibitors of the p53-MDM2 Interaction 11:05 am - 11:15 am Discussion 11:15 am - 11:40 am Kaushik Raha (GSK, Collegeville, USA) Structure-based Design of a Potent Inhibitor of Pi3K Alpha 11:40 am - 11:50 am Discussion 11:50 am - 12:15 pm Tara Mirzadegan (Johnson Johnson, San Diego, USA) Computer-Aided Drug Discovery of HIF Prolyl Hydroxylase Inhibitors for the Treatment of Anemia 12:15 pm - 12:30 pm Discussion 12:30 pm Lunch 1:30 pm - 4:00 pm Free Time 4:00 pm - 6:00 pm Poster Session I 6:00 pm Dinner 7:30 pm - 9:30 pm Prediction of ADMET Properties I Discussion Leader: Pat Walters (Vertex, Cambridge, USA) 7:30 pm - 7:40 pm Introduction by the discussion leader 7:40 pm - 8:20 pm Nigel Greene (Pfizer, Groton, USA) Combining Physicochemical Properties and In Vitro Assays to Predict In Vivo Outcomes 8:20 pm - 8:35 pm Discussion 8:35 pm - 9:15 pm Holger Fischer (Roche, Basel, Switzerland) Designing Drug Like Molecules: Impact of a Holistic Data Analysis Approach in Drug Discovery 9:15 pm - 9:30 pm Discussion TUESDAY 7:30 am - 8:30 am Breakfast 9:00 am - 12:30 pm The State of the Art of Calculating Protein-Ligand Interactions Discussion Leader: Ajay Jain (UCSF, San Francisco, USA) 9:00 am - 9:15 am Introduction by the discussion leader 9:15 am - 9:55 am Neil Taylor (Desert Scientific, Sydney, Australia) An Exploration of Network Hotspots and Cooperativity in Protein-Ligand Recognition 9:55 am - 10:10 am Discussion 10:10 am - 10:40 am Coffee Break 10:40 am - 11:20 am Jonathan Essex (University of Southampton, UK) Rigorous Free Energy Calculations in Drug Discovery: What Can they Really Do? 11:20 am - 11:35 am Discussion 11:35 am - 12:15 pm Demetri Moustakas (AstraZeneca, Wilmington, DE, USA) Towards a Single-point Estimate of the Binding Free Energy 12:15 pm - 12:30 pm Discussion 12:30 pm Lunch 1:30 pm - 6:00 pm Free Time 6:00 pm Dinner 7:30 pm - 9:30 pm Prediction of ADMET Properties II Discussion Leader: Pat Walters (Vertex, Cambridge, USA) 7:30 pm - 8:10 pm Chihae Yang (Altamira LLC, Columbus, OH, USA) Leveraging the Past to Jump Start the Future: Using a Computational Battery of Methods for Toxicity Assessment 8:10 pm - 8:30 pm Discussion 8:30 pm - 9:10 pm Scott Boyer (AstraZeneca, Gothenburg, Sweden) The Reality of Using Computational Tools to Reduce Safety Risk 9:10 pm - 9:30 pm Discussion WEDNESDAY 7:30 am - 8:30 am Breakfast 9:00 am - 11:30 am New Structures, New Insights: G Protein-Coupled Receptors Discussion Leader: Brian Shoichet (UCSF, San Francisco, USA) 9:00 am - 9:10 am Introduction by the discussion leader 9:10 am - 9:50 am Gebhard Schertler (Paul-Scherrer-Institute, Switzerland) Structure of Inactive and Active G Protein-Coupled Receptors: Implication for Activation and Ligand Binding 9:50 am - 10:05 am Discussion 10:05 am - 10:35 am Coffee Break 10:35 am - 11:15 am Stefano Costanzi (NIH, Bethesda, USA) G Protein-Coupled Receptors: Structural Modeling and Computer-Aided Ligand Discovery 11:15 am - 11:30 am Discussion 11:30 am - 12:30 pm Open Mic Session Discussion Leader: Daniel Ortwine (Genentech, South San Francisco, USA) ( 5 minute talks by poster presenters ) 12:30 pm Lunch 1:30 pm - 4:00 pm Free Time 4:00 pm - 6:00 pm Poster Session II 6:00 pm Dinner 7:00 pm - 7:30 pm Business Meeting Nominations for the next Vice Chair; Fill out Conference Evaluation Forms; Discuss future Site Scheduling preferences; Election of the next Vice Chair 7:30 pm - 9:30 pm Prediction of Small Molecule Crystal Structures Discussion Leader: Georgia McGaughey (Merck, West Point, USA) 7:30 pm - 7:40 pm Introduction by the discussion leader 7:40 pm - 8:20 pm Marcus Neumann (Avantgarde Pharmaceuticals, Freiburg, Germany) Tailor-made Force Fields - From Crystal Structure Prediction to Drug Discovery Applications 8:20 pm - 8:35 pm Discussion 8:35 pm - 9:15 pm Colin Groom (Cambridge Crystallographic Data Center, Cambridge, UK) Applying the Knowledge Derived from Half a Million Small Molecule Crystal Structures 9:15 pm - 9:30 pm Discussion THURSDAY 7:30 am - 8:30 am Breakfast 9:00 am - 12:30 pm Protein Design Discussion Leader: Karyn O'Neil (Johnson Johnson Ventures, King of Prussia, USA) 9:00 am - 9:15 am Introduction by the discussion leader 9:15 am - 9:55 am Bill deGrado (University of Pennsylvania, Philadelphia, USA) Substrate and Function-Directed Design of Proteins and Peptide Assemblies 9:55 am - 10:10 am Discussion 10:10 am - 10:40 am Coffee Break 10:40 am - 11:20 am Dan Tawfik (Weizmann Institute, Rehovot, Israel) Enzyme Design and Evolution 11:20 am - 11:35 am Discussion 11:35 am - 12:15 pm Brian Kuhlman (University of North Carolina, Chapel Hill, USA) Computational Design of Protein Interfaces and Switches 12:15 pm - 12:30 pm Discussion 12:30 pm Lunch 1:30 pm - 6:00 pm Free Time 6:00 pm Dinner 7:30 pm - 9:30 pm Keynote Session Discussion Leader: Brian Kuhlman (University of North Carolina, Chapel Hill, USA) 7:30 pm - 8:30 pm Jim Wells (UCSF, San Francisco, USA) Turning Enzymes ON with Small Molecules 8:30 pm - 9:00 pm Discussion FRIDAY 7:30 am - 8:30 am Breakfast 9:00 am Departure
个人分类: 科技会议|3920 次阅读|2 个评论
《分子模拟与药物设计》课程主线
rasin 2010-11-1 16:23
这学期给研究生讲《分子模拟与药物设计》,附件是前三章的主线图,供参考(这个博客的图片上传后都不清楚,所以以后就附件吧) 小节没有编号,按照顺时针的顺序阅读即可。 第一章 概述 第二章 药理学基础与药物设计理论基础 第三章 化学信息学与药物设计
个人分类: 药物设计|4605 次阅读|0 个评论
我自己的软件系统__分子矩阵分析系统
热度 2 chgh76 2010-5-21 11:53
今天博客首开,博士亦即将毕业了,在这里秀一秀自己辛苦开发的一个药物设计系统,虽然很简陋,但是毕竟是自己娃,希望有志者一起来讨论完善。 分子矩阵分析系统 (The Analysis System of Molecular Matrix, ASMM) 系统说明 : 本软件是在博士攻读期间独立完成开发,系统分为三个部分: ① :分子输入系统, ② :描述子计算系统, ③ :数据分析系统。为了确保系统的正确性,在相同参数设置情况下,所有算法结果均经 SPSS15.0 和其它算法的外部软件,如独立的 LIBSVM 包,直接检验校正。 开发工具 : 本软件以 VC++2005和MatLab7.0 为开发工具。 环境要求 : 1 .WINDOWS 2000/XP 2. PC (586 以上 ) 机,将屏幕大小设为 1280800 功能介绍 ① 分子输入系统 分子输入系统通过批量读入 SYBYL2 格式分子文件,采用回溯算法,依据外部定义的标准子结构片段对读入的分子结构进行检查校正,确保输入分子结构的正确性。 ② 描述子计算系统 该系统主要是实现分子分子结构的数据化,它在读入分子结构文件的基础上,集成了分子结构描述子的自动计算,其中描述子主要包括 3D-HoVAIF , Vmed 、 EState 和 Pmaif 的计算,在这些描述子的计算中,均能够随意的改变原子分类方案和拓扑路径的计算方法,同时该部分亦提供了多肽的数据化计算系统。 ③ 数据分析系统 该系统主要是实现对分子数据的自动化处理,提取合理结构参数进行设计分子预测分析,在该系统中主要包含的算法有主成份分析 (PCA) 、前向逐步线性回归 (FSMLR) 、前向逐步线性判别分析 (FSLDA) 、偏最小二乘回归与判别分析(PLSr and PLS_DA)、支持矢量机回归 / 分类 ( 集成 LIBSVM) 和反向传播神经网络回归 / 分类 (BPANN) 。 程序设置界面系统 界面很乱,以后再逐步细化。 ① 描述子计算结果示例 ② PLS回归结果
个人分类: 生活点滴|5876 次阅读|3 个评论
分子模拟中的“算不准原理”
chemicalbond 2010-5-20 08:48
前一阵提及比尔盖子投资薛定谔的新闻,1千万美元投入分子模拟软件。【1】第一个效应便是增加了很多就业机会。找工作的人不要错过,那些岗位都应该是年薪在六位数左右的。【2】 那位因此事给自然杂志写专栏文章的人,最近又有新的文章,说的也是分子模拟在药物设计中的作用。【3】看看那里的读者啥样的观点都有,一点都不奇怪。象很多其它领域一样,如果没有真正做过相关的工作就发表高论就像是瞎子摸象,了解的通常是很片面的信息。正好今天有位找工作的朋友问及相关问题,我就把一些个人体会写在博客上。 这里讲的分子模拟主要是针对蛋白质和有机小分子之间的非(化学)键相互作用。这一领域在八十年代末期有了较大的突破,这主要是由于分子图像软件的发展和分子对接技术(docking,即在蛋白质的活性中心寻找小分子与之结合的低能结构)的发展。当时的代表人物是TACK KUNTZ,和PETER KOLLMAN。两位都是做理论化学出身后来转化分子模拟的。KUNTZ的贡献主要是发展第一个对接技术,KOLLMAN是做AMBER分子力场和自由能模拟著名的。【4】到了90年代,很多公司应用分子模拟技术设计癌症病类药物【主要是HIV蛋白酶抑制剂】,获得了巨大的成功。【5】 不过,大概象任何新技术亮相一样,很容易在短暂辉煌之后便带来泡沫。随着无数制药公司的跟进,人们很快就发现分子模拟给出的计算结果往往跟实验结果偏离很大,更不用说用来设计药物。实际情况是,分子模拟的问题很多,尤其是计算中间有大量的近似。即使到了今天,使用最先进的方法和软件,其中的误差也还是很大的。这就是本文要提及的“算不准原理”。 药物设计中最主要的计算量便是一个小分子针对某个生物靶子(比如HIV蛋白酶)的活性,在物理化学中可以成为热力学平衡常数。这个过程可以简化为P+L=PL,P就是PROTEIN,L是LIGAND,PL就是两者之间通过非键作用形成的复合物。实验上测量试管中发生的过程非常简单,基本原理和中学化学教的中和滴定是一样的,只不过指示剂不同而已。根据不同的小分子浓度下的效果得到一条滴定曲线,数学上做个导数就得到拐点,即平衡浓度(一般可以用它来表示生物活性),浓度越小,即活性越高。比如说爱滋病蛋白酶抑制剂,如果小分子活性很高,吃很小剂量的药物就可能抑制住蛋白酶的活性,从而起到治病的功能。通常,最后做成药物的小分子的生物活性一般是纳摩尔量级(10^-9M)。根据热力学第二定律,那个过程的自由能变化基本额上就是-RTlnK,R是气体常数,T是绝对温度,K可以近似为小分子的平衡浓度。活性差别是10倍的话,能量上也就是大约1.34kcal/mol。 对于生物活性,要通过电脑进行理论预测,那可不是一般的难。这么多年来,全世界有无数人都希望找到那个可能存在的能够计算机预测生物活性的holy grail,但是都失望了。这里头的原因很多,最主要的大概是2个方面。一是因为我们面对的是个很复杂体系,其自由度是个很非常巨大的是数字(通常,一个分子内部的运动自由度就有(3N-6), N是原子数,在3维空间,需要减去3个平动和3个转动自由度,而对于蛋白那来说,N通常是个3位数),从而导致计算过程取样不够完全而引入我误差,另一方面,前面提及的变量是个相对数值很小的变量,即计算的额信噪比很难提高。 这个误差和量子化学对热力学物理量的计算误差很大也是相关的。近年来,你量子化学方法和计算技术都会获得了很大的进展,不过,目前的最高水平也就是针对气相的小分子体系热力学量的计算更可能达到误差为1个kcal/mol. 这个数值也曾经被称为 chemical accuracy。 当然,科技总是不断前进的.总有一天,人们会对这些问题理解得更加深入,相关的计算误差也会减小。然而,一个更好的策略是提高相对值的计算准确度,因为那样会排除很多个大误差的计算。而,实际上,也往往是相对数值更加重要。 参考: 【1】 http://www.sciencenet.cn/m/user_content.aspx?id=322494 【2】 http://tbe.taleo.net/NA2/ats/careers/searchResults.jsp;jsessionid=FCB1B3BE6F7959FEC2834C2E20A91764.NA2_primary_jvm?org=SCHRODINGERcws=1 【3】 http://pipeline.corante.com/archives/2010/05/17/modeling_in_drug_discovery_questions.php 【4】2001年我曾经联系KOLLMAN做博士后,他很爽快的就答应了。非常遗憾的是,几个月后收到他的另一封电子邮件,告诉我他已经得了癌症,而且是病情很严重,建议我申请其它地方。没过多久,他就去世了。2002年在UCSF有个专门为他组织的分子模拟会议,我也有幸参加了。 【5】据说90年代末期分子模拟类的工作机会非常多,工作很容易找。那时的我因为在化学所身陷基础物理化学的深渊,对这一领域的信息量竟然一无所知,否则,很可能来美国选择学校和导师会是完全不同的结果。
个人分类: 科普与新知|2591 次阅读|0 个评论
药物设计流程图
albumns 2010-3-22 00:58
前段时间集中听了几场药物设计的报告,把药物设计的一个大概流程整理了一下,制作成流程图梳理如下
个人分类: Linux相关|8109 次阅读|0 个评论
eHiTS分子对接指南zz
热度 1 albumns 2009-12-4 04:15
eHiTS是由SimBioSys, Inc.公司开发的用于快速虚拟筛选的分子对接软件,运行平台为Linux,可以并行化运算。对学术用户免费,下载申请表格,填写协议后,传真返回(或者扫描为图片,通过电子邮件返回),可以使用一年。第二年使用可以如上再次申请。 公司主页: http://www.simbiosys.ca/ehits/ 分为以下几个部分: 用法 输入文件要求 输出文件要求 结果分析 其他参数设定 通过已知活性数据构建并使用训练集 评分程序 文件格式转化程序 安装及常见问题解决方法 用法: 在命令行窗口输入ehits.sh,不输入任何参数,回车,ehits会给出各种参数的用法,非常直观。 ehits可以直接输入晶体结构,软件会自动分解蛋白和配体,然后对蛋白和配体进行对接: $ehits -complex pdb_code.pdb 虚拟筛选的命令输入格式为: $ehits -receptor rec.mol2 -ligand database.mol2 -clip lig.mol2 -allowflat -param eHiTS_6.2/data/parameters_HTS.cfg -fast -usedb ------------------------------------ 输入文件要求: --------------------------------------- 1.输入格式: mol,sd/sdf,pdb,mol2,tma(tagged molecule ascii),tmb(tagged molecule binary) 注:tma,tmb为eHiTS默认格式。 2.文件名中除了后缀前的点(.),不能有其他的点(.)。 3.受体(蛋白质): -receptor rec.mol2 i)不需要加氢 ii)如果受体输入格式为PDB,PDB文件中需要包含CONECT信息。PDB数据库中的复合物结构大多需要修正,不过很多软件在修正后保存pdb文件时,不会在文件中保留CONECT信息。此时,最好存成其他格式,比如mol2,sd等。 iii)若输入文件为PDB格式,软件可以根据温度因子(temperaturee factor)对残基位置进行变动。 4.配体: -ligand lig.mol2 -ligand database.mol2 i)不需要准备质子化状态 ii)如果是数据库,不要提供目录,而是提供包含多个分子的文件,比如multi_mol2或者multi_sdf文件。 iii)必须为3D分子,如果有2D分子则直接剔除。如果有平面的3D分子,则使用-allowflat选项避免将之剔除。 5.辅基(co-factor)、水(water)、金属离子(metal ion)的考虑: -water 与-complex合用,不删除水分子 6.活性位点的确定: i)通过-clip选项,并加以下任一文件确定br /复合物中共结晶的配体分子文件: -clip lig.mol2 包含活性位点氨基酸残基原子的文件: -clip selected_residues.mol2 ii)-margin N确定活性位点盒子大小,默认-margin 7 iii)如果确切知道盒子的范围,可以选取盒子对角两个点所在的原子存为PDB文件,将之作为参照,用-clip two_corner_atoms.pdb -margin 0参数定义盒子 7.参照分子(用于计算RMSD) -rms lig.mol2 -------------------------------------- 输出文件要求: --------------------------------------- 1.输出分子文件格式: mol,sd/sdf,tma(tagged molecule ascii),tmb(tagged molecule binary) 2.运算路径: i)默认$HOME/ehits_work ii)可以通过修改安装目录中的aux.sh文件中的ehits_work路径来修改输出路径;修改后需把grant文件放入新的ehits_work/license目录中。 iii)如果不修改aux.sh文件,则在运算时通过添加 -workdir 参数也可以暂时修改运算路径。 iv)ehits_works/目录包含: license/ logs/ preprocess/ results/ results/receptor/ligand/ 0/,1/,2/,3/,4/,5/,6/,7/,8/,9/ 如果分子数为4位数,则生成4层目录:n/n/n/n/(n=0~9),前999个分子位于0/目录中,其中1~9位于0/0/0/n/目录中,10~99位于0/0/n/n/目录中,100~999位于/0/n/n/n/目录中;1000~1999个分子位于1/目录中... 如果分子数为5位数,则生成5层目录:n/n/n/n/n,n=0~9 3.输出分子文件 i)默认$HOME/ehits_work/results/protein/ligand/ehits_best.sdf 通过-out选项修改 ii)输出文件中分子的标记 -tagname 对于mol2文件,不要使用该选项,软件会自动从文件内部识别mol2文件名,并将之添加到输出结果中。 4.评分文件 i)评分值以pKi为单位(Kd或Ki的对数值,分值在-6时,活性在uM级别) ii)评分文件在$HOME/ehits_work/results/中 -------------------------------------- 其他参数设定: --------------------------------------- 1.精度 -accuracy N i)N默认为3 ii)-accuracy 1即-fast iii)N越大,采样数越多,运算时间越长,一般,运算时间与精度呈平方增长。 2.参数文件 对接: -param *.cfg 默认eHiTS/data/parameters.cfg 虚拟筛选: -param *.cfg 默认eHiTS/data/parameters_HTS.cfg 评分: -rkb *.rkba rkb文件可以通过训练(training utility)获得。 3.并行化 -lsf_nodes N 通过LSF运行N个节点 -pbs_nodes N 通过PBS运行N个节点 -proc N 通过SMP机器运行多个进程 -sge_nodes N 通过Sun Grid Engine机器运算并行任务数 注:在SUNWAY,可以通过szrun来进行并行运算: $szrun 4 2 ehits ...通过4个节点2个CPU 4.继续上次中断的运行: -reuse 5.结束任务 $stop_ehits.sh 6.构象选择(在输出文件中,每个分子仅能保留一种构象) -select N 选取每个分子的N个构象进行分析 默认-select 32 -toprand N 选取每个分子的N个构象进行分析 如果与-rms选项合用,则best.sdf文件中的第一个构象是和参考分子RMS值最小的构象。 eg. -toprank 10 7、受体柔性:通过软对接实现受体的柔性 i)利用PDB文件中的温度因子(temperature factor)信息,预测原子可能位置,产生经验评分函数 ii)旋转Ser,Thr,Tyr的羟基,以及Lys的-NH3+。eHiTS并不移动主/侧链的重原子 iii)在大多数力场中,6-12 potential计算中,并不考虑立体位阻(steric clash)或者van der Waals势能 -------------------------------------- 结果分析: --------------------------------------- 图形软件Chevi(eHiTS配套软件,对所有用户免费)和UCSF Chimera都可以进行受体-配体相互作用分析,后者还可以将sdf文件另存为mol2格式,但是不能保留其中的氢原子。 另外,Sybyl(输入格式选择MACCS),Maestro,Pymol,CACTVS也可用于结果分析。 --------------------------------------- --------------------------------------- 通过已知活性数据构建并使用训练集 --------------------------------------- eHiTS对已知数据集的训练分为两种情况: 1.VSTS Fliter Utility高通量虚拟筛选过滤规则 分为两个步骤: i)仅对活性分子和非活性分子通过神经网络(neural net)进行训练,得到filter。 $eHiTS_6.2/filter_training/filter_train.sh activies decoys output eg. $eHiTS_6.2/filter_training/filter_train.sh inhibitors_multi.mol2 decoys_multi.mol2 trained_filter.net 在当前目录生成trained_filter.net文件,亦即filter,用于下步快速过滤。 参数说明: -num_act 用于训练的活性分子,默认为全部 -num_decoy 用于训练的非活性分子,默认为全部 -num_round 训练次数,默认为20 ii)正常使用ehits并进行参数设定,以利用filter快速对数据库进行过滤(6~7个分子/min),筛除可能的非活性部分,保留数据库中的一部分分子(一般10%),进行分子对接。 ehits.sh ..... -filter -dock 10 说明: -filter trained_filter.net 使用trained_filter.net作为filter -filter 使用ehits默认网络(net)作为filter -dock 10 保留数据库中的10%分子进行分子对接 -dock 0 仅进行过滤而不对接 一般,过滤后的评分值介于0~1,1表示分子与活性分子非常吻合,而0表示基本不吻合。 2.Traning Utility通过对已知数据训练优化评分函数 除了对活性分子和非活性分子,还加入受体进行训练,得到的参数文件用于考察受体和配体的相互作用及作用强度,分为两种: i)validation training:PDB复合物以及一组decoys进行训练,用以优化评分函数,更好的预测配体和一个家族内的几个靶点的结合模式。 ii)enrichment training:针对某个受体,利用活性/非活性化合物以及该受体结构进行训练,优化评分函数,以使活性化合物的评分比非活性化合物更高,以提高富集率。(better rank activities over decoys) eg. $enrich_training.sh -receptor rec.mol2 -clip lig.mol2 -actives inhibitors_multi.mol2 -decoys decoys_multi.mol2 $enrich_training.sh -complex complex.pdb -actives inhibitors_multi.mol2 -decoys decoys_multi.mol2 在ehits_work/preprocess/receptor/目录中生成WeightsTable.ria文件。由于该文件是针对没个特定受体生成的训练文件,所以在进行虚拟筛选时,eHiTS会自动在ehits_work/preprocess/receptor/目录钟寻找该文件。 注:提供尽可能多的活性化合物和两倍数量的非活性化合物用于训练。运算速度与ehits对接速度相近。 --------------------------------------- score.sh Utility评分程序 --------------------------------------- 用法: $score.sh 回车,给出提示 $score.sh macro.mol2 docked_lig.sdf -clip ref.mol2 -conform 50产生构象数。仅当输入配体为1个分子时,可以产生构象。multi分子文件不能产生构象。 -out lig_conf.sdf 输出的构象集文件 -opt 找出输入结构的局部最低评分函数,选用该参数后,计算时间大大延长。 --------------------------------------- Convert Utility文件格式转化程序 --------------------------------------- $convert infile.tma outfile.sdf 输入格式:mdl,sd/sdf,pdb,mol2,tma,tmb 输出格式:mdl,sd/sdf,tma,tmb -config ...../data/parameters.cfg -noLp -noH -verify --------------------------------------- 安装: --------------------------------------- 下载安装文件: eHiTS_6.2_Linux.bin适用于所有linux平台 eHiTS_6.2_Linux_Pentium3.bin,适用于P3以上电脑,比前者快30% #sh eHiTS_6.2_Linux.bin /usr/local/ 在/usr/local/目录生成eHiTS_6.2目录,以及两个链接文件:ehits.sh和stop_ehits.sh #cp ehits.lic /usr/local/eHiTS_6.2 将ehits.lic拷入eHiTS_6.2目录。该lic文件从官方网站申请获得,包括几个字符,如ucnsyphu23,用于下面从官方网站服务器获取认可。因而,需要事先签署协议(对于学术用户1年一签),则官方服务器可以通过该lic的申请。 #cd /usr/local/bin #ln -s ../eHiTS_6.2/ehits.sh ./ehits 创建文件链接 #exit 退出管理员用户 运行时,在$HOME下生成ehits_work,其中的license目录中自动从官方服务器上获得lic文件 修改安装目录中的aux.sh文件,将ehits_work的路径修改为自己的运算路径(默认为$HOME),在新的ehits_work目录中,自动生成license等目录,将从网站上获取的grant文件放入license目录。可以运行。 如果不修改aux.sh文件,则在运算时通过添加 -workdir 参数也可以暂时修改运算路径。 ----------------------------------- 不能正确申请lic的解决方法(比如不能链接到官方服务器上): --------------------------------------- 不能获取license时,会在~/ehits_work/license目录中生成eHiTS.*.query文件,通过该文件,有两种方法获取license: 1.通过网站: http://www.simbiosys.ca/license/ 2.发送电子邮件: support@simbiosys.ca 在附件中添加文件 eHiTS.*.query 将获得的eHiTS.*.grant文件,放入eHiTS.*.query所在目录,即~/ehits_work/license。 OK! ---------------------------------------- license安装: ---------------------------------------- i)不同用户或者CPU会自动向官方服务器申请不同的license文件,并将之放在$HOME/ehits_work,比如 eHiTS.dell.wjmed.grant 用户wjmed在dell机器上的license ii)并行linux超级计算机,每个节点均需要license,由于cluster往往有网关保护,所以不能直接链接到官方服务器上,所以按照上面提到的方法,向官方网站上传quer文件,获取grant文件,并将之放入ehits_work/license目录中。比如: eHiTS.gn012.wjmed.grant 注:gn012为012节点,wjmed为用户名。
个人分类: 好文转载|5745 次阅读|1 个评论
换位思考—将中药的理念用于药物的设计(二)
jacky2008 2008-7-25 12:26
二、 化学药物的设计进展及存在问题 经过近一个世纪的发展,特别是近年来生物学科和计算机技术等学科的迅速发展,给药物设计提供了较好的条件,药物研究与开发经历了由粗到精、由盲目到自觉、由经验性试验到科学的理性地设计的阶段。药物研究已经由 从动物、植物体内分离、纯制和测定,天然活性产物直接被用作药物的 发现阶段( Discover )、经过 药物发现的黄金时期的 发展阶段( Develop )进入到由 新理论、新技术以及相关学科交叉渗透的多学科性、综合性的 设计阶段( Design )。 特别 是近 20 年来,随着化学、生物学、分子药理学、分子生物学的发展,对于各种内源性生理活性物质和药物与受体作用的作用模式和结构认识的不断深入,以及生物学黄金时代开创的结构生物学、蛋白质组学和基因组学等学科大大的充实了药物发现所依靠的生命科学基础,现代科学和计算机技术的运用(如组合化学、高通量筛选和计算机辅助药物设计)改进了药物发现的技术和方法;信息学科的突飞猛进的发展,各种信息数据库(化合物信息库和生物信息库等)和信息技术(信息处理和转换技术等),可以更便捷的检索和搜寻所需要的文献资料数据,使我们可以在药物研究和开发中更有效的利用一切传统的和现代的知识,尽快的作出最佳决策,研究水平和效率大为提高,使药物的发现更快捷、更经济有效。另外国家和相关制药企业为了争取国际市场,在药物研究和开发( RD )方面投入了大量的资金,从另一方面促进了医药工业和药物化学的快速发展。 20 世纪末期新药的研究集中在作用于细胞膜上的受体靶和酶靶等,以信息的传递和阻断为目的,主攻细胞边缘;由于蛋白质组学和人类基因组学研究的深入,对于疾病产生的机理更加清楚,因此在 21 世纪研究的热点将集中在细胞内起关键作用的核酸及多糖靶,主要是细胞内基因的修饰与调控,主攻目标在细胞内。 另一方面, 21 世纪的新药研究与开发,需要充分利用新技术、新知识和新方法,需要多学科领域的协同作战。因此必须加强生命基础过程的研究,通过分子病理学、分子药理学、分子生物学等学科的深入研究,更清楚的了解机体内源性活性物质的分子机制,寻找药物特异性作用的新靶点。先导化合物的设计将仍然是 21 世纪药学研究的热点之一,通过计算机辅助药物设计与生物工程相结合,组合化学与高通量筛选相辅佐,新药的研究与开发将走向一个崭新的台阶。(后续接)
个人分类: 思路|3798 次阅读|0 个评论
换位思考—将中药的理念用于药物的设计
jacky2008 2008-7-10 15:56
已有几千年历史的中药研究,历经数代人的不断努力,特别是近年来研究的不断深入,已经积累丰富的经验和理论基础。近年来,为使中药走出国门,走向世界,人们以中医药的理论为指导,在现代医药研究的理论和方法的基础上加以改进的方法来研究中药,无疑是有利于取长补短,加速中药研究的发展。这里从另一个角度出发,探讨如何合理的应用中医中药的基本理论和思路,来进行化学药物的设计和研究。 一、中药的特性 传统中医认为中药治病是祛病扶正,调节阴阳平衡,非常重视人体本身的统一性、完整性及其与自然界的相互关系。自然界的运动变化,会直接或间接的影响着人类,使人体相应的发生生理或病理的反映,人生于地,悬命于天,天地合气,命之曰人《素问.宝命合行论》。中医用药除讲究阴、阳、虚、实外,还特别注意用药的性、味之别,注意中药的归径等,只有考虑了上述因素,才能做到对症下药。 中药的药性理论很多主要包括四性(寒、热、温、凉)、五味(辛、甘、酸、苦、咸)、升降浮沉及归经等。五味中,酸生肝,苦生心,甘生脾,辛生肺,咸生骨,味与性和归经密切相关,凡药酸者能涩能收,苦能泻能燥能坚,甘者能补能和能缓,辛者能散能润能横行,咸者能下能软坚,淡者能利窍,能渗泄,此五味之用也。 药有酸咸甘苦辛五味、又有寒热温凉四气,李东垣《用药心法》曰:凡药之所用者,皆以气、味为主。气昧相同,作用相近,气味不同,作用各异,一药数味,效用扩大。 中医学认为升降出入是机体生命活动的总话,它概括了脏腑、经络、营卫、气血、津液等全部生理活动及新陈代谢整个过程。作为药性理论来讲,升降浮沉既有单纯的药物作用趋势的概念,又有参与调整、恢复、平衡脏腑、经络气机运动的含义。 归经是指药物对机体的选择性作用,即某药对某些脏腑经络有特殊的亲和作用,因而对这些部位的病变有主要和特殊的治疗作用。归经不同、药物的治疗作用不同,归经指明了药物治病的适用范围,也就是药效所在.包含了药物作用定向定位的概念。是阐明药物作用机理,指导临床用药的药性理论基本内容之一。人们对于中药的归经有很仔细的研究。 中医用药完全是根据中药的四性、五味、升降浮沉和归经结合患者的疾病特征而对症下药的。如寒者温之,热者寒之。又如属于血虚的缺铁性贫血,用四物汤治疗,主药当归含铁量为方中之最。损者益之,虚者补之,对各种虚症,则给以相应的补益药。 现代医学研究表明,中药的四性、五味、升降浮沉和归经等与其所含的化合物的类型、含量以及微量元素等因素有关。 进一步来说中药的四性、五味及归经实际上是与化合物中的相关基团、类型、共存的微量元素及其相互作用有关。而这些基团和结构是可以改变的,改变后的化合物有可能会改变其四性、五味及归经。同样,在新药设计时,也可以借助中药的上述性质、原理进行设计。(持续,下一节继续谈)
个人分类: 思路|3976 次阅读|1 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-23 18:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部