1993年,我被免试保送为南京师范大学生物系无脊椎动物学专业硕士,导师是归鸿教授、苏翠荣(副)教授。从此以后,我就和生物系里的三本书,Invertebrate Zoology(Barnes)、The Insects: Structure and Function (Chapman)和Numerical Taxonomy(Sneath Sokal),以及Zoological Records结下了不解之缘。 Invertebrate Zoology图文并茂,给了我很多动物学的知识,也使我第一次了解到类群的起源和演化是如此的复杂而迷人。这是我到动物研究所读博士,有了借书证以后,借的第一本,也是借期最长的专业书籍。1994年暑假,我在南师大生物系新大楼南侧的平房内,反复研读了The Insects: Structure and Function,掌握了大量的专业词汇。而Numerical Taxonomy这本书几乎没有离开过我在南师期间的野外采集包。这本书当年让我有太多着迷的地方,希望能够用数学方法、计算机技术开展蜉蝣的分类工作。然而,真正在计算机上敲入命令,开始昆虫系统学探索,则还得归功于一个简单而神奇的软件, Hennig86 (Farris)。 1995年6月之前,我对昆虫分类学还没有太多的兴趣,但是关于Hennig86的信息出现是一个非常重要的影响。同时丰富的野外经历给予了自己对许多昆虫的感性认识。这年我在浙江丽水龙泉山区的采集经历促成了我专业兴趣的转折点。回到南京之后,我下决心要继续攻读昆虫学博士学位,并分别给天津南开大学的郑乐怡教授、北京动物研究所的黄大卫研究员写信。郑先生是昆虫系统学的大家,给郑先生写过几次信,因此当时就直接咨询是否可能投考。但由于动物研究所的巨大科学声望,自己对黄老师也没有太多了解,因此就写信希望获取他1991年在《系统进化动物学论文集》对Hennig86程序的介绍。当时,郑先生由于身体原因,没有如常回复;黄老师则在寄送抽印本的同时,还手写了信件,给了我很大的鼓励。后来我到北京拜访了老师。此后,我对昆虫学的兴趣越发浓郁,同时搜索、慢慢阅读并试图理解Willi Hennig的工作。 近日收到2013年发表的关于Willi Hennig的一本书,From Taxonomy to Phylogenetics。开卷之初,突然发现,二十年以来,我对昆虫的兴趣从无到有、投师动物研究所、坚守昆虫系统学、培养博士后和研究生,竟无一不源于对Hennig关于分类学的革命性思路的好奇和学习。当和他同期的昆虫学家都在埋头研究一个个或新奇、或重要的物种时,Willi Hennig却犹如一个书呆子,在静静地思考,并谨慎而执着地提出了影响深远的概念、理论和方法。他没有出生豪门,经历了二战,最后因开创了分支系统学而闻名于世。现在,单系群(Monophyletic group)和共同祖先(Common ancestor)现在已经深入人心,被宏观和围观系统学家广为接受。他对系统学的贡献,可以和Aristotle、Linnaeus和Darwin其名(Quentin Leandro)。 每年新人进实验室,我都希望和他们聊聊兴趣培养于他们研究的重要性。但是,现在在网络的帮助下,信息来源太丰富了,也很少有难以获得的思路或技术,可以让他们再有感慨、兴奋、享受了。当年我如果有今天的便利条件,以我兴趣之广泛,或许也早已迷失于网络之中。适逢今日,优秀大学生进入实验室冬令营活动在动物研究所举办。非常羡慕这些更加年青的学子,能够有机会来到动物研究所,和导师面对面了解辉煌的学科历史、获知精彩的学科进展、憧憬充满未知的学科未来。祝福他们,相信至少有部分人,能够对未来的研究生生活、工作有所准备,有所规划,寻觅到自己心仪的学科导师和方向。 Willi Hennig was not a hero, he was a simple man - possibly a 'nerd' (Yoon 2009: 240). 附部分信息: Willi Hennig介绍: http://en.wikipedia.org/wiki/Willi_Hennig Phylogenetic Systematics, 1963.( 1963_Hening-phylogenetic systematics.pdf ) Cladistic Analysis or Cladistic Classification - A Reply to Ernst Mayr,1975.( 1975_A Reply to Ernst Mayr.pdf ) Willi Hennig and the Rise of Cladistics,2003.( 2003_Willi Hennig and the Rise of Cladistics.pdf ) Phylogenetics- Heed the father of cladistics,2013.( 2013_Phylogenetics- Heed the father of cladistics.pdf )
论文在线发表,引用信息如下: A Protocol for Species Delineation of Public DNA Databases, Applied to the Insecta. Douglas Chesters; Chao-Dong Zhu Systematic Biology 2014; doi: 10.1093/sysbio/syu038 论文全文下载: 相关数据: http://datadryad.org/resource/doi:10.5061/dryad.k7t50 论文在线发表: Abstract: http://sysbio.oxfordjournals.org/cgi/content/abstract/syu038?ijkey=tS8O8zuszBKwUulkeytype=ref PDF: http://sysbio.oxfordjournals.org/cgi/reprint/syu038?ijkey=tS8O8zuszBKwUulkeytype=ref 网站: phylolab.ioz.ac.cn 软件链接: 1、 Automated taxonomic identification of Apoidea (bee) DNA sequences 2、 Multi-Gene DNA Barcoding for Arthropods (beta) 介绍 大量 DNA 条形码数据为实现快速物种界定提供了可能性,也带来了两个问题:1)基于单个位点信息的物种界定是否可靠?2)依据公共数据库信息,实现物种界定的可靠性有多高? MEE 论文 (http://onlinelibrary.wiley.com/doi/10.1111/2041-210X.12104/abstract) 解决了多基因物种界定的全局参数优化 问题。我们 在提交MEE论文的前一天,也向另外一个专业杂志, Systematic Biology 提交了另外一篇论文。该论文最早的想法:飞速发展的测序技术至今测定了多少物种?公共数据库中有多少具有物种水平分类学信息的序列?这些分类学信息是否真实反映了物种界限?在无法完成形态分类学验证的情况下,如何基于多基因片段的信息,为无标记序列提供并验证物种分类信息? 为了实现上述想法, Douglas Chesters 博士开发并测试了一套流程,把 MEE 论文的方法从蜜蜂总科进一步推广到昆虫纲,从少数几个基因片段推广到n个,以期获得更加普遍而可靠的结论。经过审稿人、编辑、副主编和主编的3轮密集审阅,我们收获了很多建设性的建议和想法,并规划了下一步工作。 公共 DNA 数据库中昆虫物种界定规程 公共 DNA 数据库中包含很多生物类群,为系统学研究提供了大量数据来源。目前,基于分子数据的物种鉴别和界定工作已经逐步开展。现代测序技术的飞速发展,带来了海量分子数据的同时,也导致很多研究人员无法为相关数据提供准确的分类学信息。这些分类信息不够完整的分子数据,阻碍了在物种一级水平上开展精细的数据挖掘。同时,基于较大数据库进行物种聚类研究,也需要整合多个基因片段,从而在数据结构和计算过程中产生了很多问题。 作者研发了一种在分子序列数据库中界定物种的方法: 1) 首先获取所有昆虫的 DNA 序列,并对它们进行文本加工; 2) 根据一定的规则过滤掉重复数据; 3) 划分遗传位点 L ; 4) 根据每个位点信息,界定物种 S ; 5) 物种单元与位点相匹配,形成一组多位点物种界定的数据矩阵 L × S 。 作者应用马尔科夫聚类的方法将数据库划分为同源基因片段数据集。基于包含大部分物种多样性的基因,完成物种鉴定,并同时对物种单元名字赋予物种名。在物种聚类过程中,两两相似之处计算的复杂性的主要来源于线粒体基因组中的 COI 位点。自主研发的软件解决了这个复杂的过程:在分类的体系内执行序列两两比对,且为不同阶元的序列标注分类信息。 该工作研究了 GenBank 中超过 24 个不同同源基因, 194000 个未带分类标签的序列,包含 41 525 个带分类标签的物种( 98.7% 从昆虫数据库中获得)。通过对每个位点的分层聚类,利用独立的最优参数,这些序列被分组到 59173 个基于单个位点的分子分类单元( MOTU )中。来自不同位点的 MOTU ,由多部匹配算法进行匹配。这样,位点之间形成不一致性最低的多位点单元。匹配后,我们 发现了在目前的昆虫数据库中,存在 78091 个基于多位点信息的 MOTU 。其中, 38 574 个单元包含物种分类学信息,而 34 891 个则没有包含物种分类标签 。 除了可以估算物种多样性,我们开发的规程还将促进现代序列数据集的物种界定。特别是 L × S 矩阵代表了后分类学思路,将可以解构种级元基因组数据。这些方法将可以在多个基因位点,甚至基因组水平提取大量数据,产生更多研究物种多样性的 L × S 矩阵,从而整合到后续的系统发育的流程。 上述研究成果,已经被Systematic Biology接收: 17-Jan-2013 Submitted 18-Apr-2013 Reject; resubmission encouraged 08-Aug-2013 Resubmission 21-Nov-2013 Accept with major revisions 06-Jan-2014 Resubmission of R1 14-Apr-2014 Accept with minor revision 19-Apr-2014 Resubmission of R2 28-Apr-2014 Accept pending receipt of final changes 29-Apr-2014 Resubmission of R3 10-May-2014 Accept, Production Checklist 11-June-2014 Awaiting Assignment to Batch 15-June-2014 Published on-line