最早接触文献检索,是在读大学的时候,当时选修了情报学专业的一门课,叫做科技文献检索,也就是从那个时候就开始接触SCI了,还学会了BA,CA,还有PA。只到在做本科毕业设计的时候,才知道BA这个东西是那么有用,又是那么无用。一大堆厚厚的影印版BA堆在那里,大多没有人翻过,积满了灰尘,当时就觉得这要浪费多少钱呀,但是大学图书馆又不能不买这些东西,因为有个别人需要用的时候,却又是那么的宝贵。至少当时是帮了我的大忙了。我的本科毕业论文是用英文撰写的,当时还写出了一篇英文论文,投稿SCI刊物(Mutation Research),待我毕业后很长时间,收到指导教师转过来的复印件,审稿者需要补充一个实验,证明培养的细胞没有失活,可惜我的指导教师是日本留学回来的,不会英语,没有看懂这封邮件,最后就超过了编辑给定的期限,只好作罢。不然,我的第一篇SCI论文就应该是在1992年至1993年发表的。多年过去了,也好长时间不到图书馆查文献了,我不知道BA印刷版是否还存在,是否还有人会用这个东西来查询什么? 互联网是一场革命,这大家都知道。网络检索也是一场革命,有雅虎的时候,大家并无太多感觉,有了Google,网络检索革命也就到来了。我刚接触到Google,就被其所吸引,因此在新世纪元年(2001年)的首期《电脑报》上发表了一篇介绍Google的文章: 搜索引擎界的革命:Google 。不过,那个时候也没有想到其能与学术检索和评价联系起来,只是觉得那是一个互联网信息的检索工具而已。SCI在中国大地的兴起和普及,让Web of Science也很快进入研究人员的手里,并成为一个重要的学术检索工具。 一直觉得SCI这个东西,发表杂志有门槛,引用这篇文章的杂志,是否计入引用次数也有门槛。这究竟是SCI商业垄断呢还是为了保证学术引用的质量,也许二者兼而有之吧。其实,不管作者将文章发表在何处,对于其文章被什么人引用,总是很关心的。如果有一个更全面提供这些信息的检索工具就好了。谷歌学术应该就是在这种需求下出现的吧。它可以在论文、预印本摘要、书籍,甚至发布会海报中查询引用情况。总之,谷歌学术彻底搜索整个互联网,提供了更为完整的信息。据上周Science上的一篇文章介绍,谷歌学术的出现,对研究者的学术搜索(research-seeking)行为有很大的影响。随着谷歌学术的不断发展,目前其对文献纲要的整理完全可以与商业学术搜索资料库Web of Science和Scopus相媲美,而在社会科学和人类学领域甚至做得更好。另外,谷歌是在线期刊中文章的主要推介来源,这远远超过其他任何搜索工具。作为研究人员的学术搜索引擎,谷歌学术提供了可量化所发表作品影响力的引文指标,甚至许多研究人员将这些数字放如其个人简历中。 学术评价是一件非常严肃的事儿,谷歌学术是否能充当学术评价的能力,这显然会引起许多研究人员的关注。一个很明显的事实是:谷歌学术检索的范围覆盖了整个互联网,而不仅仅来自经过相对严格评审的期刊。这一方面体现了其更全面的学术引用情况,但另一方面,由于谷歌学术缺乏管理者,因此其搜索的量化指标就很容易被人操纵。有人对此做过实验,将一些假论文放在网上,并引用其他的文章,数周后,这些文章的被引用数显著上升。因此,谷歌学术在对引文指标的分析中,是否有能力检测欺诈行为,就是一个重要的问题。但谷歌似乎对此非常自信,他们认为有些批评人士夸大了这一问题。使引文分析数据出现偏差的固然可称为“垃圾信息”,到目前为止,学术文章中垃圾信息的数量并不算太高。学术界对操纵数据的学术骗子应该有一定的社会规范来进行惩罚,并说谷歌有抑制这种情况产生的特殊算法,但涉及到核心搜索引擎方面的技术问题,因此并没有透露。谷歌学术等进入学术搜索领域必将会使汤森路透和爱思唯尔的日子很难过。不过,这样的竞争,对科学家是有好处的,科学家不用只依赖一个服务而有更多选择了。以前有传言谷歌将淡化并解散学术搜索团队的说法似乎不靠谱,因为这个团队事实上正在扩大。因此,总的来看,谷歌学术是一个非常棒的服务,使得影响力的评价比以往任何时候都更加透明。这也是一个发展中的工具,未来应该开发更加精细的引文分析模型,但谷歌似乎正在致力于通过网络创造条件让全球科学家之间的交互和协作。 这篇文章引发了人们对谷歌等机器产生的引文指标的问题。但是其实这种对引文指标的操纵即使对人类监管的指标也可能产生,影响因子也可通过鼓励某些引用操作而获得,如1)具有相同观点同行的引用可导致某一学派的学术重要性畸形偏高;2)编辑可通过某些方式引导作者引用该杂志的文章以提高期刊影响因子。在对Science这篇文章的评论中,有些人的说法也非常有道理。比如,有人认为,谷歌学术中的垃圾就像大数据的噪音,随着更多人的使用,其严重性会随之降低,最后只需很少的后处理这种噪音就可忽略了。群众的智慧用于科学评价似乎是合理的,特别是可考虑科学和教育在市场中漂移问题的评价。显然,学术检索中垃圾信息的情形,对于上述个别情况的比较来说,可能是个问题,但也很容易解决,如去掉自引。此外,当谷歌学术比较众多数据时,其数值可能不会偏离太远,因为包含大量的垃圾的引用一定非常明显并容易被人们所发现。另外,从技术上讲,也是可以纠正这些垃圾的,文章影响力的排序除了引文数量之外,还有这些引文本身的来源问题,这一点通过谷歌强大的搜索能力是完全可以做到的。 有评论者还提供了一个数据分析,非常有意思。一个经典的集合理论公式为: N(A OR B) = N(A) + N(B) – N(A AND B) 。 在检索中,交集大小如何计算?其实,在谷歌中是无法区分AND操作和AND NOT操作的,但二者显然差别是非常大的,一个是包含,一个是排除。web of sciecne(WOS)显然要做得好一些。比较下面这个例子: A = fermentation; B = submerged 搜索引擎 A OR B A B A AND B 计算值 误差 谷歌网页检索 31.2 M 7.80 M 6.3 M 0.556 M 13.54M -56.6% 谷歌学术检索 1.79 M 1.9 M 1.04 M .0848 M 2.855 M +59.5% WOS 107.8K 81.85K 28.709 2.425 K 108.129 +0.30% 并集的结果比最后的计算值要差很多,特别是传统的谷歌检索几乎增加了近一个数量级。相比而言,Web of Science 的偏差很小。 参考资料: John Bohannon. Google Scholar Wins Raves—But Can It Be Trusted? Science 2014-01-03. http://comments.sciencemag.org/content/10.1126/science.343.6166.14
谷歌学术搜索(Google Scholar )可以用,大家实用吧。 http://scholar.google.com/scholar?hl=enq=AIDSbtnG=lr=lang_zh-CNas_sdt=1%2C5as_sdtp = 这里进也可以: 各类信息搜索,都是可以的。 http://www.google.com/intl/en/about/products/ 刚才我搜索的结果如下: 搜索艾滋病(AIDS) Scholar About 39,000 results ( 0.03 sec) Any time Any time Since 2012 Since 2011 Since 2008 Sort by relevance Sort by date My Citations Articles Legal documents Search the Web Search Chinese (Simplified) pages include patents include citations Advanced search Create alert My Citations Settings Articles Legal documents Any time Since 2012 Since 2011 Since 2008 Custom range... — Search Sort by relevance Sort by date Search the Web Search Chinese (Simplified) pages include patents include citations Create alert 教育的目的: The aids of education 怀特海, 徐汝舟, 英语教授 - 2002 - 生活· 读书· 新知三联书店 Cited by 267 Related articles Cite 肿瘤坏死因子与 AIDS 陈飞, 侯芳玉, 张绍伦 - 国外医学免疫学分册, 1992 - cnki.com.cn : AIDS 患者血清肿瘤坏死因子(TNF) 增高. TNF 过多可导致免疫抑制, 诱导HIV 活化表达, 引起发热, 恶病质等病理生理表现. 治疗 AIDS 常用药物IFN-γ, IL-2 等也能导致TNF 增高, 并用抗TNF 的单克隆抗体以消除TNF 增高所带来的不良后果或许是 AIDS 治疗中的一个有效 ... Cited by 87 Related articles All 2 versions Cite More Cached 自愿咨询检测在 AIDS 防治中的作用及其影响因素 王常合, 庞琳, 吴尊友 - 中国艾滋病性病, 2005 - cqvip.com 艾滋病( AIDS ) 自愿咨询检测(Voluntary Counseling Testing, VCT), 是指人们在经过咨询以后 能够对于是否做艾滋病检测做出自我选择的过程. VCT 坚持自愿和保密的原则, 向服务对象提供咨询, 检测, 保健治疗, 持续关怀和转诊服务. Cited by 89 Related articles All 3 versions Cite from lw23.com lw23.com 流动人口 AIDS 知识与态度现状调查 陆焯平, 朱作金 - 中国艾滋病性病, 2004 - file.lw23.com 摘要: 目的了解流动人口对艾滋病( AIDS ) 相关知识的知晓情况, 对 AIDS 高危行为的态度及个人 防范意识, 掌握人群对 AIDS 健康教育的需求, 为在流动人口中开展 AIDS 健康教育工作打下基础. 方法对南宁市的建筑工人, 宾馆和酒楼服务员, 理发美容人员, 小商贩, 学生等进行 AIDS 知识与 ... Cited by 95 Related articles All 6 versions Cite More View as HTML from lw23.com lw23.com AIDS 自愿咨询检测 (一) 王立秋, 杨新宇, 王斌 - 中国艾滋病性病, 2003 - file.lw23.com 无论是在发达国家还是在发展中国家, 艾滋病( AIDS ) 自愿咨询检测(VCT) 都已经成为 AIDS 预防与关怀项目的一个重要组成部分…. 随着社区需求的变化及对艾滋病病毒(HIV) 感染者和 AIDS 病人的管理, 治疗和支持方面的变化, VCT 服务也在逐渐演变, 即使是那些HIV ... Cited by 74 Related articles All 6 versions Cite More View as HTML
在一个校友论坛中,一位朋友说检索到一篇超过15万次引用的论文。 “找到一篇谷歌学术引用数超15万的论文 A rapid and sensitive method for the quantitation of microgram quantities of protein utilizing the principle of protein-dye 好像是生物学的。 http://scholar.google.com/schola ... +btnG=lr=” 我看了一下——原来是考马斯亮蓝。 我的回复 “是可以将蛋白质染色的一种染料——考马斯亮蓝,可以对蛋白质进行定量。 一开始科学家都在寻找这样的灵敏的染料,有一个纺织商人给那位科学家寄了很多种纺织业的染料,发现其中的考马斯亮蓝可以很好的对蛋白质进行染色,而且线性很好” “Bradford 这个科学家的名字已经成为生化分析(蛋白质定量)中的一种方法的名字了。 - Analytical biochemistry, 1976 - hoffman.cm.utexas.edu 这个杂志的影响因子只有2-4分,但是上面曾经发表了很多一流的文章。 考马斯亮蓝 也就是Coomassie Brilliant Blue G-250” 后来又检索了以下引用超过一万次的论文,主要是生物学领域的,很多都是方法学的文章,附在文章最后面。 大家来个互动——一起来找高引文章吧。最好给个20字内的描述其工作及意义。 1. http://scholar.google.com.hk/scholar?q=Gapped+BLAST+and+PSI-BLAST%3A+a+new+generation+of+protein+database+search+programsbtnG=hl=zh-CNas_sdt=0%2C5 Gapped BLAST and PSI-BLAST: a new generation of protein database search programs BLAST: 用来比较DNA序列的程序。可以在 http://www.ncbi.nlm.nih.gov/ 使用。 以下是后来编辑的部分: 这个是升级版得Blast 用来做蛋白序列比较的。一开始写DNA比对,是错误的。 原来版本对DNA比对的Blast是指这篇文章。 http://scholar.google.com.hk/scholar?q=Basic+Local+Alignment+Search+ToolbtnG=hl=zh-CNas_sdt=0 被引40832. 2. http://scholar.google.com.hk/scholar?q=pcrhl=zh-CNas_sdt=0 Analysis of relative gene expression data using real-time quantitative PCR and the 2- CT method 定量PCR 方法,可以针对体内的基因表达水平进行定量分析的技术。 Analysis of Relative Gene Expression Data Using Real-Time Quantitative PCR and the 2−ΔΔCT Method 3. http://scholar.google.com.hk/scholar?q=Primer-directed+enzymatic+amplification+of+DNA+with+a+thermostable+DNA+polymerasebtnG=hl=zh-CNas_sdt=0 pcr,可以将基因指数扩增的办法。 4. http://scholar.google.com.hk/scholar?q=southern+blothl=zh-CNas_sdt=0 Detection of specific sequences among DNA fragments separated by gel electrophoresis 作者是Southern,现在这个技术叫southern blot 。 在生物技术领域,还有Western blot , northern blot。 还没有Eastern blot 5. http://scholar.google.com.hk/scholar?q=paulinghl=zh-CNas_sdt=0 作者Pauling。讲化学键的。但是不是原始文件。PCR那个文章也不是原始文献。 The nature of the chemical bond 1992 6. http://scholar.google.com.hk/scholar?q=simple+salting+out+procedure+for+extracting+DNA+from+human+nucleated+cells.hl=zh-CNas_sdt=0 提取DNA方法。 A simple salting out procedure for extracting DNA from human nucleated cells . 7. http://scholar.google.com.hk/scholar?q=Sequencing+end-labeled+DNA+with+base-specific+chemical+cleavages.btnG=hl=zh-CNas_sdt=0 Sequencing end-labeled DNA with base-specific chemical cleavages. 8. http://scholar.google.com.hk/scholar?q=A+technique+for+radiolabeling+DNA+restriction+endonuclease+fragments+to+high+specific+activity.btnG=hl=zh-CNas_sdt=0 A technique for radiolabeling DNA restriction endonuclease fragments to high specific activity. DNA片断同位素标记 从以上文章中我看出来了,在生物领域,方法学的突破被引用的要多一些。 那种理论突破,比如P53基因发现,还有发现干细胞之类的都很难上榜啊。 Establishment in Culture of Pluripotential Cells from Mouse Embryos 只有 4757次。SiRNA发现大约是9000多次。还有些nobel奖也就1000次左右。 基于方法学的引用次数多 这一个思想,在web of science网站(比googel scholar更专业,更准确的引用数据库,只收入学术文献的引用,Google 会收录网站的引用之类的。)上检索了下Software 关键词。 出来以下结果: 1. 标题: CLUSTAL-W - IMPROVING THE SENSITIVITY OF PROGRESSIVE MULTIPLE SEQUENCE ALIGNMENT THROUGH SEQUENCE WEIGHTING, POSITION-SPECIFIC GAP PENALTIES AND WEIGHT MATRIX CHOICE 作者: THOMPSON JD; HIGGINS DG; GIBSON TJ 来源出版物: NUCLEIC ACIDS RESEARCH 卷: 22 期: 22 页: 4673-4680 DOI: 10.1093/nar/22.22.4673 出版年: NOV 11 1994 被引频次: 35,972 (来自所有数据库) 2. 标题: BASIC LOCAL ALIGNMENT SEARCH TOOL 作者: ALTSCHUL SF; GISH W; MILLER W; 等. 来源出版物: JOURNAL OF MOLECULAR BIOLOGY 卷: 215 期: 3 页: 403-410 DOI: 10.1006/jmbi.1990.9999 出版年: OCT 5 1990 被引频次: 32,855 (来自所有数据库) 3. 标题: Gapped BLAST and PSI-BLAST: a new generation of protein database search programs 作者: Altschul SF; Madden TL; Schaffer AA; 等. 来源出版物: NUCLEIC ACIDS RESEARCH 卷: 25 期: 17 页: 3389-3402 DOI: 10.1093/nar/25.17.3389 出版年: SEP 1 1997 被引频次: 30,833 (来自所有数据库) 4. 标题: A short history of SHELX 作者: Sheldrick George M. 来源出版物: ACTA CRYSTALLOGRAPHICA SECTION A 卷: 64 页: 112-122 DOI: 10.1107/S0108767307043930 子辑: Part 1 出版年: JAN 2008 被引频次: 26,530 (来自所有数据库) 5. 标题: A COMPREHENSIVE SET OF SEQUENCE-ANALYSIS PROGRAMS FOR THE VAX 作者: DEVEREUX J; HAEBERLI P; SMITHIES O 来源出版物: NUCLEIC ACIDS RESEARCH 卷: 12 期: 1 页: 387-395 DOI: 10.1093/nar/12.1Part1.387 出版年: 1984 被引频次: 14,198 (来自所有数据库) 6. 标题: Crystallography NMR system: A new software suite for macromolecular structure determination 作者: Brunger AT; Adams PD; Clore GM; 等. 来源出版物: ACTA CRYSTALLOGRAPHICA SECTION D-BIOLOGICAL CRYSTALLOGRAPHY 卷: 54 页: 905-921 DOI: 10.1107/S0907444998003254 子辑: Part 5 出版年: SEP 1 1998 被引频次: 13,863 (来自所有数据库) 7. 标题: MEGA4: Molecular evolutionary genetics analysis (MEGA) software version 4.0 作者: Tamura Koichiro; Dudley Joel; Nei Masatoshi; 等. 来源出版物: MOLECULAR BIOLOGY AND EVOLUTION 卷: 24 期: 8 页: 1596-1599 DOI: 10.1093/molbev/msm092 出版年: AUG 2007 被引频次: 12,796 (来自所有数据库) 8. 标题: MODELTEST: testing the model of DNA substitution 作者: Posada D; Crandall KA 来源出版物: BIOINFORMATICS 卷: 14 期: 9 页: 817-818 DOI: 10.1093/bioinformatics/14.9.817 出版年: 1998 被引频次: 12,432 (来自所有数据库) 9. 标题: IMPROVED METHODS FOR BUILDING PROTEIN MODELS IN ELECTRON-DENSITY MAPS AND THE LOCATION OF ERRORS IN THESE MODELS 作者: JONES TA; ZOU JY; COWAN SW; 等. 来源出版物: ACTA CRYSTALLOGRAPHICA SECTION A 卷: 47 页: 110-119 DOI: 10.1107/S0108767390010224 子辑: Part 2 出版年: MAR 1 1991 被引频次: 12,360 (来自所有数据库) 上述9篇中,有“Gapped BLAST and PSI-BLAST: a new generation of protein database search programs ”是重复的。 后来用CELL,RNA, DNA随便搜搜,都很多过万的文章。很少有中国人的。 补2个被引超级高(过20万次)的。 1.http://scholar.google.com.hk/scholar?hl=zh-CNq=PROTEIN+MEASUREMENT+WITH+THE+FOLIN+PHENOL+REAGENT+btnG=lr= Protein measurement with the Folin phenol reagent 221826次。 2. CLEAVAGE OF STRUCTURAL PROTEINS DURING ASSEMBLY OF HEAD OF BACTERIOPHAGE-T4 作者: LAEMMLI, UK (LAEMMLI, UK) 来源出版物: NATURE 卷: 227 期: 5259 页: 680- DOI: 10.1038/227680a0 出版年: 1970 被引频次: 205,829 (来自 Web of Science)