许培扬博客分享 http://blog.sciencenet.cn/u/xupeiyang 跟踪国际前沿 服务国内科研

博文

主题标引规则对文献计量分析的影响

已有 3467 次阅读 2012-5-31 09:34 |个人分类:信息分析|系统分类:科研笔记|关键词:学者| 主题, 影响, 一级, 二级

主题标引规则对采用医学主题词(MESH)做文献计量分析是有影响的。
 
1  由于标引深度的控制,有些文献中比较重要的内容就不一定标引出来。
2  标引规则有:上位标引、靠词标引、组配标引等,有些主题概念不能直接反映出来。
3  MESH主题词分为主要叙词、次要叙词,前者用于定性加权(*)标引,如果采用加权标引的主题词进行文献计量分析,局限性和问题就更大。
4  副主题词组配数量是人为控制的,例如:一篇疾病治疗的文献中讲到三种以上治疗方法时,不标引具体的治疗方法,只组配副主题词/治疗,这样在文献计量分析时就统计不到具体的治疗方法,但很可能这几种治疗方法是非常重要的研究内容。
5  还有很多标引规则对文献计量分析的全面性和准确性造成影响,比如:肿瘤文献的标引规则,药物文献的标引规则。以后将具体介绍和讨论。
 

标引深度分为一级标引和二级标引。?

 

  一级标引?  

      是指以文章的主题为中心来说的。主题是作者集中力量所要表达的主要思想,但作者所写的东西并非一切都是主题。如:提到前人的研究、介绍性说明,一时的提法和背景等,都不是真正研究的对象。总的来说,一级标引是文章论述的重点,是作者探讨的目的和对象,在医学领域中最常见的是指:?

1. 医学各个学科或专业知识主要论述的课题。?

2. 某种实验研究的直接目的和结果。?

3. 临床疾病的预防、诊断、治疗等重要的手段、方法及创新。?

4. 一篇文章中篇幅占得较多的内容。?

5. 尽管篇幅不多,但材料新、有创见并为读者所关心的内容。?

6. 词表和标引规则中规定作为一级标引的概念。?

7. 一级标引词用加权符号*表示。?

例:*肝疾病?

肝疾病/*治疗?

   *肝疾病/诊断?

二级标引?

1. 是文献论述的次要主题。?

2. 有时是一级标引的组配标引词。?

3. 为了某种研究目的所提供的载体、条件、方法和手段。例如;某种动物的去势、疾病的化学诱导,同位素标记,人工造瘘,胸腺切除等等。?

4. 治疗学中药物的剂型、剂量、投药方式等。?

5. 文献中的一般特征或附加成分。例如:地名、时代、文献类型、语种等。?

6. 计算机检索的特征词如:人类(包括性别、年龄组)、动物(如:大鼠、小鼠、狗、猫)

7. 词表中规定应作为二级标引的主题词,如对两种病的鉴别诊断,除在各疾病后组配/诊断外,还要标诊断,鉴别。?

不要标引的内容?  

1. 文中提到的常规技术,也未加以讨论,大家已熟知的东西。如;一篇关于心脏病诊断的文章,提到常规的心电描记术;一篇关于糖尿病的文章,提到葡萄糖耐量试验;在组织学和细胞学中,提到常规的显微镜应用等。?

2. 研究工作用的载体在处理中所采用的方式、方法及其数量等。?

3. 文中未加讨论或作者考虑不够成熟的某种概念,如一篇关于氨基酸的文章中提到某种新的,未加证实的氨基酸。?

4. 临床上构成一种变化不定的、不明显的症状群。?

5. 一些非历史性文章中有关历史背景的说明。?

 

MeSH的主题结构和种类

 

①主题词(Descriptors/Main Heading): 主题词用以表达主题事物和内容,该类词是MeSH的核心,主题词可以有单词、短语和倒置等形式。

单词主题词:Microtomy(超薄切片法), Plasmids(质粒),  

短语主题词:Microspora Infections(微孢子门感染), 

倒置主题词:Microscopy, Electron(显微镜,电子)

②限定词/副主题词(Qualifier/ Subheading: 限定词或称作副主题词只能与主题词组配使用,提供一种将某主题词特指方面相关文献集中的方法。

③出版类型词 (Publication TypesPT): 出版类型词代替原来的资料副主题词(form subdivision,1999年开始使用,出版类型词描述款目的特征即类型是什么,该类词用于机检系统中对检出文献进行限定。

④地理词(Geographics):地理词包括大陆、地区、国家、州和其它地理部分,在树结构表中的Z类列出,但字顺表中不包含这类词。地理词可用于机检系统中对检出文献进行限定。

⑤款目词(Entry term)或“见”参照see references):款目词主要是主题词的同义词,包括主题词词形、词序以及拼写的不同形式,或是主题词的相关参照词。正式标引以及生成各种标目均不用款目词。在机检系统中,款目词词表是强化MeSH词典的一种方式。

 

MeSH的选词原则和标引方法

 

标引常见的、文献特指的、且词表中可直接查到主题词的概念比较容易,但有些新概念、复合概念以及词表没有专指的主题词或款目词,进行主题标引就有一定的难度。MeSH对这类情况提供了三种标引方法:                                  

①组配: 即采用两个或多个主题词标引,如空肠炎(jejunal enteritis),可以用“空肠”(jejunal和“肠炎”(enteritis这两个主题词表示。

②主题词限定: 是指用规定的副主题词与主题词组合使用,如单胺氧化酶缺乏可以表达为“单胺氧化酶/缺乏”Monoamine Oxidase/deficiency)。

③ 先组主题词标引: 先组主题词实质是主题词与主题词组合表达的概念,由于这种概念的文献量多,使用频率高,将这种组合定为正式主题词,词形也发生了变化。MeSH中有大量这类词,如“肝糖原”(Liver Glycogen)“胸外科学”Thoracic Surgery),“心脏移植”(Heart Transplantation),“心肺转流术”(Cardiopulmonary Bypass)等。为避免应该使用先组词时误用限定词,NLM增加了一类注释,即限定注释 (详见:MeSH的参照系统 ② 注释)

④ 使用顺序:在对医学文献信息资源进行主题标引时,MeSH对提供的三种标引方法规定了使用顺序,即首选先组主题词,次选主题词限定,最后才用组配的方法。这种首选先组、次选限定、后选组配标引方法的选词原则,适用于所有采用MeSH进行主题标引的数据库系统,而不管是书目数据库、期刊论文文献数据库或是药学、循证医学、艾滋病等其它专题性数据库。

 

标引实践证明,标引误差很多与主题分析有关。

 

有人曾专门做过这方面的调查,发现造成标引误差的因素中有40%与主题分析有关。而且值得强调的是,由于不遵守标引规则而形成的误差,往往可以在审核时发现和纠正。但是由于主题分析不准确所形成的标引误差,一般是难以发现的。主题分析是标引的第一步,也是最为重要的一步。

 

主题分析的误差?

  ?

主题分析是标引工作的关键环节,主题分析的结果又是标引的重要依据。主题分析的好环,直接关系到文献的标引质量和检索的效果。如果主题分析不当,即使选词最好,也会影响标引和检索的效果,降低文献检索工具的查全率和查准率。因此,在进行主题分析时,必须注意防止和消除各种主题分析的误差。所谓主题分析误差,是指在主题分析过程中所产生的人为性误差。主题分析的误差有两种:?

1. 提炼误差:这是指从文献中提炼出来的主题概念及其数量,同文献本身所具有的主题概念及其数量之间的差异。这里包含两层意思:一是提炼与分析出的主题概念是错的,与原文献不符;二是提炼与分析出的主题概念比原文献少了或多了。?

2?取舍误差:这是指标引人员对提炼和分析出的主题概念,在选定应标引的主题概念时取舍上的误差。也就是说,应省略的没有省略,不应省略的却省略了,或省略不一致。?

上述误差,主要是由于标引人员的观点、方法和知识水平的不同所造成的。避免和分析这些误差,提高主题分析的质量水平,就必须从以下方面加以注意。?

1. 必须不断提高标引人员的专业知识水平。只有懂得专业知识,又掌握标引方法和技术的人,才能真正标引好该专业的文献。?

2. 同一标引人员标引文献的专业范围,应尽量做到相对稳定。这样做有利于提高文献标引的一致性、准确性,并大大提高主题分析的质量水平和文献标引的速度。?

3. 在标引的一般规则中,明确规定出本部门,本专业的标引范围和重点,规定统一的标引深度和检索深度,以便标引人员在对文献进行主题分析时,选定应标引的主题概念时,在取舍上有章可循。?

 

标引时,首先分析一篇文献并弄清以下问题:

?

1. 这篇文献的主要论点是什么?用户会用哪些概念去检索这篇文献??

2. 这篇文献的次要论点是什么??

3. 哪些概念是文献讨论的而不是仅仅提到??

4. 结合期刊的专业考虑,这篇文献的倾向和重点是什么?与既定的标引原则有何关系,是关于实验研究的还是临床方面的?是哪个专业的??

5. 权衡题名和文内泛指的概念和专指的概念,何者更为重要??

6. 选作标引的概念是否根据文献的实质内容而不是根据标引人员个人的或主观的评价??

 



https://m.sciencenet.cn/blog-280034-576891.html

上一篇:六一儿童节,哪儿好玩?
下一篇:二手烟对人体健康有哪些严重危害?

0

发表评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-17 07:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部