许培扬博客分享 http://blog.sciencenet.cn/u/xupeiyang 跟踪国际前沿 服务国内科研

博文

我国信息组织相关文献计量分析

已有 5333 次阅读 2010-12-13 10:28 |个人分类:信息分析|系统分类:论文交流|关键词:学者| 信息组织, 信息分析, 文献计量分析

我国信息组织相关文献计量分析
李阳[1]  
 [摘要]目的:通过对1982-2009年我国信息组织相关文献的统计分析,使国内相关领域的科研人员对我国现阶段信息组织的研究现状及发展趋势能够有一个更为全面、清晰地了解,从而更好地把握其研究方向。方法:利用文献计量学方法,采用NoteExpressTDA两款信息分析软件,对万方数据知识服务平台收录的国内信息组织相关文献的时间、著者、期刊、机构进行分析;同时利用关键词词频分析法,对国内信息组织研究有关的论文开展主题及研究热点分析。结果:万方数据库(网络版)在1982-2009年间共收录信息组织研究文献952篇;武汉大学发文量最多,是开展信息组织相关研究的最核心机构;知识组织、数字图书馆、情报检索语言等是当前研究的热点,竞争情报、学科信息门户及神经网络等领域是未来的发展趋势。结论:现阶段我国信息组织相关研究的总体发展趋势良好,基础理论研究与应用研究并重,涉及多个学科领域,并逐步向一些热门领域发展,其潜在价值仍有待人们进一步的发掘。
[关键词] 信息组织;文献计量分析;NoteexpressTDA;词频分析法
Analysis of Literatures Relating to Information Organization in our Country
Li Yang
Inistitute of Medical Information,Chinese Academy of Medical Sciences,Beijing 100020,China
[Abstract] Objective: The paper aims to make domestic researchers have a more comprehensive and clearer understanding on the research status at present and development trend of information organization in our country by analyzing literatures published from 1982-2009,so that the researchers can better grasp research direction. Methods: The literatures on information organization were searched in WangFang database,and by using bibliometric method as well as Noteexpress and TDA,the publishing years,the first authors and their institutes,the publishing journals of the literatures were analyzed. Themes and hot topics were analyzed by using keywords frequency analysis method. Results: A total of 952 literatures were searched in WangFang database;The papers from WuHan University were in the largest quantity;At the present hot topics are knowledge organization,Digital library, information retrieval language and so on;Competitive intelligence,subject information gateway and neural network are future development trends. Conclusion: The overall development trend on information organization in our country is good;Both of basic theoretical and application researches involving multiple disciplines attract much attention, which gradually develop into some popular areas and their potential value is still to be further explored.
[Keyword] Information organization; bibliometrics; Noteexpress; TDA; Word frequency analysis method
1 引言
信息组织是一种由来已久的人类社会实践活动,在其发展历程当中,通过不断地汲取相关学科的理论(如系统理论、耗散结构理论、协同理论及突变理论等)和方法,来使自己逐渐得到充实和完善[1]1987年,成都科技大学滕福生教授从电力管理信息系统的角度初步探讨了信息组织的相关理论[2]1997年,宋彩萍和霍国庆明确提出了信息组织的定义,将处于无序状态的特定信息,根据一定的原则和方法,使其成为有序状态的过程,其目的是将无序信息变为有序信息,方便人们利用信息和有效地传递信息[3]
随后,图情领域的专家学者们针对信息组织这一概念分别给出了自己的理解。南京空军政治学院戴维民教授从宏观的角度将信息组织阐释为一种通过一定的工具和技术将无序的信息组织成一个有序系统的方法,并从信息组织方法的发展历程角度强调了信息组织的重要性和有效性[4];北京大学信息管理系马张华教授从微观的角度对信息组织做出如下阐述[5]所谓信息组织,亦称为信息资源组织,是根据使用的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等进行分析、选择、处理、序化,并以适当的方式加以提供的活动。
此外,还有许多学者从不同的角度提出了自己对信息组织这一概念的理解[6-12]。上述定义虽然表述略有不同,但存在一个共同之处,即信息组织是一个序化过程,其目的在于方便人们对信息的有效利用。
    本文采用基于数量统计的文献计量学方法,以万方数据库(网络版)为数据源,对国内20多年来的信息组织研究文献进行了一个系统的分析,使国内相关领域的科研人员能够对我国目前信息组织的研究现状、热点及发展趋势有一个全面、清晰地认识和了解,从而更好地把握信息组织的研究方向,为未来的研究打下一个坚实的基础。
2 材料与方法
2.1 资料来源
万方数据知识服务平台由中国科技信息研究所(北京万方数据股份有限公司)开发。目前,全新改版的万方数据资源系统共收录70多个类目共6000余种期刊(其中绝大部分是进入中国科技论文统计源的核心期刊)[13],同时汇聚了9大类100多个数据库的上千万条数据资源,涵盖了社会科学、自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等各个领域的学科资源,可谓是包罗万象,且数据每日更新,检索时间回溯至1982年,故本文选择万方数据知识服务平台检索系统作为检索对象,可使随后的分析结果更加科学、客观、全面。
2.2 方法
由于标题是一篇论文不可或缺的重要组成部分,是论文核心内容的简明概述,是表达论文主题概念的自然语言词汇[14],具有言简意赅的特点,因此本文拟利用检索式信息组织 or 知识组织 or 检索语言 or 情报组织,在标题字段中进行相关文献的检索;然后利用Noteexpress软件对检索结果进行去重[15],并辅助人工筛选,从而可使检索结果更为精确。此外,在文献分析中,数据的准确性是影响最后分析结果是否客观的一个重要因素[16]因此在开展具体的数据分析之前,应首先利用Thomson Data Analysis(以下简称TDA的数据清洗功能,对著者、机构等字段进行规范,使文献格式更加规范化,便于进行下一步的分析。本次检索时间范围是1982-2009年,检索时间为2010-09-19,数据库更新时间截止到2010-9-16
3 结果与分析
经过Noteexpress软件去重及人工筛选,最后得到文献952篇。以下笔者将利用TDA软件对这952篇文献进行具体地统计分析:
3.1 文献类型分析(见表1
    从表1可以看出,期刊仍然是信息组织领域的主要文献来源;而博硕士论文虽然数量有限,但却对信息组织的相关问题及内容进行了深入研究和探讨。在90篇会议文献中,全国第四次情报检索语言发展方向研讨会、全国计算机信息管理学术研讨会等五次会议论文共46篇,占会议论文总量的51.1%(具体情况见表2),其它44篇文献共出现于28次学术会议上。从中可以看出,信息组织涉及信息学、管理学、计算机技术、网络通信技术以及图书馆学等多个领域。会议论文从总量上看虽不多,但多涉及信息组织的前沿研究领域,同样对信息组织的发展产生了极为重要的作用。
国内信息组织相关文献类型分布

文献类型
期刊文献
会议文献
学位论文
硕士    博士
文献量(篇)
790
90
 61      11
百分比(%
83.0
9.4
    6.4     1.2

 
国内信息组织会议文献量排名前5的会议

会议名称
文献量(篇)
百分比*%
全国第四次情报检索语言发展方向研讨会
15
16.7
全国计算机信息管理学术研讨会
10
11.1
信息化与信息资源管理学术研讨会
8
8.9
图书情报工作研究会学术研讨会
7
7.8
中国图书馆学会年会
6
6.7

*注:百分比为各项会议文献占会议文献总量的百分数。
3.2 文献时间分布(见表3
    从表3可以看出,信息组织相关文献的发文量基本呈逐年上升趋势,其中2006年发文量最高,达120篇;随后文献量稍有下降,但变化不大,呈稳定的波动趋势。1987年出现的信息组织相关文献是成都科技大学滕福生教授撰写的1篇会议文献[2],随后相关文献不断出现在期刊杂志及学术会议中,且数量也不断增加。1991年出现了1篇与信息组织相关的博士学位论文[17]随后与信息组织相关的博硕士论文相继出现,从不同角度对信息组织领域的多项问题(如数字图书馆、建立语义知识库、半结构化信息组织技术等)进行了深入阐述。信息组织成为博硕士学位论文的重要选题从一个侧面反映其被研究人员的关注程度明显增强。
国内信息组织相关文献时间分布

序号
年份
文献量(篇)
百分比(%
1
2006
120
12.6
2
2008
113
11.9
2
2005
113
11.9
4
2007
101
10.6
5
2003
98
10.3
6
2004
95
10.0
7
2009
86
9.0
8
2002
77
8.1
9
2001
65
6.8
10
2000
29
3.0
11
1999
23
2.4
12
1998
17
1.9
13
1993
3
0.3
13
1991
3
0.3
15
1997
2
0.2
15
1996
2
0.2
15
1995
2
0.2
15
1994
2
0.2
19
1987
1
0.1

3.3 文献著者分布(仅统计第一著者,见表4
   对标有著者字段的941篇文献进行分析,分析结果如下:表4可见发文量在五篇以上的作者,这些作者可以被认为是国内信息组织领域的核心作者。此外,在941篇文献中,第一作者共有713人,由此可见,信息组织相关研究既有稳定的核心作者群,又有着广泛的群众基础[18]在此需要说明的一点是发文量这一指标仅能说明发文数量的多少,而无法衡量论文影响力的高低,即著者论文的被引用次数,因此本文的统计结果存在着一定的局限性,仅供参考之用。
4国内信息组织相关文献著者(第一著者)分布

第一著者名
单位
发文量(篇)
周九常
郑州航空工业管理学院
14
黄如花
武汉大学,信息管理学院
9
白海燕
中国科学技术信息研究所,北京
8
王知津
南开大学商学院信息资源管理系,天津
8
王军
郑州大学图书馆,河南
7
白华
郑州大学信息管理系,河南
6
文榕生
中国科学院,文献情报中心,北京
6
李秀云
郑州大学工学院图书馆,河南
6
李国秋
华东师范大学商学院,上海
5
牟冬梅
吉林大学公共卫生学院医药信息学系,长春
5
司莉
武汉大学信息管理学院,武汉
5
张晓林
中科院文献情报中心
5
郑贵宇
三峡大学图书馆,湖北
5

3.4 文献期刊分布(见表5
    由表5可见,790篇文献共登载于212种期刊,其中载文量排名前20位的期刊均为国内图情领域的重要期刊,共刊载文献504篇,占期刊文献总量的63.8%《图书情报工作》、《情报杂志》、《情报科学》、《中国图书馆学报》、《情报理论与实践》、《现代情报》等期刊刊载信息组织方面的论文均在20篇以上,已形成了信息组织相关论文的核心期刊群,可以为相关研究人员投稿提供一个参考。此外,通过对全部期刊的一个初步分析,可以发现信息组织做为图情领域的一个分支学科涉及医学、计算机、经济、军事等多个领域,充分显示其涵盖内容广泛,受到了越来越多的关注。
 
 
国内信息组织相关文献所在期刊分布

序号
期刊名称
文献量(篇)
百分数*(%)
1
图书情报工作
69
10.0
2
情报杂志
48
7.0
3
情报科学
39
5.7
4
中国图书馆学报
34
4.9
5
情报理论与实践
32
4.6
6
现代情报
32
4.6
7
情报资料工作
29
4.2
8
现代图书情报技术
27
3.9
9
科技情报开发与经济
23
3.3
10
情报学报
18
2.6
11
图书馆理论与实践
17
2.5
12
情报探索
16
2.3
13
图书馆杂志
16
2.3
14
图书情报知识
16
2.3
15
图书馆论坛
15
2.2
16
图书馆学刊
12
1.7
17
图书与情报
12
1.7
18
图书馆建设
11
1.6
19
图书馆学研究
11
1.6
20
大学图书馆学报
9
1.3
21
江西图书馆学刊
9
1.3
22
图书馆
9
1.3

*注:此处百分比为占期刊文献总数的百分比。
3.5 文献著者(第一著者)机构分布(见表6
对标有著者地址字段的920篇文献进行统计分析,由表6可见,国内共有14所机构发文量大于10篇,其中高校12个,研究机构2个。武汉大学在信息组织研究领域占有绝对的核心地位,其文献量遥遥领先,发文量占到统计总量的9.0%;其次是华中师范大学,也是位于武汉,从而在一定程度上可以表明武汉在信息组织领域是一个核心地区。此外,统计结果表明,高校是目前国内开展信息组织相关研究的主体,而科研院所除中科院、中信所、医科院、农科院等大型研究所之外,其余院所发文量均较少。信息组织是一门应用价值很高的学科,而高校的研究大多集中于基础理论性研究,缺少应用研究。笔者认为随着时间的发展及人们对信息组织应用价值的认识和重视,应用研究必将在信息组织研究中占据越来越重要的地位。
国内信息组织相关文献著者机构分布

序号
机构名称
文献数(篇)
百分数*%
1
武汉大学
83
9.0
2
华中师范大学
27
2.9
3
中国科学院
26
2.8
4
吉林大学
21
2.3
4
北京大学
21
2.3
4
南京政治学院
21
2.3
4
郑州大学
21
2.3
8
南开大学
19
2.1
9
中山大学
14
1.5
10
南京大学
12
1.3
11
南京农业大学
11
1.2
11
中国科学技术信息研究所
11
1.2
11
中南大学
11
1.2
11
郑州航空工业管理学院
11
1.2
11
国防科技大学
11
1.2

3.5 文献关键词词频分析(见表7
词频分析法是指利用能够揭示或表达文献核心内容的关键词或主题词在某一研究领域的文献中出现频次高低来确定该领域研究热点和发展动向的一种文献计量方法[19]。某个关键词或词组出现的越频繁,表明该领域对这个概念的关注度越高,该主题就有可能是这个领域的一个热点[20]。由于万方数据库未对文献进行主题标引,无法统计主题词的词频,因此,本文采用关键词词频分析法来探究信息组织领域的研究热点及发展趋势。
国内信息组织相关文献关键词词频分布

序号
关键词
频次*
1
知识组织
215
2
检索语言
102
3
数字图书馆
73
4
分类
71
5
本体
49
6
网络信息组织
46
7
网络环境
44
8
竞争情报
38
8
语义网
38
8
元数据
38

*注:已将同义词、近义词的出现频次进行合并,此处所列频次是指各个近义词或同义词的频次之和。
7可见,包括博硕士论文、会议论文在内的729篇论文中,共出现关键词500余个(233篇文献没有标注关键词;一篇文献可以包含若干个关键词,一个关键词可以出现在多篇文献中;排除了信息组织、利用、地位等无实际意义的关键词),本表列出了出现频次排名前十的关键词,从中可以看出,知识组织是目前信息组织领域最为活跃的研究热点,是信息组织的高级形式,正朝着自动化、智能化及集成化的方向发展;其中XML、本体、元数据、语义网及知识挖掘等均属于知识组织的范畴,是研究网络信息组织的重要技术和工具。情报检索语言作为近现代信息组织的一项重要工具,其重要性也毋庸置疑。利用web2.0技术对网络信息资源进行合理构建、搜集、组织、利用及共享的数字图书馆在信息组织应用中占据了较大的比重,表明我国信息组织的应用研究正在逐渐加强。此外,竞争情报、学科信息门户、神经网络等热门领域也日益受到信息组织研究人员的关注和重视,表明信息组织领域隐含的经济及社会效益已经激发了人们的研究热情。
4 结语
通过以上文献计量学的统计分析,可以看到现阶段我国信息组织相关研究的总体发展趋势良好,基础理论性研究与应用研究并重,涉及多个学科领域,并逐步向一些热门领域发展,其潜在价值仍有待人们进一步的发掘。此外,通过文献来分析国内信息组织的研究热点,一方面会受到文献质量的影响,另一方面也会受到标引质量的影响。如果文献质量不高,或者文献标引不规范,那么分析结果必然受到影响[21]。另外,数据库收录文献的时滞性也是一个不可忽视的问题。因此,本文的研究结果只能为相关研究人员提供一些参考依据,为其选择研究方向提供一些借鉴。若想进一步了解一些具体问题,还需咨询信息组织领域的一些专家学者。
需要说明的是,由于文献计量统计是一种纯定量的研究方法,因此本文所得到的只是一种描述性的解说,而并非是一种定性的推断性的结论[22]。未来的研究将会随着数据的积累和完善,信息组织领域自身的发展和成熟,以及文献计量方法的进一步改进,得到更深的拓展。
本文通过对国内信息组织相关文献的统计分析,使国内相关领域的科研人员对现阶段我国信息组织的研究现状及发展趋势能够有一个更为全面、清晰地了解,从而能够更好地把握其研究方向。
 
参考文献
[1] 信息组织的理论基础[EB/OL].[2010-09-24].http://baike.baidu.com/view/401761.htm
[2] 滕福生.电力管理信息系统的信息组织理论.信息管理、电力计算及数据通信学术会议论文集.中国电机工程学会信息管理、电力计算及数据通信学术会议,1987.
[3] 宋彩萍;霍国庆.信息组织论纲[J].中国图书馆学报,1997(1):20-22.
[4] 戴维民主编.信息组织[M].北京:高等教育出版社,2009.
[5] 马张华编著.信息组织= Information organization[M].北京:清华大学出版社,2008.
[6] 党跃武.信息组织论[J].图书情报工作,1997(3):12-16.
[7] 尚可聪.信息组织要论[J] .图书情报工作,1998(11):1-4.
[8] 曹树金;罗春荣编著.信息组织的分类法与主题法[M].北京:北京图书馆出版社,2000.
[9] 倪莉。信息组织研究述评[J].情报资料工作,2001(2):16-18.
[10] 冷伏海;徐跃权;冯璐主编.信息组织概论[M].2.北京:科学出版社,2008.
[11] 储节旺;郭春侠;吴昌合编著.信息组织学[M].北京:清华大学出版社,北京交通大学出版社, 2007.
[12] 周宁主编.信息组织[M].2.武汉:武汉大学出版社,2004.
[13] 万方数据库[EB/OL].[2010-11-07]. http://baike.baidu.com/view/290752.htm.
[14] 陈立新;刘则渊;梁立明.基于论文标题的学科结构研究[J].情报学报,2010(29),2:305-313.
[15] 王敏;李阳;孙晓北;许培扬;池慧.2009年甲型H1N1流感国内外文献分析研究[J];医学研究杂志:2010(39),2:98-102.
[16] 李海存;王敏;许培扬.国际单克隆抗体研究文献分析[J].预防医学情报杂志,2010(4): 298-304.
[17] 钟毓宁.机械设计与诊断的知识组织及可靠性管理[D].华中理工大学,1991.
[18] 孙燕;卢朝晖;王敏.图书馆医学信息学论文统计分析[J].中华医学科研管理杂志,2005,18(6):364-365,378.
[19] 马费成;张勤.国内外知识管理研究热点——基于词频的统计分析[J].情报学报,2006, (2):164 -171.
[20] 张士靖;周志超;杜建;谢莉琴.国内外健康管理研究热点对比分析[J].医学信息学杂志,2010(31),4:6-10.
[21] 朱坤;马明;王敏.基于文献计量学的国际社区卫生服务研究热点分析[J].中国卫生政策研究,2009(2),25-29.
[22] 马费成;宋恩梅.我国情报学研究分析:以ACA为方法[J].情报学报,2006(25),3:259-268.
 


[1] 作者单位:100020   北京,中国医学科学院医学信息研究所   研究生    导师 许培扬

 

 

 



https://m.sciencenet.cn/blog-280034-393071.html

上一篇:科研创新:高山红景天组方对糖尿病视网膜病变中PEDF抑制周细胞凋
下一篇:真正的学者 ---- 王小凡教授

1 张南希

发表评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-5 11:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部