

tag 标签: 共词分析


版块 作者 回复/查看 最后发表



rbwxy197301 2020-7-29 09:50
Keyword‑citation‑keyword network: anew perspective ofdiscipline knowledge structure analysis QikaiCheng 1,2 · JiaminWang 1,2 · WeiLu 1,2 · YongHuang 1,2 · YiBu 3 Received: 11 September 2019 / Published online: 25 June 2020 © Akadémiai Kiadó, Budapest, Hungary 2020 Abstract This paper proposes keyword-citation-keyword (KCK) network to analyze the knowledge structure of a discipline. Diferent from traditional co-word network analysis, KCK net work highlights the importance of keywords assigned in diferent articles, as well as the semantic relationship between keywords in various articles. In this study, we select com puter science domain as an example to illustrate the proposed method. Meanwhile, the results of network analysis, PageRank analysis, and research topic analysis are compared with those of traditional co-word analysis. A total of 110,360 articles with 164,146 unique keywords and 1,615,030 references collected from ACM digital library have been used for this empirical study. The results demonstrate that KCK network outperforms in detecting indirect links between keywords with higher semantic relationship, identifying important knowledge units, as well as discovering the topics with greater signifcance. Findings from this study contribute to a new perspective and understanding for elucidating discipline knowledge structures, and provide guidance for applying this method in various disciplines. Keywords: Keyword-citation-keyword network· Co-word network· Knowledge structure· Cluster analysis· Network analysis Scientometrics (2020) 124:1923–1943 https://doi.org/10.1007/s11192-020-03576-5
个人分类: 学术期刊|2082 次阅读|0 个评论
rbwxy197301 2017-3-15 11:36
Improving the co-word analysis method based on semantic distance Jia Feng• Yun Qiu Zhan1• Hao Zhang Received: 24 July 2016  Akade´miai Kiado´ , Budapest, Hungary 2017 Abstract: We propose an improvement over the co-word analysis method based on semantic distance. This combines semantic distance measurements with concept matrices generated from ontologically based concept mapping. Our study suggests that the co-word analysis method based on semantic distance produces a preferable research situation in terms of matrix dimensions and clustering results. Despite this method’s displayed advantages, it has two limitations: first, it is highly dependent on domain ontology; second, its efficiency and accuracy during the concept mapping progress merit further study. Our method optimizes co-word matrix conditions in two aspects. First, by applying concept mapping within the labels of the co-word matrix, it combines words at the concept level to reduce matrix dimensions and create a concept matrix that contains more content. Second, it integrates the logical relationships and concept connotations among studied concepts into a co-word matrix and calculates the semantic distance between concepts based on domain ontology to create the semantic matrix. 本文提出了一种基于语义距离的共词分析方法改进方法。本文把语义距离测度和基于概念地图生成的概念矩阵综合在一起。该研究表明,根据矩阵维度和聚类结果的基于语义距离的共词分析方法产生了一个较为理想的结果。这种方法有一定的优势,但也有两个方面的局限。首先,它高度依赖于领域本体,其次,在概念地图形成的有效性和准确性还有待进一步研究。这种方法在两个方面优化了共词矩阵。首先,把概念地图应用到共词矩阵的标签中,它把词在概念水平进行了结合,降低了矩阵的维度,而且生成了一个包含更多内容的概念矩阵。其次,它把逻辑关系的概念的内容有机整合之后形成一个共词矩阵,通过基于领域本体计算概念间的距离,然后生成语义矩阵。 Keywords: Co-word analysis  Semantic distance  Concept mapping  Semantic matrices Improving the co-word analysis method based on semantic distance.pdf
个人分类: 研究方法|2414 次阅读|0 个评论
rufenghaiyun 2015-6-2 19:29
1 定义 共词分析(Co-word Analysis)是通过对反映文献主题内容的关键词进行统计分析,研究文献内在联系和科学结构。 2 流程 2.1 确定分析问题 2.2 确定分析单元 一种是从关键训列表、标题、摘要等进行提取;另一种数据收集方式则是利用专门的语词提取软件直接从全文抽取。 2.3 高频词的选定 高频词的确定主要有两种方法:一种是结合研究者的经验在选词个数和词频高度上平衡,该方法具有一定的主观性;另一种是结合齐普夫第二定律辅助判定高频词的界限。 2.4 计算共词频率,得到共词矩阵 在共词分析中,为方便词对共现频率的运算。设计共词矩阵,对于N个高频词的共词分析中,便形成一个N-N的共词矩阵。共词矩阵的计算方法有如下几种:包容指数法、临近指数法、相互包容系数法。 2.5 对共词矩阵进行处理,揭示共词信息 常用的分析方法如下。 (1)共词聚类分析法 借助数据挖掘中的聚类分析法,对共词关系网络中的词与词之同的距离进行数学运算分析,将距离较近的主题词聚集起来,形成一个个概念相对独立的类团。类团分析是共词聚类分析的核心内容。 (2)共词关联分析法 在共词关联分析的过程,涉及到4个重要的概念:支持度、置信度、期望可信度、作用度。 (3)共词词频分析法 词频分析法是利用能够揭示或表达文献核心内容的关键主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量方法,是定性分析法的一种。 (4)突发词监测法 突发词监测是Kleinberg于2002年提出话题的突发监测(Brustdetection)算法,它关注焦点词一相对增长率突然增长的词。基于单个词的词频增长率变化更有可能涉及到领域局部热点的变化。 3.分析软件 可以用浙江大学刘启元开发的SATI软件生产共词矩阵,再利用Ucinet或spss进行分析。 4 应用领域 (1)揭示特定领域内的研究丰题及其层次之间的关系,以及其对应的研究方向问的关系,划分科学子研究领域并确定其研究结构; (2)从横向和纵向角度揭示特定领域内研究主题之间以及同其他研究主题之间的关系; (3)考察特定研究领域内研究主题发展的历史脉络及其子领域的演进态势; (4)通过词间关系的数据挖掘达到学科主题知识发现的目的。 参考文献 钟伟金,李佳.共词分析法研究(一)——共词分析的过程与方式 .情报杂志,2008,27(5):70-72. 李颖,贾二鹏,马力等.国内外共词分析研究综述 .新世纪图书馆,2012,(1):23-27.
个人分类: 信息计量|5286 次阅读|0 个评论
热度 3 delphi1987 2015-5-31 01:12
马上要毕业了,趁此机会将博士期间研究做一个梳理;今后工作不知是否还可延续,因此也是一种留念。 博士期间主要研究为共词分析方法优化,在此方面发表近10篇论文,均是方法改进性质的研究,自认为都不是灌水文,对得起自己的学术理想。 论文可归纳为一个体系,包括: 1:基础研究:通过实验梳理科技论文关键词特点、关键词网络结构特点,发现问题,寻找启示,为后续改进指明方向。主要有论文2篇: 《 科技论文关键词特征及其对共词分析的影响 》,刊于情报学报;《 科研领域关键词网络的结构特征与启示 》,刊于现代图书情报技术; 考虑到共现矩阵的行、列分别代表分析对象、特征项;从这两个方面入手是改进共词分析的突破口,于是做了以下两个方面研究: 2:在 1基础上衍生出,从特征项选择(共词矩阵的列)方面优化共词分析。目前有论文1篇,《 共词分析中的词语贡献度特征选择研究 》,刊于现代图书情报技术;这方面还有很多研究空间;后续一段时间内会投入更多精力来研究; 3:在1 基础上衍生出,从分析对象选择(共词矩阵的行)方面优化共词分析。目前来看,一个比较好的思路是:分析一个研究领域(或者研究群体,比如机构)时,不能只孤立地看它自身情况;而是要把它放在更大的背景内考察(比如所属学科)。目前有5篇论文: 《 Selecting publication keywords for domain analysis in bibliometrics: A comparison of three methods 》刊于 Journal of Informetrics; 《 Identifyingthe research focus of Library and Information Science institutions in Chinawith institution-specific keywords 》刊于scientometrics;《 领域知识分析中的关键词选择方法研究——一种以学科为背景的全局视角 》刊于情报学报;《 基于特色关键词的科研机构研究主题揭示:方法与实证 》、《 全局视角下的科研领域特色知识点提取 》均刊于图书情报工作;总的来说,这种思路效果很不错。 除2和3之外,考虑到共词网络的结构特点,可以从层次结构视角来看共词网络,这与目前计量分析中普遍采用的划簇(比如聚类、网络子群划分)有很大的区别,但是它实际上更符合人们对知识体系结构的认知。 相应地有以下方面研究: 4:在1基础上衍生出,从关键词网络的层次结构发现方面优化共词分析,目前有3篇论文,《Exploring the Topic Hierarchy of Digital Library Research in China using Keyword Networks: A K-core Decomposition Approach》近期录用于Scientometrics,《 领域知识网络的层次结构与微观形态探证 》刊于情报学报、《 层次视角下概念知识网络的三元关系形态研究 》刊于图书情报工作。 真的很希望有更多的人关注方法优化。 有学术理想的师弟师妹们,不要再拿一成不变的工具和方法换分析领域灌水了。 打破的是枷锁,得到的是世界啊 。
个人分类: 论文交流|6294 次阅读|6 个评论
rbwxy197301 2014-1-29 11:51
Inte gration of three visualization methods based on co-word analysis Ying Yang , Mingzhi Wu , Lei Cui Library of China Medical University;;Library of Shenyang Pharmaceutical University;;Department of Medical Informatics and Information System,China Medical University Scientometrics , 2012, Vol.90 (2), pp.659-673 Springer期刊 DOI:10.1007/s11192-011-0541-4 keywords: Coword visualization;Cluster tree;Strategic diagram;Social network map;Integration Abstract Visualization of subject structure based on coword analysis is used to explore the concept network and developmental tendency in certain field. There are many visualization methods for coword analysis. However, integration of results by different methods is rarely reported. This article addresses the knowledge gap in this field of study. We compare three visualization methods: Cluster tree, strategy diagram and social network maps, and integrate different results together to one result through coword analysis of medical informatics. The three visualization methods have their own character: cluster trees show the subject structure, strategic diagrams reveal the importance of topic themes in the structure, and social network maps interpret the internal relationship among themes. Integrati on of different visualization results to one more readable map complements each other. And it is helpful for researchers to get the concept network and developmental tendency in a certain field. 基于共词分析的主题结构可视经常常用来探索特定领域 概念网络及其发展趋势。共词分析可视化的方法有很多种。但是,不同方法结果的整合研究还比较少见。本文将关注这些研究是的知识差异。我们三种可视化方法:聚类树、战略座标图和社会网络图,并且以 医学信息学共词分析为例, 将不同结果进行了整合。这三种方法各有特点:聚类树可以显示主题结构;战略座标图可以揭示出主题在结构中的重要性;社会网络可以用来解释主题之间的相互联系。不同可视化法的整合可以充分利用各自的优势。它有助于研究者了解特定领域的概念网络及其发展趋势。
个人分类: 研究方法|4686 次阅读|0 个评论
热度 2 terahertz 2013-3-30 21:48
( 本文发表在《科技管理研究》2013年第23期 ) 中国专利学位论文研究热点的共词分析 刘琼, 刘桂锋 ,刘红光 摘要 : 选取中国知网硕博学位论文数据库中的专利学位论文 , 利用文献计量分析对专利硕博论文的外在特征进行归纳分析,重点提取专利硕博论文的关键词进行共词分析,并结合分层聚类、多维尺度分析和关系网络可视化分析等情报学分析方法,对专利硕博学位论文的研究现状、研究热点及研究趋势进行了多方面的讨论。 关键字: 专利;学位论文;共词分析;分层聚类;多维尺度分析;关系网络可视化分析
个人分类: 发表论文|4122 次阅读|6 个评论
zilu85 2008-10-14 02:20
Stegmann and Grohmann Stegmann and Grohmann 通过运用共词技术拓展了 SL 方法,这是一种用于聚类的统计学方法。他们不使用单词或者概念,而是分析文献集合中每对 MEDLINE 文献的关键词共同出现次数。关键词包括 MeSH 以及酶标记号和 CAS 注册号。这些分析最后生成了所包含关键词的地图或者战略坐标。链接互补又分离文献的 promising( 有希望的 ) 词倾向于出现在低向心度和密度的区域。通过复制 Swanson 在雷诺氏病和鱼油关系、偏头痛和酶缺乏上面的发现,验证了他们的方法的有效性,他们还发现朊病毒、神经变性疾病和锰之间的关系。这种关系早期曾经由 Chen 在研究知识潜在领域问题的时候提出过。之所以叫潜在,是因为在陈的关于知识地图的书中这是些被引频次低的重要论文。 共词分析和聚类的优点在于研究初期选词是自动化的。但是,专题的专家还是要为了最后选择合适的词而评判一下各个类别。共词聚类的另外一个优点是用户对类别的地图或者坐标评价起来要比评价一长串排序的词要容易得多。其缺点是这种方法依赖于来自于受控词表的关键词。其他挖掘标题和文摘的方法更适合没有关键词的方法。此外,这种考量在将来研究人员需要合并没有统一主题词表的数据库并在其中挖掘信息的时候会显得十分重要。 Gordon MD, Lindsay RK. Toward discovery support systems: a replication, re-examination, and extension of Swanson's work on literature-based discovery of a connection between Raynaud's and fish oil. Journal of the American Society for Information Science. 1996; 47 :116128
个人分类: 生物医学文献计量学|4515 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-17 11:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社
