eldennie的个人博客分享 http://blog.sciencenet.cn/u/eldennie

博文

Citespace简单使用教程

已有 37081 次阅读 2015-6-7 16:28 |个人分类:知识图谱|系统分类:科研笔记|关键词:学者

具体操作可看The CiteSpace Manual 的论文。下面是我自己理解将数据可视化部分的简单用法。


1、聚类

   聚类能更精准的分析领域里研究方向和热点的分类。

   首先点击首行菜单栏的,然后窗口的右上角看到#clusters就代表聚类完成。左上角显示的是整个聚类网络的一些特性。参数modularity和mean silhouette是告诉我们整体框架的特征的重要参数。例如modularity q = 0.7141代表指数高,整个网络是被分为了松耦合的集群。mean silhouette = 0.5904代表所有集群的同质化程度平均都不高也不低。

   通过点击,可以看到每个聚类集群的情况。Silhouette列代表聚类集群的同质性。假设所有聚类集群的大小一样,Silhouette值越高,那个聚类集群里的成员越一致。如果某个聚类集群的容量太小,高同质化参数是没有意义的。average year of publication代表是最新的论文形成的还是老的论文形成的。


2、生成聚类的标识

   CiteSpace 可以从文章标题,关键词列表,摘要三个方面标识论文。聚类标识按照聚类集群的容量降序排列的。为了能更清晰的看到聚类标识,可以选择改变如下:


3、主要研究领域

   为了完整清晰呈现主要研究领域,将有些细节可以隐藏


    图中的1、2、3刚好对应下面的(1)、(2)、(3)

(1)节点大小


(2)集群标识大小

根据标识的大小决定是隐藏还是显示,或者改变标识里的字体的大小

(3)连接的透明度


4、主要研究领域的关联

  为了弄清楚这个,我们需要在图中恢复连接。CiteSpace用紫色线来标明高连接度的节点。色彩越往紫色走,代表连接度越高。通过点击

第一个符号的菜单,就可以看到连接的线。


5、最活跃的研究方向

在CiteSpace里的爆发点检测算法是Kleinberg 算法。  

可以生成爆发点的总结图。通过图可以看出是从哪些文献开始爆发的,并且发生在什么时候。这方法也可以运用到其他节点类型上。


6.主要的研究领域是研究什么的

  为了更深入地研究各个集群,可以点击


然后会出现一个装有四个面板的窗口:1、Clusters,2、Citing Articles.3、Cited References,4、Summary Sentences。

只有你点击Clusters,2、3才会出现内容。

Citing Articles:每一条是指引用了这个Cluster里的一篇论文的论文,每条前面的数字代表引用的比例即引用了这个集群的多少程度。黄色标明的那个词语就是在整个可视化图里显示的那个词语,同时它也在top terms里。

Cited References:代表了自己的集群引用的文章。前面的数字代表引用的次数。同时还给出了文章的其他信息。

Summary Sentences:点击开始按钮,然后会抽取这个集群里所有摘要中最有代表性的句子


7、时间线视图


点击右侧的Timeline单选按钮,然后你就能看到水平线上的各个集群视图。




https://m.sciencenet.cn/blog-2602259-896205.html

上一篇:知识图谱研究分析总结
下一篇:社会网络分析中的数据挖掘综述

0

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-11-29 08:18

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部