科学网—ChaomeiChen的留言板

[57]happyyunou 2011-9-22 23:32

陈老师，您好！我今天下载了CiteSpace 3.0 R1，安放路径C:/CiteSpaceII/disc/lanch.jnlp，其他的一切运行正常。但是只要我在"Term Type"中选择“Noun Phrase”，它就提示让我下载POS的那六个文件，我也按照提示做了，把那六个文件都放在了C:/CiteSpaceII/disc/resources/wsj3t0-18-left3words下，但是仍旧不能够选用“Noun Phrase”，也不能使用“Burst Phrase”，一旦选用就会出错，但如果选择“None”就一切正常。陈老师，我该如何解决这个问题呢？谢谢老师了~

我的回复(2011-9-23 10:09)：你的disc中是否有个lib目录？

[56]WuTongtootoo 2011-9-20 12:51

陈老师您好！感谢你的CiteSpace，太牛了。用了很久了，但最近处理的数据集比较大，有些问题向您请教。
你在“如何增强CiteSpace处理数据的多少和快慢 ”一文中提到了数据集过大的处理办法，但我下载了还是会出现JVM不能创建不能运行的问题（could not create the Java Virtual Machine）啊，在我机器上修改为1500M以下有时候能够运行，有时候也不行。我在一个内存为8G的机器上试过，也是这样的情况，请问是什么原因呢？该如何解决？
还有其它几个问题向您请教：
1 您的新版本是不是去掉了按住Alt键拖动鼠标多选的功能啊？我用的这个功能好像只有2.8版本有。
2 关于可视化的聚类图每一年的颜色可以设置吗？我的数据较多，总是看不清楚。
3 可以根据节点的属性而不是勾选左侧的选定节点来决定是否显示该节点吗？

如蒙回复，不胜感激！谢谢！

我的回复(2011-9-20 20:58)：JVM如果内存已被其他应用程序占用，就会有这种情况。抢先打开CiteSpace是一种办法。
1。好像是。近似的选法可用右键选择列出同一类里的成员。
2。暂且没有这种界面。可试试增加每个时间区的长度，slice length=3, 5，10，等。
3。没有。可在表中按列排序，然后逐个剔除。以后可以考虑加上类似功能。

[55]陈超美 2011-9-14 00:35

分析功能：有。聚集系数：没有。直接标明聚类及其silhouette等。

[54]刘昆 2011-9-11 14:24

陈老师，您好。我想请问下，CiteSpace有分析功能吗，如对网络进行聚集系数分析等。

[53]clover6 2011-9-10 10:16

陈老师，谢谢您的回复。还有两个问题：第一，在节点个数问题上，一般通过设置，最后多少节点是理想的？（我目前运行时得到节点关键词308个，连线2057条）；第二，在进行时间线视图时（timeline），每一个聚类后面的名称是依据什么来标注的？（通过运行，发现有的聚类名称和研究领域联系不大）

我的回复(2011-9-10 23:00)：1. 这个问题可参考我以前的博客。主要考虑是网络结构是否能回答在比节点本身更高抽象层次上的一些问题。
2。是由引用各聚类的论文决定的，具体词组可选自论文的标题，摘要，和索引词，再由3种办法之一度量。如“联系不大”，可解释为施引/被引之间的“距离”较大，参照silhouette值。详件：
Chen, C., Ibekwe-SanJuan, F., & Hou, J. (2010) The structure and dynamics of co-citation clusters: A multiple-perspective co-citation analysis. Journal of the American Society for Information Science and Technology, 61(7), 1386-1409. 10.1002/asi.21309

[52]clover6 2011-9-9 13:33

陈老师，在时间段的选择问题上，time scling为2，选择12年和13年，数据处理过程有什么不同吗？（奇数年和偶数年的问题）

我的回复(2011-9-9 15:41)：12年得到6个时间段；13年7个。第7个的暴光时间为1年，而不是2年。解读时别忘了这个区别。

[51]刘昆 2011-9-5 12:38

陈老师，您好。我想请问下关于CITESPACE怎么保存图谱，我是做教育经济的，图点很散，怎么样吧图点聚集起来输出，看起来一目了然

我的回复(2011-9-6 04:59)：可以存成.viz格式，以后可以直接用CiteSpace打开使用：
File>Save Visualization
也可以:
File>Save PNG
如能增加更多联接，也许能把整体集中一些: 增加time slice的长度，增加topN, topN%等。

[50]殷晓莉 2011-8-17 10:26

陈老师，还有个问题，就是收集的数据量比较大，例如多达几万条的数据，去重怎么处理，citespace有去重功能吗？还是不需要进行去重也不影响分析结果？谢谢

我的回复(2011-8-18 02:32)：去重：Data>Import/Export>WOS>Duplicates Removal

[49]殷晓莉 2011-8-16 21:58

陈老师，您好，请教一下几个问题，就是在citespace中运行数据之后，下面结果框框显示的“Rec in file”有些不足500，例如498.497等等，但是那些文档我都是500条下载的，不知道什么原因；第二个问题就是，当“Years Per Slice”选择不同时，有效引文率也不同，而且不像很多实例给出的结果那样高达99%，有时才80%多，请问是我收集的数据问题还是什么？会不会影响结果分析呢？期待回复，谢谢

我的回复(2011-8-17 08:46)：如果一条记录中引文数量为0，该记录将不包括在统计里。
如果有不规范的引文，不规范的引文会在Java console中显示，但是会降低你看到的比例。收集数据是如选文献类型为Article, Review, 或Proceedings会减少这种不规范记录，但很难完全避免，除非手工处理。

[48]tongliwen 2011-8-5 15:47

陈老师，你好，如何在生成的可视图中为各个节点标出相应的文字说明？

我的回复(2011-8-5 20:54)：统一标：Article Labeling下面的组合控制，如Freq + threshold (越小符合显示要求的会越多)。
单独标：右键》Label the Node. 也可随后右键取消。

[47]tongliwen 2011-8-5 10:16

陈博士，你好，我自己在CNKI下了些REFWORK格式的数据，然后CiteSpace>Data>Import/Export>CNKI ，格式转换成功后，但是在导入后，点击GO!后没有结果，显示的内容是这样的：
space status
Please wait while CiteSpace imports files and builds networks.
Note that counts in the space column include both citer and citee entries.
The process may take several minutes to complete.
Similarity measure: Cosine

process reports
Network modeling starts at Fri Aug 05 10:09:45 CST 2011.

Pruning sliced networks: false
Pruning merged network: false

Slice Filename Rec in file Rec in slice

1-year slices criteria space nodes links

Pruning configuration:

几个小时后仍然停留在这个画面，麻烦你帮忙。
.

[46]tongliwen 2011-8-5 10:13

我用示例数据库，但是看不懂这些图表示什么意思（我一般都是默认的配置），我也不清楚这些配置是什么意思，特别是threshold interpolation中的c\cc\ccv应该如何设置，为什么要有三组？此外，不知道有没有详细的操作示例，比如我想对某一主题的作者情况进行分析，应该如何操作，设置参数，那些可视化图又是如何看出作者间的关系等，特别是我根本从这个可视化图中看懂一些用户说的那些信息，比如那些作者是核心，那些作者是有联系，那些点是关键点、拐点等等，谢谢！

[45]hztlw 2011-8-2 10:23

陈老师，您好，我想请教您一个问题，我下载CNKI或者万方的数据格式，应该如何进行转换，谢谢。

我的回复(2011-8-2 21:50)：试试CiteSpace>Data>Import/Export>CNKI

[44]xiexg 2011-7-30 09:47

陈老师，请教一个问题，我在处理一批纪录的时候，为什么在文献共被引分析里的iteration数字一直是0 ，而图谱则呈现一个似圆环型，内部交错的结构，而处理同样数据的作者共被引等则iteration数字一直在上升变化呢，可以呈现出分离很好的图谱。

我的回复(2011-7-30 22:23)：句号点错了。
应该变化。提供......

我的回复(2011-7-30 22:22)：应该变化提供。详细点儿的信息：如何启动？数据中文/英文？所有数据还是其中一批？系统还有什么提示。。。
找3~5条记录单独做个project试一下，如果还出现同样的问题，把这3~5条记录考在这里。

[43]xiexg 2011-7-28 23:56

陈老师，关于名词短语提取一步还需要请教一下，node type 里节点类型还需要选择吗？若选择的话，选什么好呢，pruning里的算法还用选择吗？结果运行后是选择visualize 还是cancel?提取完以后如果直接做文献共被引的话有什么影响，还是需要先做比如说热点分析等等，然后再做共被引分析呢？

[42]殷晓莉 2011-7-27 11:10

陈老师，您好，我的毕业论文是关于科学知识图谱的，现在遇到一个问题，就是我在WOS中收集的数据量太大，有300多M，在citespace中根本无法运行完一次，查了很多资料，应该是内存不足，我使用的是2G内存的电脑，现在担心的问题是，怕在4G的电脑上运行都不行，您有没有什么更好的建议或方法能给我指导一下？因为这个无法解决的话，就没有办法进行下一步，期待您的回复。

我的回复(2011-7-27 17:28)：第一，300M的数据是否真有必要？
如果可能，分为几个时间段，分别处理。另外，增加time slice length(通常为1年，可增为2， 3，等)。

[41]xiexg 2011-7-26 11:41

陈老师，再次请教你一个问题，这个问题一直迷惑着我，我在您的有关文献里看到citespace的操作步骤1、2、3（extract noun phrase term from title,abstract,descriptors,identifiers of citing articles in the dataset）4----，关于步骤3我在实际操作的过程中并没有执行，而是直接分析共被引等内容，这样的话结果会有影响吗？如果我在分析了共被引等后，然后想作前沿词的探测的话会对结果有影响吗？另外关于提取名词的操作步骤是这样的对面，选择了time scling ,term source,然后在term type里选择noun phrase，然后点go对吗？如果我想探测突现词，必须先进行名词短语的提取然后选择burst term--detect bursts吗？可是这样只能在窗口里显示了几个探测词，我往往再选择go，才能出现相应谱图？

我的回复(2011-7-27 09:04)：CiteSpace中的burst detection 有两种用法：1。名词短语和 2。单词。
1需要事先提取。2则不用。
如果后面的分析不涉及名词短语，结果不会受影响。
最后几个问题：对；是；应该如此。

[40]longlock 2011-7-26 09:57

谢谢老师的答复！再请问老师一个问题：因为从CSSCI上下载的数据是txt格式，在您写的一篇文章要转换成UTF-8格式。我刚刚试了，确实可以用WordPad存unicode，这种格式可以用格式转换软件转换成Citespace软件识别的格式吗？

[39]杜文龙 2011-7-26 06:52

好的，非常感谢陈老师！学生再试试。

[38]longlock 2011-7-25 22:22

陈老师，您好！我从CSSCI上下载数据，但是无法将txt文件另存为UTF-8格式的，打开转换器的进行转换的时候只能得到1KB的乱码，请问具体是怎么转换的？我的电脑上装了JAVA程序，转换格式软件和Citespace软件，是不是还有什么软件没有装啊？请老师指教！谢谢了啊

我的回复(2011-7-26 00:04)：用WordPad应该可以存unicode.

ChaomeiChen的个人博客分享 http://blog.sciencenet.cn/u/ChaomeiChen

留言板

陈超美