CiteSpace 在单个时间分区按阈值控制网络节点数量,满足阈值条件的引文才被可视化,有 Top N 、 TopN% 、 ThresholdInterpolation 、 SelectCiters 共 4 种设定方式。 Top N 选取被引次数最高的 N 个引文, TopN% 先按被引次数排序再按百分比( N% )选取引文,这两种方式各时间分区的阈值完全相同。阈值插值( Threshold Interpolation )从被引频次 c ( citation )、两篇文献的共被引频次 cc ( cocitation )和共被引系数 ccv ( cosinecoefficient )三个层次设置阈值,其中 ccv 计算公式为 ,其中 cc(i,j) 是文献 i 和文献 j 的共被引次数, c(i) 和 c(j) 是各自的被引次数,例如在某个时间分区里,文献 i 和文献 j 共被引 2 次,文献 i 被引 4 次,文献 j 被引 3 次,则 ccv=2/sqrt(4 × 3) ≈ 0.577 。它在整个时间跨度的第一个、中间一个、最后一个时间分区分别设定阈值锚点,其余时间分区的阈值利用线性插值算法来计算,实现了不同时间分区阈值的个性化。选择施引文献( Select Citers )先根据引文记录中的 TC 字段值筛选施引文献,然后需再用 Top N 、 TopN% 、 ThresholdInterpolation 中其中一种方法作为阈值筛选施引文献中的参考文献。阈值调谐可依据 Citespace 软件界面左下角( Space Status 和 Process Reports )数据处理报告的选中的引文数量、节点数和连接数量进行调整,确定合理的阈值需要进行反复的试算和比较。软件界面左侧 Space Status 文本框中 space 栏对应数值为该时间分区内引文的有效参考文献数目,题录字段缺失及重复的参考文献不计入, nodes 指满足阈值条件的参考文献数目。 Process Reports 中 Records within the chosen range 的值指有效的引文数量,缺少参考文献的引文不记数。