半偏相关系数 sr 的 t 检验: N 是样本量, P 是预测变量总数, R 2 是当被检验变量被包括进来时总的方差解释率,临界 t 值得自由度是 N - P -1 。 参考文献 Cohen BH. Explaining psychological statistics . New York, US:John Wiley Sons, 2008. 中译本 : 高定国等译 , 心理统计学 ( 第三版 ) . 上海 : 华东师范大学出版社 , 2011.
相关系数的显著性检验 : Null Hypothesis R =0 , Alternative Hypothesis R ≠ 0 。 相关系数 R 的分布分为两种:当样本量 N 很大时, R 服从正态分布;反之, R 服从 t 分布。 计算 t 值的最简单公式: 自由度是 n-2 。 举例,识字率与政治稳定的相关系数 R =0.5 , N =10 ( nations )这是强相关性吗?判定系数 R 2 =0.25 ,也就是政治稳定的 25% 的方差可以被识字率解释。代入上式,得到 t =1.63 ,查询 t 分布临界表,自由度为 8 的单侧检验 α =0.05 的临界值是 1.860 , t =1.63 < 1.860 ,所以不能拒绝原假设 R =0 。 小结,相关系数大不一定是显著的,反之,相关系数小也可能是显著的,关键在于采样数量。对于小样本采样,较常出现偶然的强相关性,所以必须对它的显著性进行检验。对于大样本采样,就很容易达到显著性,所以多关注相关系数的强弱,看它包含多少解释信息。
偏相关系数显著性的检验假设 : Null Hypothesis H 0 : PR =0 , Alternative Hypothesis H 1 : PR ≠ 0. Under the null hypothesis this test statistic will be approximately t-distributed, also with n-2-k degrees of freedom. k为被固定的 解释变量个数。 We would reject H 0 if the absolute value of the test statistic exceeded the critical value from the t-table evaluated at α over 2: 举例: PR =0.711879 , n =37 ,代入得到 t =5.823 ,检验显著性水平 α =0.01 。 查询 t 分布临界表 ,自由度是 37-2-2=33 ,表中没有自由度为 33 的对应数值,选择临近且不大于 33 的 30 , 0.005 对应 2.750 ,意味着 t ( df , 1- α /2) = t (33, 0.995) 临界值是 2.750 。因为 t =5.823 > 2.750 ,拒绝原假设, PR 在 0.01 显著性水平上两种变量具有显著相关性。
相关系数、n阶相关、互信息 相关系数,如(Pearson product moment correlation coefficient),表示的是两个 X 、 Y (时间序列、向量、随机变量等)之间的线性相似性(线性相关性)。 表示两个随机变量 X 、 Y 之间 n 阶相关的量有没有,是什么? 互信息(Mutual Information)怎么计算? 两个独立的正态分布随机变量之间的相关系数、互信息都是0吗? 两个 X 、 Y 之间互信息=0,能表示这两个随机变量 X 、 Y 之间 n 阶相关性为0吗?就是没有 n 阶相似性? 感谢您的指教! 相关链接: 2014-03-04,《 相关系数和互信息之间的解析关系》 http://blog.sciencenet.cn/blog-107667-773091.html
Author Name Disambiguation for CitationsUsing Topic and Web Correlation Kai-Hsiang Yang, fromInstitute of Information Science, Academia Sinica, Taiwan ECDL'08 (European Conference on Digital Library) 利用主题相关度和web相关度判断是否重名,用的是pair-wise聚类模型。