科学网

 找回密码
  注册
科学网 标签 test 相关日志

tag 标签: test

相关日志

格兰杰因果关系检验(Granger causality test)
yiboliu 2015-6-3 03:55
转自: http://zh.wikipedia.org/wiki/%E6%A0%BC%E8%98%AD%E5%82%91%E5%9B%A0%E6%9E%9C%E9%97%9C%E4%BF%82 http://bbs.pinggu.org/thread-876993-1-1.html 又附 http://blog.sciencenet.cn/blog-247792-451034.html
7235 次阅读|0 个评论
[转载]Matlab: 偏相关系数检验
lixujeremy 2014-12-16 16:23
偏相关系数显著性的检验假设 : Null Hypothesis H 0 : PR =0 , Alternative Hypothesis H 1 : PR ≠ 0. Under the null hypothesis this test statistic will be approximately t-distributed, also with n-2-k degrees of freedom. k为被固定的 解释变量个数。 We would reject H 0 if the absolute value of the test statistic exceeded the critical value from the t-table evaluated at α over 2: 举例: PR =0.711879 , n =37 ,代入得到 t =5.823 ,检验显著性水平 α =0.01 。 查询 t 分布临界表 ,自由度是 37-2-2=33 ,表中没有自由度为 33 的对应数值,选择临近且不大于 33 的 30 , 0.005 对应 2.750 ,意味着 t ( df , 1- α /2) = t (33, 0.995) 临界值是 2.750 。因为 t =5.823 > 2.750 ,拒绝原假设, PR 在 0.01 显著性水平上两种变量具有显著相关性。
个人分类: Mathematics|4797 次阅读|0 个评论
P-value值计算、显著性分析以及Fisher's exact test精确检验
liujd 2013-6-28 18:06
个人分类: 模式识别与机器学习|0 个评论
[转载]rank sum test 秩和检验
songhaomouse 2013-5-29 03:26
rank sum test 秩和检验 秩和检验方法最早是由维尔克松(Wilcoxon)提出,叫维尔克松两样本检验法。后来曼—惠特尼将其应用到两样本容量不等(n1不等于n2)的情况,因而又称为曼—惠特尼U检验。这种方法主要用于比较两个独立样本的差异。 1、假设中的等价问题 设有两个连续型总体, 它们的概率密度函数分别为: f 1 ( x ), f 2 ( x )(均为未知) 已知 f 1 ( x ) = f 2 ( x − a ),a为末知常数,要检验的各假设为: H 0 : a = 0, H 1 : a 0. H 0 : a = 0, H 1 : a 0. H0:a=0,H1, a0. 设两个总体的均值存在,分别记为μ 1 ,μ 2 ,由于 f 1 , f 2 最多只差一平移,则有μ 2 = μ 1 − a 。此时, 上述各假设分别等价于: H 0 :μ 1 = μ 2 , H 1 :μ 1 μ 2 H 0 :μ 1 = μ 2 , H 1 :μ 1 μ 2 H 0 :μ 1 = μ 2 , H 1 :μ 1 μ 2 2、秩的定义 设X为一总体,将容量为n的样本观察值按自小到大的次序编号排列成 x (1) x (2) Λ x ( n ) ,称 x ( i ) 的足标i为 x ( i ) 的秩, i = 1,2,Λ, n 。 例如: 某施行团人员的行李重量数据如表: 重量(kg) 34 39 41 28 33 写出重量33的秩。 因为2833343941,故33的秩为2。 特殊情况: 如果在排列大小时出现了相同大小的观察值, 则其秩的定义为足标的平均值。 例如: 抽得的样本观察值按次序排成0,1,1,1,2,3,3, 则3个1的秩均为(2+3+4)/3=3. 两个3的秩均为(6+7)/2=6.5. 3、秩和的定义 现设1,2两总体分别抽取容量为 n 1 , n 2 的样本,且设两样本独立。这里总假定 n1n2。 我们将这 n 1 + n 2 个观察值放在一起,按自小到大的次序排列,求出每个观察值的秩,然后将属于第1个总体的样本观察值的秩相加,其和记为 R 1 ,称为第1样本的秩和,其余观察值的秩的总和记作 R 2 ,称为第2样本的秩和。 显然, R 1 和 R 2 是离散型随机变量,且有 R 1 + R 2 =( (n1+n2)(n1+n2+1) )/2. 4、秩和检验法的定义 秩和检验是一种非参数检验法, 它是一种用样本秩来代替样本值的检验法。 用秩和检验可以检验两个总体的分布函数是否相等的问题 秩和检验的适用范围 如果两个样本来自两个独立的但非正态获形态不清的两总体,要检验两样本之间的差异是否显著,不应运用参数检验中的 T检验 ,而需采用秩和检验。 秩和检验的方法 1、两个样本的容量均小于10的检验方法 检验的具体步骤: 第一步:将两个样本数据混合并由小到大进行等级排列(最小的数据秩次编为1,最大的数据秩次编为 n 1 + n 2 )。 第二步:把容量较小的样本中各数据的等级相加,即秩和,用T表示。 第三步:把T值与秩和检验表中某α显著性水平下的临界值相比较,如果 T 1 T T 2 ,则两样本差异不显著;如果TT1或T=T2, 则表明两样本差异显著。 例: 某年级随机抽取6名男生和8名女生的英语考试成绩如表1所示。问该年级男女生的英语成绩是否存在显著差异? 男、女生英语考试成绩表 解: 检验步骤: (1)建立假设: H 0 :男女生的英语成绩不存在显著差异 H 1 :男女生的英语成绩存在显著差异 (2)编排秩次,求秩和: T= 13 + 7 + 14 + 12 + 5.5 + 11= 62.5 (3)统计推断:根据 n 1 = 6, n 2 = 8,α = 0.05, 查秩和检验表,T的上、下限分别为 T 1 = 29, T 2 = 61,有 T T 2 ,结论是:男女生的英语成绩存在显著差异。 3、两个样本的容量均大于10的检验方法 当两个样本容量都大于10时,秩和T的分布接近于正态分布,因此可以用Z检验,其基本公式为: 式中:T为较小的样本的秩和。 例: 某校演讲比赛后随即抽出两组学生的比赛成绩如表2,问两组成绩是否有显著差异? 解: 检验步骤: (1)建立假设: H 0 :两组成绩不存在显著差异 H 1 :两组成绩存在显著差异 (2)编排秩次,求秩和: n 1 = 12, n 2 = 14, T = 144.5,代入公式,有: (3)统计推断:因为|Z|1.96,则应保留虚无假设,拒绝备择假设。结论是:两组的演讲比赛成绩不存在显著差异。
个人分类: 笔记|1 次阅读|0 个评论
[转载]permutation test 置换检验
zyysdjn 2013-5-24 11:14
转载 Permutation Test 置换检验 | Public Library of Bioinformatics + http://www.plob.org/2012/12/19/3176.html 显著性检验通常可以告诉我们一个观测值是否是有效的,例如检测两组样本均值差异的假设检验可以告诉我们这两组样本的均值是否相等(或者那个均值更大)。我们在实验中经常会因为各种问题(时间、经费、人力、物力)得到一些小样本结果,如果我们想知道这些小样本结果的总体是什么样子的,就需要用到 置换检验 。 Permutation test 置换检验 是Fisher于20世纪30年代提出的一种基于大量计算(computationally intensive),利用样本数据的全(或随机)排列,进行统计推断的方法,因其对总体分布自由,应用较为广泛,特别适用于总体分布未知的小样本资料,以及某些难以用常规方法分析资料的假设检验问题。在具体使用上它和Bootstrap Methods类似,通过对样本进行顺序上的置换,重新计算统计检验量,构造经验分布,然后在此基础上求出P-value进行推断。 下面通过一个简单例子来介绍Permutation test的思想。 假设我们设计了一个实验来验证加入某种生长素后拟南芥的侧根数量会明显增加。A组是加入某种生长素后,拟南芥的侧根数量;B是不加生长素时,拟南芥的侧根数量(均为假定值)。 A组侧根数量(共12个数据):24 43 58 67 61 44 67 49 59 52 62 50 B组侧根数量(共16个数据):42 43 65 26 33 41 19 54 42 20 17 60 37 42 55 28 我们来用假设检验的方法来判断生长素是否起作用。我们的零假设为:加入的生长素不会促进拟南芥的根系发育。在这个检验中,若零假设成立,那么A组数据的分布和B组数据的分布是一样的,也就是服从同个分布。 接下来构造检验统计量——A组侧根数目的均值同B组侧根数目的均值之差。 statistic:= mean(X a) -mean(X b) 对于观测值有 S obs :=mean(X a) -mean(X b) =(24+43+58+67+61+44+67+49+59+52+62+50)/12-(42+43+65+26+33+41+19+54+42+20+17+60+37+42+55+28)/16=14 我们可以通过S obs 在置换分布(permutation distribution)中的位置来得到它的P-value。 Permutation test的具体步骤是: 1.将A、B两组数据合并到一个集合中,从中挑选出12个作为A组的数据(X' a ),剩下的作为B组的数据(X' b )。 Gourp:=24 43 58 67 61 44 67 49 59 52 62 50 42 43 65 26 33 41 19 54 42 20 17 60 37 42 55 28 挑选出 X' a :=43 17 44 62 60 26 28 61 50 43 33 19 X' b :=55 41 42 65 59 24 54 52 42 49 37 67 67 20 42 58 2.计算并记录第一步中A组同B组的均值之差。S per := mean(X' a) -mean(X' b)= -7.875 3.对前两步重复999次(重复次数越多,得到的背景分布越”稳定“) 这样我们得到有999个置换排列求得的999个S per 结果,这999个S per 结果能代表拟南芥小样本实验的抽样总体情况。 permutation test 如上图所示,我们的观测值 S obs =14 在抽样总体右尾附近,说明在零假设条件下这个数值是很少出现的。在permutation得到的抽样总体中大于14的数值有9个,所以估计的P-value是9/999=0.01 最后还可以进一步精确P-value结果(做一个抽样总体校正),在抽样总体中加入一个远大于观测值 S obs =14的样本,最终的P-value=(9+1)/(999+1)=0.01。(为什么这样做是一个校正呢?自己思考:)) 结果表明我们的原假设不成立,加入生长素起到了促使拟南芥的根系发育的作用。 参考资料: 1. http://bcs.whfreeman.com/ips5e/content/cat_080/pdf/moore14.pdf 2. http://jpkc.njmu.edu.cn/course/tongjixue/file/jxzy/tjjz02.htm 3. http://www.r-bloggers.com/lang/chinese/541 附录:R语言求解上例的代码 a-c(24,43,58,67,61,44,67,49,59,52,62,50,42,43,65,26,33,41,19,54,42,20,17,60,37,42,55,28) group-factor(c(rep(A,12),rep(B,16))) data-data.frame(group,a) find.mean-function(x){ mean(x )-mean(x ) } results-replicate(999,find.mean(data.frame(group,sample(data )))) p.value-length(results )-mean(data )])/1000 hist(results,breaks=20,prob=TRUE) lines(density(results))
个人分类: 统计|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 12:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部