科学网

 找回密码
  注册

tag 标签: t检验

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

SPSS中正态分布验证、方差齐性检验以及Wilcox检验
热度 1 mashengwei 2017-12-18 10:44
SPSS中正态分布验证、方差齐性检验以及Wilcox检验 t检验或方差分析要求数据正态分布以及方差齐性。一般来说我们的表型数据符合正态分布以及方差齐性的要求。但对于其他类型的数据,就不一定满足这两点了。所以在进行t检验和方差分析之前,首先要进行数据的正态检验以及方差齐性检验。在SPSS中的具体操作如下: 输入的数据格式如下: 1、在菜单栏选择“分析”-“描述统计”-“探索”,如下图。 2、将分组信息group添加到“因子列表”,其他数据添加到“因变量列表”,如下图。 3、设置“统计”选项卡,所有勾选的都选上即可,如下图。 4、设置“图(T)”选项卡,设置如下图,按下图设置之后点击“继续”。 5、完成上述设置之后,点击“确定即可”,稍微等待即可出现结果。 6、这一步会出来很多统计结果,下面只介绍我们关心的正态分布检验和方差齐性检验,正态分布检验结果如下表。 从上表我们看出,显著性(p值)远小于0.001,即显著,则能够拒绝他们服从正态分布的假设。即该组数据不符合正态分析,也就不能使用t检验和方差分析(ANOVA),不管此时方差是否齐性均不能使用上述两种检验。 其实数据是否符合正态分布我们在直方图或Q-Q图上基本上也能看出,如下图,均不是正态分布。数据正态分布时,数据点基本沿直线两侧分布。 7、如果数据符合符合正态分布下面就要进行方差齐性检验,结果如下图。 从上表我们可以看到其显著性(P0.001)非常小,这说明我们要拒绝他们总体方差相等的假设,即此时方差不齐,不能使用t检验以及方差分析。 那么此时应该使用什么统计方法呢,一般时使用Mann-Whitney U 秩和检验(Wilcox检验),或者Kruskal-Wallis检验。两组数据比较使用Wilcox检验,而多组数据比较使用Kruskal-Wallis检验。切记需要满足的条件是:在进行多个群组之间比较时,因为群组不满足正态分布而不能使用ANOVA多比较,那么你可以使用Kruskal-Wallis检验,当只有两组时,使用基于两样本的Wilcox检验。 那么在SPSS里该如何进行Kruskal-Wallis检验和Wilcox检验分析呢?此部分暂时只说Wilcox检验分析,其实Kruskal-Wallis检验在SPSS里操作也是类似的,只不过Kruskal-Wallis检验适用于多重比较。分析入口如下。 点击确定之后,接下来会弹出一个设置页面,如下图,该页面包含3个子页面即“目标”,“字段”,“设置”。其中目标这个可以保持默认设置,字段以及设置的页面如下。 按照上述页面设置之后,点击运行即可。最后结果如下图所示。 这是输出的主要结果,零假设是“基因表达水平的分布在两组之间相同”,除root z13之外,P0.05,故拒绝原假设,认为基因的表达水平在两组之间有统计学差异。而root z13则没有显著的统计学差异。 欢迎关注“ 小麦研究联盟 ” ,了解小麦新进展
个人分类: 文献推荐|57906 次阅读|2 个评论
理解基因组数据分析之差异比较篇
yufree 2015-8-29 11:14
先从最简单的例子来,假设我们比较两组人的平均身高该如何做?我们要对两组人采样,采样数最好一样,然后测量每个样本的身高,记录后分组计算均值与方差。如果目的是比较均值,那么首先要考虑使用的方法,如果是t检验,那么先对均值的方差进行F检验来确定是否需要等方差t检验,然后就是双样本t检验,结果显著(p0.05)我们就说这两组人的身高有显著性差异(无差异就是0),给出两组身高的均值与差异的置信区间,我们的数据分析就完了。上述过程槽点略多,不吐槽了,如果你在实验室一线至少要掌握上面那个实验设计与数据分析的思路来寻找差异,多数科学发现的本质就是寻找未知的差异。 下面是一组R代码,模拟了两组数据均值的对比,读懂输出的结果,另外注意R默认的t检验是不等方差的。 # 模拟生成两组数据 group1 - rnorm(100,100,10) group2 - rnorm(100,130,13) # 进行t检验 t.test(group1,group2) # 结果 # Welch Two Sample t-test # #data: group1 and group2 #t = -16.857, df = 186.154, #p-value 2.2e-16 #alternative hypothesis: true difference in means is not equal to 0 #95 percent confidence interval: # -30.50828 -24.11558 #sample estimates: #mean of x mean of y # 100.9668 128.2787 如果是基因组数据分析,基本思路就是设定实验组与对照组,对比找出差异,对有差异的数据在相应物种基因组里定位然后寻找功能注释,后面就是讲故事阶段了。但不同于我们对比身高,基因组数据分析对比的不单单是一组变量例如身高,而是一堆变量例如基因A,B,C,D,……,Z。当然不止26个,这时我们遇到的问题就是一个样本,几百上千维的描述如何保证样本代表性。这个问题的解决一般要靠实验设计,对比差异的话至少也要有两组,每组多少生物学重复通过试验来检测下统计功效,在满足一定功效的前提下反推需要的样本数。 在基因芯片表达谱这个矩阵上,我们希望得到的信息是高度依赖所研究的科学问题的。大概有如下这两种: 我的样本不分组,都是得了一种恶性病,我想找出这种病在基因层次的描述。这种情况你需要采集样本的基因组数据,对样本基因表达谱进行聚类,找出变化相对一致的基因。 我在实验设计就有两组数据,这种情况可以直接对这两组进行t检验,然后对差异基因进行数据库检索或功能定位,进而依据组别判断数据的生物学意义。 照这样看似乎并不难,本质上就是跟对照或数据库的数据找差异,可以看作是t检验的推广。但问题实际比想象的要复杂,举例而言,两组样本每个样本测定1000个基因,在0.05置信区间上至少出现50个假阳性,更何况一般芯片测的数比这要多,而常识上多数基因是不受影响的,也就是即便假阳性比率不高,但只要有就会影响我们回答科学问题。下面我用模拟数据来说明下这个问题。 # 安装bioconductor source(http://bioconductor.org/biocLite.R) biocLite() # genefilter包用来同时进行高维t检验,得到所有基因的分组差异 # Biobase包用来提供处理表达数据集的方法 # biocLite('genefilter') library(genefilter) library(Biobase) # GSE5859数据集收集了不同人种的基因表达数据 # devtools::install_github(genomicsclass/GSE5859) library(GSE5859) # 读入数据 data(GSE5859) # 提取分组信息,这里先选取两个人种 info - pData(e) g - info$ethnicity gASNCEU - which(g == 'ASN' | g == 'CEU') group - factor(g ) # 提取表达谱原始数据 exp - exprs(e) # 进行分组t检验 results - rowttests(exp,group) # 提取结果p值 pvals - results$p.value # 模拟随机表达谱并提取p值 m - nrow(exp) n - ncol(exp) randomData - matrix(rnorm(n*m),m,n) nullresults - rowttests(randomData,group) nullpvals - nullresults$p.value # 随机分组比较并提取p值 permg - sample(group) permresults - rowttests(exp,permg) permpvals - permresults$p.value # 观察p值分布与火山图 par(mfrow = c(2,3)) hist(pvals,ylim=c(0,9000)) hist(permpvals,ylim=c(0,9000)) hist(nullpvals,ylim=c(0,9000)) plot(results$dm,-log10(pvals), xlab=Effect size,ylab=- log (base 10) p-values) plot(permresults$dm,-log10(permpvals), xlab=Effect size,ylab=- log (base 10) p-values) plot(nullresults$dm,-log10(nullpvals), xlab=Effect size,ylab=- log (base 10) p-values) 从上面的分析我们可以看出p值的分布在实际样品与随机数据是有差异的。随机数据中p值的分布是均匀分布,但样品中明显是偏态分布,而且火山图可以看出均值差较小时出现了很多有显著性差异的数值。毋庸置疑,这会干扰我们后续的通路分析。 数据也就长这样了,问题就是多次比较后假阳性比较多。我们可以用比较保守的Bonferroni矫正来用比较小的p值控制假阳性,当然为了保证统计功效,也可以使用控制错误发现率的方法来减少假阳性。一般控制错误发现率都是针对全局的,但q值法提供了一种对每个对比进行检验的方法,当q值比较小,我们认为这个结果还是比较靠谱的。这样当一个基因同时满足q值与p值小于0.05,那么我们大概可以说这组数的差异是显著的,我们也筛到了想要的基因。 另一个更常用的解决方法是使用经验贝叶斯方法。我们注意看一下随机数据生成的火山图,这里面与实际数据相比差异与p值大致趋势一致。当我们假设多数基因应该是不变化时,我们就应该同时收敛差异与p值的离散状况。这里我们假设各组基因的变化服从一个超分布,然后计算t值时对方差进行贝叶斯加权。当基因组内差异小其方差权重小而整体权重大,当差异大时整体权重小,这样就实现了t值的一个收敛,最后给出的火山图也跟着收敛了。经验贝叶斯方法算是基因组数据分析里比较常用的方法,单看效果应该不错,可以配合q值去筛选差异基因。 下一篇我们从t检验推广到线性模型,并想办法矫正掉一些批次效应。
个人分类: 科搜研手册|12198 次阅读|0 个评论
统计学笔记一
LindaChina 2012-7-11 11:33
1 、信度和效度 测量的尺度或规则是测量观察结果的特定水平。每一个水平都有特定的属性特征集。测量尺度以 4 中形式出现: 定类:定类测量水平是以观察结果的属性特征定义,也就是观察结果只适合一个而且唯一的一个分类或层级。例如性别、种族等。定类测量水平的各个类别相互排斥。 定序:定序测量水平的“序”表示次序,被测量的食物按照他们的属性特征排序。例如去应聘时的排号等。 定距:当谈到定距测量水平,一般指的是检验或者评估工具是基于某种连续体,这样我们可以讨论一个较高的成绩比较低的成绩高多少。而定序测量水平只有次序,次序之间的差距不能体现。但是定距测量水平就可以。比如你的数学成绩是 90 分,是数学成绩为 45 分的同学的两倍高。 定比:定比测量水平的评估工具的特征是测量尺度中绝对零值的存在。这意味着没有要测量的任何特征。让人迷惑的是,这不就是说我们要测量的观察结果是否可能是没有任何可以测量的?后来在网上查找,确实存在这样的学科,例如心理学和生物学中你可以有不存在属性特征的情况,例如绝对零值(没有分子运动)或者零光程。但是在社会学和行为科学中,这种情况就比较让人无法理解了。即使你的数学成绩为 0 ,也并不意味着你的数学能力为 0 。 信度 所谓信度,通俗的理解就是“我如何知道我每次使用的检验、量表和工具等都能发挥作用?”。也就是一个测试或者你使用的其他任何测量工具对事物的测量可以保持一致性。但是,有很多因素会影响测试结果,导致结果产生误差。墨菲定律告诉我们,世界并不是完美的。因此,我们看到的结果是观察值而非真实值。 观察值 = 真实值 + 误差值。 而我们的工作就是尽量减少误差,增加信度,这样观察值和真实值才能更匹配。 信度有如下几种类型: 信度类型 何时使用 如何计算 举例说明所得结果的含义 再测信度 当你想知道一个测试在不同时间是否可信 计算时期 1 和时期 2 相同测试的两次值之间的相关系数 不同时期的青少年认同的形成的邦左( Bonzo )测试是可信的。 复本信度 当你想知道一个测试的几个复本是否可信或者是否等价 计算一个复本测试的值与相同内容的另一个复本的测试(不是完全相同的测试)的测试值之间的相关系数。 人格测试的两个复本是等价的,而且表现出复本信度。 内在一致性信度 当你想知道一个测试的项目是否评价一个而且只评价一个维度 每一个项目的得分与总得分之间的相关系数 SMART 创造性测试的所有项目评价相同结构。 评分者信度 你想知道对一个观察结果的评价是否具有一致性 检验不同评分者一致结论的百分比 最佳着装足球运动员评价的不同评分者信度是 0.91 ,表示不同裁判的一致程度很高。 效度 效度可以这样理解:效度是来帮助判断我每次使用的检验、量表和工具等是否能够测量我想测量的内容。效度类型总结: 效度的类型 何时使用 如何计算 举例说明所得结果的含义 内容效度 当你想知道一个特定主题的项目样本是否能够反映项目总体 请教专家,让专家判断测试的项目是否反映将要测量的主题的项目总体 我的统计学课程的而每周测试可以评价每章的内容。 准则效度 当你想知道测试成绩是否和其他标准系统相关,这个标准表明被测试者具备某个领域的能力。 计算测试成绩和其他有效的测量之间的相关系数,并评价相同的一组能力。 研究显示烹调技能的 EAT 测试与结束烹饪学习后两年内成为主厨相关(预测效度的一个案例) 建构效度 你想知道测试是否测量一些基本的心理结构 计算测试成绩和反映测试设计的结构的理论结果之间的相关系数 这是真实的——参与身体接触和危险性运动的男性的侵略性 TEST 测试的得分较高 信度和效度很重要,如果工具急不可信又无效,你的实验结果也就让人怀疑。 2 、假设检验 零假设 零假设总是表示研究的两个变量无关。零假设是提供与观察到的结果进行比较的基准,进而分析是否是由于其他因素引起这些差异。零假设有助于定义观察到的群体间的差异范围是由偶然性引起(这是零假设的论点)还是由偶然性之外的因素(这可能是其他变量影响的结果)引起。 除了零假设,还有研究假设,包括无方向研究假设和有方向研究假设,都非常好理解。这里不再赘述。 好假设的标准 (1) 一个好的假设一般是以陈述句形式出现 (2) 一个好的假设提出变量间预期的关系。 (3) 假设反映他们建立的理论和文献基础。 (4) 假设应该简短并切中要点。 (5) 好的假设是可检验的假设。 标准值: z 值 标准值是以标准差为单位进行了标准化,是可比较的。计算公式为: z= X-X~ s 其中, z 是标准值 z 值, X 是具体数值, X~ 是数据分布的均值, s 是数据分布的标准差。 不同分布的 z 值具有可比性。 z 值越大,表示该数值距离均值越远。需要记住如下结论: ( 1 ) 84% 的数值落在值为 +1 的 z 值之下( 50% 落在均值之下, 34% 落在均值和值为 +1 的 z 值之间)。 ( 2 ) 16% 的数值落在值为 +1 的 z 值之上(曲线下的全部面积是 100% , 84% 的数值落在值为 +1 的 z 值之下)
个人分类: 统计学|5270 次阅读|0 个评论
T检验
laifly 2012-6-23 09:23
因为下定决心,这次要学会spss,所以格外用心。本来T检验应该不是什么难题,但却发现杜强等编的spss书,在结果分析中说的太简单,所以有点搞不清。我找了一本邱浩政的书,也没有把问题解决。所以先把问题记录在博客里,下次再去找其他的书,把问题解决。 杜强那本书,是0.05和0.01,我怀疑印刷错误,应该0.05和0.1。到底什么时候否定原假设,什么时候不否定?待查 经查,一般为0.05,小于0.05,就是拒绝原假设。 大于或者等于0.05,接受原假设。
个人分类: 学习心得|2917 次阅读|0 个评论
使用R语言检验样本平均值是否有别于某一水平
Bearjazz 2011-12-28 11:10
检验样本平均值是否有别于某一水平 熊荣川 六盘水师范学院 xiongrongchuan@126.com 我们参考来自网络的数据进行分析示范 http://blog.sina.com.cn/s/blog_4af3f0d20100h0je.html 某种元件的寿命 X (小时),服从正态分布, N ( mu,sigma^2 ),其中 mu,sigma^2 均未知, 16 只元件的寿命如下:问是否有理由认为元件的平均寿命大于 255 小时。 命令: 输入 注释 X- c(159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 485, 170) 给向量 X 赋值 t.test(X, alternative = "greater", mu = 225) 检验平均值是否大于 225 结果 One Sample t-test data: X t = 0.6685, df = 15, p-value = 0.257 alternative hypothesis: true mean is greater than 225 95 percent confidence interval: 198.2321 Inf sample estimates: mean of x 241.5 平均值 241.5 ,大于 225 。 ( 1-P )值的大小代表支持备择假说的概率,即 1-0.257 = 0.743 ,均值大于 225 是个大概率事件 以下我们修改了部分数据,使得均值接近 225 输入 注释 X- c(159, 280, 101, 212, 224, 379, 179, 264, 222, 362, 168, 250, 149, 260, 220, 170) 给向量 X 赋值 t.test(X, alternative = "greater", mu = 225) 检验平均值是否大于 225 结果 One Sample t-test data: X t = -0.0034, df = 15, p-value = 0.5013 alternative hypothesis: true mean is greater than 225 95 percent confidence interval: 192.3401 Inf sample estimates: mean of x 224.9375 1-P = 0.4987 这是均值大于 225 的概率 我们修改部分数据,使得均值远小于 225 输入 注释 X- c(159, 280, 101, 212, 224, 151, 179, 264, 222, 362, 168, 250, 149, 260, 150, 170) 给向量 X 赋值 t.test(X, alternative = "greater", mu = 225) 检验平均值是否大于 225 结果 One Sample t-test data: X t = -1.1377, df = 15, p-value = 0.8634 alternative hypothesis: true mean is greater than 225 95 percent confidence interval: 177.5168 Inf sample estimates: mean of x 206.3125 1-P = 0.1366 这是均值大于 225 的概率 实际上均值小于 225 我们修改备择假说条件 输入 注释 X- c(159, 280, 101, 212, 224, 151, 179, 264, 222, 362, 168, 250, 149, 260, 150, 170) 给向量 X 赋值 t.test(X, alternative = "less", mu = 225) 检验平均值是否大于 225 结果 t.test(X, alternative = "less", mu = 225) One Sample t-test data: X t = -1.1377, df = 15, p-value = 0.1366 alternative hypothesis: true mean is less than 225 95 percent confidence interval: -Inf 235.1082 sample estimates: mean of x 206.3125 1-P = 0.8634 这是均值小于 225 的概率 刚好和相反的备择假说互补
个人分类: 我的研究|6363 次阅读|0 个评论
使用R语言进行两组数据显著性t检验(入门级)
热度 1 Bearjazz 2011-12-28 10:17
使用 R 语言进行两组数据显著性 t 检验(入门级) 熊荣川 六盘水师范学院 xiongrongchuan@126.com 实例一 两组数据显著性 t 检验 (随机赋值模拟) 输入 注释 expend - c(rnorm(10)) 随机产生 10 个正态分布的数据 stature- c("obese","lean","obese","lean","obese","lean","obese","lean","obese","lean") d - data.frame(expend,stature) 数据框赋值 t.test(expend~stature) T 检验 结果 Welch Two Sample t-test data: expend by stature t = -9e-04, df = 7.985, p-value = 0.9993 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -1.204426 1.203442 sample estimates: mean in group lean mean in group obese 0.04850100 0.04899317 不显著 因为我们是交替给两组数据赋值,当然不显著 实例二 两组数据显著性 t 检验 (区间赋值模拟) 输入 注释 rm( stature, d ) 清空 stature 和 d 的原值 stature- c("lean","lean","lean","lean","lean","obese","obese","obese","obese","obese") 为 stature 进行区间赋值 d - data.frame( expend ,stature) 数据框赋值 t.test(expend~stature) T 检验 结果 Welch Two Sample t-test data: expend by stature t = -1.4237, df = 5.974, p-value = 0.2046 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -1.8056111 0.4781883 sample estimates: mean in group lean mean in group obese -0.2831086 0.3806028 不显著 区间赋值属于有规律的赋值,显著性提高 实例三 实际导入数据显著性 t 检验 输入 data-read.csv("D:\\ziliao\\zhuanye\\R bear\\vocal cords.csv") 读入表格 grah - data 第一列值赋给 grah torm - data 第二列值赋给 torm d - data.frame(grah, torm) 数据框赋值 t.test(grah, torm) T 检验 结果 Welch Two Sample t-test data: grah and torm t = 6.4396, df = 11.45, p-value = 3.995e-05 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 67.89471 137.89651 sample estimates: mean of x mean of y 174.93756 72.04194 显著
个人分类: 我的研究|46232 次阅读|3 个评论
[转载]T检验、F检验及其统计学意义
estudy 2010-10-4 14:54
1. T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。 F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的机率。 2. 统计学意义(P值或sig值) 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的p值通常被认为是可接受错误的边界水平。 3. T检验和F检验 至于具体要检定的内容,须看你是在做哪一个统计程序。 举一个例子,比如,你要检验两独立样本均数差异是否能推论至总体,而行的t检验。 两样本(如某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体,代表总体的情况也是存在著差异呢? 会不会总体中男女生根本没有差别,只不过是你那麼巧抽到这2样本的数值不同? 为此,我们进行t检定,算出一个t检定值。 与统计学家建立的以「总体中没差别」作基础的随机变量t分布进行比较,看看在多少%的机会(亦即显著性sig值)下会得到目前的结果。 若显著性sig值很少,比如0.05(少于5%机率),亦即是说,「如果」总体「真的」没有差别,那么就只有在机会很少(5%)、很罕有的情况下,才会出现目前这样本的情况。虽然还是有5%机会出错(1-0.05=5%),但我们还是可以「比较有信心」的说:目前样本中这情况(男女生出现差异的情况)不是巧合,是具统计学意义的,「总体中男女生不存差异」的虚无假设应予拒绝,简言之,总体应该存在著差异。 每一种统计方法的检定的内容都不相同,同样是t-检定,可能是上述的检定总体中是否存在差异,也同能是检定总体中的单一值是否等于0或者等于某一个数值。 至于F-检定,方差分析(或译变异数分析,Analysis of Variance),它的原理大致也是上面说的,但它是透过检视变量的方差而进行的。它主要用于:均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用、方差齐性(Equality of Variances)检验等情况。 4. T检验和F检验的关系 t检验过程,是对两样本均数(mean)差别的显著性进行检验。惟t检验须知道两个总体的方差(Variances)是否相等;t检验值的计算会因方差是否相等而有所不同。也就是说,t检验须视乎方差齐性(Equality of Variances)结果。所以,SPSS在进行t-test for Equality of Means的同时,也要做Levene's Test for Equality of Variances 。 4.1 在Levene's Test for Equality of Variances一栏中 F值为2.36, Sig.为.128,表示方差齐性检验「没有显著差异」,即两方差齐(Equal Variances),故下面t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。 4.2. 在t-test for Equality of Means中,第一排(Variances=Equal)的情况:t=8.892, df=84, 2-Tail Sig=.000, Mean Difference=22.99 既然Sig=.000,亦即,两样本均数差别有显著性意义! 4.3 到底看哪个Levene's Test for Equality of Variances一栏中sig,还是看t-test for Equality of Means中那个Sig. (2-tailed)啊? 答案是:两个都要看。 先看Levene's Test for Equality of Variances,如果方差齐性检验「没有显著差异」,即两方差齐(Equal Variances),故接著的t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。 反之,如果方差齐性检验「有显著差异」,即两方差不齐(Unequal Variances),故接著的t检验的结果表中要看第二排的数据,亦即方差不齐的情况下的t检验的结果。 4.4 你做的是T检验,为什么会有F值呢? 就是因为要评估两个总体的方差(Variances)是否相等,要做Levene's Test for Equality of Variances,要检验方差,故所以就有F值。 另一种解释: t检验有单样本t检验,配对t检验和两样本t检验。 单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。 配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。 F检验又叫方差齐性检验。在两样本t检验中要用到F检验。 从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。 其中要判断两总体方差是否相等,就可以用F检验。 若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。 简单来说就是实用T检验是有条件的,其中之一就是要符合方差齐次性,这点需要F检验来验证。 5. 如何判定结果具有真实的显著性 在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。通常,许多的科学领域中产生p值的结果0.05被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果0.05p0.01被认为是具有统计学意义,而0.01p0.001被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。 6. 所有的检验统计都是正态分布的吗 并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、f检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。
个人分类: 研究方法|5581 次阅读|0 个评论
SPSS中的参数检验(二)
热度 1 xiezilai 2010-9-20 09:13
题外话:国内教材的最大特点,就是知其然不知其所以然。教材烂熟后,应用时依然在掏浆糊,请原谅我的愚钝 SPSS中的单样本t检验、两样本t检验和单因素方差分析都是均值检验。前两者很好理解,方差分析只是处理多于2个样本的假设检验问题。 国内教材在介绍统计量 时,很少提及标准误(SE)这个词,原因不详。其实式中分母就是标准误,而统计量就是计算样本均值跟总体均值之间的差异有几个标准误。然后就是正态分布规律,95%与1.96 独立样本t检验与配对t检验之间的区别。使用中区分起来很容易,有关联的两样本采用Paired-Samples T Test(如比较同一组干电池的电压在存放前后是否存在差异),独立两样本采用Independent-Samples T Test(如比较两个城市的GDP是否存在差异),但两者的计算过程存在区别。虽然两者的统计量形式类似,但变量含义完全不同。 对独立样本,考察的是两组数据间整体上的关系,只计算数据的平均值和方差,样本大小可以不同。以A样本和B样本举例,式中分子为两样本的均值差,分母则为两样本标准误的平方和开根号。 对配对样本,考察的是一一对应的两组数据间的关系,计算成对的数据间的差异,而忽略不同对之间的关联,其统计量实际上是配对差值与总体均数0进行比较,即推断配对差值均数与0是否存在差异。因此式中分子是差值均数与0之差的绝对值,分母则为差值标准误。显然,两样本大小必须一致。 实践中存疑,请大侠指点。 问题描述:有10种课本,在北京、上海、广州的销售量见下表。请问,这三个城市的居民对这些课本的需求是否存在差异。 北京 上海 广州 课本1 100 200 245 课本2 11 9 30 课本3 20 30 70 课本4 50 40 90 课本5 60 70 50 课本6 20 15 16 课本7 7 9 10 课本8 5 10 20 课本9 30 40 50 课本10 80 60 70
个人分类: SPSS学习|7019 次阅读|1 个评论
您的t检验显著结果只是因为你的运气吗?
limx54 2009-11-19 23:28
In the xenograft mouse experiment, there were 5 mice per group used. Whether this could lead to a proper statistical analysis remains unclear. The authors need to give a clarification.这是一位审稿人在稿件回复中问我一个做分子生物学朋友的问题(注:这是一个来检验某种生物处理是否有效果的常规试验,通常的做法就是做两组数据,一组来自生物处理,另外一组来自未处理的对照,然后用t检验,看看p-value是否小于0.05)。审稿人的大意是,实验中每组用5个小鼠能否给出合理的统计分析?实际上就是问您的实验样本够不够数的问题? 您可能有点糊涂了:我的统计检验都告诉我是显著了,怎么会不够数?如果不够数目又怎么会显著?更深入一点,审稿人关心的问题是:您的显著是确实反映了实验效用,还是本来实验没啥子效用,您只这次运气好而侥幸碰到一组产生显著的数据?如果实验确实有很强的效用,在测试5个老鼠的情况下,达到显著的可能性很大,如90%。那么这种通过是意料之中的。反之,实验几乎没有效果,在测试5个老鼠的情况下,达到显著的可能性相当小,如5%。那么这个显著一般认为只是运气好而已。一个您可能比较熟悉的例子就是中六合彩。比方说,某同志买了10块钱的彩票就中了100万的六合彩大奖。可想而知,这个事件发生的概率是小之又小的。既然它发生了,往往只能说明该同志的运气好,并不能由此推断这个六合彩大奖中奖率高。如果您依照这个推断行事,认为赚钱的机会来了的话,您将会赔得很惨。 所以,要回答这个问题就必须计算能够达到显著水平0.05的概率。对于这个试验,可以认为生物处理的效用是一定的(如果有的话),检验的老鼠越多,就越能提高达到显著性水平的概率。给定一个概率标准(如80%),可以从理论上计算至少需要多少只老鼠。这就是统计上的所谓最小样本量。很多统计软件如SPSS,SAS等都可计算理论最小样本量。我曾经发现一个界面很友好的在线计算工具,http://www.danielsoper.com/statcalc/calc47.aspx。比方说当效用(Effect Size)为2的时候,如果希望有80%的概率(也叫统计功效,Statistical Power Level)达到显著性水平0.05(通常叫Alpha Level)的话,单尾t检验最少需用8个样本(每组4个),双尾t检验至少需用16个(每组6个样本)。这里很重要的前提就是,已知效用。这又似乎有点怪异,如果我都已知效用了,还要做实验检验干嘛?!的确,您一般是不知道效用的。所以这里要用到另外一个工具来估算效用,http://www.danielsoper.com/statcalc/calc48.aspx。计算也很简单,输入每组的均值和标准差,点击按钮就出结果了。通过这两个工具计算,我朋友的那个试验达到以90%的概率达到显著的最小样本是8个老鼠(每组4个)。所以,我建议他这样回复:通过统计计算,在我们的样本中只需要每组4个样本就可90%的概率达到0.05的显著性水平。所以,这个基于每组5个小鼠的统计分析结果应该是合理的。 但有一点需要注意的就是,如果用得到的试验数据先估计效用,然后又用同样的数据做统计检验的做法是属于不得以而为之的做法(因为没有其他的数据了)。不是一种严格的做法。这往往会得到过于乐观的结果。比方说,因为您运气好,您得到一组数据碰巧可以达到显著性水平,如果用它来估计效用,其估计值肯定会比较高(不然,达不到显著水平)。相应地,用这个效用计算出来的概率也会比较高(在给定样本大小的情况下)。这样一来,您还是避免不了只是运气而已的嫌疑。比较保险的做法是用与检验不一样的数据估计效用。
个人分类: 统计学习|16187 次阅读|1 个评论
T检验、F检验和统计学意义(P值或sig值)
zhao1198 2009-10-7 18:07
http://blog.znsunimage.com/2008/04/653/t-test-and-f-test-and-p-or-sig-value 1. T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布 (probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很 少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没 能确定。 F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的机率。 2. 统计学意义(P值或sig值) 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可 信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。 如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实 验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关 联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的p值通常被认为是可接受错误的边界水平。 3. T检验和F检验 至於具体要检定的内容,须看你是在做哪一个统计程序。 举一个例子,比如,你要检验两独立样本均数差异是否能推论至总体,而行的t检验。 两样本(如某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体,代表总体的情况也是存在著差异呢? 会不会总体中男女生根本没有差别,只不过是你那麼巧抽到这2样本的数值不同? 为此,我们进行t检定,算出一个t检定值。 与统计学家建立的以「总体中没差别」作基础的随机变量t分布进行比较,看看在多少%的机会(亦即显著性sig值)下会得到目前的结果。 若显著性sig值很少,比如0.05(少於5%机率),亦即是说,「如果」总体「真的」没有差别,那麼就只有在机会很少(5%)、很罕有的情况 下,才会出现目前这样本的情况。虽然还是有5%机会出错(1-0.05=5%),但我们还是可以「比较有信心」的说:目前样本中这情况(男女生出现差异的 情况)不是巧合,是具统计学意义的,「总体中男女生不存差异」的虚无假设应予拒绝,简言之,总体应该存在著差异。 每一种统计方法的检定的内容都不相同,同样是t-检定,可能是上述的检定总体中是否存在差异,也同能是检定总体中的单一值是否等於0或者等於某一个数值。 至於F-检定,方差分析(或译变异数分析,Analysis of Variance),它的原理大致也是上面说的,但它是透过检视变量的方差而进行的。它主要用于:均数差别的显著性检验、分离各有关因素并估计其对总变异 的作用、分析因素间的交互作用、方差齐性(Equality of Variances)检验等情况。 4. T检验和F检验的关系 t检验过程,是对两样本均数(mean)差别的显著性进行检验。惟t检验须知道两个总体 的方差(Variances)是否相等;t检验值的计算会因方差是否相等而有所不同。也就是说,t检验须视乎方差齐性(Equality of Variances)结果。所以,SPSS在进行t-test for Equality of Means的同时,也要做Levene's Test for Equality of Variances 。 4.1 在Levene's Test for Equality of Variances一栏中 F值为2.36, Sig.为.128,表示方差齐性检验「没有显著差异」,即两方差齐(Equal Variances),故下面t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。 4.2. 在t-test for Equality of Means中,第一排(Variances=Equal)的情况:t=8.892, df=84, 2-Tail Sig=.000, Mean Difference=22.99 既然Sig=.000,亦即,两样本均数差别有显著性意义! 4.3 到底看哪个Levene's Test for Equality of Variances一栏中sig,还是看t-test for Equality of Means中那个Sig. (2-tailed)啊? 答案是:两个都要看。 先看Levene's Test for Equality of Variances,如果方差齐性检验「没有显著差异」,即两方差齐(Equal Variances),故接著的t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。 反之,如果方差齐性检验「有显著差异」,即两方差不齐(Unequal Variances),故接著的t检验的结果表中要看第二排的数据,亦即方差不齐的情况下的t检验的结果。 4.4 你做的是T检验,为什么会有F值呢? 就是因为要评估两个总体的方差(Variances)是否相等,要做Levene's Test for Equality of Variances,要检验方差,故所以就有F值。 另一种解释: t检验有单样本t检验,配对t检验和两样本t检验。 单样本t检验:是用样本均数代表的未知总体均数和已知总体均数进行比较,来观察此组样本与总体的差异性。 配对t检验:是采用配对设计方法观察以下几种情形,1,两个同质受试对象分别接受两种不同的处理;2,同一受试对象接受两种不同的处理;3,同一受试对象处理前后。 F检验又叫方差齐性检验。在两样本t检验中要用到F检验。 从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。 其中要判断两总体方差是否相等,就可以用F检验。 若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检 验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的 总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方 法。 简单来说就是实用T检验是有条件的,其中之一就是要符合方差齐次性,这点需要F检验来验证。
个人分类: STAT|420 次阅读|0 个评论
生物统计学习笔记—样本平均数的假设检验
wangzhong 2009-3-2 22:12
u检验(u-test)大样本平均数的假设检验 当总体方差 已知,或者总体方差未知但样本为大样本( )时,样本平均数的分布服从正态分布,标准化后服从于标准正态分布,即u分布。因此用u检验法进行假设检验。 生物学研究中样本容量很少达到30,故略。 t检验(t-test)小样本平均数的假设检验 当样本容量小于30,且总体方差 未知时,检验样本平均数 与指定总体平均数 的差异显著性,或检验两个样本平均数 和 所属总体平均数 和 是否相等的方法。 一个样本平均数的t检验: 总体方差未知且样本容量n30,小样本的 与 相差较大,故 遵循自由度 的t分布。即: , , ( 样本方差; 总体方差;s样本标准差) 例:成虾的平均体重一般为21g。在饲料中添加酵母培养物后,随即抽取16只,体重为20.1,21.6,22.2,23.1,20.7,19.9,21.3,21.4,22.6,22.3,20.9,21.7,22.8,21.7,21.3,20.7。检验添加培养物后成虾体重与平均体重差异是否显著。 (1)提出假设 : ,即添加培养物后成虾体重没有显著提高。 : ; (2)选取显著水平 ; (3)概率计算: =21.51875 s=0.92824, =0.23206 t=(21.51875-21)*4/0.92824=2.2354 查询双尾t值表,df=15时, =2.131,t ,故P0.05 (4)推断:否定 ,接受 ,即添加培养物后成虾体重与平均体重差异显著。 spss应用: spss分析步骤:数据输入AnalyzeCompare MeansOne-Samples T Test Test Variable 框:待分析的样本(weight) Test Value框:已知的总体平均值(21) 结果输出: 非配对样本(成组样本)均数比较的t检验: 检验两个样本平均数 和 所属总体平均数 和 是否相等,经常用于比较生物学研究中不同处理效应的差异显著性。两个样本是从各自总体中抽取的,其所含变量之间没有任何关联,所以,无论两样本容量是否相同,均可以组平均数进行相互比较,检验其差异显著性。 注:t检验前,应首先进行F检验,以确定其方差齐性。 双样本等方差假设: 即两样本的总体方差 和 未知,但可假设 。首先,以样本各自的自由度 和 作为权数,用样本方差 和 求出平均数差数的方差 ,作为对 的估计: ,则有两样本平均数差数的标准误 : ( 时) 此时: ,具有自由度 。 例:分别测定某物种在两个不同的海拔高度1和2的比叶面积,每个高度测定5组,数据分别为: 海拔高度1:128.59,139.75,137.78,142.04,130.31; 海拔高度2:165.37,153.01,142.37,150.33,143.00。 检验两海拔高度上比叶面积差异是否显著。 (1)假设 : ,即两海拔高度上比叶面积没有差异, : ; (2)取显著水平 ; (3)概率计算: =135.69, =35.13, =150.81, =87.34, 则: =61.23, =4.95, t=-3.0551,自由度df=(5-1)+(5-1)=8时, ,所以|t| ,故p0.05, (4)推断:否定 ,接受 ,差异显著。 spss应用: spss分析步骤:数据输入AnalyzeCompare MeansIndependent-Samples T Test Test Variable 框:待分析的样本; Grouping Variable框:组别; Define Groups:定义要检验的两组的代码。 结果输出: 上图中Independent Samples Test表分为两种情况:等方差假设和异方差假设,此例中两总体方差齐性,故应看第一行,即等方差假设的结果。 双样本异方差假设: 两样本的总体方差 和 未知,且 ,但 时,仍可用t检验,计算方法与等方差假设相同,但自由度df应该用n-1,而非2(n-1)。 两样本的总体方差 和 未知,且 , 时,统计数不再服从t分布,只能进行近似t检验。(略) 配对样本均数比较的t检验: 要求两样本间随即变量配偶成对。进行假设检验时,只要假设两样本的总体差数 ,而不必假定两样本总体方差相等。 设两样本的变量分别为 和 ,共配成n对,各对的差数为 ,则样本差数的平均数: 样本差数方差为: 样本差数平均数的标准误: t值为: ,具有自由度 。 例:研究放牧对土壤氮含量的影响时,分别在8个不同海拔设置围栏,3年后在各海拔围栏内外各取一次土壤分析其氮含量,结果如下: 检验围栏控制对土壤氮含量是否有显著影响。 (1)假设 : ,即两样本总体差数没有显著差异; : , (2)取显著水平 (3)概率计算: =0.0485 =0.0468112 =0.0485/0.0468112=1.036,查表,当df=8-1=7时, =2.365,故t ,p0.05。 (4)推断:接受 ,否定 ,即围栏设置对土壤氮含量的影响不显著。 spss应用: spss分析步骤:数据输入AnalyzeCompare MeansPaired-Samples T Test Paired Variables:配对分析的样本。 结果输出: Paired Samples Statistics:配对样本基本统计量 Paired Samples Correlations:配对样本相关关系 Paired Samples Test:配对样本t检验结果 Mean:两样本变量差数的平均数; Std. Deviation:两样本差数的标准差; Std. Error Mean:两样本差数的标准误; 95% Confidence Interval of the Difference:两样本差数总体平均数的95%可信区间; Sig. (2-tailed):双尾p值。
个人分类: 资料积累|20179 次阅读|1 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-25 16:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部