科学网

 找回密码
  注册

tag 标签: 显著

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

甘肃尕海湿地保护成效显著
ghzcljz 2018-9-24 11:16
1422 次阅读|0 个评论
SPSS中正态分布验证、方差齐性检验以及Wilcox检验
热度 1 mashengwei 2017-12-18 10:44
SPSS中正态分布验证、方差齐性检验以及Wilcox检验 t检验或方差分析要求数据正态分布以及方差齐性。一般来说我们的表型数据符合正态分布以及方差齐性的要求。但对于其他类型的数据,就不一定满足这两点了。所以在进行t检验和方差分析之前,首先要进行数据的正态检验以及方差齐性检验。在SPSS中的具体操作如下: 输入的数据格式如下: 1、在菜单栏选择“分析”-“描述统计”-“探索”,如下图。 2、将分组信息group添加到“因子列表”,其他数据添加到“因变量列表”,如下图。 3、设置“统计”选项卡,所有勾选的都选上即可,如下图。 4、设置“图(T)”选项卡,设置如下图,按下图设置之后点击“继续”。 5、完成上述设置之后,点击“确定即可”,稍微等待即可出现结果。 6、这一步会出来很多统计结果,下面只介绍我们关心的正态分布检验和方差齐性检验,正态分布检验结果如下表。 从上表我们看出,显著性(p值)远小于0.001,即显著,则能够拒绝他们服从正态分布的假设。即该组数据不符合正态分析,也就不能使用t检验和方差分析(ANOVA),不管此时方差是否齐性均不能使用上述两种检验。 其实数据是否符合正态分布我们在直方图或Q-Q图上基本上也能看出,如下图,均不是正态分布。数据正态分布时,数据点基本沿直线两侧分布。 7、如果数据符合符合正态分布下面就要进行方差齐性检验,结果如下图。 从上表我们可以看到其显著性(P0.001)非常小,这说明我们要拒绝他们总体方差相等的假设,即此时方差不齐,不能使用t检验以及方差分析。 那么此时应该使用什么统计方法呢,一般时使用Mann-Whitney U 秩和检验(Wilcox检验),或者Kruskal-Wallis检验。两组数据比较使用Wilcox检验,而多组数据比较使用Kruskal-Wallis检验。切记需要满足的条件是:在进行多个群组之间比较时,因为群组不满足正态分布而不能使用ANOVA多比较,那么你可以使用Kruskal-Wallis检验,当只有两组时,使用基于两样本的Wilcox检验。 那么在SPSS里该如何进行Kruskal-Wallis检验和Wilcox检验分析呢?此部分暂时只说Wilcox检验分析,其实Kruskal-Wallis检验在SPSS里操作也是类似的,只不过Kruskal-Wallis检验适用于多重比较。分析入口如下。 点击确定之后,接下来会弹出一个设置页面,如下图,该页面包含3个子页面即“目标”,“字段”,“设置”。其中目标这个可以保持默认设置,字段以及设置的页面如下。 按照上述页面设置之后,点击运行即可。最后结果如下图所示。 这是输出的主要结果,零假设是“基因表达水平的分布在两组之间相同”,除root z13之外,P0.05,故拒绝原假设,认为基因的表达水平在两组之间有统计学差异。而root z13则没有显著的统计学差异。 欢迎关注“ 小麦研究联盟 ” ,了解小麦新进展
个人分类: 文献推荐|57985 次阅读|2 个评论
卜算子·正态分布
热度 12 kongmoon 2015-11-18 08:36
正态分布吟,离散平均律。 形若嵩峦绘起伏,理顺无章序。 天数纵茫茫,竞往巅峰聚。 山麓存留百分五,画满方家欲。   1917年美国决定参加第一次世界大战,同年4月对德宣战。由于之前美国对一战持“中立”,所以并没有备战,而现在必须在一个星期内赶制100万套军服,制衣商很为难,他都不知道军队的身高是什么样子,不得不求教于统计学家沃特·阿曼德·休哈特(Walter A. Shewhart)。休哈特说,人群中高个子和矮个子都比较少,大多数的人都是中等身材,也就是说人群的身高是一种自然的分布,也叫正态分布。只要随机抽一批美国人来量身高,得到身高的 平均值 和 标准差 后就能解决问题了。   正态分布只需要知道平均只和标准差就能轻松驾驭。平均值大家都知道,标准差就是分布中的每个数与平均值差值的平方和再开方,是一个描述群体离散程度的指标,标准差越大,群体间的差异就越大,如果群体高度接近一致,标准差则接近0。根据正态分布,入伍军人的身高分布有68%左右落在一个标准差之内,就是图中间的部分,95%的落在二个标准差之内,99。7%落在三个标准差之内…………,根据这个规律,美国军队一个星期内集结完毕开赴前线。   正态分布也叫高斯分布,10马克纸币上就印有高斯的头像和正态分布曲线图。很多看起来杂乱无章的数据,如人群的身高、智商、考试成绩、一天之内在路上跑的汽车数量、测量误差等等自然界和社会现象都服从正态分布。某事件采集的数据绝大多数都落在两个标准差范围之内,这部分曲线面积占95%,越靠近中心数越多,也就是说数字分部都有向曲线颠峰集中的趋势。而落在曲线山脚部分的只占5%,也就是说是一个很小的概率,按常理几乎不可能发生。在一次实验中如果发生了小概率事件,就可以认为这个事件与实验对照间有着本质的区别,是两件不同的事件。所以统计学上的显著水平就以5%为基准,也就是科技论文里面大量p0.05的来由,比如为了检测一种新药对某种病是否有疗效,就统计吃该种药和安慰剂的治愈率,如果两者差异显著水平p0.05就可以认为该种药有统计学意义上的疗效,p0.05就认为这种药和安慰剂一样没有统计学疗效,所以0.05这个数字在统计学上出现频率最多的数字,做对照实验的人是多么盼望出现p0.05呀!但如果一个事件不服从正态分布,这p0.05不知道多少实际意义,p值被滥用已经是心理学、流行病学领域非常普遍的问题了。
个人分类: 数学|6747 次阅读|29 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 19:30

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部