科学网

 找回密码
  注册
科学网 标签 test 相关日志

tag 标签: test

相关日志

每日翻译20190422
Bearjazz 2019-4-22 07:13
# 编者信息 熊荣川 明湖实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz An approximately unbiased (AU) test that uses a newly devised multiscale bootstrap technique was developed for general hypothesis testing of regions in an attempt to reduce test bias. It was applied to maximum-likelihood tree selection for obtaining the confidence set of trees. The AU test is based on the theory of Efron et al. (Proc. Natl. Acad. Sci. USA 93:13429-13434; 1996), but the new method provides higher-order accuracy yet simpler implementation. The AU test, like the Shimodaira-Hasegawa (SH) test, adjusts the selection bias overlooked in the standard use of the bootstrap probability and Kishino-Hasegawa tests. The selection bias comes from comparing many trees at the same time and often leads to overconfidence in the wrong trees. The SH test, though safe to use, may exhibit another type of bias such that it appears conservative. Here I show that the AU test is less biased than other methods in typical cases of tree selection. These points are illustrated in a simulation study as well as in the analysis of mammalian mitochondrial protein sequences. The theoretical argument provides a simple formula that covers the bootstrap probability test, the Kishino-Hasegawa test, the AU test, and the Zharkikh-Li test. A practical suggestion is provided as to which test should be used under particular circumstances. 为了减少 多区域通用假设检验偏差 ,近无偏检验( AU test )这一多尺度自举检验技术被开发了出来。它应用于最大似然树选择,以得到树的置信集。 AU 检验基于 Efron 等人的理论( Proc. Natl. Acad. Sci. USA 93:13429-13434; 1996 ),但新方法精度更高,操作更简便。 AU 检验,像 Shimodaira-Hasegawa ( SH )检验一样,调整了选择偏差,而这些偏差是被标准自举检验概率方法和 Kishino-Hasegawa 检验所忽略的。选择偏差来自于同时比较多棵树,并且常常导致错误树的过度自信。虽然使用 SH 检验较为保险,但它可能会显示出另一种类型的偏差,即偏保守。在这里,我证明了在典型的树选择情况下, AU 检验比其他方法的偏差更小。这些观点在模拟研究和哺乳动物线粒体蛋白序列分析中得到了说明。理论论证提供了一个简单的公式,涵盖了自举概率检验、 Kishino-Hasegawa 检验、 AU 检验和 Zharkikh-Li 检验。本研究还提出了在特殊情况下应采用何种检验的实用建议。 Shimodaira H . An Approximately Unbiased Test of Phylogenetic Tree Selection . Systematic Biology, 2002, 51(3):492-508.
个人分类: 翻译作品|2193 次阅读|0 个评论
A People & A Nation,Test Items
黄安年 2019-1-24 15:53
A People A Nation ,Test Items 【 William Bropby ( 威廉·布罗比 ) 著 《 人民和国家, 测试题 》,1982年版】 【黄安年个人藏书书目(美国问题英文部分编号 067 )】 黄安年辑 黄安年的博客 /2019 年 1 月 24 日 发布(第 20714 篇) 自2019年起,笔者将通过博客陆续发布个人收藏的全部图书书目,目前先发布美国问题英文书目,每本单独编号,不分出版时间先后与图书类别。 这里发布的是 William Bropby ( 威廉·布罗比 ) 著 A People A Nation ,Test Items( 《 人民和国家, 测试题 》),1982年版,237页。ISBN 0-395-31892-03-41330 照片9 张拍自该书, 1, 2, 3, 4, 5, 6, 7, 8, 9,
个人分类: 个人藏书书目|1184 次阅读|0 个评论
用数据说话系列(5): 非参数检验SteelDwass test和 Dunn test选谁
meiweipingg 2017-7-14 12:27
用数据说话系列(5): Kruskal test检验的事后两两比较方法(SteelDwass test和 Dunn test ) 选谁 梅卫平 Basic knowledge worth spreading! 和正态数据的ANOVA检验相对应的有 非正态数据的 Kruskal test,那么Kruskal test 事后两两比较用什么方法合适?在R语言里比较常用的有 SteelDwass test和 Dunn test 等。今天对自己的某数据集分析,发现 SteelDwass test出现了小问题( 不太符合数据 实际意义) ,而 Dunn test 则没有这个 小问题。OK,直接上图。 目测2008年的数据的 比2009年的要低,而SteelDwass test结果显示 2009和2010有显著差异, 而中位数差异更大的2008和2010却没有显著差异 。细思不对劲,   用了Dunn test 则解决了这个小问题   (2008和2010也显著差异了)。 纰漏和错误之处在所难免,恳请您批评指正! 系列文章 用数据说话系列(1): 样本数,数据顺序对 t test 的影响 用数据说话系列(2): 样本数,数据顺序对聚类分析的影响 用数据说话系列(3): 样本数,数据顺序对方差分析ANOVA的影响 用数据说话系列(4): 各种 t 检验 样本数 至少每组多少为宜 用数据说话系列(5): 非参数检验SteelDwass test和 Dunn test选谁
个人分类: 数据处理与统计分析|20475 次阅读|0 个评论
实例:科技论文中数据统计结果的通用写法(Statistics format)
meiweipingg 2017-6-14 10:04
偶然看到了一个杂志的 Instructions for Authors - Specific requirements , 比较细致地罗列出了 “常用统计检验结果”的写作格式, 如下。 各大期刊的数据统计结果的描述其实也都大同小异,下述格式较为通用,希望对科技论文写作新手有所帮助。 --------------------------------------------- Give means and standard errors/standard deviations with their associated sample size in the format: X ± SE = 35.09 ± 0.07 km, n = 15. When standard deviation/error is shown in an illustration, n should be given as well. Statistical tests use the following formats: (ANOVA, F (1,25) = 8.56, P = 0.035) (Kruskal-Wallis test, H 25 = 123.7, P = 0.001) (Chi-square test, X 22 = 0.23, P = 0.57) (Paired t test, t 24 = 2.33, P = 0.09) (Linear regression, r 2 = 0.94, F 1,66 = 306.87, P 0.001) (Spearman rank correlation, r s = 0.60, N = 33, P 0.01) (Wilcoxon signed-ranks test, T = 7, N = 33, P 0.05) (Mann-Whitney U test, U = 44, N 1 = 7, N 2 = 24, P 0.02) Please either give the exact P-value of a statistical test, or state P0.0xxx, if this is not possible. P=0 is not valid. 上述最后一点我的理解:一定 不能写 P = 0.0000,不管软件统计结果中P值后面是否全是零 ;根据实际情况可以写成 P 0.0001。 ---------------------------------------------------------------
个人分类: 数据处理与统计分析|9261 次阅读|0 个评论
用数据说话系列(4): 各种 t 检验 样本数 至少每组多少为宜
热度 1 meiweipingg 2016-11-25 09:12
用数据说话系列(4): 独立样本、配对样本及单样本 t 检验 样本数 至少每组多少为宜 梅卫平 Basic knowledge worth spreading! 姑且先不说 t检验前提要求数据服从正态分布,以下两点需要注意: # 注意点一:一般来讲,希望有 80% 以上的统计功效 (Statistical Power Level)假设检验才有效。 # 注意点二: 另外, 效应量(Effect Size,或R语言中为delta),反映处理效应大小的度量。即,两样本 平均数的差异,一般 delta=1 。 # n : number of observations (per group). 结果显示:一般情况(即达到80%以上统计功效的前提下), 两独立样本 双尾 t检验至少需要每组 17 个样本, 两独立样本 单尾 t 检验最少需要每组 13 个样本。 补充: power.t.test(power = 0.8,delta = 1,type = paired) # n= 9.937864 # 双尾 配对样本 t 检验 至少每组 10 个样本 power.t.test(power = 0.8,delta =1,type = paired,alternative = one.side) # n = 7.727622 # 单尾 配对样本 t 检验至少每组 8 个样本 power.t.test(power = 0.8,delta =1,type = one.sample) # n = 9.937864 # 双尾 单样本 t 检验 至少每组 10 个样本 power.t.test(power = 0.8,delta =1,type = one.sample,alternative = one.side) # n = 7.727622 # 单尾 单样本 t 检验至少每组 8 个样本 When delta=1,power against n for independent two-sample t-test(n indicates sample number per group) n 1 2 3 4 5 6 7 8 9 10 Power Na 0.09131 0.1572 0.2224 0.2859 0.3471 0.4056 0.4611 0.5133 0.5619 n 11 12 13 14 15 16 17 18 19 20 Power 0.6070 0.6486 0.6867 0.7214 0.7529 0.7813 0.8070 0.830 0.850 0.8689 n 21 22 23 ... 50 100 1000 10000 … Power 0.8852 0.8997 0.9124 0.9986 0.9999 1 1 Note : two - side t-test. # 计算过程(在R软件中运行)如下: #---------------------------------------------------------- power.t.test(n = 4, delta = 1) Two-sample t test power calculation n = 4 delta = 1 sd = 1 sig.level = 0.05 power = 0.2224633 # 样本数为4的话,统计功效very bad alternative = two.sided NOTE: n is number in *each* group power.t.test(n = 20, delta = 1) Two-sample t test power calculation n = 20 delta = 1 sd = 1 sig.level = 0.05 power = 0.8689528 # 样本数为20 的话,统计功效 good alternative = two.sided NOTE: n is number in *each* group power.t.test(power = 0.80, delta = 1) Two-sample t test power calculation n = 16.71477 # very important # 两样本双尾t test,至少每组17个样本 delta = 1 sd = 1 sig.level = 0.05 power = 0.8 alternative = two.sided NOTE: n is number in *each* group power.t.test(power = 0.80, delta = 1, alternative = one.sided) Two-sample t test power calculation n = 13.09777 # very important # 两样本单尾t test,至少每组13个样本 delta = 1 sd = 1 sig.level = 0.05 power = 0.8 alternative = one.sided NOTE: n is number in *each* group # -------------------------------------------------- # 特定情况,比如:效用值(Effect Size或曰 delta)为2的时候 power.t.test(power = 0.80, delta = 2) Two-sample t test power calculation n = 5.090008 # 特定条件,效用值=2 的情况, 双尾只需要至少每组 5个样本 delta = 2 sd = 1 sig.level = 0.05 power = 0.8 alternative = two.sided NOTE: n is number in *each* group power.t.test(power = 0.80, delta = 2, alternative = one.sided) Two-sample t test power calculation n = 3.987012 # 特定条件,效用值=2 的情况, 单尾只需要至少 每组 4 个样本 delta = 2 sd = 1 sig.level = 0.05 power = 0.8 alternative = one.sided NOTE: n is number in *each* group 参考博文: 1. 李淼新 : 您的t检验显著结果只是因为你的 运气吗? 2. Power calculations for one and two sample t tests 3. Statistical power 4. 统计功效和效应值 5. t.test with varying delta 纰漏和错误之处在所难免,恳请您批评指正! 系列文章 用数据说话系列(1): 样本数,数据顺序对 t test 的影响 用数据说话系列(2): 样本数,数据顺序对聚类分析的影响 用数据说话系列(3): 样本数,数据顺序对方差分析ANOVA的影响 用数据说话系列(4): 各种 t 检验 样本数 至少每组多少为宜 用数据说话系列(5): 非参数检验SteelDwass test和 Dunn test选谁
个人分类: 数据处理与统计分析|35501 次阅读|1 个评论
Steel.Dwass test in R: Kruskal-Wallis post hoc test
meiweipingg 2016-5-8 11:22
引子:非参数ANOVA方法常见为 Kruskal-Wallis test,它对应的事后分析或多重比较方法推荐使用Steel-Dwass test。 数据统计分析的 前提条件 十分重要而且很容易被忽略,比如数据是否 正态分布 ,多组数据间是否 方差齐性 ,等等,满足上述条件, 参数检验 OK ,否则,使用 非参数检验 。 可参考另一篇博文: 数据统计分析方法选择——多组数据比较 对于 参数检验方法 要想获取多组变量两两之间的显著性检验,如 1 way ANOVA 的事后分析 Tukey's HSD test, 相对应的 非参数检验方法 为 Kruskal wallis test 的事后分析 Steel Dwass test。 很多高IF的SCI对于非参数 Kruskal wallis test 的事后分析都可能会推荐 Steel Dwass test,相比于其他如 Tamhane's T2 test。 OK, run Steel Dwass test in R or Rstudio. 下述为转载内容。 目的 Steel-Dwass test 事后分析之多重比较 使用方法 Steel.Dwass(data, group) 引数 dat 数据集 group 变量分组 # Steel-Dwass test Steel.Dwass - function(data, # Steel.Dwass函数定义之数据集 group) # 变量分组定义 { OK - complete.cases(data, group) # 剔除缺省值 data - data group - group n.i - table(group) # 各组变量频数 ng - length(n.i) t - combn(ng, 2, function(ij) { i - ij j - ij r - rank(c(data , data )) R - sum(r ]) # 检验统计量 N - n.i +n.i E - n.i *(N+1)/2 # 检验统计量的期望值 V - n.i *n.i /(N*(N-1))*(sum(r^2)-N*(N+1)^2/4) #检验统计量的方差 return(abs(R-E)/sqrt(V)) #返回 t 値 }) p - ptukey(t*sqrt(2), ng, Inf, lower.tail=FALSE) # 计算 P 値 result - cbind(t, p) # 计算結果 rownames(result) - combn(ng, 2, paste, collapse=:) return(result) } 使用举例 data - c( 6.9, 7.5, 8.5, 8.4, 8.1, 8.7, 8.9, 8.2, 7.8, 7.3, 6.8, # 第 1 组数据,11 例 9.6, 9.4, 9.5, 8.5, 9.4, 9.9, 8.7, 8.1, 7.8, 8.8, # 第 2 组数据 ,10 例 5.7, 6.4, 6.8, 7.8, 7.6, 7.0, 7.7, 7.5, 6.8, 5.9, # 第 3 组数据 ,10 例 7.6, 8.7, 8.5, 8.5, 9.0, 9.2, 9.3, 8.0, 7.2, 7.9, 7.8 # 第 4 组数据,11 例 ) group - rep(1:4, c(11, 10, 10, 11)) # 定义变量分组 Steel.Dwass(data, group) 检验结果 Steel.Dwass(data, group) t p 1:2 2.680234 0.036960431 1:3 2.539997 0.053980573 1:4 1.282642 0.574011771 2:3 3.746076 0.001031145 2:4 2.046776 0.170965537 3:4 3.384456 0.003976894 Steel Dwass test 编程引用文献 Reference: 尊重知识版权,请大家查阅源代码 http://aoki2.si.gunma-u.ac.jp/R/Steel-Dwass.html
个人分类: R语言|16889 次阅读|0 个评论
学生考试分数:一般不是正态分布!
热度 16 zlyang 2016-4-5 17:33
学生考试分数:一般不是正态分布! 这是2015年6月两位科学家研究的结果。图片出处,您猜,您猜,您猜猜!该文的IDS 号: CI0FN。 感谢这两位科学家! 相关链接: 2016-02-19, 学生考试的分数(电子数据) http://blog.sciencenet.cn/blog-107667-957225.html 2016-04-04,全球最聪明的中国人,到底缺少什么? http://blog.sciencenet.cn/blog-107667-967771.html 感谢您的指教! 感谢您指正以上任何错误!
6758 次阅读|44 个评论
[转载]test
JoeyXu 2016-3-7 09:01
test
9 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 16:39

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部