heninghuang的个人博客分享 http://blog.sciencenet.cn/u/heninghuang

博文

统计学改革:挑战与机遇 精选

已有 5282 次阅读 2021-12-25 08:28 |系统分类:观点评述

统计学改革(statistics reform)又称为统计改革”(statistical reform), 统计推断改革”(reform of statistical inference) , 或者统计践改革”(reform of statistical practice)。倡导统计学改革的学者(改革派)的主要观点是抛弃显著性检验,实行效应量估计”(estimation of effect size)

长期以来,统计显著性检验是科学研究中广泛使用,但是又一直有争议的统计推断方法。最近十几年来,显著性检验受到极大的挑战。这是因为越来越多的科学家和统计学家认为显著性检验的误用或滥用是造成“可重复性危机”的主要原因之一,并且认为 可重复性危机反映了显著性检验在方法论上的缺陷,即显著性检验范式本身有问题。因此,一些科学家和统计学家(改革派)呼吁彻底抛弃统计显著性概念和显著性检验。例如《美国统计学家》2019 年特刊“21 统计推断”的社宣称 在是完全停止使用‘统计显著性’一候了”1】2019年3月,800多位学者在《Nature》上名呼吁‘抛弃整个统计显著性概念’【2】

显著性检验范式的主要缺陷之一是统计显著性’代表‘科学显著性’。它引导(或者是误导)科学家关注‘统计显著性’,并且采用二分法来评定统计显著性,例如p 值<0.05被认为是具有统计显著性的标准。学术期刊倾向于发表p 值<0.05的成果助长了显著性检验的误用和滥用。与显著性检验范式相反,效应量估计 (范式)引导科学家关注‘科学显著性’,根据效应量估计直接进行科学推断。

其实统计学改革的呼声由来已久。Fidler Cumming 2007年的论文【3】中写道:“多学科都提出了改革统计实践的令人信服的据,有的已了几十年,但实现改革明十分困。” 2014年,作为统计学改革的主要倡导者 Cumming 提出了“新统计学”的概念,“新统计学”包括效应量估计,置信区间,荟萃分析等【4】。Cumming 表明这些“新”方法实际上并不新,但是广泛使用这些方法对于许多研究人员来说是新的。

统计学改革涉及制定新的期刊政策,编写和出版新的统计学教科书,编写和发行新的统计分析软件。这些工作已经在进行,尽管还没有全面铺开并且进展缓慢。例如心理学期刊《Basic and Applied Social Psychology》于2015正式禁止使用显著性检验置信区间 5】;Cumming2012出版了关于统计学的教科书【6】。Hurlbert等指出【7】:“统计学中的许多争议主要或完全是由于期刊质量控制不善、统计学教科书质量差、教学质量差、写作不清晰以及缺乏对历史文献的了解所致。” 他们建议:“[在]科学文献中不允许使用“统计显著性”一词及其所有同源词和象征性附属词,除非重点放在统计学历史及其哲学和方法论上。”

然而迄今为止,学术共同体远远无法在范式转换上达成共识。改革派倡导抛弃显著性检验范式,效应量估计作为新范式来取代显著性检验范式。保守派则强烈反对抛弃显著性检验范式【8、9】。改革派与保守派之间正在进行激烈的争论【例:8-11】。因此, 统计学改革将是一个漫长的过程。

参考文献及相关链接:

1 Wasserstein R L, Schirm A L, and Lazar N A, 2019. Editorial: Moving to a World Beyond “p < 0.05”, The American Statistician, Vol. 79. https://www.tandfonline.com/doi/full/10.1080/00031305.2019.1583913

2】Scientists rise up against statistical significance, https://www.nature.com/articles/d41586-019-00857-9

3】Fidler F and Cumming G 2007 Lessons learned from statistical reform efforts in other disciplines Psychology in the Schools 44 441-449

4】Cumming G 2014 The New Statistics: Why and How Psychological Science25 7–29


5】Trafimow D and Marks M 2015  Editorial Basic and Applied Social Psychology 37 1-2

6】Cumming G 2012 Understanding The New Statistics: Effect Sizes, Confidence Intervals, and Meta-Analysis New York: Routledge

7】Hurlbert SH, Levine RA, and Utts J 2019 Coup de Grace for a Tough Old Bull: “Statistically Significant” Expires The American Statistician 73(sup1) 352-357 DOI: 10.1080/00031305.2018.1543616

8】The ASA President’s Task Force Statement on Statistical Significence and Replicability https://errorstatistics.files.wordpress.com/2021/06/presidents-task-force-statement.pdf

9】Karen Kafdar 2021 Statistical significance, p-values, and replicability

https://errorstatistics.files.wordpress.com/2021/06/kafadar-editorial-2021.pdf

10】Megan Higgs 2021 Thoughts on the Task Force Statement https://critical-inference.com/thoughts-on-the-task-force-statement/

11】Andrew Gelman 2021 Thoughts on “The American Statistical Association President’s Task Force Statement on Statistical Significance and Replicability”

https://statmodeling.stat.columbia.edu/2021/07/12/thoughts-on-the-american-statistical-association-presidents-task-force-statement-on-statistical-significance-and-replicability/



https://m.sciencenet.cn/blog-3427112-1318043.html

上一篇:科学家真的需要‘统计显著性’和p值吗?
下一篇:“白糖”测量不确定度评估问题试解

19 张学文 尤明庆 赵凤光 王凌峰 宁利中 李宏翰 周忠浩 武夷山 陈蕴真 王安良 农绍庄 刘永辉 李侠 张鹰 谢钢 王从彦 李俊臻 李毅伟 许培扬

该博文允许注册用户评论 请点击登录 评论 (54 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-8-16 06:37

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部