科学网-缺乏思考的统计学应用-谢钢的博文

缺乏思考的统计学应用

2023-12-27 12:51

阅读：1701

国际知名的德国心理学家及方法论学者古德.吉仁泽(Gerd Gigerenzer)教授2004年在社会经济学杂志(The Journal of Social-Economics) 上发表了一篇批评统计分析的宗教仪式化的文章，题目为 Mindless Statistics（如下图所示）。根据文章的内容我把它意译为‘缺乏思考的统计学应用’。

在这篇文章中吉仁泽教授运用弗洛伊德的心理分析概念的类比的方法为我们对他所称为运用‘统计分析的宗教仪式’来做数据分析的研究人员他们头脑中存在的潜意识的思维矛盾冲突作了一个生动的描述。

首先，吉仁泽教授指出了费雪的显著性检验与奈曼-皮尔逊的假设检验之间的基本区别，那就是，对于费雪而言显著性水平的是相关的观察数据所具有的一个特性，即它反映了这组样本数据与所假设的理论之间的一种关系；而对奈曼-皮尔逊而言，α只是一个检验规则的特性，与样本数据无关。根据费雪的显著性检验，如果结果是显著的，你拒绝原假设；在结果是非显著的情况下你无法得出任何结论 - 这个检验结果的决定过程是非对称的。而奈曼-皮尔逊的假设检验，其决策过程是对称的（即你必须在原假设与备择假设之间二选一，非此即彼）。因此，费雪的显著性检验的显著性水平与奈曼-皮尔逊的假设检验的α是两个完全不同性质的东西。

接着，吉仁泽教授运用弗洛伊德的心理分析概念的类比的方法给出了下面这个研究人员在按‘统计分析的宗教仪式’来做数据分析时他们头脑中存在的潜意识的思维矛盾冲突的示意图（原文中的Fig. 2）。

吉仁泽教授的这幅研究人员头脑中的潜意识的思维矛盾冲突示意图可以这么解读。我们在实际研究工作中做统计推断分析时，从自我（主观/自然）的角度总是按费雪的显著性检验模式去做的。比如，只检验一个原假设；在实验完了以后才确定一个显著性的水平；样本容量根据经验法则确定；让文章得以发表，但心里却总有一种歉疚感。这种歉疚感的内在原因在于费雪的显著性检验模式是不符合演绎推理逻辑的。于是我们就有了按奈曼-皮尔逊的假设检验（超我）模式进行数据分析的需要：需要对两个或更多的假设进行检验；在进行实验前就要确定α（第一类错误阈值）与β（第二类错误阈值）；确定样本容量；不对（无法针对一组样本数据的分析结果）所检验的假设做真伪的判断结论…。奈曼-皮尔逊的假设检验模式是符合演绎推理逻辑的，但做科学研究我们需要对一组样本数据的分析结果也能作出某种结论性的判断。其实，研究人员内心真正的‘本我’想得到是贝叶斯统计分析才能得到的关于各个可能的科学假设的验后概率是多少！

亲爱的读者，如果你也是众多的科研工作者之中的一员，也常常在应用统计推断分析对数据进行建模分析，并且希望可以按分析结果对自己的相关的研究成果做一个结论性的判断，你不妨也思考一下，吉仁泽教授给出的这幅研究人员头脑中的潜意识的思维矛盾冲突示意图是否也与你有关呢？

转载本文请联系原作者获取授权，同时请注明本文来自谢钢科学网博客。

链接地址：https://m.sciencenet.cn/blog-3503579-1415545.html?mobile=1

分享到:

当前推荐数：19

推荐人：

李毅伟郑永军汪凯高宏宁利中尤明庆王成玉葛及杨正瓴檀成龙孙颉武夷山杜占池马鸣周忠浩黄河宁朱晓刚刘跃池德龙

推荐到博客首页

网友评论1 条评论

该博文允许注册用户评论请点击登录