马耀基
重复实验的假阳性概率
2024-1-7 22:20
阅读:1346

做实验一般希望得到阳性结果,因为这才说明这实验有意义,有利于论文发表。当涉及到抽样时,需要用统计方法来判断实验数据是否支持阳性结论。比如要判断某减肥药是否有效,做实验时随机抽取两组人,一组人服用减肥药,一组不服。这时需用统计方法从这两组被试服药前后的体重数据中提取信息。

有的人当实验得到阴性结果时,就重复做的实验,如果下一次是阳性,就只取阳性那一次的数据。

按照统计检验的逻辑,当数据表明假阳性的概率小于某个值时,我们就认为是阳性。假阳性即事实上阴性却被判为阳性。这个值称为显著性水平,用α表示。显著性水平是针对只做一次实验的,当重复做时,假阳性的概率就增大了。

做一次实验假阳性的概率是α,可推得n次实验出现假阳性的概率为:1-(1-α)n

如取α=0.05,

只做1次实验时,假阳性的概率是0.05;

做2次实验时,假阳性的概率是0.10;

做3次实验时,假阳性的概率是0.14;

做4次实验时,假阳性的概率是0.19;

……

实验次数越多,假阳性的概率越大。就像买彩票,买的次数越多,中奖概率越大。如果实验一直做下去,即使事实上阴性,最终也几乎总能得到阳性的结果,统计检验失去了意义。

因此,如果要多次重复实验,显著性水平α必须做相应的修改,取更小的值。当实验重复的次数为n,希望假阳性的概率小于p时,应该取显著性水平

转载本文请联系原作者获取授权,同时请注明本文来自马耀基科学网博客。

链接地址:https://m.sciencenet.cn/blog-1255140-1417020.html?mobile=1

收藏

分享到:

下一篇
当前推荐数:3
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?