科学网-重复实验的假阳性概率-马耀基的博文

重复实验的假阳性概率

2024-1-7 22:20

阅读：1346

做实验一般希望得到阳性结果，因为这才说明这实验有意义，有利于论文发表。当涉及到抽样时，需要用统计方法来判断实验数据是否支持阳性结论。比如要判断某减肥药是否有效，做实验时随机抽取两组人，一组人服用减肥药，一组不服。这时需用统计方法从这两组被试服药前后的体重数据中提取信息。

有的人当实验得到阴性结果时，就重复做的实验，如果下一次是阳性，就只取阳性那一次的数据。

按照统计检验的逻辑，当数据表明假阳性的概率小于某个值时，我们就认为是阳性。假阳性即事实上阴性却被判为阳性。这个值称为显著性水平，用α表示。显著性水平是针对只做一次实验的，当重复做时，假阳性的概率就增大了。

做一次实验假阳性的概率是α，可推得n次实验出现假阳性的概率为：1-(1-α)ⁿ。

如取α=0.05，

只做1次实验时，假阳性的概率是0.05；

做2次实验时，假阳性的概率是0.10；

做3次实验时，假阳性的概率是0.14；

做4次实验时，假阳性的概率是0.19；

……

实验次数越多，假阳性的概率越大。就像买彩票，买的次数越多，中奖概率越大。如果实验一直做下去，即使事实上阴性，最终也几乎总能得到阳性的结果，统计检验失去了意义。

因此，如果要多次重复实验，显著性水平α必须做相应的修改，取更小的值。当实验重复的次数为n，希望假阳性的概率小于p时，应该取显著性水平 $.alpha =1-.sqrt[{n}] {1-p}$ 。

转载本文请联系原作者获取授权，同时请注明本文来自马耀基科学网博客。

分享到:

当前推荐数：3

推荐人：

网友评论0 条评论