科学网 › 标签 › 概率预测

标签: 概率预测

相关帖子	版块	作者	回复/查看	最后发表

没有相关内容

相关日志

新冠病毒检验的可信度和概率预测: 热度 1 lcguang 2020-2-11 15:44; 摘要：假设核酸检验敏感性是0.5，特异性是0.9，被感染的基础概率是0.2；则作为检验手段，阳性的可信度是0.8，阴性的可信度是0.44；作为概率预测，阳性的可信度是0.21，阴性的可信度是0.86. 检验为阳性时，被感染的概率是0.56；检验为阴性时，被感染的概率是0.122.因为漏报率较高，有人提出用CT辅助确诊是合理的。抗病毒前线传来消息，核酸检验假阴性太多，这给救治和隔离带来极大困难，有人因此提出要配合CT等手段确诊。本文做一科普，说明假阴性和假阳性是怎么回事，根据阳性或阴性能做怎样的概率预测，以及我们应当在多大程度上相信检验结果：阴性和阳性。设医学检验中，e1表示阳性，是对有病或被感染h1的预测；e0表示阴性，是对没病或没被感染h0的预测. 设e是变量，作为证据；h是变量，作为假设。则不确定关系如下：图1 e和h的关系概率P(e1|h1)叫做敏感性，又叫真阳性率； P(e0|h0)叫特异性，又叫真阴性率。敏感性和特异性反映检验手段好坏。P(e0|h1)=1-P(e1|h1)叫假阴性率，也就是漏报比例，这个比例越小越好。 P(e1|h0)是假阳性率，也就是误报比例，这个也是越小越好。但是一个检验通常很难做到两者都小（参看下图）。漏报损失更大，所以漏报比例要小，这更加重要，要优先考虑。图2. 四个条件概率和检验分界x'的关系然而，遗憾的是，目前核酸检验新冠毒肺炎，敏感性只有0.3-0.5. 假设是0.5 （参看 https://www.thepaper.cn/newsDetail_forward_5878994 ），这意味着真感染者有一半要漏报。有人会说既然它这么低为什么还要用？医学检验中用阳性似然比反映阳性有多可靠： LR+= P(e1|h1)/P(e1|h0)=敏感性/(1-特异性) 只要特异性较大，LR+就大；根据阳性可以预测有病的概率就较大。比方说，特异性是0.9(这是假设，我没有查到核酸检验的特异性)，那么阳性似然比LR+=0.5/（1-0.9）=5. 假设有疑似症状的人被感染的先验概率（又叫基础概率）是P(h1)=0.2(目前大概是0.2)，那么可以算出 P(e1)=P(h1)P(e1|h1)+P(h0)P(e1|h0)=0.2*0.5+0.8*0.1=0.18; P(e0)=0.82. 检查出阳性后，被感染的条件概率就是 P(h1|e1)=P(h1)P(e1|h1)/ =0.2*0.5/0.18=1/1.8=0.56. 被感染的概率从0.2增加到0.56, 所以检验有用。但是阳性也不完全可信。因为阳性的误报概率是P(h0|e1)=1-0.56=0.44. 这意味着没100个阳性者有44个不是真地被感染。阴性也不完全可信，因为阳性患者中被感染和没被感染的概率是 P(h1|e0)=P(h1)P(e0|h1)/P(e0)=0.2*0.5/0.81=0.122； P(h0|e0)=1- P(h1|e0)=0.878。这意味着100个阴性的人当中有12.2个是被感染的。这就是为什么有医生呼吁要使用CT辅助确诊——因为敏感性较低。对于被感染h1，一种检验的阳性可以提高被感染的条件概率——作为另一种检验的先验概率，再使用另一种检验，如果也是阳性，则后验概率就更大。另一方面，某个被感染者被一种检验漏报后，另一种检验还可能查出来。从上面分析可以看出敏感性的重要性。但是要注意，敏感性高，并不意味着阳性e1可信，而是意味着阴性e0可信，即预测没感染可信。类似地，特异性高并不意味阴性e0可信，而是意味着阳性e1可信。本人研究归纳确证问题(参看： http://www.survivor99.com/lcg/CM/Recent.html )，得到确证度或可信度（在-1和1之间变化）：比如，对于新冠病毒检验， b1*=(5-1)/5=0.8; LR - =P(e0|h0)/P(e0|h1)= 特异性 /(1- 敏感性 )=0.9/0.5=1.8; b0*=(1.8-1)/1.8=0.44b1* 。这说明, 作为检验手段，阴性远不如阳性可信。注意：b*和基础概率P(h1)无关，只和检验手段有关，所以被称之为信道确证度。通过P(h1)和b1*也可以算出被感染的概率： P(h1|e1)= P(h1)/ 。同理有 P(h0|e0)= P(h0)/ 。但是，这一确证测度——信道确证度——和似然比一样，只反映信道或检验手段好坏，并不反映概率预测好坏。为此我们还需要预测确证度c*： c*在预测的概率大于0.5时大于0，否则小于0. 比如对于新病毒检验， c1*=(0.56-0.44)/0.56=0.12/0.56=0.21. c0*=(0.878-0.122)/0.878=0.86. 比较b*和c*可见，对于概率预测，阴性比阳新更加可信——因为预测的没被感染的概率更大。通过c*能更方便算出被感染的概率: P(h1|e1)=1/(2-c1*); P(h0|e0)=1/(2-c0*). 对于上面新冠病毒检验，通过阳性可以预测被感染的概率：P(h1|e1)=1/(2-0.21)=1/1.79=0.56。通过阴性可以预测没被感染的概率：P(h0|e0)=1/(2-0.86)=1/1.14=0.878. 上面结果和用 b* 算出的结果相同。但是在基础概率P(h1)改变的情况下，要计算被感染的概率还是用使用b*，即用公式 P ( h 1 |e1)= P ( h 1 )/ . 总结：假设敏感性是0.5，特异性是0.9，被感染的基础概率是0.2；则作为检验手段，阳性的可信度是0.8，阴性的可信度是0.44；作为概率预测，阳性的可信度是0.21，阴性的可信度是0.86. 检验为阳性时，被感染的概率是0.56；检验为阴性时，被感染的概率是0.122. 另外，通过c*，还可以很好解释乌鸦悖论。详见：信道确证和预测确证——从医学检验到乌鸦悖论笔者个人主页中相关讨论见： http://www.survivor99.com/lcg/CM/Recent.html 最新消息：中国疾病预防中心病毒病预防控制所成功研制新型冠状病毒（2019-nCoV）核酸等温扩增快速检测试剂盒，见： http://www.gov.cn/xinwen/2020-01/31/content_5473278.htm 其敏感性和特异性都是1. 预祝检验成功！; 个人分类: 疫情分析|7180 次阅读|4 个评论

更多...

帐号		自动登录	找回密码
密码			注册

关闭 安全验证

标签: 概率预测

相关帖子

相关日志

关闭安全验证