黄河宁
为什么连续随机变量的贝叶斯定理可能是错误的?
2020-10-29 11:41
阅读:4125

在贝叶斯统计学中,如果未知参数是连续随机变量,未知参数的先验信息以先验分布来表征,而当前信息(测量数据)以似然函数来表征。则连续随机变量的贝叶斯定理的表达式为:

后验分布 ∝ 先验分布 × 似然函数                             (1)

如果没有先验信息,统计推断只能依赖于当前信息(测量数据),这时可以假定先验分布为均匀分布。则式(1)退化为:

后验分布 = 归一化的似然函数                                 (2)

显然式(2)是错误的,因为似然函数不是概率分布。但是贝叶斯统计学的支持者们通常不接受均匀分布,从而避免式(2)暴露出来的方法论的错误。

在本质上,式(1)是用“先验分布”来对“似然函数”进行“调制”的运算。然而笔者在现有文献资料中没有找到对这种“调制”运算有效性的严格证明。似乎式(1)在很大程度上是作为“公理”来接受和使用的。

笔者最近发现式(1)违反了“自洽运算原则” (the principle of self-consistent operation) 1】,并且根据“信息汇总定律”(the law of aggregation of information (LAI))和“贝叶斯-频率转换规则” (the frequentist-Bayesian transformation rule) 推导出连续随机变量的新的贝叶斯定理为:

后验分布 ∝ 先验分布 × 当前分布                (3)

当前分布可以利用当前信息(测量数据)得到。

式(3)遵循“自洽运算原则”。十分重要的是,式(3)也可以根据频率学派的采样理论和“概率分布合成定律” (the law of combination of distributions (LCD)) 推导出来2】。因此,贝叶斯统计推断与频率统计推断其实是可以统一的。

论文1】和【2】全文可以通过下面的链接下载 。

【1】Huang, H. (2020).  A new Bayesian method for measurement uncertainty analysis and the unification of frequentist and Bayesian inference, preprint, DOI: 10.13140/RG.2.2.35338.08646, available on ResearchGate: https://www.researchgate.net/publication/344552280_A_new_Bayesian_method_for_measurement_uncertainty_analysis_and_the_unification_of_frequentist_and_Bayesian_inference?channel=doi&linkId=5f7fd8a5458515b7cf71d5ec&showFulltext=true

【2】 Huang, H. (2020).  Two simple and practical frequentist methods for combining prior information with current measurement in uncertainty analysis. Cal Lab the International Journal of Metrology, 27(3), 22-32.  available on ResearchGate: https://www.researchgate.net/publication/344502279_Two_simple_and_practical_methods_for_combining_prior_information_with_current_measurement_in_uncertainty_analysis

转载本文请联系原作者获取授权,同时请注明本文来自黄河宁科学网博客。

链接地址:https://m.sciencenet.cn/blog-3427112-1256217.html?mobile=1

收藏

分享到:

当前推荐数:3
推荐人:
推荐到博客首页
网友评论3 条评论
确定删除指定的回复吗?
确定删除本博文吗?