贝叶斯定理 ( Bayes' theorem ),是 概率论 中的一个 结果 ,它跟 随机变量 的 条件概率 以及 边缘概率分布 有关。在有些关于概率的解说中,贝叶斯定理(贝叶斯更新)能够告知我们 如何利用新证据修改已有的看法 。 通常,事件 A 在事件 B (发生)的条件下的概率,与事件 B 在事件 A 的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯定理就是这种关系的陈述。 作为一个规范的原理,贝叶斯定理 , 对于所有概率的解释是有效的;然而,频率主义者和贝叶斯主义者对于在应用中,概率如何被赋值,有着不同的看法 : 频率主义者根据随机事件发生的频率,或者 , 总体样本裡面的个数来赋值概率;贝叶斯主义者 要根据未知的命题来赋值概率。一个结果就是,贝叶斯主义者有更多的机会使用贝叶斯定理 。 目录 1 贝叶斯定理的陈 述 2 從條件概率推導貝氏定理 3 二中擇一的形式 3.1 以可能性與相似率表示貝氏定理 3.2 貝氏定理與機率密度 3.3 貝氏定理的推廣 4 範例 4.1 吸毒者检测 5 参见 6 参考资料 6.1 Versions of the essay 6.2 Commentaries 6.3 Additional material 贝叶斯定理的陈述 贝叶斯定理 是 关于随机事件 A 和 B 的 条件概率 和 边缘概率 的一則定理。 其中 P(A|B) 是在 B 发生的情况下 A 发生的可能性 。 在贝叶斯定理中, 每个名词都有约定俗成的名称 : P( A ) 是 A 的 先驗概率 或 邊緣概率 。 之所以稱為 " 先驗 " 是因為它不考慮任何 B 方面的因素。 P( A | B ) 是已知 B 發生后 A 的 條件概率 , 也由于得自 B 的取值而被稱作 A 的 后驗概率 。 P( B | A ) 是已知 A 發生后 B 的 條件概率 , 也由于得自 A 的取值而被稱作 B 的 后驗概率 。 P( B ) 是 B 的 先驗概率 或 邊緣概率 ,也作 標准化常量 ( normalized constant ) . 按這些術語, Bayes 定理可表述為: 后驗概率 = ( 相似度 * 先驗概率 )/ 標准化常量 也就是說, 后驗概率 与 先驗概率和相似度的乘積 成 正比 。 另外,比例 P( B | A )/P( B ) 也有時 被稱作 標准相似度( standardised likelihood ), Bayes 定理可表述為: 后驗概率 = 標准相似度 * 先驗概率 從條件概率推導貝氏定理 根據 條件概率 的定義。在事件 B 发生的条件下事件 A 发生的概率是 。 同樣地,在事件 A 发生的条件下事件 B 发生的概率 整理与合并這兩個方程式,我們可以找到 这个引理 有时称作 概率乘法规则 。 上式兩邊同除以 P( B ) ,若 P( B ) 是非零的,我們可以得到贝叶斯 定理 : 二中擇一的形式 貝氏定理 通常可以 再寫成下面的形式 : , 其中 A C 是 A 的 補集 (即非 A )。故上式亦可寫成: 在更一般化的情況,假設 { A i } 是事件集合裡的部份集合,對於任意的 A i ,貝氏定理可用下式表示: 以可能性與相似率表示貝氏定理 参见: 全機率定理 貝氏定理 亦可由 相似率 Λ和 可能性 O 表示: 其中 定義為 B 發生時, A 發生的可能性( odds ); 則是 A 發生的可能性。相似率( Likelihood ratio )則定義為: 貝氏定理與機率密度 貝氏定理 亦可用於 連續機率分佈 。由於 機率密度函數 嚴格上並非機率,由機率密度函數 導出 貝氏定理觀念上較為困難(詳細推導參閱 )。 貝氏定理與機率密度的關係是由求極限的方式建立: 全機率定理則有類似的論述: 如同 離散的情況,公式中的每項 均有名稱。 f ( x , y ) 是 X 和 Y 的聯合分佈; f ( x | y )是給定 Y = y 後, X 的後驗分佈; f ( y | x ) = L ( x | y )是 Y = y 後, X 的相似度函數(為 x 的函數 ) ; f ( x )和 f ( y )則是 X 和 Y 的邊際分佈; f ( x )則是 X 的先驗分佈。 為了方便起見,這裡的 f 在這些專有名詞中代表不同的函數(可以由引數的不同判斷之)。 貝氏定理的推廣 對於變數有二個以上的情況, 貝式定理亦成立 。例如: 這個式子可以由套用多次二個變數的貝式定理及 條件機率 的定義導出: 。 一般化的方法則是利用 聯合機率 去分解待求的條件機率,並對不加以探討的變數積分(意即對欲探討的變數計算邊緣機率)。取決於不同的分解形式,可以證明某些積分必為 1 ,因此分解形式可被簡化。利用這個性質,貝氏定理的計算量可能可以大幅下降。 貝氏網路 為此方法的一個例子, 貝氏網路 指定數個變數的 聯合機率分佈 的分解型式,該機率分佈滿足下述條件:當其他變數的條件機率給定時,該變數的條件機率為一簡單型式。 範例 吸毒者检测 贝叶斯定理在检测吸毒者时很有用。假设一个常规的检测结果的敏感度与可靠度均为 99% ,也就是说,当被检者吸毒时,每次检测呈阳性( + )的概率为 99% 。而被检者不吸毒时,每次检测呈阴性( - )的概率为 99% 。从检测结果的概率来看,检测结果是比较准确的,但是贝叶斯定理卻可以揭示一个潜在的问题。假设某公司将对其全体雇员进行一次鸦片吸食情况的检测,已知 0.5% 的雇员吸毒。我们想知道,每位医学检测呈阳性的雇员吸毒的概率有多高?令“ D ”为雇员吸毒事件,“ N ”为雇员不吸毒事件,“ + ”为检测呈阳性事件。可得 P(D) 代表雇员吸毒的概率,不考虑其他情况,该值为 0.005 。因为公司的预先统计表明该公司的雇员中有 0.5% 的人吸食毒品,所以这个值就是 D 的 先验概率 。 P(N) 代表雇员不吸毒的概率,显然,该值为 0.995 ,也就是 1-P(D) 。 P(+|D) 代表吸毒者阳性检出率,这是一个 条件概率 ,由于阳性检测准确性是 99% ,因此该值为 0.99 。 P(+|N) 代表不吸毒者阳性检出率,也就是出错检测的概率,该值为 0.01 ,因为对于不吸毒者,其检测为阴性的概率为 99% ,因此,其被误检测成阳性的概率为 1-99% 。 P(+) 代表不考虑其他因素的影响的阳性检出率。该值为 0.0149 或者 1.49% 。我们可以通过全概率公式计算得到:此概率 = 吸毒者阳性检出率( 0.5% x 99% = 0.495%)+ 不吸毒者阳性检出率( 99.5% x 1% = 0.995%) 。 P(+ ) =0.0149 是检测呈阳性的 先验概率 。用数学公式描述为: 根据上述描述,我们可以计算某人检测呈阳性时确实吸毒的条件概率 P(D|+) : 尽管我们的检测结果可靠性很高,但是只能得出如下结论:如果某人检测呈阳性,那么此人是吸毒的概率只有大约 33% ,也就是说此人不吸毒的可能性比较大。我们测试的条件(本例中指 D ,雇员吸毒)越难发生,發生误判的可能性越大。 参见 ^ Papoulis A.(1984). Probability, Random Variables, and Stochastic Processes, 2nd edition. Section 7.3. New York: McGraw-Hill. 概率论 数学之美番外篇:平凡而又神奇的贝叶斯方法 参考资料 Versions of the essay Thomas Bayes (1763), "An Essay towards solving a Problem in the Doctrine of Chances. By the late Rev. Mr. Bayes, F. R. S. communicated by Mr. Price, in a letter to John Canton, A. M. F. R. S.", Philosophical Transactions, Giving Some Account of the Present Undertakings, Studies and Labours of the Ingenious in Many Considerable Parts of the World 53:370 – 418. Thomas Bayes (1763/1958) "Studies in the History of Probability and Statistics: IX. Thomas Bayes's Essay Towards Solving a Problem in the Doctrine of Chances", Biometrika 45:296 – 315. ( Bayes's essay in modernized notation ) Thomas Bayes "An essay towards solving a Problem in the Doctrine of Chances" . ( Bayes's essay in the original notation ) Commentaries G. A. Barnard (1958) "Studies in the History of Probability and Statistics: IX. Thomas Bayes's Essay Towards Solving a Problem in the Doctrine of Chances", Biometrika 45:293 – 295. ( biographical remarks ) Daniel Covarrubias. "An Essay Towards Solving a Problem in the Doctrine of Chances" . ( an outline and exposition of Bayes's essay ) Stephen M. Stigler (1982). "Thomas Bayes's Bayesian Inference," Journal of the Royal Statistical Society , Series A, 145:250 – 258. (Stigler argues for a revised interpretation of the essay; recommended) Isaac Todhunter (1865). A History of the Mathematical Theory of Probability from the time of Pascal to that of Laplace , Macmillan. Reprinted 1949, 1956 by Chelsea and 2001 by Thoemmes. Additional material Pierre-Simon Laplace (1774). "Mémoire sur la Probabilité des Causes par les vénements", Savants tranges 6:621 – 656; also Œ uvres 8:27 – 65. Pierre-Simon Laplace (1774/1986). "Memoir on the Probability of the Causes of Events", Statistical Science 1(3):364 – 378. Stephen M. Stigler (1986). "Laplace's 1774 memoir on inverse probability", Statistical Science 1(3):359 – 378. Stephen M. Stigler (1983). "Who Discovered Bayes's Theorem?" The American Statistician 37(4):290 – 296. Jeff Miller et al. Earliest Known Uses of Some of the Words of Mathematics (B) . ( very informative; recommended ) Athanasios Papoulis (1984). Probability, Random Variables, and Stochastic Processes , second edition. New York: McGraw-Hill. James Joyce (2003). "Bayes's Theorem" , Stanford Encyclopedia of Philosophy . The on-line textbook: Information Theory, Inference, and Learning Algorithms , by David J.C. MacKay provides an up to date overview of the use of Bayes's theorem in information theory and machine learning. Stanford Encyclopedia of Philosophy: Bayes's Theorem provides a comprehensive introduction to Bayes's theorem. Eric W. Weisstein , Bayes' Theorem , MathWorld . Bayes' theorem at PlanetMath . 来自“ http://zh.wikipedia.org/w/index.php?title= 贝叶斯定理 oldid=18873821 ”