博文

经典的“误差理论”过时了吗？

已有 2210 次阅读 2022-11-15 08:43 |个人分类:测量不确定度|系统分类:观点评述

经典的误差理论起源于 18 至 19 世纪（例如 Airy 1861）【1】。正态分布，也被称为误差定律，在误差理论中起着重要作用。误差理论假设被测量的物理量存在真值，尽管真值可能是未知的。误差定义为测量值与真值之差。对于直接测量，测量公式为：误差=观测值-真值。在误差理论中，误差主要被划分为两类：“随机误差”和“系统误差”。随机误差导致重复测量中测量值的随机变化，它可以通过平均重复测量结果来减小。对重复测量的数据进行统计分析可以量化随机误差，无需知道真值。系统误差在重复测量中是一“恒定”误差，测量值总是大于或小于真值。如果不知道真值，就无法量化系统误差。直到20世纪90年代，测量领域采用的误差分析遵循经典的误差理论，但是对于如何表示测量结果及其误差没有统一的标准。

1993年，国际标准化组织(ISO) 联合7个国际组织发布了《测量不确定度表示指南》（Guide to the Expression of Uncertainty in Measurement (GUM))【2】。《指南》建立了测量不确定度评定体系。《指南》的发布标志着从传统的误差分析到不确定度分析的范式转变。《指南》不确定度体系的统计学基础是奈曼（Jerzy Neyman）的置信区间理论，基于学生氏t分布的小样本理论、以及有效自由度公式。《指南》引进了标准不确定度和扩展不确定度的概念，t区间半宽定义为扩展不确定度。《指南》有意回避使用“真值”和“误差”这两个术语，并且不再采用随机/系统误差分类，而是将不确定度划分为A类和B类。通过实测数据统计分析得到的不确定度为A类。通过其它方法（比如历史数据或者仪器生产商提供的精度指标）得到的不确定度都归于B类。从1997年开始，（国际）计量指导联合委员会 (JCGM)（Joint Committee for Guides in Metrology）下属第一工作组（WG1）负责《指南》及其补充文件的修改、撰写和出版。迄今为止，《指南》2008年版仍然是现行国际标准。

然而，学术界对作为《指南》不确定度体系统计学基础的置信区间理论一直存在质疑。事实上，奈曼在上个世纪30年代提出置信区间理论时就受到质疑。著名统计学家费歇尔指出置信区间理论的主要缺陷是“结果的不唯一性”。后来，著名质量管理专家戴明（Deming)【3】告诫:”… 学生还应该跳过教科书中有关置信区间和显著性检验的段落，因为这些计算在科学和工业分析问题中没有应用。”然而，置信区间与显著性检验通过统计学教科书广泛传播，成为统计推断的主流范式。最近十几年来，学术界对置信区间理论的质疑越来越强烈。例如Morey 等人【4】2016年发表了一篇题目为：“对置信区间置信的谬误”的论文，建议摒弃置信区间。一些学者认为，统计显著性检验和置信区间的应用和滥用是造成“可重复危机”的主要原因之一。心理学期刊《Basic and Applied Social Psychology》自2015年开始禁止使用统计显著性检验和置信区间【5】。另外，基于学生氏t分布的统计推断也受到质疑，例如【6、7、8、9】。

JCGM 第一工作组以及一些学者认为《指南》的A类不确定度评估是基于频率学派的客观概率观点，而B类不确定度评估是基于贝叶斯学派的主观概率观点，因此《指南》在方法论上不自洽。2012年，JCGM 第一工作组开始采用贝叶斯统计学对《指南》进行修订。2014年12月，JCGM 将《指南》修订版草稿发给 JCGM 6个成员国和25个国家的计量研究院征求意见，于2015年6月收到了1000多条反馈意见，但是其中大部分是负面意见【10】。因此，JCGM 不得不承认《指南》修订版草稿未能得到测量学界的认可。根据JCGM官方网站2019年5月4日的消息，JCGM 暂时放弃对《指南》的修订，继续保留《指南》2008年版，但是计划出版一个基于贝叶斯统计学的不确定度评估文件。《指南》修订版草稿的失败不是偶然的。一些学者明确表示反对基于贝叶斯统计学修订《指南》，并且指出了贝叶斯方法的缺陷（例如：【11】）。

笔者认为经典的误差理论并没有过时。误差理论有其自身的优点。它在统计学和实际应用中有着悠久的历史。随机误差和系统误差都有着明确的物理意义。在许多实际测量中，例如制造商对测量仪器的标定，术语“误差”是不可避免的。一些最近的文献和 ISO 标准（例如，ISO 21748： 2010【11】）仍然遵循经典的误差理论。但是另一方面，测量不确定度理论也有其自身的优点。《指南》不确定度体系的一大优点是对随机和系统效应导致的测量不确定度给出一致的处理方法【13】。此外，《指南》关于A类/B类不确定度分类在实践中很有用。笔者认为可以将经典的误差理论与现代的不确定度理论结合起来建立“测量误差与不确定度的统一理论”【14】。“统一理论”保留两种理论中的合理部分，去除不合理部分（比如摒弃置信区间）。“统一理论”恢复使用误差概念和随机/系统误差分类，同时保留A类/B类不确定度分类。在“统一理论”中，扩展不确定度定义为概率区间的半宽，即“概率误差限”，根据中心极限定理直接进行统计推断，不采用基于学生氏t分布的统计推断。

作为测量领域的实际工作者，笔者非常赞成对《指南》进行修订，因为《指南》确实存在一些缺点和局限性。笔者认为《指南》主要存在两个关键问题：（1）《指南》对测量不确定度的两种定义不一致，（2）《指南》计算扩展不确定度的方法有局限性或缺陷。这两个问题在“测量误差与不确定度的统一理论” 中都得到解决。因此，笔者建议根据“统一理论”对《指南》进行修订【14、15】。

参考文献

【1】Airy G B 1861 On the Algebraical and Numerical Theory of Error of Observations and the Combination of Observations (Cambridge and London: Macmillan and Co.)

【2】Joint Committee for Guides in Metrology (JCGM) 2008 Evaluation of Measurement Data - Guide to the Expression of Uncertainty in Measurement (GUM 1995 with minor corrections) Sevres, France

【3】Deming W E 1982 Out of the Crisis The MIT Press p507

【4】Morey R D, Hoekstra R, Rouder J N, Lee M D and Wagenmakers E-J. 2016 The fallacy of placing confidence in confidence intervals Psychon Bull Rev 23 103-123 https://rd.springer.com/article/10.3758%2Fs13423-015-0947-8

【5】Trafimow D and Marks M 2015 Editorial Basic and Applied Social Psychology 37(1) 1-2

【6】Matloff N 2014 Open Textbook: From Algorithms to Z-Scores: Probabilistic and Statistical Modeling in Computer Science (University of California, Davis)

【7】Matloff N 2014 Why are we still teaching t-tests? On the blog: Mad (Data) Scientist—data science, R, statistic https://matloff.wordpress.com/2014/09/15/why-are-we-still-teaching-about-t-tests/

【8】Huang H 2018 Uncertainty estimation with a small number of measurements, Part I: new insights on the t-interval method and its limitations Measurement Science and Technology 29 https://doi.org/10.1088/1361-6501/aa96c7

【9】Huang H 2018 More on the t-interval method and mean-unbiased estimator for measurement uncertainty estimation Cal Lab the International Journal of Metrology 25 24-33

【10】Bich W, Cox M and Michotte C 2016 Towards a new GUM—an update Metrologia 53 S149–159

【11】White D R 2016 In pursuit of a fit-for-purpose uncertainty guide Metrologia 53 S107–24

【12】International Organization for Standardization (ISO) 2010 ISO 21748 Guidance for the use of repeatability, reproducibility and trueness estimates in measurement uncertainty estimation Geneva

【13】Bich W 2014 Revision of the 'Guide to the Expression of Uncertainty in Measurement' Why and how Metrologia 51 S155

【14】Huang H 2018 A unified theory of measurement errors and uncertainties Measurement Science and Technology 29 125003 https://doi.org/10.1088/1361-6501/aae50f

【15】Huang H 2022 Practitioner’s perspective on the GUM revision, part I: two key problems and solutions Cal Lab the International Journal of Metrology 29(3) 26-37 DOI: 10.13140/RG.2.2.21127.68009

转载本文请联系原作者获取授权，同时请注明本文来自黄河宁科学网博客。
链接地址：https://m.sciencenet.cn/blog-3427112-1363769.html

上一篇：“大牌学者”对别人的研究工作不感兴趣吗？
下一篇：超越概率分析：一种实用有效的替代 t 检验的方法

heninghuang的个人博客分享 http://blog.sciencenet.cn/u/heninghuang

博文

经典的“误差理论”过时了吗？

当前推荐数：4 推荐人：尤明庆 王安良 杨正瓴 谢钢

该博文允许注册用户评论请点击登录评论 (0 个评论)

黄河宁

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

heninghuang的个人博客分享 http://blog.sciencenet.cn/u/heninghuang

博文

经典的“误差理论”过时了吗？

当前推荐数：4 推荐人： 尤明庆 王安良 杨正瓴 谢钢

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

黄河宁

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

当前推荐数：4 推荐人：尤明庆王安良杨正瓴谢钢

该博文允许注册用户评论请点击登录评论 (0 个评论)