科学网

 找回密码
  注册

tag 标签: 统计陷阱

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

4月出生的人成为数学家的可能性比较大?
热度 4 sciencepress 2015-8-3 08:04
本文为统计陷阱之六:样本有偏陷阱。 样本有偏, 通常包括样本太小、样本以偏概全(不具代表性) 等情形. 在现实生活中, 人们常常会有意无意地选择偏向于有利于自己利益或观点的有偏样本说事,而对不利于自己的样本有意地将其遗忘或掩盖, 这种现象非常普遍. 下面举几个典型的例子. 案例一: 某边远地区一中学的高考本科上线率高达97%! 某年高考成绩出来后, 发现某边远地区的中学的高考成绩斐然, 本科上线率高达97%!这个指标的最大值也就是100%, 能达到97%真是不一般, 给人的震撼力还确实不小!事实上, 该校当年参加高考的学生仅30 人, 而且全部是复读生, 大多是上一届高考上了三本线的学生. 这么小的群体(即小样本), 且还包含了不少学习基础不错的学生, 即使取得100%的本科上线率也不足以说明该校是多么好的学校. 案例二:4月出生的人成为数学家的可能性比较大? 欧拉、高斯、庞加莱, 他们三人当中一个是18 世纪的世界头号数学家, 一个是19 世纪上半叶的世界头号数学家, 还有一个是19 世纪下半叶的世界头号数学家, 他们都是4 月出生的. 此外, 20 世纪的克莱因、E. 嘉当、科尔莫戈罗夫、哥德尔、阿蒂亚、香农(信息论之父)、怀尔斯(费马大定理解决者) 等一流数学家, 也都是4月份出生的, 约占20 世纪大数学家的四分之一强. 1936 年到1986 年的30 位菲尔兹奖得主中, 4 月份出生的竟有9 个, 占30%. 我们是不是应该得出结论:4月出生的人成为数学家的可能性比较大?这里的问题还是出在样本太小, 如果人数足够多, 那么才有可能给予肯定的回答. 案例三:NBA,无三分不冠军? NBA深锐观察是新浪NBA的一个著名专栏, 在2012年2 月深锐观察:无三分不冠军?湖人痼疾不除只能等死 这一期中, 作者列举了NBA1980~2011 年季后赛三分球数据, 其中包括总冠军出手次数联盟平均出手次数总冠军命中率联盟平均命中率4 项. 作者在文中声称, 三分球的命中率是最后的总冠军球队一个重要的指标. 为了说明无三分不冠军的观点, 作者选择收集了1980~2011年NBA 三分球数据. 但是作者仅选取了表格中能支持作者观点的前几行与最后几行数据. 后经仔细观察不难发现, 2010 年、2006 年、1998 年、1997 年、1996 年等多个年份的数据都不能支持作者的结论. 这里运用了局部描述的方法, 为了让那些不仔细看表格的读者相信作者的观点是有数据支撑的. 案例四:中国人的信仰 2011年1月初, 凤凰网与新生代市场监测机构联合主办的一项关于国人生活信条的大调查——征集中国人的信仰, 凤凰网在网上发布了调查问卷, 活动共收集了63707 个有效样本, 组织者称调查覆盖了来自社会各界、各阶层的人士. 果真如此吗?对于第一个问题您有自己的信仰吗? 有76.9%的人回答有;然而对于第二个问题您认为这是一个信仰缺失的时代吗? 有92.6%的人回答是. 这看似矛盾的结果是由于统计样本覆盖不全造成的, 凤凰网将调查问卷挂在网上本身就屏蔽了平时不能上网、知识水平较低、家中经济条件不佳等人群. 而凤凰网本身面对的群体也主要是受过一定程度教育的人, 这类样本与我国普通民众是有一定距离的, 因而多数人选择有 信仰. 对于第二个问题, 他们是依据对于这个社会的总体印象去回答这个问题, 所以看似矛盾的答案是受到调查方式的局限而造成的. 本号( 科学出版社微信号│微信ID:sciencepress-cspm )已揭示统计陷阱(点击标题可阅读全文): 统计陷阱│统计学犹如比基尼, 掩盖的是最重要的地方 揭秘伤不起的平均工资 折上折?瞅瞅,这些百分数陷阱! 女人对男人有多坏!? 投向统计学的重磅炸弹:辛普森悖论 本文由刘四旦摘编自 赵焕光、章勤琼、王迪 著《 真理相遇统计 》一书。 《真理相遇统计》 从统计学科的特色、人文欣赏的视野着手,运用通俗生动的语言,精彩有趣的故事、丰富典型的案例,介绍统计文化的常识及其统计在现实世界中的广泛应用.主要内容包括为何学统计、统计应用概说、统计陷阱概说、统计历史人物故事精选、统计数据概说、统计数据收集、统计数据组织、统计数据概括、统计指数概说、时间数列概说、随机抽样与抽样分布、参数估计与假设检验、检验与方差分析及其相关与回归分析.本书可作为高等院校所有专业的本(专)科生、硕士生、中学智优生、中学数学教师,具有一定数学与统计基础的高校教师以及其各行各业的行政管理人员的数学与统计文化修养提高读本,也可作为高等院校本(专)科各个专业的选修课教材或教学参考书. 非经授权,请勿转载 转载请留言或联系:(010)64000159 科学出版社│微信ID:sciencepress-cspm 专业品质 学术价值 原创好读 科学品味
个人分类: 科学书摘|8709 次阅读|8 个评论
投向统计学的重磅炸弹:辛普森悖论
热度 5 sciencepress 2015-6-24 08:37
本文为统计陷阱之三:辛普森悖论式的陷阱。 辛普森悖论式陷阱 辛普森悖论, 英国统计学家辛普森在1951 年发表的一篇论文中首次提出: 在某些情况下, 在分组比较中占优势的一方, 可能在合并后的总评中成为失势的一方 . 先考察一个简单的例子. 案例一:药效悖论 某研究单位研究出一种新药, 为了检验药是否有效, 人们对一组患者进行试验. 试验中, 给予一些患者真正的新药, 而其余患者则给以安慰剂(不含药物的药片). 结果见表1. 表1 药效试验表 试验次数 成功次数 平均 药物 100 66 66 % 安慰剂 40 24 60 % 这一试验似乎成功地确认了新药比安慰剂更有效——试验中, 66%服用新药的患者有改进的表现, 而服用安慰剂的患者有改进表现的只是60%.因为结果相近, 另一位研究者决定对这一更大的患者组重复这实验. 得到如下结果(表2). 表2 药效重复试验表 试验次数 成功次数 平均 药物 200 180 90 % 安慰剂 500 430 86 % 服用新药的患者的表现又一次胜过服用安慰剂的患者. 两位研究者对这一发现感到兴奋, 决定把他们的数据合并起来公布结果. 但是, 他们困惑地看到了最意想不到的结果(表3). 表3 药效试验合并表 试验次数 成功次数 平均 药物 300 246 82 % 安慰剂 540 454 84 % 尽管在两次试验中新药都曾比安慰剂成功, 但是将两项试验合并起来时, 服用安慰剂的患者竟然比新药更成功. 这个结果是否太让人感到惊奇了?这里的疑惑,其实就是辛普森悖论的翻版. 辛普森悖论 还有许许多多的现实版. 下面再介绍两个有趣的例子. 案例二:录取率悖论 20 世纪70 年代, 加利福尼亚大学伯克利分校就曾讨论过录取时出现的所谓女性歧视. 《科学》杂志甚至发表过一篇文章, 阐明这其实是一个辛普森悖论的经典案例. 申请与录取人数的确切数据见表4. 表4 申请与录取人数数据 系别 男性申请者 录取 比例 / % 女性申请者 录取 比例 / % 英语 825 512 62 108 89 82 俄语 560 353 63 25 17 68 西班牙语 417 138 33 375 131 35 意大利语 373 22 6 341 24 7 总计 2175 1024 47 849 261 31 我们再次清楚地看到:每个系的女性录取率都高于男性, 但总体上女性录取率还是要低一些——只有31%被录取. 这能说明女性受到了歧视吗? 从表4 可以发现:申请英语系的人多数被录取(共约64%), 意大利语只有6.5%. 由于男性大多选择容易被录取的系别, 迫使大部分女性只能选择录取条件更高的两个系. 所以总和上女性录取率低就不足为奇了. 案例三:准点率悖论 美国航空协会每年要会出版一部《准点率汇总》. 此书调查30 个入选机场中航班到港的误点百分率. 每个航空公司都有其中心区 或空中十字路口——航空网络的枢纽, 航线由此出发呈放射状向四面八方分布. 西美航空的枢纽是亚利桑那州的菲尼克斯, 那里的天空整年都很蓝. 过去, 30 个大型机场中, 较小的阿拉斯加航空公司只能飞往其中的5 个. 其位于美国中心地区的航空枢纽是西雅图, 位于最西北端, 是一个真正的多雾之地. 1991 年, 两家公司飞经的5 个机场误点数据见表5. 表5 个机场误点数据 阿拉斯加航空 西美航空 航班数 误点率 / % 航班数 误点率 / % 洛杉矶 559 11.1 811 14.4 菲尼克斯 233 5.2 5255 7.9 圣迭戈 232 8.6 448 14.5 旧金山 605 16.9 449 28.7 西雅图 2146 14.2 262 23.3 总计 3775 13.3 7225 10.9 阿拉斯加航空公司在所有5个机场都更为准点, 但总体上却是西美航空公司更为准点!可是何种考察方式才是正确的呢?是总体观察还是注重细节?完全可以说:详细的图表为我们提供了表面现象之外的信息, 并可以将此现象完全导向其反面. 从表5 中可见, 小航空公司不论天气好坏都比其竞争对手更为准时. 点评从以上几个典型的辛普森悖论真实翻版中, 我们可以得到有益的生活启示: 拿一个团体和另一个团体比较的统计方法很容易犯错, 其原因是一个团体中个别成员的差异远大于团体与团体间的差异. 辛普森悖论被人们称为是投向统计学的重磅炸弹. 不合情理, 却无可挑剔; 精致无比, 却让人难以接受. 然而, 如果稍微探究其数学实质, 那么不难发现, 在它诡异的外表掩藏下, 内部却十分简单: 本文由刘四旦摘编自 赵焕光、章勤琼、王迪 著《 真理相遇统计 》一书。《 真理相遇统计 》从统计学科的特色、人文欣赏的视野着手,运用通俗生动的语言,精彩有趣的故事、丰富典型的案例,介绍统计文化的常识及其统计在现实世界中的广泛应用.主要内容包括为何学统计、统计应用概说、统计陷阱概说、统计历史人物故事精选、统计数据概说、统计数据收集、统计数据组织、统计数据概括、统计指数概说、时间数列概说、随机抽样与抽样分布、参数估计与假设检验、检验与方差分析及其相关与回归分析.本书可作为高等院校所有专业的本(专)科生、硕士生、中学智优生、中学数学教师,具有一定数学与统计基础的高校教师以及其各行各业的行政管理人员的数学与统计文化修养提高读本,也可作为高等院校本(专)科各个专业的选修课教材或教学参考书. 非经授权,请勿转载 转载请留言或联系:(010)64000159 科学出版社│微信ID:sciencepress-cspm 专业品质 学术价值 原创好读 科学品味
个人分类: 科学书摘|9112 次阅读|10 个评论
统计陷阱│统计学犹如比基尼, 掩盖的是最重要的地方
热度 15 sciencepress 2015-6-9 08:31
对统计学的一知半解常常造成不必要的上当受骗, 对统计学的一概排斥往往造成不必要的愚昧无知. ——印度著名统计学家C.R.劳 在信息不断膨胀的现代社会中, 人们必须了解统计的基本知识应对生存环境的不断变化, 尤其需要了解一些如何防止上当受骗的统计常识, 以免自己掉进各种各样的统计陷阱之中. 可以说, 随着社会环境的日益恶化, 统计陷阱比比皆是, 而且还不断推陈出新. 因此, 我们解读现实中的各种各样的统计结果时, 务必要多一些警惕的心理与多一点批判的眼光, 以免铸成不必要的大错. 我们将陆续为您揭示7种典型的统计陷阱.今天首先考察的是“统计滥用式陷阱”. 统计滥用式陷阱 从更广泛的意义来说, 统计的滥用是人为恶意设计陷阱的一种方式. 持怀疑论调的19 世纪英国史学家托玛斯·卡莱尔(Thomas Carlyle, 1795~1881) 痛斥 统计学家 能证明他自己所需要的任何事情 . 其实, 从古到今对统计滥用的指责与讽刺一直不断, 诸如: ▓ 统计分析经常意味着对有分歧的数字进行篡改, 用意义含糊不清的办法去解决不明确的问题. ▓ 统计学家使用统计就如同一个醉汉使用街灯一样, 是用来支撑而不是用来照明. ▓ 统计学犹如比基尼游泳衣, 它暴露的是明显的地方, 而掩盖住最重要的. ▓ 政府有关部门公布的统计数据是根据其自身需要拼凑出来的. 滥用统计的例子 历史上, 滥用统计的例子可以举出很多, 下面列举两例. 第一个例子 研究 罪犯的头颅大小 . 在19 世纪, 科学家对罪犯的头颅大小进行了大量研究, 他们想找出头颅大小或形状间的差异, 借此揭示一个人的犯罪倾向. 他们比较了一组罪犯的头颅和一组普通人的头颅大小. 当然, 研究人员发现了差异. 给定两个独立的测量数据组, 比较之后, 通常都会发现它们之间的差异. 问题不在于是否存在差异, 而在于差异是否明显. 虽然得出了最终结论, 但是人们大都放弃了对头颅大小和犯罪行为之间关系的研究. 第二个例子是 智力测验 . 过去一百多年里, 智力测验成为一项专题研究. 研究人员对许多学生进行测验, 根据测验结果, 判断被测学生是否比一般人聪明. 例如,在某个智商测验中, 有一人的智商测验分数为98(误差为±3 分), 而另一人的分数是101(±3 分), 这测试告诉我们的信息等于零. 这些数字的意义是, 这位测试分数为98 的人, 智商为95 ~ 101, 而那位得到101 分的人, 智商为98 ~ 104. 这就是说,测出98 分智商的人, 有可能比那位测出101 分智商的人, 智力商数还高上3 分. 更何况这些结论有时还受到如下统计假设的影响:学生是普通人口的不错的样本. 而这一假设恰恰是错误判断的根源. 例如, 一些学生的母语不是英语, 而测验用的是英语. 如果一个人都不能看懂测验内容, 怎么能指望他取得好成绩?显然, 测验是为这些不属于学生的群体而设计的. 测验结果会对学生的教育机会有显著影响, 但是不能反映那些不熟悉英语的学生的能力. 有无数这样错误的例子. 从这种错误的统计假设得出的任何统计结论都值得怀疑. 不幸的是, 要想设计一个不伤害总体中部分的标准测验, 是极其困难的. 滥用统计所获得的有趣发现 接下来, 我们再列举若干滥用统计所获得的有趣发现: ▓ 北卡罗来纳大学的萨那博士做了个实验, 表明上行电梯的人参与慈善活动时比下行电梯的人更慷慨. 站在自动扶梯上端时比站在下端时更愿意捐钱. 或许在大楼顶层开会, 老板更容易激励员工. ▓ 美国加利福尼亚大学旧金山分校的克劳斯博士发现, 社会地位高或自以为富裕的人, 比起社会经济地位低的人, 更不善于判断他人的情绪. 对陌生人说话时,富人比穷人更粗鲁, 而穷人比富人更乐善好施. ▓ 美国加利福尼亚大学圣地亚哥分校的克利森菲尔德等发现, 男性比女性幽默, 但只幽默一点点;可是曾有一项实验表明, 女性的幽默不逊于男性. ▓ 美国韦恩州立大学的斯塔克等发现, 爱听乡村音乐的人自杀率高. 其解释是:乡村音乐的主题往往关乎有自杀倾向的人的问题, 如婚姻、酗酒、失业等. 对此, 贡德拉赫开玩笑说, 要挽回婚姻、找到工作, 就得把乡村音乐倒过来放. ▓ 美国哥伦比亚大学的亚戈尔和斯坦福大学的莱珀研究发现, 如果让消费者在6 种果酱中挑1 种购买的可能性, 是在24 种果酱中挑1 种购买的10 倍. 过多选择会使人无所适从. 为此, 商家都想方设法进行品牌宣传. ▓ 英国伦敦大学的里斯教授发现, 脸书(facebook) 狂人 的脑袋比较大, 不仅如此, 脸书好友比较多的人, 大脑的灰质也更多. 但是目前并不清楚, 是否经常上网的人的大脑有了变化, 只是这种人更喜欢上网. ▓ 法国图卢兹国立兽医学校的一群科学家研究发现, 狗身上的跳蚤比猫身上的跳得更高——平均相差20 厘米. ▓ 日本教育机构研究表明, 经常吃早饭的人学习成绩比较好. 在算术知识回答中, 每天吃早饭的学生回答正确率达到83.7%, 完全不吃早饭的学生正确率只有66.3%;在语言能力上, 每天吃早饭的孩子正确率达64.0%, 完全不吃早饭的孩子只有44.0%. 本文由刘四旦摘编自 赵焕光、章勤琼、王迪 著《 真理相遇统计 》一书。 《 真理相遇统计 》从统计学科的特色、人文欣赏的视野着手,运用通俗生动的语言,精彩有趣的故事、丰富典型的案例,介绍统计文化的常识及其统计在现实世界中的广泛应用. 主要内容包括为何学统计、统计应用概说、统计陷阱概说、统计历史人物故事精选、统计数据概说、统计数据收集、统计数据组织、统计数据概括、统计指数概说、时间数列概说、随机抽样与抽样分布、参数估计与假设检验、检验与方差分析及其相关与回归分析.本书可作为高等院校所有专业的本(专)科生、硕士生、中学智优生、中学数学教师,具有一定数学与统计基础的高校教师以及其各行各业的行政管理人员的数学与统计文化修养提高读本,也可作为高等院校本(专)科各个专业的选修课教材或教学参考书. 非经授权,请勿转载 转载请留言或联系:(010)64000159 一起阅读科学! 科学出版社│微信ID:sciencepress-cspm 专业品质 学术价值 原创好读 科学品味
个人分类: 大众教育|17269 次阅读|33 个评论
做一次生活科学家
songshuhui 2009-9-11 13:09
量子熊猫 发表于 2009-09-01 15:13 曾经,谎话要用甜言蜜语做包装,加上小恩小惠的糖衣,添一点楚楚可怜的好味道,就能让人神魂颠倒。结果,我们这些生存竞争之下的幸存者多少丧失了天真,不会被单纯的漂亮话弄迷惑。先不要得意,现在,似是而非的科学结论、复杂的统计数据,开始出现在了从特效疗法到金融产品上,没有点专业知识,我们似乎又要被忽悠了。别急,学一点科学方法,可以帮我们理清真相。 实验,厘清混淆的变量 一位保健品推销员正在这么向你介绍他的产品:这补脑剂效果可好了,我儿子吃了一个月,学习成绩明显提高了。好吧,作为一个久经沙场的消费者,你根本不信。推销员可能会有一个儿子,可学习成绩有没提高就未必了,更有可能的是,他儿子根本不吃这种东西。你心里暗想,在拿自家人举例方面,推销员和相声演员有一拼啊。可现在,推销员改变了战术:我们的研究表明,在吃了我们的保健品半年后,学生的记忆力显著提高。那么,信,还是不信呢? 我们首先假设,推销员不会伪造数据,说的都是有据可查。这样能否证明他的保健品就真的有效呢?如果问一个受过科学训练的人,他会告诉你,不一定。在这个例子里,学生的记忆力可能受很多个因素的影响。比如,儿童的记忆力在小学阶段是逐步提高的,即使什么都不做,三年级学生的记性也比一年级好;在这半年里,老师的教育也在帮助学生学习识记;当然,保健品也许真的有效。 一个科学家要想检验这个假设服用该保健品一段时间可以提高学生记忆力,该如何做呢?答案是:控制变量。 我们关心的数据可能受许多因素的影响,所谓控制变量,指的就是把额外的因素控制住,使它们尽量少地影响数据,从而让我们能集中观察需要研究的因素产生了什么影响。比如,针对这种保健品,科学家不会简单说有效还是无效,而是要进行实验,把年龄、教学方法之类额外的因素影响去除,单独针对保健品来检验。他会选取一个班级,先测试一下孩子的记忆力,然后把孩子随机分成两半,一半服用保健品,一半服用相同量的面粉压成的药片,即安慰剂。三个月或半年半年以后回来再次测试,看看两组的成绩有没有差异。 为什么要搞得这么麻烦?让我来解释一下。把学生分成两组,一组实验组,一组对比组,为的是保证除了服用保健品之外,两组的其他情况尽可能一样。同一个班级,避免了因为年龄差异、教学方法不同等因素造成的学生记忆力的差别;随机分配,使两组间的记忆力平均成绩在没有服药前基本一致。最后,他还会给没有服药的孩子开安慰剂。这些面粉片里根本不含任何影响记忆力的成分,却会导致人们心理状态的变化。我们也不知道服药后感觉记忆力提高是不是只是一种心理作用,因此只有使用安慰剂来平衡两组在这方面受到的影响。如果实验结束后,学生们的记忆力确实比半年前有所提高,可两组之间没有差异,我们就知道,这提高并非来自保健品的功效了。 把准实验伪装成实验,已经足够令人困扰了,而另一个烟雾弹则是统计数据。还是以上面的例子,记忆力显著提高是什么意思呢?是以前每天能背记十个单词,现在提高到了二十个了呢?还是从一百个提到了一百一十个?这两者都是每天提高十个,但难度却不可同日而语。在表述上,前者可以说成记忆力提高百分之百,而后者却只是提高百分之十。 相关,广受误解的概念 统计学诞生之初,作用之一就是提供各种数据以供参考。许多隐藏在混乱数据下的现象被它揭示了出来;许多含混的说法也得以澄清。但与此同时,新的麻烦也随之而来。媒体很早就学会了使用统计数据这一招,浑水摸鱼者当然也不甘落后。理解统计数据多少需要一点专业知识,而呈现清晰的数据恐怕还需要一点良心。于是可以想象,貌似科学的数据成了骗子的新法宝。 早在1954年,美国记者达莱尔哈夫就写了一本《统计陷阱》,专门谈使用统计学撒谎的种种伎俩。将相关说成因果,就是其中一种利用统计的谎言。 事物之间的关系多种多样,统计上关心的两种关系是因果和相关。前者不难理解,比如说缺水导致歉收;后者对大众却有点生疏,它指的是两者有着相同和相异的变化趋势。相同的趋势叫做正相关,比如一组孩子的身高和体重往往是正相关的,身高越高体重相应越重;相异的则是负相关,比如吃高脂肪食物越多,保持健康的几率越小。请记住,这些关系并不是因果关系,我们还不能确定其中一个变量的变化导致了另一个变量的变化。很有可能存在另一个变量影响了它们两个。比如,生长发育导致了身高体重的增长,又兴许存在肥胖基因,才是暴食和血管疾病的罪魁祸首。 然而,将相关当作因果确实屡见不鲜。某调查显示,常去网吧和学习成绩低下呈高度正相关,就是说学生去网吧越频繁,学习成绩越差。这不免让人推论,去网吧使成绩变差,但事实情况可能并不存在这种因果关系,而是厌学情绪或者学习障碍导致了学生成绩差和喜欢去网吧。在这个例子中,去网吧的频率和学习成绩可能都受厌学情绪的影响。学生厌学情绪越强烈,去网吧越频繁,同时学习成绩越差。但如果我们不作进一步研究,就可能仅仅把相关的两者看作因果,从而将学习不好完全归因于网吧。而禁止学生去网吧,起到的作用很可能十分有限。 一个收费昂贵的训练班宣称,他们的学员在毕业后三年都获得了极高的收入。我们是否该马上报名参加,好早一点学会这致富经呢?且慢,我们仔细检查这些数据,兴许会发现这么一个悚然一惊的事实这些学员在入学前已有一定的经济基础,正因为如此他们才担负得起高昂的学费,则他们增长的收入很大程度上来自于已有的基础。如果你本来不富有,恐怕训练班也不能教会你什么让你变得有钱。 另一个相关研究这样宣布:收入和智商呈现正相关。不用怀疑,在某些情况下这很可能是真的。我们知道,孩子的智力发展和家庭教养环境高度相关,那些家境良好的孩子往往能接受很好的医疗和早期教育。出身良好往往确实意味着拥有高智商的机会增加了。但这个例子并非说高收入导致了高智商,而是提醒我们,亟需帮助那些家境不好的孩子获得良好的教育。 这些例子告诉我们,轻易归因是隐患重重的。世界上有联系的事物甚多,但确定因果关系却需慎而又慎。 抽样,你的数据代表谁? 最常见的统计数字误导恐怕就是来自抽样的问题了。试想这么一个问题:中国成年男性的平均身高是多少?按照平均数的计算方法,我们应该测量所有成年男性,然后将身高加在一起再除以人数,这显然是不可能的。可是,我们设计家居时,人类工效学的工程师却告诉你,这个数字是170厘米。这是怎么得出的呢? 要计算这个数字就需要进行抽样。从所有成年男性中抽出一个样本,计算样本的平均身高,以这个数值作为中国所有男性平均身高的估计。只要样本选取得当,这个估计值就非常可信。 如何才能算作得当?首先是需要样本足够大,尽可能减少随机误差带来的干扰。这个大在不同的情况下是很不一样的。如果我们研究的是一所学校,可能选取一到两个班就可以了。可如果涉及的问题是全国性质的,可能人数就要达到数千、数万甚至更大。样本容量有保证是一方面,另一方面是样本选取不能有偏,就是样本能很好的代表总体。 我们知道,中国各地的人身材是有一定差异的,如果仅仅选取某些地区进行测量,就可能得出一个和真实情况差别很大的结果。最后,还有一点,很多调查受到社会赞许倾向的影响,例如,恐怕很少有人愿意填写问卷承认自己歧视农民工,但实际言行显然是另一回事。 看到这里,读者可能已经想到了网上常见的所谓民意调查。且不论是否可能造假制造所谓民意,这些结果是否能够采信都值得存疑,其原因就在于样本构成大有问题。 某网站将调查放出,最可能看到这个调查的是这个网站的常客,而他们参加调查的动机各有不同。某些话题更能引发人的兴趣,有些则只是很少的人关心。这都会导致最终参加调查的人是一个有偏的样本。结论可能代表了这些人群,却不能推广到全体。不妨试试,在高档消费网站投放一个增加税收以补助农村医疗的调查,看一看能回收哪些意见。 如果我们现在做一个调查,看一看最初恢复高考的三年中几所名牌大学入学学生如今的年收入,你一定会得到一个高得吓人的数字。我敢如此肯定并不是我熟悉他们的社会成就,而是因为我了解调查的缺陷。可以想见,当年的那些大学生虽然有案可查,但能够准确联系调查的却只有一部分较为成功的人了。其中有一些人虽然联系上了,却不一定愿意接受调查。最后,还不能排除一些人受赞许倾向的影响,有意无意地提高报告自己的收入水平。最终,调查员只回收了那些成功人士的数据,而沉默的大多数却被统计式地忽视了。 还不得不考虑,平均数也有一个小小的麻烦,它特别容易受极端数据的影响。回忆一下小学时老师对一个差生拉下全班平均分的愤懑表情。以及,一个月收入五万的老板和五名月收入两千元的员工享受着一万元的月平均工资,而这个平均数居然是一个员工月收入的五倍之多。 结语,科学方法,现代公民的必修课 只要伎俩足够精巧,学习过统计学的人都有可能被暂时蒙蔽。还记得讲到实验时所说的保健品吧?保健品公司宣称,在所有考试成绩优异的学生中,有68%服用了他们的产品。我们就要问问,这些接受调查的学生是怎么样选取的呢?为什么不调查在所有服用产品的学生中,有多少感到成绩提高?而公司又可以宣称,他们发现,保健品使用量与学生的英语成绩正相关。好吧,他们没告诉你的是,他们调查了30个学生,其中只有5个人吃了保健品,从将及格到中等成绩,确实是吃得多成绩好一点。更不用提当这些结果登载在报上时,精明的广告人设计的图案了形成鲜明反差的柱状图将服用者的优势凸显出来。其实这只是增大了图像的对比,并没有真正显著的差异,却给我们强烈的印象买一瓶吧! 凡此种种,不一而足。看来,我们的确有必要学习一点简单的统计学,这并不能让你成为精算师,但却能使你少落入大众传媒的陷阱。 现代社会的问题从信息不足转变为信息太多,匮乏的危机让位给了甄别的困难。科学方法可能会成为每个人的必修课。爱因斯坦说:想象力比知识更重要,那么面对海量的信息,批判思维也比知识更重要吧。 图片来源: google Planetrussell 文字编辑: 小庄 已发表在《读者》原创版
个人分类: 数学|1722 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-22 05:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部