科学网

 找回密码
  注册

tag 标签: 统计数字

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

重点应该放在生活质量而不是统计数字上
jiangjiping 2018-8-8 08:37
重点应该放在生活质量而不是统计数字上 蒋继平 2018年8月8日 国内舆论对于改革开放40年的进展争论不休,保守派对40年来国家取得的巨大进步和人民生活的普遍提高避而不谈, 只把眼睛盯着社会上出现的问题, 有的甚至小题大作, 借机否定改革开放的正确选择;与次恰恰相反,改革派侧重宣扬这40年来取得的巨大成就, 有的甚至夸大其词,为改革开放歌功颂德, 避而不谈在改革开放中出现的社会问题。我很难理解这种境况。 我估计是利益的博弈导致了这样截然不同的立场观念。 我想很可能是保守派在改革的进程中失去了原来的优势,而改革派在改革的进程中获得了自身的利益。 我一直生活在美国, 与国内的变化没有多少切身关系, 所以, 我是属于一个局外人,因而, 改革开放与我没有利益的博弈关系。作为一个中立的人, 我的观点没有倾向性,更没有任何政治企图。 虽然长期定居美国, 我在过去的20多年中, 经常因公出差或者私人探亲访友到达中国的许多地方。 所以, 我对中国社会的现状还是有切身感受的。别的不说, 我每次回国都觉得中国的变化非常快, 快的几乎超出我的想象力。这种实实在在的变化, 不是几个文人墨客的笔杆子可以抹杀的。从表象来看, 大城市的高楼大夏是最鲜明的标志,从深层次来看,处于社会低层的农村发生的变化更大。 我的故乡是地道的农村, 一个村庄只有几十户人家, 总人口原来是100多人, 原来全部是真正的农民。2016年我回家乡探亲时, 这个村庄只剩下几十人, 年轻人几乎全部进城了, 大多数是考上大学, 没有上大学的就去城里打工。 我的4个兄弟的子女们全部考上大学或者专科学校, 没有一个还在农村从事农业劳作。与我同龄的一代人, 许多也有一份社办企业的工作。再说几乎每个村庄都通上了公路, 交通已经相当方便, 家家户户都有电,年轻人都有手机, 有的家庭已经有了私人汽车, 大多数都有摩托车。从年轻一代的受教育情况我就可以非常理直气壮地说, 中国的改革开放取得了非常了不起的实质性成果。 这样的社会进步不是GDP的数据可以反映出来的。 我非常想不通的是,为什么一些人如此看重统计数字。 在我的心目中, 许多统计数字没有多少参考价值。换句话说, 就是一些数字与实际生活质量没有任何关系。举个最简单的例子,同样的一套房子, 一套在北京的学区内, 一套在郊外的六环外,对于房子的住户来说,住在这样的房子中的生活质量应该差不多, 因为房子的设施一摸一样, 但是, 两个房子的市场价格很可能相差几倍。 假如读者还不太清楚我说的意思, 那我就用自己的例子来说。我现在的房子在南彿罗里达州的一个小城镇,单间独院,花园草坪,紧邻风景秀丽的人工湖,双车库,中央空调面积200多平米, 三个正规的全套浴室卫生间,房龄只有三年左右, 目前的市场价只有50万美元左右。 我儿子在旧金山市区的一套房子, 只有90平米, 而且是在楼房中的一个单元,房龄已经60年了, 其市场估价已经接近200万美元。 你说这样的数字能够反映实际生活质量吗? 在我看来,正常的逻辑思维应该把重点放在实际的生活质量上, 让普通大众在日正常生活中吃得放心, 用得舒心, 住得称心, 玩得开心,出门办事顺利方便。 从实质性的意义上来说, GDP 的统计数据真的没有多少意义, 同样的一颗青菜, 在美国超市要五美元, 在中国只要五元人民币。 还有, 一条公路造价几亿人民币, 造好后不久就坑坑洼洼的不能正常行车, 需要重新铺设, 这些费用都计算在GDP 上。 你说这样的GDP有实际价值吗? 我不想多说,要是我是一位掌控一方的决策者的话, 我一定会极尽全力来提高人民的实际生活水平,重点放在社会治安, 交通管理,医疗教育和政府部门为民办事的效率方面, 而不是追求高速的GDP增长率。 拿GDP的数据与日本比, 与美国比, 超过了日本, 马上要赶上美国, 又能说明什么问题。要是人们吃得忧心, 睡得担心, 出门办事烦心, 即使都是百万富翁又是什么样的生活质量呢?请读者们三思!
个人分类: 个人观点|2130 次阅读|0 个评论
统计数据的解读需要科学的分析才准确
热度 4 jiangjiping 2015-3-12 02:09
统计数据的解读需要科学的分析才准确 蒋继平 2015 年 3 月 11 日 最近因为柴静的 引发的风波, 社会上对柴静在报告中引用的一些统计数字出现了明显不同的解读。 今天的科学网的一篇由 岳东晓发表的 和许培杨博主的 两篇文章就是这种对同一个统计数字做出不同解读的典型例子。 我对这两个文章不进行任何个人的评论。 我想说的是, 对一个统计数字, 首先要知道统计数字的来源,统计方法, 和这个统计数字涉及的相关因素。然后根据这些信息用科学的头脑进行分析和解读。 只有这样, 才能得到比较正确的结论。 我记得在讨论有关雾霾是否与患癌症有关的一篇博文中, 有人引用联合国卫生组织发表的世界各国癌症发病率的统计数字来说明癌症好像与雾霾没有任何关系。他的理由是:根据联合国卫生组织 2012年的统计数据, 世界上癌症发病率排在前五名的五个国家是: 丹麦、法国、澳大利亚、比利时和挪威 , 而这五个国家的空气很好, 生态环境也不错。 从表面上看起来, 这个统计数字和社会现实似乎很容易得出空气污染与癌症没有任何正相关的结论。 但是, 事实上这样的结论是比较草率的, 是没有经过科学分析造成的。 为什么这么说呢, 我的理由如下。 首先, 我们要知道癌症是一种慢性病, 从接触到有害物质, 到真正的发病需要相当长的时间, 通常可能需要 10-20 年的时间。 所以, 2012 年的癌症统计数字, 实际上反映的可能是几十年前的生态环境情况, 而不是现在的生态环境情况。 其次, 生物生病涉及到三个主要因素, 一是寄主的抗病能力, 二是致病物的致病能力, 三是环境条件对寄主和致病物的影响力。 癌症是一种非常特殊复杂的病,这种病可能由多种致病物引发, 而不是仅仅由空气污染引发。 空气污染引发的可能是与呼吸道有关的癌症, 比如说, 肺癌, 鼻咽癌和气管癌等。 而这个统计数据包含所有类型的癌症。其他类型的癌症是由其他致病物引发的。 要是一个生态环境中其他致癌物的比例很高, 那么, 生活在这个生态环境中的人必然会具有较高的患癌症的机率。 虽然, 这个区域看起来蓝天白云,没有雾霾,但是, 这样的环境仍然不能排除其他癌症的发生呀。具体地来说, 要是用核电站发电的比例很高, 那么, 需要考虑到放射性污染引发的癌症。 还有, 实验室经常使用放射性物质的科研人员,患癌症的概率可能要高一些。这几个国家的科研水平较高, 是不是也是一个因素。 再来说国家和人群基因的关系。 总的来说, 一个国家的人群的基因比较相近。 而人群的基因对癌症发生的影响最大。 因为我一辈子的主要工作就是使植物生病(罪业呀),所以, 我深深懂得生物是否生病的关键因素是生物本身对某种致病物的抵抗力。 这种抵抗力是内因, 病原菌和环境条件是外因, 外因必须通过内因而起作用。 这就是为什么在同样的环境条件下用同一个致病物接种,有的品种生病, 而其他的还能健康生长的道理。 我怀疑是否排在前五位的国家的人群对某些致癌物特别敏感, 容易得癌症。 然后再来分析环境条件和致病物对生物生病的影响。 这点好像不用多说, 读者们自己也可体悟到其中的道理。 要是没有致病物, 生物就不会生病, 这是很明显的。但是, 癌症是一个很特殊的病, 它可由许多因素引发, 而且是慢性累积效应。 雾霾只是大气环境的一个表面现象, 它的组分在不同的时期和不同的地点可能很不一样。 比如说,烧煤碳产生的雾霾和烧塑料产生的气体的组分是不一样的, 前者产生黑色的烟雾,看上去是真正的雾霾, 而后者产生的是淡淡的无色气体。 但是, 后者可能更能引发人们的癌症。据联合国世界卫生组织的报告, 丹麦和 挪威每年燃烧的塑料也是在世界上排在前面的两个国家。 因而, 我怀疑这两个国家的高癌症发病率是否与烧塑料有关。 要是那样的话, 那么, 癌症与空气污染具有明显的正相关就是不争的事实。 这里特别需要说明的是, 空气污染不能用简单的可见度来衡量, 而是需要对空气组分进行检测分析。 还有,统计数字来自于群体样本记录的收集。 这个群体样本记录涉及到一些因素。 先进的国家对这样的记录做得比较好,先进的国家对个体的健康保护也做得比较好, 他们技术先进, 检测准确。 这是发现癌症的一个优势。 因而, 先进国家的统计数字可能真实地反映了人群中的发病率, 而落后国家的统计数字可能不能准确地反映实际患病的人数。 最后, 我要说的是,一个统计数字, 只是一个社会或者自然现象的客观记录, 这个数字仅是一个表面现象, 它必然产生于其他因素。 所以, 在解读这个统计数字时, 我们必须对产生这个数据的因素进行认真的分析, 只有知道了这些因素的原委后, 我们才能真切地领悟到这个数字包含的内容和代表的意义。 借此机会, 我提请大家思考这样几个问题, 不管柴静制作 的动机和目的是什么, 不管她采用的表达是否合适, 不管她应用的数据图表是否真实, 您认为严重的雾霾 对健康是有益呢, 还是有害呢? 您是喜欢生活在蓝天白云下, 还是在灰暗的雾霾中呢? 在您有了答案后, 您应该采取哪种行动呢?
个人分类: 观点交流|3246 次阅读|9 个评论
统计数字说明啥问题
黄安年 2010-10-3 21:27
统计数字说明啥问题 黄安年文 黄安年的博客 /2010 年 10 月 3 日发布 这两天系统地浏览了 9 月份科学网博文中有关美国问题的文章(见《 科学网博客中与美国问题有关的文章目录第三十二辑( 2010 年 9 月)》,黄安年的博客 /2010 年 10 月 3 日) http://www.sciencenet.cn/m/user_content.aspx?id=369445 )顺便对 9 月 21 日以来科学网博客中有关钓鱼岛的博文和有关方舟子、肖传国事件的博文做了数字统计, 情况如下: 9 月 21 日以来科学网博客中有关钓鱼岛事件的博文共 87 篇 ( 不包括笔者的文章 ) 9 月 21 日以来科学网博客中有关方舟子、肖传国事件的博文共 223 篇 ( 不包括笔者的文章 ) 另外一个统计数字如下: 科学网精选博文( 8 月 29 日 10 月 3 日) 有关钓鱼岛的博文 0 篇 有关方舟子、肖传国事件的博文共 22 篇
个人分类: 个人所思所想(09)|3314 次阅读|0 个评论
统计数字的缺失:排他性
黄安年 2010-8-1 15:51
统计数字的缺失:排他性 黄安年文 黄安年的博客 /2010 年 8 月 1 日发布 我们的统计数字有时具有排他性,因而缺乏准确性。某些统计以官方认可的为权威根据 , 然而往往官方认可的数字中往往含有某些不被列入统计范围之内的数字。 例如我们一年中究竟出版了多少册(种)书 , 是以出版的书籍有无书号为准的。非卖品的书 , 你说它不是书 , 其实它是书 , 即所谓山寨版书,这些书有的质量远高于公开出版物,但是因为没有书号而不被认可为书,在我们的官方出版统计数字中 , 这非卖品是不算书的。至于网络书籍目前也是不被认同为书的。过去有禁书 , 被打入另册,现在这非卖品不一定被认定为禁书 , 但统计上是不包含的。那么我们是否清楚,这些非卖品的书一年出了多少 , 都是因为什么原因成为非卖的 , 是自愿非卖 , 还书无奈非卖 ? 又如 , 人口统计上 , 长期以来没有正式户口的超生、非法 生的黑人,往往也是不计算入人口总量的 , 这些黑人口究竟有多少,如果搞不清楚,那就是一个大大的漏洞 , 人口 13 亿多 , 人口近 14 亿,人口 14 亿以上是不同的含义,意味着人均 GDP 的不同,人均碳排放不同等等。 再如 , 人才的统计 , 现在是否把退休人才都计算在内 , 还不清楚,至少没有专门提到如何发挥退休人才的作用问题。有意思的是 , 我们大学的学术研究机构在统计学术成果时,是将在职人员和退休人员的成果混在一起统计的,而分享成果却又没有退休人员的份。 我们一些省市自治区所以在统计 GPD 和人均 GDP 上搞猫腻或弄虚作假,往往在统计外流人口、外来人口上做了手脚,形成了虚假数字。 还可以举个小例子,科学网博客究竟发表了多少博文 , 恐怕难以说清楚,因为现在的数字是按现成保留文章统计的 , 个别或者少量博文,或自己或被有关方面删除了 , 并不在统计博文之列。 统计的基本要求是完整性和准确性,如果不完整 , 具有排他性 , 其准确性和权威性也就成问题了。
3703 次阅读|0 个评论
科学网博客上的有趣的统计数字
黄安年 2009-7-24 17:35
科学网博客上的有趣的统计数字 黄安年文 黄安年的博客 /2009 年 7 月 24 日发布 今天在科学网博客上选择累计登陆量前 10 位博主的情况 , 进行了排列,时间是 24 日 16 : 40-50 分间,数字分别如下,立此存照: 文章数 总登陆量 评论量 每篇文章平均登陆量 王鸿飞 572 2679228 10853 4684 黄安年 3240 2540845 2543 784 周可真 1006 1572209 7452 1563 杨学祥 1318 1565074 3038 1195 武夷山 888 1520562 5377 1712 嵇少 丞 298 1220331 5479 4095 陈 安 1361 1035597 4518 761 李世春 705 1025997 2616 1455 何毓琦 265 1022349 1492 3858 杨 玲 579 994044 不详 1717 这里需要说明的 : 第一 , 删除的文章和评论未计算在内,科学网并未显示这方面的数字。 第二 , 在页面上重点推荐的文章数量没有显示,编辑部清楚这个数字。谁都明白推荐与否对于一篇文章的登陆量关系不小。 上述情况如何看待,见仁见智。本人已经退休 , 时间相对充裕,一些文章是写给自己看的 , 带有记事性质,博文暂时领先不足为奇,无需刻意赶超。
个人分类: 个人所思所想(09)|4172 次阅读|3 个评论
《驯服偶然》译者前言
gl6866 2008-11-30 09:15
十多年前,我参加了中国科学院组织翻译李约瑟博士《中国科学技术史》的工作,在翻检文献过程中,见到李约瑟对黄仁宇先生关于明代的漕运这个专题研究的评价,李公说黄先生的研究是一切围着数字转。而眼下加拿大科学哲学家和科学史学家哈金的这本书便是一部关于数字的书。 黄仁宇先生曾颇有感慨地谈到中国传统的治国方式是间架性的设计,即不由它自身做主摸索而成,乃是由政治家鸟瞰的态度裁夺。这种间架性的设计被认为是超时代的政治早熟。正如李约瑟评价朱子时所说,在没有产生一个牛顿式的宇宙观之前,先已产生了一个爱因斯坦式的宇宙观。这种理念应用于社会政治方面,则出现这样的情况,一般政令上面冠冕堂皇,下面有名无实。结果则是中国的亿万军民不能在数字上管理。(《赫逊河畔谈中国历史》,三联书店,北京,1997年,第12?5页)换句话说,在黄先生看来,二十世纪之前中国最大的问题在于名与实之间没有成功地得到链接。 实际上,西方诸国在进入现代的过程中,并非一开始就能在数字上进行管理。这其中也有很漫长的过程。而这个过程,即名与实的链接过程,则构成本书的主要故事。中世纪晚期,随着文艺复兴运动的出现,宗教改革的胜利、民族国家形成过程中,西欧诸国也开始在数字上治理国家了。现代民族国家的观念肇始于意大利半岛的各城邦国家,如佛罗伦萨、威尼斯和米兰等,随着这些城邦国家在对外交往中逐渐形成了统一的政治实体,那些雄心勃勃的思想家和政治家便企图创造一种整体的民族性。这些观念的传播无疑对北方诸国产生了巨大的影响,然而,彻底意识到民族国家在本质上是以其统计学为特征的是德国的思想家和政治家。 科学技术的作用有两个方面,一方面使自然对象化;另一方面则使社会对象化。资产阶级登上政治舞台后,打出了民主的旗号,对于他们而言,民主绝不是什么生活方式,而是一种社会治理的方式。因而,相对于资产阶级的民主政治,便是一整套与之相适应的法治观念。他们下大力气使自然科学的思想、方法、成果在社会领域进行创造性的应用,取得了成功。制度上的的创设一方面适应了经济社会的发展,另一方面,正如哈金教授所言:对人和世界的支配不是更少了,而是控制更强了,原因是一种新的定律粉墨登场了。这便是我所谓的偶然被驯服的原因所在。 所谓对偶然的驯服,是指在自然和社会定律的支配下,偶然或不规则的事件显然已经得到了控制。世界不是越来越成为偶然的,而是大大相反。以往支配人们思想的决定论遭受了侵蚀,偶然的自主定律则得到发展。人性的思想被正常人的模型取而代之。始于十九世纪的这两种转变是同时发生的,而且相互激励。偶然是真实的,它使秩序脱离于混沌。在我们关于世界和人的观念中,非决定论的色彩越浓,控制力也就越大。这便是本书的思想核心所在。 几千年来的决定论思想何以遭受侵蚀?在哈金看来,是由于十九世纪末雪崩般的统计数字。人的多种行为,尤其是异常行为,如自杀、犯罪、游民、癫狂、卖淫、疾病之类,被列入官方的统计研究的范畴。通过研究发现,这些现象年复一年似乎具有惊人的规律。有关社会的统计定律便是从这种关于人的异常行为的研究中发现的。其目的又是什么呢?根据平均值和离中趋势的数据所形成的正常人的思想,开始实施若干社会工程,以便改造不合需求的社会阶层。正如优生学的创始人高尔顿于一百年前所说,概率定律的首要目的便是在最具野性的混乱之中以宁静和完全平淡的方式实施帝王式的统治。由此可见,决定论遭受侵蚀并不是无序和无知的肇始,而是恰恰相反。 马克思主义经典作家曾一针见血地指出,问题不在于解释世界,而在于改造世界。我们将看到,西方对社会的改造源于一种理念,即人们通过点查和分类可以改善(控制)有异常行为的亚人口群体。进一步的考察表明,并非任何数目字都能起这个作用。多数首次认识到的定律般的规律都与异常现象相关:自杀、犯罪、游民、疯狂、卖淫、疾病等。这一事实具有启发意义。现在人们通常说,在决策理论、运筹学、风险分析以及在更广一些但却专业不太强的统计推理领域,信息与控制是中立项。根据这个中立项,可以导出更一般的题目。点查需要分门别类,而出于统计的目的所定义出的新的人群是有重要意义的,因为在这种人以群分的方式中表达了我们对他们的看法,同时也可以了解到我们自身的各种可能的潜在性。 走进作者的世界,就好比走进一座博物馆,每一章便是由各种数字事实布置起来的展厅,沿着博物馆的长廊走下去,两厢的展厅向我们呈现出我们当前的概念组织成为可能的各种条件。一个领域是有关物理学非决定论的;另一个领域则是为社会控制的目的所开发的统计信息。哈金教授以福柯式的方法向我们展示了欧洲社会发生的那场持久的、全方位的革命。这便是今天称之为导致社会发生巨大变革的慨率性革命。这场革命绝非像法国大革命那样轰轰烈烈,甚至不易为世人察觉。主导这场革命的也不是什么大思想家,而是那些务实的官员和学者。正是他们的不懈努力,才使得西方社会呈现出今天这幅图景。 这本书是作者花费了十年心血写成的。在这本书中,文史哲、经法社,数理化、天地生被融于一炉,向我们展示出哈金教授渊博的学识。早在1975年,哈金教授便出版了《概率的突现有关概率、归纳和统计推理早期思想的哲学研究》(The Emergence of Probability -- A A Philosophical Study of Early Ideas About Probability, Induction and Statistical Inference) 一书,成为当时畅销的学术著作。《驯服偶然》也同样取得了巨大的成功,出版后不久便被Random House的Modern Library评为本世纪一百部用英语写成的最佳作品。目前哈金教授任教于加拿大多伦多大学科学技术哲学与科学史系。他长期以来从事科学哲学和科学史的研究与教学工作,在统计思想史领域是权威。 本书是一部专业性很强的科学哲学和科学史著作。译者绠短试汲,在翻译过程中深感力不从心。中央编译出版社王吉胜先生在全书翻译过程中始终给予热情的鼓励和及时的帮助,本书责任编辑王丽华同志耐心细致审读译稿,使译文大为增色。没有这些同志的辛勤劳作,本书是不会以现在这种形式同读者见面的。当然,翻译中的错误和不妥之处,仍是我个人的责任。尚望读者不吝赐教为感。
个人分类: 评论述评|2333 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-23 13:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部