科学网 › 标签 › 可信度

标签: 可信度

相关帖子	版块	作者	回复/查看	最后发表

没有相关内容

相关日志

新冠病毒检验的可信度和概率预测: 热度 1 lcguang 2020-2-11 15:44; 摘要：假设核酸检验敏感性是0.5，特异性是0.9，被感染的基础概率是0.2；则作为检验手段，阳性的可信度是0.8，阴性的可信度是0.44；作为概率预测，阳性的可信度是0.21，阴性的可信度是0.86. 检验为阳性时，被感染的概率是0.56；检验为阴性时，被感染的概率是0.122.因为漏报率较高，有人提出用CT辅助确诊是合理的。抗病毒前线传来消息，核酸检验假阴性太多，这给救治和隔离带来极大困难，有人因此提出要配合CT等手段确诊。本文做一科普，说明假阴性和假阳性是怎么回事，根据阳性或阴性能做怎样的概率预测，以及我们应当在多大程度上相信检验结果：阴性和阳性。设医学检验中，e1表示阳性，是对有病或被感染h1的预测；e0表示阴性，是对没病或没被感染h0的预测. 设e是变量，作为证据；h是变量，作为假设。则不确定关系如下：图1 e和h的关系概率P(e1|h1)叫做敏感性，又叫真阳性率； P(e0|h0)叫特异性，又叫真阴性率。敏感性和特异性反映检验手段好坏。P(e0|h1)=1-P(e1|h1)叫假阴性率，也就是漏报比例，这个比例越小越好。 P(e1|h0)是假阳性率，也就是误报比例，这个也是越小越好。但是一个检验通常很难做到两者都小（参看下图）。漏报损失更大，所以漏报比例要小，这更加重要，要优先考虑。图2. 四个条件概率和检验分界x'的关系然而，遗憾的是，目前核酸检验新冠毒肺炎，敏感性只有0.3-0.5. 假设是0.5 （参看 https://www.thepaper.cn/newsDetail_forward_5878994 ），这意味着真感染者有一半要漏报。有人会说既然它这么低为什么还要用？医学检验中用阳性似然比反映阳性有多可靠： LR+= P(e1|h1)/P(e1|h0)=敏感性/(1-特异性) 只要特异性较大，LR+就大；根据阳性可以预测有病的概率就较大。比方说，特异性是0.9(这是假设，我没有查到核酸检验的特异性)，那么阳性似然比LR+=0.5/（1-0.9）=5. 假设有疑似症状的人被感染的先验概率（又叫基础概率）是P(h1)=0.2(目前大概是0.2)，那么可以算出 P(e1)=P(h1)P(e1|h1)+P(h0)P(e1|h0)=0.2*0.5+0.8*0.1=0.18; P(e0)=0.82. 检查出阳性后，被感染的条件概率就是 P(h1|e1)=P(h1)P(e1|h1)/ =0.2*0.5/0.18=1/1.8=0.56. 被感染的概率从0.2增加到0.56, 所以检验有用。但是阳性也不完全可信。因为阳性的误报概率是P(h0|e1)=1-0.56=0.44. 这意味着没100个阳性者有44个不是真地被感染。阴性也不完全可信，因为阳性患者中被感染和没被感染的概率是 P(h1|e0)=P(h1)P(e0|h1)/P(e0)=0.2*0.5/0.81=0.122； P(h0|e0)=1- P(h1|e0)=0.878。这意味着100个阴性的人当中有12.2个是被感染的。这就是为什么有医生呼吁要使用CT辅助确诊——因为敏感性较低。对于被感染h1，一种检验的阳性可以提高被感染的条件概率——作为另一种检验的先验概率，再使用另一种检验，如果也是阳性，则后验概率就更大。另一方面，某个被感染者被一种检验漏报后，另一种检验还可能查出来。从上面分析可以看出敏感性的重要性。但是要注意，敏感性高，并不意味着阳性e1可信，而是意味着阴性e0可信，即预测没感染可信。类似地，特异性高并不意味阴性e0可信，而是意味着阳性e1可信。本人研究归纳确证问题(参看： http://www.survivor99.com/lcg/CM/Recent.html )，得到确证度或可信度（在-1和1之间变化）：比如，对于新冠病毒检验， b1*=(5-1)/5=0.8; LR - =P(e0|h0)/P(e0|h1)= 特异性 /(1- 敏感性 )=0.9/0.5=1.8; b0*=(1.8-1)/1.8=0.44b1* 。这说明, 作为检验手段，阴性远不如阳性可信。注意：b*和基础概率P(h1)无关，只和检验手段有关，所以被称之为信道确证度。通过P(h1)和b1*也可以算出被感染的概率： P(h1|e1)= P(h1)/ 。同理有 P(h0|e0)= P(h0)/ 。但是，这一确证测度——信道确证度——和似然比一样，只反映信道或检验手段好坏，并不反映概率预测好坏。为此我们还需要预测确证度c*： c*在预测的概率大于0.5时大于0，否则小于0. 比如对于新病毒检验， c1*=(0.56-0.44)/0.56=0.12/0.56=0.21. c0*=(0.878-0.122)/0.878=0.86. 比较b*和c*可见，对于概率预测，阴性比阳新更加可信——因为预测的没被感染的概率更大。通过c*能更方便算出被感染的概率: P(h1|e1)=1/(2-c1*); P(h0|e0)=1/(2-c0*). 对于上面新冠病毒检验，通过阳性可以预测被感染的概率：P(h1|e1)=1/(2-0.21)=1/1.79=0.56。通过阴性可以预测没被感染的概率：P(h0|e0)=1/(2-0.86)=1/1.14=0.878. 上面结果和用 b* 算出的结果相同。但是在基础概率P(h1)改变的情况下，要计算被感染的概率还是用使用b*，即用公式 P ( h 1 |e1)= P ( h 1 )/ . 总结：假设敏感性是0.5，特异性是0.9，被感染的基础概率是0.2；则作为检验手段，阳性的可信度是0.8，阴性的可信度是0.44；作为概率预测，阳性的可信度是0.21，阴性的可信度是0.86. 检验为阳性时，被感染的概率是0.56；检验为阴性时，被感染的概率是0.122. 另外，通过c*，还可以很好解释乌鸦悖论。详见：信道确证和预测确证——从医学检验到乌鸦悖论笔者个人主页中相关讨论见： http://www.survivor99.com/lcg/CM/Recent.html 最新消息：中国疾病预防中心病毒病预防控制所成功研制新型冠状病毒（2019-nCoV）核酸等温扩增快速检测试剂盒，见： http://www.gov.cn/xinwen/2020-01/31/content_5473278.htm 其敏感性和特异性都是1. 预祝检验成功！; 个人分类: 疫情分析|7136 次阅读|4 个评论

硕士论文盲评结果有多大可信度？: 热度 17 ncepuztf 2017-12-16 19:41; 又是一年硕士论文提交月，让导师们胸闷的时候又到了。各种国考暂时告一段落，研三的研究生们收收心，该熬夜加班赶论文了。关于研究生论文各种要注意的问题，请参考“ 论文注意问题 ”。作为评判硕士论文是否达标的手段，多数学校实行了盲评。有的学校甚至将硕士论文盲评应用到教育部学位论文平台，让全国的导师同行进行评审，这是个好经验，应该推广。我系的硕士论文虽然也实行了盲评，但还局限在校部和校区之间互评，比之前由导师直接送审给熟人还是进步不少，撇开了人情，质量也有所改善，这种改善来自学生对可能不通过的畏惧和导师为了面子对“ 认真 ”的改善。因为每年都有那么 7-8 个拿到 C 的，如果一个论文得了双“ C ”，那肯定要延期了，至于 1 年还是半年，具体情况具体处理。每篇硕士论文会有 2 位专家评审，结果可以是 A,B或C ，分别表示同意答辩，同意修改后答辩或不同意答辩。这和期刊论文的评阅类似，专家给出的结论究竟有多大可信度一度充满了争议，因为这结果往往和专家的学识水平、要求的标准高低、对所评研究内容熟悉程度，态度是否认真，甚至心情好坏密切相关。有导师反映，他的一位学生工作不积极，论文内容也是东拼西凑的，比较差，另一位学生工作认真，干了不少活，写作也认真，可是评阅结果回来正好相反，他认为差的得了 AA ，认为好的得了 BC 。还有导师反映自己带的一位推免学生发了不少学术论文，还得了国家奖学金，论文结果得了 AC 。这种情况我也遇到过，同是评审 1 篇论文，那论文是研究热点，但没做多少工作，有一章每页有 10 多个错别字，我给了 C 的结果，报到秘书那儿，秘书说另一位老师给了 A ，这差别太大了，提醒我检查一下。我说，我是认真读过的，太差了，你让另个老师仔细看看吧，如果仔细看了，一定不会给 A 的，后来那位老师改成了 B 。如上，很多时候，连导师们都对论文评阅结果的可信度提出质疑，更不要说学生了，辛辛苦苦混两三年，文字码了好几万，没过，那真是“冤”得很。 “ 没有考不上的博士，没有毕业不了的硕士 ”，虽不尽然，但目前的研究生教育确实承载了太多功能，比如延迟就业、稳定人群。孩子们多数也是为了就业，为了一份好工作，真想投身科研者寥寥。导师们表示理解，除了太不像话的论文，基本还是抬了贵手。关于论文评阅结果的可信度的讨论没个结果，但还是得出下面规则，这规则的可信度比论文结果的可信度要高：对学生而言：给 A 的不一定认真看过，给 C 的一定是认真看了的。对老师而言：不想让过就认真看，想让过就浏览下算。; 个人分类: 科教|11371 次阅读|37 个评论

《股市幸存者如是说》（升级版）已经出版: lcguang 2016-11-24 08:18; 再版序言本书初次出版以后，得到了不少热心读者和网友的称赞，有人说书中内容“干货”多；有人说相见恨晚；有人说比许多外版翻译过来的财经书还好；有人不光自己买，还推荐给亲戚、朋友。这是对我的极大鼓励。 2015 年 6 月，股市从暴涨转向暴跌，我收到清华大学出版社编辑的来信，说希望此书能够再版，希望我做适当补充修改。随后的 7-9 月，很多人因为杠杆交易严重亏损，甚至破产、跳楼。而我这本书恰巧是讲通过头寸比例控制风险的，我觉得出版社的眼光不错，我当努力配合。再版中我增加了一些内容，包括：我本人这几年的投资总结（见第一章结尾）；专为杠杆交易写的另外三篇（见第二章结尾）。其中最后一篇《2015 年大熊之际谈最优杠杆比例》提供了投资比例最新优化公式（考虑盈、亏、平三种可能）和两个表格，表格中有预测收益不同时的优化比例及复利。这些是很重要也很实用的补充，希望大家喜欢。第三章增加了两篇，分别是关于高铁和房价的，内容虽不多，至少见解独到。最近我有幸看到网上报道的刘鹤的重磅文章，网上评价很高。而这篇文章和本书初版文章《经济危机的根源：信息革命和白领劳动异化》以及我更早的文章《白领劳动异化――信息革命不可忽视的副作用》异曲同工。所以我特地于最后一章补充了一篇《刘鹤的重磅文章和我早年的文章比较》。因为年龄和身体的原因，从去年开始，我在股市上花的时间少了，想把自己过去的一些研究整理完善、成文发表。不料语义信息研究导致归纳逻辑的重要发现——得到一个很有说服力的可信度（或确证度）公式。新版压轴文章《股市和经济预测的信息量和可信度》就包含了我这一年来研究的主要成果。此外，其他地方也有一些小的修改和补充，如在前一版原文后增加了再版补注或补充内容，不再一一说明。我一直说，投资需要预测和决策（投资组合）两方面都行。我只能说我决策（确定投资比例）内行，预测研究仅限于评价准则。但是光是预测好，决策不好，一次失误就足以致命。而能意识到自己预测不好，但是决策较好，总还能让自己幸存下来。我本人 2008 年以来的投资就是这样，没有预测到股市暴跌如此之深，但是由于适当控制了头寸，减少高风险品种投资，所以能幸存于股市，而且活得很好。希望这本书能帮助更多朋友减少深度亏损，做股市的长久幸存者！最后，依然要感谢读者的关注！也谢谢出版社的大力支持！鲁晨光 2016 年 9 月; 个人分类: 投资组合和风险控制|2832 次阅读|0 个评论

中国人的认知水平停留在是非阶段：从最热年可信度38%说起: 热度 2 杨学祥 2015-1-31 19:49; 中国人的认知水平停留在是非阶段：从最热年可信度 38% 说起杨学祥 2014 年，全球平均气温为 14.6 ℃ ，比 20 世纪的平均水平高出 0.69 ℃ ，成为 1880 年有记录以来的最暖年。尽管此前有科学家质疑，自 1998 年以来，全球气候变暖“停滞”，但事实并非如此。 2005 年和 2010 年全球地表平均气温仍比 1998 年高出 0.04 ℃ 和 0.05 ℃ ， 2014 年更是高出了 0.07 ℃ 。 2014 年最热年无疑证实了全球气候变暖的事实。 http://roll.sohu.com/20150127/n408098576.shtml 有报道称，虽然不乏“全球变暖是阴谋”的论调，但科学记录在忠实记录这个星球的体温。继美国国家海洋和大气管理局、英国气象局、世界气象组织、日本气象厅之后，中国气象局公布的数据显示，2014年是自1880年有记录以来最暖的一年。在这个难得有共识的世界上，也许只有这种难以做手脚的数字才会让人们暂时消停一会，想想如何面对共同的问题，这也将是2015年联合国巴黎气候大会面对的棘手难题。 http://news.hexun.com/2015-01-27/172801310.html 因为没有见到不同的意见发表，我以“ 铁的事实： 2014 年成1880年以来最暖年”为小标题，转载了多国气象机构的报告结论，提出了温室气体和月亮赤纬角最小值共同对2014年最热年有贡献，因为2014年南极海冰40年来的最大面积无法用温室气体的增加来解释，而月亮赤纬角最小值导致的潮汐南北震荡幅度减少，减弱两极和赤道的热交换，可以使低纬度地区变暖，两极地区变冷。网友发来的信息令我吃惊： NASA: We ’ re only 38% surewe were right. （美国国家航空航天局：我们仅以38%可信度认为我们是对的。） http://www.climatedepot.com/2015/01/18/update-feds-conning-the-public-scientists-accuse-nasa-of-misleading-lying-about-hottest-year-claim/ thealleged ‘ record ’ amounted to anincrease over 2010, the previous ‘ warmest year ’ , of justtwo-hundredths of a degree – or 0.02C. The margin of error is said byscientists to be approximately 0.1C – several timesas much. http://blog.sciencenet.cn/blog-2277-863589.html http://blog.sciencenet.cn/blog-2277-864190.html 数据之间的差距太小，数值的误差太大，可信度自然不高。有人会问，美国人在说谎吗？显然不是，因为100%可信度的科研报告是不存在的，测量误差、计算误差和分析水平的高低受到科技水平的限制。是和非是最简单的非此即彼的判断，适于确定性事件的判断。对于不确定性事件和人们尚未完全认知的事件，我们认知的可靠性就不会是100%。以中国的天气预报水平为例，我国1~3天的天气预报水平处于世界先进行列，24小时的晴雨预报准确率也达到了83％的高点。但总体来看，我国监测预报预警能力仍然相对薄弱，与国际先进水平相比还落后很多年。有专家指出：干旱是因为降水少，气象学界大部分人都研究温度变化，研究降水变化较少，那是因为降水预报十分困难。比如，在降水方面，今年的梅雨季节到底是早来还是晚来，降雨量多少，都是大家关心的问题，但是预报难度相当大。专家解释，灾害性降水预报的准确率也就20％，甚至更低。以2014年最热年的数据为例，图1给出了 1880-2014 年美国航天局与国家海洋大气局的数据对比（上图）以及日本气象厅数据（下图），上图和下图的差别是非常大的。上图中， 1998 、 2005 、 2010 、 2014 年的温度是逐步上升的，而下图中， 2005 和 2010 年比 1998 年低。图 1 1880-2014 年美国航天局与国家海洋大气局的数据对比（上图）以及日本气象厅数据（下图）按照美国数据， 2005 年和 2010 年全球地表平均气温仍比 1998 年高出 0.04 ℃ 和 0.05 ℃ ， 2014 年更是高出了 0.07 ℃ 。 2014 年最热年无疑证实了全球气候变暖的事实。按照日本数据， 2005 年和 2010 年全球地表平均气温比 1998 年低，与美国数据相比，误差高出 0.04 ℃ 和 0.05 ℃ ，那么， 2014 年更是高出了 0.07 ℃ 的可信度会有多大呢？一定不会是 100% 。自认 38% 是一种客观科学的态度，盲目相信者应该自省。图 2 2014 年 1-12 月全球气温变化水平（不包括两极海冰覆盖地区）图 2 给出 2014 年 1-12 月全球气温变化水平，由于不包括两极地区，所以不能反映全球气温的真实变化。例如， 2014 年南极海冰面积40年来最大值，在图2中只表现出德雷克海峡海水变冷。这样的真实资料的取舍包含太多的主观任意性。 2014 年 10 月 14 日凤凰科技讯科学日报报道，近日消息称今年南极洲的海冰结冰程度创了新的记录，相比科学家们自 20 世纪 70 年代晚期开始进行的海冰结冰程度长期卫星记录相比，今年的海冰覆盖了更多南部海洋。然而，南极洲这一上升趋势只相当于北冰洋海冰丢失程度的 1/3 。自 20 世纪 70 年代晚期以来，北极每年丢失了 53900 平方千米的冰；南极每年增加了 18900 平方千米的海冰。今年 9 月 19 日，自 1979 年以来南极洲的海冰结冰区域首次超过了 2000 万平方英里，根据国家冰雪数据中心（ NSIDC ）这样显示。这一基准的结冰程度持续保持了几天。 1981 年至 2010 年间平均最大的结冰范围为 1872 万平方千米。今年单日最大结冰量发生在 9 月 20 日，据国家冰雪数据中心的数据显示。在这一天海冰覆盖面积为 2014 万平方千米。今年五天平均最大结冰量发生在 9 月 22 日，海冰覆盖了 2011 万平方千米。图 4 2014 年 9 月 20 日南极海冰分布 http://www.weather.com.cn/climate/2014/10/qhbhyw/2209601.shtml 是非判断是简单判断，人世间的纷争正是这种简单判断的产物。事实上，争论双方不是 100% 的对和 100% 的错，各有对错的百分数才是最准确的判断。更为重要的是，正像我们准确预测 2014 年最热一样，我们的研究得出冷暖极端事件将连续发生的结论：结论之一：如果 2015 年发生强厄尔尼诺事件，与 2014-2016 年月亮赤纬角最小值叠加，将形成比 2014 年更高的气温。结论之二：赵得秀教授根据日食 - 厄尔尼诺系数理论预测， 2023 年将发生拉尼娜事件。 2023-2025 年月亮赤纬角最大值与之叠加，将产生极冷气温，拉马德雷冷位相增强了这一作用。 http://blog.sciencenet.cn/blog-2277-863589.html http://blog.sciencenet.cn/blog-2277-864190.html; 个人分类: 科技点评|3995 次阅读|5 个评论

网络投票，靠谱么？: 热度 2 周春雷 2013-12-12 12:31; 某高校研究生会举办了一个网络投票活动，目的在于从全校范围内评选出同学们最喜爱的“十大好导师”，结果在执行过程中发现刷票行为严重，不得不重新制定计数规则。以下为引用的通知原文： ----------- 规范投票纪律 2013-12-06 01:08:57 来源: 好导办为了贯彻并执行本活动的规范、公平原则，真正产生同学们最喜爱的“十大好导师”，现将投票纪律重申如下： 1. 投票为每个IP每两小时可投10票。 2. 不得以同样的评语重复投票。 3. 不得冒充他人姓名投票。针对以下情节，我们将进行投票删除处理： 1. 以同样的评语重复投票（即使投票者不同姓名，若评语完全一致，视作刷票）。 2. 发布恶意攻击、毁谤的言论，或与投票主题无关等无意义评论。 3. 同一个学号使用多个网段的IP反复投票，将视为刷票。 ------- 以我看来，出现这种博弈行为一点也不奇怪：被评价者来自不同的院系，潜在的票源差异极大，计数规则漏洞明显，以IP地址作计量单位并不科学，再加上一些压根不知诚信为何物的玩家和可能存在的收钱办事的职业水军，不出现爆high场景反倒令人意外。最重要的是，评价的目的有意义吗？？学术界的事情，还是别玩成喧嚣的选秀闹剧吧？; 个人分类: 学术评价|8262 次阅读|4 个评论

2013年应用科学与工程创新国际学术会议【ASEI2013究竟靠不靠谱】: 热度 1 swh1989 2013-9-25 17:39; 在科学网上查到“2013年应用科学与工程创新国际学术会议”在征稿，但是发现这个会议没有开会地址，觉得比较奇怪，后来网上查了下这个会议的情况，口碑不一，也有很多人像我一样质疑。详见网址 http://blog.sciencenet.cn/blog-81552-668701.html ，在小木虫上议论也是不一，详见网址 http://emuch.net/html/201305/5955004.html ，烦请科学网会议编辑证实下该会议的可信度。我打电话该会议的指定服务电话，问了两个问题（1）国际期刊一般是不要版面费，你们这么贵的版面费究竟用在哪里？对方回答，我们收的。（2）有没有指定的期刊？对方回答，先审稿，再指定期刊。此外，对方回答问题的环境好像特别嘈杂，不像一个编辑部或者来稿中心的工作地点。此外，在网上查找下对方提供的电话号码，这个号码还是一个名叫“北极猫”的休闲车服务电话。以上所有疑点不得不让人怀疑此会议的可信度和真实度。; 5520 次阅读|2 个评论

科学数据的可信度有多高？: 热度 27 jiangjiping 2012-11-17 23:01; 科学数据的可信度有多高？蒋继平 2012 年 11 月 17 日最近的一系列事件使我这个在科研领域奋斗了 30 多年的科技人员对科技数据的可信度产生了高度的疑问。现在我在此列出三个具体的例子让大家评论一下。第一个例子是：大约一个月前，我们给加州一家国际上认证的种子质量检测企业送去了 10 多份种子样本，要求对每个品种进行三个病毒的检测。这三个病毒是种子带菌病害，对种子质量至关重要。它们分别是烟草花叶病毒（ Tobacco mosaic virus ） , 简称 TMV; 蕃茄花叶病毒（ Tomato mosaic virus ） , 简称 ToMV; 还有一个是 PeMV 。检测报告显示所有样本的 ToMV 和 PeMV 都是阴性反应，也就是说这些样本不带有任何这两种病毒。可是，令人感到非常意外和吃惊的是，所有的样本的 TMV 数据都是阳性反应，也就是说这些样本都带有 TMV. 这个报告对我是一个非常沉重的打击。这是因为一旦种子被确认为带有 TMV , 那这些种子就等于被判处了死刑。烟草花叶病毒是种子带菌，机械传播的一种病毒病害，在自然界生存和传播的能力很强。它相当于人类的爱滋病。所以，我们对它是非常害怕的，因而，是格外小心的。我仔细地查看了报告的数据，觉得所有品种的数据很接近，几乎在同一个区间内波动。我对这组数据产生了很大的怀疑，要求老板将同样的样本送往爱荷华州立大学（ Iowa State University ）的种子检测实验室进行 TMV 的检测。检测结果是全部阴性反应，也就是说这些种子不带 TMV 病毒。这个结果是我预料之中的事。这是因为我们在田间收获这些种子时并没有发现任何烟草花叶病毒的存在。我们拿到爱何华州立大学的报告后，立即与加州的企业联系，要求进行其中四个品种的病毒生物毒性检测，看看这些“病毒”是否有活性。检测结果是阴性，也就说这些“病毒”已经没有活性，不能造成病害。那位负责监测的科学家说活性检测的结果与酶标检测的结果不一致，但是以活性检测的结果为主，仍然可以给我们开出这四个品种种子不带 TMV 的质量证书。那么，请问各位看官，加州企业的 TMV 酶标检测的数据是否可靠？其可信度有多高？第二个例子是：我的一位助手用同一种试剂，对同一个样本进行生物化学的测试，结果是同一种试剂的两根不同的试条获得结果相差很大，比如说，一根试条的读数是 140 ，另一根是 250 。按照试验的正常状态，它们应该是一致的，至少也应该在 130-150 之间。可是，事实上，它们相差很大。我接到助手的报告，一开始不相信，就自己动手重复了他的实验，结果我也获得了与他差不多的结果。从此，我对这个产品和实验数据的可信度产生了高度怀疑。第三个例子是：我拿我自己当试验品，在家中，在超市，在家庭医生门诊室做同样的高血压检测。我发现即使是在同一时间，在同一种状态下，用同一种仪器，其检测结果也会大不一样。具体地来说，我在家中用简易高血压电子检测仪对自己的血压进行检测，我一般连续检测四到五次，结果每次都获得不一样的结果，有的时候相差很大。在超市的检测结果也是如此。在家庭医生门诊室，先由护士检测，再由医生检测，结果是医生和护士的检测结果也不一样。您相信谁的数据？所以，对我来说，科学数据只是一些数据而言，不能全信，要对其进行分析和思考。; 个人分类: 故事感想|9757 次阅读|69 个评论

首部《中国自然灾害风险地图集》，能信得过吗？: 热度 5 陈龙珠 2011-5-10 21:02; 据新华社传媒报道，作为国家“十一五”科技支撑重点项目“综合风险防范关键技术与示范”的支撑成果之一，《中国自然灾害风险地图集》近日在京发布。相关负责人称，该地图集着重展示了我国各类自然灾害风险的区域分布特点，以及各省区市综合自然灾害风险的空间差异：中国综合自然灾害相对风险等级呈现出“ 东部高于中部、中部高于西部 ”的格局，其中长三角及长江下游沿江地区、淮河流域、华北平原及京津唐地区、两湖地区、汾渭盆地、四川盆地、下辽河地区成为全国7个综合自然灾害高风险地区。凭直觉，本博对上述的结论，与我国当前社会和经济发展相对水平的区域分布颇为一致，感到疑惑。去年我曾审读过一篇相关的文稿，其中对人口密度越大、经济体量越高的地区，给予更高的受灾易损性，严重忽视了这些地区在设计和建造基础设施时已给予了相对更高的抗灾能力储备的现实。若由这类不成熟的理论体系来编制国家级灾害风险等级地图，则或许会为那些相对落后而自然灾害频烈度不低的地区之基础设施，在今后相当长的时间内被忽视尽快地得到必要的改善，埋下不可忽视的社会隐患！相关信息： “长三角地区自然灾害风险等级评估技术研究”课题接受专家中期评估（2011-04-12）; 个人分类: 防灾减灾|6088 次阅读|5 个评论

如何看待网上发布的材料？: sqdai 2010-8-17 05:52; 昨天说了自己逛博客的一些感想，似乎意犹未尽。今天说说在看待网上材料的一些想法，与博友们一起探讨。互联网为我们打开了极为广阔的信息天地，人们可以足不出户，尽收大千世界的风云变幻，大到时闻要务，小到鸡毛蒜皮，包罗万象，无所不有，只要在选定的网站，输入关键词，立即跳出你想要的消息或知识，也可以通过谷歌、百度等，随心所欲地搜索到所关注的信息。网络有时在人们判断事物的过程中起重要作用。这里讲一个故事。几年前，受国家自然科学基金委员会之邀，我参加了一次杰出青年基金项目的全委终审。任务是把当年基金委各个学部经网上公示的全部拟批准的项目最后过一遍。评审会一开始，就抓岀一个公示期内有人揭发申请者一稿多投的项目来讨论。我拿过项目申请书一看，不禁笑了：这位申请者也做得忒明目张胆了一点，把作者、题目完全相同但发表刊物不同的三篇论文相继并列，一稿多投的劣迹如秃子头上的虱子，一目了然！于是，与会者一致同意，枪毙该项目：取消了该项目参加终审的资格。此例显示了网络公示的作用。（但我当时想，此项申请是如何通过通讯评议和会议评审的？此前的评审人也太粗心了吧！）接着，在一般性质疑 - 讨论过程中，有一位名校副校长发言，指出，申请者中有一位 B 君，网上有人质疑，他的有效论文数有假，十几篇主要论文中，申请者为通讯作者且与申报项目直接相关的寥寥无几，多数与项目无直接关联性，甚至风马牛不相及。网上还有人揭发，此君十分霸道，长于把别人的成果窃为己有，他所领导的单位中，别的课题组的论文，他也抢着署名，有时还抢做第一作者，底下的人敢怒而不敢言。难怪他展示的论文显得他相当博学。此言既岀，引发轩然大波，很多参会者争相发言。归纳起来，一部分人认为网络言论不可信，有些可能是挟私报复随意编造的；另一部分人认为，网上的揭发有较大的可信度，因为当事人提供了足够的证据， B 君涉嫌论文数造假。那段时间里， B 君在网上小有名气，招来的议论真不少。恰好我在出访期间，抽空读了网上关于 B 君的主要材料。发现：揭发者把论文内容、写作过程等等和盘托出，符合新闻学中写文章提供 6W 的原则；网上言论基本上是众口一词的， B 君的反驳显得十分苍白无力。因此，我立即站在第二拨评审者一边，认为 B 君涉嫌的论文数造假罪名成立。记得我当时这样说：对于网络上的信息的可信度问题，我的看法是：大致说来， 20 ％真实可信，情况属实； 20 ％完全不可信，属于捕风捉影无中生有一类；还有 60 ％则模棱两可，其中有可信的部分，也含有水分。就 B 君的网上材料而言，应该属于第一类。言毕，不少人鼓掌，表示同意。接着，申请者研究领域的内行们（其中有人调阅了申请者的论文）充分表述了各自的具体看法，意见倾向于一边倒。最后，通过无记名投票， B 君落选。是为当年终审中经投票唯一被淘汰者。上面这个故事充分显示了网络的威力，人们只要正确地利用网络提供的信息，可以做过去难以做到的事情。话说回来，对于网络信息，我们仍应科学地对待，不可不信，不可全信。我前面提出了 20 ％－ 60 ％－ 20 ％的分类，这只不过是我们做理工科研究者的积习：凡事喜欢量化，不尽科学、准确，只能说大致趋势如此。网上材料总有一小部分是水货，纯属胡编乱造；还有相当一部分是含水货，不全虚假，不全真实。总起来说， 80 ％是含水分的，我们不能轻易相信，需要仔细分析，去伪存真，去芜存精。那么，水分从何而来？别有用心者故意造谣生事。世上总有那么些人（尽管为数极少）唯恐天下不乱，善于空穴来风，瞎编故事。而谣言编得越离谱越恶毒，在网上传播的速度越高，造谣者深谙此道。偏听偏信者随意传播谣言。有些人视力模糊耳根软，一听谣传就相信，跟着瞎起哄，瞎传播。更可恶的是，有人在传播过程中添油加醋，网上的消息随之越来越离谱。无知者无心散布不实之词。更多的人是跟风、照搬。我有时到网上搜索一个主题，哇！出来成千上万条，仔细一看，只有头十条还算新鲜，其余多是你抄我，我抄他的二手货乃至十手货，其中不乏以讹传讹的传谣者。所以，我们既要充分发挥网络的威力，又要对网上的材料慎之又慎：拒绝水分，更拒绝水货。写于 2010 年 8 月 17 日晨; 个人分类: 灯下琐语|4576 次阅读|0 个评论

上海将终结钓鱼式执法并向公众公开道歉: 陈龙珠 2009-10-26 10:37; 转注：上海城市交通钓鱼执法事件到目前已有明显的进展。这样的结果，使我再次对那些不畏世道艰险而奋力抗争的张军（从以下报道看实名似为张晖）们，肃然起敬！ ........................................... 　　新华网快讯：记者26日从上海市政府常务会议获悉，浦东新区将终结孙中界钓鱼式执法案并向公众公开道歉；闵行区张晖事件执法取证不正当，区政府将依法撤销原处罚决定。 . 上海钓鱼执法事件回顾 10月26日：上海浦东城管执法局向孙中界道歉并承诺赔偿 10月26日：上海浦东区称城管局对钓鱼执法事件结论不属实 10月23日：上海钓鱼执法事件当事人要求返还车辆 10月22日：上海浦东成立联合调查组再查钓鱼执法事件 10月20日：上海浦东新区城管局否认存在倒钩执法 10月19日：上海执法队设诱饵查黑车续：律师申请信息公开 10月17日：上海要求查明被指开黑车司机砍手指证清白事件 10月14日：司机被指非法营运为证清白刀砍手腕自杀 09月16日：白领驾车搭载胃疼路人被指非法运营 ........................................... 附录（摘录自 http://sh.sina.com.cn/news/s/2009-10-26/0847119931.html ）据了解，上海各区县钩车的劳务费不尽相同，南汇钩一辆250元，嘉定和青浦400元，闵行500元，奉贤600元。这些钱，每月由钩头到各区交通管理执法大队结算领取。实际拿到手的，只有80%左右，其余部分被执法大队提留。　　以闵行区为例，每钩一辆车，钩头可领回400元，其中200元揣到自己的腰包，另外200元分给实际钩车的人。做钩子，月收入多则五六千，少则两三千。如果做钩头，月入一两万是稀松平常的事。在那个小圈子里，钩头是令人向往的职业。; 个人分类: 社会思考|4377 次阅读|5 个评论

业内戏言浅析: 陈龙珠 2009-10-5 10:25; 土木工程是一个隶属于工科的大领域，其中包括结构、岩土、市政、桥隧、暖通、防灾等二级学科，目前其复杂问题的科学研究方法主要有实验观测和数值模拟。人们一般认为，实验观测是认识客观事物属性最可信的途径，而理论分析或数值模拟的结果必须经过实验观测的检验才能应用。但由于精力和能掌握的研究资源有限，具体到一个人来说往往会偏重于使用某一种方法，实验和理论相互脱节的现象，现在似乎屡见不鲜。当前在我国海量土木工程项目设计中流传算不清，加钢筋顺口溜和如下两方面的戏言，或许就是例证。对研究数值模拟的专家来说，在材料本构关系模型、单元属性、网格划分、边界条件、荷载以及数学方法等相关问题进行系统深入的研究后，往往会认为自己的成果严密而可信。但由于实际工程结构体系很复杂、计算机技术能力有限，目前的数值模拟技术在众多关键性问题方面难能考虑周全和必须进行简化处理，计算结果暂多用于定性认识工程指标的变化趋势和设计方案比选上，但在定量准确化方面上经常不尽如意。因此，具有一定理论分析涵养但工程实践丰富的一些工程师曾经戏言，数值模拟的研究结果，主要是研究分析者自己最为相信。与上述相反，对利用室内外实验观测开展研究方面的专家来说，虽然在试验准备阶段对材料、加载、边界条件和观测系统等大多会进行较为周密和充分的论证，但还是很难在物理力学方面满足所有的相似率要求，测试系统有时也会出现未被发现的、但会影响测试结果的问题，更糟糕的是对实验数据的采信和剔除往往是基于测试分析人员既有的知识和设想或理论预估进行的，甚至会出现故意捏造。因此，一些具有实验观测经历的科技人员曾戏言，现在的许多实验观测研究成果，大多是非实验研究人员最为相信的。业内的戏言，既深刻地提醒人们应慎用当前的相关研究成果，同时也为今后的研究工作指明了改进的方向。推荐博文：王德华-不理想的数据可以剔除吗？; 个人分类: 高等教育|4985 次阅读|2 个评论

如何设计调查问卷: 热度 1 youyouch 2009-2-23 10:20; 调查问卷是研究生必备知识之一，也是很重要的一种研究手段。所谓调查问卷，就是根据调查目的，制定调查问卷，由被调查者按调查问卷所提的问题和给定的选择答案进行回答的一种专项调查形式。问卷调查以其通俗易懂、实施方便、适用范围广、节省调查时间、调查效率高等优点被学界和企业界广泛的使用，成为国际通行的一种调查形式，在我国也应用广泛。一份好的调查问卷可以获得第一手资料，获得标准化、系统化调查内容，便于后期的数据处理。那如何才能设计一份效果较好的调查问卷呢？下面介绍一些调查问卷的基本知识，以供参考。一调查问卷的组成调查问卷通常由三部分组成：前言、主体内容和结束语。问卷前言主要是对调查主题、目的、意义、调查的主办单位及对个人资料隐私保护等的说明。问卷的开头是十分重要的。大量的实践表明，几乎所有拒绝合作的人都是在开始接触的前几秒钟内就表示不愿参与的。因此，前言部分文字必须简明易懂，诚恳礼貌，能激发被调查者的兴趣。问卷主体是调查所要收集的主要信息，它由一个个问题及相应的选择项目组成。通过主体部分问题的设计和被调查者的答复，调查者可以对被调查者的情况有较充分的了解，以便于作进一步的数据统计与分析。问卷结束语主要表示对被调查者合作的感谢，记录调查时间、调查地点等。结束语要简短明了，有的问卷也可以省略。二调查问卷的设计调查问卷是以问题的形式系统地记载调查内容的一种印件。设计问卷，是询问调查的关键。完美的问卷必须具备两个功能，即能将问题准确传达给被问的人和使被问者乐于回答，这样的问卷才能具有一定的信度和效度。要完成这两个功能，问卷设计时应当遵循一定的原则和程序，运用一定的技巧。 1 调查目的和内容要明确在问卷设计中，最重要的一点就是必须明确调查目的和内容。为什么要调查？对哪些对象进行调查？调查需要了解什么？首先，要确定主题和调查范围。根据调查的目的要求，研究调查内容、调查范围等，酝酿问卷的整体构思，将所需要的资料一一列出，分析哪些是主要资料，哪些是次要资料，淘汰那些不需要的资料，再分析哪些资料需要通过问卷取得、需要向谁调查等，确定调查地点、时间及调查对象。比如，要调查学生的作业习惯，可从学生做作业注意力方面；做作业规范方面；自主完成和合作方面；作业反思方面等入手调查。其中做作业规范方面就不一定要通过问卷获得答案，可通过学生的作业直观了解。其次，要分析样本特征。即分析了解各类被调查对象的基本情况，以便针对其特征来准备问卷。 2 问卷问题设计要合理科学（ 1 ）问题的形式与排列调查问卷提问的方式一般可分为以下两种形式： ① 封闭式提问。也就是在每个问题后面给出若干个选择答案，被调查者只能在这些被选答案中选择自己的答案。设计问卷时要注意让其回答起来方便，例如，尽可能划 O 或或，少写文字。 ② 开放式提问。就是允许被调查者用自己的话来回答问题。由于采取这种方式提问会得到各种不同的答案，不利于资料的统计分析，因此在调查问卷中不宜过多。问卷中问题的排列也会影响到问卷的回收率以及有效率，一般按下列规则排列： ① 容易回答的问题放前面，较难回答的问题放稍后； ② 封闭式问题放前面，开放式问题放后面。 ③ 要注意问题的逻辑顺序，可以将问题按时间顺序、类别顺序进行列框，由一般至特殊，循序渐进，逐步启发被调查者，使得被调查者一目了然，在填写的时候自然就会愉快地进行配合。（ 2 ）问题的表达与措辞问题的措辞不当往往会使被调查者误解题意或拒绝回答，影响回答率，从而直接影响数据质量。因此，在问题的表达与措辞方面要注意以下几点。首先，文字要表达准确，不应使被调查者有模糊认识。例如问题您通常喜欢选购什么样的旅游鞋？就是用词不准确，因为对通常什么样的含义，不同的人有不同的理解，回答各异，不能获取准确的信息。如改为具体的问题：您外出旅游时，会选购什么牌子的旅游鞋？，这样表达就很准确，不会产生歧义。其次，问卷要避免使用引导性的语句。如设计问卷时，问某牌号的电脑质优价廉，您是否准备选购？这样的问题具有一定的引导性，容易使被调查者简单得出结论，这样不能反映被调查者对商品的真实态度和真正的购买意愿，所以产生的结论也缺乏客观性，结果可信度低。再次，问卷问句设计要有艺术性，避免对被调查者产生刺激而不能很好地合作。如下面两组问句： A ：您暂时不准备买电脑的原因是什么？（ a ）买不起（ b ）没有用（ c ）不懂（ d ）软件少 B ：您暂时不准备买电脑的主要原因是什么？（ a ）价格高（ b ）用途较少（ c ）性能不了解（ d ）其他显然 B 组问句更有艺术性，能使被调查者愉快地合作。而 A 组问句较易引起被调查者反感、不愿合作或导致调查结果不准确。最后，问卷不要提不易回答的问题。比如涉及被调查者的心理、习惯和个人生活隐私等问题。遇有这类问题，如果实在回避不了，可列出档次区间或用间接的方法提问。如调查学生的费用开支情况，如果直接询问，不易得到准确结果，而划分出不同的档次区间供其选择，效果会比较好。（ 3 ）问题的数量与试测问题的数量也是一份调查问卷能否成功的关键，问卷尽可能简短，其长度只要足以获得重要资料即可，问卷太长会影响填答效果，最好控制在 20 分钟以内。即使是一份很成功的问卷，也须要经历时间的考验，所以在问卷设计完成时，应该先进行小范围的试测，并对调查问卷进行及时调整。只有这样，才能够达到调查的最终目的，就是得到准确的数据和分析。最后祝大家学习进步！; 个人分类: 学术研究|11037 次阅读|0 个评论

四川地震专家称：“7到8级地震”说太模糊太没依据: 杨学祥 2008-9-6 09:03; 　　还会有 7 到 8 级的大地震？到底是真是假？昨（ 5 ）日，不少市民就前日国新办新闻发布会中国外媒体说，今年 9 月可能在中国西南地区还会发生 7 到 8 级大地震的记者提问议论纷纷，尽管国家汶川地震专家委员会主任马宗晋院士表示：这一点我们不能肯定，但市民对此仍有些担心。就此，四川省地震局研究员韩渭宾、成都市防震减灾局研究员洪时中均认为国外媒体的这一说法依据出自何处未能说明，过于模糊。专家洪时中说，从前晚开始，他就接到不少电话，都是询问今年 9 月份是不是真的有 7 到 8 级大地震。昨日，洪时中对于国外媒体这一说法的依据来源感到疑惑，这一依据源自哪里？是否有科学根据？还是猜测而已？这些都不清楚。对于 9 月份可能还有 7 到 8 级大地震的说法，洪时中说，依据是否具有科学性并不清楚，我本人认为可信度并不高。我多次查找相关新闻，没有找到国外媒体说，今年 9 月可能在中国西南地区还会发生 7 到 8 级大地震的详细报道。有人把中央电视台记者在提问时提到外媒曾经报道中国西南地区近两个月内可能发生 7 级到 8 级地震与社会上一度流传巴西预言家朱瑟里诺在其网站上的一条预言，大致内容是 9 月 13 日中国南宁与海南岛之间将发生 9.1 级大地震替换。这是张冠李戴，应该及时澄清。　　参考文献 1．郑其。 7 到 8 级地震说太模糊太没依据。 2008 年 09 月 06 日 06:26 四川在线 - 天府早报。 http://news.sina.com.cn/o/2008-09-06/062614411021s.shtml 2．杨学祥 . 相互矛盾的报道： 9 月 13 日将有 9 级大震的预言借尸还魂 . 发表于 2008-9-5 20:41:13 科学网。 http://www.sciencenet.cn/blog/user_content.aspx?id=37872; 个人分类: 灾害预测|6210 次阅读|9 个评论

更多...

帐号		自动登录	找回密码
密码			注册

关闭 安全验证

标签: 可信度

相关帖子

相关日志

关闭安全验证