科学网

 找回密码
  注册

tag 标签: 误差

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

系统的输出、误差及系统类型的定义
xiaoyanghe 2012-10-27 14:25
系统的输出、误差及系统类型的定义
最近给本科生上《自动控制理论》(双语),使用的教材是 J. David Powell 和 Abbas Emami-Naeini 合著的 Feedback Control of Dynamic Systems (Fifth Edition) ,参考文献 。该教材有其特色。下面对一些基本概念做一些探讨,希望能和同行一起交流,共同提高。 1、 什么是控制系统的输出 这是自动控制理论的一个基本问题。我们称被控制的量为控制系统的输出,如图 1 中 Y ( s ) (以后就简称为系统的输出或者输出)。系统的输出又称为控制系统对输入信号的响应。 可能是为了简化问题,参考文献 都没有考虑测量噪声。如果要考虑被控制量的测量噪声时,如何定义输出呢?文献 和文献 有不同的定义。文献 定义 Y N ( s ) 为输出,如图 2 所示。 文献 仍旧定义 Y ( s ) 为输出,如图 3 所示。 我觉得,相对来说,图 3 的定义可能更为合理,毕竟图 2 所定义的输出是已经被噪声所污染过的,不是我们想要的量。 按文献 的定义,反馈控制可以降低系统相对于参考输入信号和扰动输入信号的敏感度,但无法同时降低系统相对于噪声输入信号的敏感度(两者是有矛盾的)。 2、 什么是系统的误差 如果按图 1 的情形,一般都定义为 E ( s )= R ( s )- H ( s ) Y ( s ) ( 1 ) 这里不会有什么异议。对于图 3 的情形,我们仍然应该按上式定义。 但是,要注意的是,此时的误差已经不是控制器的输入信号了。 如果有什么疑惑,不妨先假设 H ( s )=1 ,一切就都好理解了。 3、 如何定义系统类型 除了文献 ,参考文献 中,,都是按开环传递函数 C ( s ) G ( s ) H ( s ) 中包含的积分环节的个数来定义系统类型。即,如果不包含积分环节,称为 0 型系统,如果包含一个积分环节,称为 1 型系统,依此类推。 而文献 的定义如下: A stable system can be classified as a system type, defined to be the degree of the polynomial for which the steady-state system error is a nonzero finite constant. 需要解释一下,这里的 polynomial 是指输入时间函数的多项式。 该定义的好处:一是只针对稳定的系统定义系统类型,对于不稳定的系统,由于不存在稳态误差,就不定义系统类型了。二是,系统的类型是和输入信号的位置有关的。例如,对于图 4 所示的系统: 按一般教材的定义,该系统是 2 型系统。而按文献 的定义,对于参考输入 R ( s ) ,系统是 2 型系统;对于扰动输入 D ( s ) ,系统是 1 型系统。 按文献 的定义,我们可以有以下的结论了: 0 型系统不能消除稳态误差; 1 型系统可以消除阶跃输入信号带来的稳态误差,而对于斜坡输入信号的稳态误差是一个有限的常值,其余依此类推,不管输入信号作用在何处。 顺便说一下,一般不会讨论噪声引起的稳态误差。正确的做法是,在反馈通道加滤波器将其滤除。 4 、 稳态误差常数如何定义 我们都知道,所有的教材,稳态误差常数定义如下: 稳态位置误差系数:K p =Lim 稳态速度误差系数:K v =lim 稳态加速度误差系数:K a =Lim 既然只有稳定系统才有稳态误差, 建议最好在定义这些系数之前加一个条件 ,即 1+ C ( s ) G ( s ) H ( s )=0 ( 2 ) 的根都位于 LHP (左半平面)。也就是说,对于不稳定的系统,我们就不讨论稳态误差系数了,没有意义! 参考文献 J. David Powell, Abbas Emami-Naeini. Feedback Control of Dynamic Systems (Fifth Edition) . 北京:人们邮电出版社, 2007 年 B. C. Kuo. Automatic Control Systems (7 th Edition) . New York: John Wiley Sons, INC 李友善 . 自动控制原理 . 北京:国防工业出版社, 2005 年 吴麒,王诗宓 . 自动控制原理(上册)(第二版) . 北京:清华大学出版社, 2006 年 胡寿松 . 自动控制原理(第四版) . 北京:科学出版社, 2001 年 卢子广,林靖宇,周永华 . 自动控制理论 . 北京:机械工业出版社, 2009 年
个人分类: 教学|5635 次阅读|0 个评论
关注潮汐组合:北京两次暴雨预报为什么出现误差?
热度 1 杨学祥 2012-7-26 14:34
关注潮汐组合:北京两次暴雨预报为什么出现误差? 杨学祥 有媒体提出,市气象局在预报时报的是暴雨,但 7 月 21 日 实际降雨级别远远超过预报程度。市气象台总工程师、首席播报员孙继松介绍,气象台在 24 小时前预报了暴雨情况, 预报差了一个量级 。北京发生全市性的大暴雨以上的天气过程在历史上非常罕见, 24 小时前预报暴雨对于市气象台来说也很少见。 http://news.china.com/focus/beijingbaoyu/11124818/20120726/17338434.html 尽管气象部门 25 日中午就预告称,北京当天傍晚至夜间将有大雨到暴雨,但 18 时至 19 时之间,北京城区仅仅降下 0.9 毫米雨量。这让刚刚经历了“ 7 · 21 ”雨灾的北京人感受到了天气的诡异莫测。北京全城躲雨现空城奇景,然而暴雨爽约令人空等。 http://news.ifeng.com/mainland/special/beijingdayu/content-3/detail_2012_07/26/16300084_0.shtml 潮汐组合 C : 7 月 19 日 为日月大潮, 16 日月亮赤纬角达到最大值北纬 21.66613 度,两者弱叠加,潮汐强度较强,潮汐南北摆动较大,地球扁率变小,地球自转变快,有利于厄尔尼诺发展(强),可激发地震火山活动和冷空气活动。 潮汐组合 D : 7 月 26 日 为日月小潮(上弦), 23 日月亮赤纬角达到极小值北纬 0.00017 度,两者弱叠加,潮汐强度达到最小值。赤道和两极潮汐变化幅度大,地球扁率变大,地球自转变慢,有利于拉尼娜发展(弱)。 7 月 21 日 北京暴雨发生在强潮汐组合 16-19 日以后 2 天,受强潮汐的激发作用,暴雨强度增大,形成不可抗拒的特大自然灾害; 25 日暴雨发生在弱潮汐组合 23-26 日之中,暴雨未在北京发生,转移到了天津。 强潮汐对暴雨的激发作用值得关注。 相关新闻: 北京气象局:暴雨当天预报差了一个量级 2012-07-26 08:41:31 北京日报 【大 中 小】 特大自然灾害直接经济损失 116.4 亿 8 月 5 日 前受灾群众入住临时房屋 本报记者 侯莎莎 昨天,市政府新闻办召开北京“ 7 · 21 ”特大自然灾害情况通报会。根据市委、市政府部署,用 3 个月左右的时间,将可重新使用的受灾房屋修建完毕,让受灾群众早点搬进去;利用 10 天左右的时间完成受灾群众临时房屋的搭建,保证 8 月 5 日 前能够入住。此次特大自然灾害已造成直接经济损失 116.4 亿元。 经济损失:升至 116.4 亿元 市防汛抗旱指挥部副指挥、新闻发言人潘安君通报:此次暴雨灾害的最大雨量点发生在房山区河北镇,雨量为 541 毫米。全市因灾造成直接经济损失 116.4 亿元。 目前城市的主要道路全部恢复正常,水电气热生命线工程正常。拒马河险情得到控制。现在,各种保障物资已向受灾严重的区县调运。卫生部门组织卫生防疫应急小分队赶赴灾区一线,指导开展卫生防疫工作,采购 110 万元的药品发往灾区,目前灾区没有发生疫情。水务部门迅速赶到现场,抢修供水管线,保证农村地区供水。 气象:预报差了一个量级 有媒体提出,市气象局在预报时报的是暴雨,但 7 月 21 日 实际降雨级别远远超过预报程度。市气象台总工程师、首席播报员孙继松介绍,气象台在 24 小时前预报了暴雨情况,预报差了一个量级。北京发生全市性的大暴雨以上的天气过程在历史上非常罕见, 24 小时前预报暴雨对于市气象台来说也很少见。 排水:大暴雨远超城市设计标准 有记者问,北京这次大雨造成如此大的损失,北京的排水系统为什么失效? 潘安君介绍,城市建设在不同的时期有不同的标准,北京在城市建设过程中总体标准在国内处在领先位置,但与世界发达国家大城市、世界级城市还存在一些差距,这场大暴雨远远超出我们的设计标准。我们在建设世界城市的过程中,要不断提高城市建设标准来适应气候不断变化的情况。 京港澳高速:打捞机动车 127 辆 据市交通委副主任、新闻发言人李晓松介绍, 7 月 21 日 京港澳高速南岗洼路段发生严重积水,积水路段长度达到 900 米,积水约 20 万立方米左右,平均水深 4 米,最深处达到 6 米,致使双向车辆无法通行。 发生险情之后, 7 月 21 日 23 时 45 分,首发集团立即向上级报告,从市到各相关部门迅速开展工作。在这次抢险中,各单位一共出动抢险人员 7000 余人,其中武警、公安消防等部队官兵 4000 多人,器械设备 500 多台、套。到 7 月 23 日 上午 6 时,排水泵主泵修复完毕, 7 月 24 日 上午 8 时积水排干,抽排积水达到 23 万立方米,清理淤泥 3000 余立方米,打捞机动车 127 辆,其中出京方向 116 辆、进京方向 11 辆,找到遇难者 3 人。 灾后重建: 3 个月时间完成受灾房屋修建 潘安君介绍,今天上午,市委、市政府召开了“ 7 · 21 ”特大自然灾害善后工作领导小组第一次会议,对这次灾后恢复重建工作,包括安置工作做了全面部署。主要措施包括:要用 3 个月左右的时间,将可重新使用的受灾房屋修建完毕,让群众早点搬进去;利用 10 天左右的时间完成受灾群众临时房屋的搭建,保证 8 月 5 日 前能够入住;从长远生活出发,对不能回迁的受灾群众,按照科学规划、科学选址的原则,选择搬迁安置点;在半个月内要确保房山区全区供水系统、道路系统恢复正常。 现场问答 记者:北京作为现代化城市,为何一场大雨造成这么大的伤害? 潘安君 ( 市防汛抗旱指挥部副指挥、新闻发言人 ) :北京是发展中的大城市,中心城区的城市化程度很高,各项基础设施相对完善,但农村地区的基础设施还有薄弱环节。 李江 ( 房山区委常委、常务副区长 ) :房山区基础设施,特别是排水系统相对薄弱。雨水收集系统还需提升。房山区这几年正处于资源型产业向现代化、城市化、工业化发展阶段,是首都的发展新区,基础设施建设正处于更新、改造、提升的阶段。另外,地形复杂和上游泄洪等多种因素造成山区丘陵地带山洪和泥石流爆发。大石河和拒马河洪水爆发,引发新的次生灾害,破坏力叠加,对基础设施破坏明显。 http://news.china.com/focus/beijingbaoyu/11124818/20120726/17338434.html 北京全城躲雨现空城奇景 暴雨爽约 2012 年 07 月 26 日 13:18 来源:辽宁电视台 http://tv.people.com.cn/n/2012/0726/c14645-18604660.html 天津普降大到暴雨 部分路段积水交通受阻 2012 年 07 月 26 日 11:47 来源:中国新闻网 中新网 7 月 26 日电综合消息,受副热带高压和弱冷空气的影响,继 7 · 21 强降雨之后,自 25 日白天到今晨,天津市普降大到暴雨,部分路段出现积水,城市交通受阻。天津市气象台分别于今晨 5 时 35 分和 6 时发布 2 次暴雨橙色预警。预计今日白天,此次降雨还会持续,傍晚前后趋于结束。 据从天津市气象台获悉,截止到今晨 7 时,最大雨量出现在西青大寺,雨量为 195.0 毫米,达到大暴雨量级。市区雨量为 71.4 毫米,也达到暴雨量级。由于此次降雨系统由西南向东北方向前进,所以雨量集中较大的地区主要是静海、北辰、西青以及市区的河西、河东等地。 据监测数据显示, 25 日 05 时至 26 日 08 时,天津有 51 站出现暴雨, 92 站出现大暴雨,大暴雨的落区主要集中在天津中南部市区、北辰、静海、西青、津南、滨海新区等区县,其中最大降雨量出现在静海的薛庄子,为 235.2 毫米。 今天上午 9 时,天津降雨仍在持续。从当前的卫星云图上看到,包括天津在内的华北上空仍然是阴云密布。天津市气象台今天 7 时 50 分继续发布暴雨橙色预警信号,预计未来 3 小时内天津市区、滨海新区、静海、津南、西青、东丽等地仍将有 50 毫米以上的降雨,且有分散的超过 100 毫米的降雨。 针对此次强降水过程, 25 日天津市气象局发布了暴雨Ⅳ级应急响应命令,今晨 5 时 35 分将Ⅳ级应急响应命令提升至Ⅲ级。 6 时 35 分天津市政府启动暴雨Ⅲ级应急响应命令,要求全市气象、排水、防汛、交通、警备区等部门都积极采取措施,保证城市正常运行。 受强降雨影响,天津滨海国际机场暂时处于关闭状态, 20 个航班延误, 3 个航班取消,滞留旅客 3000 余人;市内路段积水严重,部分地道封闭,近 30 条公交线路改道;中短途客车班次减少。 天津市交通管理部门已经启动恶劣天气紧急预案,对全市 125 个积水点位, 28 个预积水低片, 54 个涵洞增派警力。交管部门表示,如果发现积水过深将采取交通管制,予以分流的措施。 气象专家表示,近期天津暴雨的频次如此密集,在气象记录中是比较少见的。提醒相关部门要及时检查、疏通或维修城市排水系统,加快城市基础设施恢复,防范短时强降雨造成的城市内涝,并及时做好交通疏导,也要防范局地雷电大风及冰雹等危害。此外山区要防范山洪、泥石流和山体滑坡等灾害,提前转移危险地区群众,做好海河流域等干支流及大中型水库防汛工作。 http://news.ifeng.com/mainland/detail_2012_07/26/16320595_0.shtml 北京做足准备暴雨未至 广渠门桥遭记者围观 观影记录 北京做足准备暴雨未至 广渠门桥遭记者围观 0 分 50 秒 优酷网 内容摘要 北京做足准备暴雨未至 广渠门桥遭记者围观 标签:暴雨北京记者围观 来源:优酷网 时间: 2012-07-26 13:32:19 http://v.163.com/zixun/V7M3CBCH5/V86DD7DUP.html 气象部门预告北京有大到暴雨 城区仅降下 0.9 毫米雨量 2012 年 07 月 26 日 01:48 来源:第一财经日报 作者:张旭东 谢雪琳 尽管气象部门昨日中午就预告称,北京当天傍晚至夜间将有大雨到暴雨,但 18 时至 19 时之间,北京城区仅仅降下 0.9 毫米雨量。这让刚刚经历了“ 7 · 21 ”雨灾的北京人感受到了天气的诡异莫测。 昨日 11 : 50 许,北京市气象台发布暴雨蓝色预警:“预计今天傍晚至夜间,本市东部地区 ( 大兴、通州、平谷、密云 ) 将有暴雨,雨量将达到 50 毫米以上。其他大部分地区有大雨到暴雨,累积雨量在 30~50 毫米。” 蓝色是四级暴雨预警(蓝色、黄色、橙色、红色)中最低的一级,量定标准是“ 12 小时内降雨量将达 50 毫米以上,或者已达 50 毫米以上且降雨可能持续”。而 21 日北京的暴雨预警为橙色( 3 小时内降雨量将达 50 毫米以上,或者已达 50 毫米以上且降雨可能持续),且为北京有暴雨预警以来的最高级。 http://news.ifeng.com/mainland/special/beijingdayu/content-3/detail_2012_07/26/16300084_0.shtml
个人分类: 科技点评|3415 次阅读|1 个评论
热烈祝贺神九凯旋,着陆点偏离16公里反应巨大高技术差距
热度 5 laserdai 2012-7-1 06:19
非常地特别高兴,神九太空遨游顺利凯旋,让古老的中华民族再一次走到了世界文明的最前列,今后毕将带领全人类向太空的深度继续进军。 前进,前进,进! 这当然是中国和中国人的骄傲,更是全人类的伟大进步。 高兴的同时,感觉到中国肩膀上担子加重了,因为这是全人类的事情,这是中国的义不容辞的责任和义务:带领全人类向太空前进。 神九返回舱成功着陆过程, http://news.sciencenet.cn/htmlnews/2012/6/266241.shtm “神九”返回舱成功着陆 三名航天员平安返回, http://news.sciencenet.cn/htmlnews/2012/6/266235.shtm 神九返回成功着陆 2012年6月29日9:53时 看了CCTV 直播, http://bbs.sciencenet.cn/blog-280034-587051.html 但是,也有一点美中不足: 神九着陆点偏离理论地点16公里 险掉进小河, http://war.163.com/12/0630/10/8586E9RF00011MTO.html http://news.163.com/12/0630/17/858VBHM40001124J.html 程庆欣透露, 受 草原上的高空风速影响 ,返回舱实际着陆点距离理论着陆点向东南偏离了16公里,好在当时着陆场晴空万里,能见度好、低空风速小,飞机能及时赶到,“虽然有颠簸,但着陆点仍在36×36平方公里的正常区域内。” 返回舱着陆瞬间, 在地上翻了个滚,落点在小山沟,地势不平 。 程庆欣说, 以往的搜救训练,都是在平地上进行的 ,返回舱落入沟底,对所有搜救人员都是个考验, 要快速做出判断,“情况复杂,我看了一下山顶,找到一小片稍微平整的地方,立即紧急降落,此时返回舱落地不到两分钟。” 对于神九着陆翻滚,总感飞船着陆形象有点不太成功,这跟单杠/高低杠等体操运动员一样,前面的一整套动作做得非常完美,但是落地的时候站立不稳甚至跌到很明显是美中不足。 关于16公里差距有点大了,因此 落点在小山沟,地势不平 。 人家直接飞回机场降落,我们还得去草原上捡回来。觉得 1.6公里才应该是正常范围,以后还需要改进十倍。 当然,人家在空天航空领域投入的金钱远超中国,大量试验积累的数据也是我国望尘莫及的。中国对载人航天的计划正在一项项的进行中,中国载人航天才做了几次试验,每次都有着质的显著提高,相信以后在降落的问题上一定有更多的改进,下一次的着陆达到跟飞机的机场降落完全一样的感觉。 有位博主还出了好主意说: 直升飞机钩挂着陆的方式 : 类似空中加油的方式,设计一种可靠的空中对接钩挂装置,可让直升飞机在飞行中可靠地钩挂住降落伞,然后平缓地随降落伞降落,用可控的方式缓冲下降的速率,最终平稳地将返回舱放在地面。 应该有更安全的方式进行返回舱着陆, http://blog.sciencenet.cn/blog-33982-587380.html
个人分类: 高技术与经济|4761 次阅读|21 个评论
生物实验结果的不确定性
热度 2 chemicalbond 2012-5-31 00:53
生物实验结果的不确定性
曾经参与科学网博客的一个讨论,话题是一些生物活性数据的难于重复性。有位某生物类期刊的工作人员跟我是有不同意见的,那是可以理解的。 美国化学会的药物化学杂志有篇新文章,基本上回答了一些我很多年前就想知道的问题: 《 The Experimental Uncertainty of Heterogeneous Public K i Data》 http://pubs.acs.org/doi/abs/10.1021/jm300131x 注意,文章摘要里面给的图有点误导,图中没有给出单位:摘要里面把Ki和pKi混在一起,而根据文章图中的单位应该是pKi, 即平衡常数Ki的负对数。如,6就是一个微摩尔,9就是一个纳摩尔。下面是来自正文里面有单位的图 基本上,这篇文章收集了大量的生物活性数据,通过统计分析来说明即使是对于同样体系的实验测量,得到的结果都是有一定误差的(pKi1 和 pKi2之间的差别)。统计上说,平均的误差大约是3倍,显然很多数据间的差别是大于3的。这从上图也可以看出,甚至很多差别是多于2个对数单位的,即100倍以上,那是蛮可怕的,这基本上不是正常的误差,而可能是来自某种错误因素了,否则,那啥生物学家的工作也太不靠谱了。 对于此类的数据挖掘,最好还是给一些具体的实例,看看问题到底在哪里? 否则,还是有点云中漫步的感觉。 另外,文章也建议用那个平均误差作为理论计算的上限。这个是有点问题的。一方面,上面那个3倍是各种胡乱数据的一个平均,而实际是对不同体系,可重复性就可能不太一样。比如,通常细胞活性数据就比酶的活性数据更不可重复。另一方面,有些时候理论计算的精度是可能强于实验的。这个不太好理解,但是有些时候计算预测出来的相对活性确实是比较精确的,因为很多可能的误差都被抵消了。
个人分类: 科普与新知|3765 次阅读|4 个评论
编程中数据处理的问题(三)浮点数运算与精度误差
andrewwang 2011-11-10 21:37
上篇博文提到了两种误差,“转换误差”和“舍入误差”。其实前者完全是因为我们只习惯用十进制的科学计数法,而计算机暂时又只能使用二进制,所以必须转换进制实现人与机器的数据互动。有要是有种外星人天生习惯用二进制思考问题,我想就没这个问题啦。Ha, joking! 这篇博文进一步探讨一下,机器具体怎么在运算中产生“舍入误差”,以及这种误差对数值计算算法有什么样的影响。首先是 机器精度E m ,这个概念很基础,但是时间长了容易模糊,只知道IEEE设计浮点数时使机器表示实数具有离散化的特性。有一种直观的理解方法就是:两个实数的差值小于 “它们平均值的E m 倍”的时候,这两个数在机器中就作为同一个数存储。 这种表述可以和浮点数的数轴标识对应起来。 If abs(A - B) (A + B)/2 *E m Then A == B in MACHINE; 一般在可以用这样的算法得到机器精度epsilon: epsilon = 1; loop = 0; maxloop = 100; while loop maxloop epsilon = epsilon/2; b = 1 + epsilon; if b == 1 break; end loop = loop + 1; end 如果实数的运算结果在机器精度表示的范围之外,那么就产生了舍入误差。 有两种情况舍入误差会造成较大的影响。一种是误差的累积,在许多(如几百万次)步骤运算后,微小的误差可能会累积产生对结果有明显的影响。另一种比较有趣,即便的步骤不多的运算,也有可能产生灾难性的误差。比如计算自然底数公式: e = Lim n-∞ (1 + 1/n) n 在计算时可以选择一个较大的数得到一个e的近似值。用一个较大的值n计算得到的近似值 f(n)和标准e值2.718281828459046 比较,得到误差error,无论用什么语言实现,结果都是类似的。下面是用8Bytes的float实现得到的数据(Intel Windows平台): n f(n) error 1.0e+000 2.0000000000 0.7182818285 1.0e+002 2.7048138294 0.0134679990 1.0e+004 2.7181459268 0.0001359016 1.0e+006 2.7182804691 0.0000013594 1.0e+008 2.7182817983 0.0000000301 1.0e+010 2.7182820532 0.0000002248 1.0e+012 2.7185234960 0.0002416676 1.0e+014 2.7161100341 0.0021717944 1.0e+016 1.0000000000 1.7182818285 可以看出n在10 8 的时候能到的最佳的近似值,而往后到10 16 的时候,误差竟然突增到灾难性的地步。虽然公式 e =(1 + 1/n) n 只有几步的计算,却产生了与理想情况巨大的误差。这是因为“1 + 1/n”的浮点加法在两个数相差很大的数量级的时候有很大的精度损失。8Bytes的浮点数拥有16位的十进制有效数字,因此当n=10 16 时,达到了有效数字的极限,1/n和1相比直接可以被忽略掉,结果自然也就是 1 了。 因此,浮点数运算有这样的特点“当 两个相差好几个数量级的浮点数相加 或者 两个几乎相等的浮点数相减时,舍入误差达到最大”。 另外在科学计算中经常被提起的误差来源于“用离散逼近连续函数”导致的截断误差(Truncation error),但是这种误差与机器本身和机器语言并没有关系,是属于算法设计中的问题。 研究机器运算的误差特点有两个用处,一个是在进行科学计算算法设计时能够有意识的想到这些问题,遇到问题也能够合理的分析;二是帮助我们更加熟悉面对的机器的特性,也是很有趣的过程。
2046 次阅读|0 个评论
编程中数据处理的问题(二)浮点数运算与精度误差
热度 2 andrewwang 2011-11-7 23:52
浮点数的运算误差主要来源于两个方面,“转换误差”和“运算舍入”。 所谓“转换误差”,先看一段C程序: float a = 0.65f;   float b = 0.6f;   float c = a - b; 此时c=0.5吗?运行结果其实是 0.0499999523,为什么?是我们输入十进制的0.65和0.6其实转换成二进制时为:   (0.65)10 = (0.101001100110011001100110011001100110011......)2   (0.6) 10 = (0.10011001100110011001100110011001100110011......)2 省略号就是无穷尽。而实际的存储只能是取前几位,造成转换误差。实际上我们输入十进制整数是能无误差转换成二进制,而小数却不一定(进制转换方法不详述)。 来看什么时候这个数字会无法表示呢?那么只有两种情形:    1) 幂数不够表示了:这种情况往往出现在数字太大了,超过幂数所能承受的范围,那么这个数字就无法表示了。如幂数最大只能是10,但是这个数字用科学计数法表示时,幂数一定会超过10,就没办法了。    2) 尾数不够表示了:这种情况往往出现在数字精度太长了,如1.3434343233332这样的数字,虽然很小,还不超过2,这种情况下幂数完全满足要求,但是尾数已经不能表示出来了这么长的精度。 有意思的是,有时候有些不大的整数也有可能造成转换误差,比如:对一个单精度浮点数(4 Bytes)赋值“ 20014999”,由于这个数表示成浮点式二进制为(注意是按照浮点二进制转换,有别于整数二进制): 0 10010111 0011000101100111100 1100 从左到右三组数字分别是符号、幂指数、尾数。实际上,该尾数不是精确的,实际要是尾数位数足够的话,应该是 0011000101100111100 10111 注意看这个尾数,实际的尾数10111被舍入成1100。这样就造成了误差,此时这个浮点数变量实际存储的是“20015000”。 要是使用双精度的double(8 Byte)则可以精确表示,其二进制表示为: 0 10000010111 001100010110011110010111 0000000000000000000000000000 注意加亮的尾数的确保存了精度。 按照上一篇博客的理解,20014999这个数正好处在 “浮点数表示精度间隔的中间” 。单精度的float无法表示它。因为浮点数的精度不是平均分布的呢,和整数的均布不同,浮点数精度是“两头差,中间好”。 所谓“运算舍入”误差,这个十进制运算是一样的(代数运算对进制无偏向性)。1/3=0.3333333…… ,以及按照级数计算出得一些无理数如π=3.1415926549…… 。这种运算舍入误差在二进制中同样存在,因此带来精度问题。还有一些运算中的舍入误差跟特定的机器实现有关,比如可能出现在加减法中、乘法中(这在下一篇博文中会详细说明)。 总之浮点数至少最后一位是不精确的,甚至有些在一段运算过后可能产生较大的精度误差。 浮点运算很少是精确的,只要是超过精度能表示的范围就会产生误差。一般在科学计算中浮点数的精度能够满足,不行就用double或者更多Bytes的扩展浮点类型。但是有些使用要注意,比如比较判断时,开头c代码中,判断 c==0.5 就会得到 false,因此一般使用 abs(c-0.5)=0.0001 。还有一些情况是金融货币领域,对数字要求精确,比如一个人存了15000000元,你不能说他存了14999999。这时候有一些其他的解决办法。比如 C#中提供了Decimal类型,VB中提供了Currency 类型,这些都是用很大的资源开销来处理精度,并不适合做科学计算,但是适合需要很精确的场合。
3316 次阅读|2 个评论
扔棍子提高测量精度
Amsel 2011-6-30 17:26
  半年前 “ 新语丝读书论坛 ” 曾为一个测量问题大起争论。争论的起因是,按照一百年来温度计的精度, “ 全球变暖 ” 理论(全称是 “ 人类排放温室气体导致灾难性的全球变暖 ” )的数据基础 —— 每百年上升不到一度 —— 到底多大可能应该归于误差。争论的焦点随后转移到这个问题:用一把刻度精度有限的尺子,可否通过随机扔棍子的办法,无限提高对棍子长度的测量精度? http://xys.cnhub.net/bbs/read.php?forum=0id=775717 送交者 : james_hussein_bond 于 2011-01-04 18:38:31: 008 尺子的定义: _____1_____2_____3_____4_____5_____6_____7_____8 我上面画的是一个尺子 . 在每一个数字的地方有一个 sensor. 每个 sensor 的输入是盖住和不盖住两个状态 . 如果实测的长度盖住 3, 没盖住 4, 那我们说这个长度是 3.5+-0.5. 由于每个 sensor 本身的尺寸很小 , 如果被测的长度位于 4 和 5 中间 , 测一万遍都会得出同样的结果 , 4 盖住 , 5 不盖住 . 结果是 4.5+-0.5. 同一个数字 , 平均不平均都没区别 . 但是如果被测的长度正好在 4 上 , 由于 sensor 本身有大小 , 可能有时候输出盖住 , 有时候输出不盖住 , 测量会有两种结果 , 3.5+-0.5 和 4.5+-0.5. 由于有了随机性 , 测一万次可以平均一下 , 这样得出的结果可能是 3.8+-0.5, 无论如果 , 比不平均的结果要更接近真值 , 但是误差还是 +-0.5 湘女的东西:长度大约 0.1 。 问题:如何通过对多次测量的平均将此物长度确定到 任意精度? 首先,尺子是唯一测量工具,不允许做什么"对准一端"这种额外加的条件。你拿什么判断一端是否对准了?所以唯一正确的解法,是让物体随机地落在尺子上,看有几个 sensor 被盖住。 假设物体长 L1 , sensor 长 S1 , LS , sensor 完全盖住时 100% 给信号,部分盖住时 50% 给信号,只考虑物体左端落在 1 和 2 之间的情况,那么 sensor 发信号的几率是: 0.5*(S/2) + 1*(L-S/2) + 0.5*(S/2) = L 左边第一项是左端落在 sensor 1 上的贡献,第二项是 sensor 2 被完全盖住的几率,第三项是左端落在 sensor 2 上的贡献。 结论:只要看 sensor 发信号的几率,就得出物体长度 L 。 实验上,每次测量得到的结果是 0 或 1 ,几率分别是 1-L 和 L 。 N 次测量后 variance 是 NL(1-L) ,误差是 sqrt 。只要增加测量次数,精度就可以任意提高。   当时我对这种测量问题并没有亲身经验,因而插不上嘴。而最近几个月,我们完成了一个标准化的工作 —— 标定氢同位素的天然气标准样品的氢同位素比值,其间要不断参考美国标准和技术研究院( NIST )的定义和规范,对这类问题才有了切身体会。   按照 NIST 标准的描述,测量值与真实值的差别包括两部分 —— 偶然误差和偏差。偏差不但来自仪器的系统误差,也可能来自测量手段。比如,上面那个扔棍子的方法,尺子刻度本身会带来系统误差,而如果测量场所的风向在某一方向上有优势,那么也会带来偏差。   偶然误差可以通过统计方法来减少,那就是增加测量次数,而不确定性反比于测量次数的平方根。   与偶然误差相比,偏差的最大问题是,并不必然地遵从正态分布。对于上面那把尺子, “2 和 3 之间的距离 ” 与 “4 和 5 之间的距离 ” 并不绝对相等,而且也并不绝对等于一个真实的单位长度。也就是说,任何两个刻度之间的长度都存在偏差,而且这些偏差之间也并不一致。仅就这把尺子而言,我们不但不知道每个单元格的偏差多大,甚至也无法知道哪个单元格的偏差更小。现在从权的办法,只能假定真实的单元格长度处于最窄的和最宽的单元格之间,并且其概率分布是矩形分布,而不是正态分布。 —— 当然最重要的结论是,偏差是无法通过增加测量次数来消除的。   所以,就这个测量方法而言,增加扔棍子的次数,并不必然导致棍子长度测量结果的不确定性减少。它固然不取决于尺子精度,但是它最终取决于尺子单元格本身的不确定性。   再到起始的问题:全球地表平均温度 “ 每百年上升不到一度 ” 的观测结果到底多大可能应该归于误差?我们依然需要从偶然误差和偏差两方面来考虑。从偶然误差考虑,仪器精度并不是个问题,因为数据点和观测次数非常之多,总可以把方差降得足够低。温度表误差假设是 0.5 度, 100 次的观察就可以将不确定性降低到 0.05 度以下,所以仪器精度本身不是一个问题。   问题仍然在偏差部分。对偏差的校正,更多地不是依赖统计,而是依赖背景知识。而 IPCC 公布的地表温度值的定量变化,至少包括以下偏差: 1 )仪器更新( http://www.nature.com/nature/journal/v453/n7195/full/nature06982.html ); 2 )热岛效应( Anthony Watts 的项目就是考虑这个问题的影响); 3 )对每种环境的温度点该如何加权(这是 Pielke Sr. 的研究范围); 4 ) 权威温度数据库对温度资料的校正和取舍(气候门丑闻暴露出这样的问题)。   所以,尽管我们知道最近 100 年来地表温度上升速度有一个数值,但是这个数值的不确定性有多大,并没有一个可靠的数字( IPCC 报告的主要结论在统计上经常通不过,比如所谓 “ 全球变暖 ‘90% 可能 ’ 由人类活动造成 ” 就是一个例子)。 参考资料: http://physics.nist.gov/cuu/Uncertainty/
个人分类: 科研笔记|3751 次阅读|0 个评论
科研上处理“数据误差”的原则和技巧
热度 5 jiangjiping 2011-6-22 17:35
科研上处理“数据误差”的原则和技巧 蒋继平 2011 年 6 月 22 日 从事科学研究的人, 都会有切身体会, 那就是在实验过程中, 总会出现数据上的误差。一般的实验设计都需要至少三组重复, 每个重复之间虽然条件一样,可是, 得到的数据可能会不一样。 这就需要试验统计, 计算误差的分布区间, 进而评估不同的实验样本之间是否存在显著性的差异。 在社会学中, 对人群进行抽样调查, 是常用的一种获得民意的科学方法。 可是, 抽样调查的结果可能会因为被调查的人群的片面性, 因而,不能真实地反映社会现实。 这就有一个“样本误差”的问题。现代应用的一个不成文的规则,就是声明这个数据有 3% 的误差。 这样简单的说明, 不具有严密的科学数据, 在社会学上可以说得过去, 在真正的科研领域是站不住脚的。 因而,在科研领域, 我们在获得实验数据后, 总是对数据进行统计分析, 根据分析的结果, 确定试验是否有效, 这是最普遍和最常用的方法。 可是, 在科研实践和实际操作中, 这个程序也是可以根据具体的情况来对待的。 大家知道, 一般的实验误差可能来自于三个方面, 即人为,环境条件和实验样本。 通常情况下,在实验样本和环境条件完全一致的情况下下, 还有可能出现数据误差。 因而, 很明显, 实验误差的一个主要致因是人工误差。 人工误差是很正常的事。道理很简单, 要是让一个人在一张纸上同时画两条线,一上一下,要求画的一模一样, 不管他如何认真, 其结果这两条线总会有差异的。 所以,科研上出现误差是很正常的事,关键是我们如何正确地处理这些误差。本文仅以我个人的经历来简单地说明这个问题。 首先我要声明一下, 我是搞生物学的, 主要的工作是植物抗病筛选, 因而,我的经历也许只适合在这个专业方面的科技人员。 · 处理“数据误差”的原则。 这个原则很简单, 就是应用现有的知识和学问, 对获得数据进行分析,要是获得的具体数据与现有的已经被反复证明是正确的知识有矛盾, 一定按照现有的知识进行处理。 举个实例:蕃茄抗镰刀菌枯萎病( Fusarium Wilt of Tomato )是一个单显性基因, 因而,在感病和抗病杂交的第一代,其全部植株都是抗病的,其第二代,理论上有 25% 是全抗的( RR ) , 50% 是半抗的( Rr ), 还有 25% 是感病的( rr ); 实际上, 75% 是抗病的,因为是显性的原因。 要是某一品种在人工接种后出现 65% 的感病植株,只有 35% 的“抗病”植株,那么,这个品种一定是感病的。 这个 35% 的数据是人为误差造成的。 因而,在最后作结论时,我们必须把这个品种当成感病品种来处理。否则的话, 要是我们把这 35% 的植株当成抗病的植株的话, 把他们保留下来,移栽后收获的种子在来年播种后长出来的的植株肯定是感病的。这样做的后果就是狼费大量的时间和精力 ,是非常不明智的和不科学的做法。 在科研的实际操作中,我们把这种误差 当成是“人工实验误差( Experiment error caused by man’s operation )”。 这 35% 的“抗病”植株并不是因为它们真正的抗病, 而是由于人工接种造成的失误。 所以, 我们必须毫不留情地丢弃它们。 · 处理“数据误差”的技巧。 在遵顺大原则的情况下, 在实际操作中, 还必须掌握一些“技巧”。这些技巧实际上是科研人员运用已有的知识结合自己在科研实践中积累的经验而产生的学问。 面对试验中出现的“误差”, 能够根据不同的情况来进行不同的处理。还是拿蕃茄抗镰刀菌枯萎病( Fusarium Wilt of Tomato )来作为一个具体的例子。我们要对一批蕃茄杂交二代进行抗性筛选,在供测试的 100 个样品中,都是从杂交第一代中单株选出来的品系。我们将每个样本接种 30 株。 测试的目的有两种:一种是“只要数据( Index only ) , 另一种是“保留存活者( Save survivors )。 在对抗性进行评估时, 我通常会根据测试的目的要求进行不同的处理。 对于只要数据的测试, 在样本的评估上就比较宽松。 具体地说, 当一个样本的 30 株苗全部抗病, 就是“抗( R ) , 有 14-29 株抗的, 就是属于分化的一类( D ) , 低于 14 株的, 属于感病 (S) 。 但是, 对于“保留存活者”的测试要求, 我就比较严格, 标准就提高了。 30 株全抗的仍然是抗( R ) , 23-29 株抗病的属于分化类,少于 23 株抗病的, 属于感病类。 在这样的标准下,每个样本即使有 22 株“抗病”的, 仍然被认为是感病的, 这 22 株“存活者”仍然被无情地抛弃。 为什么要如此做呢? 这是因为从测试中保留的存活者是被用作下一个季节的种源的。 要是“存活者”没有真正的抗性,而是溜网的鱼,那么, 下一代必定是感病的, 那样的话, 我们的所有努力就毫无结果。 因而, 为了保证保留的存活者具有较高的可靠性,我就采用“宁可错杀一千, 绝不放生一个”的策略。 这是根据实验目的采取策略的技巧。 还有一个技巧是根据参照系的表现来处理实验误差。 在任何有效的实验中, 必须有参照系。 参照系的可信度可作为选择的标准。 如果参照系的可信度很高, 那么, 评估标准就可以宽松一些;要是参照系的可信度较低,那么, 评估标准旧的相应地提高。 简言之, 科研上对待实验误差一要掌握原则, 二要应用技巧。 要不然的话, 一味按照书本上学来的知识, 生搬硬套,不但脱离实际, 而且效率低下。这种科技工作者会给人一种“书呆子”的感觉。 (注: 未获授权,不得转载和分享。)
个人分类: 经验交流|7798 次阅读|7 个评论
气象学家的谎言:从实际出发到从模型出发
热度 8 杨学祥 2011-1-27 08:25
气象学家的谎言:从实际出发到从模型出发
气象学家的谎言:从实际出发到从模型出发 杨学祥 目前研究者对气候变化进行归因研究主要依赖的工具就是模式。这些气候模式实际上是气候系统的数学表达。气候系统非常复杂,考虑的因素众多,不仅仅地球上不 同的地域有着完全不同的气候表现,不同的气候现象之间也有相互影响,所以要比较准确地研究气候问题,很难使用简单直观的方式来演示,因此选用了模式的方 法。由于是数学表达,这些模式就可以通过计算机进行计算、优化,对过去和现在的气候现象进行分析,并根据模式对未来的气候变化趋势作出预测 。 模式变成科学家之间的通用语言,与此同时,模式的误差也成了掩盖事实的虚假谎言。气象学家用模式磨光了理论和实践的差别,在虚构的模式数据上得出违背事实的结论。 图1 对20世纪全球平均气温的模拟与实测值的比较 黑线为实测值,粗红线为多个模型平均结果,细黄线为各个单独模式的模拟结果 图1是一个被认为效果很好的模拟,多个模型的平均结果与实测之很接近,在模拟技术上可谓极大的成功。但是,一个致命的缺点是,1998年的最大值点被磨光了,1998年前后的气温陡升和陡降,变成平滑的上升,给出全球持续变暖的假象。 图2 进一步扩大了这一假象,把平滑上升的曲线磨得更为光滑,一条完美的持续上升曲线欺骗了更多的科学信徒 。 事实上,三大观测机构的实测数据都表明1998年、2005年和2010年是三个明显的极大值,它们近似在一个水平上,形成一个全球编年的停滞时期。 观测是客观的,模式是人为选取的,气候问题的政治化使磨光函数增加了政治色彩,把掩盖事实变成一项高尚的艺术。 狗似猴,猴似人,狗与人相差甚远。相似推断的结果是,差之毫厘,谬以千里。我们万万不要为气象学家的谎言所蒙蔽。 世界气象组织2011年1月20日表示,2010年与2005年和1998年共同成为全球有记录以来最热的年份。世界气象组织在当天发表的一份公报中指出,2010年全球平均气温比1961年到1990年间的平均气温高出了0.53°C,比2005年和1998年分别高出了0.01°C和0.02°C,由于这三年间的差异过小,因此专家将2010年、2005年和1998年共同列为全球有记录以来最热的年份,同时2001年到2010年也成为有记录以来最热的十年。气象组织秘书长雅罗表示,这些数据证实了全球气候显著变暖的趋势(不如说是停滞不前的趋势) 。 美国国家气候数据中心12日发布2010年气候相关指数,数据显示,2010年地球表面气温比二十世纪平均值高0.62摄氏度,与2005年并列自1880年有地球表面气温统计以来最热年份(并没有持续上升) 。 全球气温的观测是有误差的,同一机构的观测精度只有0.01摄氏度,不同机构的观测误差高达0.04摄氏度。2010年以前,国际气象组织以2008年为史上最热年,美国气象机构以2005年为史上最热年。今年国际气象组织观测标准的改变应该有合理的说明。 我在2010年12月指出,2010年处于潮汐1800年周期中的暖时段,200年周期的冷时段,60年周期的冷时段;1998年处于潮汐1800年周期中的暖时段,200年周期的冷时段,60年周期的暖时段。2010年重复1998年状态(陡峭的直线上升)的可能性不大,但千年极寒不会发生 。 2010年的气温并没有创造新纪录,停滞性波动变化显示转折期的特征 。 国际气象组织关于全球气温测量的数据选择是混乱的,2010年12月3日的最暖年排序是1998年和2005年,2011年1月20日的最暖年排序就改为2005年和1998年,根据是什么? 根据数学常识,由于温室气体的持续增减,温室效应的显著表现应该是全球气温的持续升高,忽略季节性变化,年平均温度相应逐年升高。事实远非如此,20世纪80年代的全球迅速变暖是陡峭直线上升的,在1998年达到最大值。此后,1999年迅速下降,直到2005年才恢复,而后又持续下降,直到2010年才恢复。停滞不前是客观事实。 以表1的数据为例,1—10月全球气温的排序,1998年高出平均值为0.52℃,1999年为0.26℃,2000年为0.24℃,隔年差最大值为0.26℃。1998年最高温度发生,1999年和2000年气温骤降,气温的暴起暴落值得关注。 全球气温没有逐年上升的事实迫使气象学家改用十年均值来证明全球持续变暖,事实上,十年均值的变暖速度要比年均值变暖的速度慢得多,即使1998年的全球温度保持不变地持续到2010年,近十年的平均温度仍然是最高值。实际气温的变化曲线低于1998年或2005年的最高值,所以,年平均温度停滞不前是事实,近十年平均温度最高是假象。1998年以后,气象学家一直在用假象来欺骗世界公众。 参考文献 1.IPCC说了什么?(十四)气候变化归因Comments 橡树村 发表于 2010-12-30 07:54 http://songshuhui.net/archives/47063 2.2010 updates to model-data comparisons。gavin @ 21 January 2011 http://www.realclimate.org/index.php/archives/2011/01/2010-updates-to-model-data-comparisons/ 3.付旭。世界气象组织称2010年为有记录以来最热一年。2011年01月20日23:39 国际在线。 http://news.sina.com.cn/w/2011-01-20/233921849115.shtml 4.去年“最热”。凤凰网科技。2011年01月14日 03:30 武汉晨报。 http://tech.ifeng.com/discovery/detail_2011_01/14/4272830_0.shtml 5.在严寒中讨论全球变暖:理论和实践的双重倒退。凤凰网资讯。2010年12月09日 10:04光明网。 http://news.ifeng.com/opinion/gundong/detail_2010_12/09/3420485_5.shtml 6.杨学祥。在严寒中讨论全球变暖:理论和实践的双重倒退。 2010-12-8 07:14 科学网。 http://bbs.sciencenet.cn/home.php?mod=spaceuid=2277do=blogid=391413 7.杨学祥。2010年与2005年和1998年共同成为最热年。 2011-1-21 07:03 科学网博客。 http://bbs.sciencenet.cn/home.php?mod=spaceuid=2277do=blogid=406421 1900-2000对20世纪全球平均气温的模拟与实测值的比较 1980-2010年全球温度变化
个人分类: 科技点评|3328 次阅读|26 个评论
说人家的“坏话”,只能关起门来说
liwei999 2011-1-6 00:07
立委按: 镜兄这片文字有些不地道,一方面关起门来说别人坏话,另一方面可劲儿地表扬自己: 理工科的人对数理上不同的概念比较擅长区别,而文科的人对感觉、感情上的微小差异有分辨能力。两个都兼有的,就是镜某这样的了 。吹牛的毛病凡是男人大多都有些,可是一边吹牛一边说别人的不是,就不地道了,应该深入批判。但是,新年了,实行革命人道主义,还是停止炮击了吧。 在多说几句表扬/批评-他人/自我的组合。表扬和自我表扬没有问题,不但没有问题,为和谐社会计,还是值得大力提倡的事情:俗话说:千穿万穿,马屁不穿。批评和自我批评,是马列主义毛委员思想的精髓,也是不错的。表扬他人和自我批评,那是圣人,一般人做不到。最糟糕的组合是批评他人和表扬自己,所谓马列主义对人,自由主义对己。镜子这次就栽在这里。最近 中国学术评价网 闹的沸沸扬扬的对小方抄袭剽窃的批判也主要是基于小方的两种标准:打别人的假与自己的行为的不一致(小方的那些编译式科普本身问题不大)。无情打击他人和无限吹捧自己的组合引起反弹是自然的、必然的。 说人家的坏话,只能关起门来说。 作者: mirror 日期: 01/04/2011 08:49:33 老八也是老朋友了,他最近出了一个有趣的题目,问难道只要测量很多次, 误差就可以变得很小? 有没有人明白这个公式的意思? 并且进一步挑战说:拿一个最小刻度1mm 的尺子能不能准确到1个微米?这是一个问题。 紧接着老八把问题更具体化了: Quote 我想受过教育的人, 以及大部分没怎么受过教育的人都知道, 不管怎么折腾, 用一个1mm刻度的尺子量出的结果最多写成18.3mm, 如果写成18.324578mm, 并郑重地向全世界宣告这个物体长度比以前增加了0.000078mm的人, 是头脑有病的人 对这个题目的根源没有跟踪,但是通过观察人们的讨论,发现没有什么人有什么有分量的说法。甚至老八自己也有些混淆了问题的所在。 首先正面回答老八的那个公式。有个N个样本的集团(这个N不是那么要紧),这个集团有确定的平均值x-和分布偏差。需要强调的是这个平均值x-是没有分布的,有分布的是每一个样本值的x(i)。如果想知道这个样本集团的平均值x-怎么办?最好的办法就是挨着个测一遍,按定义走一趟。如果不按定义走,随意测几个样本值来代替平均值x-的时候,不确定性就出现了。需要强调的是时下最标准的用法是说不确定性,而不是误差。原本没有分布的平均值x-,因为人们偷尖耍滑了,就要产生不确定性了。这个不确定性的大小,取决于原来样本空间的分布偏差和抽样数目n的大小,具体的就是老八的那个公式了。 拿一个最小刻度1mm 的尺子能不能准确到1个微米是个比较唬人的问题。直觉上是不能。但是凡事儿都有特殊情况。特殊情况下,拿一个最小刻度1mm 的尺子可以测到1个微米的厚度。比如说一张纸的厚度,一般是微米级的。拿最小刻度1mm 的尺子是无法测量。但是不妨可以测量1000页为40mm的厚度,比如一本字典。这样一来,一张纸的40微米的厚度就可以测出来了。需要强调的是这时候有效数字是不会无缘无故地增加。也就是说,40.0mm不会变成40.00mm。 说到这里,老八混淆了什么事情就应该很清楚了。应该说老八也算是比较聪明的人了,但是依然会发生概念上地混淆。这是由于人脑结构的弱点,没有办法。 理工科的人对数理上不同的概念比较擅长区别,而文科的人对感觉、感情上的微小差异有分辨能力。两个都兼有的,就是镜某这样的了。新年伊始,自我表扬一哈。 因为免不了以后有田牛的板斧。 ---------- 就是论事儿,就事儿论是,就事儿论事儿。
个人分类: 镜子大全|2772 次阅读|0 个评论
分子模拟中的“算不准原理”
chemicalbond 2010-5-20 08:48
前一阵提及比尔盖子投资薛定谔的新闻,1千万美元投入分子模拟软件。【1】第一个效应便是增加了很多就业机会。找工作的人不要错过,那些岗位都应该是年薪在六位数左右的。【2】 那位因此事给自然杂志写专栏文章的人,最近又有新的文章,说的也是分子模拟在药物设计中的作用。【3】看看那里的读者啥样的观点都有,一点都不奇怪。象很多其它领域一样,如果没有真正做过相关的工作就发表高论就像是瞎子摸象,了解的通常是很片面的信息。正好今天有位找工作的朋友问及相关问题,我就把一些个人体会写在博客上。 这里讲的分子模拟主要是针对蛋白质和有机小分子之间的非(化学)键相互作用。这一领域在八十年代末期有了较大的突破,这主要是由于分子图像软件的发展和分子对接技术(docking,即在蛋白质的活性中心寻找小分子与之结合的低能结构)的发展。当时的代表人物是TACK KUNTZ,和PETER KOLLMAN。两位都是做理论化学出身后来转化分子模拟的。KUNTZ的贡献主要是发展第一个对接技术,KOLLMAN是做AMBER分子力场和自由能模拟著名的。【4】到了90年代,很多公司应用分子模拟技术设计癌症病类药物【主要是HIV蛋白酶抑制剂】,获得了巨大的成功。【5】 不过,大概象任何新技术亮相一样,很容易在短暂辉煌之后便带来泡沫。随着无数制药公司的跟进,人们很快就发现分子模拟给出的计算结果往往跟实验结果偏离很大,更不用说用来设计药物。实际情况是,分子模拟的问题很多,尤其是计算中间有大量的近似。即使到了今天,使用最先进的方法和软件,其中的误差也还是很大的。这就是本文要提及的“算不准原理”。 药物设计中最主要的计算量便是一个小分子针对某个生物靶子(比如HIV蛋白酶)的活性,在物理化学中可以成为热力学平衡常数。这个过程可以简化为P+L=PL,P就是PROTEIN,L是LIGAND,PL就是两者之间通过非键作用形成的复合物。实验上测量试管中发生的过程非常简单,基本原理和中学化学教的中和滴定是一样的,只不过指示剂不同而已。根据不同的小分子浓度下的效果得到一条滴定曲线,数学上做个导数就得到拐点,即平衡浓度(一般可以用它来表示生物活性),浓度越小,即活性越高。比如说爱滋病蛋白酶抑制剂,如果小分子活性很高,吃很小剂量的药物就可能抑制住蛋白酶的活性,从而起到治病的功能。通常,最后做成药物的小分子的生物活性一般是纳摩尔量级(10^-9M)。根据热力学第二定律,那个过程的自由能变化基本额上就是-RTlnK,R是气体常数,T是绝对温度,K可以近似为小分子的平衡浓度。活性差别是10倍的话,能量上也就是大约1.34kcal/mol。 对于生物活性,要通过电脑进行理论预测,那可不是一般的难。这么多年来,全世界有无数人都希望找到那个可能存在的能够计算机预测生物活性的holy grail,但是都失望了。这里头的原因很多,最主要的大概是2个方面。一是因为我们面对的是个很复杂体系,其自由度是个很非常巨大的是数字(通常,一个分子内部的运动自由度就有(3N-6), N是原子数,在3维空间,需要减去3个平动和3个转动自由度,而对于蛋白那来说,N通常是个3位数),从而导致计算过程取样不够完全而引入我误差,另一方面,前面提及的变量是个相对数值很小的变量,即计算的额信噪比很难提高。 这个误差和量子化学对热力学物理量的计算误差很大也是相关的。近年来,你量子化学方法和计算技术都会获得了很大的进展,不过,目前的最高水平也就是针对气相的小分子体系热力学量的计算更可能达到误差为1个kcal/mol. 这个数值也曾经被称为 chemical accuracy。 当然,科技总是不断前进的.总有一天,人们会对这些问题理解得更加深入,相关的计算误差也会减小。然而,一个更好的策略是提高相对值的计算准确度,因为那样会排除很多个大误差的计算。而,实际上,也往往是相对数值更加重要。 参考: 【1】 http://www.sciencenet.cn/m/user_content.aspx?id=322494 【2】 http://tbe.taleo.net/NA2/ats/careers/searchResults.jsp;jsessionid=FCB1B3BE6F7959FEC2834C2E20A91764.NA2_primary_jvm?org=SCHRODINGERcws=1 【3】 http://pipeline.corante.com/archives/2010/05/17/modeling_in_drug_discovery_questions.php 【4】2001年我曾经联系KOLLMAN做博士后,他很爽快的就答应了。非常遗憾的是,几个月后收到他的另一封电子邮件,告诉我他已经得了癌症,而且是病情很严重,建议我申请其它地方。没过多久,他就去世了。2002年在UCSF有个专门为他组织的分子模拟会议,我也有幸参加了。 【5】据说90年代末期分子模拟类的工作机会非常多,工作很容易找。那时的我因为在化学所身陷基础物理化学的深渊,对这一领域的信息量竟然一无所知,否则,很可能来美国选择学校和导师会是完全不同的结果。
个人分类: 科普与新知|2591 次阅读|0 个评论
我们无法看清世界,误差理论死亡中的哲学问题
chrujun 2010-5-4 07:23
物理实验中一般会学到测量误差有关的知识,不知现在还有没有?不过,测量误差已经宣告死亡,取而代之的是测量不确定度。 误差的定义是测量值与真实值之间的差。实际上我们根本就不知道真实值。无论是测量温度、长度、压力、重量,还是时间与电流,我们永远无法这些物理量的真实值。因此,测量误差根本无解计算。 这就是测量不确定度横空出世的原因。测量不确定度是指对测量量的离散情况的合理估计。在这个定义里,引起哲学悖论的真实值消失了,只有估计、合理、离散等模棱两可的词汇,测不准原理得到了完美体现。就拿物体长度来说,且不说温度变化会导致物体长度发生变化,即使我们控制温度不变化,但组成物体的原子在不停远动,原子中的电子更是如此,因此,我们无法得到物体长度的真实值。 无论如何,我们只能对这个世界看得更清楚一些,我们无法看清任何事物。这就是测量世界给出的答案,和人不可能踏进同一条河有异曲同工之妙。
个人分类: 地球物理及仪器|3744 次阅读|2 个评论
天线特性参量中天线误差的简单小结
williammilo 2010-2-25 07:58
我的博客已经搬家到 xiongbox.com 欢迎访问熊伟博士的网站! 本文永久链接 http://xiongbox.com/天线特性参量中天线误差/ 1.天线误差是使 天线性能变差的各种天线变形 。 天线的方向图、增益等参数是由天线上的电流分布的振幅与相位决定的 。 2.一般由设计人员根据使用要求,求得天线上 所需要的电流分布(包括振幅和相位在空间的分布),以及选择实现这种分布的方法 。例如,若要求高增益,则同样口面尺寸就应选择同相等幅的电流分布,对于阵列天线可以选用间距为半波长、单元为半波振子的同相等幅馈电的同相水平阵列来实现等幅同相的电流分布。但制造和安装都不可能丝毫无误,因而必须规定公差,也就是成品与要求的差别在公差范围以内就认为合格。环境影响也会引入误差,这种误差会引起天线口面上的相位畸变,使天线的性能变坏。 各指标参量(增益、方向图、极化等)变坏的程度与天线各种误差的性质和大小有关 。一般说来,误差越大性能越差。但规定的公差越严,造价就越高,因而在规定各种公差时,同时考虑由于引入误差对性能的影响和所规定的公差对造价的影响。用常规方法常常无法解决这种矛盾,因而必须采用新的加工工艺或设计出其他能满足要求性能的新型天线。 3.天线的误差有两大类。 一为系统误差,一为随机误差 。系统误差一般表现为口面上的一次相差、二次相差和高次相差和它们的组合。而随机误差则是随机分布的许多小范围的相位畸变。在一个天线上这两种误差一般都同时存在。 天线越大、波长越短,则误差的影响也就越大。系统误差是属于系统本身的具有一定规律的误差,其效应可以计算出来,有些还可以通过测量发现 。
个人分类: 电子信息工程与计算机科学|2779 次阅读|0 个评论
1.34 kcal/mol
华明 2010-2-7 08:14
个人分类: 学术与争鸣|3 次阅读|0 个评论
平均比率与比率的平均:小心计算财务比率
einziger 2009-10-15 23:45
平均比率与比率的平均:小心计算财务比率 假设A公司的资产负债率是40%,B公司的资产负债率是60%,那么A公司和B公司的平均资产负债率就是(40%+60%)/2=50%?未必。 假设A公司的总资产为500万元,B公司的总资产为100万元,则A公司的负债为200万元,B公司的负债为60万元,因此A公司和B公司的总负债为260万元,而A公司和B公司的总资产合计为600万元,所以两公司的平均资产负债率应当是260/600=43%! 因此,直接计算一个行业内所有公司的某项财务比率的算术平均值,并不能客观地反映该行业该财务比率的平均状况。正确的计算方式是分别对分子和分母求和,最后计算比率。 那么,错误的计算方法得到的结果是偏高呢还是偏低呢?都有可能。如果高负债率公司的资产规模较大,则结果偏高;反之,如果低负债率公司的资产规模较大,则结果偏低。 我们不妨考虑只有两家公司的情形。设甲公司的某项财务比率为a/b,乙公司的该项财务比率为c/d,则两公司的平均该项比率为(a+c)/(b+d)。 但是,经常有人这样(错误地)计算两公司该财务比率的平均值:(a/b+c/d)/2。当b d时,可以如此推论: 反之,当b d时,可将上面的推论中的大于等于号改为小于等于号。 由文章一开始讨论的例子可以看到,若构成比率分母的数量相差较大,则错误平均方法计算出的平均某某比率完全不能正确反映该比率的真实平均水平。
个人分类: 公司财务|9094 次阅读|0 个评论
贝勃定律的科学释义-两种文化的一个案例
lvnaiji 2009-9-2 16:13
吕乃基 还是 从左正伟 老师的博文生活中的贝勃定律!第一次知道什么是贝勃定律。后来在百度百科查到较为完整的说明。博主无意继续在人文领域为此添砖加瓦,而是意在揭示贝勃定律的科学依据误差理论。为使读者理解本文的主旨,先引述该条目的全文。 有人做过一个 实验 : 一个人右手举着 300 克 的 砝码 , 这时在其左手上放 305 克 的砝码 , 他并不会觉得有多少差别 , 直到左手砝码的重量加至 306 克 时才会觉得有些重 . 如果右手举着 600 克 , 这时左手上的重量要达到 612 克 才能感觉到重了 . 也就是说 , 原来的砝码越重 , 后来就必须加更大的量才能感觉到差别 .   这种现象被称为 : 贝勃定律   贝勃定律在生活中到处可见 . 比如 5 毛钱一分的 晚报 突然涨了 5 块钱 , 那么你会觉得不可思议 , 无法接受 . 但是 , 如果原本 500 万的房产也涨了 5 块 , 甚至 500 块 , 你都会觉得价钱根本没有变化 .   有头脑的人会利用贝勃定律为自己减轻做事的 阻力 . 小到商家的产品价格调整他们会小幅度上涨 , 在人们都接受以后再加价更多 ; 大至谈判的技巧 , 一般有经验的谈判专家都是在谈判临近结束时才提出一些 棘手 的条件 , 而对方被一开始的优厚条件所 诱惑 , 也就不怎么在意后来才知道的那些缺点了 .   有些人总抱怨恋人对自己不如刚认识时那么好了 , 其实这也是贝勃定律在作怪 . 在还不熟悉的情况下 , 对方给你的一点点关怀你都会觉得情深似海 , 而当你们相恋许多之后 , 与原来相同的那些关爱你也会觉得平淡如水了。审美疲劳   一个女孩和母亲吵架赌气离家。在外逛了一天,直到肚子很饿了,她才来到一个面摊,却发现忘记带钱了。好心的面摊老板免费煮了一碗面给她。女孩感激地说: 我们又不认识,你就对我这么好!可是我妈妈,竟然对我那么绝情 面摊老板说: 我才煮一碗面给你吃,你就这么感激我,你妈帮你煮了十几年饭,你不是更应感激吗? 女孩一听,整个人愣住了!是呀,妈妈辛苦地养育我,我非但没有感激,反而为了小小的事,就和她大吵一架。女孩鼓起勇气,往家的方向走,快到家门时,她看到疲惫、焦急的母亲正在四处张望。妈妈看到女孩时,忙喊: 饭都已经做好,快回去吃,菜都凉了! 此时女孩的眼泪夺眶而出   我们对亲人朋友的关爱习以为常;而陌生人的一点帮助,却我们就感激不已。这便是 贝勃定律 在操作我们的感觉。对于亲人朋友,我们对他们的关爱习以为常,而且期望值很高。有时他们少了一丝关爱,我们甚至会恶言相向。对于陌生人,我们没有抱着多大的期望,因此,他们的一点点帮助,我们都感动不已。   一个新人刚开始工作,在单位拼命表现,兢兢业业,然后慢慢熟悉环境后就松懈下来,周围人会觉得这个人矫情,前面的表现都是假的,对这个人的人品也提出质疑;另外一个新人,开始就显得一无是处,懒散不守纪律,慢慢熟悉之后,懂得了单位的规矩。仅仅能做到按时上班,但大家立刻都会夸奖他进步,表现越来越好,觉得这个人要求上进,比前者好很多。其实,前者已经做的工作总量不知道比后者多了多少。   俗话说,好人难做。你辛辛苦苦地耕耘,却因为做错一件事而把前面的功劳全部葬送;而坏人却可以因为做件普通的好事而受到称赞。从而,大家对事物的感觉也都产生错觉,似乎后者的 真小人 比前者 伪君子 更值得信任。其实这些都是贝勃定律在操控你的感觉而已。   所以 , 变了的不是事实 , 而只是你的感受变了 .   我们的感觉很敏感,但也有惰性;它会蒙骗我们的眼睛,也会加重我们的感受而迷失理性.所以,不能太自以为是,我们应带着谦卑的心对待万物众生,才可以少犯错误,积累智慧 . 贝勃定律告诉我们,给予方要多做雪中送炭的事,少做锦上添花的事,尽量不做画蛇添足的事;而受予方要懂得珍惜自己的点滴所得,善待身边的人。 今年是斯诺提出两种文化 50 周年。相对于该领域的大量研究而言, 科学网上的两种文化 ( http://www.sciencenet.cn/m/user_content.aspx?id=249695 ) 有一个显著的特点,那就是作者普遍具有深厚的科学技术底蕴,并以此作为进入人文文化的基础和途经。博主虽然已经长期没有直接从事理工科领域的教学和科研,但系理工科出身,感到在上述关于贝勃定律的解释中,似乎隐含着科学依据,那就是误差理论。其实,条目的第一段已经在某种程度上显示,看来作为人文文化的贝勃定律与科学中的误差理论二者间的某种联系。 先把感受着外界事物的人看作科学测量中的仪表。人,也在测量着周围的一切,从手上的砝码、晚报的涨价,到母亲的爱。在上文砝码的实验中,就是把人看作是仪表。这里就涉及到仪表的测量范围。原来的砝码越重 , 后来就必须加更大的量才能感觉到差别。怎样的仪表能测量 1 克 的差别?实验室中称量范围在 1000 或 500 克 以下的天平可以。高速公路上查超重车辆的磅秤能测出来吗?仪表测量范围与误差的关系本来就是科学常识。在收了重礼之后,对小礼品就没有感觉。犯罪也是如此。所谓杀一人是死,杀一百人也是死,后者实际上超出仪表的范围。因而,以砝码实验推及人类社会中的情感,只能说明在人类社会中的测量,与科学中的测量有着共同的误差问题。 重要的是揭示人与仪表的区别。由百度百科的条目可以得出三点,其一,测量范围随时间的变化。仪表不知疲劳,只要没有损坏,就始终如一,图林对人脑与电脑的区别也说明这一点。但人会疲劳,如电影《手机》中的所谓审美疲劳。上文中的女孩沐浴于母亲的爱抚之中,对爱的感受下降。疲劳和对母爱的迟钝,可以理解为在同一刺激下,仪表的测量值不断增加。至于好人难做,毛泽东早就清楚这一点:难的是一辈子做好事。于是,在误差的相对值维持不变的情况下,为了继续有所感受,只能是绝对值增加。母亲只能以更大的爱方能对女儿有所刺激。久别胜新婚,就是暂时切断时间的延续,让测量范围降下来。对于爱是如此,对于恨亦然。所谓斯德哥尔摩综合症,就是人若长期处于被劫持的状态下,恨的测量范围逐步增加。归零( 归零:以汶川的名义 汶川地震半年祭 ),地震将人与自然的关系,人际关系回归到启蒙运动所论述的自然状态,让人们体验原初状态下的感受,就是相对于将仪表归零。 类似地,人的感觉也有遗忘功能。由裸体刚穿上衣服时,皮肤的感觉敏锐真切,然后渐渐淡忘,没感觉。试想,如果皮肤始终对衣服保持敏感,大脑不断接受同一信息,一来加重其工作强度,二来难以接受新的信息。在此意义上,遗忘,或者说,人作为仪表,在同一刺激下测量范围的增加,是人的本能,是人在复杂环境中生存的自我保护。 其二,人与仪表的另一个区别在于所测量的来源。仪表只管测量,不问所测物理量的来源,例如是来自砝码还是西瓜;人,则对来自同一刺激源的刺激逐渐迟钝,对新的刺激源即使是同一类刺激,譬如一碗面条保持敏感。在上文中,女孩对母亲的爱迟钝,而对陌生人灵敏。举办假面舞会、还有施特劳斯的轻歌剧《蝙蝠》等都说明这一点。设想,在斯德哥尔摩综合症中,中途若换另一个劫持者,被劫持者的憎恨与恐惧必然会上升到被劫持之初,也就是仪表恢复其灵敏度。在此意义上,人的本能是喜新厌旧,喜新在这里的含义是敏感。美国、日本和台湾近来政党的更迭尽管有种种原因,但喜新厌旧恐怕是其中之一。在某种意义上可以说,喜新厌旧是社会发展的一个动力。科学技术和文学艺术在相当程度上正是因此而得到发展。 其三,以上分析的可以说是误差理论中的原理误差和装置误差。环境误差同样体现在人类社会中。所谓幸福感就与环境密切相关。以司空见惯的排队为例。排了一小时轮到我时,回头一看,这么多人,甚至比我刚来时还要多,顿感安适自在。然而若后面寥寥无几,甚至只有我一个,那个郁闷!误差,与边界条件有关,与初始条件有关。在古希腊的文献中有这样一段描述:清晨小溪里的水是温和的,中午在市场热闹起来时,溪水就凉了,黄昏集市收摊时,溪水又变得温和起来。由此看来,人所测量的是反差,并没有一个标准。条目中说到两个新人在单位中的表现给同事留下的印象,或者说仪表的测得值,就是反差。 此外,在测量中还有使用误差,在人类社会中也有其类似的事例。 以上将人与仪表类比,旨在对贝勃定律有较为全面的理解。人毕竟不是仪表。人之为人,就在于在遵循自然规律的同时超越之。不过,为了超越,首先要了解自然规律,了解这些规律在多大程度,以及以何种方式在人与社会中起作用,只有这样,超越方有可能。 误差理论本身涉及领域广泛,内涵深刻,对此博主所知尚不如九牛一毛,理解有误差之处,真诚恳请各位网友指正。
个人分类: 科技|14276 次阅读|7 个评论
误差的计算方法(转载)
fengaas 2009-8-16 17:58
转载自:http://hi.baidu.com/thinkover/blog/item/b4b744a9b22600fc1e17a297.html
个人分类: 电脑应用|7014 次阅读|0 个评论
实验方法的精确性问题
cutefay 2009-3-29 23:39
前一段时间在实验室里做蛋白质含量检测实验凯氏定氮,用的是传统的凯氏定氮仪,最后我和实验室另一同学发现:传统凯氏定氮的误差还是很大的,实验的精确性挺差的。 传统的凯氏定氮是蛋白质经过浓硫酸消化之后,用定氮仪把释放出来的氨气收集到硼酸里,再通过标准盐酸滴定,来计算含氮量。这个过程中,误差最大的是来源于标准盐酸滴定的过程,因为滴定终点的判断是根据指示剂变色来判断的,要滴回到粉红色。而就这个粉红色每个人肉眼感受是不一样的。我和实验室同学那天都在做凯氏定氮,后来我们发现我们对粉红色的定义大不相同,结果,对一蛋白质含量约10-20%的样品,我们俩测定的误差可以达到20%,20%的误差是相当大的。 后来,我们俩一起做了一个小的验证实验,来验证到底谁对粉红色的定义更准确,于是我们就用pH试纸来测那粉红色的液体的pH,结果发现:即使用pH范围很窄的试纸,也无法准确知道这溶液的准确一点儿的pH,例如,我们觉得两种溶液的pH试纸显示的颜色差不多,而实际上这两种溶液的pH能够相差0.5-1.0之间,这个误差也太大了点。后来,我们就用pH计来精确测定pH,pH计可以得到很精确的pH。通过pH计我们发现,原来我们俩的滴定终点判断都不算准确,真正的滴定终点差不多刚好是我们俩中间的那个时候。也就是说,我们俩计算的误差刚好是约等于正负10%。 于是,我们得出结论:做传统凯氏定氮实验的滴定的时候,滴定终点最好是用pH计来判断,通过肉眼分辨颜色,无论是溶液指示剂法还是pH试纸法,都是误差相当大的。 而现在很先进的微量自动凯氏定氮仪,里面应该有pH计的准确判断滴定终点的功能,用那定氮仪做实验就要准确多了。所以工欲善其事,必先利其器,这器的作用还是挺大的,尤其是在科研领域。 通过我以前做过的实验发现,还有很多传统的检测方法误差也很大。例如那些比色法测定物质的含量,稀释不同的倍数测定之后计算出来的结果误差也是很大的,而如果能够用其他的办法代替,就能精确很多。以前做还原糖的测定实验用DNS检测法,误差较大,后来实验室有了高效液相色谱,用高效液相色谱来检测,就精确多了。另外,蛋白质检测也有几种不同的办法,几种不同的办法之间测定的数据结果也是有比较大的误差的。 因此,不要迷信经典实验方法,也不要太迷信自己的实验数据,用另外一种方法检测,说不定实验数据又不相同。只有几种不同办法比较,才能够知道精确性究竟如何。 另外,传统的办法不一定准确还有一个表现:例如,凯氏定氮是通过测定含氮量来计算蛋白质含量,而如果样品中有无机氮,也会被算在内,造成结果不准。三聚氰胺被添加到牛奶里,就是个最好的例子,凯氏定氮是检测不出来三聚氰胺的。
个人分类: 科研*创新|7118 次阅读|9 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 14:21

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部