科学网

 找回密码
  注册

tag 标签: 鲁棒性

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

不戴泳镜游泳与鲁棒性
热度 6 lidawning 2018-9-15 15:18
两年前的暑假,我在怀化转车去成都,在 C 兄那里停留了一天。当时天气炎热, C 兄提议去郊区的腾古远水库游泳,我非常赞同。可是我没带游泳装备,最关键的是没带泳镜。自从读大学起,游泳时都是装备齐全的,泳裤、泳镜、泳帽一个不少。如果没有泳镜,还真不知怎么游了。当时如果去买泳镜,还不知道在哪里能买到,而且会耽误时间, C 兄便帮我在他隔壁哥们那边借了一副。 最近,在租住的公寓楼下有一个配套的小泳池,我经常去游。游着游着就想起了两年前那件借泳镜的事。心里头又来了一个问号,我如果不戴泳镜,还能游泳吗?这看似是个傻问题。既然会游泳了,不戴泳镜又何访。之所以有这个问号,是由于我游泳时已经习惯了在水下换气,这时候如果戴着泳镜,即使在水下也可以睁着眼睛。而如果我不戴泳镜,依旧按照已经习惯了的方式游泳则要么不能睁开眼睛,看不到东西;要么眼睛进水,引起眼睛不适。总之,如果不戴泳镜,按照我已习惯的方式游泳是不方便的。 我又想到了小时候在家乡的小河里游泳的场景,那时哪有什么游泳装备?个个小伙伴都游得很开心,虽然泳姿是野路子,不如现在的正规,但好歹不需要依赖任何装备就能游。记忆中有一副毛主席游长江的画面,画面上他老人家也没戴泳镜,不也游得好好的?如果哪天真来洪水了,难道我还要先去找副泳镜才能游吗?想到这些,我觉得该试着摘掉泳镜游泳了。为了能看见周围物体,又不让眼睛进水,我选择了让头始终露出水面,在水面上换气的方式。刚开始这样游的时候还挺费力的,也呛了几口水。这样游过几次之后,就熟练了,也轻松了。虽然效率比不上戴着泳镜游标准泳姿,但这对外界环境的依赖小啊。换句话说,不需要戴泳镜的游泳方式比标准的全副装备的游泳方式的环境适应性更好。 信息科学中的“鲁棒性”可以用来形容这两种游泳方式的不同。在维基百科上,对计算机科学中的鲁棒性的定义如下:“ In computer science, robustness is the ability of a computer system to cope with errors during execution and cope with erroneous input. ”即:计算机科学中,鲁棒性是指计算机系统在运行过程中处理错误和错误的输入的能力。还是以上述两种游泳方式为例来说明鲁棒性,如果有两个人,其中 A 在不戴泳镜和戴泳镜两种条件下都能游泳 , 而 B 只有在戴了泳镜时才能游泳。那么在标准的游泳比赛上(要戴泳镜),两人都可以参加。但是,当情况发生变化时,比如规定参加比赛者不许戴泳镜,这时 B 就不能参加了。这个例子中, A, B 对正确的输入指令(戴泳镜的标准游泳)都可以应付,但 B 对异常的输入指令(不戴泳镜游泳)则无法处理,而 A 可以处理。可见 A 的鲁棒性更好。 编过程序的人都对鲁棒性有切身体会,鲁棒性好的程序对一些异常情况都能较好处理,整体上可靠性更高,而鲁棒性差的程序则经常出问题甚至崩溃。鲁棒性对于我们的工作、生活也有重要的意义。例如:在看高水平的乒乓球 / 羽毛球比赛时,冠军通常都有一个共性:失误较少,而且在出现失误时能很快调整过来。这其实是鲁棒性好的一种表现。再比如,在篮球比赛中,普通球员投进一个时,我们不会说他水平高,因为他很难再进一个。相反,顶级球员即使在有多人干扰的情况下也能接二连三的进球。这就是鲁棒性高低的区别。 作为高校师生,也要努力提高自己的鲁棒性。多媒体教学设备普及后,大学教师的课堂教学都是用多媒体课件进行的。时间长了以后,可能很多教师对多媒体课件产生了依赖。如果突然没有了多媒体,估计有不少老师不知如何上课了。也常听学生讲“我必须在没有任何干扰的情况下才能学习”。这其实也是鲁棒性不好的表现。 如何提高鲁棒性呢?这是一个很重要的问题。我想到的是要多进行测试,发现问题并解决问题,以使自己在不同条件下都能得到相对稳定的结果。计算机科学和其他学科中肯定还有很多好的方法,在此抛砖引玉,希望大家给出更多的建议。
个人分类: 成长心路|11642 次阅读|13 个评论
美利坚之春
jiangming800403 2016-3-8 09:13
随着推特、脸谱等社交媒体的发展,美国的两党政治体制正在失去鲁棒性。很多人(包括我)都曾经认为共和党党内初选的“滤波器”机制可以过滤掉特朗普这样的大嘴政治人物。但事实上我们可能都错了,特朗普已经异军突起,已经使得共和党党内精英坐卧不安,共和党的宣传机器已经将火力集中打击特朗普,但是即使动用非传统手段,特朗普赢得共和党党内初选已经是大概率事件,虽然特朗普遭到了几乎所有人,甚至代表上帝的教皇的反对。 特朗普异军突起说明,经过长达八年经济危机的折腾之后,作为美国稳定支柱之一的传统中产阶级政治已经瓦解,经历了长达三十多年新经济的折磨,在历史上具有深刻的对政府不信任传统的“茶党”正在崛起,他们代表着右翼保守派的下层力量,如果不考虑技术进步因素,从二十世纪七十年代起,茶党们的生活水平实际上一直是在降低。但是一个房地产大亨,真能代表白人下层劳工的利益吗? 与前第一夫人、国务卿、参议院希拉里.克林顿相比,特朗普毫无治国理政经验,但是希拉里战胜特朗普也并不轻松。因为希拉里在民主党选民那里,同样两级分裂,激进的自由派(即所谓的占领华尔街运动)同样极端不信任希拉里,存在着反水的可能。 近年来欧洲已经数次出现,左右两翼联手干掉极右翼的局势。2016年美国大选,充满了不确定因素,不到最后时刻,很难说尘埃落定,因为存在着极端不喜欢特朗普的共和党人和极端不喜欢希拉里的民主党人,两党的选举人在最后投票的都可能叛变。 但是,如果特朗普入主白宫会把美利坚的巨轮引向何方?他自己是继续特立独行,还是被体制化。 房宁:谁能拦住特朗普 .................................... 谁能拦住特朗普?既然是选举,那就只能看选票了。特朗普的选票主要来自白人、男人、工人、富人、老人、老移民、退伍军人、上学少的人、读《圣经》多的人、讨厌政客的人。也许只有他们能够拦住特朗普。(作者是 中国 社科院政治学研究所所长) 
个人分类: 国际观察|1820 次阅读|0 个评论
中国的鲁棒性有多强?
热度 2 xiaoyanghe 2015-9-7 15:12
所谓鲁棒性( Robustness ),是指一个控制系统当其自身参数(或结构)变化或者存在外部扰动时,仍然能够正常运行的能力。一个国家或社会也是一个系统,其系统的鲁棒性是无疑十分重要的。 大规模的外敌入侵,可以视为社会系统的一个外部干扰。中国应对这一因素的鲁棒性,我想绝大多数的人都会认为是很强的。因为,我国军队的武器装备,虽然是比美国、俄国还有一定的差距,但比起几十年前(特别是抗日战争),还是强了很多。还有一点,如果真有外敌入侵,估计不会像抗日战争时期那样,有很多人投降当汉奸了吧? 大规模的自然灾害,也可以视为社会系统的另一个外部干扰。随着国力的增强,中国应对大规模自然灾害的能力也在增强。 说完了外部因素,来说一说内部因素。改革开放这几十年来,由于利益分配不均和不公、贪污腐败等造成的各种社会矛盾无疑是社会不稳定的最重要因素。这些社会矛盾就像是一个个火药桶,只要一有风吹草动,随时都会爆炸。 为此,执政党和各级政府花费了大量的人力和物力来“维稳”。只要有重大的突发事件或者是到了敏感的日期,政府就会采取各种措施来“引导舆论”。 经济增速放缓、停滞甚至下滑也是社会危机的导火索。这些年,经济的高速增长似乎掩盖了很多的社会矛盾。但是,一个社会的经济发展有着自身的规律。不可能一直都是高速增长。那么,就目前来说,经济增速放缓到什么程度会引发重大的社会危机?无疑是一个很有意义的课题。 既然经济增速放缓几乎是不可避免的,如何在经济增速放缓到来之前提高中国系统的鲁棒性又是一个很有意义的课题。
个人分类: 人生感悟|3679 次阅读|3 个评论
到底有没有免费的午餐?
热度 9 zhuyucai1 2014-1-19 19:22
“世上没有免费的午餐”一般是指一个有关国家福利的经济原理,跟中国的“天上不会掉馅饼”的道理很接近。在机器学习中有一个“没有免费午餐定理”,说的是要想在某些指标上得到性能的提高,必须在另一些指标上付出相应的代价。 在控制界没有正式的没有免费午餐定理,但大家都知道,一个控制器的控制品质(响应速度和抗干扰能力)和鲁棒性(对模型误差的容忍度)一般是相矛盾的,即一般是提高品质会降低鲁棒性,反之亦然。有人也把这个矛盾叫控制系统的没有免费午餐定理,听起来合情合理。 那么能否找到一种控制算法,既提高控制品质,又提高鲁棒性?或者说控制技术中会不会有免费午餐? 做过 MPC 项目的人都知道,传统的工业 MPC 控制器的抗干扰性不是很好。为了提高抗干扰能力,我们在 MPC 算法中加了一个递推(自适应) ARMA 模型来描述不可测干扰,用来提高模型预测的精度。在无数次仿真中,发现我们的方法不仅能提高控制品质,还大大提高了鲁棒稳定性!后一点令我们非常吃惊。难道这是控制中的免费午餐?我请控制界的一些大牛们帮助分析一下,至今没有得到任何回复,估计是太难了。 如果理论上能证明我们提出的自适应干扰模型能同时提高控制品质和鲁棒稳定性,那就证明了控制中确有免费的午餐,那就好玩了。如果能找到反例,也很有价值。请理论好的同学帮帮忙。文献【 1 】是我们方法的详细介绍,文献【 2 】再一次提到这个问题。 发现一个现象,提出一个理论难题,是很有意思、有刺激的事。这样的事在控制界已经很少发生了。 到底有没有免费的午餐,天上会掉馅饼吗? 感觉是,如果你朝正确方向努力上十年、二十年,天上会掉馅饼的。 没有严格证明。。。 【1】 Xu, Z.H., Zhu, Y.C., Han, K.,Zhao, J., Qian, J.X. (2010). A multi-iteration pseudo-linear regression method and an adaptive disturbance model for MPC. Journal of Process Control .Vol. 20, No. 4, pp 365-558. 【2】 Zhu, Y.C., R. Patwardhan, S. B.Wagner and J. Zhao (2012). Towards a low cost and high performance MPC: the role of system identification. Computers Chemical Engineering . Vol.51, pp. 124-135.
6031 次阅读|14 个评论
鲁棒性在气候科学研究中的应用一瞥——气候变化真鲁棒? 
hillside 2014-1-18 19:43
  据不完全搜索(普通外网与中国知网),“鲁棒”与“气候变化”在中文世界中似乎缺少直接关联,但在国外气候科学研究中“鲁棒“与”气候”已经喜结良缘,不少文献出现,现略举数例: 用两个高分辨率气候变化模拟情景分析欧洲极端降水变化的鲁棒性 hillside 2014-1-18 0 0 hillside 15 秒前 试用集合气候模型对月气温降水概率分布函数的变化预测值进行鲁棒性估算——英文论文 hillside 2014-1-18 0 12 hillside 22 分钟前 空间鲁棒的气候极值聚集预测研究——英文论文介绍 hillside 2014-1-18 0 18 hillside 1 小时前 局地降水极值未来变化的鲁棒性研究——英文论文介绍 hillside 2014-1-18 0 14 hillside 1 小时前 我个人判断,“集合预报”及“鲁棒性”都与所谓“不确定性”有着不解之缘,假以时日,它们之间应当可以建立关联(后来找到一点国外研究信息,见于附件)。 附1: PNAS文章确定全球变暖多重影响下的热点区域 国家科学图书馆《科学研究动态监测快报》2013年7月15日第14期(总第128期)气候变化科学专辑 根据PNAS在线发布的一项题为《全球变暖的多行业气候影响热点区域》(Multisectoral Climate Impact Hotspots in a Warming World)的最新研究成果,如果温室气体排放量有增无减,本世纪末全球可能有1/10的人口生活在气候影响的热点区域。在最糟糕的情景下,还有更多的人会面临粮食减产、水资源缺乏、生态系统失衡和人体健康等多重风险。 该研究由德国波茨坦气候影响研究所(PIK)、国际应用系统分析研究所(IIASA)和其他单位的研究人员合作完成,模拟在全球不同地区,气候变化对水的供应、疾病的传播、农业生产和生态系统的影响会如何重叠,结果确定亚马逊地区、地中海和东非地区的多个行业可能会经历剧烈变化。研究本身是跨行业影响模型对比计划(ISI-MIP)的部分产出成果之一。 文章的第一组作者,PIK的Franziska Piontek指出,气候变化对不同部门的重叠影响可能会相互作用,并因此对受影响地区的人民的生计带来数倍的压力,这就是该研究关注全球多个行业的原因。中国科学院合著者汤秋鸿指出,研究将过去30年中最干旱的3年设定为阈值,如果未来情景下水资源量低于该阈值,则认为气候变化给该区域带来水资源缺乏的环境风险。结果表明,当前的极端情况在未来可能成为常态。 多个不同气候模型的组合增加了结果的鲁棒性 和传播效果。共同作者之一,NASA戈达德空间研究所的Alex Ruane提出,多个模型预测得出的热点区域比单个模型模拟得到的要更可靠。 这是首例基于计算机模型全面模拟气候变化及其影响,并确定气候变化影响的行业热点的研究,也是全球气候影响的研究人员首次共同努力阐明人类正在面临的风险。研究的目的是为未来分析全球变暖的后果奠定新基础。 (裴惠娟 编译) 原文题目:Identifying Climate Impact Hotspots Across Sectors 附2: 气候变化再审视———非政府国际气候变化研究组报告 (见本人帖子: 介绍«气候变化再审视——非政府国际气候变化研究组报告» (2013年5月出版) ) 2 模型的本质问题 Susan Solomon (IPCC 第四次评估报告发布时第一工作小组的联合主席) 和在«美国国家科学院院报» (Proceedings of the National Academy of Sciences of the United States of America) 上撰文的其他3个作者指出, 由大气CO2 浓度增加导致的气候变化在排放停止后的1000 年内是不可逆转的(Solomon etal,2009)。 这在虚拟世界的计算机运行的气候模型中可能如此,但是在现实世界里未必如此。 这4位科学家提出气候参数建模需要符合三个标准条件: ①观测到的变化已经出现且有证据表明是人为因素引起的; ②各种现象基于充分理解的物理原理;③预测是有效的,且在模型间具有足够的鲁棒性。 对于Solomon等提出的第三条标准,许多计算机模型预测确实是有效的,并且在模型间具有鲁棒性,但这些模型的假设和具体时空上的结论通常存在巨大的分歧,甚至并不能证明彼此的有效性,也不能将这些不一致的预测进行组合产生有意义的平均值。许多研究发现,实际数据与模型预测相悖。因此, 认为这些模型是鲁棒的想法只是痴心妄想而已 。 附3: http://journals.ametsoc.org/doi/abs/10.1175/JCLI3990.1 Held, Isaac M., Brian J. Soden, 2006: Robust Responses of the Hydrological Cycle to Global Warming. J. Climate , 19 , 5686–5699. doi: http://dx.doi.org/10.1175/JCLI3990.1 Robust Responses of the Hydrological Cycle to Global Warming (水文循环对于全球变暖的鲁棒响应) Isaac M. Held National Oceanic and Atmospheric Administration/Geophysical Fluid Dynamics Laboratory, Princeton, New Jersey Brian J. Soden Rosenstiel School for Marine and Atmospheric Science, University of Miami, Miami, Florida Abstract Using the climate change experiments generated for the Fourth Assessment of the Intergovernmental Panel on Climate Change, this study examines some aspects of the changes in the hydrological cycle that are robust across the models. These responses include the decrease in convective mass fluxes, the increase in horizontal moisture transport, the associated enhancement of the pattern of evaporation minus precipitation and its temporal variance, and the decrease in the horizontal sensible heat transport in the extratropics. A surprising finding is that a robust decrease in extratropical sensible heat transport is found only in the equilibrium climate response, as estimated in slab ocean responses to the doubling of CO 2 , and not in transient climate change scenarios. All of these robust responses are consequences of the increase in lower-tropospheric water vapor. Received: September 13, 2005; Final Form: March 17, 2006 附4:http://www.iansa.eu/papers/IANSA-2012-01-dreslerova.pdf(全文下载) Human Response to Potential Robust Climate Change around 5500 cal BP in the Territory of Bohemia (the Czech Republic) (公元前5500左右波希米亚地区人类对于潜在的鲁棒气候变化的响应) Interdisciplinaria archaeologica(《跨学科考古学》杂志),Volume III ● Issue 1/2012 Dagmar Dreslerováa等 1. Introduction This contribution is dedicated to Marek Zvelebil. The range of his interests was admirably wide, from the life of hunters and gatherers through the Mesolithic – Neolithic transition and the beginning of agriculture, to the study of the ancient landscape as a whole. He used various approaches to solve archaeological themes including ethnography, linguistics, or environmental studies. In the latter respect he did not fear being accused of environmental determinism, as the example of an explanatory model for the Mesolithic-Neolithic transition in Denmark, published together with Rowley-Conwy (Rowley-Conwy 1984, Zvelebil, Rowley-Conwy 1984) demonstrates. The expressions flux and transition were often used in his work but may also be used in order to characterise Marek Zvelebil himself. Landscape, environment and flux will also be the subject of this article. It attempts to answer the question as to whether the observed change in spatial distribution of archaeological evidence from the Neolithic and Eneolithic (in the sense of the Middle and Late Neolithic in NW Europe, ca. 4200–2200 BC) might have been caused by a change in climate or whether this phenomenon was independent from external forces and a result of cultural factors. The previous climate, as the most important agent influencing the alteration of all other parts of an environment, is the subject of many scientific disciplines, although the outcomes are, despite tremendous efforts, still somewhat unsatisfactory. The main reasons for this are: the complexity of the climate system as such, the regionality of the climate, the short history of its direct instrumental measurement, the evaluation of the climatic parameters in relative terms (e.g. wetter, drier), the varying sensitivities of the proxies, and the difficulties of their more precise dating. Previous allegations can be illustrated by comparing proxy data supported by warmer/drier and cooler/wetter climate phases at ca. 6000 cal BP in Britain and north-west Europe (Schulting 2010) or in the eastern Mediterranean and adjacent regions over the past 6000 years (Finné et al. 2011). In both cases the proxies from the same period of time vary enormously in spite of the relative geographical proximity of the areas. 附5: http://www.theccc.org.uk/blog/climate-science-remains-robust-despite-claims-in-the-mail/ 气候科学依然鲁棒 (摘录,全文可见链接) Climate science remains robust despite claims in the Mail Parliament has given the CCC the responsibility to constantly monitor the science upon which we depend to guide our responses to the threat of climate change. Like all scientists, we always take a sceptical stance, testing each assertion against the evidence and ensuring proper peer review of every important finding. Although we turn to the experts to find the best available facts, we assess material from other sources carefully, to ensure that we have missed no useful insights. The Mail on Sunday recently published an article by David Rose challenging fundamental aspects of climate science and suggesting that action now to reduce greenhouse gas emissions is unwarranted. In accordance with our responsibility, we considered the three main claims, which focus on:………… 附6: http://onlinelibrary.wiley.com/doi/10.1002/wea.543/pdf Robust adaptation to climate change ( 气候变化的鲁棒性适应) Robert L. Wilby 1 and Suraje Dessai 2,3 1 Department of Geography, Loughborough University,Leicestershire, UK 2 School of Geography, University of Exeter, Exeter, UK 3 Tyndall Centre for Climate Change Research, UK Introduction Coupled ocean/atmosphere general circulation models (OA/GCMs) have been instrumental in showing the need for global action to curb the anthropogenic emissions that cause climate change. It may be contested, however, that these tools have been less helpful in informing how to adapt at regional and local scales (Schiermeier, 2007). Given the legacy of past emissions and the prospect of unavoidable climate change, the case for committing more financial and technical resources to adaptation is gaining ground (UNDP, 2007; Parry et al., 2009). This poses a challenging question: how can we ensure that adaptation measures realize societal benefits now, and over coming decades, despite uncertainty about climate variability and change? The scientific community is developing regional climate downscaling (RCD) techniques to reconcile the scale mismatch between coarse-resolution OA/GCMs and location-specific information needs of adaptation planners. The resulting ‘scenarios’ are regarded as plausible descriptions of the future climate that reflect the influence of local topography and/or land-sea effects, and their interactions with changing synoptic-scale weather patterns under rising concentrations of greenhouse gases. Thanks to widely available and user-friendly tools, the volume of peer-reviewed research on RCD has grown dramatically over the last decade (Wilby et al., 2009). It is becoming apparent, however, that downscaling also has serious practical limitations, especially where the meteorological data scenarios. The value of high-resolution climate change scenarios for long-term planning may be questionable wherever climate variability is already stressing human and environmental systems. For instance, parts of North Africa and the Middle East are facing a water crisis due to rapid population growth, combined with weak governance, climate variability and limited renewable supplies. Under these circumstances, even achieving Millennium Development Goals (MDGs) by 2015 (such as access to safe drinking water) may seem a remote prospect, let alone sustaining progress under climate change to the 2020s and beyond. Hence, there have been calls to re-examine the ways in which climate risk information is used in adaptation and development planning (Dessai et al.,2005). This paper begins by comparing two different approaches to climate risk assessment in adaptation planning. We then describe a framework for robust adaptation decision-making that departs from traditional ‘predict and provide’ methods. We draw upon examples from the water sectors of developing and developed countries as evidence of how significant progress can be made in the majority of cases without climate change projections. Our views are also shaped by recent experiences of supporting adaptation in practice. 附7: http://www.ghanabusinessnews.com/2013/06/06/african-countries-need-robust-climate-change-policies-fao/ 非洲国家需要鲁棒的气候政策 African countries need robust climate change policies – FAO Page last updated at Thursday, June 6, 2013 14:14 PM // Leave Your Comment There is the need for African countries to formulate and implement robust policies, to mainstream climate change adaptation and mitigation into national and sub-national development plans. Dr Lamoudia Thiombiano, Country Representative, Food and Agricultural Organisation (FAO) of the United Nations, who made the call, also said there was the need for these countries to increase public and private investments in agriculture and rural transformation. He was speaking at the ongoing 2nd Climate Change and Population Conference being hosted by the Regional Institute of Population Studies (RIPS), University of Ghana, Accra. - See more at: http://www.ghanabusinessnews.com/2013/06/06/african-countries-need-robust-climate-change-policies-fao/#sthash.ey1rzCDS.dpuf 附8: http://www.nber.org/papers/w16440 关于非洲内战与气候变化之间存在鲁棒性的肯定性研究及否认其间鲁棒性存在的反驳论文 Climate and Civil War: Is the Relationship Robust? Marshall Burke, John Dykema, David Lobell, Edward Miguel, Shanker Satyanath NBER Working Paper No. 16440, Issued in October 2010 A recent paper by Burke et al. (henceforth “we”) finds a strong historical relationship between warmer- than-average temperatures and the incidence of civil war in Africa (Burke et al. 2009). These findings have recently been challenged by Buhaug (2010) who finds fault with how we controlled for other potential explanatory variables, how we coded civil wars, and with our choice of historical time period and climate dataset. We demonstrate that Buhaug’s proposed method of controlling for confounding variables has serious econometric shortcomings and show that our original findings are robust to the use of different climate data and to alternate codings of major war. Using Buhaug’s preferred climate data under sound econometric assumptions yields results that suggest an even stronger relationship between temperature and conflict for the 1981-2002 period than we originally reported. We do find that our historical relationship between temperature and conflict weakens over the last decade, a period of unprecedented African economic growth and very few large wars. This paper is available as PDF (250 K) or via email . 附9: http://www.jydoc.com/article/9151.html 鲁棒性——健康的系统 时间:2005年04月11日 作者:普通高中通用技术课程 点击:48次   控制系统的鲁棒性研究是现代控制理论研究中一个非常活跃的领域,鲁棒控制问题最早出现在上个世纪人们对于微分方程的研究中。Black首先在他的1927年的一项专利上应用了鲁棒控制。但是什么叫做鲁棒性呢?其实这个名字是一个音译,其英文拼写为Robust。也就是健壮和强壮的意思。控制专家用这个名字来表示当一个控制系统中的参数发生摄动时系统能否保持正常工作的一种特性或属性。就像人在受到外界病菌的感染后,是否能够通过自身的免疫系统恢复健康一样。
个人分类: 大气科学|5344 次阅读|0 个评论
微博:人文艺术修养的作用!
热度 3 xcfcn 2012-4-27 20:10
俗云:学好数理化,走遍天下也不怕! 这个诚然是事实,尤其是在高科技的今天。 但是人也仅仅是会思考的芦苇,很脆弱的。 尤其是“峣峣者易缺,皦皦者易污。” 这个时候,人文的作用就会凸现, 它会让人左看右看,前看后看,甚至超脱一点地看。 这自然会增加一个人的鲁棒性, 让你过几天后“又是一位好汉”,放空自己,重新出发。 我这个理呆就很郁闷:不懂艺术不懂人文,但有一点好! 咱一直生活在底层,忧郁症啥玩艺大概很难跟我结缘。 PS:我是从理呆从世俗的角度来说这段话的,背景就是有人自杀。
个人分类: 杂论|497 次阅读|5 个评论
玩網絡的朋友需要具有一定的心靈魯棒性
热度 7 jiangjinsong 2012-4-12 22:42
永遠不挨駡的人是不存在的~ 蕭子這廝有個優點 老是大嘴冒傻氣 有點享受受虐的意思 連我老人家那麼nice的人都忍不住時不時地欺負他一下 沒事把他拿出來罵一罵! 那些在網絡上從來都受寵沒被罵過的人都是不成熟的 被罵過之後就成熟了
个人分类: 口無遮攔|2598 次阅读|26 个评论
“鲁棒性”的音译(外一则)
热度 9 boxcar 2012-1-16 07:59
robust应该音译成神马? 一开始我想,当然是 “扰拨死它!” 且慢,后来想想死了就不好玩了,所以改一改, 改成 ——扰不死它。 总之,还是活着好。 外一则: 顺便就小甜甜童鞋昨天的休博删文说一句: ——哥们儿,你的“鲁棒性”还不够啊! 应该无论咋“扰”,就是“不死”才行。 由此,或许可以引发出一个关于“博客鲁棒性”的研究, 搞网络的、搞信息情报的各位老大,机遇呀! 这次,善哉一下武夷山老师的博文标题风格。
个人分类: 科学网|6673 次阅读|25 个评论
怎么理解“鲁棒性”
热度 20 lix 2012-1-15 23:11
老邪是这么理解的:鲁智深那根禅杖,很结实。
个人分类: 生活点滴|5886 次阅读|23 个评论
令人费解的鲁棒性——论robust的汉译
热度 8 hillside 2012-1-15 13:42
   鲁棒(robust)性与鲁棒控制是系统科学的热门语,并逐渐向其他领域延伸。所谓“鲁棒性”,是指控制系统在一定(结构,大小)的参数摄动下,维持某些性能的特性。鲁棒性诚然值得追求,但鲁棒的字面含义却有些匪夷所思。    据《现代汉语词典》,“鲁”除用作国名、地名与姓名等特称外,常规释义有二:1、迟钝、笨;2、莽撞;粗野。而“棒”呢?1、棍子;2、(体力或能力)强、水平高、(成绩)好。   “鲁”与“棒”两个含义有些相左的字搭配到一块,总感觉不是滋味,似乎是拉朗配。当然,外词汉译有各种讲究,比如信达雅等等。    用什么好呢?“罗棒性”粗看上去不错,比较中性,但是“网罗”、“大棒”的联想令人心有余悸。我想,可否用“韧棒性”来翻译呢?从音译看,有些失真,但综合发音与含义,它又是一个不错的表达。“荦棒性”(荦:明显也)、络棒性、珞棒性等也是可以考虑的用词。我一时也未发现更好的用词,只是抛出一个想法而已。其实,直译“健壮性”、“维壮性”、“保壮性”(或者壮的其它同尾词)也大致可用。
个人分类: 语言文化杂谈|11682 次阅读|19 个评论
坚持四项基本原则,开发鲁棒性NLP系统
热度 3 liwei999 2011-12-9 07:04
《科研随笔:自然语言处理系统的鲁棒性》 以前说过,一个 real life 自然语言处理系统,其质量和可用度除了传统的 data quality 的衡量指标查准度(precision)和查全度(recall)外,还有更为重要的三大指标:海量处理能力(scalability), 深度(depth)和鲁棒性(robustness)(参见:《 “三好”立委要做“三有”系统 》)。 本文就简单谈一下鲁棒性。 为了取得语言处理的鲁棒性(robustness),一个行之有效的方法是实现四个形容词的所指:词典主义(lexicalist); 自底而上(bottom-up); 调适性(adaptive);和 数据制导(data-driven) 。这四条是相互关联的,但各自重点和视角不同。系统设计和开发上贯彻这四项基本原则, 是取得鲁棒性的良好保证。有了鲁棒性,系统对于不同领域的语言,甚至对极不规范的社会媒体中的语言现象,都可以应对。这是很多实用系统的必要条件。 先说词典主义策略。词典主义的语言处理策略是学界和业界公认的一个有效的方法。具体说来就是在系统中增加词汇制导的个性规则的总量。自然语言的现象是如此复杂,几乎所有的规则都有例外,词汇制导是必由之路。从坚固性而言,更是如此。基本的事实是,语言现象中的所谓子语言(sublanguage),譬如专业用语,网络用语,青少年用语,他们之间的最大区别是在词汇以及词汇的用法上。一般来说,颗粒度大的普遍语法规则在各子语言中依然有效。因此,采用词典主义策略,可以有效地解决子语言的分析问题,从而提高系统的鲁棒性。 自底而上的分析方法。这种方法对于自浅而深的管式系统 (pipeline system) 最自然。系统从单词出发,一步一步形成越来越大的句法单位,同时解析句法成分之间的关系。其结果是自动识别(构建)出来的句法结构树。很多人都知道社会媒体的混乱性,这些语言充满了错别字和行话,语法错误也随处可见。错别字和行话由词汇主义策略去对付,语法错误则可以借助自底而上的分析方法。其中的道理就是,即便是充满了语法错误的社会媒体语言,其实并不是说这些不规范的语言完全不受语法规则的束缚,无章可循。事实绝不是如此,否则人也不可理解,达不到语言交流的目的。完全没有语法的“语言”可以想象成一个随机发生器,随机抽取字典或词典的条目发射出来,这样的字串与我们见到的最糟糕的社会媒体用语也是截然不同的。事实上,社会媒体类的不规范语言(degraded text)就好比一个躁动不安的逆反期青年嬉皮士,他们在多数时候是守法的,不过情绪不够稳定,不时会”突破”一下规章法律。具体到语句,其对应的情形就是,每句话里面的多数短语或从句是合法的,可是短语(或从句)之间常常会断了链子。这种情形对于自底而上的系统,并不构成大的威胁。因为系统会尽其所能,一步一步组合可以预测(解构)的短语和从句,直到断链的所在。这样一来,一个句子可能形成几个小的句法子树(sub-trees),子树之内的关系是明确的。 朋友会问:既然有断链,既然那些子树没有形成一个完整的句法树来涵盖所分析的语句,就不能说系统真正鲁棒了,自然语言理解就有缺陷。抽象地说,这话不错。但是在实际使用中,问题远远不是想象的那样严重。其道理就是,语言分析并非目标,语言分析只是实现目标的一个手段和基础。对于多数应用型自然语言系统来说,目标是信息抽取(Information Extraction),是这些预先定义的抽取目标在支持应用(app)。抽取模块的屁股通常坐在分析的结构之上,典型的抽取规则 by nature 是基于子树匹配的,这是因为语句可以是繁复的,但是抽取的目标相对单纯,对于与目标不相关的结构,匹配规则无需cover。这样的子树匹配分两种情形,其一是抽取子树(subtree1)的规则完全匹配在语句分析的子树(subtree2)之内(i.e. subtree2 subtree1),这种匹配不受断链的任何影响,因此最终抽取目标的质量不受损失。只有第二种情形,即抽取子树恰好坐落在分析语句的断链上,抽取不能完成,因而影响了抽取质量。值得强调的是,一般来说,情形2的出现概率远低于情形1,因此自底而上的分析基本保证了语言结构分析的鲁棒性,从而保障了最终目标信息抽取的达成。其实,对于 worst case scenario 的情形2,我们也不是没有办法补救。补救的办法就是在分析的后期把断链 patch 起来,虽然系统无法确知断链的句法关系的性质,但是patched过的断链形成了一个完整的句法树,为抽取模块的补救创造了条件。此话怎讲?具体说来就是,只要系统的设计和开发者坚持调适性开发抽取模块(adaptive extraction)的原则,部分抽取子树的规则完全可以建立在被patched的断链之上,从而在不规范的语句中达成抽取。其中的奥妙就是某样榜戏中所说的墙内损失墙外补,用到这里就是结构不足词汇补。展开来说就是,任何子树匹配不外乎check两种条件约束,一是节点之间句法关系的条件(主谓,动宾,等等),另外就是节点本身的词汇条件(产品,组织,人,动物,等等)。这些抽取条件可以相互补充,句法关系的条件限制紧了,节点词汇的条件就可以放宽;反之亦然。即便对于完全合法规范的语句,由于语言分析器不可避免的缺陷而可能导致的断链(世界上除了上帝以外不存在完美的系统),以及词汇语义的模糊性,开发者为了兼顾查准率和查全率,也会在抽取子树的规则上有意平衡节点词汇的条件和句法关系的条件。如果预知系统要用于不规范的语言现象上,那么我们完全可以特制一些规则,利用强化词汇节点的条件来放宽对于节点句法关系的条件约束。其结果就是适调了patched的断链,依然达成抽取。说了一箩筐,总而言之,言而总之,对于语法不规范的语言现象,自底而上的分析策略是非常有效的,加上调适性开发,可以保证最终的抽取目标基本不受影响。 调适性上面已经提到,作为一个管式系统的开发原则,这一条很重要,它是克服错误放大(error propagation)的反制。理想化的系统,模块之间的接口是单纯明确的,铁路警察,各管一段,步步推进,天衣无缝。但是实际的系统,特别是自然语言系统,情况很不一样,良莠不齐,正误夹杂,后面的模块必须设计到有足够的容错能力,针对可能的偏差做调适才不至于一错再错,步步惊心。如果错误是 consistent/predictable 的,后面的模块可以矫枉过正,以毒攻毒,错错为正。还有一点就是歧义的保存(keeping ambiguity untouched)策略。很多时候,前面的模块往往条件不成熟,这时候尽可能保持歧义,运用系统内部的调适性开发在后面的模块处理歧义,往往是有效的。 最后,数据制导的开发原则,怎样强调都不过分。语言海洋无边无涯,多数语言学家好像一个爱玩水的孩子,跳进大海就乐不思蜀。见水珠不见海洋,见树木不见森林,一条路走到黑,是太多语言学家的天生缺陷。如果由着他们的性子来,系统叠床架屋,其执行和维护的 overhead 会越来越大,而效果却可能越来越差(diminishing returns)。数据制导是迫使语言学家回到现实,开发真正有现实和统计意义的系统的一个保证。这样的保证应该制度化,这牵涉到开发语料库(dev corpus)的选取,baseline 的建立和维护,unit testing 和 regression testing 等开发操作规范的制定以及 data quality QA 的配合。理想的数据制导还应该包括引入机器学习的方法,来筛选制约具有统计意义的语言现象反馈给语言学家。从稍微长远一点看,自动分类用户的数据反馈,实现某种程度的粗颗粒度的自学习,建立半自动人际交互式开发环境,这是手工开发和机器学习以长补短的很有意义的思路。 以上所述,每一条都是经验的总结,背后有成百上千的实例可以详加解说。不过,网文也不是科普投稿,没时间去细细具体解说了。做过的自然有同感和呼应,没做过的也许不明白,等做几年就自然明白了,又不是高精尖的火箭技术。 【相关篇什】 《 “三好”立委要做“三有”系统 》 http://blog.sciencenet.cn/home.php?mod=spaceuid=362400do=blogid=510567 【立委科普:从产业角度说说NLP这个行当】 : http://blog.sciencenet.cn/home.php?mod=spaceuid=362400do=blogid=434811 《科普随笔:keep ambiguity untouched》 http://blog.sciencenet.cn/home.php?mod=spaceuid=362400do=blogid=496808 ◊ 中间那段“黑压压”的一片,有些负担。分段为好。 - mirror 12/08 17:24 噼里啪啦打字下来的,又没有例子,知道可读性不好。 作者: 立委 日期: 12/08/2011 19:11:42 有时候想,也不能弄得太可读了,都是多年 的经验,后生想学的话,也该吃点苦头。:=) RE: 如果输入的原始文本有很多错字漏字,比如来自劣质 OCR的文本。有什么好办法克服错误放大? 这要看具体情况和目标了 作者: 立委 日期: 12/08/2011 23:21:00 适配性、数据制导的容错性开发肯定可以对付一些错字漏字的现象, 但是究竟能对付多少,那些是可以对付的,那些是难以对付的,需要具体分析。 可以看一下两极的情形:天花板和地板。 容错、纠错的系统本质上是对人的容错、纠错能力的 modeling,因此人的理解能力是系统可能逼近的天花板。理论上讲,如果人能理解错字漏字的语句,基本说明了这个不规范的句子形式内涵语义的冗余度,那么一个容错系统应该也可以做到。(当然,人的理解可能不自觉地调动常识、专业知识、联想和推理等非语言学手段,模拟起来很困难,在目前,简单地容错开发是远远达不到人的理解力的。)如果错字漏字造成真正的语句歧义,那么最好的系统最多做到分析的多路径。最后,如果错字漏字严重到人都搞不清什么意思的时候,机器自然是两眼一抹黑。 地板就是一个完全规范的“紧式”语言系统,错字漏字的地方就造成断链,局部语义无法合成为完整的理解(problem with the semantic compositionality, the key to language understanding)。所谓容错开发,就是尽可能把紧式系统松绑为“宽式”系统,把非排歧的无关紧要的条件放宽。譬如英语中的主谓一致关系的条件(第三人称单数的主语需要其谓语动词有词尾-s, 这个中小学语法课上的金科玉律就是紧式语法的条条框框,在宽式开发中一般不用)。再如汉语动词的被动语态,有些句子加了“被”字,万一这个关键的被动语态的助词漏掉了,容错系统应该仍然分析无误,如果逻辑动宾的语义搭配条件参与了分析的过程的话(如:“饭吃了” 就是 “饭被吃了”,而“我吃了” 则不一样)。 上述回答,对于您这样的大儒,基本是可以(被)预测的废话,不说也罢。不过,我也没有更到位的说法给您。 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|9488 次阅读|5 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-11 18:21

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部