科学网

 找回密码
  注册

tag 标签: 确定性

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

电缆火灾防控
dfedhw 2019-8-14 11:43
【温故而知危】山东省招远市罗山金矿“8·6”重大火灾事故 转自微信公众号安全执法 相比于日常所使用的成千上万的电缆而言,发生电缆火灾的比例微乎其微,甚至一部分还可能自熄,然而当火灾出现在一些较为封闭的建筑空间(如电缆隧道、电缆沟、电缆竖井、高层建筑、地下矿井),倘若任由其蔓延开来,又可能造成极为严重的后果,故有必要采取一定措施予以防控。 电缆几乎遍布于建筑的每一个角落,就自动灭火手段而言,要想面面俱到无疑是不现实的,为此只能遵循“点-线-面-空间 ” 的顺序依次进行设防,从而达到安全投入产出比最佳,也便于现场实施。人工灭火手段作为一种有效补充,在起火点距离人员较近时能够灵活发挥作用。无论自动还是人工灭火,“快”字是关键。 接头发生短路击穿的概率远高于电缆本体,故在电缆敷设过程中,无论是前期施工还是后期维修,除了确保工艺质量之外,还应有意识地将所有的接头制作安装于水平段,绝对避免其位于斜坡段或垂直段,以免一旦起火快速蔓延,失去灭火先机。 全线设立火灾报警系统也许是必要的,然而以下几点需要引起足够重视: 1.因为点多面广以及现场通风条件,个别火灾未必能被数量有限的探测器及时发现; 2.处于复杂的使用环境,报警器频繁误报会导致系统的正常使用受到干扰,一定的使用年限之后,维护滞后导致系统全面或部分失效; 3.真实的火情有可能出现于任一时刻,由于值班人员的水平差异,造成就算知晓火情发生,却无法准确判断火情位置,包括各种信息综合中出现的失误,由于现场情况不明而导致外围救援工作无法定向开展; 4.特殊环境下的通讯障碍,导致火场内外人员无法及时沟通传递最新动态。 电缆火灾的预警有多种手段,切不可完全依赖于自动报警系统,况且 仅仅知悉起火还远远不够,足量灭火剂的及时投送到位才是关键 ,更多的要借助于现场的各种“短平快”手段。电缆火灾也非一朝一夕所形成,有一定的发展过程,前期的表面异常发热现象很容易通过定期的红外线测温予以提前发现,并及时消除火灾隐患,以此来避免应对严重火灾时的被动局面。 现实当中,一定比例的电缆起火实际并未造成严重的后果,其中存在部分偶然因素及幸运成分,而电缆火灾防控的目的在于通过对技术的合理选择,把“成功灭火”这一过去看似小概率的事件变为可控的大概率事件、确定性事件。为了真正达到这一目的,需要从安全成本的整体投入、技术的筛选、实施过程中的难易程度、设备设施的可靠性、现场人员普遍操作水平以及事故后果来综合权衡。 概率、神奇与神棍 转自微信公众号蝈蝈创新随笔 高层建筑电缆井火灾防控 一种可用于防控电缆接头火灾的自动灭火装置_代恒伟.pdf
1973 次阅读|0 个评论
从我见到你的一刻
pingguo 2018-7-20 15:29
人生唯一的确定性, 就是它的不确定。 我的直觉如此, 我以往的经验如此, 我关于人生的猜想也是如此。 是时候修正这一点, 不是借助我自己的力量, 也不是借助文字或信仰的力量, 而是你, 从我见到你的一刻。 2018-07-17
个人分类: 诗歌|1420 次阅读|0 个评论
公共阐释:中国阐释学的理论建构学术研讨会侧记
ssglwu 2017-8-6 11:14
公共阐释:中国阐释学的理论建构学术研讨会侧记 吴国林 2017 年 8 月 4 日 —6 日在广州召开了“ 公共阐释:中国阐释学的理论建构 ”学术研讨会。会议由中国社会科学杂志社、《学术研究》杂志社主办。会议地点:越秀宾馆。 会议主题:公共阐释的有关理论建设。公共阐释是一个新概念,它由中国社会科学院张江教授提出。它是阐释者以普遍的历史前提为基点,以文本为意义对象,以公共理性生产有边界的约束,且可公度的有效阐释。提出这一命题,旨在建构当代中国阐释学基本框架确立一个核心范畴,以此为题展开讨论和批评,在阐释学领域做出中国表达。 会议开幕式由中国社会科学杂志社常务副总编王利民主持,中共广东省委宣传部副部长、广东省社会科学院党组书记蒋斌致欢迎词,广东省社科联书记王晓出席会议。来自于中国社会科学院、中国人民大学、复旦大学、中山大学、山东大学、华南理工大学、华中科技大学、吉林大学、华东师范大学、陕西师范大学等学术单位的张江、吴晓明、潘德荣、张盾、傅永军、袁祖社、吴国林、韩东晖、彭启福、何卫平、马天俊、牛文君等学者30多人参加研讨会。中国社会科学杂志社的副总编王利民(常务)、李红岩、孙麾等出席会议。 会议第一阶段由《学术研究》主编叶金宝主持。张江做公共阐释理论的主题报告。 会议参考资料 : 张江:《公共阐释论纲》,《学术研究》 2017 年第 6 期。张江:《评 “ 人人都是他自己的历史学家 ”—— 兼论相对主义的历史阐释》, 《历史研究》 2017 年 1 期。 随后的研讨会由《天津社会科学》杂志社主编赵景来 、 《江海学刊》杂志社副主编赵涛、《学术研究》杂志社副主编罗苹主持。 会议讨论的议题有:公共阐释的哲学基础,中国诠释学构想,解释学的普遍性,阐释的公共性与对马克思的客观阐释,公共理论与公共阐释的有效性,差异、共识与公共理性,阐释的公共性与人的历史性前提,量子诠释学论纲等。会议就相关问题引起热烈讨论。 我自己报告的论文是《 量子诠释学论纲—— 兼论公共诠释 》,引起了会议学者会上会下的热烈讨论。学者们赞同,如果诠释学方法是普遍的,那么它应当用于量子领域。作者讨论了:量子力学诠释(interpretation)问题、量子诠释的确定性、量子文本的分类、意义、理解与理性等问题。 会议 闭幕式由 《江海学刊》杂志社主编韩璞庚主持,《中国社会科学》杂志社副总编孙麾作总结报告,对研讨会给予了 高度评价 。 这是一个小型的高端学术讨论会,将持续推进有关研究。 这次研讨会是中国学者构建诠释学的一个学术自觉和努力。
个人分类: 学术会议与讨论会|2776 次阅读|0 个评论
P .VS. NP及其确定性与非确定性
热度 12 lhy8848 2016-12-5 01:21
无论 P NP 问题或者确定性与非确定性问题都是及其难于讨论的问题,也不是本人的能力所能深入分析的,在这里只是针对 柳渝老师相关的博文给出的回应。 在 柳渝老师的博文《 NP 理论( 5 ):不确定性问题( NP )研究中的层次与中国传统逻辑 》中讨论了一些 P NP 问题,并将这些问题与确定性及非确定性的问题进行关联,除此之外,柳老师更着重于将这些讨论上升到认知逻辑范畴,尤其是中国春秋时代白马非马的论题。在这篇博文下面我提出了自己解读的困惑,针对我的评论,柳老师专门开出一个博文作为正式的回复,也因此我觉得需要将我所理解的这些论题的内容再加以详细讨论。 首先我所谈论的这些内容基本都是教科书或者相关文章中的摘取片段,我并没有贡献新的思想,鉴于仅仅是博文,不一一指出引用的相关文章。 PNP 问题属于可计算理论方面非常重要的问题,甚至可以说是这个领域中仅有的几颗皇冠上的明珠。这个问题属于计算机科学和计算数学领域,也是数论领域的问题。 我们世界中,很多问题是能够通过设计具体的算法来解决的,这些算法与问题的规模相关。比如解一元二次方程,我们有直接的公式进行计算,无论解是什么,我们都能在相对恒定的时间得到计算结果,这个问题就是常数类型的问题,但是再比如排序问题, 10 个数与 10 万个数排序消耗的时间就跟数的规模相关,并且我们也知道不同的算法给出的优化水平相差是很大,这种算法与问题的规模相关的指标是可以进行比较的,我们将这种指标定义成复杂度。当然我这里不准备详细讨论复杂度问题,只是指出来所谓的 P 问题与 NP 问题是与算法的复杂度相关的,并且还需要指出的,算法与计算机体系相关,当前讨论算法复杂度一律基于诺依曼体制,这是算法彼此可比较的大前提,如果我们面对量子计算机或者其它比如号称超越诺依曼体制的透明计算之流,那就不是目前所考虑的范围。 诺依曼的体制中,计算能力是受到限制的,我们认定一个问题随着规模的扩大,能够获得解决的前提就是提供的算法所消耗的空间与时间,或者与常数相关或者是呈现与问题规模的多项式增长相关,这两种情况都是属于多项式复杂度的算法。 所谓的 P 问题就是指能够在多项式复杂度算法中得到解决的问题,在计算机行当里,称这类问题为简单问题;需要注意的是,所谓 NP 问题并不是指不能用多项式复杂度算法解决的问题,它的其中一个定义是能够用多项式复杂度的算法验证问题结果的问题,所以能够知道 P 问题首先一定是 NP 问题,因为 P 算法本身就是对结果的验证,所以这两者不是对立关系,而是 P 属于 NP 。但是 NP 问题是否存在多项式复杂度算法来解题则是不确定的,我们不知道是否存在这样的算法,但是往往地已经找到的算法都是非多项式的,比如指数型或者阶乘型复杂度,这类的算法计算机只能限制在很小的规模下获得结果,因为随着问题规模扩大,资源将急速耗尽,因此我们认为这类问题当前提供的算法是不可计算的,超出了计算机的能力,也是属于难的问题。 P 与 NP 的问题最大的猜想就是 P 是否能够等于 NP ,换句话来说,人们关心的是如果一个问题的结果能够用多项式复杂度的算法来验证,那么是否存在多项式算法来得出这个结果那?凭直觉人们就认为 PNP ,但是没人能够证明这一点。 NP 问题很著名的一个例子就是无向图的哈密顿回路查找问题,如果我们知道了一个回路,验证这个回路是哈密顿回路是一次方的复杂度,但是我们目前无法找到一个多项式复杂度的算法来发现这个回路。 NP 问题中还有一类更奇妙的问题,已经证明了,所有的 NP 都能约化成一类特殊的 NP 问题,这类 NP 问题叫做 NPC ,或者 NP 完全问题。所谓约化,就是指一个问题可以通过多项式算法将这个问题转化为另一个问题。这样的情况下,意味着 NPC 问题是比普通的 NP 问题更复杂一点的问题,如果找到一个 NPC 的多项式复杂度算法,也就能够通过降阶的方式将这个算法改造成解决任意一个确定的 NP 问题的多项式复杂度算法。这个句子有点拗口,但是简单来说,就是意味着存在一个通用的万能算法,能够解决所有 NP 问题,这样只要找到一个 NPC 的多项式算法也就证明了 P=NP 。这个万能算法的存在性真的令人不可思议,也因此无论在直觉上还是在尚不完整的理论上,人们都倾向于认为 PNP ,也就是说,尽管 P 属于 NP ,但是 NP 中仍然有一些问题,不能用多项式复杂度来解决。但是这在目前为止仍然是个没有完成的证明。 NPC 问题并不抽象,著名的寻找哈密顿回路就是这样的一个 NPC 问题,科学网杜立智博主贴出来一个算法,据说能够以多项式复杂度的情况下解决这个问题,如果确实得证,这是一个无论怎么高评都不过分的成果,因为这证明了 P=NP ,在计算机行当里,绝对属于图灵奖的成果。 当然还存在非 P 非 NP 的问题,还是那个哈密顿回路问题,假如问题换个问法:一个无向图中是否不存在哈密顿回路。验证这个问题其实就是寻找哈密顿回路的问题,这个问题就已经不是 NP 问题了。 此外还有一些有解但无算法的问题,比如问比如圆周率 Pi 的小数点后面是否有连续的 100 万个 0 ,解决这个问题除了不断计算 Pi ,没有任何其它途径,但是这不是算法。 还有一类无解也无算法的问题,就是著名的停机问题,已经证明停机问题的算法不存在,这与 PNP 问题一点关系都没有。 所以从上面的 PNP 的描述中我们能够看到,所谓的 P 与确定性相关的无非是确定性地存在多项式复杂度的算法,使得问题具有可计算的能力,而 NP 与非确定的关联,并不是因为 NP 是非常困难的问题,毕竟 P 问题也在 NP 问题之中,而是其主要关注在一些特别的问题上,那些问题存在对结果多项式复杂度的验证算法,但是是否存在多项式复杂度的解决问题的算法是不确定的,是对算法存在与否的不确定性,与我们日常所理解的确定性与不确定性是完全无关的。柳老师的博文中将 P 与 NP 绝对对立,将物理数学领域里所谈论的确定性与不确定性与 PNP 问题中的确定性与不确定性挂钩是不可以的,完全不是一样的涵义。其实在学校的课堂上,讲述这段理论的时候,授课老师就已经对中文翻译将 PNP 与确定非确定关系挂钩表示无奈,特别强调这与通常意义所理解的字面含义不相关,需要加以区隔。 柳老师提出了观点: 人们总是事先约定或隐含地约定了将不确定性问题转化为最优近似求解的问题 。这种看法可能就是基于将通常意义上的不确定性混淆在 NP 问题上,其实 NP 问题基本上可以看做属于数论问题,是在整数意义上的操作,近似的结果可能与无结果是一样的,典型例子就是非对称秘钥 RSA 设计原理。 RSA 加密原理就是默认了 P NP ,一个大数分解成素数因子的算法相对于数的位数来说,目前是指数级别复杂度,但是验证素数属于大数的因子却是恒定的常数算法,不能说找到一个近似的素数就可以看做破解 RSA 密钥,要知道找到近似的结果其实也可以有常数级别的算法,但是要想破解密文,差一点都不可以。 认为柳老师存在误读的地方可以看前面博文中:“不确定性的消失和 NP 理论”一节,在那里,提到 计算机强大的解决问题的能力给人们带来了一种观念上的错觉:(所有的)不确定性问题总是可以确定性地解决的,用术语来说,就是 P = NP ,或者称之为 “NP 完全性 ” ( NP-completeness )。 可以看出来这里面 P/NP/NP- 完全的定义与我所提到的完全不同,并且 P = NP 恰恰不为从事计算科学的人的直觉所认同。并且博文中还提到 莫里斯 · 克莱因( Morris Kline )在 “ 数学:确定性的丧失 ” 一书中探讨了以确定性和精确性的内容为骄傲的数学发展过程中面临的自身的危机,伊利亚 · 普利高津( Llya Prigogine )的 “ 确定性的终结 —— 时间混沌与新自然法则 ” 、费曼( RichardPhillips Feynman )的 “ 科学的不确定性 ” 等,恰恰在这里将物理学和数学意义上的确定性与非确定性与 P NP 问题中的确定性与非确定性混淆在一起,这给绝大多数不了解计算科学领域的人很大的误解,可以从博文的讨论中看出来,基本都是围绕科学意义上的意涵来进行思考的,窃以为都走了岔路。 顺便提一嘴,如果杜博主有关哈密顿回路多项式算法成立,意味着 RSA 已经被破解了,无需等待量子计算机的时代到来。不仅仅是 RSA 被破解了,而且对称密钥 DES 类型的也被破解了,因为这两类算法目前都是属于 NP 类中没有多项式算法的类型,整个密钥体制也因此宣告终结。这是很可怕的情景,杜博主为了人类和平事业还是放弃图灵奖吧。 以上观点仅仅是自己一时的思考,可能在很多方面对柳老师的理论没有领悟,很感谢柳老师专门开出一个博文来回应我的疑问,这也是对两个博文的再讨论吧。
7193 次阅读|33 个评论
“确定性” versus “不确定性”
热度 6 liuyu2205 2016-1-9 12:07
克莱因的书“数学:确定性的消失”(Mathematics: The Loss of Certainty,Par Morris Kline),追溯数学在19世纪、20世纪的发展,从非欧几里得几何、悖论、公理化运动到哥德尔不完备定理,揭示了人们对数学的认识从“确定性”到“不确定性”的变化。“确定性的消失”一说,指当人们看到数学的“不确定性”如沉在海水下面的冰山开始崭露头角时的困惑,如罗素所说:“我在数学里总是希望得到的那种壮丽的确定性,消失在不知所措的困惑之中了”,此“不确定性”与关于数学基础的反思密切相关,谓之“问题的问题”,。。。 后起之秀的计算机科学,在20世纪30、40年代,伴随着数学的公理化运动,为了定义什么是机器可以计算的问题,提出“可计算性”概念,进一步表达为“图灵-丘奇定律”。于可计算问题,计算与判断一致,故“可计算问题”具有“确定性”。与哥德尔不完备定理的角度不同,图灵是从计算的角度,证明了存在着“不可计算问题”-“停机问题”,“停机问题”不可判断,也就是说,“停机问题”具有“不确定性”。 然而随着计算机运用的广泛开展,相对于算法可以求解的问题(P),出现了某些实际问题算法求解困难(NP)。从可计算性的角度,问题可以算法求解实际上就是指“可计算性”,只是这里人们用算法的“多项式时间复杂度”表达了“可计算性”,指机器的能力与问题实例的规模增长相匹配,故机器对这样的问题具有计算的能力:P是可计算的;而问题算法求解困难就是指“不可判定性”,即可计算性意义的算法的存在出现了问题,机器对这样问题不具有(精确)计算的能力:NP“难”到不可计算。然而,就是在这里人们的认知开始出现了偏差:没有看透“多项式时间复杂度”的本质是“可计算性”,仅仅局限于具体问题,混淆了“多项式时间复杂度”与实际计算的“多项式时间”的本质区别(见博文: 对“多项式时间复杂度”的误解 )!从而,把P认为是一类可计算问题,而NP是另一类可计算问题,NP由此失去了“不确定性”的本质(见博文: NP是可计算的吗?- “问题”的分类 )。 在这种意义上,我们或许也可以说,“流行的算法理论:不确定性的消失”!但是,这里的“不确定性的消失”是一种认知的迷失,而克莱因所说的“数学:确定性的消失”的困惑,实际上是一种认知的觉醒。正如克莱因在书的开篇所说: -战争、饥荒和瘟疫能引起悲剧,然而,人类思想的局限性也能引起智力悲剧。(There are tragedies caused by war, famine, and pestilence. But there are also intellectual tragedies caused by the limitations of the human mind.)
个人分类: 不确定性问题和算法讨论|4186 次阅读|9 个评论
“判断”的层次
热度 1 liuyu2205 2015-1-7 18:15
“判断”是人最基本的思维活动之一。 于汉字(汉字基因): 判═半刀,分也,辨也,斷也; 斷═絲斧,使不連續,折也,判也,絕也,無也。 判斷者,分辨後令之不再連續也。 按西方哲学的传统观念,也是人们现在普遍接受的观念,人的思维活动包括:概念、判断、推理。为此,我们引用在西方语言、逻辑学中占有重要地位的书“Grammaire générale et raisonnée(普遍唯理语法),Antoine Arnauld (1612-1694)和Claude Lancelot (1615-1695)”中一段话: Tous les philosophie enseignent qu'il y a trois opérations de notre esprit: concevoir, juger, raisonner. Concevoir, n'est autre chose qu'un simple regards de notre esprit sur les choses, soit d'une manière purement intellectuelle, comme quand je connaît l'être, la durée, la pensée, Dieu; soit avec des images corporelles, comme quand je m'imagine un carré, un rond, un chien, un cheval. Juger, c'est affirmer qu'une chose que nous concevons est telle, ou n'est pas telle: comme lorsqu'ayant conçu ce que c'est que la terre, et ce que rondeur, j'affirme de la terre, qu'elle est ronde. Raisonner, est se servir de deux jugements pour en faire un troisième: comme lorsqu'ayant jugé que toute vertu est louable, et que la patience est une vertu, j'en conclus que la patience est louable. “所有的哲学家都教导说,我们头脑中有三类活动,即:概念、判断、推理。 概念,指我们头脑简单地观察事物所得,或者是纯粹抽象的,如当我想到存在、时间、思想或上帝;或者是有形象的,如当我想到一个正方体、一个圆形、一只狗或一匹马。 判断,指断定我们构想的事物是这样的或者不是这样的,如当我构想什么是地球和什么是圆形以后,对地球作出判断,认为地球是圆的。 推理,是运用两个判断来求出第三个判断,如当我判断一切美德都是值得赞扬的,并且耐心是一种美德,就得出结论,耐心是值得赞扬的。” 也就是说,按一般的理解,“判断”指对事物的某种性质进行肯定或否定的断定。但是如果我们仔细推敲,就会发现“判断”是有层次之别的。 比如,一个人早上起来,对“昨晚是否下雨”进行判断,若他看到地上有雨水等现象,可肯定:“昨晚下雨了(yes)”,或否定:“昨晚没下雨了(no)”。 他还可以对“明天是否下雨”作出判断,若借助天上压得很低的云等现象,他可断定:“明天下雨(yes)”,或者:“明天不下雨(no)”。 但是,这二个判断却有本质的区别。于前一判断“昨晚是否下雨”,事件已结束, 结果 已形成,故能与 结果 对照,验证 判断的 “对错 / 真假 ”,故此判断是“确定性”。但于后一判断“明天是否下雨”,因 事件仍在进行中, 结果 尚未形成,无 结果 可对照,以验证其“ 对错/ 真假”,故此判断是“不确定性”的。 在P问题和NP问题中,涉及到的正是这二种本质完全不同的“判断”,但因人们忽视了二者的本质区别,造成了现今理解“NP问题”的困难,故我们称之为“不确定性的困惑”。
个人分类: 不确定性问题和算法讨论|3819 次阅读|3 个评论
‘有效市场理论’批判
热度 1 TUGJAYZHAB 2014-2-6 12:55
有效市场理论学习与批判 有效市场理论: “ 1964 年奥斯本提出了 “ 随机漫步理论 ” ,他认为股票价格的变化类似于化学中的分子 “ 布朗运动 ”( 悬浮在液体或气体中的微粒所做的永不休止的、无秩序的运动 ) ,具有 “ 随机漫步 ” 的特点,也就是说,它变动的路径是不可预期的。” 在多元数据分析中,我一般不接受‘随机’、‘混沌’的前提假定,认为那是一元实数对多元世界的畸解。我们大家都同意客观世界是多元的。多元世界 的 真实、正确的投影应该是‘多维空间’的、‘多元向量’的。多元的客观世界在一维数轴上的投影一定会有畸变,缺失,因而有时会显得不可理解,神秘。这是正常的。认为在一维空间,永远能够解释多元世界才是不正常的,不可能真实的。 在反映真实的多维空间里,股票市场不是‘随机系统’,而是有波动的‘确定性系统’。简单用实例说明如下。见表: A B C D E F G 1 Symbol 4-Feb %_4 5-Feb %_5 Trend_5 Expectation 2 AKREX $19.93 0.0128 $19.92 0.0129 1.0039 1.0 3 BREFX $21.63 0.0139 $21.50 0.0139 0.9984 1.0 4 DIA $154.08 0.0993 $154.18 0.0998 1.0051 1.0 5 ETGLX $22.78 0.0147 $22.50 0.0146 0.9921 1.0 6 FBALX $22.19 0.0143 $22.14 0.0143 1.0022 1.0 7 FBIOX $201.89 0.1301 $196.91 0.1275 0.9797 1.0 8 FBMPX $76.25 0.0491 $76.53 0.0495 1.0081 1.0 9 FBSOX $35.23 0.0227 $35.06 0.0227 0.9996 1.0 10 FCNTX $92.53 0.0596 $92.32 0.0598 1.0022 1.0 11 FCYIX $31.67 0.0204 $31.56 0.0204 1.0010 1.0 12 FDCPX $71.35 0.0460 $71.14 0.0461 1.0015 1.0 13 FDLSX $126.15 0.0813 $125.36 0.0812 0.9982 1.0 14 FFNOX $34.20 0.0220 $34.16 0.0221 1.0033 1.0 15 PVSAX $35.20 0.0227 $35.22 0.0228 1.0050 1.0 16 FGRTX $14.56 0.0094 $14.57 0.0094 1.0051 1.0 17 FHKCX $31.72 0.0204 $31.33 0.0203 0.9921 1.0 18 FIEUX $36.99 0.0238 $37.10 0.0240 1.0074 1.0 19 FIGFX $10.49 0.0068 $10.50 0.0068 1.0054 1.0 20 FLCSX $26.11 0.0168 $26.11 0.0169 1.0044 1.0 21 FSCHX $136.45 0.0879 $136.84 0.0886 1.0073 1.0 22 FSDPX $80.02 0.0516 $80.16 0.0519 1.0062 1.0 23 FSRPX $80.56 0.0519 $81.05 0.0525 1.0106 1.0 24 FTQGX $19.71 0.0127 $19.65 0.0127 1.0014 1.0 25 FWRLX $10.08 0.0065 $10.04 0.0065 1.0005 1.0 26 FWWFX $23.90 0.0154 $23.86 0.0154 1.0028 1.0 27 GASFX $26.46 0.0171 $26.25 0.0170 0.9965 1.0 28 JAGLX $45.12 0.0291 $44.69 0.0289 0.9949 1.0 29 SPHIX $9.35 0.0060 $9.35 0.0061 1.0044 1.0 30 VICEX $27.57 0.0178 $27.30 0.0177 0.9946 1.0 31 WAIGX $27.33 0.0176 $27.33 0.0177 1.0044 1.0 32 SUM $1,551.50 $1,544.63 0.9956 其中: A2:A31 是我们在《科学网》用‘多元向量乘法群’指导的投资实验所用的 30 个基金的代码。 B2:B31 是 30 支基金昨天,二月 4 日星期二,的收盘价,从网上下载取得。 B32 是这 30 支基金价格的代数和,我们命名为‘市场价格和 4 ’。 C2:C31 是这 30 支基金被‘市场价格和 4 ’除得的商。命名为‘基金价格百分比 4 ’。 D2:D31 是 30 支基金今天,二月 5 日星期三,的收盘价,从网上下载取得。 D32 是这 30 支基金 5 日价格的代数和,我们命名为‘市场价格和 5 ’。 F32 是两‘市场价格和’的比值。0.9956表示市场微微有下跌。 E2:E31 是这 30 支基金价格被‘市场价格和 5 ’除得的商。命名为‘基金价格百分比 5 ’。 F2:F31 是连续两天, 4 日和 5 日,相应‘基金价格百分比’的商,命名为‘多元演替系统即时变化趋势’,简称‘趋势’,小数点后精确到第 4 位。(注意:这里用到了多元向量的除法。分量的商做商的分量。) G2:G31 同样是趋势值,但小数点后只取一位。我们命名它为‘市场百分比变化期望值’。我们看到 30 个基金的‘期望值’都等于 1.0 。 可能以上的数学表述上比较粗糙,不够严密。但,通过以上实例讨论,我希望大家可以看出:‘股票市场百分比’的变化率的期望值是一。所以,股票市场是‘有波动的确定性系统’,至少是‘确定性在邻域’的系统,而不是‘随机系统’。只因为它有波动,便称其为‘随机系统’,认为其不可预测是不够严密、不够妥当,不科学的。换句话说:“不是股市太狡猾,而是我们的功力还不到家”。以实数为基础的数学工具,无论统计、博弈,...都难以揭示多元股市运动的奥秘。股市运动的奥秘呼唤着‘多元向量乘法群’的出现。 待续。 相关阅读:《关于‘有效市场理论’》 : http://blog.sciencenet.cn/blog-333331-764128.html
个人分类: 十四十五|1767 次阅读|8 个评论
随笔,随机性 确定性
penghit 2012-9-8 20:44
世界具有随机性么?还是它是确定的? 认识的不全面? 一直疑惑。从前一直以为,世界一定是确定的,我们看到的随机性仅仅是因为我们看问题的局限性造成的,例如,一个硬币是正面还是反面问题,如果我们把当时的所有的物理条件都整理出来,那么是不是可以建立一个精确模型来预测投出硬币的正反面。我们看到的随机问题,仅仅是因为认识的不全面,可是,问题是,我们能真正的做到全面认识么?! 主成分,非主成分因素 任何一个问题的影响因素都是几乎无限维,或许我们可以找到该问题的主成分,但是,非主成分并不是就不对问题造成影响,或许影响因子在小数点后面一万位,那么由主要因素(主成分)推论出的结果就会存在一定的偶然性。简单系统的这种偶然性可以忽略不计。但是对于复杂系统,即使是主成分也会有非常多个维度,对于这样的系统,常常存在我们熟知的蝴蝶效应,即使是某个维度的微小差异,在一定时间后也会严重影响最后的预测结果,这时候,非主成分因素就是不可忽略的了。 我的想法是确定的么? 每当意识到这个问题,总感到一股寒意,记录这一刻身体内所有原子的物理状态,例如:位置,组合方式,以及所受力的大小和方向,下一刻的所有分子的物理状态将由这一刻的完全决定。我们一切的所想,所做,仅只是原子作用的结果,而与我们的意识无关,意识只是名义上的控制者,一切只是自然规律的傀儡。“我”只是自己的旁观者,像看电影一般并不能改变银幕里的一丝一毫。(很消极,很消极) 跑题了,想说的其实是这个世界时虽然可能是确定的,但是可见的世界是有限随机的,我们可理解的世界是有限随机的,存在于我们脑海里的世界是有限随机的,一切的一切都是有限随机的,虽然有随机性,但是又有一定的规律性(统计意义上,而且不同条件规则可能不同,即不同条件下一个物体有不一样的性质),整个自然界就是建立在有限随机上,宏观的无机自然界沉淀了更多规则,使随机性相消而更加看上去有规则,宏观的有机自然界则以一定的形式将具有随机性的规则进行组织和合理利用,使得宏观的的有机自然界有更复杂的随机性和随机中呈现的规则性。 不成熟的言论.... 慎观!
3308 次阅读|0 个评论
申请数学模型鉴定
热度 2 TUGJAYZHAB 2012-7-11 05:35
中国数学会内蒙古分会 ( 内蒙古自治区数学学会 ) 内蒙古大学数学科学学院 负责老师 我叫白图格吉扎布,内蒙古大学李博先生 (1929-1998) 的研究生,想先咨询一个数学问题。在现有的数学教科书里,‘多元向量除法’是否空白?据 1978 年高等教育出版社《数学手册》,向量只有点乘和差乘,不封闭,所以没有逆,不能做除法。为了满足草原生态监测的需要,我比照向量加法的定义(分量的和,做和的分量), 定义了多元向量的乘 / 除法( 1995 , 233 页) :‘分量的积 / 商,做积 / 商的分量’。这样,我把四则运算从‘实数’扩展到‘多元向量’,使我们的研究领域从一根‘数轴’扩展到‘多维空间’,可以监测多元系统的动态: 若,一个多元演替系统(如草原)的状态可以用多元向量(多维变量空间的实体)表示,并有连续的观察值,则‘后、前状态向量的商’是系统的‘状态转移’。依据 ‘确定性在邻域’的假定,‘记忆消退’地使用历史数据可以形成一条非马时间链, 来分析系统(草原)的动态。 以上思路被总结归纳成四个基本公式,并被命名为‘超球面模型’( 1995 , 45 页) : Y ( i,k+1 ) = /2 T ( i,k ) = Y' ( i,k ) / Y' ( i,k-1 ) Y' ( i,k ) = Y ( i,k ) /| Y ( k ) | | Y ( k ) |=√(Σ( Y ( i,k ) ^2)) 其中, Y ( i,k ) , T ( i,k ) ,和 D ( i,k ) 是双下标变量。第一下标 i=1,2,…m ,标识分量,第二下标 k ,标识时间。对于确定的时刻, Y , D , T 是 m - 元向量, m 维空间的实体。 Y ( i,k ) 是给定时刻的草原状态 ( 多数情况下第一下标可以省略不写 ) 。 T ( i,k ) 给定时刻的系统状态转移,又称系统演替趋势。 Y ’ ( i,k ) 是草原在单位超球面上的投影。 D ( i,k ) 是草原在给定时刻的观察值。 | Y ( k ) | 是给定时刻的向量长度,各分量的平方和的算术根,标量。 第二个问题:在发表模型时,我是中国农业科学院草原研究所派出的访问学者,美国科罗拉多州立大学( CSU )的博士后。我用自己硕士论文( 1981 , 1 页) 的英文摘要与 CSU 交涉,推动 学校出具备忘录,承认模型的知识产权属于内蒙古大学,中国( 1994 , 296 页) 。 中科院阳含熙院士和应用数学所王寿仁两位教授,在模型研发早期曾经给予鼓励、赞许和关键的指点( 1995 , 45 页) 。如果超球面模型能通过贵院、学会的科学鉴定,确定成立,并有应用价值,我愿意捐出知识产权,实现模型的‘叶落归根’,以推动我本人的叶落归根。请学会或学校有关部门、有关领导就知识产权的转移问题,予以接洽、鉴定、审查、接收为盼。 白图格吉扎布 博士 tjbmdsm@yahoo.com ( 0471 ) 5297714 15560905072 主要参考文献: 白图格吉扎布, 2006 ,趋势分析及其在生态股市中的应用。北京,民族出版社。 《数学手册》,1978,高等教育出版社。
个人分类: MDSM 通讯|2837 次阅读|8 个评论
超球面模型第八讲 白-杰时间链(1)
TUGJAYZHAB 2011-9-28 22:29
超球面模型第八讲 白-杰时间链(1) 原名‘上帝不掷骰子’ 要点:确定性在邻域,杰 - 白滤波,终点再做起点,加权两个信息来源,减小取样规模,提高精度,减少误差,贡献和方差成反比,展开时间链,保留记忆,记忆消退,白-杰时间链。 ‘上帝不掷骰子’/浅议混沌 - 学习武老师 ‘漫谈混沌’的 体会。 因为自己做的是‘草原系统动态监测’的研究,所以对‘偶然性’‘随机’‘混沌’等提法有本能的排斥。但由于自己对‘混沌’等所知甚少,一直没有轻易发言。学术讨论讲对等。要在相应的场合,对相应的问题、作者,对人家的理论有相应的了解才好发言。武老师在科学网转载了他的文章‘漫谈混沌’,使我有机会学习,有机会议论所谓的‘混沌’。虽然我是生物专业出身,数学力学底子不够,实在达不到武老师的档次。但这一点似乎可以变通。因为我们都接受公理系统,承认高级的理论是由一些基本的公理推导出来的,所以高级的理论不能违背基本的逻辑。如果我认为武老师的文章违背了基本逻辑,违背了基本的运算法则、常识,也还是可以勉强发议论的。 武老师在文章中,引用庞卡莱的话说:...‘最大的偶然性是伟大人物的诞生。两个生殖细胞的相遇,不同性别的相遇纯粹出于偶然性。 … 只要精子偏离十分之一毫米,拿破仑就不会出生,欧洲大陆的命运就会改观。’ 对拿破仑我不太了解,但年轻时比较认真地学过《毛泽东选集》。拿我们比较了解的毛的成长为例,我不认为是‘两个生殖细胞的偶然’相遇造就了毛伟人,而是国共两党几十年的斗争造就了毛伟人,而且不止造就了一个毛,而是造就了彭,周,刘,朱,和蒋等一批伟人。这么多‘偶然性’和起来应该就不再是偶然性了。 所以拿‘偶然性’来解释世界,远不如拿‘确定性’解释世界合适。因为,据爱因斯坦:‘上帝不掷骰子’。 最后现象的巨大差别不是由初始条件的微小差别决定的,而是由从初始到最后的‘过程’(中所受外力)决定的。 忽视过程,不掌握全部的信息,只看初始和结果,便断然否定‘确定论’,用莫名其妙的‘混沌’‘随机’‘偶然性’来随意解释世界是不妥的。 从事科学研究的前提是:假定客观世界的变化是有规律的,是可以认识的。确定某项事物‘混沌’、‘随机’、‘偶然性’、‘没有确定性’以致不可认识,是需要严格证明的,而不能是‘我们不能预测’‘我们无法认识’的托词。我们不能‘预测’,应该从自己找原因,从研究方法上找突破。‘不能预测’很可能是我们研究得还不全面,不深入的缘故。比如,用一维的‘标量(实数)’研究多元系统的动态,很可能是我们不能预测的原因之一。我们在一维世界里,根据世界在一维数轴上的投影,要推断多维世界里发生事情的原委,是在碰运气,能看明白是很幸运的。就好比用黑白照片去记录、认识五彩缤纷的世界是有很大局限的。武老师文章中提到的拉普拉斯(1749-1827)用‘向量’表示‘系统’的思路值得我们效仿。 我们要把‘混沌’等先放在一边。待我们进入多维世界后,仍然不能认识、预测时,再来启动‘混沌’也不晚。 未完待续。下一篇: 议拉普拉斯向量方程。 超球面模型第八讲的链接: 白-杰时间链( 1 ) ‘ 上帝不掷骰子 ’ 白-杰时间链 ( 2 ):议拉普拉斯向量方程 白-杰时间链 ( 3 )确定性在邻域(上) 白-杰时间链( 3 )确定性在邻域(下) 白-杰时间 链( 4 ) 白-杰时间链推导 超球面模型第八讲( 5 )两不同来源数据的不同权重 武际可, 漫谈混沌 http://blog.sciencenet.cn/home.php?mod=spaceuid=39472do=blogid=480766
个人分类: 第八讲|2230 次阅读|1 个评论
幂律之类的分布律是确定性与随机性的协奏曲
热度 2 zhangxw 2011-8-24 11:15
幂律之类的分布律是确定性与随机性的协奏曲 张学文, 2011/8/24 很多群体(自然的、社会的)中的统计分布显示着明显的规律性。大家熟悉的幂函数分布(所谓幂律)是例子(如最近的大学生运动会成绩分布),所谓正态分布或者负指数分布等也是例子。 为什么一些统计分布律巧好是这样而不是别的? 从最大熵原理,我称为最复杂原理,配合上 1 , 2 个约束条件就可以获得理论说明。这些在我写的《组成论》里做了比较系统的解释。即幂率之类的分布规律是熵原理的一种体现。 但是这个说法可能让一些人不容易了理解。现在我们依然宣传这个原理,但是换为下面的语言: 自然或者社会的统计分布规律背后体现着确定性约束和天然存在的随机性一种协奏结果,如果该现象中真的确定性约束仅有一个(再无更多的),而且它是该变量的几何平均值不能变化;而其随机性是最大任意性(熵最大),那么其分布就仅能(所以)是幂律。 这样我们就看到确定性与随机性在该事物中都起到自己的作用,而它们协奏的结果是幂律! 如果把确定性从几何平均值不变改为代数平均值不变,那么协奏曲(统计分布律)就是负指数分布。如果确定性的约束是几何平均值与代数平均值都不变(两个确定性),那么它们与随机性的协奏曲就是所谓G AMMA 分布,如果是方差确定不大变化,则是正态分布等等。 这种认识就把确定性与随机性放到了大家协作的地位了。 牛顿力学本身是完全的确定性,没有随机性,而统计分布函数体现着确定性与随机性的协奏。
个人分类: 组成论|3134 次阅读|4 个评论
因为时间连续
pingguo 2011-4-1 13:57
多少人曾问,为何宇宙如此和谐?人回答不了,只好引入神来回答:因为神在背后。能否稍微改进一下这个回答:因为时间连续,神在时间背后。 假如时间是间断的——时间间断,意味着——某一时刻的物质、能量、信息将会突然失踪或者如同幽灵一般地到来(无缘无故地增加或减少)。物理世界众多守恒定律,显然不支持这个假设。 尽管物质世界充满了偶然性,因为有时间这个最后的连续性,使得这些偶然性都无法逃离到数学之外,如同物质无法逃离到宇宙之外一样。 时间连续意味着物质世界在根本上具有确定性 ,而确定性正是数学的灵魂。它是人的思维具有确定性的根据,所有的概念、定义——作为认识的基础——乃是因为对象具有确定性的缘故。没有这个确定性,逻辑、哲学、意识等等,都将失去生长的土壤。 谈到思维或意识的确定性,我们几乎可以去谈论人类社会所具有的某种确定性了。 这里或许有一个问题:时间连续,它在数学上的意义与它在物理世界的意义是否有所不同? 此外,确定性要求物质、能量、信息本身是一致的。我们只能在此意义上谈论可知或不可知。 2011-04-01
个人分类: 随笔|2862 次阅读|0 个评论
整体论的最高境界,以及确定性的把握
sheep021 2010-7-14 12:42
经常说整体论,天人合一论,但一直没有深刻体会,刚刚在回复二傻师兄的评论时: 当你自己的【心】与世界的【心】融为一体时,世界要怎么变化,你还能不确定吗? 突然醍醐灌顶(不知道是否真的,还是自己的幻觉):原来如此!方想起《黄帝天机经》中的一句话:宇宙在乎手,万化生乎身。天性,人也;人心,机也。 把握宇宙的确定性,人心是【机】哦。否则,交友不交心,见人不见心,相互打哑谜,能确定吗? 庄子:天地与我并生,而万物与我为一 原来是心的融合。(得道的)人心与天心(道心)融为一体,彼此不分你我。 而普通人的心为了不能与天心交融为一体呢? 因为 人就是奴隶,作为他人的奴隶,作为物的奴隶,更作为某种思想文化的奴隶。可以借用精神控制一词。精神控制的本意是某个人利用某种说教对他人进行控制。这里的精神控制是指每个人都不自觉地处在某种思想文化的严重束缚中。也就是迷信和崇拜。至少人是习惯的奴隶。什么是习惯,习惯是一种心理。【 张檀琴 语 】 所谓的开悟、得道就是对精神控制的破执。 只有 破执这个精神枷锁之后,才能心心交融,天人合一。 其实,这些已经包含在 一体同观,不二法门 一文中,只是当时尚未有深刻体会。 至于如何实现天人交心,天人合一,佛家和道家有各自不同的方法,甚至每家都有多种不同的方法。 谢谢隔壁家的二傻子师兄,不愧是天狼星的特使! 也谢谢 张檀琴 老师。 整体论的最高境界到底什么样子呢? 如何把握宇宙的【确定性】呢? 《老子》说了: 孔德之容惟道是从。道之为物惟恍惟惚。惚兮恍兮其中有象。恍兮惚兮其中有 物。窈兮冥兮其中有精。其精甚真。其中有信。自古及今,其名不去以阅众甫。吾 何以知众甫之状哉!以此。
个人分类: 生活点滴|802 次阅读|11 个评论
用一篇论文启发大家发现局限性
wangyong77 2009-3-13 20:37
信息论的局限性及其根源分析 注意:这个版权我是要的,写出的论文我一般都是要投稿的,所以,注意我前面提到的不要的是针对没有整理成另外的。 1. 引言 香农(Shannon,又译仙农、申农)的信息论是针对通信问题的,对于现实中的信息问题并不一定非常适用 ,后人将他的信息论称为狭义信息论,而对应的广义信息不仅研究通信问题,还研究其他与信息有关的领域。针对广义信息,一些学者提出了全信息理论、广义信息论、统一信息理论等 。这些理论认识到了狭义信息论的某一些局限性,但是,并不能解决所有的信息论局限问题,本文试图从新的角度来分析狭义信息论的局限性。 2. 香农信息论针对现实信息问题的局限性 目前被认识到的香农信息论的局限性主要有如下几点:第一,信息论仅仅考虑到了随机不确定性,而没有考虑到信息表示中集合的局限性和信息的模糊性等不确定性,针对这一问题,一些学者提出了模糊集、粗糙集理论。第二,信息论没有考虑语义和语用,一些学者认为这是信息论的局限性的主要根源 。国内钟义信就提出包括语法信息、语义信息和语用信息全信息理论 。 笔者也发现信息论存在如下局限性:第一,信息论没有考虑信息的可靠性问题,而现实中的信息大多数都是不可靠的。而信息的可靠性却是信息价值的前提,比如情报类信息的可靠性就非常重要。信息的可靠性是信息的主要指标,但是信息论没有考虑,仅仅是考虑到信息的不确定性。第二,信息的完备性问题,信息论并没有考虑信息并不完全发送的情况,而现实中许多信息都是不完全(完备)、片面的,需要融合。在没有更加完备信息的场合下,人们往往权宜地将片面的信息姑且当作全面的信息来对待,这种情况下,可以认为不完备的信息相对于完备的信息而言是不可靠的 。第三,在信息论中一些简单的信道并联和串联可以合为一个信道,比如简单的两个串联信道的信道矩阵可以直接通过相乘而当作一个信道,但是信息论没有考虑信息复杂的多重传递,比如,信息从一个信源传递到中间信宿,而中间信宿又转发给一个最终信宿,而且在这个转换的过程中,信息的表示发生了改变,在这种多重传递的过程中,可能会产生多重不确定性。现实中的信息往往需要经过这种多重传递,导致多重不确定性。比如,当然如果考虑前面提到的模糊集合等,这种多重不确定性性将更加复杂。信息论没有考虑到信道矩阵的传递概率等参数的复杂性。现实中这种传输特性可能不是确定不变的,而可能是随机变量,甚至可能更加复杂。第四,信息论中以通信为研究对象,其传输的信号本身是确定的,然而现实中却存在许多不确定性问题。在通信中,定义信息为消除不确定性的东西无可厚非,但是面对本身不确定的信息,我们如果去消除其不确定性,只会导致信息失真,这是舍本逐末的。量子信息论就是对经典信息论的一种推广,量子比特除了是0和1外,还可以是0和1中间的一个叠加态。在文献 中,考虑了信息的可靠性问题,指出信息的可靠性比确定性更加重要,现实中,人们也是宁可选择不确定,但是可靠的消息,也不会选择不可靠而确定的消息。第五,信息论中的条件相对而言是简单的,而且多是以条件概率来表示的。然而现实中许多中的信息的条件是比较复杂的,比如,给出的条件可能是知识、规律等等,在已知先验概率的情况下,又得知某一个规律,通过这个规律并不能简单得出相应的条件概率来。第六,信息论用先验概率来表示已知的信息,然而,现实中,许多已知的信息并不是可以用先验概率来表示,比如可能包含未知数,可能是某个约束条件,可能是某个规律,甚至可能是完全未知的。第六,信息论由于不考虑语义,没有考虑到信息可能本身都是不相容的,自相矛盾的。现实中,有大量的信息可能是不一致和矛盾的。 3. 信息的实例分析 针对以上局限性,为了让问题更加明朗,可能通过举例来分析: 例子一:发送者给接收者发送重要情报:某两国即将开战。从信息论而言,这本身是一种信息量很大的信息,但是如果这个消息不正确,可能它就会造成很大的祸害,人们更加看重消息的可靠性,如果信息不可靠,通信是无意义的,信息的价值也不存在。信息论只是力图保证接收者接收到的消息是原来的消息,而对来自于信源的信息是否真正可靠,并没有进行研究。若以上信息不可靠,则两国开战的概率可能不是 1,而是介于0和1之间,这样概率值本身具有随机不确定性。为了不至于将概率的不确定性和信息的不确定性混淆,可以假设发送的情报改为:某两国即将开战的概率为0.7。如果这个情报不绝对可靠,则可能这个概率值不是0.7,而是在0.7附近,此时概率本身不是确定的,值0.7可能只是平均。这种可靠性问题还可能更加复杂,比如除了针对于是否开战可能不可靠外,还可能针对主语有不可靠的可能性,比如,可能不是两国,而是三国,或者两人等等。 例子二:某一事件 m的概率是由一些条件确定的,假设这些条件是c 1 ,c 2 ,,c n ,且假设事件m的概率可以表示为 P(m)= f(c 1 ,c 2 ,,c n ) 假如我们只是对于条件 c 1 未知,其他均已知,或许可以根据条件c 1 的概率分布,求出P(m)的平均值。针对具体的情况,条件c 1 却是已知且确定的,但是在未知该条件的情况下,我们只有权宜地利用该条件未知情况下的平均的概率值来代替真实的概率,这种情况下,两个概率值虽然相近,但是并不等同。当用平均值取代具体的某一值的时候,信息显然不可靠,因此,在本例子中的信息不完备的情况也可以转换为信息不可靠的问题。一般而言,知道的条件越多,条件越完备,得出的概率就越可能接近条件完备的情况下的概率,进而信息也越可靠。本例子的情况可能更加复杂,比如,m的概率在所有的条件都确定的情况下,依然可能是随机变量,好比量子力学中的测不准原理并不是因为隐参量的存在或者量子力学的不完备,而是一种自然的不确定性。 例子三:通过几次实验来测试某一事件 m发生的概率,当已知条件t:实验结果为P t (m)=0.7的情况下,我们并不能知道此条件下事件m发生的概率P(m∣t),只能确定P(m∣t)是在0.7附近的一个随机变量,如果一定要将该随机变量用固定的值0.7代替,该值就会带来可靠性的问题。概率论和信息论中都频频出现联合概率分布和条件概率,但是并没有说明许多条件下,条件概率或者联合概率分布中的概率值本身可能是随机变量,或者部分未知,甚至完全未知的。这样容易导致本来概率值不确定,但是却将不确定的概率值当作确定的概率值。 例子四:某生考试成绩一向非常理想,得优秀的概率为 0.875,但是在一次考试之前,因为生病而耽误了功课,所以其得优秀的概率会下降,假设降到0.75。在未知考生生病和耽误功课之前,我们知道的先验概率的不确定性要小于知道耽误功课以后的后验概率的不确定性。从信息论角度看,后者的信息量反而减少了。现实中,人们并不会因为先验概率不确定性小而选择它,而是会选择条件更加完备的情况下的后验概率,因为它更加贴近实际。这一点说明,以不确定来度量信息是受到限制的,这对于本身不确定的问题是不适用的,此外也说明信息需要有度量其可靠性和完备程度的指标,而且这一指标比度量信息不确定性的信息熵更加重要。 例子五:甲从乙处得到情报:敌人明天早晨百分之九十九要发动进攻。此后,甲同样从丙处得到相同的情报。从信息论角度来看,对于问题敌人明天早晨是否要发动进攻,不确定性是一样的,因而信息量一样,丙似乎并不提供新的信息。但是人们依然会感觉从丙处得到了信息,这种信息使得甲更加确定敌人明天早晨百分之九十九要发动进攻,这一例子进一步说明信息的可靠性应当是一个度量信息的指标。 例子六:当获得消息所有的事件都是等概率发生的的时候,对这句话的内容是什么,或者对于问题所有的事件发生呈现什么样的概率分布而言,它消除了不确定性。但是对于什么事件将发生情况,不可能是更加确定,信息量不可能增加而只可能是减少。这一点说明信息量仅仅是针对于消息本身的不确定性而言的,而该消息衍生出来的问题的不确定性并不与消息的信息量有必然联系,因此,信息熵这一度量的应用范围也是有限的,并不适合应用在日常的信息问题中。 例子七: Brillouin曾经提出了一个悖论:假如一段信息被以文本形式发送,文本的最后一部分却告诉接收者,说明此前的所有的信息都是不真实的。在这样的情况下,是否有信息被传输?Brillouin建议要关注负信息。在该悖论中,有两部分消息,第二部分消息是对前面的一种否定。笔者认为,这两部分消息前后矛盾的,它们的可靠性都是相对的,但是,在一般情况下,假如发送者是诚实的且没有故意开玩笑,则根据语境和情理分析,后面部分的消息正确的可能性大的多,这种情况下,综合前后部分的信息,可以认为没有发送有用的信息。当然也不能绝对地排除发送者在后面犯错误或者是发错消息的可能性。信息论中,消息的各个符号之间的关联采用冗余来表示,但是,该消息在一般情况下可以从整体上看成是一种冗余的编码,即不可能被发送的编码(发送概率为0的编码),由于通信中时延的存在(如果没有时延存在,一般情况下消息会是自恰的),使得本不相容的,也不可能被发送的信息在一个完整的消息中发送。 通过以上的例子分析,暴露出信息论的一些局限性,为挖掘信息论局限性的根源提供了基础。当然,还有许多局限性在这里不一一赘述。 4. 信息论局限性的根源 由以上例子分析可以得出,信息论没有考虑信息的可靠性,而信息的可靠性是一个非常重要的指标。在通信中,由于消息是确定的,因此,不确定性的消除与可靠性的增加有一定的联系。实际上,我们要消除不确定性是很容易的事情,而香农信息论的消除不确定性是以保证信息的可靠性和完备性为基础的,比如利用纠错码纠错,利用后验概率来增强信息的完备性。假如把信息的确定性当作唯一的指标,抛开信息的可靠性问题,则可以随便确定某一事件的概率为 1,其余事件的概率为0就可以了。再假如,我们把信息的确定性当作首要考虑的目标,其次考虑其可靠性,则我们也可以指定概率最大的事件概率为1,其余事件概率为0。这样首先保证了确定性,可靠性也在一定程度上得到了满足。如果如此,信息论和信息处理就变得相当的简单了。显然现实中人们不是这样的。根据以上多处的分析,可靠度是信息的一个首要指标。 以上的信息的可靠性、完备性以及经典集合的不切和实际都可以归结为对信息的多重不确定性的忽视,比如,在实例分析中,我们发现不可靠的信息,它的信息表示本身是不固定的,其概率值可能是随机变量,不完备的信息也是类似。对于模糊集和粗糙集之类的非经典集合,则可以认为是某一个集合包含的对象不确定而造成的,比如,在粗糙集中,对象 a 可能属于也可能不属于集合X,对象a 是否属于集合X就具有随机不确定性。其中一些不确定性与信息论原有的不确定性叠加起来就可能产生多重不确定性。这里的不确定性除了随机不确定性、模糊不确定性,还可能有更多形式的不确定性,包括某些不完全的约束条件造成的不确定性。可见,对信息多重不确定性的忽视是信息论的局限性的重要的根源。对信息可靠性的忽视也是信息论无法广泛应用的重要原因。鉴于所有的信息都很难可靠和完备,所以我们可以将可靠性和完备性问题总归为信息的相对性问题。实际上,现实中人们很难得出完全可靠的信息,只有权宜地采用相对可靠的信息,当有更加可靠的信息的时候,人们会利用更可靠的信息取代先验的信息。由于可靠性也与概率值的不确定性有关系,对信息可靠性的度量也可以借鉴香农对信息不确定性的度量,然而,计算概率的不确定性会比信息熵的计算复杂,因为概率需要满足更多的约束条件。 从 Brillouin悖论和例子四与例子六可以看出香农信息量公式仅仅是用来度量传输特定信息的时候最少的传输量,在通信场合也一定程度上反映可靠性,但是当考虑信息对应引申出来的意义的时候,信息量大小与消息的意义的确定性和内容的多寡并没有必然关系,且某一信息可能增加其他信息的不确定性,甚至一些信息可能一方面增加一些信息的不确定性,一方面减少另外一些信息的不确定性,比如今天下雨这一信息可能减少今天路上潮湿与否的不确定性,但是也会增加今天学生迟到与否的不确定性。可见,是否需要考虑负信息也是值得商榷的。 当然,信息论也与现实信息问题具有很强相似性,信息论的方法很值得在现实的信息问题的研究中(包括信息的可靠性的研究中)借鉴,比如 Brillouin悖论中的自相矛盾与纠错编码出现错误导致的不一致性很相似,可以类似采用取最大概率事件作为真正发生事件,而当概率都很相近的时候,可以类似删除信道进行信息删除。 总而言之,信息论的局限性是源于信息论是针对通信问题的,其模型本身具有的局限性。当然也与概率论的局限性有关系,由于对概率值随机性和多重随机不确定性研究的不足,使得人们容易陷入概率(包括联合概率分布)就是确定值,而不可能是随机变量, 给定条件就可以得出条件概率等思维定势中,而这些思维定势只是适用于现实概率论问题中的一部分。由于信息论的这些限制条件能够较好地满足通信问题,使得它能够在通信领域得到成功的应用,而推广到一般的信息领域则需要针对它的局限性解除相应的约束条件。 5. 结束语 本文分析了香农信息论的一部分局限性,通过对其局限性的研究,一方面可以明确它的适用范围,避免对信息论的滥用,将信息论应用在适用的领域。另一方面,可以为推广和借鉴信息论提供方向,比如可以根据信息表示中概率是固定值的局限性改进信息的表示来适应对信息可靠性研究的需要,进而推广信息论。此外,还为概率论的发展提出了新的方向。信息论也与现实中的信息问题有许多的相似性,如前面提到的对信息可靠性和完备性的考虑。这些相似性为借鉴信息论提供了条件。 参考文献 . ,Bell System Technical Journal,27 (1948),379429,623656 Shannon C E. A mathematical theory of communication . 钟义信.信息科学原理 .福州:福建人民出版社,1988. . 鲁晨光.广义信息论 .中国科技大学出版社,1993 . .Contributions towards a unified concept of information .Doctorial Thesis of University Bern,1995. Daniel Federico . 宛天巍, 王浣尘, 张旭,信息测度方法的综述,系统工程理论方法应用, 2005,14(6) . 王勇,香农信息定义分析与改进 ,情报杂志,2008,27(8): 57-60. 信息论的局限性及其根源分析 王勇 (计算机与控制学院,桂林电子科技大学,广西 桂林 541004) E-mail : hellowy@126.com 摘 要: 从新的角度指出了香农信息论的局限性,这些局限性主要体现在对信息的可靠性和完备性的忽视,通过例子分析进一步说明信息可靠性对于度量信息的重要意义。指出局限性产生的根源在于对信息多重不确定性的忽视,以及对概率值本身存在不确定性的认识不足。 关键词: 信息论,通信,可靠性,纠错,概率 中图分类号: G201 1. 引言 香农(Shannon,又译仙农、申农)的信息论是针对通信问题的,对于现实中的信息问题并不一定非常适用 ,后人将他的信息论称为狭义信息论,而对应的广义信息不仅研究通信问题,还研究其他与信息有关的领域。针对广义信息,一些学者提出了全信息理论、广义信息论、统一信息理论等 。这些理论认识到了狭义信息论的某一些局限性,但是,并不能解决所有的信息论局限问题,本文试图从新的角度来分析狭义信息论的局限性。 2. 香农信息论针对现实信息问题的局限性 目前被认识到的香农信息论的局限性主要有如下几点:第一,信息论仅仅考虑到了随机不确定性,而没有考虑到信息表示中集合的局限性和信息的模糊性等不确定性,针对这一问题,一些学者提出了模糊集、粗糙集理论。第二,信息论没有考虑语义和语用,一些学者认为这是信息论的局限性的主要根源 。国内钟义信就提出包括语法信息、语义信息和语用信息全信息理论 。 笔者也发现信息论存在如下局限性:第一,信息论没有考虑信息的可靠性问题,而现实中的信息大多数都是不可靠的。而信息的可靠性却是信息价值的前提,比如情报类信息的可靠性就非常重要。信息的可靠性是信息的主要指标,但是信息论没有考虑,仅仅是考虑到信息的不确定性。第二,信息的完备性问题,信息论并没有考虑信息并不完全发送的情况,而现实中许多信息都是不完全(完备)、片面的,需要融合。在没有更加完备信息的场合下,人们往往权宜地将片面的信息姑且当作全面的信息来对待,这种情况下,可以认为不完备的信息相对于完备的信息而言是不可靠的 。第三,在信息论中一些简单的信道并联和串联可以合为一个信道,比如简单的两个串联信道的信道矩阵可以直接通过相乘而当作一个信道,但是信息论没有考虑信息复杂的多重传递,比如,信息从一个信源传递到中间信宿,而中间信宿又转发给一个最终信宿,而且在这个转换的过程中,信息的表示发生了改变,在这种多重传递的过程中,可能会产生多重不确定性。现实中的信息往往需要经过这种多重传递,导致多重不确定性。比如,当然如果考虑前面提到的模糊集合等,这种多重不确定性性将更加复杂。信息论没有考虑到信道矩阵的传递概率等参数的复杂性。现实中这种传输特性可能不是确定不变的,而可能是随机变量,甚至可能更加复杂。第四,信息论中以通信为研究对象,其传输的信号本身是确定的,然而现实中却存在许多不确定性问题。在通信中,定义信息为消除不确定性的东西无可厚非,但是面对本身不确定的信息,我们如果去消除其不确定性,只会导致信息失真,这是舍本逐末的。量子信息论就是对经典信息论的一种推广,量子比特除了是0和1外,还可以是0和1中间的一个叠加态。在文献 中,考虑了信息的可靠性问题,指出信息的可靠性比确定性更加重要,现实中,人们也是宁可选择不确定,但是可靠的消息,也不会选择不可靠而确定的消息。第五,信息论中的条件相对而言是简单的,而且多是以条件概率来表示的。然而现实中许多中的信息的条件是比较复杂的,比如,给出的条件可能是知识、规律等等,在已知先验概率的情况下,又得知某一个规律,通过这个规律并不能简单得出相应的条件概率来。第六,信息论用先验概率来表示已知的信息,然而,现实中,许多已知的信息并不是可以用先验概率来表示,比如可能包含未知数,可能是某个约束条件,可能是某个规律,甚至可能是完全未知的。第六,信息论由于不考虑语义,没有考虑到信息可能本身都是不相容的,自相矛盾的。现实中,有大量的信息可能是不一致和矛盾的。 3. 信息的实例分析 针对以上局限性,为了让问题更加明朗,可能通过举例来分析: 例子一:发送者给接收者发送重要情报:某两国即将开战。从信息论而言,这本身是一种信息量很大的信息,但是如果这个消息不正确,可能它就会造成很大的祸害,人们更加看重消息的可靠性,如果信息不可靠,通信是无意义的,信息的价值也不存在。信息论只是力图保证接收者接收到的消息是原来的消息,而对来自于信源的信息是否真正可靠,并没有进行研究。若以上信息不可靠,则两国开战的概率可能不是 1,而是介于0和1之间,这样概率值本身具有随机不确定性。为了不至于将概率的不确定性和信息的不确定性混淆,可以假设发送的情报改为:某两国即将开战的概率为0.7。如果这个情报不绝对可靠,则可能这个概率值不是0.7,而是在0.7附近,此时概率本身不是确定的,值0.7可能只是平均。这种可靠性问题还可能更加复杂,比如除了针对于是否开战可能不可靠外,还可能针对主语有不可靠的可能性,比如,可能不是两国,而是三国,或者两人等等。 例子二:某一事件 m的概率是由一些条件确定的,假设这些条件是c 1 ,c 2 ,,c n ,且假设事件m的概率可以表示为 P(m)= f(c 1 ,c 2 ,,c n ) 假如我们只是对于条件 c 1 未知,其他均已知,或许可以根据条件c 1 的概率分布,求出P(m)的平均值。针对具体的情况,条件c 1 却是已知且确定的,但是在未知该条件的情况下,我们只有权宜地利用该条件未知情况下的平均的概率值来代替真实的概率,这种情况下,两个概率值虽然相近,但是并不等同。当用平均值取代具体的某一值的时候,信息显然不可靠,因此,在本例子中的信息不完备的情况也可以转换为信息不可靠的问题。一般而言,知道的条件越多,条件越完备,得出的概率就越可能接近条件完备的情况下的概率,进而信息也越可靠。本例子的情况可能更加复杂,比如,m的概率在所有的条件都确定的情况下,依然可能是随机变量,好比量子力学中的测不准原理并不是因为隐参量的存在或者量子力学的不完备,而是一种自然的不确定性。 例子三:通过几次实验来测试某一事件 m发生的概率,当已知条件t:实验结果为P t (m)=0.7的情况下,我们并不能知道此条件下事件m发生的概率P(m∣t),只能确定P(m∣t)是在0.7附近的一个随机变量,如果一定要将该随机变量用固定的值0.7代替,该值就会带来可靠性的问题。概率论和信息论中都频频出现联合概率分布和条件概率,但是并没有说明许多条件下,条件概率或者联合概率分布中的概率值本身可能是随机变量,或者部分未知,甚至完全未知的。这样容易导致本来概率值不确定,但是却将不确定的概率值当作确定的概率值。 例子四:某生考试成绩一向非常理想,得优秀的概率为 0.875,但是在一次考试之前,因为生病而耽误了功课,所以其得优秀的概率会下降,假设降到0.75。在未知考生生病和耽误功课之前,我们知道的先验概率的不确定性要小于知道耽误功课以后的后验概率的不确定性。从信息论角度看,后者的信息量反而减少了。现实中,人们并不会因为先验概率不确定性小而选择它,而是会选择条件更加完备的情况下的后验概率,因为它更加贴近实际。这一点说明,以不确定来度量信息是受到限制的,这对于本身不确定的问题是不适用的,此外也说明信息需要有度量其可靠性和完备程度的指标,而且这一指标比度量信息不确定性的信息熵更加重要。 例子五:甲从乙处得到情报:敌人明天早晨百分之九十九要发动进攻。此后,甲同样从丙处得到相同的情报。从信息论角度来看,对于问题敌人明天早晨是否要发动进攻,不确定性是一样的,因而信息量一样,丙似乎并不提供新的信息。但是人们依然会感觉从丙处得到了信息,这种信息使得甲更加确定敌人明天早晨百分之九十九要发动进攻,这一例子进一步说明信息的可靠性应当是一个度量信息的指标。 例子六:当获得消息所有的事件都是等概率发生的的时候,对这句话的内容是什么,或者对于问题所有的事件发生呈现什么样的概率分布而言,它消除了不确定性。但是对于什么事件将发生情况,不可能是更加确定,信息量不可能增加而只可能是减少。这一点说明信息量仅仅是针对于消息本身的不确定性而言的,而该消息衍生出来的问题的不确定性并不与消息的信息量有必然联系,因此,信息熵这一度量的应用范围也是有限的,并不适合应用在日常的信息问题中。 例子七: Brillouin曾经提出了一个悖论:假如一段信息被以文本形式发送,文本的最后一部分却告诉接收者,说明此前的所有的信息都是不真实的。在这样的情况下,是否有信息被传输?Brillouin建议要关注负信息。在该悖论中,有两部分消息,第二部分消息是对前面的一种否定。笔者认为,这两部分消息前后矛盾的,它们的可靠性都是相对的,但是,在一般情况下,假如发送者是诚实的且没有故意开玩笑,则根据语境和情理分析,后面部分的消息正确的可能性大的多,这种情况下,综合前后部分的信息,可以认为没有发送有用的信息。当然也不能绝对地排除发送者在后面犯错误或者是发错消息的可能性。信息论中,消息的各个符号之间的关联采用冗余来表示,但是,该消息在一般情况下可以从整体上看成是一种冗余的编码,即不可能被发送的编码(发送概率为0的编码),由于通信中时延的存在(如果没有时延存在,一般情况下消息会是自恰的),使得本不相容的,也不可能被发送的信息在一个完整的消息中发送。 通过以上的例子分析,暴露出信息论的一些局限性,为挖掘信息论局限性的根源提供了基础。当然,还有许多局限性在这里不一一赘述。 4. 信息论局限性的根源 由以上例子分析可以得出,信息论没有考虑信息的可靠性,而信息的可靠性是一个非常重要的指标。在通信中,由于消息是确定的,因此,不确定性的消除与可靠性的增加有一定的联系。实际上,我们要消除不确定性是很容易的事情,而香农信息论的消除不确定性是以保证信息的可靠性和完备性为基础的,比如利用纠错码纠错,利用后验概率来增强信息的完备性。假如把信息的确定性当作唯一的指标,抛开信息的可靠性问题,则可以随便确定某一事件的概率为 1,其余事件的概率为0就可以了。再假如,我们把信息的确定性当作首要考虑的目标,其次考虑其可靠性,则我们也可以指定概率最大的事件概率为1,其余事件概率为0。这样首先保证了确定性,可靠性也在一定程度上得到了满足。如果如此,信息论和信息处理就变得相当的简单了。显然现实中人们不是这样的。根据以上多处的分析,可靠度是信息的一个首要指标。 以上的信息的可靠性、完备性以及经典集合的不切和实际都可以归结为对信息的多重不确定性的忽视,比如,在实例分析中,我们发现不可靠的信息,它的信息表示本身是不固定的,其概率值可能是随机变量,不完备的信息也是类似。对于模糊集和粗糙集之类的非经典集合,则可以认为是某一个集合包含的对象不确定而造成的,比如,在粗糙集中,对象 a 可能属于也可能不属于集合X,对象a 是否属于集合X就具有随机不确定性。其中一些不确定性与信息论原有的不确定性叠加起来就可能产生多重不确定性。这里的不确定性除了随机不确定性、模糊不确定性,还可能有更多形式的不确定性,包括某些不完全的约束条件造成的不确定性。可见,对信息多重不确定性的忽视是信息论的局限性的重要的根源。对信息可靠性的忽视也是信息论无法广泛应用的重要原因。鉴于所有的信息都很难可靠和完备,所以我们可以将可靠性和完备性问题总归为信息的相对性问题。实际上,现实中人们很难得出完全可靠的信息,只有权宜地采用相对可靠的信息,当有更加可靠的信息的时候,人们会利用更可靠的信息取代先验的信息。由于可靠性也与概率值的不确定性有关系,对信息可靠性的度量也可以借鉴香农对信息不确定性的度量,然而,计算概率的不确定性会比信息熵的计算复杂,因为概率需要满足更多的约束条件。 从 Brillouin悖论和例子四与例子六可以看出香农信息量公式仅仅是用来度量传输特定信息的时候最少的传输量,在通信场合也一定程度上反映可靠性,但是当考虑信息对应引申出来的意义的时候,信息量大小与消息的意义的确定性和内容的多寡并没有必然关系,且某一信息可能增加其他信息的不确定性,甚至一些信息可能一方面增加一些信息的不确定性,一方面减少另外一些信息的不确定性,比如今天下雨这一信息可能减少今天路上潮湿与否的不确定性,但是也会增加今天学生迟到与否的不确定性。可见,是否需要考虑负信息也是值得商榷的。 当然,信息论也与现实信息问题具有很强相似性,信息论的方法很值得在现实的信息问题的研究中(包括信息的可靠性的研究中)借鉴,比如 Brillouin悖论中的自相矛盾与纠错编码出现错误导致的不一致性很相似,可以类似采用取最大概率事件作为真正发生事件,而当概率都很相近的时候,可以类似删除信道进行信息删除。 总而言之,信息论的局限性是源于信息论是针对通信问题的,其模型本身具有的局限性。当然也与概率论的局限性有关系,由于对概率值随机性和多重随机不确定性研究的不足,使得人们容易陷入概率(包括联合概率分布)就是确定值,而不可能是随机变量, 给定条件就可以得出条件概率等思维定势中,而这些思维定势只是适用于现实概率论问题中的一部分。由于信息论的这些限制条件能够较好地满足通信问题,使得它能够在通信领域得到成功的应用,而推广到一般的信息领域则需要针对它的局限性解除相应的约束条件。 5. 结束语 本文分析了香农信息论的一部分局限性,通过对其局限性的研究,一方面可以明确它的适用范围,避免对信息论的滥用,将信息论应用在适用的领域。另一方面,可以为推广和借鉴信息论提供方向,比如可以根据信息表示中概率是固定值的局限性改进信息的表示来适应对信息可靠性研究的需要,进而推广信息论。此外,还为概率论的发展提出了新的方向。信息论也与现实中的信息问题有许多的相似性,如前面提到的对信息可靠性和完备性的考虑。这些相似性为借鉴信息论提供了条件。 参考文献 . Shannon C E. A mathematical theory of communication ,Bell System Technical Journal,27 (1948),379429,623656 . 钟义信.信息科学原理 .福州:福建人民出版社,1988. . 鲁晨光.广义信息论 .中国科技大学出版社,1993 . Daniel Federico.Contributions towards a unified concept of information .Doctorial Thesis of University Bern,1995. . 宛天巍, 王浣尘, 张旭,信息测度方法的综述,系统工程理论方法应用, 2005,14(6) . 王勇,香农信息定义分析与改进 ,情报杂志,2008,27(8):57-60.
个人分类: 学术研究|3043 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-3 06:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部