科学网

 找回密码
  注册
科学网 标签 随机 相关日志

tag 标签: 随机

相关日志

概率论与数理统计课堂感想(一)
热度 1 zywsict 2019-6-29 09:17
概率论与数理统计课程感想 2017级网络工程一班杜远东 不知是不是一种错觉,随着年龄的增长我们察觉到的时间就流逝得越快,仿佛昨天才开学,然而今天就已是本学期最后一天,而概率论与数理统计这门课程也上到了最后一节课。 记得刚接触概率论与数理统计这门课的时候直接被书本的厚度给唬住了!心想就一个学期要学这么厚的一本书,还是概率论与数理统计这样的数学内容,觉得自己这门课估计是很难学明白了。但是也抱着一股较劲儿的心思吧,心想再难总不能让自己这门课挂掉吧?于是也一直坚持坐最前面,而且老师上课的风格也不容许我有片刻的懈怠,但是长久以来养成的上课陋习还是让自己即使坐最前面也无法保持长时间的精力集中!所幸在张老师的独特教学方式下———严禁玩儿手机、随机点名回答问题(都与平时成绩挂钩),我还是能在这门课上终有所获!在这里我要对张老师由衷的说一声:“谢谢!张老师确实是我进入华大以来遇到的最负责任的老师了!” 张老师在课堂上教了我们不止是课程内的东西,还有学习习惯以及对自己人生的思考与规划等等,让我在期末复习时即使面对厚厚的一本概率论与数理统计书也丝毫不慌,因为知道这本书的内容看似很多,但每一章与每一章都是有联系的,只要系统化起来整理一遍就会发现其实整本书零零散散的内容就结合成一张网了!而只要我们抓住了这张网,期末考试这条鱼也就只能是我们的囊中之物了!我也会慢慢将这个习惯延伸到其他科目上去,希望自己浪费了两年的大学还有挽救的余地! 最后就是给老师的一点小意见了,希望老师上课的时候能尽量读准确专业名词和公式名称,虽然是一些小瑕疵,但有时候如果公式复杂一点,下面坐着的同学们就要懵了。再有就是老师有时候会给人逻辑混乱的感觉,其实语速放慢点也没关系的!希望老师能继续您的教学风格,严格对待每一届的学生,因为很有可能有个学生就是因为上了老师您的一门课而改变了他原本潦草不堪的人生轨迹!而这个学生也许以后回忆起大学生活,会十分庆幸自己遇到了您!相信老师知道自己无形中拽出了一名即将堕向深渊的学生的时候也会欣慰的吧?在文末请允许我再一次感谢老师!
个人分类: 随机数学课堂感想|5125 次阅读|2 个评论
利用热力学第二定律建造真随机数
sjdkx 2018-12-19 19:20
  利用热力学第二定律的另一表述——熵增加原理可以高效的建造出真随机数组。   数组中的数据达到一定的要求时数据被称为随机数组,首先数组的基本元素是连续的、完整的、均匀的,如果元素有缺失是不能形成随机数组的,表现形式是所有基本元素的数量是相同的,在此基础上就是数组中元素的分布了,顺序排列或部分顺序排列都不是随机的,随机的没有任何规律的排列才是随机数组的特征,真随机也没有什么神秘的只是一些分布状态而已,那就看看如何实现这些排列了,下面是用随机排序建造随机数组的例子: int n1=101; unsigned char ch; int i,j,NN=10240000,NK=1; unsigned char *str; //定义数组指针 str = new unsigned char ; //分配内存 for(i=0;iNN;i++) { str =i%256; //建立顺序数组 } for(j=0;jNK;j++) //随机排序的次数NK { for(i=0;iNN;i++) //随机排序 { n1=i + ( i + n1 + str + str )%(NN-i); ch=str ; str =str ; str =ch; } }   可以看到,共有10240000个元素,基本元素0-255,每种都有40000个。   随机排序是这样进行的,在待排序的数据中随机选择一个数n1,并且交换str 和str 的数值,循环完成后每个元素的序列都发生了变化,就完成了一次随机排序。   数据n1 是随机排序的关键,它拼凑了一些变量来实现数据变化的随机性。   可见NK是决定数组进行了多少次随机排序。我们将分析这些数据来评判这一过程。 现在国际上公认的随机数评价方法是NIST测试共有15种数百个指标,我们的数据在不同的随机排序之后也要使用NIST来检测一下。 10240000字节的NIST检测结果如下:   1)进行一次随机排序的测试结果 近似熵检测ApproximateEntropy = 0.000000 块内频率测试BlockFrequency = 1.000000 累积和测试CumulativeSums = 0.789027 , 0.497647 离散傅立叶变换测试FFT = 0.000000 频率测试Frequency = 0.602193 线性复杂度检测LinearComplexity = 0.572865 块内最长连续“1”测试 = 0.000000 非重叠模板匹配测试NonOverlappingTemplate抽查 = 0.497647 , 0.497647 , 0.497647 , 0.497647 重叠模板匹配测试OverlappingTemplate = 0.000000 随机偏移测试RandomExcursions八点 = 0.000000,0.000003,0.000012,0.060734,0.710044,0.668883,0.645599,0.932786 随机偏移变量测试RandomExcursionsVariant十八点 = 0.016927,0.006212,0.002274,0.000745,0.000511,0.000443,0.000202,0.000921,0.016430,0.288450,0.482328,0.461011,0.499533,0.727773,0.743010,0.748404,0.789161,0.801676 二元矩阵秩测试Rank = 0.000000 游程测试Runs = 0.744299 串行测试Serial = 0.000000 全局通用统计测试Universal = 0.000001   2)进行三次随机排序的测试结果 近似熵检测ApproximateEntropy = 0.887813 块内频率测试BlockFrequency = 0.612131 累积和测试CumulativeSums = 0.716513 , 0.641557 离散傅立叶变换测试FFT = 0.719998 频率测试Frequency = 0.399508 线性复杂度检测LinearComplexity = 0.954226 块内最长连续“1”测试 = 0.300848 非重叠模板匹配测试NonOverlappingTemplate抽查 = 0.641557 , 0.641557 , 0.641557 , 0.641557 重叠模板匹配测试OverlappingTemplate = 0.292812 随机偏移测试RandomExcursions八点 = 0.201590,0.101736,0.064311,0.011157,0.196435,0.423448,0.058816,0.324844 随机偏移变量测试RandomExcursionsVariant十八点 = 0.756369,0.774686,0.943432,0.780585,0.950888,0.982856,0.918993,0.264409,0.019754,0.012870,0.036389,0.094576,0.120530,0.160800,0.305725,0.533384,0.697271,0.811989 二元矩阵秩测试Rank = 0.312437 游程测试Runs = 0.682886 串行测试Serial = 0.327414 全局通用统计测试Universal = 0.050151   3)进行五次随机排序的测试结果 近似熵检测ApproximateEntropy = 0.166503 块内频率测试BlockFrequency = 0.223603 累积和测试CumulativeSums = 0.457242 , 0.571503 离散傅立叶变换测试FFT = 0.675447 频率测试Frequency = 0.889648 线性复杂度检测LinearComplexity = 0.192694 块内最长连续“1”测试 = 0.724479 非重叠模板匹配测试NonOverlappingTemplate抽查 = 0.571503 , 0.571503 , 0.571503 , 0.571503 重叠模板匹配测试OverlappingTemplate = 0.587273 随机偏移测试RandomExcursions八点 = 0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000 随机偏移变量测试RandomExcursionsVariant十八点 = 0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000 二元矩阵秩测试Rank = 0.883535 游程测试Runs = 0.257427 串行测试Serial = 0.494902 全局通用统计测试Universal = 0.477515   4)进行七次随机排序的测试结果 近似熵检测ApproximateEntropy = 0.273182 块内频率测试BlockFrequency = 0.007362 累积和测试CumulativeSums = 0.181577 , 0.174069 离散傅立叶变换测试FFT = 0.450727 频率测试Frequency = 0.984043 线性复杂度检测LinearComplexity = 0.939927 块内最长连续“1”测试 = 0.017737 非重叠模板匹配测试NonOverlappingTemplate抽查 = 0.174069 , 0.174069 , 0.174069 , 0.174069 重叠模板匹配测试OverlappingTemplate = 0.233910 随机偏移测试RandomExcursions八点 = 0.279335,0.134724,0.171779,0.583415,0.562464,0.462367,0.555043,0.260584 随机偏移变量测试RandomExcursionsVariant十八点 = 0.433906,0.400755,0.313842,0.126340,0.049446,0.125783,0.282657,0.467986,0.922114,0.114497,0.078756,0.200369,0.326141,0.286349,0.209493,0.313842,0.412994,0.269445 二元矩阵秩测试Rank = 0.768957 游程测试Runs = 0.487839 串行测试Serial = 0.580894 全局通用统计测试Universal = 0.323612   5)进行十三次随机排序的测试结果 近似熵检测ApproximateEntropy = 0.933483 块内频率测试BlockFrequency = 0.996558 累积和测试CumulativeSums = 0.905719 , 0.932290 离散傅立叶变换测试FFT = 0.167783 频率测试Frequency = 0.968093 线性复杂度检测LinearComplexity = 0.130748 块内最长连续“1”测试 = 0.069903 非重叠模板匹配测试NonOverlappingTemplate抽查 = 0.932290 , 0.932290 , 0.932290 , 0.932290 重叠模板匹配测试OverlappingTemplate = 0.181520 随机偏移测试RandomExcursions八点 = 0.685155,0.392273,0.812459,0.648181,0.063320,0.133137,0.054298,0.264821 随机偏移变量测试RandomExcursionsVariant十八点 = 0.867602,0.733741,0.665665,0.857459,0.951282,0.818494,0.889983,0.565011,0.491866,0.216006,0.115459,0.054066,0.078027,0.148902,0.125131,0.115780,0.169925,0.177808 二元矩阵秩测试Rank = 0.709401 游程测试Runs = 0.032304 串行测试Serial = 0.591065 全局通用统计测试Universal = 0.583741   从结果数据可见,NIST检测的数据是由部分合格到全部合格的发展过程,为什么会有这样的结果,这是自然规律所决定的,也从侧面印证了热力学第二定律的客观性。   用这种方法形成真随机数组是没有问题的,但效率不高,从上面可见,如果n1 算式中引入性能优良的随机函数,那效率将是非常高的,一般一次就能让NIST检测全部通过。   其实NIST检测就那么有用吗?没能通过NIST的数据就不能用了吗?实际是否定的,本质是只要是不能推算的未知数据作用是差不多的。   利用自然定律来实现数据的改造是简单有效的方法,希望你有所帮助或启发。
个人分类: 密码学相关|871 次阅读|0 个评论
关于DNA聚合酶工作机制
richor 2018-7-11 09:37
详见我的博士论文: Phd_Thesis.pdf DNA 聚合酶保真度非常高。实验上发现 , 病毒和大肠杆菌的 DNA 聚合酶的复制保 真度 在生理条件下 可以达到 10 7 – 10 8 , 真核生物 DNA 聚合酶的复制保真度会更高。 大肠杆菌细胞内的 DNA 聚合酶 I 最早被解析出结构 , 基于该 DNA 聚合酶人们做了许多早期工作机制的研究。然而 , 后续的研究发现 ,DNA 聚合酶 I 在 DNA 复制过程的主要功能为后期的修复错误 , 并非催化 dNTP 的聚合。在大肠杆菌细胞内主要催化 dNTP 聚合的是 DNA 聚合酶 III 。该 DNA 聚合酶催化 DNA 聚合的速率可以达到 750 dNTP/ 秒。 由于细菌细胞内的 DNA 聚合酶往往是以合酶的形式行使功能 , 对其工作机制的研究涉及到许多相关辅酶的影响 , 因此 , 人们更多的使用结构上更简单、但具备完整催化聚合功能的病毒 DNA 聚合酶来研究其工作机制。这类 DNA 聚合酶包括 T7 病毒 DNA 聚合酶 ,T4 病毒 DNA 聚合酶 , φ 29 病毒 DNA 聚合酶等。 DNA 聚合酶的工作机制,涉及到聚合和剪切两个过程: 对比具有剪切活性和没有剪切活性的 DNA 聚合酶的保真度 , 可以发 现 , 聚合过程的选择作用可以贡献 10 4 – 10 6 , 剪切过程则贡献 10 1 – 10 3 。 具体模型细节,按历史演化,有以下三种: 最新提出的 c1 模型的细节:
个人分类: DNA聚合酶|5435 次阅读|0 个评论
严重问题:六个重要的英语词被混淆成三个汉语词
热度 3 zhuyucai1 2018-3-23 22:35
(1) Safety, security 被翻成“安全”; (2) Intelligent, smart 被翻成“智能”; (3) Stochastic, random 被翻成“随机”。 这是谁干的?!请科学网的专家改进翻译,为普及科学做贡献。
4364 次阅读|5 个评论
思考题(四十三)麦地里下多厚的雪才能让表面看起来是平的?
qianlivan 2018-1-8 16:34
假设麦苗高度是h=10 cm,那么麦地里下多厚的雪才能让表面看起来是平的(起伏小于1 cm)?
个人分类: 思考|2826 次阅读|0 个评论
[转载]《自发进化》节选(71)
热度 1 罗非 2016-3-21 10:15
进化的解码 自然界真的是分形几何学的某种表达吗?尽管把简单的数学方程引入分形计算机程序,并生成很有现实感的海岸线和生物有机体图像提供了很强的证据,但它并不能证明自然界的本质就是分形的。遍及生物圈的自相似模式的出现,可能其实仅仅是一个巧合。那么问题就变成,“是否有什么功能上的原因,致使生物圈的进化由分形几何学驱动?” 自然界是个动态系统,它建立在迭代过程和混沌数学的基础上,并且很敏感。分形几何刚好适用于为这样一种混沌系统建模,这个事实支持了我们的推测,但仍然没有为自然界为什么应该是分形的提供一个必然的理由。然而,还有另外一个令人信服的、严格地基于数学的理由,它提示在分形几何学和自然界结构之间所观察到的相似性何以不仅仅是巧合。 在历史上,拉马克把进化描述为“转变”,是某种从原始有机体开始向上进步,达到他形容为“完美”的状态的线性过程。在他的模型中,拉马克把进化设想为某种上升的阶梯。达尔文主义者也承认进化是上升的过程,但他们将该过程比之于一棵树。他们认为,大多数的随机变异所产生的新有机体类似于树的侧枝,它们不一定有助于物种的垂直提升。 作为更流行的考虑,我们更乐于给出这样的建议,即进化的道路更像是一朵怒放菊花的外形。各物种会向每一个方向进化,其内在动机是住满所有可用的环境生态位。有机体已经进化到可以住在冰川的冰块中,住在海底的火山口中,住在地面之下好多公里的基岩中,以及这些极端之间的所有地方之中。 在这个菊花模型里,提问“进化去往何方?”是没有意义的。它同时去往每一个方向。要跟踪进化的过程,我们必须先定义一个参数,用它作为尺度来衡量进化的进展。例如,海中生命的进化路径和陆地或者空中生物的进化路径相比有着不同的含义。人类在水中呼吸有机体的进化层次中排名并不高,在卵生动物或飞行动物的进化层次中也同样如此。那么,人类在进化上来说究竟擅长什么呢? 同时作为进化的观察者和参与者,我们选择了进化菊花上的一片花瓣,来代表那个我们觉得可以把自己区别于低等生物的特性,这个特性就是觉察。拉马克在强调神经系统的发展作为其测量进化的尺度时,反映的正是这一特性。同样地,达尔文主义者也把他们的进化树阐释成神经系统的发育不断提高的层级系统。 不幸的是,正如在本书第1章《信者得见》中所总结的,以及在《信仰的生物学》一书中更详细地讨论过的,传统科学对进化的理解,已经由于它误把细胞核及其内含的基因当做细胞的神经系统,而产生了大大的扭曲。由此,当代科学出现了一种短视性的偏见,亦即用测量有机体的基因组作为其进化先进性的代表。 如前面所述,细胞真正的大脑是它的膜。膜结构中内置了感受器蛋白和效应器蛋白,它们既是开关,也代表着感知的可测量的单位。因此,某种有机体的觉察可以通过计算其所拥有的感知蛋白数量,加以物理地量化。 在第12章,《精神良医》中,我们提供的证据表明,因为物理的限制,感知蛋白只能在膜上形成单层。这种物理限制表明,各种感知蛋白的群体数量的增加直接系于有机体膜表面积的增加。换句话说,某种有机体为了增加其感知和脑能,它就不得不增加其膜能。 简单地说,这些洞察揭示出,数学家们有可能通过测绘某种有机体的膜表面积来计算其进化先进性。这要怎么做呢?刊登于《美国新闻与世界报道》的“人生的数学”一文的作者威廉•奥尔曼说,“分形数学研究表明,分形当中分支套分支的重复结构代表着在三维空间内获得最大表面积的最好的方式……”为进化建模需要使用分形几何学,是因为没有了它进化就不会发生。因而,自然界中那些自相似模式的外观不是某种巧合,而是进化数学的反映。 那些美得惊心动魄的,由计算机生成的分形模式,如同这本书的封面上所显示的装饰蝴蝶的翅膀的那些图案一样,它们应该能够提醒我们,尽管我们充满了的现代焦虑,尽管我们的世界看起来混乱不堪,但自然界却存在秩序。而因为这秩序是由自相似的分形模式内在组成的,所以在太阳底下没有什么真正的新鲜事物。 分形几何学的深奥世界提供了一个数学模型,它提示诸如随意性、无计划性、随机性和偶然性这些作为达尔文理论基础的东西,都是已经过时的概念。我们相信,继续支持这些过时的想法代表着对人类生存的根本性威胁,它应当,尽可能迅速地,走上哥白尼时代之前地心宇宙学说同样的道路。 Evolution Decoded Is Nature really an expression of fractalgeometry? While introducing simple mathematical equations into a fractalcomputer program and creating realistic landscapes and images of biologicalorganisms provides stronger evidence, it does not prove that Nature is trulyfractal in character. The appearance of self-similar patterns throughout thebiosphere may, in fact, be merely a coincidence. The question then becomes, “Isthere any functional reason as to why the evolution of the biosphere would bedriven by fractal geometry?” Nature is a dynamical system, founded oniterated processes and chaos mathematics, and subject to sensitivity. The factthat fractal geometry is the specificmathematics to model such a chaotic system supports, but yet again, does notnecessarily provide a reason as to why Nature should be fractal. However, thereis another compelling reason, based strictly on mathematics, that suggests whythe observed parallels between fractal geometry and the structure of Nature aremore than coincidence. Historically, Lamarck described evolutionas transformation, a linear process thatstarts with primitive organisms and progresses upward toward what he describedas “perfection.” In his model, Lamarck envisioned evolution as an ascendingladder. Darwinists also acknowledged an upward progression in evolution, butthey compared the process to a tree. They recognized that most randomvariations that generated new organisms are similar to a tree’s lateralbranches in that they do not necessarily contribute to vertical ascension ofthe species. As a more current consideration, we wouldlike to suggest that the path of evolution most closely resembles the shape ofan exploding chrysanthemum. Species evolve in every direction with the innatedrive to inhabit all available environmental niches. Organisms have evolved tolive in glacier ice, at volcanic vents under the ocean, in bedrock manykilometers beneath the ground, and everywhere in between. In the chrysanthemum model, it makes nosense to ask, “Where is evolution going?” It’s going in every direction atonce. To track the course of evolution, we must first define a parameter to beused as a yardstick to measure evolutionary advances. For example, the path ofevolution of life in the sea has a different meaning than the path of evolutionof life on the land or in the air. Humans do not rank very high in theevolution of water-breathing organisms or in the evolutionary hierarchy ofegg-laying animals or flying animals. So what do humans excel at,evolutionarily speaking? As both observers of and participants inevolution, we have selected a petal of the evolution-chrysanthemum to representa trait we feel distinguishes us from lower organisms, and that trait is awareness.This is the same character that Lamarck used when he emphasized the developmentof the nervous system as his evolutionary yardstick. Darwinists, likewise,illustrate their tree of evolution in a hierarchical ascendance of nervoussystem development. Unfortunately, as summarized in Chapter 1, Believing Is Seeing, and in more detailin The Biologyof Belief , conventional science’s understanding of evolution hasbeen significantly distorted by its faulty misperception that the cell’snucleus and its enclosed genes represent the cell’s nervous system. 5 Hence, science currently has a myopic preoccupation with measuring an organism’sgenome as representative of its evolutionary advancement. As described earlier, the true brain ofthe cell is its membrane. Built into the membrane’s structure are receptorproteins and effector proteins that serve as switches and which represent a measurableunit of perception. Consequently, an organism’s awareness can be physicallyquantified by calculating the number of perception proteins it possesses. In Chapter 12, Time to See a Good Shrink, we provide evidence that, becauseof physical restrictions, perception proteins can only form a monolayer in themembrane. This physical restriction means that an increase in the population ofperception proteins is directly tied to an increase in the organism’s membranesurface area. In other words, for an organism’s awareness to multiply and toincrease its brain power, it would have to increase its membrane power. Simply, these insights reveal thatmathematicians can calculate evolutionary advancement by mapping an organism’smembrane surface area. 6 And how would that be done? According toWilliam Allman, author of the “Mathematics of Human Life,” an article in U.S. News World Report, “Mathematicalstudies of fractals reveal that the repetitive branching-within-branchingstructure of a fractal represents the best way to get the most surface areawithin a three-dimensional space . . .” 7 Modeling evolution demandsthe use of fractal geometry because evolution wouldn’t occur without it.Consequently the appearance of self-similar patterns in Nature is not a coincidence,but is a reflection of evolutionary mathematics. The strikingly beautiful,computer-generated pictures of fractal patterns, such as those adorning thebutterfly’s wings on the cover of this book, should remind us that, despite ourmodern angst and the seeming chaos of our world, there is order in Nature. Andbecause this order is inherently comprised of self-similar fractal patterns,there is nothing truly new under the sun. The esoteric world of fractal geometryprovides a mathematical model that suggests the arbitrariness, planlessness,randomness, and accidents that underlie Darwinian theory are an outmodedconcept. We believe that continued support of these outdated ideas represents afundamental threat to the survival of humanity and should, as rapidly aspossible, go the way of the pre-Copernican Earth-centered Universe.
个人分类: 科普|571 次阅读|1 个评论
[转载]《自发进化》节选(68)
罗非 2016-3-18 09:46
必要性是发明之母 在面对全球危机之际,新的前沿科学正在引入一个足以维持生命延续的新故事,一种看待世界的不同方式。当我们清除了我们文明当前所持的这种错误范式神话,代之以今天的科学所提供的修订版的觉知,一个全新的充满无数可能性的世界就出现了。透过这个校正之后的范式透镜去看的话,某种迄今未曾识别的模式跃入关注的焦点。 例如,在新科学的启迪之下,考虑一下人类如何进化这个问题。与进化由随机突变驱动的达尔文主义论断相反,凯恩斯所描述的有益突变,似乎可以肯定是意向性的。那种高躯体突变过程提供了一种进化机制,使有机体天生就能够主动地改变其遗传代码,从而适应环境的动态改变 。 前沿进化理论家们最近再次提出了 19 世纪的生态性物种形成概念,该概念认为,新物种的进化是由生态压力驱动的。这些理论家指出,环境当中狭小的、区域性的变化,如在各种微气候区中所见的那样,影响着有机体,使之迅速适应并改变其生物学形态和行为,以及其在这一改变了的环境中生存和繁荣的能力。 例如,我们可以把完全相同的鱼或蜗牛群体分割成两组,其中每组都分别引入相互分离但完全相同的环境。如果我们在其中一个环境中引入以鱼或蜗牛为食的捕食者,并追踪这两个群体的命运,我们就可以观察到,环境变化——捕食者——对鱼或蜗牛物种的进化过程产生了何等深远的影响。人们在自然生态系统中已经看到了类似的结果。 处于这种改变后的环境中的鱼或蜗牛,它们的成熟和繁殖更早,而相应的结构和行为变化可能导致它们的行为模式与那些生活在安全环境中因而未受到挑战的同宗相比出现很大的不同。如果有些个体因捕食者的存在而被迫迁移到其环境中此前很少光顾的地方生活和进食的话,这两个亚群的物种甚至可能进一步脱离关联。不管这些变化的出现是由表观遗传机制还是适应性突变机制所导致的,这些由环境引起的变化可能导致它们在发展道路上出现如此强烈的差异,以至于这些有机体可能再也无法识别此前本属同一物种的其它成员,也无法再与它们交配繁殖。 最近人们在对微生物的长期遗传研究中,展示了环境在塑造进化过程中的影响。为了确定随机性在进化过程中的作用,研究人员问了这样一个问题,“如果生命的历史可以从同一起点重来,它是否会有不同的展现方式?”他们首先将基因完全相同的细菌分别放入不同的试管中,这些试管中的每一个都包含同样的应激环境,然后再追踪每个试管中的细菌在 24,000 代中的进化。 研究人员发现,“这些微型适应性变异体每次都以同样的方式展开,它只受所在的环境因素的调控。”在一些实验中,不同培养皿中的适应来自不同类型的基因过程。在另一些研究中,不同培养皿中的适应具有惊人的可重复性,可以直接精确到 DNA 中 ATCG 序列的特定改变模式。 无论它们所采取的路径是什么,每支试管中的微生物最终都适应了同样的环境,并且大体上使用了相同的途径。这表明,同样的种群在面临相似条件时将遵循平行的进化道路。因此,通过这一实验以及前述的其他,新的前沿科学告诉我们,进化受环境中的决定因素的直接影响,而且很显然,不是随机的。 如果正像这些实验所提示的,进化是由环境条件塑造的,那么,只要对环境条件有足够的觉察,我们就应该能够预见进化过程。那么问题就变成,“在一个动态的世界里,我们能够预测环境条件吗?” 尽管动态系统看起来像是随机运作,洛伦茨却指出,如果有了足够高分辨率的环境数据,即使这些系统也是可以预见的。各种动态系统表达的是确定性混沌,或者简单地说,就是混沌。与显示随机行为的系统相反,混沌系统的命运是可预测的,而且正如洛伦兹所经验的,对初始值的影响高度敏感,例如在巴西一只蝴蝶翅膀的扇动,它启动连锁反应,并最终成为得克萨斯州的龙卷风。 When It Comes to Invention, Necessity Is aMother In the face of global crises, new-edgescience is introducing a new life-sustaining story, a different way of lookingat the world. When we replace civilization’s current faulty paradigmatic mythswith the revised awareness offered by today’s science, a whole new world ofpossibilities emerges. Seen through a corrected paradigm lens,heretofore-unrecognized patterns come into sharp focus. For example, consider the question ofhumanity’s evolution in light of new scientific insights. In contrast to theDarwinian assertion that evolution is driven by random mutations, Cairnsdescribed beneficial mutations that certainly seem to be intentional. Thehypersomatic mutation process provides a mechanism of evolution through whichorganisms are innately capable of adapting to dynamic changes in theenvironment by actively changing their genetic code. Leading edge evolution theorists have recently revived the 19thcentury concept of ecologicalspeciation, which suggests the evolution of new species is driven byecological pressures. These theorists point out that narrow, regionalvariations in an environment, such as in microclimate zones, influence anorganism to rapidly adapt and change its biological shape and behaviors as wellas its abilityto survive and thrive in that altered environment . For example, we can split an identical population of eitherfish or snails into two groups and introduce each group into separate, but identicalenvironments. If we introduce predators that feed off the fish or snails intoone of the environments and follow the fate of both populations, we can observehow environmental alterations—the predators—profoundly influence the course ofevolution within the fish or snail species. Similar results havebeen observed in natural ecosystems. 1 Fish or snails in the altered environmentwill mature and reproduce earlier, and consequent changes in their structureand behavior will likely lead to different behavior patterns than thoseexpressed by their unchallenged cohorts in the safe environment. The twosubpopulations of species could even further disconnect from one another ifsome are forced by predation to live and feed in formerly unfrequented parts oftheir environment. Regardless of whether these changes are introduced byepigenetic mechanisms or by adaptive mutations, environmentally inducedalterations may lead to such divergent developmental paths that such organismsmay no longer be able to recognize or breed with other members of the,previously, same species. 2 The influence of environment in shapingevolution was recently demonstrated in long-term genetic studies on microbes. Trying to determine the role of chance inevolutionary development, researchers asked, “If the history of lifecould be replayed from the same starting point, would it unfold differently?”After introducing genetically identical bacteria into separate test tubes, eachof which contained the same stressful environment, they followed the evolutionof bacteria in each tube through 24,000 generations. Researchers found that “these miniatureadaptive radiations unfold in the same way every time, governed by theavailable environmental niches.” 3 In some experiments, adaptations indifferent cultures were derived from different types of genetic processes. Inother studies, the adaptations in different cultures were surprisinglyreproducible, right down to the specific pattern of alterations in ATGCsequences in DNA. Regardless of the path they took, microbesin each tube ultimately adapted to the same environment, generally using thesame pathways. This indicates that identical populations faced with similarconditions follow parallel courses of evolution. Therefore, through this experimentand the others described above, new-edge science reveals that evolution isdirectly influenced by environmental determinants and, apparently, is notrandom. If evolution is shaped by environmentalconditions, as these experiments suggest, then, with enough awareness ofenvironmental conditions, we should be able to envision the course ofevolution. The question then becomes, “Can we predict environmental conditionsin a dynamic world?” While dynamical systems appear to behave randomly, Lorenz revealed that, with enough resolution ofenvironmental data, even these systems are predictable. Dynamical systemsexpress deterministic chaos, or,simply, chaos . In contrast to systems thatdisplay random behaviors, the fates of chaotic systems are predictable and, asLorenz experienced, highly sensitive to initial influences, such as the flap ofa butterfly’s wings in Brazil that initiates a chain reaction and culminates asa tornado in Texas.
个人分类: 科普|593 次阅读|0 个评论
[转载]《自发进化》节选(67)
罗非 2016-3-17 10:18
第十一章:分形进化 “一旦我们理解了进化的数学, 我们就将了解未来。” ——斯瓦米·贝雍达南达 未来学有未来吗? 在第一部分 信者得见 和第二部分 启示录中的四种错觉 中,我们提供了一份简短的西方文明史,这份历史是通过不断进化的基本范式这一镜头看到的。我们的重点是个人信念怎样地影响了我们的生物学,以及文化的范式信念如何塑造一个文明的命运。在第三部分中,我们将把这些旧故事抛在脑后,与此同时为新的故事编织各种元素,这个新故事将引导我们通过真正的新千年这块未知之地。 在编写“我们是怎么来的”的故事时,我们得到了一个坐享其成的机会,可以从后知后觉的角度评估历史。然而,第三部分将介绍一种完全不同类型的故事——某种深入未来的愿景。提供 将 发生什么的信息显然和提供历史分析属于不同的努力。我们现在即将进入预测这个领域,或者更正式地称为 未来学 ,即根据对社会趋势的评估,系统地预报未来。 预测可以是精密的推理,也可能是彻底的猜测。从性质上讲,猜测所依据的是不充分的信息,因此它代表着某种不确定的预测。与此相反,推理所依据的是证据和逻辑,因此它代表了有很大概率可能正确的预测。然而,推理的准确性依赖于所知的证据和逻辑推演。显然,本该很坚实的推理也可能完全脱靶,只要它所依据的诸信念是不准确的或者扭曲的。 福特汽车公司为通过扭曲的镜头展望未来提供了强有力的实例。 1958 年,福特发布了一项 4 亿美元的风险投资项目,旨在吸引公众的关注和购买力。福特雇佣了麦迪逊大道上最好的营销研究团队,设计出一个新的汽车系列,并将其吹捧为“……带有更多你的观念”的汽车。福特的这型埃德塞尔汽车,其设计目标是满足大众在流行款式上的趋势,其广告设计目的也是从科学角度上吸引购车者的动机。 但埃德塞尔却成了历史上最有名的营销灾难。事实上,该名称从此成为商业惨败的代名词,其他同样命运多舛的产品往往被诙谐地作为“埃德塞尔之流”弃置掉。营销专家们把埃德塞尔当做美国企业无法了解美国消费者的绝顶实例。有关这次失败的更有趣的因素之一,如《 时代 》杂志在其“ 50 种最差汽车”名单中所说的,是“文化评论家们推测,这辆车之所以是一个失败,是因为其垂直格栅看起来很像阴道。也许吧。美国在 1950 年代中对各种与女性相关的事物肯定都有恐惧症。” 使用传统诸信念和推理来做预测的未来学家有时会错得很离谱。就像一位弓手一样,他们有罪。预言者之罪的严重性可以从被误导的人数上来测量。那么如果某未来学家刚好是负责指导文明命运的政治学家、经济学家、或者社会学家的话,想一想这位未来学家的罪的后果吧。 在以下这个悲剧性的错觉和误导的实例中,国防部长唐纳德·拉姆斯菲尔德向全世界保证,战胜伊拉克所花费的时间不会超过几个星期。我们现在知道,拉姆斯菲尔德基于扭曲的证据和推理所犯的罪,已经让美国为这场所有战争中之埃德塞尔付出了——并且还将继续不断地付出——高昂的代价! 优秀的未来学家有能力评估数据并识别其中的固有模式。因此,模式识别是学习过程中的首要成分,也是规划未来之所必需。 下面给你一个机会,测试一下你作为未来学家的技能如何。请研究下面的四个序列,预测填空的数字或字母: (1) 13 – 26 – 39 – 52 – 65 –___ (2) C – F – I – L – O – R –___ (3) 7 – 3 – B – 16 – 2 – 9 –C – 0 – 4 – H – 1 – 1 – ___ (4) 3 – 1 – 4 – 1 – 5 – 9 –2 – 6 – ___ 只有当我们观察到某种可识别的模式之后,答案才会显现。在序列( 1 )中,模式显示每个新数字的导出方法是给前一个数字加 13 。在序列( 2 )中的模式是列出字母表中每次排第三位的字母。如果你第( 1 )和( 2 )题的答案分别是 78 和 U ,那么恭喜你——你已经看到了深入未来的景象! 然而,在预测序列( 3 )的未来时,问题就出现了。因为很显然,这个模式既没有节律也没有逻辑。因此,不论你用任何答案来填空,顾名思义,它所代表的都是彻底的猜测。因为这是某种随机序列,从哲学上说,任何猜测都可能对或者错——而且,正如适用于量子宇宙的情形,该猜测的准确性理所当然地依赖于观察者。 对大多数读者而言,序列( 4 )似乎又是一个随机序列。令人惊讶的是,它的答案是 5 。也许你已经足够聪明地认出了这个表面看来的非模式其实是一串特定的数字序列,它代表着圆周率(π)的数学形式。因此,序列( 4 )强调了某种对未来学家而言重要的关注点,也就是自然界中这样的一些成分,它看上去似乎是随机的,实际上却是 混沌的 ,因为它们具有某种潜在但迄今未知的模式。 这个简单的练习说明了有关未来学的三个根本要点:首先,如果能够识别出某种模式,那么预测未来事件的准确性相对较高。其次,如果发现事件是随机的,那么所有的预测本质上都是猜测,其精确性是靠碰运气的。第三,表面看来缺乏某种模式并不意味着真的没有模式。有些模式显而易见,有些模式不易辨认,有些事情根本就没有模式! 生存有赖于模式识别。作为原始的例子,人族早期对自然界基本模式的知识包括昼夜周期,月周期,以及包括四季的恒星年周期。观察与预测天体模式的能力对农业的发展和文明的进一步演化都十分重要,因为这种觉察给人们提供了方法和动机以规划未来的行动,例如春种秋收以待冬日。 同样,早期的人类文化能够把生老病死的生物模式与这颗行星上季节循环的模式联系起来。这些模式对于生存来说是如此的重要,以至于各种文明都建立了许多巨型建筑和神殿,例如英国巨石阵和马丘比丘的印加太阳神殿,以观察和标记日月星辰的运转。 今天,日历成了我们记录这些每日的、季节性的以及年度的模式的标记物。只要日历在手,不论身处世界上任何地方的人都可以知道,诸如海龟到加拉帕戈斯海滩产卵的繁殖季,或燕子返回卡波斯特拉罗的日子。 当早期人类把天文模式与人类行为模式相互联系时,他们发现了地球周期和人体生理学之间的关系。例如,月周期和女人月经周期的长度都是 28 天,这个事实并非某种巧合。 天空和人的生物学与行为之间的这种联系导致古代社会创建了占星术这门科学和艺术。事实证明,模式观测和人的行为预测这样的占星术实践是如此之有价值,以至于从最早记载的历史直到今天,各国政府的统治者与领袖们都在咨询占星学家以占卜他们国家的未来。 随着新文化信息的引入并被视为真理,先肇始于一神论者,后来又被科学唯物论者所加强,文明对地球艺术的觉察力逐渐退化,先是变成了历史,然后岁易时移,又变成了神话。今天的科学认为,这些古老的实践纯粹是违背自然法则的信仰。而我们当今这个基于科学的社会完全抛弃了这种古老的深入未来的占卜艺术,把它当做原始的超自然礼仪。 但是,或许正如新的前沿科学所揭示的,这些地源性实践仅仅是违背了传统科学家们那种受局限的视野而已,这些人仍然在通过那四种神话错觉的有色眼镜看世界。幸运的是,在我们中间还有能说这颗行星的语言的原住民后裔。但是,这些地球管家的人口正在迅速减少,所以我们必须迅速行动起来,以确保他们的智慧不会丢失。 今天之文明的特征主要是由科学唯物论拿出来作为范式性真理的东西所塑造的,而这些东西其实是 19 世纪中叶达尔文介绍了他那个版本的进化论之后才开始被采纳的信念体系。尽管它们存在固有的缺陷,但这些被视为科学真理的东西仍然提供了某种重要的概念框架,使技术发展和文明成长成为可能。不过,尽管这些有缺陷的信念体系曾经为我们的现代世界提供了奇迹,但其缺点今天已经威胁到了人类的生存。 目前人类所面临的关键问题其实是一些症状,它们反映出我们无法伸向未来。文明像一支任性的火箭,已经歪歪斜斜地从一个灾难飞往另一个灾难,充分表现出自己是一个强大的但却没有任何有意导航的运载工具。 传统智慧正是促成人类历史的那种反复无常、并且经常是灾难深重的历史进程的重要因素。尽管这种普遍接受的推理形式被用于勾画模式并展望未来,但它也可能被错误的知觉所扭曲,尤其是当我们需要对能量场、基因决定论和进化的本质有一个准确认识的时候。 因此,为了准确地看清我们的去向,必须首先了解我们导致现状的模式。然而,在向传统科学咨询进化中的固有模式问题时,我们必须认识到,达尔文主义那种很有限制性的随机进化信仰会在很大程度上扭曲他们的答案。 传统科学如何解释我们导致现状的过程? 噢——是在随机突变和遗传事故的驱动之下,通过数十亿年的时间逐步演变而来的。 那么,如果我们就是这样一路走来的,那么我们可以预测进化将把我们带向何处吗? 也许是一路兜风……到地狱? 严肃地说,如果进化是由随机的、无模式的事件驱动的,有谁能预测我们会去往何方?在这种情况下,任何预测从概念上说都是一种纯粹的猜测。例如,想一想当初家用电脑热刚开始冲击大众的时候,未来学家们预测说,在若干世纪之后,人类将进化成身体更小、脑袋更大的状态,因为他们整天坐在电脑终端前。但是,如果我们看看目前流行的肥胖和智力萎缩,就可以看出这个预言纯粹是一场埃德塞尔猜测! Chapter 11 Fractal Evolution “Once we understand the math of evolution, we will understand the aftermath as well.” —Swami Beyondananda Is There a Future in Futurology? In Part I, BelievingIs Seeing, and Part II, FourMyth-Perceptions of the Apocalypse, we provided a brief history ofWestern civilization as seen through the lens of an evolving basal paradigm.Our focus was on the nature of how personal beliefs influence our biology andhow a culture’s paradigmatic beliefs shape the fate of a civilization. In PartIII, we leave the oldstories behind as we weave the elements of a new story that will guide usthrough the uncharted territory of a truly new millennium. In compiling the story of how we gothere, we were afforded the armchair opportunity of assessing history throughthe lens of 20–20 hindsight. But Part III introduces a completely differentkind of story—a vision into the future. Offering information as to what will be is clearly a different endeavor thanproviding an historical analysis. We are now entering into the domain of prediction,or, more formally, Futurology, a systematic forecasting ofthe future based on an assessment of societal trends. A prediction may range from an outrightguess to an astute inference. By its nature, a guess is based on in sufficient information and,consequently, represents a chancy prediction . In contrast, an inference is based on evidence and reasoning and, therefore,represents a prediction that has a greater probability of being correct . Yet, the accuracy of aninference is dependent on perceived evidence and reason. Obviously, apresumably solid inference can totally miss the mark if the beliefs upon whichit is founded are inaccurate or distorted. The Ford Motor Company provided apowerful example of envisioning the future through a distorted lens. In 1958,Ford unveiled a $400 million venture designed to capture the public’s attentionand purchasing dollars. Using the best Madison Avenue marketing research, Forddesigned a new line of automobiles touted as the carhaving “. . . more YOU ideas.” The Ford Edsel wasengineered to complement public trends in styling, and its advertising wasscientifically designed to elicit car buyers’ motivations. But the Edsel became the most famous marketing disaster in history. In fact, the namehas since become synonymous with commercial fiascos, and other similarlyill-fated products are often comically dismissed as being Edsels. Marketingexperts hold the Edsel up as a supreme example of corporate America’s inabilityto understand the nature of the American consumer. One of the more interesting factorsfor the failure, as stated in TIME magazine’s list of “50 Worst Cars,” was that: “ Cultural critics speculated that the car was a flop because thevertical grill looked like a vagina. Maybe. America in the ’ 50swas certainly phobic about the female business.” Futurists who use conventional beliefs and reasoning totarget a prediction sometimes widely miss the mark. Like an archer, they sin.The gravity of a prognosticator’s sin can be measured in terms of the number ofpeople who are misled. Consider the ramifications of a futurist’s sin when thatfuturist is a politician, economist, or sociologist responsible for guiding thefate of civilization. In a tragic example of misperception and misguidance,Secretary of Defense Donald Rumsfeld assured the world of a fast victory inIraq lasting no more than a few weeks. We now know that Rumsfeld’s sin, basedon distorted evidence and reasoning, has cost—and continues to cost—UnitedStates dearly in what has been the Edsel of all wars! A good futurist has the ability to assess data and identifyinherent patterns. Therefore, pattern recognition is aprimary component in the learning process and a necessity in projecting thefuture. Below is an opportunity to test yourskills at being a futurologist. Study the four sequences below and predict thenumber or letter that will fill the blank: (1) 13 –26 – 39 – 52 – 65 – ___ (2) C – F– I – L – O – R – ___ (3) 7 –3 – B – 16 – 2 – 9 – C – 0 – 4 – H – 1 – 1 – ___ (4) 3 –1 – 4 – 1 – 5 – 9 – 2 – 6 – ___ Answers only become obvious after weobserve a recognizable pattern. In sequence (1), the pattern reveals that eachnew number is derived by adding 13 to the previous number. In sequence (2) thepattern represents listing every third letter in the alphabet. If your answersfor (1) and (2) were respectively, 78 and U, congratulations—you have seeninto the future! However, problems arise in predicting thefuture in sequence (3) because, apparently, there is neither rhyme nor reason tothe pattern. Consequently, any answer you use to fill in the blank, bydefinition, represents an outright guess. Because this is a random equation,philosophically, any guess can be either right or wrong—and, as befitting aquantum Universe, the accuracy of that guess is dependent, of course, upon the observer. For most readers, sequence (4) might seemto be yet another random sequence. Surprisingly, the answer is 5. Perhaps you were sufficiently astute to haverecognized this apparent non-pattern as the specific sequence of numbers that representthe mathematical formula for Pi ( p ). Equation(4), therefore, underscores a relevant concern for futurologists, that is, somecomponents of Nature that appear to be random are actually chaotic in that they possess an underlying, butas yet, unrecognized pattern. This simple exercise illustrates threefundamentally important points concerning futurology: First, if a pattern canbe recognized, then the accuracy of predicting a future event is relativelyhigh. Second, if events are found to be random, then all predictions areessentially guesses with an accuracy based on chance. Third, the apparentabsence of a pattern does not imply the absence of a pattern. Some patterns areobvious, some patterns not readily recognizable, and some things simply don’thave a pattern! Survival is dependent on patternrecognition. As a primal example, humankind’s early knowledge of Nature’sfundamental patterns included the day-night cycle, the lunar cycle, and thesidereal yearly cycle with four seasons. The ability to observe and forecastcelestial patterns was fundamental to the development of agriculture andfurther evolution of civilization because this awareness provided humans with themeans and motivation to plan future actions, such as planting crops in thespring then harvesting and storing food for the coming winter. Likewise, early human cultures were ableto connect the biological patterns of birth, growth, and death with the planet’scyclic seasonal patterns. These patterns were so important to survival, thatcivilizations built great edifices and temples, such as Stonehenge and theIncan Sun Temple at Machu Picchu, to observe and mark the transit of the sun,moon and stars. Today, the calendar serves as ourmonument to these daily, seasonal and yearly patterns. With a calendar, aperson anywhere in the world can know, for example, the propagation season for turtleslaying their eggs on a Galapagos beach or the day swallows return toCapistrano. When early humans connected astronomicalpatterns with patterns of human behavior, they recognized a link betweenEarth’s cycles and human physiology. For example, the fact that the lunar cycleand a woman’s menstrual cycle are each 28 days long is not a coincidence. This link between the heavens and humanbiology and behavior led ancient societies to found the science and art of astrology.The practice in astrology of observing patterns and predicting human behaviorproved to be so valuable that, from earliest recorded history to the presentday, government rulers and leaders have consulted with astrologers to divinethe future of their nations. With the introduction of new cultural information, perceived astruths, that was proffered by the monotheists and, later, by the scientificmaterialists, civilization’s awareness of Earth arts receded first into historyand, over time, into myth. Science today considers these ancient practices asbeliefs that are simply beyond the laws of Nature. And our currentscience-based society totally dismisses the ancient divining arts of seeinginto the future as primitive metaphysical rituals. But perhaps, as new-edge science isrevealing, these Earth practices are only beyond the limited vision ofconventional scientists who still perceive the world through the flawed lensesof the four myth-perceptions. Fortunately, we have among us aboriginal descendentswho are still able to speak the language of the planet. But, the populations ofthese Earth stewards are rapidly diminishing, so we must act quickly to ensurethat their wisdom will not be lost. The character of today’s civilization isprimarily shaped by what scientific materialism presents as paradigmatic truths,which are really the beliefs originally adopted after Darwin introduced hisversion of evolution theory in the mid-19th century. In spite of their inherentfaults, these perceived scientific truths, nonetheless, provided an importantconceptual framework that enabled the development of technology and the growthof civilization. But while these flawed beliefs once provided the miracles ofour modern world, their shortcomings are a threat to human survival today. The critical problems currently facinghumanity are symptoms that reflect our inability to project into the future.Like a wayward rocket, civilization has been careening from one disaster toanother, showing itself to be a forceful vector with no intentional direction. Conventional wisdom is a contributingfactor to history’s erratic and often calamitous course. While this commonly acceptedform of reasoning is used to envision patterns and project futures, it can alsobe distorted by faulty perceptions, especially when an accurate awareness ofenergy fields, genetic determinism and the nature of evolution is required. Therefore, in order to accurately seewhere we are going, we must first understand the patterns of how we got here.However, when consulting conventional science about inherent patterns inevolution, we must recognize that limiting Darwinian beliefs concerning randomevolution will profoundly distort their answers. How does conventional science explain howwe got here? Oh—through billions of years of gradual evolution driven byrandom mutations and genetic accidents. So, if that’s how we got here, then canwe predict about evolution will take us? Perhaps on a joy ride . . . to Hell? Seriously, if evolution is driven byrandom, unpatterned events, how can anyone predict where we are going? Anyprediction, by definition, would be a sheer guess. For example, consider thefact that when the home computer rage first hit the public, futurists projectedthat, in the centuries ahead, humans would evolve smaller bodies and biggerheads from sitting at computer terminals all day. But if we look at the currentepidemic in obesity and dwindling intelligence, we see that that prediction wasan Edsel of a guess!
个人分类: 科普|481 次阅读|0 个评论
韦小宝掷骰子的概率
热度 1 andydong 2015-6-12 21:05
金庸武侠名著 《鹿鼎记》第 42 回里: ……韦小宝道:“大家争个不休,终究不是个局。这样罢,咱们掷一把骰子,碰一碰运气,倘若归老爷子赢呢,我们非但不阻三位进宫,晚辈还将宫里情形,详细说与两位知道。”……归二娘道:“是了!你们两个各掷一把,谁掷出的点子大,谁就赢了。”韦小宝心想:“只一把,说不定他运气真好,一下子掷了个三十六点。”说道:“这样罢,咱们各掷三把,三赢两胜。”归钟是掷的次数越多,越是高兴。说道:“咱们每人掷三百次,胜了两百次的算赢。”归二娘道:“那有这么麻烦的,各掷三把够了。” 这一节的原意是韦小宝想掷骰子作弊,然后胜了归氏三人,就可阻碍他们进宫行刺康熙,也不违背了他对小皇帝的义气。 我们这里不考虑韦小宝的作弊,来说说完全随机的掷骰子(从 1 点到 6 点完全随机),如果以所有掷出的骰子总和最大为胜,三局好还是三百局甚至三千局更好呢? 我们用随机数模拟的方式来计算下,就用 MS Excel 表格中的 RandBetween(1,6) 函数,可产生一个介于 1~6 的整数,如果取三次(相当于掷了三次骰子),韦小宝的结果可能是: 2 + 4 + 2 = 8 而归氏的结果可能是: 3 + 6 + 1 = 10 由此归氏胜,韦小宝输。不过这个结果因为随机,每次结果差异较大。 如果改为掷三百次呢?韦小宝的结果可能是: 2 + 5 + 1 + …… + 5 = 426 而归氏的结果可能是: 1 + 2 + 6 + …… + 4 = 390 由此归氏输,韦小宝赢。不过这个结果还是每次差异较大。 如果改为掷三千次,韦和归二人的结果可能是 10299 和 10524 如果改为掷三万次,韦和归二人的结果可能是 105052 和 104939 可以进一步计算,表明如果掷的次数越多,两人的结果越接近。可通过多次计算求得平均值和标准差,由此通过 F 检验或 t 检验可知并无显著性差异 (p0.05) 。如果对韦小宝来说平局就算赢的话,时间上足够,要求掷的次数越多,平局(赢)的可能性就越高。 应该说世界上并无真随机,计算机里产生的是伪随机数,比如用一定规律的数学递推公式产生一个随机数序列。不过如果用穷举法把这个序列无限长的写下去,是存在一个重复性和周期性的,所以就不再是随机了,但只要递推公式选得比较好,随机数间的相互独立性是可以近似满足的,只要所用随机数的个数不超过伪随机数序列出现循环现象时的长度就可以了。著名的蒙特卡罗随机抽样法就是基于一系列的可能发生的场景接近可能的真实情况,从而对很多问题进行概率上的推算。
6000 次阅读|1 个评论
可以精确再现的摇号,还有概率意义吗?
热度 4 cgh 2014-2-28 12:51
可以精确再现的摇号,还有概率意义吗? 科学网有个数学教,也有不愿入教的数学大师。科学网上的数学科普也是比较多的,这里就不挂上大名,免得有人不乐意。总之,科学网上懂数学的人还是很多。把北京市小客车摇号的概率问题放科学网上应该没错,最好能引起一次小小的讨论。 2014 年开始,北京市小客车摇号推出提高中签概率的举措,“照顾”久摇不中的申请者。从刚刚公布的方案看,具体方法是给需要提高概率的人分配更多的号码放到摇号池。比如,超过 24 期未中的人以 2 个号码参加。这样来看,确实使这部分人的相对概率增加了一倍。同时,值得注意的是,总号码池的数量也增加了。基准概率人群的概率相对是开始减少了。 上面增加概率的方法,无论如何还是相对公平,也符合数学逻辑的。但是,最新的公告 http://www.bjhjyd.gov.cn/jggb/2014224/1393230939498_1.html 显示,“为进一步体现小客车指标摇号工作的公开、公 平、公正性,自 2014 年 2 月 25 日起,北京缓解拥堵网站提供 摇号程序下载 服务,申请人可自行下载摇号程序和 “ 摇号池编码文件 ” ,进行摇号结果验算。” 这就让我这个数学能力一般的人有点纳闷了,随机的摇号居然可以精确重复? 这个“验证“的具体输入条件是:“ 申请人首先输入查询期的“文件 MD5 码”,然后导入相应的“摇号池编码文件”(无需解压缩,直接导入),并输入查询期 6 位随机种子数后,点击“计算”按钮,程序即可显示查询期全部中签编码。 ” 也就是,给定上述三个东西,就能得到唯一的结果。那么,随机的东西就只有那个 6 位的“随机种子”!这个似乎和我们理解的随机不是一回事吧。如果从这个六位数确定地计算每个结果,也就可以从所要的结果精确计算需要的六位数,这个对应关系应该不是随机的。也就可以是人为“操作”。何来公开和公正? 再来说这六位的“随机种子”,带给每个申请号码是同样的概率吗?这个恐怕需要科学网的数学博主来帮忙论证一下。直观上讲,如果没人编号都是同样位数的数字(现在是 13 位的数字),每个数字的概率是相等的。可是,现在中签的编号是 6 位数产生的,这中间的概率是如何传播呢? 看过电视里的彩票摇号,用的是乒乓球在吹气状态下进入管道的随机过程。就这都爆出很多造假行为。北京市小客车摇号程序,在没有公开原代码的情况下,如何能说它是公开公正公平的,还是高科技可控的?
个人分类: 杂谈|5533 次阅读|7 个评论
再谈“意想不到的老虎”
热度 10 xying 2014-1-21 08:27
我在 《占卜与推理》 里介绍了“意想不到的老虎”悖论,谈到对于这类问题逻辑推理得不出答案,用博弈的方法可以有一个最优的混合策略解,以此来说明解决具体问题的政治技巧。这篇文章给喜欢追根究底的人一个深入的博弈技术上解释。 “意想不到的老虎”,我在中学的时候读过,一直不得要领,直到近些年读了些书以后,才嚼出点味道来。 麦克向公主的父亲求婚。国王把他带到五个房间前说:“有一只老虎藏在这里,这是在你意想不到的那一个房间。你逐个把门打开。如果你足够聪明,在打开那扇门之前猜到。我就把女儿嫁给你。” 麦克想:“如果老虎在第五间,我打开前面四间的门都一定是空的,那我在打开这房间之前就能猜到它在这里。这不是意想不到的,因为它与国王断言相矛盾,所以老虎不可能在这里。(第一步) 把第五间排除了,老虎只能在剩下四个房间里。同样推理,也不可能在这最后的第四间。(第二步) 如法论证,老虎也不可能在第三,二间里。(第三,四步) 如果老虎在第一间。因为老虎是在这五个房间里,已经排除了后面所有的房间后,就不是意想不到的。所以也被否定掉。(第五步)” 麦克信心满满地相信:如果老虎是意想不到的,就不会在这些房间里。当他依次打开第二个门时,意想不到地跳出一只老虎来。 国王说的话得到了验证,都是真的。那么麦克推理的错误在哪里呢? 这个悖论还有不同的形式,诸如 Surprise Examination , Unexpected Hanging Paradox ,预测悖论等等。关于这些悖论,中文网上许多解答大同小异,大约都是从同一个地方抄来的。认为错这第一步,第二步和最后一步,各有他们的理由。但都没说到点子上。大家可以看“维基百科:老虎悖论” http://zh.wikipedia.org/wiki/%E8%80%81%E8%99%8E%E6%82%96%E8%AE%BA 英文的说出些道理,说学术界对它倍有兴趣,却没有达成一致的意见。这看似简单悖论背后的复杂性甚至可以引申出哲学上重大的问题。见“ Wikipedia : Unexpected hanging paradox ” http://en.wikipedia.org/wiki/Unexpected_hanging_paradox 简单地说,这是一个自我指涉的认知悖论。在逻辑上,国王提供些知识,其中有两个命题: 1. 老虎在五个房间之中。 2. 老虎所在的房间你推测不出来。 实际上这两个命题在推理下不相容,它们构成了自相矛盾的判断。你在假设下推测出老虎在任何房间都会被第二个命题否定。麦克利用它们得出老虎不在这五个房间的任何一间中。但这又与第一个命题相矛盾了。这逻辑推理的过程没有错,错在你如果认为,国王给定的知识可以用来做推理的前提,那结果则会跟给定的前提相矛盾。从不相容的几个命题出发,你可以推出任何结论。就是说你可以用其中的命题经过一定的推理路径得出某个结论,也可以经过不同的路径得出相反的结论。 麦克推出老虎不在这五个房间里,我们来看这也可以推出老虎在第五个房间。 用反证法。假设老虎不在第五间,麦克的第一步推理的结果换成了假设。按照麦克的第二,三,四,五步推理。仍然得出老虎不在这些房间里,但这结论与命题1矛盾,所以初始的假设不对。因此老虎是在第五间。 也可以推出老虎在第二个房间。 按麦克原来的第一,二,三步套路推出老虎不在第五,四,三房间。现在假设不在第二间,用假设代替第四步的结果,加上第五步结果,与上述国王命题1矛盾。依反证法,假设的反面是对的,因此老虎必须在第二间。 这样自我指涉的认知悖论,以给定的知识作为推理的根据,逻辑推理兜了一圈必定是矛盾的。你在这圈子任何一个地方断开,把结论换成了假设,一直推到矛盾时,按反证法说,假设就不对了,从而得出与假设相反的结论。 网上的一些解释是用逻辑得出与麦克的推理中一步相反的结论,然后说这一步是错了。这仍然没有跳出怪圈,依然在悖论的逻辑路子里兜圈子。按这样子,也能证明任何一部都是错的。 有人问,既然这两个命题构成一个自相矛盾的判断,为什么国王到最后还是对的? 网上也有各种解释。其实这只是国王运气好,麦克没蒙对。他要是按照前面路子推出来老虎在第二个房间。尽管是自园其说的论证,麦克只要自个儿信了,就可以牛逼哄哄地指着门说:“我推测出老虎就在这一间。” 国王岂不就是错了? 从认知的观点,国王给出的知识在推理上自相矛盾,无益于推导,不能作为推理的根据。你用它们来推理,是白忙乎。国王随便将老虎关在哪个房间,都和这知识无关,也就无从据此猜测,就算你蒙对了,那也是意外的。世人的许多凭借大道理来论证的事,大抵如此。 有人嗤笑说:“这太简单了,如果这个老虎是‘意想不到的’,那么无论麦克说什么,国王都可以说他不对。因为能被你猜着了,就不是意想不到的。” 这是在语言上做文章,不过这样解读没有技术含量。悖论的目的是促进思考,很多问题并不拘于严谨的表达,而是用形象说法来揭示深刻的思想。不同人看到的是不同的问题。有能力的看到的是难点,不纠结于浅显的枝节以免忽略本质。“意想不到”这话比较含糊,故事中国王这句话其实只是提个醒,有“谅你也想不到”的意思。并非用它来判决麦克的答案。答案的对错是由事实来验证的。 一位朋友跳出这个问题,从一个高度说:“既然这只老虎是‘意想不到’的,麦克怎么可能‘足够聪明,在打开那扇门之前猜到’呢?” 她以女性的直觉说:“这只能解释为:国王根本就不想把女儿嫁给麦克。麦克的错误是在于,还想根据国王的话,企图用推理来猜出这‘意想不到’的结果。” 这确实一针见血! 既然国王和麦克意愿相左,两人各自从不言而喻合适的大道理出发,严谨地论证自己的诉求,都觉得自己不亏理。再下去就只能是暴力解决了,文明一些,就赌个输赢。大家愿赌服输。这个故事的议题就从逻辑的问题转为博弈的问题了。 其实国王原来的意思也是随便将老虎关一个房间。看在公主的份上让麦克猜一次,有 20% 机会中奖,对穷屌丝也该知足了。大道理谈不拢,玩暴力你赢不了,还能怎么地?那个“你足够聪明,怎样,怎样”说法是玩政治都懂的学问,让你有点自己也可以掌握命运心灵鸡汤之类的盼头。要是麦克是黑骑士、蝙蝠侠的什么,公主一门心思又在他身上,国王也许就要考究麦克的智商了,这 20% 中奖机会这时有点欺负人。麦克凭他的实力宁可用拳头。 博弈的设计是政治家必修课。这里是设计个比赛规则。比如说,麦克可以猜多次,直到见着了老虎。要猜着了, 10 分;没猜着却见了虎,负 10 分;没虎蒙有时,扣些分,设为 M 分,接着猜。最后看积分正负定输赢。研究政策的人都该想想:这扣分 M 该是多少?才能让麦克和国王都觉得愿意放弃拳头,玩游戏赌输赢。 国王没什么花招可用,必须预先将老虎放入一个房间,策略分别记为 1 , 2 , 3 , 4 , 5 ,对应着把老虎放在编号那个房间。麦克当然可以从头到尾每个房间都说有老虎,但是老虎要是在比较后的房间,猜不中扣分很多,显得傻,未必是最好的策略。如果前面房间都没虎,后面有的概率就较大了,所以没有前面开始了猜有,后面再猜没有的道理。因此麦克比较现实的策略库是:策略 1 从头开始都一直说有,到猜中为止; 2 从第二间开始猜有,直到猜中为止;如此 3 , 4 , 5 类推。比如说国王的策略为 4 ,麦克的策略为 3 ,意味着国王把老虎放在第四个房间,麦克在第一,二房间都说没有,从第三个房间开始说有老虎,丢了 M 分,第四个房间蒙着了得 10 。这个对局麦克的得分就是 10-M ,把这个数值放在博弈支付矩阵的第三行第四列中。支付矩阵其他元素的赋值类推。这是一个零和的博弈,国王的得分是麦克的负值。我们可以写出麦克博弈支付矩阵如下。 选择 \ 老虎 1 2 3 4 5 1 10 10-M 10-2M 10-3M 10-4M 2 -10 10 10-M 10-2M 10-3M 3 -10 -10 10 10-M 10-2M 4 -10 -10 -10 10 10-M 5 -10 -10 -10 -10 10 从这矩阵看出,除非麦克蒙错了不受罚( M=0 ),不存在着优势策略。也就是说在这个问题上别指望国王和麦克有什么策略一定比别的高明。对于聪明人来说,这样还不够,因为胜负的概率很不同。如果麦克和国王的实力相当,什么样的 M 才公平呢? 公主说:“国王和麦克如果都完全随机选策略,他们的数学期望是这个博弈的平均分,它是矩阵里所有分量都加起来除 25 。 M=2.5 时这个平均分为零,这个最公平。” 这不能说错,但这是对两个都漫不经心的随机选择者而言,在弱智王国里的公平。国王如果同意这个数,就被公主忽悠了。因为麦克这时可以选第一个策略,就是每个房间前都说有老虎,无论老虎在哪个房间,都不会是负值,这就稳操胜卷了。 国王叹气说:“女大不中留呀!你把老爸当傻瓜了。这第一个策略优势太大,必须加大扣分惩罚力度才行。 M=5 时,这个策略的平均分是零,这才是合理。” 麦克说:“你觉得我肯定选那第一个策略?我是那个总以为别人只会盲目随机傻瓜的真正傻瓜吗?要按你说的,我所有策略没有一个是正的均值了,这能合理吗?真正合理的 M 值,必须使得你和我全都采用最好的策略时得分是零。” 孙子兵法云:“多算胜,少算不胜,而况于无算乎?”麦克的提议是对于两个聪明人的公平。但这要费脑筋由人及己的通盘计算。我计算过, M=3.78 ,是双方都没有优势策略和纯策略的博弈,只有一个混和策略的纳什均衡。国王的最优策略是以 16% , 13% , 11% , 10% , 50% 的概率把老虎方进房间序号 1 , 2 , 3 , 4 , 5 。麦克是以 50% , 10% , 11% , 13% , 16% 的概率选取他的策略 1 , 2 , 3 , 4 , 5 。这时候的得分的数学期望为零。这些计算是非合作博弈基础课程的内容,就不在这里多说了。 世上很多事情是用大道理辩不清的,在现实中最后的解决只能是实力的对撼,而不是基于美好的幻想。提出兵不血刃的替代方案,设计一个让大家都心甘情愿地接受现实,用风险较小的游戏来代替残酷的对决, 是一种政治的艺术 。对于明白人来说,公平的结果必定是一种随机的选择。
个人分类: 科普|11750 次阅读|24 个评论
占卜和推理(3)
热度 9 xying 2014-1-16 08:42
这里的“占卜”泛指各种实现随机选择的方法,它在古代祈求神灵指点,乃至现代通过选举表决的方式被广泛地应用。推理则是根据理论或经验凭借着人们的智能做出确定性的决定。 远古蒙昧,人们对于未知事物充满敬畏,容易放弃无知的猜测和无谓的争执,听从一种直截无偏的裁决。占卜便应运而生。它能胜出,是因为随机比起偏执有更好的成绩。它能平息争议,是因为公平无偏。能为大家所遵从,则是借重了神灵的权威作为强迫的理由。 随着人们心智渐开,很多过去无法理解,只能听天由命的事情,都可以通过理性辩驳来分析和决断了。巨大的成功使得人们自信心过分膨胀,总以为天下的事,用道理都可以说得通,决定得了的。实际上这是一个误解。世间很多的道理似是而非,各执一端。 东汉时陈蕃,十来岁时闲处一室,而庭宇芜秽。父友薛勤来访,问他:“孺子何不洒扫以待宾客?”蕃曰:“大丈夫处世,当除扫天下,安事一室乎!”,据说薛勤当即反问:“一屋不扫,何以扫天下?” 这就是各说大道理唬人了,双方听不进,于事也无益。其实《后汉书》里只有陈蕃很牛逼地说的那段话,薛勤那句是后人添上去教育小孩的。大人总说:要想成就大事,就应该从一点一滴的小事做起。历史上陈蕃是当了大官做了大事,“大丈夫处世,当除扫天下,安事一室乎!” 便作为少有大志的证据。编出来的后面那句,就被解释为,他得了教训,所以能成大事。要是他一事无成,一定会当作好高骛远不踏实,“一屋不扫,何以扫天下”的坏典型。这类正反都说得通自圆其说的名言,并不是可以用来做决策根据的。 另一大类似是而非的就是随大流的思想,随大流就是以大多数人的看法为准绳,人云亦云,行动也跟从。这种想法是认为大多数的看法总是对的,以为是集合了众人的智慧。选举中的多数原则就是基于这个认知。实际上,这个认知就像“意想不到的老虎”悖论中的麦克推理一样是没有根据的。想想看,电影院失火时你随大流和大家挤一条道好,还是走人少的安全门更明智?股市和楼市泡沫时,你随大流冲进去,这难道也是正确的选择? 从博弈的角度来看,运用占卜还是推理来决策,各有各的优势,取决于所处的局势。危机动乱呼唤英雄,推崇权威,和平发展存异共处,需要包容。关键是在不需要权威时,如何摆脱独裁。也就是在没有能推理而来的确定性优胜策略,不需要统一意志时,如何摆脱独裁的模式,走回各种策略都有机会表达的随机决策模式,取得真正包容大众意志的民主。 有人认为选举能够杜绝独裁,这是昧于事理不了解历史。选票只是人民拥戴的一种规范形式,如果真有这种单向阀的作用,在人类几千年的历史发展中,早就没有独裁的祸害了。实际上第一代的独裁者都是民众推选出来的。 在博弈科普系列中,我写过一个故事 ,演示了如何使用美国经济学家肯尼思•阿罗的“不可能定理”中枢纽选票的技巧,通过合法的选举来操纵结果。 历史上由正常的民主选举走向专制并不少见,著名的有:法国大革命走向雅各宾专政和德国希特勒当选走向法西斯专政。苏联十月革命成功后,与列宁齐名的可以称为知识分子的领导人只有托洛茨基和布哈林。托洛茨基是红军之父,布哈林是政治理论家和经济学家。声名,威望,功绩都远胜只管组织工作的斯大林。斯大林以组织的技巧,发挥了选举的力量置他们于死地。在精心的安排,适当的宣传,狂热的口号之下,人民选举造就了斯大林的独裁,而不是斯大林原先就具有绝对权威。一但独裁的权威已成,选举还能走出权威的意志?这是因为那时人民没有民主的觉悟吗?不。法国大革命,一战后的德国社会和苏联的革命恰恰都是追求民主,以之为旗帜,实现了选举为制度的社会。现实中的回归,都是权力经过时间被继承者们摊薄后,不同意志力量间的均衡,这时候才不能由一人说了算。 有人说:关键是制度。那制度靠什么来保证?宪法?宪法靠什么来保证?洛克说。。。 谁说的都没用。这一切都要靠人来参与,真正有保证起作用是博弈的实力,而不是空洞的口号。政治的现状是各种力量博弈的均衡状态。取决于组成这些力量中的人们,为自身和所在群体的利益各自努力的合力。 作为社会理性脊梁的知识分子,要用头脑思考民主真正有效的机制找出防止弊病的办法,而不是追逐潮流哗众取宠,简单用贴标签判定正误,满足于做山寨版。 人们追求民主是想防范专制的暴虐。已知的选举方法做不到这一点,除了买票、抹黑、诱导种种合法、非法的作弊手段之外, 50 年代以来美国许多政治学的研究,已经发现在原理上还有很多弊病,比占卜更容易被人合法地操纵。当社会资源被垄断后,选举只会沦为形式,并不能真正起着阻止的作用,或成为背后集团分赃的工具。既然这一切弊病,都是通过诱惑、欺瞒、威胁下才成为可能,那民主有效的机制则是要不通过能被操纵的思考,用完全随机的选择才能跳出陷阱,才起作用。我们需要一个大家都心甘情愿遵从的新的随机发生器,或者称为新的占卜方法。 无论占卜还是选举,其真正有意义的功能都是随机发生器。它们在历史上都发挥过积极的作用。只是后来被人发现漏洞后,做弊破解了。古代的占卜让你相信这是神灵的意志,现代的选举让你相信这是人民的意志。其实都不必是真的,但只要相信了,就能形成一种制度系统认可的力量,进而压迫,强制那些不愿意的人,达到平定争执,同心协力的效果。从奴隶社会到现代社会都是这么运作的,这个原理始终没有变过。它力量来自大家认同的公平。真正无偏的公平是不被人干预的随机,才不会受权力威胁,金钱诱惑,资源倾斜,资讯不均和智力欺瞒的影响,避免被操纵。 有的朋友说:“选举是民主的表现,不管结果如何人们都心甘情愿地接受。要用随机占卜,对你的故事里中午吃什么,可以接受。如果事关生死,能心甘情愿用完全随机的占卜来决定的,一定是极少数,大多数人都不会同意的。这是人性!” 人性真的不愿意接受随机的选择吗?圣经中亚当和夏娃被逐出伊甸园的故事,实际上是描写:要仅仅依靠知善恶能力来决定自己命运时,人们的那种彷徨。你看看无数信神的人,每逢重大事情无法取决,都会虔诚地祷告以求上苍的指示,从各种征兆明悟之中,决定了自己的选择。人们在危难之中,期盼英雄,等待拯救,不也是放弃自己的控制,而听从自己意志之外的安排吗?如果人们意见相左,无法说服,要凭实力生死相搏,有一个机会,按合适的比例随机决定哪一方妥协,你还要坚持自己的意志吗? 也许,待到很多人了解政治的技巧,熟悉了如何在博弈现实中自处后,大家会设计出更少弊病的占卜方法,来决定争执不下的国家大事。在这之前,作为被代表的人,如果无法确信自己的选择,最能发挥出积极民主作用的神圣一票是:自己随机做出选择。
个人分类: 闲侃|6131 次阅读|17 个评论
占卜和推理(2)
热度 11 xying 2014-1-13 07:55
是按照常识和逻辑来推定,还是用占卜或混合策略随机选择,这是亚当和夏娃走出伊甸园后,关于决策理念的重大不同。相当于是用智慧果开启的辨是非能力来把握自己的命运,还是将命运交回给上天的安排。 世界上很多的事情并不是靠单方面努力,一厢情愿就能够决定的。博弈论便是研究这类事情的学问。博弈理论告诉我们:所有事情都有最好的答案(纳什均衡的策略)。但有的时候这个答案是混合策略。也就是说:在这种情况下,所有供作选择的具体的方案都不是最好的,只有随机在它们之间指定一个,在统计意义上可能要比其中任何一个要好。想想猜拳,就不难理解这个结论。 所以世界上有些事情可以由常识和逻辑来确定,有些事情去占卜比起你苦思冥想如何决策更为明智。占卜从博弈角度看来真正的作用是一个随机发生器。占卜能够沟通神灵的说法只是引导大家信赖这个方法的手段。 有人说:你占卜的随机概率和混合策略的概率不一定吻合。是的,但这不是重点,可以在技术上改善,或者通过解释来调整。由占卜挑出了一个具体决策,它们可能是以不同的概率选定的。但就这个选定的策略而言,它们的后果是一样的。重要的是,这个决策不是由一定的思路按照逻辑确定性地选择出来。使用常识和逻辑推断的决策,都基于预先能够估计出的结果,在相同的已知信息下,它都是一样的。而采用占卜或混合策略的选择,对相同的局面,它可能不同,我们不知道这个选择是好的还是坏的,只能祈求它是好的,或者玩得足够多时有把握它的统计平均结果是最好的。 据说最早的占卜用于狩猎的方向。与其根据什么似是而非的固定思路来推断,老往同一个方向寻找猎物,采用占卜可以更有效地利用各方向的资源,在实践上也是成功的。大家都敬畏神灵,意见不同,交给上天裁决,卜个卦,谁也不能说不公,这就能平息争论统一意志。 破除迷信以后,重要的事情决策到现在不外乎两种方法:一是由一个人拍板,叫独裁;再就是大家选举,少数服从多数,叫民主。这多数原则,也就是随大流决策方法。洛克认为“根据自然和理性的法则,大多数具有全体的权力,因而大多数的行为被认为是全体的行为,也当然有决定权了”。这是自然法学家那里想当然正确的东西,也像麦克自圆其说的推断一样,不见得对。但对于不想依赖神灵的现代人听起来很爽,就奉为经典。 公元前五世纪的雅典是直接民主的典范,这里甚至不容许存在着权威。唯一的权威就是用选票算出来的“公民权威”。为了防止专制出现,人们设立了一个陶片放逐法。只要有足够多的票数,便可放逐大家认为潜在的独裁者。阿里斯提德素来以“公正者”著称。有一次“陶片放逐日”,一个不识字也不认识他的人,请他帮忙写上阿里斯提德的名字。阿里斯提德大惊,问这人什么时候得罪了你,非要放逐他?那人说,我并不认识他,只是听说他是“公正者”就烦!所以一定要放逐他。后来他果然被民主选举放逐出雅典。雅典为了防止专制驱逐了社会的精英,过于泛滥的直接民主,成为政治腐败、社会动乱的隐患。结果被北部崛起的马其顿王国所灭。 大多数人的意志往往是短视的,并不一定真正代表着大家的利益,尤其是在需要凝聚集体的力量抗拒外敌时。 选举最大的功效是阻止一成不变思路的政策。民主选举能够得到最好的结果是随机的。从心理上,各人的意志有机会表达,都有一定的概率被采用。从机制的效用上,这是一个大家都愿意相信遵从的,新的随机发生器。人们认为民主胜过独裁的最靠谱的理由其实是:在比烂时,它不是最烂的。这从博弈的角度很好理解:随机策略永远不是最差的。 既然民主最大的功用是随机发生器,为什么不用卜占呢? 其实在各种文明历史上早已如此。《尚书·洪范篇》说的是周武王在公元前 1122 年,取代商朝成为天子之后,去拜访商朝的遗贤箕子,想借重前朝的经验来治理天下,箕子总结了从夏朝以来的经验,其中的“稽疑”说的就是明辨疑惑的方法。 “稽疑:择建立卜筮人,乃命卜筮。曰雨,曰霁,曰蒙,曰驿,曰克,曰贞,曰悔,凡七。卜五,占用二,衍忒。立时人作卜筮,三人占,则从二人之言。汝则有大疑,谋及乃心,谋及卿士,谋及庶人,谋及卜筮。汝则从,龟从,筮从,卿士从,庶民从,是之谓大同。身其康强,子孙其逢,汝则从,龟从,筮从,卿士逆,庶民逆吉。卿士从,龟从,筮从,汝则逆,庶民逆,吉。庶民从,龟从,筮从,汝则逆,卿士逆,吉。汝则从,龟从,筮逆,卿士逆,庶民逆,作内吉,作外凶。龟筮共违于人,用静吉,用作凶。” 说是要建立制度选择专业人士管理占卜事宜,龟是龟甲卜兆,筮是用蓍草占卦。卜筮时,三人占卜,听取两人。重大疑难问题,用龟,筮,国君,官员,议员一起商量。还列出了详细的决策规则。仔细研究一下,比现代的决策程序上还要严谨更为民主。推算一下,如果夏商都是如此,那至少用了一千年。这么好的制度为什么后来不用了? 因为并非所有的博弈最佳策略都是混合策略,有些是有优势的纯策略。人的智慧渐开,对许多局面,聪明的人依靠逻辑推断,能在他人还懵然无知时确定了最好的纯策略,就取得了成功。人们自信心膨胀了,谁有点能耐都想自个儿拿主意,哪有耐心和后知后觉的一块猜拳?这占卜的事难以控制又处处受到制约。商纣王听说也是极聪明的人,他是谁都不听胡作非为,就不说他了。就是武王伐纣,这么大的事,占了几回卜都是不吉之兆,风雨暴至。众诸侯都心中恐惧,唯有太公望强之劝武王伐纣,武王于是出了兵。不听卜占,给蒙对了,也就开启了独裁胜利之门。以后卜占的地位每况愈下了,人们没有了尊崇之心老想作弊,用它来平息争论统一意志也就无从谈起了。谁是谁非在博弈后见分晓,从此就用对胜利登极者的个人崇拜来统一意志。在集聚着大众力量的绝对实力面前,局面简单,用不着什么随机的谋略,意志所向平推碾压过去就是了。直至耗尽势能。 经过了两千多年的发展,经济发展到了相互利益交错缠绕,谁都不想吃亏也不能掐死谁,朝中几派各有各的利益,都声称代表着一大帮人。当各派势均力敌,光靠大道理忽悠谁也不服谁时,这个博弈最佳策略只有混合的,这时大家又想起随机发生器了。 民主选举这个概念实在高明。它首先给人参与感,国家的命运由你手中一票来决定的;第二给你公平感,无论高低贵贱都是一票;第三给你合理感,结果由多数说了算。既然给你公平合理参与的机会,如果最后的结果与你的愿望相反,你也得认命。不然大家依法共讨之,如同过去奉天行事,这就能凝聚起大众的力量。所有这一切只是让大家相信这个随机发生器,并心甘情愿地接受它的结果。就像我们的远祖相信占卜一样。 有人生气了,“这选举是普世的真理,进步的潮流,你竟然说它的作用像占卜,真正是反动!” 有人这么生气可以理解。以前,对怀疑反映天意占卜 的 ,几千年前人们都是这么激动的。后来质疑天子和伟人时也是这么激动过。现在将信仰神灵换成相信人民,将沟通神灵的占卜改为反映民意的选举,见到对此稍有想法的,不屑动脑的人还是这么激动。这就是信仰的力量。其实在现实的世界无论何时,有实力才能参与博弈,否则只能被代表,有能力质疑才是民主社会合格的公民,如果不容思考只能盲从,你有什么智慧来看清选举中政客的忽悠,有什么把握分辨谁是真正代表着你和群体的利益?这时还不如去拜过佛祖、划了十字、默念原则后,依随机决定,更能发挥自己的积极作用。 (待续)
个人分类: 闲侃|7249 次阅读|26 个评论
占卜和推理(1)
热度 13 xying 2014-1-10 07:44
占卜由来已久,商朝是“每事占”,殷墟的甲骨文最多的就是占卜记录。例如“贞:元示五牛,蚕示三牛。”(问一下:给大王祭祀五头牛,给蚕神祭祀三头牛,好不好呀?) “庚寅卜,唯河害禾?”(庚寅这天卜占,今年会不会发大水淹了庄稼?”)很省脑筋,什么事都靠卜占。 周文王被纣王关在羑里时,悉心钻研占卜的学问,把原来的八卦规范化、条理化,演绎成六十四卦的《周易》。知识就是力量,他赢得天下也成为儒家最为推崇具有学术成就的君王。 耶稣出生时,几位智者根据星相和占卜推断他的到来和方向。基督徒经常也通过祈祷来获得启示。至于圣经中反对占卜,其实只是反对求别家神灵的指点,并不反对用自家的方法来倾听上帝的声音。 无论是用龟卜,算卦,星相,求签,罗塔牌,祈祷启示,还是心灵感应,占卜都是在随机中指定决策。在各种宗教中解释为沟通神灵,借由超自然的力量答难决疑。世界各种文明的早期,几乎所有的重要决策都是由占卜来决定的。 随着知识积累,理智渐开,人们觉得这个占卜太昧于事理,也难分正误,又受制于巫师解释,远不如按照常识和逻辑推断来得可靠。占卜成了人类文明进步史上最早被斥为迷信的行为。有学问的人认为古人愚昧,用占卜来糊弄自己以求心安。但这解释不了为什么它会在各种文明中广泛地存在,并且至今仍不时地被人应用。常识和逻辑推断一定比占卜更可靠吗?先听一个故事。 麦克向公主的父亲求婚。国王把他带到五个房间前说:“有一只老虎藏在这里。你逐个把门打开。如果你足够聪明,能在打开那扇门之前猜到。我就把女儿嫁给你。提醒一下,这是你意想不到的。” 麦克想:“有你这句提醒,我就可以用逻辑来推理了。如果老虎在第五间,打开前面四间都一定是空的,这种情况在打开这房间之前就能猜到它在这里。这不是意想不到的,所以老虎不可能在这里。 把第五间排除了,老虎只能在剩下四个房间里。同样推理,也不可能在这最后的第四间。如法论证,老虎也不可能在第三,二,一间里。” 麦克信心满满地相信:如果老虎是意想不到的,就不会在这些房间里。但是当他依次打开第二个门时,意想不到地跳出一只老虎来。 国王说的话得到了验证,都是真的。那么麦克推理怎么错了呢? 这个“意想不到的老虎”是认知科学的悖论,很有名,在这几十年中外学术期刊上都有些论文来分析。在逻辑学,认知科学,哲学和博弈论上都有些讨论。在英文上多数以“ Surprise Examination ” 或 “ UnexpectedHanging Paradox ”为题。 其实在这里麦克并不能根据国王的话来推理,因为它们形成自相矛盾的断言。从这里你可以推出老虎在任何一个房间,也可以不在那一间。 有人说:你这信息太少,要是多点就好判断了。 行,改写一下故事。 公主得了内部消息后,偷偷告诉麦克:“老虎关在第二个房间,但这消息也许是假的。” 麦克能够据此做出正确的逻辑判断吗?也不能。如果相信“老虎在第二个房间”,则与后半句冲突。如果按后半句置之不理,又辜负了公主一番心意。 朋友说:“这时候就不是靠逻辑了,麦克按照他的心理状态和对公主的了解,赌一下押在哪一边。”现实世界上行事大抵如此。这时候最好要祷告了。 我们这个世界并不缺乏大家都相信的许多大道理,它们放在一起彼此矛盾、互不相容。人们都可以从某个大道理,依照一定的路径,非常逻辑地推出你所需要的东西。在政治上尤其如此。我们的伟大导师都说过:“右派可能利用我的话得势于一时,左派则一定会利用我的另一些话组织起来,将右派打倒。” 人们之所以还口沫横飞,引经据典,气壯如牛地将自己心中早已认定的私见,用最高指示或普世价值论证出来,大约不是为了蒙自己,就是为了蒙别人。 所以麦克要讲出“婚姻自主,民主人权”的大道理,国王也可以用“女儿幸福,家长把关”的大道理顶回去。彼此针锋相对的结论都是无懈可击地从大道理推理来的,只要公主还爱麦克,又不想和老爸闹翻,谁都不亏理。大道理碰到明白人都是说不出结果来的,要不世界上怎么不缺战争呢? 国王和麦克都是明白人,不玩嘴皮子了,还是用实力对决来得清爽。文明一些,就赌个输赢。这个故事的议题就从逻辑的问题转为博弈的问题了。 要最不费什么心思的赌赛就是:国王随便将老虎关一个房间。麦克猜一次,有 20% 机会中奖,纯粹碰运气,没有谁蒙谁的问题,就是没什么技术含量,去求神拜佛也对麦克不公平。要是国王还想考究麦克的智商,那就要有个精细的比赛规则。麦克可以猜多次,直到见着老虎。要猜着了老虎, 10 分;没猜着碰到老虎,负 10 分;没老虎说有,扣些分,比如说 3.78 分,再接着猜。最后看积分正负定输赢。 可以证明:这是一个公平的博弈,双方都没有优势策略和纯策略的纳什均衡,只有一个混和策略的纳什均衡,在均衡处双方的数学期望是 0 。国王的最优策略是以 16% , 13% , 11% , 10% , 50% 的概率把老虎关进序号为 1 , 2 , 3 , 4 , 5 的房间。麦克是以 50% , 10% , 11% , 13% , 16% 的概率选取他的策略从第一,二,三,四,五号房间开始依次每个都说有老虎。这是用博弈的理论证明的最佳策略。 问题是国王和麦克采用概率分布的混合策略,到实现时还是要选取出具体的一个策略。按照概率取定这个房间的过程意味着放弃逻辑的推断而将命运交付给卜爻的随机性来决定。这就是用科学理论论证出来最为理性的回答:这时候的决策,占卜比推理更可靠! (待续)
个人分类: 闲侃|8132 次阅读|28 个评论
随机Fourier特征
murongxixi 2013-11-22 14:55
核方法虽然可以得到非线性的分类器,大大提高分类性能,但是当数据集很大时,就跑不动了。以支持向量机为例,对于一个有$m$个样本的数据集$S = \{ \boldsymbol{x}_1, \dots, \boldsymbol{x}_m \}, \boldsymbol{x}_i \in X \subseteq \mathbb{R}^d$,核支持向量机需要计算核矩阵并维护所有的支持向量,故训练开销和测试开销分别是$O(m^2 d)$和$O(md)$,而线性支持向量机可以直接存储$\boldsymbol{w} \in \mathbb{R}^d$,计算$f(\boldsymbol{x}) = \boldsymbol{w}^\top \boldsymbol{x}$只需要$O(d)$的时间开销,因此一般来说,线性支持向量机比核支持向量机要快得多。 于是就有许多学者研究如何加速核方法,使得它也能用于大规模学习问题($m$很大的情况),其中一个路子就是做核近似,即显式地构造映射$z : \mathbb{R}^d \mapsto \mathbb{R}^n$ 使得 \begin{align*} k(\boldsymbol{x}_1, \boldsymbol{x}_2) = \langle \phi(\boldsymbol{x}_1), \phi(\boldsymbol{x}_2) \rangle \approx z(\boldsymbol{x}_1)^\top z(\boldsymbol{x}_2) \end{align*}其中$\phi$是对应于$k$的某个核映射。有了$z$后,我们可以将数据集映射到新的特征空间$Z \in \mathbb{R}^n$中,在这个特征空间中使用线性模型就近似于在原来的特征空间中使用核$k$了,这时通过直接存储$\boldsymbol{w} \in \mathbb{R}^n$可以使得计算$f(\boldsymbol{x}) = \boldsymbol{w}^\top z(\boldsymbol{x})$只需要$O(nd + n)$的操作,远远小于原来$O(md)$的时间开销。 随机Fourier特征就是这个路子的一个代表性方法,但是它还不能解决任意的核,只能用于平移不变核,即满足$k(\boldsymbol{x}_1, \boldsymbol{x}_2) = k(\boldsymbol{x}_1 - \boldsymbol{x}, \boldsymbol{x}_2 - \boldsymbol{x})$的核,例如: Gaussian核,$k(\boldsymbol{x}_1 - \boldsymbol{x}_2) = e^{ -\frac{||\boldsymbol{x}_1 - \boldsymbol{x}_2||_2^2}{2 \sigma^2} }$。 Laplacian核,$k(\boldsymbol{x}_1 - \boldsymbol{x}_2) = e^{ - ||\boldsymbol{x}_1 - \boldsymbol{x}_2||_1 }$。 Cauchy核,$k(\boldsymbol{x}_1 - \boldsymbol{x}_2) = \prod_d \frac{2}{1 + ||\boldsymbol{x}_1 - \boldsymbol{x}_2||_d^2}$。 它主要基于这样一个事实, 任意平移不变核$k(\boldsymbol{x}_1 - \boldsymbol{x}_2)$都是某非负测度的Fourier变换 ,由于概率也是一种测度,它是归一化的测度,因此只要对$k$进行适当的拉伸,就可以使得$k(\boldsymbol{x}_1 - \boldsymbol{x}_2)$是某概率分布$p(\boldsymbol{w})$的Fourier变换,于是 \begin{align*} k(\boldsymbol{x}_1 - \boldsymbol{x}_2) = \int_{\mathbb{R}^d} p(\boldsymbol{w}) e^{-j\boldsymbol{w}^\top (\boldsymbol{x}_1 - \boldsymbol{x}_2)} d \boldsymbol{w} \\ = \int_{\mathbb{R}^d} p(\boldsymbol{w}) \cos (\boldsymbol{w}^\top (\boldsymbol{x}_1 - \boldsymbol{x}_2)) d \boldsymbol{w} \\ = E_{\boldsymbol{w} \sim p(\boldsymbol{w})} \\ = E_{\boldsymbol{w} \sim p(\boldsymbol{w})} \end{align*}其中第二个等号是由于$k(\boldsymbol{x}_1 - \boldsymbol{x}_2)$和$p(\boldsymbol{w})$都是实函数,因此虚数部分可以丢弃。若按照分布$p(\boldsymbol{w})$采样出$\boldsymbol{w}_1,\dots,\boldsymbol{w}_n$,那么有 \begin{align*} \ \ \ \ E_{\boldsymbol{w} \sim p(\boldsymbol{w})} \\ \approx \frac{1}{n} \sum_{i=1}^n \cos (\boldsymbol{w}_i^\top \boldsymbol{x}_1) \cos (\boldsymbol{w}_i^\top \boldsymbol{x}_2) + \sin (\boldsymbol{w}_i^\top \boldsymbol{x}_1) \sin (\boldsymbol{w}_i^\top \boldsymbol{x}_2) \\ = \langle z(\boldsymbol{x}_1), z(\boldsymbol{x}_2) \rangle \end{align*}其中 \begin{align*} z(\boldsymbol{x}_1) = \frac{1}{\sqrt{n}} \left( \cos (\boldsymbol{w}_i^\top \boldsymbol{x}_1), \dots, \cos (\boldsymbol{w}_D^\top \boldsymbol{x}_1), \sin (\boldsymbol{w}_i^\top \boldsymbol{x}_1), \dots, \sin (\boldsymbol{w}_n^\top \boldsymbol{x}_1) \right) \\ z(\boldsymbol{x}_2) = \frac{1}{\sqrt{n}} \left( \cos (\boldsymbol{w}_i^\top \boldsymbol{x}_2), \dots, \cos (\boldsymbol{w}_D^\top \boldsymbol{x}_2), \sin (\boldsymbol{w}_i^\top \boldsymbol{x}_2), \dots, \sin (\boldsymbol{w}_n^\top \boldsymbol{x}_2) \right) \end{align*}这样我们就得到了映射$z$,而前面的分布$p(\boldsymbol{w})$可以通过Fourier逆变换得到 \begin{align*} p(\boldsymbol{w}) = \frac{1}{(2 \pi)^n} \int_{\mathbb{R}^d} e^{j \boldsymbol{w}^\top (\boldsymbol{x}_1 - \boldsymbol{x}_2)} k(\boldsymbol{x}_1 - \boldsymbol{x}_2) d (\boldsymbol{x}_1 - \boldsymbol{x}_2) \end{align*}特别地,若$k$是Gaussian核,即$k(\boldsymbol{x}_1 - \boldsymbol{x}_2) = e^{ -\frac{||\boldsymbol{x}_1 - \boldsymbol{x}_2||_2^2}{2 \sigma^2} }$,那么由Gauss型函数的Fourier变换还是Gauss型函数知 \begin{align*} p(\boldsymbol{w}) = e^{- \frac{ ||\boldsymbol{w}||_2^2 \sigma^2}{2}} \sigma^d (2 \pi)^{-\frac{d}{2}} \thicksim \mathcal{N}(\boldsymbol{0}, \Sigma) \end{align*}其中$\Sigma$是$d \times d$的对角阵,对角线上每个元素都是$\sigma^{-2}$,也即$\boldsymbol{w}$的每一个分量都独立地服从于$\mathcal{N}(0, \sigma^{-2})$。 以上就是随机Fourier特征的大致思路,注意计算每个样本$n$个新特征的时间开销是$O(nd)$,因此这个方法的训练开销是$O(mnd)$,测试开销是$O(nd)$,相比于原来核方法都提高了不少。 今年,ICML上有一篇文章提出了一个新算法叫Fastfood,对随机Fourier特征进行了进一步加速,其着眼点就是在计算$n$个新特征这一步。若设$\boldsymbol{W}^\top = $,其中$\boldsymbol{w}_i$采样自$p(\boldsymbol{w})$,那么这一步可以简单写为$\boldsymbol{W} \boldsymbol{x}$。要想突破矩阵向量乘的计算瓶颈,必须充分利用矩阵本身的一些信息,这里$\boldsymbol{W}$的每一个元素都采样自$\mathcal{N}(0, \sigma^{-2})$,而正是这一点可以使得它可以近似地写成$\boldsymbol{H} \boldsymbol{G}$,其中$\boldsymbol{H}$是一个Hadamard矩阵,$\boldsymbol{G}$ 是一个Gauss对角阵,利用Hadamard矩阵右乘向量只有$O(d \log d)$的开销,可以将$\boldsymbol{W} \boldsymbol{x}$的计算开销降到$O(n \log d)$。
个人分类: 机器学习|126 次阅读|0 个评论
[转载]对随机现象的刻画
haijunwang 2013-4-22 00:12
转载地址: http://blog.sciencenet.cn/blog-219728-273927.html 在概率论中,刻画随机现象的量叫做“随机元”。当然,一般的教科书都不怎么会用这个概念。这个概念涵盖了大家熟悉的“随机变量”,“随机向量”以及“随机过程”。 那么,概率论如何来刻画“随机元”? 最重要的概念是“概率分布”。概率分布告诉了我们这个随机元处于不同取值的“可能性”,也就是“统计性质”。可以说,概率分布一旦确定,原则上我们对相应的随机现象就进行了完整的刻画。当然,这里要提示大家,对于多元随机变量以及随机过程,我们这里所指的“概率分布”是联合概率分布。 但是,事实并不是想象的那般顺利。一般要得到概率分布是不大容易的事情。这时候,我们退一步,希望找到一些“粗略”一点的特征来刻画我们关心的随机现象。 当中最重要的当然就是期望,也可以叫做平均值。期望的重要性不言而喻,但是,对于不同的情况,期望的效用是不一样的。对于“正态分布”这样的“单峰”分布,期望非常好的刻画了分布总体的平均性质,也就是我们可以断言服从正态分布的总体,大部分个体是集中在“均值”附近;但是如果对于“凹”型,或者双峰的分布,期望虽然也揭示了系统的平均行为,但是这时我们不能说这个“均值”反应了总体分布的“倾向”,而仅仅是个数学上的平均而已。就像我们说两个班里的平均分都是80,但是A班同学大部分考80;B班同学大部分是100和60。对于这两个班,80的意义就是不一样的。 所以,光有期望是不够了,我们还关心这个分布偏离平均值的情况。于是引出方差的概念。用很时髦的话说,我们不仅关心平均“收益”,还关心“风险”。方差就是对风险的一种度量。 需要指出的是,如果是多元随机变量,我们还应刻画不同分量之间的关系,于是就有协方差矩阵的概念。 数学上说,期望和方差只是揭示了随机变量的“一阶矩”和“二阶矩”性质。那大家会问,“更高阶矩”涵盖了怎样的新信息?是否还能像期望方差那样有相当直观的涵义?答案是有的,三阶矩和四阶矩都有具体的统计学意义(偏度和峰度),大家可参阅相关教材。 但是,我这里想跟大家交流另外一个非常有意思的问题——“矩问题”。刚才我们讲到,如果对概率分布难以做到完全了解,就只能通过“期望方差”这些特征来进行粗略的刻画。那么,如果我有办法得到“任意阶矩”的信息,是否就能逼近对于分布的完整信息?这在概率论界是一类很著名的问题。 这里给大家一个好用的结论:如果随机变量的取值是有界的,那么矩问题就是可行的。也就是说,通过对许多阶矩的测量,就可以渐近的掌握分布的信息。
个人分类: 数学原理|1347 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-17 21:44

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部