科学网

 找回密码
  注册

tag 标签: 概率分布

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

伊辛模型I --- 从概率分布到相变
zhongwei2284 2018-4-3 14:15
1. 引子: 一个课堂测验 Vs 伊辛模型 现在我们先玩一个测试游戏,想象一下现在我们要给一群小学生做某种测验,上面有许多题目,每道题都只是判断对错,每道题如果答对了正确答案记为 1, 答错了则记为 -1 ,但是题目几乎都是初高中甚至大学的问题。学生一共有 100 个,一共分十列坐着,每列 10 个学生。每个学生前面有一台电脑,测试在电脑上面进行。规则如下: a 每个学生的电脑上面会显示一些别人选的答案,但也只是会显示周围四个人的答案 ; b 每道题答题时间 3 分钟,在到时间前可以根据周围同学的答案对自己的答案进行修改 ; c 每道题上面标注了相应的奖励分数,游戏结束后根据所得到的奖励分数领取相应的奖品,当然分数越高奖品越好 ; d 坐在边上的同学只能看到他周围 3 位邻座同学的答案,而坐在角落的同学只能看到周围两位同学的答案。 最后,测试结束后,每个同学在不同奖励的题目上面的平均分数会是多少呢?很有可能出现如图 1 所示的情形。即当某道题目奖励分数很高的时候,要么大多数人都答对,要么大多数人都答错 ; 而当某些题目没有奖励或者奖励很少时,平均的分数很可能是 0, 因为大部分人都觉得无所谓,加上题目又不知道它的真实答案,索性随便蒙一个,而周围的人的答案也没什么分析和参考的必要了。 啊,其实这个就是现实版的伊辛模型呀!只不过,伊辛模型里面没有学生,有的只是自旋,奖励的倒数类似于温度,每个’小磁针’可以朝上也可以朝下。到底是怎么回事呢?我们跑到伊辛模型里面去看看吧! 图 1 测试的可能出现的每道不同奖励的题目的平均分数。当然,现实肯定不会是完全这样,并且由于人的因素比较复杂,结果必然更加复杂。 2 伊辛模型及其模拟:以二维为例 伊辛模型是统计力学中最为人所熟知的模型之一,它一开始用于描述物质的铁磁性,模型中包含描述单个原子磁矩的参数σ i , 其值为+1表示自旋朝上,-1则表示自旋朝下。其哈密顿量可以表示为 其中,J为相互作用参数,h为外场强度,ij表示近邻相互作用,即每个自旋只与周围最近的自旋有相互作用,二维模型中周围一共有四个'邻居'。 1924年的时候,伊辛证明了该模型的一维情况是没有相变的,以后也是以伊辛的名字命名了该模型。然而,需要指出的是,如果这个模型任何维度上都没有相变,那就无趣了。还好,事实证明该模型在大于1维的空间中会出现相变,从此,一股伊辛模型的相变的探索狂风吸引了许多科学家,从该模型中取得的成就也是统计力学中的重要一章,我们对于相变现象的理解从这里开始更加深入了。从早期各种平均场论的理论,到后来昂萨格给出的二维条件下的伊辛模型的严格解。伊辛模型带来了许多振奋人心的进展。与此同时,人们开始把这个手中把玩的'玩具'变成了有用的工具,它被用到许多的现象中,如合金中的有序-无序转变、液氦到超流态的转变、液体的冻结与蒸发、玻璃物质的性质、森林火灾、城市交通等等。需要提及的是对于三维伊辛模型的严格解,至今都没有得到。因而,计算机模拟成了研究伊辛模型的重要手段之一。那如何模拟伊辛模型呢?我们先来看看最常用的算法之一,即Metropolis 算法是如何模拟伊辛模型的吧: a 首先要建立格点,给每个格点一个初始化的值; b 随机选择第i个自旋,如果该自旋是朝上,即 ,假设该自旋翻转即 σ i 的值从+1变成了-1,计算翻转前后能量的差值ΔE,如果 ΔE =0,翻转成功,否则翻转成功的几率为 .T为系统的温度。 c 进行相关参数的计算。 当然,在开始计算相关参数之前,需要有一个预热过程,即先让系统达到平衡态。 图2 不同温度时二维伊辛模型的平衡态时的图像 图3 利用Metropolis算法计算得到的平均磁化强度随着温度的变化图,系统尺寸为L=20. 3. 边界条件的影响 边界条件对于计算模拟来说,有时候也是相当重要,对于不同的研究课题如果选错了边界条件可能得到的结果会有点出入。对于伊辛模型而言,大多数情况下,我们会用周期性边界条件,有时候也会用到例如引子中介绍的那样,也就是假设周围的自旋不存在,我们称之为自由边界条件。尤其对于存在二级相变的系统,有限的尺寸以及不同的边界条件对临界点处的行为有不小的影响。常见的边界条件如图4: 图4 不同的边界条件。a中左边的为普通的周期边界条件,右边的则是扭曲的周期边界条件;b中一个是自由边界条件,另一个则是半周期半自由边界条件;c是边界加外场的边界条件。 假如我们更关心一整个系统的性质,常常选择的是周期边界条件(a);在研究一个系统的自由边界的时候,常常用的就是自由边界条件(b);在研究浸润等现象的时候,需要在某个边界加入外场(c)。总之,边界条件的选取有时候需要花点时间思考思考。要不然有时候可能会得到一些不一样的结果。 4. 从概率分布到相变 总算到了这里!对于伊辛模型的大多数的结果,如能量随温度的变化,比热随温度的变化等,不难得到,因而第2节只是给出了一个磁化强度的结果。而这篇博文其实最想关注的是分布,什么的分布?当然是磁化强度啊! 图5 磁化强度随时间的变化,T=Tc 我们先来看看磁化强度随时间的变化(T=T c 为例,图5),这就是一个随即变化的时间序列,通过这个变化的序列,我们可以得到不同温度下磁化强度的分布图(图6)。 图6 磁化强度的分布随着温度的变化 哈!看呀,不同的温度下的分布原来长这样。其中,当 的时候,分布是两个高斯分布的叠加,而当温度高于临界温度的时候,磁化强度的分布原来的高斯分布呀!原来在相变发生的时候,磁化强度的分布也发生了有意思的变化!!至于这种分布产生的变化会带来什么影响呢? 相变的发生伴随着对称性的破缺,此时高斯分布不再,磁化强度在临界点会出现 反常扩散 ,这又是怎么一回事?我们将在下一篇博文中介绍。 利用得到的分布随着时间的变化,我们还可以得到自由能随着温度的变化呢!利用公式 得到自由能的结果如图7所示: 图7 由磁化强度的分布随温度的变化得到的自由能随着温度的变化图 结果有没有让你想起相变的朗道理论呢?当相变的发生,自由能也发生改变,类似于一个小球在势井中,温度较高的时候,它喜欢在势井的最低点附近转悠,当温度降低到发生相变时,小球不得不做新的选择了,此时有了两个最低点,有时候它会跑到左边的最低点附近溜达,厌烦了它就去右边的最低点附近转转。 当然,有时候我们只对相变点发生的故事感兴趣,这时候利用标度变换,我们可以得到更多关于伊辛模型的规律(图8)。 图8 不同系统尺寸L下,伊辛模型中磁化强度随着温度的变化规律。其中β=0.125是磁化强度的临界指数。 5. 只是个开始 虽然伊辛模型已经被研究了快一百年了,但是里面还是有一些很有意思的事情等着我们去了解。也依然还存在着一些未知的秘密。这只是个开始,不是结束!! 参考文献: K.Binder and D.W.Heermann, Monte Carlo Simulation in Statistical Physics: An introduction M.Newman and G.T.Barkema, Monte Carlo Methods in Statistical Physics
个人分类: 那些贝壳们|2589 次阅读|0 个评论
关于算术统计平均值为常量前提下的概率分布新理论初探
冯向军 2017-8-8 09:38
关于算术统计平均值为常量前提下的概率分布新理论初探 美国归侨冯向军博士,2017年8月8日写于美丽家乡 【摘要】在变量xi的 算术统计平均值为常量前提下,至少存在两种类型的 概率分布pi:标准负1次幂律和不是 标准负1次幂律的某种分布。这其中,i = 1,2,...,n。 标准负1次幂律 满足 pixi = C = 常量。 不是 标准负1次幂律的某种分布则满足 pixi 不等于常量。任何分布pi(xi,a,b)只要在数学上满足: p1(x1,a,b)x1 + p2(x2,a,b)x2 + ...+ pn(xn,a,b)xn = C1 p1(x1,a,b) + p2(x2,a,b) + ... + pn(xn,a,b) = 1 就都是可能的 变量xi的 算术统计平均值为常量前提下的 概率分布pi。这其中:a,b为待定参数,C1为常量, i = 1,2,...,n。 变量xi的 算术统计平均值为常量前提下的 概率分布pi具体取何种分布f(xi),则处决于 变量间隔xi之内给定事件出现的总数的统计平均值 Freq = -log(f(xi)) (1-1) 的具体形式。此时,概率分布被视为 变量间隔xi之后给定事件才出现的概率分布。 当 Freq与变量xi成正线性关系: Freq = -log(a) + bxi,b 0 就有 变量xi的 算术统计平均值为常量前提下的 概率分布pi为负指数分布 pi = aexp(-bxi), i = 1,2,...,n。 当 Freq与变量的对数log(xi)成正线性关系: Freq = -log(a) + blog(xi),b 0 就有 变量xi的 算术统计平均值为常量前提下的 概率分布pi为幂律分布 pi = axi -b , i = 1,2,...,n。 【举例】 表一是三组4元变量和给定的变量的算术统计平均值C。 C x1 x2 x3 x4 4.266666667 16 8 4 2 8.1 81 27 9 3 12.04705882 256 64 16 4 表一:三组4元变量和给定的变量的算术统计平均值C。 它们同时既可以对应表二所示的标准负1次幂律分布(4c = C),又可以对应表三所示的负指数分布。 c/x1 c/x2 c/x3 c/x4 0.0667 0.1333 0.2667 0.5333 0.0250 0.0750 0.2250 0.6750 0.0118 0.0471 0.1882 0.7529 表二:标准负1次幂律分布。 p1 p2 p3 p4 0.043283 0.1672 0.3287 0.4608 0.003429 0.1119 0.3577 0.5269 0.000046 0.0607 0.3659 0.5733 表三:负指数分布。 表四给出了负指数分布所对应的变量间隔xi之内给定事件出现的总数的统计平均值Freq(xi),i = 1,2,3,4。 Freq(x1) Freq(x2) Freq(x3) Freq(x4) 2.8928 1.5413 0.8655 0.5276 5.4227 1.9370 0.7751 0.3878 9.7545 2.5711 0.7752 0.3263 表四:负指数分布所对应的变量间隔xi之内给定事件出现的总数的统计平均值Freq(xi),i = 1,2,3,4。
个人分类: 决定性概率论|1968 次阅读|0 个评论
那些随机变量的倒数的概率密度分布函数与原变量同类?!
热度 3 zhangxw 2015-12-2 17:18
那些随机变量的倒数的概率密度分布函数与原变量同类?! 张学文, 2015/12/2 一个随机变量的概率密度如果是正态分布,那么这个变量的倒数的概率分布也是正态吗?我现在的回答是:不是。 如果该随机变量的原概率分布符合幂律呢?我的回答是:是的。即该随机变量的倒数的概率分布依然符合幂律! 以上就是我最近的觉悟(不是动手推算!)。 我最近形成这个认识是基于: 1. 在分析气象学中的降水量、水汽压力的比值问题时,注意到它和它的倒数都具有明确的物理意义。 2. 在分析到这个比值的概率分布问题时,感到我遇到了 变量与变量的倒数的概率分布存在什么关系的问题。 3. 在网友提示下回忆到变量的函数的概率分布问题在概率论中是早有介绍的知识:其概率分布是 原分布函数再乘以该变量的微商 ,而互为倒数就是函数关系的一个特例。于是本问题是函数的概率分布问题的特例。 4. x 的倒数就是 1/x ,其微商应当是 1/x 2 , 所以原变量的概率分布函数乘以 1/x 2 ,就是其原变量的倒数的概率密度函数了! 5. 这样,随机变量的倒数的分布函数问题就全部明确了。 6. 而当原分布函数中本来就含有变量的幂的情况时,新变量的概率分布函数仅是改变了幂的次数,而没有改变函数的类型。 7. 我浏览概率分布表,注意到,概率密度是幂函数(所谓幂律), 是对数正态 ,是韦伯分布,是(?)分布时都含有幂函数部分,所以随机变量的概率密度函数在其变量变成为它的倒数时的概率分布函数依然是原类型的分布(自然参数可以有变化)。 以上就是我的考虑与认识过程,这对吗? 那些随机变量的倒数的概率密度分布函数与原变量同类?!前面第 7 条就是我认为的答案,它们可能不对、不全,欢迎补充和批判。 这么考虑有问题吗?欢迎指正!
个人分类: 一般科技.2.|9584 次阅读|7 个评论
在两条曲线谁顺眼问题的背后
热度 2 zhangxw 2015-11-26 17:19
在两条曲线谁顺眼问题的背后 张学文, 2015/11/26 昨天我根据两组有 800 多个数据而求得了两个统计曲线,随后我发一博客 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=938503 征集大家对它们之中谁更美观,合理,科学的看法 … 感谢几位朋友在博客评论中发表了自己的见解。 我问的问题是否应当有答案?什么样的答案比较合理,科学,有依据? 对此我现在不好随便说,但是 但是现在我 需要告诉大家:其实这两组数据来自一个数据源 (的不同数学处理)! 让我举个例子: 如果一个学校有 800 名学生参加百米短跑测验。于是老师就有 800 个学生百米短跑成绩的数据 800 个。对这些数据的统计就可以获得不同百米成绩的学生各有多少的对应曲线(学生个数 - 百米成绩关系曲线)。对吧,我们把它称为曲线 1. 其实我们还可以分析每个学生的跑百米的速度,于是获得 800 个学生的 800 个速度的数据。面对这些数据,也可以分析不同百米速度的同学各有多少以及它对应的(速度 - 学生人数)曲线。我们把它称为曲线 2. 于是针对学生的百米成绩,我们就可以分析两组曲线,一个是不同百米秒数的学生各有多少,另外一个是不同百米速度的学生各有多少。 显然百米的秒数越小,速度就越大,所以以上两个统计分布曲线的含义是不同的,其外观也是不同的。 同时,大家也会觉悟到百米秒数与百米速度成绩是互为倒数的。 于是我们的两个分布曲线(频数分布,对应概率密度分布函数)实际是两个 互为倒数 的随机变量的概率分布曲线。 这个分析说明我们:仅从数学角度看,我们似乎无权说哪个曲线是漂亮的,而另外一个是别扭的,不科学的。在数学面前它们的地位应当是相同的! 好了,关于两组随机变量互为倒数的数组,关于其概率分布的外貌似乎我们无权说谁好看,谁不好看 … 以上就是我企图表达的问题的数学内容。不过, 800 学生百米成绩是个容易让大家理解问题的例子。不是我的博客中的原始数据的含义。我的原始数据是檀成龙给的 71 个气象站的 12 个月的降水量与水汽压力的再计算的比值,以及此比值的倒数。这些比较专业的变量不利于大家理解本问题的核心点,所以我淡化了它,而改用学生百米成绩与速度的相关例子了。 也许下面的话是初步结论: 取值只能大于 0 的随机变量 x 的概率密度分布函数与该随机变量值的倒数 (1/x) 的概率密度分布函数在物理上可能都具有物理意义。它们的概率密度函数是不同的,但是他们的概率密度应当是有关的。这个关系是什么呢 — 我提出这个疑问,不知道概率论中是否有答案。 至于我关心的降水量与水汽压力的比值问题概率分布函数,以后会继续具体分析,现在就不具体议论了。 补(2015.11.26,21时) 姬扬 2015-11-26 19:21的意见应当点到了要点: 这个问题是标准教材里的内容 第二章04随机变量函数的分布密度 http://wenku.baidu.com/link?url=M7qg0lsjUSLxf2kkn3KCE-nlVssJVANeV1NmOQkdpZPIRlhOScwObhMW9uxG_v72tMi2pPNiiTfZ9BApnbyYMZi7alX_v1QD4tOIHa47wkq 博主回复(2015-11-26 20:40) : 谢谢提示,就是。 它应当归入随机变量的函数的概率分布这个大类中。 针对倒数关系,其概率密度应当是原值的概率密度乘以(1/x)的平方?!
个人分类: 统计、概率、熵、信息、复杂性.1.|3464 次阅读|8 个评论
[请教] 所有的概率分布都可以转化成正态分布吗?
热度 7 zlyang 2015-8-8 09:48
所有的概率分布都可以转化成正态分布吗? 请问: (1)所有的连续概率分布,都可以转化为正态分布吗? (2)所有的离散概率分布,都可以 转化为“离散形式的”正态分 布吗? 感谢您的指教! 哪有权威的参考资料(特别是近年权威的英文资料)? 感谢您对下面内容的解释! 以下图片截取自高惠璇教授的《统计计算》,具体版本不详。感谢高老师! (1) (2)
16514 次阅读|23 个评论
另一些分布函数--《气象随机场的分布函数及其转移矩阵》-10
zhangxw 2014-7-10 16:38
另外一些气象分布函数 -- 《气象随机场的分布函数及其转移矩阵》 - (之 10 ) 张学文 , 2014/7/9-10 2014-7-9 注:本内容的相当一部分内容取自《组成论》( 2003 年中国科学技术大学出版社)一书的第 19 章。 本系列是以气象随机场为核心分析对象的,在这种视角下,单站的气象数据仅是气象场的特例。因此我们不会把单个气象站的气象变量分析作为重点,但是也不会把它们开除。从气象统计分析的发展历史角度看,现在的气象场分析实际是单站气象变量分析的发展。这里我们就简单归纳一些单站的气象变量的概率分布的基本认识。 气象站有50年的温度资料,我们可以问不同的温度(的天气)占据了多少时间?这就是把气象资料(原始列表)换算为分布函数。这个问题可以利用气象资料计算。过去,在气象领域,这经常被称为气象要素的频率分布,它属于概率论和统计学的语言下的研究对象。其频率分布的理论分布就是在资料无限长的情况下对应的概率分布函数。 与此类似,气候学还研究最高温度、最低温度、气压、风向、风速、湿度、降水量等等不下数十种含义不同的气象要素(标志变量)的分布问题。这些问题都在气候统计学中有一定的地位,有相当的实用价值,也做过比较多的研究。它们都是气候统计研究的重要内容。 下表给出了8种气象要素在当地的出现概率问题。它们仅是数十不同含义的气象要素的分布函数中的一部分。对于不同的地点其分布函数也不尽相同。这里仅是示例。气象中要研究的这一类分布函数太多了。 大的工程项目都要求对与工程有关的重要气象要素进行计算。这些计算既要有尽量长的气象历史资料也要科学地归纳出概率分布函数。尤其是极端气象条件的出现概率(经常以N年一遇的数值是多少的形式给出答案). 气象要素的概率分布函数的一般示例 表 广义集合 个体名称 标志(变量)名称 分布函数要描述的问题 分布函数 1 当地温度的长时间的记录 一个短时段 温度 不同温度的出现概率是多少 正态分布为主 2 当地气压的长时间的记录 一个短时段 气压 不同气压的出现概率是多少 正态分布 3 当地相对湿度的长时间的记录 一个短时段 湿度 不同相对湿度的出现概率是多少 Beta 4 当地风的长时间的记录 一个短时段 风的方向 不同方向的风的出现概率是多少 各地不同 5 当地风的长时间的记录 一个短时段 风的速度 不同速度的风的出现概率是多少 Weibull 6 当地云的长时间的记录 一个短时段 云量 不同云量的出现概率是多少 U 型分布 7 当地蒸发的长时间的记录 一天 蒸发量 不同蒸发量的出现概率是多少 8 当地降水量的长时间的记录 一年 当年内的一日最大降水量 一年内不同的日最大降水量的出现概率是多少 极值分布 如果以全球大气(广义集合)的化学成分为标志值,以每克空气为个体,我们还形成了关于大气化学成分的分布函数。如果以全球大气(广义集合)的地理位置为标志值,问不同位置的大气各有多少,这就是大气密度分布函数(见后)。以上概括表明各种气象对象正从被动地“统计统计”,变成了寻找分布函数的公式和解释为什么它服从这个公式。一个系统性的知识正在形成。 另外,每个地点的气象要素的概率分布与同一时刻的全球的气象要素的分布都是用相同的气象资料换算出来的。所以这些 不同含义的分布函数之间的应当是存在某些关系的 。 另外气象统计分析的对象也可以是天气系统。气 旋、反气旋、台风、龙卷风等等都是天气学中的“天气系统”。它们是大气环流中的重要成员,并且有新生、移动、发展和消亡。我们可以把每个天气系统看作是一个个体,把一定地区一定时段的所有的气旋(或者反气旋、台风 … )看作是一个广义集合。有了广义集合自然就引出了一批分布函数,于是可以问:强度不同的气旋各有多少等等问题。以天气系统为对象的这些研究与过去所谓的“天气学统计”关系密切。鉴于在老的理论思路影响下,这一类研究被认为是没有动力学的,低级的。所以它受到了冷落。记得我国张培忠在这个方面做了不少有价值的工作。封国林、曹鸿兴揭示了关于台风、温带气旋的负幂分布规律 。他们的工作符合分布函数的思路,并且具体得到了分布公式。把分布函数概念用到这个领域以后,使我们重新看到了这方面工作的重要性,而等待我们做的事还有很多。 不同的天气系统组成的广义集合和分布函数示例表 广义集合 个体名称 标志(变量)名称 分布函数要描述的问题 分布函数 1 西太平洋地区的热带气旋 每个热带气旋 热带气旋的深度(用闭合等压线的圈数表示) 不同深度的热带气旋各有多少 负幂函数 2 西太平洋地区的热带气旋 每个热带气旋 热带气旋的最大风力 不同(最大)风力的热带气旋各有多少 负幂函数 3 西太平洋地区的台风 每个台风 台风中心的地理位置 不同地理位置的台风各有多少 ?(两维) 4 所有进入我国的冷高压 每个进入我国的冷高压 高压中心的气压值(强度) 不同强度的冷高压各有多少 ? 5 所有进入我国的冷高压 每个进入我国的冷高压 高压中心的地理位置 不同地理位置的高压中心各有多少 ?(两维) 6 所有进入我国的温带气旋 每个温带气旋 温带气旋的深度(用闭合等压线的圈数表示) 不同深度的温带气旋各有多少 负幂分布 7 所有进入我国的温带气旋 每个温带气旋 低压中心的地理位置 不同位置的温带气旋各有多少 ?(两维)
个人分类: (熵+统计)气象学|2925 次阅读|0 个评论
气象分布函数的几类基元-《气象随机场的分布函数及其转移矩阵》7
热度 1 zhangxw 2014-7-5 17:22
气象分布函数的几类基元 -- 《气象随机场的分布函数及其转移矩阵》 - (之 7 ) 张学文 , 2014/7/4-5 我们已经介绍了一些气象随机场的分布函数,而这些气象随机场(如温度、风速、太阳高度角、降水量)都是以其地理分布图上的对应笼罩面积为统计对象的。或者说,这些分析的 统计基元 都是指 面积基元 。 气象场的种类很多,并且以气象变量的面分布为主。但是以面积为基元的统计仅是气象场统计的重要内容而不是全部。其实还有另外一些气象场,而其统计的基元却可以不是面积基元。 线基元、面基元、体基元、质量基元、时间基元 都可以是气象场随机场的统计基元。现在对这几类统计基元统一归纳讨论一下。 线基元的气象随机场分布函数 设想有某地某时刻的气象探空资料,而知道从地面到 10 公里 内的各个高度的温度数据。我们自然可以根据分布函数的思路问:不同温度占据的高度各有多少。或者问 不同温度在总的 10 公里 高程内分布占有的百分比是多少 。这个问题是把温度的铅直分布看做是一个 场 ( 1 维的场),它把大气的几何厚度看做是统计对象。此时,我们说不同温度占有的大气厚度是以一维的厚度为基元的统计分布函数。可以说它是面积元的分布函数的一种退化。 设想在春分日(秋分日可以)我们仅分析任意时刻的地球赤道上各个地点的太阳高度角。显然任何时刻各个经度上的太阳高度角都不相同。它对应的气象场的分布函数问题就是:不同的太阳高度角所占有的经圈长度各有多少 ? 在天文气候学中知道赤道上的太阳高度 h 在春分日随经度的变化应当是一个正弦函数(它包括了太阳在地平线以下的负的太阳高度角)。而根据 ! http://blog.sciencenet.cn/blog-2024-456903.html 的 分析,太阳高度为 90 度, -90 度的情况占有的经度最多(出线概率最高)。 在这个例子中,统计基元就是单位经度,而不是我们过去经常用的单位面积。 面基元的气象随机场分布函数 这种气象随机场的分布函数我们已经在前面的介绍中给了一些例子,这里就不重复了。值得补充的是:在以面积为基元进行气象场统计时,其基元是单位几何面积。或者说分布函数的函数值对应于面积(在被总面积除了以后,变成了相对面积)。而在以线基元讨论问题时,基元的单位是长度(前面的两个例子中分别是大气厚度和地球上的经度间距)。 体基元的气象随机场分布函数 根据以上分析,体元(以三维的体积为基元)的气象场的分布函数就是统计具有不同气象变量值的空气分别占了本气象场的多少体积。这个体积元不仅包括垂直地面的面积,也包括了在铅直方向的单位长度。它对应的概率统计问题是在大气分析的大气中任取单位体积的空气,问其温度(或者是其他气象变量)为不同值的概率是多少。 注意 到 大气在铅直方向的分布十分不均匀。所以铅直方向的每 100 米所代表的大气,在低空与高层差别很大。所以盲目做这种以体积为基元的分布函数是不妥当的,是物理含义混乱的。所以简单地以体积元为统计对象的做法需要十分谨慎。 但是一种代替办法可能是,改以水平的面积单元乘以铅直方向的单位大气压力差,也是个稳妥的代替的做法。(笔者过去没有做过这种分析,现在是理论上点到为止)。 质量基元的气象随机场分布函数 前面分析体基元的分布函数时遇到了不同高度上相同的厚度所代表的空气的数量并不相同的问题。解决这个问题的一个自然办法就是不以几何体积为统计基元,而改以大气质量为统计基元。 例如问,在 全球 大气中任取单位质量的空气,问它的温度为不同值的概率是多少。这显然是一个合理又有基础意义的气象问题。它对应的分布函数是求 不同的温度的空气占了大气总质量的百分比是多少 。显然如下的问题也十分重要(它们都以全球大气质量为总的分析对象): 不同压力的空气占了大气总质量的百分比是多少; 不同相对湿度的空气占了大气总质量的百分比是多少; 不同比湿的空气占了大气总质量的百分比是多少; 不同风速的空气占了大气总质量的百分比是多少; 不同位能的空气占了大气总质量的百分比是多少,等等。 显然气象学应当回答这些基础气象统计问题。但是遗憾的是经典气象学似乎没有感到应当这样提出问题。我们在《熵气象学》一书中则在 1992 对此给了初步的分析与归纳。这些都是以质量为基元来分析气象变量的分布函数的重要内容。 关于以上一些问题的答案,我们在后面有简要说明。而现在我们仅指出其中的“不同压力的空气占了大气总质量的百分比是多少”问题是可以从大气基本满足所谓静力学关系而求得。下面给出它对应的图。 它的结果简单而竟惊人: 大气压力的分布(质量基元上的)基本满足统计学中的均匀分布。 对此的证明请参考《熵气象学》第 2 章。 均匀分布可能是是统计与概率论中最简单的一种分布。但是它在后面讨论分布函数的转移矩阵时具有重要意义。这些容我们以后再展开讨论。 时间基元的气象随机场分布函数 我们从开始就强调这里分析的是气象对象的随机场,而不是某个单一气象站的气象变量随时间的变化。这类似我们分析数学中强调矢量,而不是标量。但是,在矢量概念下,我们也可以把标量看作是矢量的一种特例。基于这种类比,不妨认为过去气候学分析单点的气象要素值随时间的变化也是一种随机场,是以时间为基元的随机场。它给出不同气象变量(如温度)占有的相对时间各有多少(如正态分布)。 在这种视角下,我们可以把过去对单站的气象要素的出现概率分析看作是气象随机场分析的一种特例。 另外一种见解可以是,过去的气候概率分析是时间域的,而这里强调的气象场是空间域的概率分析。而这里的空间又可以是一维(长度)、 2 维(面积)、三维(体积)的。 基于以上的认识,我们把气象随机场的分布函数分析看作是过去的时间域的气候概率分析的扩展。 在 1992 年出版的熵气象学一书中,已经对很多重要的气象变量的分布函数做了初步介绍。我们在后面则是扼要介绍它们。
个人分类: (熵+统计)气象学|2940 次阅读|5 个评论
喝酒游戏,概率分布和卷积
热度 9 yunlongwang 2014-4-18 11:31
我对能算概率的东西一向情有独钟,包括喝酒时候的一个小小游戏。 桌子上放个公杯,一桌人轮流摇骰子,一次摇两个。 如果两个骰子结果数字和 Y 不是 {7,8,9} 中的任何一个,此玩家算过,不用喝,到下一个人摇; 但是如果 Y =7 ,该玩家向公杯中随意倒酒,可多可少,并继续摇;如果 Y=8 ,公杯的酒喝一半,继续摇;如果 Y=9 ,哈哈,那惨了,全喝,继续摇。 我上大学的时候,同学们把这个游戏亲切地称为“ 789 ”。 显然,游戏的参与者会很关心两个骰子数字(设为 X1 和 X2 )和是 7 , 8 或 9 的概率。或者更进一步,他们关心 Y=X1+X2 的概率分布( probability mass function )。当年我没能很快意识到 Y 的分布,颇感遗憾。如果我以后能当老师,那我的学生如果能在喝酒的时候稍微 show off 一下,也算我没白写。 首先,考虑 Y=7 这个事件,其发生的概率等于 (X1, X2)=(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) 这六个互斥事件发生的概率的和。仔细观察上面罗列的六个事件,再注意到 X1 和 X2 相互独立, p(X1, X2)=p(X1)p ( X2) ,我们可以得到下面这个式子: 是不是很眼熟,数学上来说,这就是卷积运算。说到对卷积的理解,我认为线性时不变系统(简称 LTI 系统)是一个很好的例子:输入函数和 单位脉冲响应 函数的的卷积就是输出函数。那么在计算独立随机变量和的分布的时候,为什么也会出现卷积运算呢? 我不想用严格的数学证明来描述答案,让我用信号系统的类比来解释。简单地说,线性时不变系统的输出是由很多很多个有时间延迟的单位脉冲响应的线性组合。倒过来想,上句话等价于 t 时刻的输出信号是很多很多种输入 ( 时刻输入 )和时延 (经过 时间 )的总和。因为很多老师已经对这个问题做过详细的介绍,我就不多说了【 1 】【 2 】【 3 】【7】。 在算概率的时候会用到卷积运算,这和 LTI 系统有没有联系呢?按我的理解,可以把 X1 理解成输入函数的自变量(时间), p ( X1 )理解成输入函数的因变量(函数值)。同理, X2 是系统 位脉冲响应 的自变量(时间), p ( X2 )是单位脉冲响应的函数值。 X1 和 X2 的独立性保证了这两个函数的相乘关系,也就是线性系统的特性。同样因为输出是 X1 和 X2 的和,在 X1 时刻(对应 时刻 )输入脉冲,经过 X2 时间(对应 时间 )后的输出的响应,这也符合了时不变系统的定义。因此, Y 的分布可以类比成一个 LTI 系统的输出。 当然,严格来说,这样的类比并不严谨,但是我希望用一个易于理解的概念来介绍一个新的概念。 不加证明的给出结论,两个独立的连续随机变量 X1 和 X2 , 服从分布概率密度为 和 的分布 , 那么随机变量 Y=X1+X2 的概率密度 为 , 对于离散随机变量的分布,上式可以简化成求和的形式 : 熟悉卷积的朋友都知道,两个矩形窗的卷积是一个三角形的窗函数,我跳过计算,直接给出分布如下图: 可以看到,出现 Y=7 的概率最大,次之的是 Y=6 和 Y=8 。如果要让这个游戏更加凶残,不妨改成 6 , 7 , 8 。 如果要进一步的分析,比如平均一个人会喝掉多少酒,那么需要先做一些假设(比如离散化倒酒的体积,倒酒是均匀分布之类),再构造一个马尔科夫链。每次状态转移伴随着一个 reward 。而我们刚才计算的仅仅是转移概率的第一步。其实是挺复杂的一个问题,以后有机会再写个续篇吧。 最后,说到卷积,就想再说说积分变换。 根据定义,连续随机变量 Y 的动差生成函数( moment generating function ,矩量母函数)可以由下式表达: 其中 f(y) 是随机变量 Y 的分布函数,在上面的例子中就是 p(y) 。 不活脱脱的就是 的双边拉布拉斯变换么?那推而广之,设 为实数序列, 为独立随机序列,定义随机变量 那么其动差生成函数就是 对 作拉普拉斯逆变换就可以得到 Y 的分布。 举个例子,用动差生成函数方法可以很容易证明:独立分布的高斯随机变量的和还是高斯分布。 因为如果随机变量Y服从 ,则 。 后记: 某天无意中浏览到余昕老师的博文“裹而不乱的卷积”,进而经过一番相关搜索后发现科学网上还有个关于卷积的博文专题。 ( http://news.sciencenet.cn/news/sub18.aspx?id=851 ) 不看不知道,一看真奇妙。看着各位大师纷纷从各个角度展示卷积之意义,我这个小小后辈受益匪浅。但是我只在袁贤讯老师【 4 】和田灿荣老师【 5 】的博文中见到关于卷积和概率的介绍,作为一个统计信号处理的学生,我就冒昧的写了本文作为对他们工作的致敬。李小文老师的讲法挺有意思,用幂级数讲卷积,我是第一次见【6】。^_^ 我因为要引参考文献,就不能不说自己对文献的理解。赶鸭子上架,我就冒昧的说说我对“大话卷积”专题的理解。说的不对请老师们原谅。我感觉邹谋炎【 7 】老师对卷积的理解是搞信号处理人的理解。我也是这么理解的,请让我冒充一下本门弟子吧。我第一次接触卷积是在奥本海姆编的信号系统书上看的,那里面就是充分利用 LTI 系统性质,用线性组合解释卷积。后来我又看过两三本信号系统书,也是这么解释的。不过这肯定不是卷积的唯一理解方式。我都不记得积分变换书上有没有讲卷积了。总之,我感觉卷不卷仅仅是两种理解方法,看个人爱好吧。 唐常杰老师的博文有很多有趣的适于用卷积建模的例子【8】。 还有很多关于卷积的博文,我就不一一列举了,请看专题。 PS: 1. 对这种生活中的小问题建模是我的兴趣爱好之一,应该不算浪费时间吧,毕竟写博文以后上课也能用。 2. 亲爱的父亲大人,你要是看了本文千万别担心我总是在喝酒才想这个东西。我没有喝酒,请放心。 3. 百度百科对数学词条太不友好了,非常难以编辑公式, MGF 的词条写得惨不忍睹。 【 1 】余昕老师的《 裹而不乱的卷积 》,附带 LTI 系统介绍。 【 2 】曹广福老师的《 大话卷积 》,数学老师讲卷积 【 3 】王晓刚老师的《 “卷”,还是“不卷”,这是个问题 》,物理老师讲卷积 【 4 】袁贤讯老师的《 也谈卷积 --- 及其在振动、中心极限定理以及更新理论中的应用 》 【 5 】田灿荣老师的《 概率中的卷积 》 【6】 李小文老师的《 当年给学生讲卷积 》,通过 幂级数的乘法讲卷积。 【7】 邹谋炎老师的《 科研小记:“卷”与“不卷” 》。 【8】唐常杰老师的《 辐射、服碘、补盐、空袭和卷积-----教学难点讨论之一 》。
17367 次阅读|21 个评论
这是李老师要的双峰概率分布吗?
热度 1 zhangxw 2013-7-2 18:51
这是李老师要的双峰概率分布吗? 张学文, 2013/7/2 方才看到这个问题,我没有弄清楚原意。 但是我过去注意到对一个 sin 函数均匀随机采样,其取值为不同概率的分布就是双峰概率分布。不过它的自变量在 -1,1 之间。,也许与李老师要的比较合适?是否需要改造一下,这里我没有加入参数,其实在 sin 前面加了系数就是参数了。 本人关于双峰的问题好像在气象要素分布的博客中给出过例子,现在记不清了。 下面是我在 2011 年 7 月做的图 欢迎参考2011的博客: http://blog.sciencenet.cn/blog-2024-454770.html
个人分类: 统计、概率、熵、信息、复杂性.2.|7470 次阅读|4 个评论
对幂律成因的一种说明
热度 1 zhangxw 2011-2-1 13:08
对幂律成因的一种说明 本文是 2005 , 9 , 4 发表在奇迹论坛上的三篇连贯文章中的第 2 篇,刊出后数年有 5 万多的浏览量,有 60 多个跟贴,但是 2010 年该网站的有关论坛关闭了。另外由于我这个博客上也随手发了一些幂律现象,这里把我对幂律成因的简要认识补贴于此 -- 张学文 2011.2.1 1. 幂律成因 -- 斩乱麻问题、幂律成因与组成理论之二 --2005-9-4-- 张学文 斩乱麻问题是利用复杂程度最大(跳出热力学的熵原理)求一个函数的生动例子,现在利用类似思路研究为什么很多自然和社会现象中体现着 Zipf ,或者分型学说的创立者大力宣扬的幂分布(幂律分布)。 2. 大约 50 年前 G.K.Zipf 发现英文的文本中 a , the 等字母少的词出现的机会多,而字母多的词(如 Basketball )很少出现,他发现组成一个词用的字母的数量 n 与该词在文章中出现的概率 p 为负幂函数关系: p=c(n^a) , a 是个小于 0 的常数, c 是系数。 Zipf 热情地寻找这个规律在其他社会现象领域的实用个例,目前有专门讨论这个定律的网站。多数城市的人口比较少,少数城市人很多;多数网页看它的人数很少,少数网页很多人看,这里的城市数量与人口数量的关系,网页数量与看它的人数都满足幂律关系的。 3. 显然把幂函数的两边取对数,那么变量(如组成词的字母数)与其出现概率的对数恰好是线性关系,或者说在双对数坐标下,变量关系是一条直线。所以变量对数为直线关系就成为判定是否为幂律的简单依据。 4. B.B. Mandebort 倡导的分型几何学,他弄出来的美丽图案已经让人们承认他是一个新的分支的领袖了。其实, Mandebort 研究的所谓分型问题中包括了大量的幂律分布,其他人也在这种热情中又发现新的幂律。所以目前从自然科学里的原子核到社会现象,人们在非常广泛的领域里都发现幂律存在。 统计数学里经常介绍很多广为应用的概率分布函数,著名的如正态分布,那里对幂律的关注比较少,其实,幂律也是概率分布中的一种。鉴于在不同语言下发现了大量的事例,幂分布应当在概率论中占有比较重要的地位。 5. 为什么这些十分不同的现象都服从幂律,其共同的制约因素是什么?我也看过分析一些文章,不谈形成原因的文章多 ( 甚至说不知道原因反而体现这个分布的神秘性 ) ,理论分析文章少,而指明它们的共同原因的文章,我到目前依然没有看到(也可能我看的文章少)。 6. 大约在 15 年前,我们就收集和自己证明,很多概率分布函数都可以利用熵最大(复杂性最大)原理配合不同的约束而推导出来。《熵气象学》(气象出版社, 1992 )中就汇集了我们给出的多种概论分布所要求的约束条件。但是书里没有提幂分布。 7. 大约在 1991 年《熵气象学》交稿后我们发现用最大熵原理配合上 “ 变量的几何平均值为常数 ” 这个简单约束条件就很容易得到幂分布。它与斩乱麻的约束条件的差别很小,一个的变量的平均值为常数,一个是其几何平均值不变。可以说这个简单认识道出了幂分布的形成原因。 8. 遗憾的是这个认识我们一直没有写成文章。 1999 年我为网易的科技栏目写 “ 改造后的熵 ” ,就把这个认识公布到网上了。见诸书面文字则是 2003 年出版的组成论里比较系统地说明了这个认识。 9. 所以可以说:关于 Zipf 律、分型的自相似律、幂分布律的形成原因就是变量具有随机性(可以引用熵最大原理 — 最复杂的结局出现的概论最高),而且变量的几何平均值(对于与百分比的平均)不变,这么两条。它类似斩乱麻问题但是那里的约束是代数平均值不变。所以在我看来幂律形成的统一原因在熵原理那里是个已经解决的问题。有兴趣的同志可以到组成论的网页版 http://zxw.idm.cn/ZCL/index.htm 看其中的 17 章 .6-8 节 10. 略
个人分类: 幂律|4835 次阅读|1 个评论
从最大熵原理统一认识主要的概率分布
zhangxw 2010-7-18 10:52
从最大熵原理统一认识主要的概率分布 张学文, 2010-7-18 1. 概率分布函数在统计学与概率论里占有主要地位。而被科学界重视、在统计学中经常用的概率分布函数大约就是 10 多种。早期出名的概率分布是正态、现在比较时髦的幂律分布,另外,负指数分布等也实例很多。 2. 目前教科书对于为什么经常出现这些分布的缘由并没有统一的说明。而很多实际工作者只要用自己的数据在科学界第一次证实它们符合某分布,一般就认为这是个不错的论文。更深的原因一般不涉及。 3. 80 年代我们发现负指数分布符合降水量的占有面积分布。 1992 年出版的《熵气象学》 http://zxw.idm.cn/content1.htm# 熵气象学 的附录则公布了我们收集大约 10 个分布函数。其特点是它们都是最大熵原理配合十分简单(合理)的假设的逻辑、数学推理的结果。即我们可以从最大熵原理的角度统一认识这些分布函数的形成原因(或者说存在背景)。 4. 在《组成论》一书里( http://zxw.idm.cn/ZCL/index.htm 2003 ,中国科学技术大学出版社),我们扩展、充实了以上的认识。并且把这个与热力学第二定律有联系,又不能说这是热力学的原理的原理称为最复杂原理,而热力学第二定律是它的特例。这样就理顺了一个认识链。 5. 下面以《组成论》书里 18 章最后一段作为本博客文章结尾。欢迎关注这个认识。 第十七和十八章介绍了十多种概率分布是如何从最复杂原理推导出来的。它们有的来自文献也有我们自己推导的。这个总体认识形成于 80 年代末,在 90 年代初期我们做了努力。当时马力同志负责了不少数学公式的推导工作,并且汇集到《熵气象学》一书中。这里汇集的认识又有进步和深化。另外 崔旭 博士(国外在读)也帮助做了一些工作。这里对马力同志早期的工作 和崔旭 博士的工作一并表示感谢。 收集更多的概率分布、全部用最复杂原理推导出来(也许不可能或者思路很笨)、给出每个分布的全部推导公式、给出其物理含义的一般说明、给出对应的应用事例、给出对应的数值模拟实验的步骤与说明、给出在电脑上的应用程序,这应当是一件非常有意义的工作。它应当由数学工作者、统计学工作者、电脑工作者联合完成,并且形成对应的报告、论文、专著、软件和光盘。笔者的本书是在这个方向做了努力,但是它与这个目标有距离。欢迎有兴趣的人士继续这个工作。 笔者也期待早日把这个认识统一写入统计学教科书,把对应软件汇入流行的统计软件功能中。
个人分类: 组成论|18248 次阅读|13 个评论
对概率分布簇成因的另一认识途径(2)--格子间里的昆虫数量的转移问题
zhangxw 2009-6-10 19:01
对概率分布簇成因的另一认识途径( 2 ) -- 格子间里的昆虫数量的转移问题 为了突出物理图像,不陷入数学符号迷宫。我们用格子间里的昆虫数量的演化问题来说明我们的 一般模型 。 1. 设想有一排格子(格子的数量 2-20 个已经可以展开我们的问题了),每个格子有一个号码。如 1 号, 2 号, 。规定号码相临的格子有门可以相通。不相临的格子不通(这暗含了在一维、有序、离散空间里讨论问题)。如各种的排列如下图 1 号 2 号 3 号 4 号 5 号 6 号 7 号 8 号 9 号 10 号 11 号 12 号 有时最后一个格子可以与第 1 个格子相连(有门),形成一个环。现在把 N 个昆虫(如 N=100 万)集中放到某格子里作为初始状态。初始状态时各个格子间的门都锁着。 2. 本模型规定每一个时间步长,各个门同时打开,允许昆虫按一定的规则出入。但是在这个时间步长内,昆虫只能从本格子飞到相临的格子里,或者不飞出去。如 6 号格子里的昆虫只能在一个时间步长飞到 5 号, 7 号格子,或者依然留在 6 号格子里。 3. 一个时间步长之后还可以有第 2 个时间步长,以致充分多的步长(时间演化)。昆虫的这种位置变化称为 转移 或者 扩散 。我们关心多步转移的结果。 4. 我们的一般问题是:给定 一种转移(扩散)规则 。经过一定数量的时间步长,不同格子里的昆虫数量各有多少。显然,不同格子里的昆虫数量就形成一个 分布函数(自变量值是格子的号码,函数值是那里的昆虫数量) 。 5. 不同的初始状态、转移规定、经历的时间步长都会对转移后的分布形成影响。而探讨这些因素的关系,就是本模型的总问题。即我们关心若干时间步长以后获得的是什么样的分布函数(不同格子里的昆虫数量各有多少)。 6. 能够在本模型的 转移规则 下获得不同格子里的昆虫数,可以体现概率论中的各种分布函数吗?希望这个简单的例子可以让大家理解我们的基本模型。至于不同规则获得的各个结果,后面讨论。 7. 不同格子里的昆虫数量,仅是便于理解的例子,它可以变成不同经济条件的人各有多少,不同状况的天气各有多少面积,不同点击率的网站、文章各有多少等等类似问题。说不定您那个专业领域原本就已经揭露了很多分布函数却缺少合适的理论说明,而这个模型恰好符合您的需要! 8. 好了,一段不宜过长。本段到此为止。后续见( 3 )。
个人分类: 统计、概率、熵、信息、复杂性.1.|4798 次阅读|0 个评论
对概率分布簇成因的另一认识途径(1)--开场白
zhangxw 2009-6-10 18:59
对概率分布簇成因的另一认识途径( 1 ) -- 开场白 张学文,学习探索笔记, 2009-6-10 1. 统计学广泛应用于各个领域。统计学的基础是概率论。而 10 多个概率分布函数(如正态分布、幂率分布、负指数分布、均匀分布等)是概率论和统计学的重要内容。关于这些分布函数(我们称为分布函数簇)的数学特征、以及在它们分别在各个领域的具体应用已经有很多研究。 2. 很多学科研究对概率分布函数的应用,多体现在 这些数据符合某某分布函数 的水平等方面。而对于为什么它恰好符合这个分布而不是另外的分布的问题,探索的比较少(为大量数据穿上一套合适的数学外衣,这文章确实已经比较漂亮了)。显然,寻找概率分布簇中这些不同的分布的统一的原因和具体区别,是具有基础意义的问题。 3. 《组成论》(张学文著, 2003 ,中国科学技术大学出版社)一书研究了各个领域的分布问题。它还给出了的一种思路,就是把这些常用的一些概率分布函数的形成机理都从最大熵原理(最复杂原理)去认识。它理出来的思路是最大熵原理在不同场合配合不同的约束条件必然出现不同的概率分布函数。这为认识不同的概率分布提供了统一的理论思路,又根据不同问题中的不同约束获得不同的概率分布函数。从而形成一个系统化的认识。 4. 今年笔者发现了另外一个统一认识不同的概率分布形成机理的思路。目前我已经沿着这个思路获得了均匀分布、幂率分布、正态分布的初步线索。我觉得这个思路值得进一步发展与落实,而我个人力量不足。所以我把有关的初步成果分段公布。欢迎有关学者指点以致参与。 5. 我获得这个初步认识所运用的数学步骤十分简单。它比熵思路包括的运算也少。但是构成这个一般模型,我是经历了一番周折的。后面不谈思想经历,而以容易理解的语言介绍初步收获。本段作为一个系列介绍的开场白吧。后续见( 2 )。
个人分类: 统计、概率、熵、信息、复杂性.1.|7010 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-30 18:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部