科学网

 找回密码
  注册

tag 标签: 幂律分布

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

自由落体运动中的概率幂律分布
热度 2 冯向军 2017-6-15 11:27
自由落体运动中的概率幂律分布 美国归侨冯向军博士,2017年6月15日写于美丽家乡 在《组成论》中【1】,张学文先生发现了自由落体运动中一个作为概率密度而不是直接作为概率的幂律分布:位置概率密度。本文中要讨论的是 自由落体运动中 另一种直接作为概率的幂律分布。 【定义】倒速度RV为运动物体移动单位距离所需要的时间。 倒速度RV对运动物体而言是有十分明确的物理意义的量,其单位是秒/米。 移动单位距离所需要的时间越长, 倒速度RV就越大, 移动单位距离所需要的时间越短, 倒速度RV就越小。 倒速度RV的数学表达式是 RV = dt/dx 这其中,x为位置变量,而t为时间变量。对于自由落体运动,假设t=0时,x=0,dx/dt =0,则有 x=(1/2)gt^2 t=(2x/g)^(1/2) 仅考虑x 0的情形, RV=dt/dx=(1/g)(2x/g)^(-1/2)=(1/g)*(1/sqrt(2/g))x^(-1/2) 或 RV=1/sqrt(2g)x^(-1/2),这其中g为重力加速度,g = 9.8(米/秒^2)。 可见倒速度RV是关于位置变量x的幂律函数。在《关于决定性事件的概率论》中,函数值一旦归一化,一般就变成了与函数具有同样变化规律的一种概率分布,这种概率分布符合概率公理。假设自由落体物体离地面的初始高度为H=30米。 自由落体物体运动至地面的总运动距离则为 H = 30米。将这个 总运动距离n等分,则得到物体自由落体过程中的n个 0的位置变量的样本值x1,x2,...,xn以及相应的 n个倒速度 变量的样本值RV1,RV2,...,RVn。 令 RVT = RV1 + RV2 +...+RVn,则 RVT可视为倒速度样本算术平均值的n倍,单位为 秒/米。于是有倒速度概率分布 pi = RVi/RVT = (1/RVT) * 1/sqrt(2g)xi^(-1/2),(i = 1,2,...,n) p1 + p2 + ...+ pn = 1 显然, 倒速度概率分布是关于位置变量的幂律分布。具体计算结果如下图一所示。 图一 倒速度概率p随位置x变化而变化的情形。 图二 验证倒速度分布p确实为关于位置x的标准幂律分布 我们要问从《关于决定性事件的概率论》来看,倒速度概率这个标准幂律分布的成因是什么?不失一般性,假设变量q服从约束条件:log(q)的统计平均值为常数。由平等遍历度和约束条件所构成的拉格朗日算子为: L = -p1log(p1)-p2log(p2)-...-pnlog(pn) + C1(p1 + p2 + ...+ pn -1) + + C2(p1log(q1) + p2log(q2) +...+ pnlog(qn) - C3) 对L求一阶偏导数dL/dpi并令之为零,就有: dL/dpi = -log(pi)-1 + C1 + C2log(qi) = 0,(i = 1,2,...,n) pi=exp(C1-1)(qi)^C2,(i = 1,2,...,n) 又因为拉格朗日算子的二阶偏导数矩阵是负定的主 对角线上元素恒负而其余元素都等于零的对称矩阵,因此上述令 拉格朗日算子的一阶偏导数等于零的幂律分布确实是令约束条件下的平等遍历度取极大值而符合最大平等遍历度原理的分布。 对于上述自由落体运动中的标准幂律分布倒速度概率,待定常数C1 = log( (1/RVT) * 1/sqrt(2g) ) + 1 = -0.8248,而C2 = -0.5。由此可见本文中的标准幂律的成因是如下所示的约束条件(对可能的概率分布选择范围的约束):对于位置变量x,log(x)的统计平均值为常数: p1log(x1) + p2log(x2) +...+ pnlog(xn) = 常数C3 参考文献 【1】张学文,《组成论》。
个人分类: 决定性概率论|3852 次阅读|3 个评论
[讨论] Higgs boson 数据是否被夸大了?
热度 1 zlyang 2012-7-21 13:14
[讨论] Higgs boson 数据是否被夸大了?
Higgs boson 数据是否被夸大了? 看了 李铭 教授的《对曹俊提供的希格斯测量数据的质疑》 http://blog.sciencenet.cn/./home.php?mod=spaceuid=222979do=blogid=590030 和 曹俊 研究员的 《希格斯花絮》 http://blog.sciencenet.cn/home.php?mod=spaceuid=296183do=blogid=588924 俺也提出一点疑问: 假如 这个包 和 周围的涨落 服 从 幂律分布 , 还能确定这个包就是Higgs boson的存在吗? 那里有这些原始数据? 正如 李铭 老师说的: 这个误差分析有很大的疑点。 建议新的分析方法: 将原始数据,以及扣除红线(四次多项式拟合)后的残差, 按照数理统计学、复杂系统的方法再好好分析一下吧。 谁能保证这个极小概率的现象,不是一次偶然的大背景涨落呢? 这是复杂系统的常见现象。 例如,一个标准的白噪声,出现7以上的点的可能性小得可怜,但也会偶然出现。这和目前 Higgs boson 数据的描述太相像了! 背景涨落服从什么分布?这大包的出现概率是多少? 能从数理统计学角度排除这个大包不是一次偶然的大背景涨落? 科学网目前有这方面的博主,建议我们联合起来,参与一下数据分析吧! 科学网,加油吧!为发现真理而努力。 《科学网、奥林比亚科学院、Nicolas Bourbaki》 http://bbs.sciencenet.cn/blog-107667-254080.html 相关链接: 董子凡,科技日报,2012-07-11:《访陈国明研究员:“上帝粒子”新发现背后的谜团》 http://news.sciencenet.cn/htmlnews/2012/7/266818.shtm 【物理学标准模型不是万能的,像暗物质、暗能量、物质与反物质不对称等问题,它都不能解释。】 许培扬《希格斯教授“上帝粒子”研究论文与引证分析报告(1970-2012)》 http://blog.sciencenet.cn/blog-280034-589361.html 示例:科学网博客总排行, 2012年07月21日 星期六 http://blog.sciencenet.cn/blog.php?mod=list 原始数据(水平轴:名次;垂直轴:点击量) 取对数lg后的关系(水平轴:名次;垂直轴:点击量) 排名前五位的博主,博文点击量偏少了?特别是前两位,明显低于幂律。
7154 次阅读|7 个评论
UMPU test 甄别样本究竟服从对数正态分布,还是服从幂律分布?
热度 1 zqjiang 2011-5-7 11:36
最近,在拟合一些样本概率分布时候,用对数正态分布对整个样本拟合还不错,但是尾分布用幂律分布拟合也不错。正纠结于选择什么分布比较合适的时候?我发现Sornette教授提出了一个有效的方法 来判断究竟尾分布究竟是对数正态,还是幂律? 想法源于1999年Journal of the American Statistical Association上一篇关于指数和正态分布检验的论文。因为将服从幂律分布或对数正态分布的随机变量取自然对数之后,即转化为服从指数或正态分布的变量。因此,通过对样本参数的简单变换,就可以将目标问题转化为样本变量服从 指数分布, 还是服从 正态分布 的问题 (个人认为很巧妙!)。 如何计算分布参数?如何进行统计检验?具体就不做介绍了,请重点看文献 第三节的第二小节。 Y. Malevergne, V. Pisarenko, D. Sornette, Physical Review E 83 , 036111 (2011). J. D. Castillo, P. Puig, Journal of the American Statistical Association 94 529-532 (1999).
12498 次阅读|0 个评论
[转载]幂律分布研究简史
Michaelhu 2010-12-18 01:00
西安理工大学电子系的胡海波和王林撰文《幂律分布研究简史》,这是一篇很有意思的文章,值得反复研读,特别是其“结束语”段: “幂律分布已有超过一百年的研究历史了,即使在现在,仍然是众多学科研究的热点。它那简洁优雅的形式,可以将许多似乎毫不相干的事物联系在一起,这种独特的魅力吸引了一大批杰出的物理学家、生物学家、天文学家、地质学家、数学家和社会学家,并不断有新的研究者加入到该领域。但即便如此,要真正从本质上把握驱动系统呈现幂律分布的物理过程与机制,仍然有许多试验或理论性的工作要做。另外,不同类型的幂律分布幂指数有很大的不同,究竟是什么原因导致了这种不同?这仍然是一个尚未完全解决的问题。不过,我们相信,不久的将来,在众多科学家的共同努力下,人类最终将根本性地破解幂律分布之谜,为物理世界的简洁之美再谱华章。” 全文详见《物理》2005年第12期P889-896。 博主评论: 地质作用过程中的数学规律也有很多是服从幂律关系,本人博士论文(2001)中多次应用幂律来描述地质过程中参数之间关系 ,并非特意、只因其拟合度最高 ,且相变时一些物理化学参数间也服从幂律关系。尽管不甚了解其中原因,但隐约感到幂律在地学上有重要研究意义!
个人分类: 地压梯度|5512 次阅读|2 个评论
把幂律分布写入概率论教材
热度 2 jalu 2010-1-18 17:50
把幂律分布写入概率论教材 1960 年前后,数学家 Erdos 和 Renyi 提出了著名的 ER 随机图,成为网络领域的奠基性数学理论。近 40 年来, ER 随机图一直是研究网络的基本模型。但是近些年,由于计算机的飞速发展使得计算能力的极大增强以及大规模实际网络实证数据库的获得,人们发现许多大规模实际网络结构既不是规则网络也不是随机网络,而是具有与前两者皆不同的具有统计特征的网络,这样的一些网络被称为复杂网络。复杂网络研究的两个里程碑式的工作分别是 1998 年由 D. J.Watts 和 S.H. Strogatz 发现的小世界效应和 1999 年由 A.L. Barab si 和 R.Albert 发现的无标度特性。这些重要的发现使得复杂网络成为一个十分引人注目的新兴研究领域。 许多现实世界中的复杂网络的连接度分布呈某种幂律( power-law )函数的形式。以 k 表示节点的度, p(k) 表示度为 k 的概率密度,则幂律分布 p(k) ~ k^(-a), 其中 k 大于某个正常数,幂律系数 a 大于 1 ,这是为了保证对概率密度从大于某个正常数到无穷的积分收敛。由于幂律分布没有明显的特征长度 , 该类网络也称为无标度 (Scale-free) 网络。幂律分布广泛地存在于实际的大规模系统,譬如 Internet 网、万维网 ( WWW) 、航空网、 电力网、 科研合作网络 、生物中的基因调控网络、新陈代谢网络 等等 。而且人们发现许多实际大规模的复杂网络的幂律系数 a 值在 2 至 3 左右,例如 Internet 网的 幂律系数在 2.2 - 2.48 左右 , WWW 网的 幂律系数约为 2.1 (入度)和 2.45 (出度)左右,新陈代谢网络的幂律系数约为 2.2 左右。 最近国内 汪秉宏 教授 和其它几个研究小组 与国际上许多实证研究也表明,人类动力学的许多动力学行为也表现为 幂律分布,使得 过去对于人类动力学的泊松分布的假设遭到巨大的挑战。 网络度的幂律分布的一个重要特点是,节点度 k 出现的概率 p(k) 在 k 增大时不是以指数形式迅速趋于 0 ,而是以比较平缓的幂律形式渐进地趋于 0 。因此表现出 长尾和宽尾性质。最早指出这种长尾分布的是 Pareto 定律和 Zipf 定律。 19 世纪的意大利经济学家 Pareto 研究了个人收入的统计分布,发现少数人的收入要远多于大多数人的收入,提出了著名二八律,即 20% 的人口占据了 80% 的社会财富。 1932 年,哈佛大学的语言学专家 Zipf 在研究英文单词出现的频率时,发现如果把单词出现的频率按由大到小的顺序排列,则每个单词出现的频率并非比较均匀,而是与它的名次的幂次存在简单的反比关系,表明英语单词中只有少数的词被经常使用,而绝大多数词很少被使用。 网络的幂律分布表明度大的节点还是有一定的数量,在网络中这些度大的节点称为 Hub ,虽然 Hub 节点在节点总数中只占极少数,但是它们却发挥了主导的作用。正是这些 Hub 的存在,使得网络具有与均匀的随机网络完全不同的性质。随机网络模型假设网络中任意一对节点连接的概率都是相等的,得到的度分布 p(k) 服从 泊松分布,在 节点度 k 趋于无穷大时 泊松分布 p(k) 趋于 0 的速度是介于 正态分布 e^(-k^2) 和 指数分布 e^(-k) 之间的,指数分布 e^(-k) 趋于 0 的速度已经是很快的了,可想 泊松分布 趋于 0 的速度之快。但是总的来说,这三种分布都是窄尾或者几乎无尾 。 就拿我们最熟悉的 正态分布来看,在正态分布表中,假设期望值为 0 ,方差为 1 ,那么变量与期望值之差的绝对值不超过方差的概率大约略微大于三分之二,不超过两倍方差的概率在百分之九十五,而超过三倍方差的概率仅仅只有百分之零点三。说明变量集中在期望值附近的一个很窄的范围内变化,尾部 几乎为 0 。所以正态分布和 泊松分布 只能刻画那些个体性质非常一致的系统。譬如中国成年男子的身高在平均值 1. 70m 左右,低于半米或高于 三米 的大概没有,所以以身高为横坐标 , 以出现此身高的概率为纵坐标 , 绘出钟形分布曲线 , 两边衰减得极快。 而世界上的许多现象个体之间并非如此 一致 , 像各 国的 GDP ,美国与最低国家之比可以高达几万倍;个人收入的分布,比尔盖茨与一般人的收入差别也是天文数字。前面提到的 Internet 等网络的节点度都是非常不均匀的, 度很大的 Hub 节点总有一定的数量 。可能是因为 不 均匀 和 差异性是普遍的,因此用幂律分布更能够真实地反映现实复杂系统,尤其在突发事件和异常现象频繁出现的今天,更不能只研究那些 均匀、一致、和谐的现象 。 目前我们的概率论教材,在介绍概率分布时都是介绍传统的二项分布、泊松分布、正态分布和指数分布等等,当然它们也都有广泛的背景。而像幂律分布这样一种反映现实世界大量存在的重要的概率分布基本上没有涉及,更没有讨论它的背景、性质和作用,在一些教材中只是 偶尔在习题中出现 Pareto 分布, 这不能不说是目前概率论教材的一个缺陷。希望我们的概率论教材不断更新内容,及时反映新的研究成果,把幂律分布写入新的教材。 注:上面的建议已经思考了几年,但是一直没有静下心来写,最近开播了,才下决心把它写出来,供大家讨论。 最近与武汉大学数学与统计学院概率论专家 刘禄勤 教授以及我的博士生陈娟同学就此问题进行讨论,在此表示衷心的感谢!
个人分类: 生活点滴|25355 次阅读|18 个评论
到底哪些实证数据真正服从幂律分布?
fudanzhangzz 2009-11-20 19:00
到底哪些实证数据真正服从幂律分布呢? 在此特向大家推荐Newman最新发表在SIAM Review上的文章。 Aaron Clauset, Cosma Rohilla Shalizi, and M. E. J. Newman, Power-law distributions in empirical data , SIAM Review 51 , 661-703 (2009). 文章发表版本的摘要与PDF链接如下: http://siamdl.aip.org/getabs/servlet/GetabsServlet?prog=normalid=SIREAD000051000004000661000001idtype=cvipsgifs=Yes
个人分类: 未分类|8750 次阅读|7 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 10:09

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部