科学网

 找回密码
  注册
科学网 标签 幂律 相关日志

tag 标签: 幂律

相关日志

2020-03-08《科学网》博客点击量与幂律(帕累托分布)
热度 2 zlyang 2020-3-10 15:54
2020-03-08《科学网》博客 点击量 与 幂律 ( 帕累托 分布) 2020-03-08晚饭时分的“科学网博客排行”数据。依次为单周博客排行、博客总排行、博文平均点击量排行。绘制的图片如下: “博客总排行”比较符合幂律。另外两个前20多名比较符合,后面的就差了。 单周博客排行, 前 23 名点击量之和,与后面 77 位的点击量之和相当; 博客总排行, 前 25 名点击量之和,与后面 75 位的点击量之和相当; 博文平均点击量排行,前 31 名点击量之和,与后面 69 位的点击量之和相当。 我最担心的时,科技工作者们的贡献也类似帕累托。尽管贡献不能真正地量化。 毁掉牛顿, 还是成全牛顿? 这是个问题。 1543年维萨里与哥白尼之前,原本并没有科学和技术。后来人类不断探索,就有了科学和技术。 科学和技术的“评价”,也需要不断的探索!!努力去探索,办法总会有的。不探索,就不会有方法。 在对人类社会进步客观规律认识的背景之上,重点研究“科技发展”、“人才成长”和“教育活动”自身的客观规律,是未来的长期的艰巨的任务。 “其实地上本没有路,走的人多了,也便成了路。” 参考资料: 科学网博客排行 http://blog.sciencenet.cn/blog.php?mod=list 相关链接: 2020-03-08,科技评价:牛顿、俺;帕累托分布、正态分布 http://blog.sciencenet.cn/blog-107667-1222401.html 2019-07-26,积极探索“科学和技术”评价的好方法! http://blog.sciencenet.cn/blog-107667-1191231.html 感谢您的指教! 感谢您指正以上任何错误! 感谢您提供更多的相关资料!
2244 次阅读|6 个评论
大自然的宠儿幂律的重要特性:因果相对变化的相似性或不变弹性
冯向军 2017-8-22 15:12
大自然的宠儿幂律分布的重要特性: 因果相对变化的相似性或不变弹性 美国归侨冯向军博士,2017年8月22日写于美丽家乡 相似性是几何学或分形几何学的概念,弹性则是经济学概念。所谓 因果相对变化的相似性或不变弹性在数学上指的是同一回事。 对于在自变量x处可微的表示某种因果关系的因变量或函数y=f(x),如果 dy/y = k(dx/x) (1-1) 并且k为常数,就称 因变量或函数y=f(x)具有 因果相对变化的相似性或不变弹性。这其中 dx/x是自变量或因的相对变化,而 dy/y则是因变量或果的相对变化。k = (dy/y)/(dx/x),在经济学上被称为弹性或弹性系数。当 k为常数时,就称k为不变弹性或不变弹性系数。 我一直在猜想:作为 大自然的宠儿的幂律分布,其存在是如此广泛以致几乎到了无所不在的地步,应该总有某种重要而根本的原因吧。因为世出世间一切事都逃不出因果,所以我一直在找大自然之所以如此偏爱幂律分布的因果律方面的原因。经过多年来不懈的努力探索,我终于恍然大悟:原来 幂律分布如此普遍,或许原因无他,只因为 幂律分布具有 因果相对变化的相似性或不变弹性而已。 非常幸运而又值得一提的是,我的《关于决定性事件的概率论》所发明的发生概率和广义熵同时最大原理,可以在平衡态普遍存在的自然约束条件 、 自洽约束条件和系统约束条件下,统一推导出齐普夫定律(Zipf's Law)所描述的标准负1次幂律 、 各种 标准非负1次幂律和非 标准非负1次幂律:Tsallis分布。
个人分类: 决定性概率论|2665 次阅读|0 个评论
幂律分布所对应的数值或非数值变量的特征规模和特征数量级
冯向军 2017-6-30 11:20
幂律分布所对应的数值或非数值变量的特征规模和特征数量级 美国归侨冯向军博士,2017年6月30日写于美丽家乡 在自然和社会中【2】,存在很多幂律分布。 地震规模大小的分布 、月球表面上月坑直径的分布、行星间碎片大小的分布 、 太阳耀斑 强度的分布 、计算机文件大小的分布 、战争规模的分布 、人类语言中单词频率的分布 、大多数国家姓氏的分布 、科学家撰写的论文数的分布、论文被引用的次数的分布、网页被点击次数的分布 、书籍及唱片的销售册数或张数的分布、每类生物中物种数的分布等等等等都是典型的幂律分布。 【1】文中,我提出了n元生克幂律分布联系数pCN的数学表达式。 关于概率分布p1,p2,...,pn 及其变量值x1,x2,...xn 的n元生克 幂律 分布联系数pCN的数学表达式为: pCN =(p1log(x1) + i*p2log(x2) +...+ i*pnlog(xn))/log(x1),(i = +1)。这其中 log(x1 ) log(x2) ... log(xn) 0 。 容易证明(我们已经作过多次类似的证明,所以不再重复) :当 作为柯尔莫哥洛夫概率的 n元生克 幂律 分布联系数 pCN = 常量,就必有概率分布p1,p2,...,pn 服从幂律分布。对于最终实际形成的 幂律分布,假设: pj = 10 -sj ,j = 1,2,...,n sj = -log10(pj), j = 1,2,...,n 我们就 称sj为变量xj的 特征规模 ,j = 1,2,...,n。当将特征规模sj取整时,特征规模sj就变成变量xj的 特征数量级 。每一个变量,无论是数值变量还是非数值变量(如姓氏),都对应着一个特征规模。因此可以认为在大量服从幂律分布的人或物的 物以类聚人以群分中,类和群都与某个特征规模相联系,当将这种 特征规模sj取整时,就是与 某个特征数量级 相联系。 当 n元生克 幂律 分布联系数 pCN = 常量而导致幂律分布时就有: pj = axj -b ,j = 1,2,...,n xj = 1/a * pj b = 1/a * 10 -bsj p1s1 + p2s2 +...+ pnsn = 常量 这也就是说 幂律分布所对应变量的特征规模的统计平均值是个常数。下表给出了4元幂律分布的所对应的变量x1的特征规模随设计常数b变化的情形。 a b x1 x2 x3 x4 p1 p2 p3 p4 x1的特征规模 0.3104 0.1 64 16 4 2 0.2048 0.2353 0.2703 0.2897 0.6886 0.3791 0.2 64 16 4 2 0.1650 0.2177 0.2873 0.3300 0.7825 0.4557 0.3 64 16 4 2 0.1309 0.1984 0.3006 0.3701 0.8832 0.5401 0.4 64 16 4 2 0.1023 0.1782 0.3102 0.4093 0.9900 0.7315 0.6 64 16 4 2 0.0603 0.1386 0.3184 0.4826 1.2195 0.9533 0.8 64 16 4 2 0.0342 0.1037 0.3145 0.5476 1.4657 1.2075 1.0 64 16 4 2 0.0189 0.0755 0.3019 0.6038 1.7243 1.4983 1.2 64 16 4 2 0.0102 0.0538 0.2839 0.6522 1.9918 1.8312 1.4 64 16 4 2 0.0054 0.0378 0.2629 0.6939 2.2659 2.2132 1.6 64 16 4 2 0.0029 0.0262 0.2408 0.7301 2.5449 2.6525 1.8 64 16 4 2 0.0015 0.0180 0.2187 0.7617 2.8275 3.1581 2.0 64 16 4 2 0.0008 0.0123 0.1974 0.7895 3.1129 参考文献 【1】冯向军, n元生克分布联系数的数学表达式及满足特定分布的概率分布设计,科学网,2017年6月27日。 http://blog.sciencenet.cn/blog-1968-1063221.html 【2】百度百科,幂律分布。 http://baike.baidu.com/item/%E5%B9%82%E5%BE%8B%E5%88%86%E5%B8%83
个人分类: 决定性概率论|1644 次阅读|0 个评论
“推导”狭义相对论中的一个非标准幂律分布
热度 1 冯向军 2017-6-14 18:17
“ 推导”狭义相对论中的一个非标准幂律分布 美国归侨冯向军博士,2017年6月14-15日写于美丽家乡 假定S'系和S系是两个相对作匀速运动的惯性坐标系。规定S'系沿S系的x轴正方向以速度v相对于S系作匀速直线运动。根据狭义相对论的洛仑兹变换,有 x’= (x - vt)/(1 - (v/c)^2)^(1/2) 这其中x'和x分别是S'系和S系的x'轴和x轴的坐标。t是S系的时间,c是光速。当x=0,t=1时 x' = -c /((c/v)^2 - 1)^(1/2) 这其中x'是S系原点的x坐标在S系1秒时刻于S’系中的相对应的x'坐标。令r = c/v,有 x' = -c(r^2 - 1)^(-1/2) 因为r是光速与相对运动速度v的比值,r = 1。r是两速度的比值,可称为速比。我们来考察r从2变至4(v/c从0.5下降至0.25)区间内x'随速比r的变化而变化的情形x'(r),不过我们将从《关于决定性事件的概率论》的角度来考察。将r的变化区间 n-1等分,得r的样本值r1,r2,...,rn。相对于r的样本值有x'(r)的样本值x'1,x'2,...,x'n。命 XT' = x'1 + x'2 +...+x'n XT'/c = x'1/c + x'2/c +...+x'n/c 这其中XT'是坐标x'的n个坐标值之和,是x'的样本的算术平均值的n倍,单位是米。 于是有满足概率公理的概率分布 pi = x'i/XT' = (x'i/c)/(XT'/c) = -1/(XT'/c)(ri^2 - 1)^(-1/2) (i=1,2,...n) 显然概率分布pi是关于速比变量ri的非标准幂律分布。 图1 概率p的样本随速比r=c/v的样本的变化而变化 图2 x'/c的样本随速比r=c/v的样本的变化而变化。r 图三 概率p的对数随速比r的对数作准线性变化。 由以上分析可见,S系的原点x坐标(x = 0),在S'系却对应着关于速比r=c/v这个变量的概率分布:非标准幂律分布。r越小,概率值越大。空间不是绝对的而是相对的。 通过这个范例,我们想宣示的核心理念是: 在 《关于决定性事件的概率论》中, 客观世界的一切函数关系均对应着某个概率分布。决定概率分布的最大平等遍历度原理其地位等同于牛顿力学中的牛顿三大定律。 我们要问从《关于决定性事件的概率论》来看,这个非标准幂律的成因是什么?不失一般性,假设变量q服从约束条件:log(q^2-1)的统计平均值为常数。由平等遍历度和约束条件所构成的拉格朗日算子为: L = -p1log(p1)-p2log(p2)-...-pnlog(pn) + C1(p1+p2+...+pn-1) + + C2(p1log(q1^2-1) + p2log(q2^2-1) +...+ pnlog(qn^2-1) - C3) 对L求一阶偏导数dL/dpi并令之为零,就有: dL/dpi = -log(pi)-1 + C1 + C2log(qi^2-1) = 0,(i = 1,2,...,n) pi=exp(C1-1)(qi^2-1)^C2,(i = 1,2,...,n) 又因为拉格朗日算子的二阶偏导数矩阵是负定的主 对角线上元素恒负而其余元素都等于零的对称矩阵,因此上述令 拉格朗日算子的一阶偏导数等于零的幂律分布确实是令约束条件下的平等遍历度取极大值而符合最大平等遍历度原理的分布。 对于上述狭义相对论中的非标准幂律分布,待定常数C1 = log(-c/XT') + 1 = -1.0165,而C2 = -0.5。由此可见本文中的非标准幂律的成因是如下所示的约束条件(对可能的概率分布选择范围的约束):对于变量速比r, log(r^2-1)的统计平均值为常数: p1log(r1^2-1) + p2log(r2^2-1) +...+ pnlog(rn^2-1) = 常数C3
个人分类: 决定性概率论|2455 次阅读|9 个评论
今天我国降水幂律特别好(20170306)
zhangxw 2017-3-6 10:28
今天我国降水幂律特别好( 20170306 ) 张学文, 20170306 下面的图是我国今天02时到08时的降水量最大的30个气象站的降水量与其排名的双对数坐标下的关系。它体现了所谓幂函数特征,其度量相关质量的R平方值高达0.9861.它与1已经很接近了。这种情况比较稀遇 最近的 24 小时(昨天 08 时 - 今天 08 时)全国31%的面积上的降水是 156 亿吨.雨量比昨天又增加很多。降水依然集中在长江流域以南。我国最近24小时单站最大降水量是46.8毫米深,它出现在江西广昌。 从各地的气象站中挑出最近 24 小时(昨天 08 到今天 08 时)降水量最大的前 30 个气象站,其降水量与其雨量排名的名次关系见附图 。它体现了两个变量是幂函数关系R平方=0.95 下面是有关的图表。基础资料来自今天的 http://www.nmc.cn/ 最近 24 小时全国降水量分布图 最近中国 24 小时不同雨量 - 笼罩面积关系统计表 2017 年3月5日08时-2017.03.6.08时     中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 相对面雨量 百亿立方米 0 0 0.000 69 0 0 0 10 3.333 27.5 0.916666667 0.88 10 25 15.000 2.5 0.375 0.36 25 50 33.333 1 0.333333333 0.32 50 100 66.667 0 0 0 100 250 150.000 0 0 0 250 500 333.333 0 0 0                           合计   100 1.625 1.56       平均降水.毫米 1.6 1.56       全国降水资源量.亿吨 156         降水相对覆盖面积% 31   平均雨量是有下限雨量乘2加上限雨量再除3而得。           昨天 08 时到今天 08 时(北京时间)中国各地 24 小时雨量前 30 名的排名名次 - 雨量关系图 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247 http://blog.sciencenet.cn/blog-2024-1034458.html
个人分类: 气象变量的笼罩面积分布|1938 次阅读|0 个评论
今天我国降水极值规律性很好(20161225)
zhangxw 2016-12-25 11:21
今天我国降水极值规律性很好( 20161225 ) 张学文, 2016/12/25 今天 02 时到今天 08 时(北京时间)中国各地 6 小时雨量前 30 名的名次与降水量的关系在双对数坐标下几乎是直线,这是它们服从幂函数关系的体现, R 平方 =0.9884 近 24 小时( 08-08 时)降水区主要在北疆以及我国东南方,全国雨雪占了全国总面积的 32% ,雨雪总量 109 亿立方米。 24 小时(昨天 08- 今天 08 )全国最大降水有 34.7 毫米,它出现在海南万宁。 从各地的气象站中挑出最近 24 小时(昨天 08 到今天 08 时)降水最大的前 30 个气象站,其降水量与其雨量排名的名次关系见附图 。 下面是有关的图表。基础资料来自当日的 http://www.nmc.cn/ 最近 24 小时全国降水量分布图 最近中国 24 小时不同雨量 - 笼罩面积关系统计表 2016 年12月24日09时-2016.12.25.08时 中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 相对面雨量 百亿立方米 0 0 0.000 68 0 0 0 10 3.333 31.4 1.04666667 1.0048 10 25 15.000 0.6 0.09 0.0864 25 50 33.333 0 0 0 50 100 66.667 0 0 0 100 250 150.000 0 0 0 250 500 333.333 0 0 0 0.000 0 0 0 0 0 合计 100 1.137 1.0912 平均降水/毫米 1.1 全国降水量/亿吨 109 降水覆盖相对面积% 32 平均雨量是有下限雨量乘2加上限雨量再除3而得。 昨天 08 时到今天 08 时(北京时间)中国各地 24 小时雨量前 30 名的名次 - 雨量关系图 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 水资源|2192 次阅读|0 个评论
今天我国降水极值的幂函数关系特别好(20161220)
zhangxw 2016-12-20 10:25
今天我国降水极值的幂函数关系特别好, R 平方 =0.99 ( 20161220 ) 张学文, 2016/12/20 从全国各个气象站中挑出最近 6 小时(今天 02 到今天 08 时)降水最大的前 30 个气象站,其降水量的对数值与其雨量排名顺序的对数值几乎在一条直线上。 它是降水极值符合幂函数的体现, R 平方 =0.991 ,见图: 过去的 24 时我国降水区域有所扩大,雨雪区占了全国总面积的 21% ,总降水量有 93 亿立方米。 24 小时(昨天 08- 今天 08 )全国最大降水有 33.4 毫米,它出现在广西融安。 从各地的气象站中挑出最近 24 小时(昨天 08 到今天 08 时)降水最大的前 30 个气象站,其降水量与其雨量排名的名次关系见附图 。它符合幂函数, R 平方 =0.94 下面是有关的图表。基础资料来自当日的 http://www.nmc.cn/ 最近 24 小时全国降水量分布图 最近中国 24 小时不同雨量 - 笼罩面积关系统计表 2016 年12月19日09时-2016.12.20.08时 中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 相对面雨量 百亿立方米 0 0 0.000 79 0 0 0 10 3.333 19 0.63333333 0.608 10 25 15.000 1.8 0.27 0.2592 25 50 33.333 0.2 0.06666667 0.064 50 100 66.667 0 0 0 100 250 150.000 0 0 0 250 500 333.333 0 0 0 0.000 0 0 0 0 0 合计 100 0.970 0.9312 平均降水/毫米 1.0 全国降水量/亿吨 93 降水覆盖相对面积% 21 平均雨量是有下限雨量乘2加上限雨量再除3而得。 昨天 08 时到今天 08 时(北京时间)中国各地 24 小时雨量前 30 名的名次 - 雨量关系图 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 水资源|3287 次阅读|0 个评论
昨日我国降水极值幂律关系特别好(20161212)
zhangxw 2016-12-12 11:02
昨日我国降水极值幂律关系特别好( 20161212 ) 张学文, 2016/12/12 从各地的气象站中挑出最近 24 小时(昨天 08 到今天 08 时)降水最大的前 30 个气象站,其降水量与其雨量排名的名次的幂律关系特别好 。在双对数坐标系中,其直线关系的 R 平方 =0.986 过去的 24 时,我国降水区域占了全国面积的 13% ,总降水量 42 亿立方米。 24 小时(昨天 08- 今天 08 )全国最大降雪仅有 5.3 毫米,它出现在新疆巴里坤。 下面是有关的图表。基础资料来自当日的 http://www.nmc.cn/ 最近 24 小时全国降水量分布图 最近中国 24 小时不同雨量 - 笼罩面积关系统计表 2016 年12月11日09时-2016.12.12.08时 中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 相对面雨量 百亿立方米 0 0 0.000 87 0 0 0 10 3.333 13 0.43333333 0.416 10 25 15.000 0 0 0 25 50 33.333 0 0 0 50 100 66.667 0 0 0 100 250 150.000 0 0 0 250 500 333.333 0 0 0 0.000 0 0 0 0 0 合计 100 0.433 0.416 平均降水/毫米 0.4 全国降水量/亿吨 42 降水覆盖相对面积% 13 平均雨量是有下限雨量乘2加上限雨量再除3而得。 昨天 08 时到今天 08 时(北京时间)中国各地 24 小时雨量前 30 名的名次 - 雨量关系图 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 水资源|1674 次阅读|0 个评论
R=0.99的面降水名次幂律(20161115)
zhangxw 2016-11-15 11:00
R=0.99 的面降水名次幂律( 20161115 ) 张学文, 2016/11/15 从我国各地气象站中挑出最近 24 小时(昨天 08 到今天 08 时)降水最大的前 30 个气象站,其降水量与其雨量排名的名次的关系符合幂函数公式, 其 R 平方值是 0.99 。您能对此给与一种理解思路吗? 下面是有关的图表。基础资料来自 http://www.nmc.cn/ 昨天 08 时到今天 08 时(北京时间)中国各地 24 小时雨量前 30 名的名次 - 雨量关系的两个双对数坐标图 . 即原变量符合幂函数关系 本图依据的原始数据表 24 小时降雨量 ( 前 30 城市 ) 2016-11-14 08:00 ~ 2016-11-15 08:00 名次 站点编号 站点名称 所在地区 降水量 (mm) 站点预报 名次对数值 雨量对数值 1 57974 嘉禾 湖南省 23.7 详细预报 0 1.374748 2 57894 井冈山 江西省 14.9 详细预报 0.30103 1.173186 3 51186 青河 新疆维吾尔自治区 13.7 详细预报 0.477121 1.136721 4 58806 宁都 江西省 13.4 详细预报 0.60206 1.127105 5 58813 广昌 江西省 12.1 详细预报 0.69897 1.082785 6 51087 富蕴 新疆维吾尔自治区 10.6 详细预报 0.778151 1.025306 7 58506 庐山 江西省 9.4 详细预报 0.845098 0.973128 8 57598 修水 江西省 9.1 详细预报 0.90309 0.959041 9 57866 永州 湖南省 8.8 详细预报 0.954243 0.944483 10 57761 新化 湖南省 8.2 详细预报 1 0.913814 11 58553 上虞 浙江省 7.7 详细预报 1.041393 0.886491 12 58725 邵武 福建省 7.7 详细预报 1.079181 0.886491 13 58608 樟树 江西省 7.4 详细预报 1.113943 0.869232 14 58637 上饶 江西省 7.4 详细预报 1.146128 0.869232 15 58820 泰宁 福建省 7.2 详细预报 1.176091 0.857332 16 57574 南县 湖南省 6.9 详细预报 1.20412 0.838849 17 58718 南丰 江西省 6.7 详细预报 1.230449 0.826075 18 57584 岳阳 湖南省 6.6 详细预报 1.255273 0.819544 19 57889 桂东 湖南省 6.5 详细预报 1.278754 0.812913 20 57993 赣州 江西省 6.2 详细预报 1.30103 0.792392 21 57749 怀化 湖南省 6.1 详细预报 1.322219 0.78533 22 58437 黄山风景区 安徽省 6.1 详细预报 1.342423 0.78533 23 58407 黄石 湖北省 5.9 详细预报 1.361728 0.770852 24 57671 沅江 湖南省 5.6 详细预报 1.380211 0.748188 25 57439 利川 湖北省 5.4 详细预报 1.39794 0.732394 26 58448 临安 浙江省 5.4 详细预报 1.414973 0.732394 27 57523 丰都 重庆市 5.4 详细预报 1.431364 0.732394 28 59218 靖西 广西壮族自治区 5.2 详细预报 1.447158 0.716003 29 57583 嘉鱼 湖北省 5.2 详细预报 1.462398 0.716003 30 57595 通山 湖北省 5.2 详细预报 1.477121 0.716003 过去的 24 时,我国降水(雪)笼罩了全国面积的 22% ,它们主要分布在长江以南,北疆、东北等地。除北疆东部外降水量不大。我国降水总量 72 亿立方米。 24 小时(昨天 08- 今天 08 )全国 最大降雨 23.7 毫米,出现在湖南嘉禾 。 最近 24 小时全国降水量分布图 最近中国 24 小时不同雨量 - 笼罩面积关系统计表 2016 年11月14日08时-2016.11.15.08时 中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 相对面雨量 百亿立方米 0 0 0.000 78 0 0 0 10 3.333 21.9 0.73 0.7008 10 25 15.000 0.1 0.015 0.0144 25 50 33.333 0 0 0 50 100 66.667 0 0 0 100 250 150.000 0 0 0 250 500 333.333 0 0 0 0.000 0 0 0 0 0 0 合计 100 0.745 0.7152 平均降水/毫米 0.7 全国降水量/亿吨 72 降水覆盖相对面积% 22 平均雨量是有下限雨量乘2加上限雨量再除3而得。 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 幂律|2445 次阅读|0 个评论
R平方=0.9865的一个降水幂律
zhangxw 2016-10-30 11:45
R 平方 =0.9865 的一个降水幂律 张学文, 2016/10/30 今天上午全国各地 24 小时( 08-08 时)的各个气象站的前 30 个最大的降水量与其排名的关系的资料 http://www.nmc.cn/publish/observations/24hour-precipitation-08.html 迟到了 2 个小时(所以没有编入我的每日降水分析中)。现在我用这个资料分析,发现此 30 个降水量与排名的关系符合幂律的程度可以说十分好,其在双对数坐标下的图和公式如下。注意其 R 平方值 =0.9865 ,已经很接近 1 了! 24 小时降雨量 ( 前 30 城市 ) 2016-10-29 08:00 ~ 2016-10-30 08:00 序号 站点编号 站点名称 所在地区 降水量 (mm) 站点预报 名次对数值 雨量对数值 1 59849 琼中 海南省 119.6 详细预报 0 2.077731 2 59848 白沙 海南省 74.2 详细预报 0.30103 1.870404 3 59854 屯昌 海南省 71 详细预报 0.477121 1.851258 4 59843 澄迈 海南省 58.8 详细预报 0.60206 1.769377 5 59951 万宁 海南省 51.1 详细预报 0.69897 1.708421 6 59847 昌江 海南省 47 详细预报 0.778151 1.672098 7 59845 儋州 海南省 46.6 详细预报 0.845098 1.668386 8 57718 息烽 贵州省 44.2 详细预报 0.90309 1.645422 9 57729 余庆 贵州省 40.6 详细预报 0.954243 1.608526 10 56786 曲靖 云南省 40 详细预报 1 1.60206 11 56959 景洪 云南省 39.2 详细预报 1.041393 1.593286 12 59851 定安 海南省 38.6 详细预报 1.079181 1.586587 13 56946 耿马 云南省 38 详细预报 1.113943 1.579784 14 56886 泸西 云南省 35.9 详细预报 1.146128 1.555094 15 56964 思茅 云南省 34.3 详细预报 1.176091 1.535294 16 56778 昆明 云南省 34.2 详细预报 1.20412 1.534026 17 57649 吉首 湖南省 30.3 详细预报 1.230449 1.481443 18 57805 织金 贵州省 29.8 详细预报 1.255273 1.474216 19 57647 松桃 贵州省 29 详细预报 1.278754 1.462398 20 56768 楚雄 云南省 28.9 详细预报 1.30103 1.460898 21 57655 沅陵 湖南省 28.7 详细预报 1.322219 1.457882 22 57907 兴义 贵州省 26.9 详细预报 1.342423 1.429752 23 56793 盘县 贵州省 26.7 详细预报 1.361728 1.426511 24 59758 海口 海南省 26 详细预报 1.380211 1.414973 25 57731 思南 贵州省 25.7 详细预报 1.39794 1.409933 26 57669 安化 湖南省 24.7 详细预报 1.414973 1.392697 27 57803 黔西 贵州省 23.7 详细预报 1.431364 1.374748 28 59941 五指山 海南省 23.6 详细预报 1.447158 1.372912 29 59954 陵水 海南省 23.3 详细预报 1.462398 1.367356 30 59945 保亭 海南省 22 详细预报 1.477121 1.342423 关于这种名次函数等等如何认识,我也疑问多多,我的一些片面认识欢迎参考我的博客中的幂律栏目 : http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space
个人分类: 幂律|3455 次阅读|0 个评论
昨日我国面降水极值现象中的幂律很好(20161030)
zhangxw 2016-10-30 10:32
昨日我国面降水极值现象中的幂律很好( 20161030 ) 张学文, 2016/10/30 昨日 08 时到今天 08 时,我国降水比较少,它主要分布在云贵到安徽一带。降水笼罩了全国 21% 的国土,总降水 162 亿立方米。 18 小时(昨天 08- 今天 02 )最大降水出现在海南琼中,雨量 68.9 毫米。(注今天没有 24 小时的极值降水数据,故改用 18 小时数据)(注后来知道24的降水极大值是119.6毫米) 从我国各地气象站中挑出昨天 08 时到今天 02 时(累积 18 小时)降水最大的前 30 个气象站,其降水量与其雨量排名的名次的关系很好地符合幂函数公式,其 R 平方值是 0.99 。 下面是有关的图表。基础资料来自 http://www.nmc.cn/ 最近 24 小时全国降水量分布图 最近中国 24 小时不同雨量 - 笼罩面积关系统计表 2016 年10月29日08时-2016.10.30.08时 中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 对全国降水量的贡献mm 百亿立方米 0 0 0.000 79 0 0 0 10 3.333 16 0.53333333 0.512 10 25 15.000 3 0.45 0.432 25 50 33.333 1.9 0.63333333 0.608 50 100 66.667 0.1 0.06666667 0.064 100 250 150.000 0 0 0 250 500 333.333 0 0 0 0.000 0 0 0 0 0 0 合计 100 1.683 1.616 平均降水/毫米 1.7 降水量/亿吨 162 降水覆盖率,% 21 平均雨量是有下限雨量乘2加上限雨量再除3而得。 今天 08 时到今天 02 时(北京时间)中国各地最近 18 小时雨量前 30 名的名次 - 雨量关系的两个双对数坐标图 . 即原变量很好地符合幂函数关系 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 水资源|2175 次阅读|0 个评论
昨日雨落我国南方(20161012)
zhangxw 2016-10-12 10:17
昨日雨落我国南方( 20161012 ) 张学文, 2016/10/12 昨日 08 时到今天 08 时,雨水降在我国南方。雨区占全国总面积的 32% ,它带来的淡水资源量是 121 亿立方米。。 24 小时中最大雨量出现在云南景洪,雨量是 42.6 毫米。 从我国各地气象站中挑出最近 24 小时降水最大的前 30 个气象站,其降水量与其雨量排名的名次的关系符合幂函数公式,其 R 平方值是 0.97 。 下面是有关的图表。基础资料来自 http://www.nmc.cn/ 最近 24 小时全国降水量分布图 最近中国 24 小时不同雨量 - 笼罩面积关系统计表 2016 年10月11日08时-2016.10.12.08时 中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 对全国降水量的贡献mm 百亿立方米 0 0 0.000 68 0 0 0 10 3.333 30.5 1.01666667 0.976 10 25 15.000 1.4 0.21 0.2016 25 50 33.333 0.1 0.03333333 0.032 50 100 66.667 0 0 0 100 250 150.000 0 0 0 250 500 333.333 0 0 0 0.000 0 0 0 0 0 0 合计 100 1.260 1.2096 平均降水1.3毫米 全国降水资源量121亿吨 降水覆盖相对面积30% 平均雨量是有下限雨量乘2加上限雨量再除3而得。 昨天( 08-08 时)中国各地 24 小时雨量前 30 名的名次 - 雨量关系的两个双对数坐标图 . 它们符合幂函数关系 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 水资源|1709 次阅读|0 个评论
昨日华西秋雨(20161010)
zhangxw 2016-10-10 12:32
昨日华西秋雨( 20161010 ) 张学文, 2016/10/10 昨日 08 时到今天 08 时,我国陕西、重庆、四川等地有降水。全国降水区域占总面积的 26% ,它带来的淡水资源量是 115 亿立方米。 24 小时中最大雨量出现在广东南澳,雨深是 69.4 毫米。 从我国各地气象站中挑出最近 24 小时降水最大的前 30 个气象站,其降水量与其雨量排名的名次的关系满足幂函数公式,其 R 平方值是 0.97 。而今天 02-08 时的类似统计关系更好: R 平方达到 0.98 下面是有关的图表。基础资料来自 http://www.nmc.cn/ 最近 24 小时全国降水量分布图 最近中国 24 小时不同雨量 - 笼罩面积关系统计表 2016 年10月9日08时-2016.10.10.08时 中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 对全国降水量的贡献mm 百亿立方米 0 0 0.000 74 0 0 0 10 3.333 23.5 0.78333333 0.752 10 25 15.000 2.3 0.345 0.3312 25 50 33.333 0.2 0.06666667 0.064 50 100 66.667 0 0 0 100 250 150.000 0 0 0 250 500 333.333 0 0 0 0.000 0 0 0 0 0 0 合计 100 1.195 1.1472 平均降水1.2毫米 全国降水资源量115亿吨 降水覆盖相对面积26% 平均雨量是有下限雨量乘2加上限雨量再除3而得。 昨天( 08-08 时)中国各地 24 小时雨量前 30 名的名次 - 雨量关系的两个双对数坐标图 今天 02-08 时的类似统计也很好: R 平方达到 0.98 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 水资源|2019 次阅读|0 个评论
昨天我国降水极值公式(20160923)
zhangxw 2016-9-23 10:53
昨天我国降水极值公式( 20160923 ) 张学文, 2016/9/23 从我国各地气象站中挑出最近 24 小时降水最大的前 30 个气象站,其降水量与其雨量排名的名次的关系比较好地符合幂函数公式关系,其 R 平方值是 0.97 最近 24 小时我国降水比较弱:降水区域占全国总面积的 37% 。全国降水总量 161 亿吨 / 天,全国平均雨深为 1.7mm/ 天。最近 24 小时的全国最大的单点降水量 77.5 毫米,它出现于海南万宁。 下面是有关的图表。基础资料来自 http://www.nmc.cn/ 昨天( 08-08 时)中国各地 24 小时雨量前 30 名的名次 - 雨量关系(双对数坐标)的两个双对数坐标图 最近 24 小时全国降水量分布图 最近中国 24 小时不同雨量 - 笼罩面积关系统计表 2016 年9月22日08时-2016.09.23.08时 中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 相对面雨量 百亿立方米 0 0 0.000 63 0 0 0 10 3.333 34 1.13333333 1.088 10 25 15.000 2.5 0.375 0.36 25 50 33.333 0.5 0.16666667 0.16 50 100 66.667 0 0 0 100 250 150.000 0 0 0 250 500 333.333 0 0 0 0.000 0 0 0 0 0 0 合计 100 1.675 1.608 平均降水1.7毫米 全国降水资源量161亿吨 降水覆盖相对面积37% 平均雨量是有下限雨量乘2加上限雨量再除3而得。 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 水资源|2545 次阅读|0 个评论
昨天中国降水汇总(20160918)
zhangxw 2016-9-18 10:49
昨天中国降水汇总( 20160918 ) 张学文, 2016/9/18 最近 24 小时我国 48% 面积出现过降水。全国降水资源总量 199 亿吨 / 天,全国平均雨量为 2.1mm/ 天。 最近 24 小时的全国最大的单点降水量 50.7 毫米,它出现于江福建厦门。全国各地 24 小时降水最大的前 30 个气象站的降水量与名次的关系符合幂函数公式关系,其 R 平方值是 0.97 下面是有关的图表。基础资料来自 http://www.nmc.cn/ 最近 24 小时全国降水量分布图 最近中国 24 小时不同雨量 - 笼罩面积关系统计表 2016 年9月17日08时-2016.09.18.08时 中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 相对面雨量 百亿立方米 0 0 0.000 52 0 0 0 10 3.333 45 1.5 1.44 10 25 15.000 2.5 0.375 0.36 25 50 33.333 0.4 0.13333333 0.128 50 100 66.667 0.1 0.06666667 0.064 100 250 150.000 0 0 0 250 500 333.333 0 0 0 0.000 0 0 0 0 0 合计 100 2.075 1.992 平均降水2.1毫米 全国降水资源量199亿吨 降水覆盖相对面积48% 平均雨量是有下限雨量乘2加上限雨量再除3而得。 昨天( 08-08 时)中国各地 24 小时雨量前 30 名的名次 - 雨量关系(双对数坐标)的两个双对数坐标图 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 水资源|2328 次阅读|0 个评论
昨天中国降水最大值公式很好(20160909)
zhangxw 2016-9-9 12:21
昨天中国降水最大值公式很好( 20160909 ) 张学文, 2016/9/9 最近 24 小时全国各地降水量最大的前 30 名中,雨量与名次的关系符合幂函数公式,其 R 平方高达 0.9938 最近 24 小时全国降水总量 266 亿吨 / 天,全国平均雨量为 2.8mm / 天,雨区笼扫过了全国 52% 的面积 。东北秋雨,华西秋雨延续。但是最近 24 小时的全国最大点降水量 184.4 毫米 ,却 在福建仙平潭。 下面是有关的图表。基础资料来自 http://www.nmc.cn/ 中国各地 24 小时雨量前 30 名的名次 - 雨量关系(双对数坐标)图 2016 年 9 月 8 日 08 时到 9 月 9 日 08 时的全国 24 小时降水量分布图 最近中国 24 小时不同雨量 - 笼罩面积关系表 2016 年9月08日 08 时-2016.09.09.08时 中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 相对面雨量 百亿立方米 0 0 0.000 48 0 0 0 10 3.333 46 1.533333333 1.472 10 25 15.000 4.5 0.675 0.648 25 50 33.333 1.3 0.433333333 0.416 50 100 66.667 0.2 0.133333333 0.128 100 250 150.000 0 0 0 250 500 333.333 0 0 0.000 0 0 0 0 0 0 合计 100 2.775 2.664 平均降水2.8毫米 全国降水资源量266亿吨 降水覆盖相对面积52% 平均雨量是有下限雨量乘2加上限雨量再除3而得。 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 水资源|2300 次阅读|0 个评论
昨天中国降水量-排名的幂律关系特别好(20160825)
zhangxw 2016-8-25 10:38
昨天中国降水量 - 排名的幂律关系特别好( 20160825 ) 张学文, 2016/8/25 最近 24 小时我国大陆的降水从黑龙江东部延伸到新疆西部。 24 小时的最大降水量已经上升到 153.4 毫米,它出现于河北黄骅 最近 24 小时中国大陆 58% 的面积有降水。总降水资源量比前一天明显增加,达到 329 亿立方米 / 日。全国 24 小时平均雨量 3.5 毫米。全国面上24小时降水最大的前 30 名的降水量与名次的关系符合幂律,其 R 平方值达到了 0.9945 (一般情况是它在 0.95 附近)。 下面是有关的图表。基础资料来自 http://www.nmc.cn/ 2016 年8月24日08时-2016.08.25.08时 中国大陆国土= 0.95 *10^10 平方米 雨量下限 雨量上限 平均雨量mm 相对面积% 相对面雨量 百亿立方米 0 0 0.000 42 0 0 0 10 3.333 50 1.66666667 1.58333333 10 25 15.000 5.5 0.825 0.78375 25 50 33.333 2.2 0.73333333 0.69666667 50 100 66.667 0.25 0.16666667 0.15833333 100 250 150.000 0.05 0.075 0.07125 250 500 333.333 0 0 0 0.000 0 0 0 0 0 合计 100 3.467 3.293 平均降水3.5毫米 全国降水资源量329亿吨 降水覆盖相对面积58% 分析张学文,参考博客 http://blog.sciencenet.cn/blog-2024-599818.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=599525 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=601823 http://blog.sciencenet.cn/blog-2024-616880.html http://blog.sciencenet.cn/blog-2024-616671.html http://blog.sciencenet.cn/blog-2024-992986.html http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 水资源|2442 次阅读|0 个评论
奥运会奖牌统计与中国大陆降水量的统计分析三视角
zhangxw 2016-8-18 12:53
奥运会奖牌统计与中国大陆降水量的统计分析三视角 张学文, 2016/8/18 最近的 31 届奥运会吸引了大家的注意,而我另外忙于每天的中国降水统计分析。现在这里把中国大陆降水的统计分析角度与奥运会奖牌的统计分析角度做了对比,结果是它们有三个统计学视角类似的。 1. 无奖牌国家的相对比值 - 无降水占有的相对面积 :今天奥运会时间已经过半,可 207 个国家(含地区)中依然有 62% 没有获得任何奖牌(如印度)。这类似每天全国降水统计中有 62% 的地方没有降水 … 。统计某特征表象不存在(无奖牌、无降水量)者占了总体的百分比问题是个重要角度。我们需要承认这个分析角度值得重视。 2. 奖牌(降水)大户们的名次 - 奖牌数(降水量值)排序符合基本符合幂律 :目前奥运会前 15 名的名次与奖牌的关系是幂函数关系。这是分析奥运会奖牌和中国降水量名次的另外一个类似的视角和结果。其中关于每天降水名次的分析欢迎参考我的另外的博客,如 http://blog.sciencenet.cn/blog-2024-997154.html 这里就不一一重复了。 即奖牌数、降水量的排名值 - 数量值都符合幂律 3. 分析获得不同奖牌(降水)的国家(面积)各有多少 :这也是一个重要统计分析角度。确实,国家与其获奖情况、全国各地的降水情况都对应着各自的统计样本空间。统计不同取值(奖牌数、降水量)占有的统计元的百分比是统计的重要环节。什么正态分布、负指数分布、均匀分布等等的理论分布都是针对本统计视角而开展的分析。不同奖牌的国家各有多少问题我们在本次奥运会闭幕后分析。 以上三个统计角度的选取与分析可以用于很多对象上。金牌数、降水量仅是两个例子。对降水的这三个视角的细致说明欢迎参考 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=996247
个人分类: 统计、概率、熵、信息、复杂性.2.|3255 次阅读|0 个评论
时间-面积混合型的雨量排名也体现“幂律”
zhangxw 2016-8-16 17:27
时间 - 面积混合型的 24 小时雨量排名也体现“幂律” 最近 31 天中国的每天最大降水量分析 张学文, 2016/8/16 去年初我曾经分析中国这个区域上不同地点的四季的各月降水量。竟然发现雨量与出现次数很好地符合负指数函数 http://blog.sciencenet.cn/blog-2024-859069.html 。这让我高兴又意外。高兴的是其负指数关系很好,意外的是这些数据混同了不同季节也混同了不同地区(中国的干旱区和潮湿区)。即它们是时间与面积的混合统计采样的结果。而一般人们忌讳这种看似错误的统计。 最近知道我国现在气象部门每天使用的气象数据来自大体均匀分布在全国各地 1800 多个气象站的观测。我发现每天的降水量前 30 名与排名名次基本符合幂律的情况。 http://blog.sciencenet.cn/blog-2024-996247.html 现在我大胆地用最近 31 天的中央气象台每天公布的当日 24 小时全国降水量最大值,统一排序,以寻找这 31 天的最大值的特征( 7 月 26 日前是 22 小时的合计,以后是 24 小时的合计)。结果发现 31 天来 24 小时我国气象站最多日降水量是 7 月 20 日 349 毫米,最小值是 7 月 29 日的 50 毫米。而这些数据(每天第 1 名)的新排名与降水量的关系也基本符合幂律。下面是对应的分析图和表: 降水量名次 24 小时降水量 名次的对数 降水量的对数 1 349.4 0 2.543323 2 267.9 0.30103 2.427973 3 198.1 0.477121 2.296884 4 186.9 0.60206 2.271609 5 177.1 0.69897 2.248219 6 162.5 0.778151 2.210853 7 159.5 0.845098 2.202761 8 155.3 0.90309 2.191171 9 155 0.954243 2.190332 10 150.2 1 2.17667 11 143.9 1.041393 2.158061 12 143.5 1.079181 2.156852 13 139.7 1.113943 2.145196 14 135.4 1.146128 2.131619 15 129.5 1.176091 2.11227 16 124.7 1.20412 2.095866 17 113.7 1.230449 2.05576 18 110.8 1.255273 2.04454 19 109.1 1.278754 2.037825 20 106.1 1.30103 2.025715 21 98 1.322219 1.991226 22 96.3 1.342423 1.983626 23 90.7 1.361728 1.957607 24 90 1.380211 1.954243 25 86 1.39794 1.934498 26 85.8 1.414973 1.933487 27 82.1 1.431364 1.914343 28 81.6 1.447158 1.91169 29 67.7 1.462398 1.830589 30 66.1 1.477121 1.820201 31 50.9 1.491362 1.706718 看来,有些统计规律体藏在你想象不到的空间中。(本关系可能随着数据的增加日后再改动)
个人分类: 幂律|2474 次阅读|0 个评论
台风“妮妲”的雨量-名次关系也符合幂函数(20160803)
zhangxw 2016-8-3 10:45
台风 “ 妮妲 ” 的雨量 - 名次关系也符合幂函数( 20160803 ) 张学文, 2016/8/3 昨天,我国广东广西继续受台风 “ 妮妲 ” 的影响,降水量不小。全国 24 小时, 6 小时降水量的前数名都是台风在广东、广西的降水。其降水与排名的关系依然是很接近幂函数。 下面是对应的图和资料分析表:( 24 小时, 6 小时) 24 小时降雨量 ( 前 30 城市 ) 2016-08-02 08:00 ~ 2016-08-03 08:00 184.629 名次 站点编号 站点名称 所在地区 降水量 (mm) 站点预报 名次对数值 雨量对数值 1 59485 中山 广东省 162.5 详细预报 0 2.210853 2 59287 广州 广东省 132.1 详细预报 0.30103 2.120903 3 59456 信宜 广东省 132.1 详细预报 0.477121 2.120903 4 59481 番禺 广东省 122.8 详细预报 0.60206 2.089198 5 59487 斗门 广东省 118.8 详细预报 0.69897 2.074816 6 59278 高要 广东省 101.6 详细预报 0.778151 2.006894 7 59493 深圳 广东省 99.5 详细预报 0.845098 1.997823 8 59271 广宁 广东省 97.8 详细预报 0.90309 1.990339 9 45011 澳门 澳门特别行政区 93.2 详细预报 0.954243 1.969416 10 59488 珠海 广东省 90.9 详细预报 1 1.958564 11 56492 宜宾 四川省 88.4 详细预报 1.041393 1.946452 12 59475 开平 广东省 84 详细预报 1.079181 1.924279 13 59478 台山 广东省 78.3 详细预报 1.113943 1.893762 14 58429 铜陵 安徽省 77.5 详细预报 1.146128 1.889302 15 59473 鹤山 广东省 76.3 详细预报 1.176091 1.882525 16 59754 徐闻 广东省 75.7 详细预报 1.20412 1.879096 17 58314 霍山 安徽省 75.6 详细预报 1.230449 1.878522 18 59462 罗定 广东省 70.5 详细预报 1.255273 1.848189 19 59096 连平 广东省 69.2 详细预报 1.278754 1.840106 20 58448 临安 浙江省 67.5 详细预报 1.30103 1.829304 21 59294 增城 广东省 67.3 详细预报 1.322219 1.828015 22 59640 合浦 广西壮族自治区 65.4 详细预报 1.342423 1.815578 23 59293 河源 广东省 65.4 详细预报 1.361728 1.815578 24 59476 新会 广东省 63.3 详细预报 1.380211 1.801404 25 58436 宁国 安徽省 61.1 详细预报 1.39794 1.786041 26 59065 贺州 广西壮族自治区 59.9 详细预报 1.414973 1.777427 27 59431 南宁 广西壮族自治区 58.9 详细预报 1.431364 1.770115 28 59289 东莞 广东省 57.2 详细预报 1.447158 1.757396 29 59058 蒙山 广西壮族自治区 56 详细预报 1.462398 1.748188 30 57839 黎平 贵州省 55.9 详细预报 1.477121 1.747412 6 小时降雨量 ( 前 30 城市 ) 2016-08-02 20:00 ~ 2016-08-03 02:00 104.5683 序名次 站点编号 站点名称 所在地区 降水量 (mm) 站点预报 名次对数值 雨量对数值 1 59481 番禺 广东省 74.6 详细预报 0 1.872739 2 59485 中山 广东省 66.6 详细预报 0.30103 1.823474 3 58448 临安 浙江省 62.5 详细预报 0.477121 1.79588 4 59287 广州 广东省 55.6 详细预报 0.60206 1.745075 5 59456 信宜 广东省 53.2 详细预报 0.69897 1.725912 6 59640 合浦 广西壮族自治区 40.5 详细预报 0.778151 1.607455 7 59487 斗门 广东省 39 详细预报 0.845098 1.591065 8 59626 东兴 广西壮族自治区 35.6 详细预报 0.90309 1.55145 9 59058 蒙山 广西壮族自治区 35.5 详细预报 0.954243 1.550228 10 59654 廉江 广东省 32.6 详细预报 1 1.513218 11 58549 金华 浙江省 30.5 详细预报 1.041393 1.4843 12 58457 杭州 浙江省 29 详细预报 1.079181 1.462398 13 57358 秭归 湖北省 26.2 详细预报 1.113943 1.418301 14 57803 黔西 贵州省 25.7 详细预报 1.146128 1.409933 15 58450 湖州 浙江省 24.1 详细预报 1.176091 1.382017 16 57707 毕节 贵州省 23.7 详细预报 1.20412 1.374748 17 58553 上虞 浙江省 23.4 详细预报 1.230449 1.369216 18 59502 陆丰 广东省 22.9 详细预报 1.255273 1.359835 19 59065 贺州 广西壮族自治区 20.7 详细预报 1.278754 1.31597 20 59431 南宁 广西壮族自治区 19.8 详细预报 1.30103 1.296665 21 59644 北海 广西壮族自治区 19.8 详细预报 1.322219 1.296665 22 59655 化州 广东省 19.7 详细预报 1.342423 1.294466 23 58336 马鞍山 安徽省 19.2 详细预报 1.361728 1.283301 24 59478 台山 广东省 18.2 详细预报 1.380211 1.260071 25 57083 郑州 河南省 17.7 详细预报 1.39794 1.247973 26 53915 崆峒 甘肃省 16.6 详细预报 1.414973 1.220108 27 59254 桂平 广西壮族自治区 16.5 详细预报 1.431364 1.217484 28 58464 平湖 浙江省 15.4 详细预报 1.447158 1.187521 29 58543 淳安 浙江省 14.9 详细预报 1.462398 1.173186 30 59647 涠洲 广西壮族自治区 14.9 详细预报 1.477121 1.173186
个人分类: 幂律|3369 次阅读|0 个评论
R平方达到0.988的面雨量-名次幂函数(20160731)关系
热度 1 zhangxw 2016-7-31 10:53
R 平方达到 0.988 的面雨量 - 名次幂函数( 20160731 )关系 张学文, 2016-7-31 昨天 08 时到今天 08 时的 24 小时内中国境内各个气象站的降水量最大的前 30 名的名次与雨量的幂函数关系的质量非常好。 R 平方值达到了 0.98882. 6 小时降水量的幂律关系的质量一般比 24 的规律性差一些,但是 2016.7.30 的 20 时到第二天 02 时的 6 小时雨量名次关系也高达 0.98. 不妨说最近中国境内的同一时间段内的雨量名次关系吧幂律体现的很好。 看来在气象变量笼罩面积面积方面的规律性值得进一步挖掘。不知道气象水文业务人员对此有何看法和利用。 不知道其他的大区域(如俄罗斯,非洲,美洲。。。)的情况是否也如此 下面是对应的图、(公式、关系质量 R 平方值)
个人分类: 气候公式选集|3458 次阅读|0 个评论
今日(2016.7.29)中国降水幂律特征
zhangxw 2016-7-29 10:11
今日(2016. 7.29 )中国降水幂律特征 张学文, 2016-7-29 昨天 08 时到今天 08 时中国境内 1800 多降水量数据集的前 30 名的雨量与名次的双对数关系不仅依然符合直线关系(对应原变量的幂函数),而且其 R 平方值高达 0.98 ,是我最近分析的大约 30 个关系中质量最好的。 本组数据中的第 1 名应当是减弱消失的台风形成的降水,其数值居然高于幂律关系的直线,这也我第 1 次遇到。 下面是对应的图和计算数据: 2016-07-28 08:00 ~ 2016-07-29 08:00 24 小时降雨量 ( 前 30 城市 ) 序号 站点编号 站点名称 所在地区 降水量 (mm) 名次对数值 雨量对数值 1 59631 防城 广西壮族自治区 135.4 0 2.131619 2 59945 保亭 海南省 77.4 0.30103 1.888741 3 54063 扶余 吉林省 58.1 0.477121 1.764176 4 59635 防城港 广西壮族自治区 56.3 0.60206 1.750508 5 54254 开原 辽宁省 55.9 0.69897 1.747412 6 54237 阜新 辽宁省 51.3 0.778151 1.710117 7 54243 昌图 辽宁省 47 0.845098 1.672098 8 58847 福州 福建省 46.4 0.90309 1.666518 9 54041 通榆 吉林省 36.9 0.954243 1.567026 10 54335 黑山 辽宁省 36.8 1 1.565848 11 59632 钦州 广西壮族自治区 35 1.041393 1.544068 12 56666 攀枝花 四川省 34 1.079181 1.531479 13 57889 桂东 湖南省 33.6 1.113943 1.526339 14 55248 改则 西藏自治区 32.7 1.146128 1.514548 15 50949 前郭 吉林省 32.1 1.176091 1.506505 16 59941 五指山 海南省 29.1 1.20412 1.463893 17 59750 雷州 广东省 29 1.230449 1.462398 18 59218 靖西 广西壮族自治区 28.4 1.255273 1.453318 19 56986 屏边 云南省 27.1 1.278754 1.432969 20 54161 长春 吉林省 27 1.30103 1.431364 21 59626 东兴 广西壮族自治区 26.7 1.322219 1.426511 22 59431 南宁 广西壮族自治区 26.6 1.342423 1.424882 23 59209 那坡 广西壮族自治区 26.1 1.361728 1.416641 24 54049 长岭 吉林省 25.9 1.380211 1.4133 25 55589 贡噶 西藏自治区 25.3 1.39794 1.403121 26 54337 锦州 辽宁省 25.2 1.414973 1.401401 27 50862 铁力 黑龙江省 24.2 1.431364 1.383815 28 56991 砚山 云南省 23.9 1.447158 1.378398 29 54454 绥中 辽宁省 22.9 1.462398 1.359835 30 58040 赣榆 江苏省 22.8 1.477121 1.357935
个人分类: 幂律|3048 次阅读|0 个评论
又一些面上的“降水量-名次”关系符合幂律
zhangxw 2016-7-27 11:17
又一些面上的“降水量 - 名次”关系符合幂律 张学文, 2016-7-27 我近来每天分析一点中国 大约 1800 个气象站的 24 小时、 22 小时 6 小时降水量的前 30 名( 1 小时为前 10 名)的雨量对数与名次的对数的关系。它们无例外地比较符合所谓幂律(双对数坐标下的直线)。有关说明欢迎参考我在幂律栏目下的各个有关 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space 博客。 下面公布其中的 4 个对应的图(含公式、日期):
个人分类: 幂律|5543 次阅读|0 个评论
发明:推测面上的最大点雨量的幂律方法(2)-初步验证
zhangxw 2016-7-25 11:46
发明:推测面上的最大点雨量的幂律方法( 2 ) - 初步验证 张学文, 2016-7-25 前天给出了用幂律推测一个区域在一个时间段内的最大降水量的方法的基本思路与计算方法 http://blog.sciencenet.cn/blog-2024-992390.html 。现在给出 10 个例子。注意它们不是特意挑的,而是把获取的资料逐一分析都用上了。这些例子质量最差的是 R 平方值 =0.8 ,其他的 R 平方值都高于 0.9. 。 10 个例子中每个的实测最大降水量(行业内好像称为老大)都小于我们的预测值。 看来这个预测技术是值得业务部门参考的 。 下面是 10 个例子的有关数据表(表中的推测最大降水量就是根据公式中的常数项 b ,用 10 的 b 次方求得的,即它 =10^ b )资料仅针对中国这个区域(不是更多或者更小) 个例 时间段2016年月日时 推测最大面雨量mm 观测最大雨量 经验幂律公式 y:降水量的对数,x:降水量排名值的对数 公式的R平方 1 2016-07-16 20:00 ~ 07-17 02:00 38.72576 15.3 y = -0.8295x + 1.5877 0.8069 2 2016-07-17 02:00 ~ 07-17 08:00 140.2814 70.3 y = -1.1447x + 2.1474 0.9553 3 2016-07-17 08:00 ~ 07-17 14:00 209.894 155.4 y = -0.9063x + 2.322 0.9331 4 2016-07-18 20:00 ~ 07-19 02:00 161.0646 99.3 y = -0.7663x + 2.2073 0.9386 5 2016-07-20 20:00 ~ 07-21 02:00 243.7811 157.6 y = -0.9268x + 2.3871 0.9644 6 2016-07-21 20:00 ~ 07-22 02:00 52.48075 40.3 y = -0.4129x + 1.7199 0.9286 7 2016-07-22 20:00 ~ 07-23 02:00 79.43282 60.1 y = -0.7415x + 1.9016 0.9678 8 2016-07-23 20:00 ~ 07-24 02:00 59.26523 45 y = -0.5209x + 1.7728 0.9613 9 2016-07-24 20:00 ~ 07-25 02:00 73.06342 56.7 y = -0.5927x + 1.8637 0.946 10 2016-07-25 02:00 ~ 07-25 08:00 79.3597 74.1 y = -0.5585x + 1.8996 0.9394
个人分类: 幂律|3672 次阅读|0 个评论
发明:推测面上的最大点雨量的幂律方法(1)
zhangxw 2016-7-23 18:07
发明:推测面上的最大点雨量的幂律方法( 1 ) 我今天发现利用面上的各个点的雨量数据可以推测此区域(面积)最大的点雨量值,条件是当时的雨量数据前 30 名的降水名次函数符合幂律。 我们先通过例子谈方法,以后再补一些说明。 l 下面是今天的一个 6 小时中国大约 1800 个各地的雨量数据中前 30 个降水量最大的雨量(的对数)与其排名(的对数)的关系图。图中显示数据点子与拟合的直线关系很好。其 R 平方值高达 0.9678. ,其雨量对数值 y 与名次对数值 x 的公式关系是: y=-0.7415x+1.9016 l 我们在注意到很多点子与直线很接近的同时,也注意到实测的最大的降水量在直线的下方,而这意味着什么? l 我认为这意味着个公式很好,而我们的 观测网 没有把真的最大雨量(第 1 名,头号)观测到。而真的降水量的最大值应当落在此直线上! l 于是读取横坐标 =0 时的直线纵坐标位置就是最大降水量的对数的推测值。即读取 x=0 时的公式的 y 值,就是最大降水量的对数值。把它换算回来就得到此区域的理论最大降水量(第 1 名)。在本例中就是求 10 的 b 次方,而 b 就是公式的常数项的值。 l 或者说本利中常数项是 1.9016 ,于是 10 的 1.9016 次方( 10^1.9016 )就是推测的最大降水量,它 =79.43 毫米 。 l 即 我们推测本时间段内中国区域的理论最大降水量是 79 毫米 ,它比实测的 60.1 毫米 几乎大了 25% 。 l 这就是本预测的核心思路与技巧了。其他的进一步说明明天再谈吧。
个人分类: 幂律|3356 次阅读|0 个评论
关于降水量面分布的排名的幂律关系的一般说明等等
zhangxw 2016-7-21 17:12
关于降水量面分布的排名的幂律关系的一般说明等等 张学文, 2016-7-21 最近注意到 http://www.nmc.cn/ 提供全国 1800 多个气象站(应当是比较均匀分布在我国各地)中降水量最大的前 30 名的数据。猜想到它们可能符合所谓幂律。或者说名次函数:降水量的值与降水量的排名值是幂函数关系。于是我就做了初步验证。 5 天下来发现我国每天 22 小时的雨量每天都符合幂律,这已经公布在我的 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=991140 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=991961 等博客中。现在补充五个 6 小时的降水的类似分析,并且对此做初步整体说明。 我羡慕公式(科学规律的重要表达形式)。也期待自己可以发现一个或者一些公式。所以发现每天的中国区域的降水量都符合一个简单的公式(尽管每天的公式参数不同)很高兴。 这 5 天我统计了 10 组中国地区的有关数据,其中 只有一组 数据我认为不宜说它符合幂律(尽管其 R 平方值也达到了 0.8 以上)。 10 组数据有关情况见于下表: 个例 日期与时间段 雨量时间长度 是否符合幂律 r 平方值 1 2016-07-16 20:00 ~ 2016-07-17 02:00 6 小时 否 0.8069 2 2016-07-17 02:00 ~ 2016-07-17 08:00 6 小时 是 0.9553 3 2016-07-17 08:00 ~ 2016-07-17 14:00 6 小时 是 0.9331 4 2016-07-18 20:00 ~ 2016-07-19 02:00 6 小时 是 0.9386 5 2016-07-20 20:00 ~ 2016-07-21 02:00 6 小时 是 0.9644 6 2016 年 07 月 16 日 08 时 ~ 2016 年 07 月 17 日 06 时 22 小时 是 0.9844 7 2016 年 07 月 17 日 08 时 ~ 2016 年 07 月 18 日 06 时 22 小时 是 0.9794 8 2016 年 07 月 18 日 08 时 ~ 2016 年 07 月 19 日 06 时 22 小时 是 0.9544 9 2016 年 07 月 19 日 08 时 ~ 2016 年 07 月 20 日 06 时 22 小时 是 0.9628 10 2016 年 07 月 20 日 08 时 ~ 2016 年 07 月 21 日 06 时 22 小时 是 0.9299 这 10 组数据中的五个 6 小时降水量的分析没有公布,这里统一列出其是否符合幂律,以及体现公式质量的 R 平方值(接近 1 是最好的)。 关于这种名次函数符合幂律的例子在其他领域很多,但是在气象上,就不同地点的雨量进行这种统计分析,我估计是第 1 次进行。 也许这样表达问题比较合适: 在一个很大的区域(中国)内存 N 个面积相等的面积元。每个面积元上有一个降水值(统一的某时刻段内,如 1 小时。 6 小时,一天,一月) . 于是相同时间段内,就有 N 个降水数据。把这些降水量数据按从大到小排序,并且仅取其前 30 ( 20 、 10 )名,如果名次(排名)与降水量的关系符合幂函数关系,就说此降水系列的名次函数符合幂律 。这等价于降水量的对数与名次的对数为直线关系。 我这 5 天对 5 个 22 小时的降水量和 5 个 6 小时降水量的分析提示 10 个分析中 9 个数据组符合幂律。 6 小时降水量的具体数据与图从略。 我猜测:任何一个与中国面积差不多或者更大的区域的 6 小时以上的降水量面分布的排名(名次) - 降水量关系都符合幂函数。 欢迎大家关注这个分析思路、并且证实它或者否定它。 以后我会进一步提供新的分析情况和认识。我对幂律的认识欢迎参考我的幂律博客栏目 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space
个人分类: 幂律|2530 次阅读|0 个评论
北京暴雨+名次幂律(20160721)
zhangxw 2016-7-21 10:42
北京暴雨 + 名次幂律(20160721) 张学文, 2016-7-21 昨天北京等地暴雨。 22 小时雨量最大值超过 250 毫米 。我国各地的 22 小时降水量的前 30 名的名排名与雨量关系依然服从 幂律 。下面是雨量图、幂律图和有关数据。 24 小时降雨量 ( 前 30 城市 ) 2016 年 07 月 20 日 08 时 ~ 2016 年 07 月 21 日 06 时 序号 站点编号 站点名称 所在地区 降水量 (mm) 站点预报 名次对数值 雨量对数值 1 54436 青龙 河北省 267.9 详细预报 0 2.427973 2 54596 房山 北京市 253.1 详细预报 0.30103 2.403292 3 54511 北京 北京市 246.2 详细预报 0.477121 2.391288 4 54594 大兴 北京市 242 详细预报 0.60206 2.383815 5 54541 抚宁 河北省 223.6 详细预报 0.69897 2.349472 6 54455 兴城 辽宁省 223 详细预报 0.778151 2.348305 7 54438 卢龙 河北省 214.5 详细预报 0.845098 2.331427 8 54505 门头沟 北京市 209.3 详细预报 0.90309 2.320769 9 54425 兴隆 河北省 191.5 详细预报 0.954243 2.282169 10 54454 绥中 辽宁省 187.2 详细预报 1 2.272306 11 54453 葫芦岛 辽宁省 186.6 详细预报 1.041393 2.270912 12 54452 建昌 辽宁省 184 详细预报 1.079181 2.264818 13 54540 昌黎 河北省 182.9 详细预报 1.113943 2.262214 14 54502 涿州 河北省 182.7 详细预报 1.146128 2.261739 15 54530 汉沽 天津市 172.9 详细预报 1.176091 2.237795 16 54439 迁安 河北省 166.6 详细预报 1.20412 2.221675 17 54499 昌平 北京市 158.6 详细预报 1.230449 2.200303 18 54522 玉田 河北省 156.8 详细预报 1.255273 2.195346 19 54434 迁西 河北省 153.5 详细预报 1.278754 2.186108 20 54519 永清 河北省 153.2 详细预报 1.30103 2.185259 21 54416 密云 北京市 149.2 详细预报 1.322219 2.173769 22 54428 蓟县 天津市 149 详细预报 1.342423 2.173186 23 54531 滦县 河北省 146.2 详细预报 1.361728 2.164947 24 54449 秦皇岛 河北省 143.6 详细预报 1.380211 2.157154 25 54539 乐亭 河北省 140.5 详细预报 1.39794 2.147676 26 54525 宝坻 天津市 139.2 详细预报 1.414973 2.143639 27 54398 顺义 北京市 137.5 详细预报 1.431364 2.138303 28 54532 丰润 河北省 134.5 详细预报 1.447158 2.128722 29 54316 八里罕 内蒙古自治区 134.4 详细预报 1.462398 2.128399 30 54328 喀左 辽宁省 133.7 详细预报 1.477121 2.126131
个人分类: 幂律|2984 次阅读|0 个评论
幂律:20160718中国22小时降水量前30名的名次与降水量符合幂律
热度 1 zhangxw 2016-7-18 12:23
幂律:20160718 中国 22 小时降水量前 30 名的名次与降水量符合幂律 张学文, 2016-7-18 今天分析的昨天 08 时到今天 06 时的全国各气象站 22 小时降水量中的雨量最大的 30 名,其雨量的对数值与排名的对视值也是很好地符合幂函数关系。其中第 1 名的湖北通城 22 小时居然下了 198.1 毫米 的暴雨! 看来中国面积上的的 22 小时雨量的排名与雨量的关系普遍(每天都)符合幂函数关系( R 平方 =0.9794 )。 这是中国特有的规律,还是一切比较大的区域的一般规律?天气学过去给出过这种规律吗!? 其有关数据如下 24 小时降雨量 ( 前 30 城市 ) 2016 年 07 月 17 日 08 时 ~ 2016 年 07 月 18 日 06 时 序号 站点编号 站点名称 所在地区 降水量 (mm) 站点预报 名次对数值 雨量对数值 1 57589 通城 湖北省 198.1 详细预报 0 2.296884 2 57752 溆浦 湖南省 164.2 详细预报 0.30103 2.215373 3 57771 韶山 湖南省 131.9 详细预报 0.477121 2.120245 4 57799 吉安 江西省 117.8 详细预报 0.60206 2.071145 5 57786 萍乡 江西省 115.5 详细预报 0.69897 2.062582 6 58804 兴国 江西省 114.1 详细预报 0.778151 2.057286 7 58822 建宁 福建省 92.8 详细预报 0.845098 1.967548 8 57798 安福 江西省 87.3 详细预报 0.90309 1.941014 9 57896 遂川 江西省 84.4 详细预报 0.954243 1.926342 10 58942 福清 福建省 77.9 详细预报 1 1.891537 11 57773 湘潭 湖南省 71.9 详细预报 1.041393 1.856729 12 58813 广昌 江西省 71.8 详细预报 1.079181 1.856124 13 58725 邵武 福建省 70.9 详细预报 1.113943 1.850646 14 57585 临湘 湖南省 70.3 详细预报 1.146128 1.846955 15 57696 宜丰 江西省 70.3 详细预报 1.176091 1.846955 16 57891 永新 江西省 69.1 详细预报 1.20412 1.839478 17 57662 常德 湖南省 68 详细预报 1.230449 1.832509 18 57666 桃江 湖南省 64.6 详细预报 1.255273 1.810233 19 58843 霞浦 福建省 64.5 详细预报 1.278754 1.80956 20 57895 万安 江西省 63.9 详细预报 1.30103 1.805501 21 57962 双牌 湖南省 63.1 详细预报 1.322219 1.800029 22 58936 仙游 福建省 62.9 详细预报 1.342423 1.798651 23 58705 永丰 江西省 60.9 详细预报 1.361728 1.784617 24 57796 新余 江西省 60.4 详细预报 1.380211 1.781037 25 56391 眉山 四川省 60.2 详细预报 1.39794 1.779596 26 58509 永修 江西省 59.1 详细预报 1.414973 1.771587 27 58718 南丰 江西省 58.6 详细预报 1.431364 1.767898 28 54633 新河 河北省 58.2 详细预报 1.447158 1.764923 29 58847 福州 福建省 58.1 详细预报 1.462398 1.764176 30 57634 务川 贵州省 57.9 详细预报 1.477121 1.762679
个人分类: 幂律|3148 次阅读|2 个评论
又一个幂律:我国各气象站6小时降水量与其排名之例
热度 2 zhangxw 2016-7-17 16:47
又一个幂律:我国各气象站 6 小时降水量与其排名之例 张学文, 2016-7-17 今天上午间我发现我国气象站的最近 22 小时的降水量(中央气象台称为 24 小时)的前 30 名的排序名次与降水量的关系符合幂函数(即取双对数以后为直线), http://blog.sciencenet.cn/blog-2024-991140.html 。现在(下午)发现我国各气象站中 6 小时的降水量的最大的前 30 名也符合的这种函数( R 平方 =0.9553 )。其关系图如下 看来气象学中应当存在很多类似的幂律关系,我明天继续跟踪新数据做分析。 其有关数据时间是 ; 2016-07-17 02:00 ~ 2016-07-1708:00 序号 站点编号 站点名称 所在地区 降水量 (mm) 站点预报 名次对数值 雨量对数值 1 58715 南城 江西省 70.3 详细预报 0 1.846955 2 54909 定陶 山东省 57.1 详细预报 0.30103 1.756636 3 53687 平定 山西省 45.6 详细预报 0.477121 1.658965 4 57752 溆浦 湖南省 30.6 详细预报 0.60206 1.485721 5 57912 惠水 贵州省 29.6 详细预报 0.69897 1.471292 6 58705 永丰 江西省 22.3 详细预报 0.778151 1.348305 7 58725 邵武 福建省 22.2 详细预报 0.845098 1.346353 8 58718 南丰 江西省 13.8 详细预报 0.90309 1.139879 9 50246 塔河 黑龙江省 13.5 详细预报 0.954243 1.130334 10 57712 汇川 贵州省 10.7 详细预报 1 1.029384 11 58843 霞浦 福建省 10 详细预报 1.041393 1 12 57647 松桃 贵州省 9.3 详细预报 1.079181 0.968483 13 50349 新林 黑龙江省 7.7 详细预报 1.113943 0.886491 14 57682 平江 湖南省 7.6 详细预报 1.146128 0.880814 15 53593 蔚县 河北省 6.6 详细预报 1.176091 0.819544 16 55248 改则 西藏自治区 6.5 详细预报 1.20412 0.812913 17 57789 莲花 江西省 5.4 详细预报 1.230449 0.732394 18 57799 吉安 江西省 5.2 详细预报 1.255273 0.716003 19 57793 宜春 江西省 5.2 详细预报 1.278754 0.716003 20 56434 察隅 西藏自治区 5.1 详细预报 1.30103 0.70757 21 56964 思茅 云南省 4.8 详细预报 1.322219 0.681241 22 58737 建瓯 福建省 4.2 详细预报 1.342423 0.623249 23 57947 融安 广西壮族自治区 4.1 详细预报 1.361728 0.612784 24 50136 漠河 黑龙江省 3.8 详细预报 1.380211 0.579784 25 58834 南平 福建省 2.9 详细预报 1.39794 0.462398 26 54705 南宫 河北省 2.7 详细预报 1.414973 0.431364 27 57827 都匀 贵州省 2.5 详细预报 1.431364 0.39794 28 58933 屏南 福建省 2.3 详细预报 1.447158 0.361728 29 52657 祁连 青海省 2.3 详细预报 1.462398 0.361728 30 57776 南岳 湖南省 2.2 详细预报 1.477121 0.342423 附带说明:此时间前的 6 小时的数据与幂律偏差比较大,我没有单独列出。 本人关于幂律以及名次关系也算幂律的一些认识这里就不一一说明了。有兴趣者和质疑者欢迎参考我的博客中的幂律栏目 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space 。
个人分类: 气候公式选集|3439 次阅读|4 个评论
我国各气象站22小时降水量的排名前30名符合幂律?
zhangxw 2016-7-17 10:23
我国各气象站 22 小时降水量的排名前 30 名符合幂律? 张学文, 2016-7-17 今天无意间分析了我国气象站的最近 22 小时的降水量(中央气象台称为 24 小时)的前 30 名 (的数据, http://www.nmc.cn/publish/observations/24hour-precipitation.html 每天更新!)的排序名次与降水量的关系。发现它们的对数是比较好的直线函数关系( R 平方 =0.9844 )。特写此博客公布之。其关系图如下 其原始数据是 ; 序号 站点编号 站点名称 所在地区 降水量 (mm) 站点预报 名次对数值 雨量对数值 1 53796 宁晋 河北省 106.1 详细预报 0 2.025715 2 58614 进贤 江西省 91.5 详细预报 0.30103 1.961421 3 53687 平定 山西省 70.1 详细预报 0.477121 1.845718 4 53784 赵县 河北省 67.1 详细预报 0.60206 1.826723 5 58659 温州 浙江省 67.1 详细预报 0.69897 1.826723 6 54909 定陶 山东省 62.3 详细预报 0.778151 1.794488 7 58667 玉环 浙江省 59.2 详细预报 0.845098 1.772322 8 57796 新余 江西省 54 详细预报 0.90309 1.732394 9 58627 鹰潭 江西省 53.8 详细预报 0.954243 1.730782 10 57792 分宜 江西省 51.8 详细预报 1 1.71433 11 58664 温岭 浙江省 50.8 详细预报 1.041393 1.705864 12 58618 东乡 江西省 48.7 详细预报 1.079181 1.687529 13 53565 偏关 山西省 46.6 详细预报 1.113943 1.668386 14 58626 贵溪 江西省 44.7 详细预报 1.146128 1.650308 15 58734 建阳 福建省 44.3 详细预报 1.176091 1.646404 16 58847 福州 福建省 44.3 详细预报 1.20412 1.646404 17 53695 新乐 河北省 44.2 详细预报 1.230449 1.645422 18 57905 贞丰 贵州省 44.1 详细预报 1.255273 1.644439 19 58635 广丰 江西省 43.9 详细预报 1.278754 1.642465 20 58609 丰城 江西省 42.8 详细预报 1.30103 1.631444 21 57798 安福 江西省 42.5 详细预报 1.322219 1.628389 22 53689 晋州 河北省 42.4 详细预报 1.342423 1.627366 23 58751 平阳 浙江省 42.4 详细预报 1.361728 1.627366 24 58616 余江 江西省 42 详细预报 1.380211 1.623249 25 58731 浦城 福建省 40.2 详细预报 1.39794 1.604226 26 58710 崇仁 江西省 40.1 详细预报 1.414973 1.603144 27 53697 藁城 河北省 39.5 详细预报 1.431364 1.596597 28 58608 樟树 江西省 39 详细预报 1.447158 1.591065 29 53699 无极 河北省 38.8 详细预报 1.462398 1.588832 30 58725 邵武 福建省 38.8 详细预报 1.477121 1.588832 本人关于幂律以及名次关系也算幂律的一些认识这里就不一一说明了。有兴趣者和质疑者欢迎参考我的博客中的幂律栏目 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space 。 附言:我也分析了今天的6小时降水量的类似数据。他们偏离幂函数关系是比较明显的(图略)。
个人分类: 空中水科学|3596 次阅读|0 个评论
科学网个人博客日浏览量的一个幂律
zhangxw 2016-5-4 11:36
科学网个人博客日浏览量的一个幂律 张学文, 2016/5/4 此前的一些分析指出,一些统计数据的每次与统计量之间经常符合幂律关系。今天我分析了科学网上总浏览量前 100 名的博主的日浏览量(来自 2016 年 5 月 3 日的浏览量与 2 日的浏览量的差)。发现第 1,2 名的日浏览量超过 1.5 万,而最后一名接近 500 次。其从高到低的排序见下图 如果我们对名次和其浏览量分别取对数,再做相关图,就获得下面的图 这里以名次的对数值为横坐标,以浏览量的对数值为纵坐标,我们看到各个数据点子基本在一条直线附近, R 平方值达到 0.93 。两个变量的对数值符合直线关系等价于原变量为幂函数关系,所以这是一个“幂律”。 有关幂律的一些讨论欢迎参考 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space 中的各个博客。这里不多说了。
个人分类: 幂律|2399 次阅读|0 个评论
关于您的一个幂律,请检验是否灵验!
热度 1 zhangxw 2016-3-6 11:57
关于您的一个幂律,请检验是否灵验! 张学文, 2016/3/6 您好!我知道您是经常写论著(打字)的学者。现在我作一个 关于您的预测 。 它是否对 就由您自己检验! 在您经常使用的汉字词汇中,有的词汇使用的次数多,有的就少一些。我的预言是 如果您对常用词汇使用次数排个队(给出名次),那么名次数(前 100 名)与对应的使用次数之间很好地符合幂函数(幂律)。 我猜您就符合这个规律,我的猜测对吗 ? 欢迎您检验! **** 做这个预言的基础是我过去对名次函数的一些分析与认识(见我的博客中的幂律栏目) http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space ,以及昨天我对科学网上孟祥溪博主的博客 http://blog.sciencenet.cn/blog-270448-960642.html 数据的检验。我发现他提供的自己的 100 多个常用词的排序很好地符合这个规律。我估量其他的学者(等文字工作者)也应当差不多。这个应当具有所谓 普适性 。 下面是我针对他的数据做的分析图, excel 给出的公式的 R 平方值达到 0.98 ,说明其符合幂函数的可信程度是相当高的。 需要补充说明: Ø 所谓您使用的词汇也符合幂律,仅是指函数关系的数学公式形式是幂函数,而每个人的公式的系数,参数值会因为每人的情况、输入的总次数而有区别。 Ø 您也可以认为这个规律属于汉字词汇。我估计其他语言饿词汇也符合这个关系。 Ø 这个关系对前 100 个词汇是很好的,词汇再多可能情况就有意外(不一定也满足幂律)
个人分类: 幂律|3229 次阅读|1 个评论
天山剖面水分循环天数与海拔高度幂律公式的补充版
zhangxw 2015-9-25 12:30
天山剖面水分循环天数与海拔高度幂律公式的补充版 张学文 ,2015/9/25 昨天在给出了天山在乌鲁木齐附近剖面上 4 个气象站的水分循环天数与高度的关系很好地符合幂律的关系以后。有人认为点子太少,不足以过分肯定。 随后我 1. 分析了这个剖面的情况认为:再补充点子,其公式关系和公式质量不会有很大的差别。 2. 大胆地把有对应资料的吐鲁番(吐鲁番不在蔡家湖乌鲁木齐大西沟的直线内,但是与此间隔不算远, 160 公里水平)的数据也一并分析。但是多了这个点以后公式的系数值略有小修订,而公式质量不仅没有降低,反而有所提高(从 0.9908 变成 0.9979 ),这令人高兴。 下面给出对应的图和资料。更多的情况请看 http://blog.sciencenet.cn/blog-2024-923054.html 气象站号 气象站 年降水量 水汽压力 含水量 水循环周期天数 海拔 51573 吐鲁番 15.6 7.6 13.25592 310.3669731 34.5 51365 蔡家湖 141 6.5 11.3373 29.36843138 441 51463 乌鲁木齐 286.3 6.1 10.63962 13.57359834 935 51465 小渠子 541.5 5.1 8.89542 6.000096316 1871 51468 大西沟 441.8 2.7 4.70934 3.893359971 3539
个人分类: 水分循环17|2815 次阅读|0 个评论
幂律:天山剖面的水分循环周期与高度的关系
热度 1 zhangxw 2015-9-24 12:35
幂律:天山剖面的水分循环周期与高度的关系 张学文 ,2015/9/24 此文如引用请注明出处 我们已经把空中水分循环一周所需要的时间 ( 周期 ) 的分析从全球平均 9-10 天逐步具体到中国 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=920098 和新疆 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=922824 , 这里则突出分析天山的乌鲁木齐附近剖面上的 水分循环周期天数与海拔高度的关系 。我们发现它们竟然很好地符合幂律! 下面是我收集的该剖面上气象站的有关数据( 30 年平均)   天山剖面           气象站号 气象站 年降水量/mm/a 水汽压力/hPa 含水量/mm 水循环周期天数/day 海拔/m 51365 蔡家湖 141 6.5 11.3373 29.36843138 441 51463 乌鲁木齐 286.3 6.1 10.63962 13.57359834 935 51465 小渠子 541.5 5.1 8.89542 6.000096316 1871 51468 大西沟 441.8 2.7 4.70934 3.893359971 3539 下面是根据这四个气象站数据分析的海拔高度与水分循环周期天数的相关图好配的理论公式。分析显示它很好地满足幂律,并且是其中的双曲线函数( 0.9972 很接近 1, 而 1 时是双曲线)。 我们看到在准噶尔盆地底部水分循环一次平均要一个月,乌鲁木齐大约是半个月,而中山带的小渠子只有 6 天。而接近天山顶处的水分循环变成了 4 天左右,它比全球平均值快了 1 倍多。 参考博客 http://blog.sciencenet.cn/blog-2024-680034.html
个人分类: 气候公式选集|3129 次阅读|2 个评论
15届世锦赛的名次与奖牌总数体现幂律关系
zhangxw 2015-8-31 11:56
15 届世锦赛的名次与奖牌总数体现幂律关系 张学文 ,2015/8/31 昨天,15 届世锦赛结束 , 有 32 个国家获得了奖牌 . 奖牌分布不平均是自然规律 . 。而非洲据前列是特色。美国屈居第 3 ,俄罗斯、古巴‘中国分列 9 。 10 、 11 位。 历来这种名次与奖牌的关系大致符合所谓幂律,即名次的对数与奖牌数的对数接近直线关系。本次的情况也大体如此。由于这是一种大样本的统计规律,所以奖牌总数不很多的样本,其符合幂律的特征就比较差。世锦赛的总奖牌比奥运会少。所以幂律关系的质量也比较差(不过 R 平方达到 0.8 也算可以了)。有关统计见表和附图。 15 届世锦赛前 15 名的有关数据表 排名 国家/地区 金牌 总数 log( 名次) Log (总奖牌) 1 肯尼亚 7 16 0 1.20412 2 牙买加 7 12 0.30103 1.079181 3 美国 6 18 0.477121 1.255273 4 英国 4 7 0.60206 0.845098 5 埃塞俄比亚 3 8 0.69897 0.90309 6 波兰 3 8 0.778151 0.90309 7 德国 2 8 0.845098 0.90309 7 加拿大 2 8 0.845098 0.90309 9 俄罗斯 2 4 0.954243 0.60206 10 古巴 2 3 1 0.477121 11 中国 1 9 1.041393 0.954243 12 荷兰 1 3 1.079181 0.477121 13 南非 1 3 1.113943 0.477121 14 白俄罗斯 1 2 1.146128 0.30103 15 斯洛伐克 1 1 1.176091 0 有关幂律的一些博客欢迎参考本人的专栏 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space
个人分类: 幂律|2397 次阅读|0 个评论
2015年中国企业500强的另一个幂律公式
zhangxw 2015-8-24 12:48
2015 年中国企业 500 强的另一个幂律公式 张学文 ,2015/8/24 昨天我公布了 2015 年中国企业 500 强的名次与其营业额的双对数为直线关系 , http://blog.sciencenet.cn/blog-2024-915360.html 这等价于名次与营业额是幂函数关系。这好像经常被称为是名次函数符合幂律。 但是在概率论的概率密度分布函数的含义下的幂函数分布与此是有不同的含义的。那里,它是指在一个群体中(如 500 个企业)任取一个,看他的营业额为不同值与其出现概率(等价与该档次的企业的相对数量)的关系。如果这个关系符合幂函数,那么它的概率密度就符合经典含义下的幂律关系(与正态分布含义相同,但是公式不同)。即概率密度函数是幂函数。 所以昨天的统计分析并没有回答这里提出的概率意义下的分布函数是否符合幂律的疑问。对此我们需要在原数据集合基础上另外做统计。 现在,我做了这个统计,即分析不同营业额与企业数量的关系。我发现营业额的对数与对应的企业数量的对数也是很好的直线关系。这个结果等价于其概率分布符合幂律。 有关概念的进一步说明欢迎参考我的博客中的幂律专题 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space 中的有关博客。 下面给出对应的图和有关统计数据表 2015 年中国 500 强企业的数量与营业额关系表 log 营业额 (百万)企业数量 Log( 企业数量) 4.5 以下 327 2.514548 5 118 2.071882 5.5 38 1.579784 6 15 1.176091 6.5 2 0.30103
个人分类: 幂律|2767 次阅读|0 个评论
2015年中国企业500强排名符合幂律公式
热度 1 zhangxw 2015-8-23 17:41
2015 年中国企业 500 强排名符合幂律公式 张学文, 2015/8/23 昨天公布了我国最新的企业 500 强名单。 其营业额的对数值与排名的对数值是比较好(R平方=0.9866)的直线关系,即(等价于)营业额与名次值的关系符合幂律(幂函数)关系(有关说明见本人博客中的幂律栏目,这里不再重复)。 下面是对应的图和 500 个数据中的前 30 组数据。 排名 公司名称 营业额(百万) Log( 排名)log(营业额) 1 中国石油化工股份有限公司 2,825,914 0 6.451159 2 中国石油天然气股份有限公司 2,282,962 0.30103 6.358499 3 中国建筑股份有限公司 800,028.80 0.477121 5.903106 4 中国工商银行股份有限公司 658,892 0.60206 5.818814 5 中国移动有限公司 641,448 0.69897 5.807161 6 上海汽车集团股份有限公司 630,001.20 0.778151 5.799341 7 中国中铁股份有限公司 612,559.20 0.845098 5.787148 8 中国铁建股份有限公司 591,968.40 0.90309 5.772299 9 中国建设银行股份有限公司 570,470 0.954243 5.756233 10 中国农业银行股份有限公司 520,858 1 5.716719 11 中国平安保险( 集团) 股份有限公司 462,882 1.041393 5.66547 12 中国银行股份有限公司 456,331 1.079181 5.65928 13 中国人寿保险股份有限公司 445,773 1.113943 5.649114 14 中国交通建设股份有限公司 366,673.20 1.146128 5.564279 15 中国人民保险集团股份有限公司 351,496 1.176091 5.54592 16 中国电信股份有限公司 324,394 1.20412 5.511073 17 中国中信股份有限公司 317,235.60 1.230449 5.501382 18 中国联合网络通信股份有限公司 288,570.90 1.255273 5.460253 19 中国海洋石油有限公司 274,634 1.278754 5.438754 20 联想集团有限公司 271,191.30 1.30103 5.433276 21 中国神华能源股份有限公司 248,360 1.322219 5.395082 22 中国太平洋保险( 集团) 股份有限公司 219,778 1.342423 5.341984 23 中国冶金科工股份有限公司 215,785.80 1.361728 5.334023 24 国药控股股份有限公司 200,131.30 1.380211 5.301315 25 江西铜业股份有限公司 198,833.50 1.39794 5.29849 26 宝山钢铁股份有限公司 187,789 1.414973 5.27367 27 交通银行股份有限公司 177,401 1.431364 5.248956 28 中国电力建设股份有限公司 167,091.20 1.447158 5.222954 29 招商银行股份有限公司 165,863 1.462398 5.21975 30 万科企业股份有限公司 146,388 1.477121 5.165505
个人分类: 幂律|2567 次阅读|3 个评论
从“情怀”看互联网思维
uestc2014xiaoyu 2015-4-27 15:02
2015 年 4 月,河南省某中学某位顾老师的一句 “ 世界那么大,我想去看看 ” ,引发了一连串的互联网效应,在各行各业掀起了一股 “ 情怀 ” 潮 ~~~ 各大旅游网站大打 “ 情怀 ” 牌,大力宣传和渲染,进行一场 “ 想走就走 ” 的旅行;各大高校站在教师和学生各种角度,都在抒情;各大 N 企,也从反面思考入手, “ 情怀很陶冶、现实很骨感 ” ,高薪招聘 …… 其实,撇开 “ 情怀 ” 本身的内容,我们可以想到前不久柴静的 “ 穹顶之下 ” 引发的一连串效应,与之类似!现在真的是一个信息快速传递的时代,后互联网时代 —— 移动互联网时代!静思,如此快速的信息洪流、信息发酵反应,究竟是好还是坏?!一个小小的事件极有可能带来幂律现象!
个人分类: 一只木鱼|22304 次阅读|0 个评论
图书价格排序符合幂律?
zhangxw 2015-3-6 10:54
图书价格排序符合幂律 ? 张学文 ,2015/3/6 今天看到科学网上科学出版社 2 月出版物的各个图书的价格资料 http://blog.sciencenet.cn/blog-528739-872362.html . 顺手分析了这 84 本书如果按价格排序 , 那么其名次与价格就构成了一一对应关系 . 对图书价格和名次序数值都取对数 . 就获得下面的图 . 它们接近直线,即勉强算符合幂函数关系 ( 俗称幂律 ). 下面是图 本人关于幂律和名次函数都有一些博客讨论介绍 , 关注这些认识的读者欢迎参考我的幂律博客 : http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=14138 , 以及组成论博客 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=1679view=mefrom=space . 那里多个短篇博客 . 而这里就不多介绍了 .
个人分类: 幂律|2063 次阅读|0 个评论
从百分比的平方和到幂律来源等等
热度 3 zhangxw 2014-11-9 12:59
从百分比的平方和到幂律来源等等 张学文 2014.11.09 注:以下内容我写于 2011.12.30 ,大概计划很大而随后没有跟进,而搁浅。现在权以此标题把此稿贴出,欢迎议论与发展 提要 : 探讨百分比们 ( 概率分布 ) 的平方和的最小值联系着有益的算法和结果。它与熵最大原理好有一比,并且是幂律形成的一个理论思路。 1. 比值们 身高达到 1.4米 的学生占 30% 。这里的 30% 是一个比值( 0.30 )。如果本班(以后称为群体)内各个身高的学生都被统计了。就存在着多个百分比。如 一个班有 45 个学生,身高为 1.4 、 1.5 、 1.6 的分别为 15 , 17 , 13 。那么我们有三个比值 15/45 、 17/45 、 13/45 。 这类群体我们会遇到很多(如不同温度占有的比值)。属于一个群体内的多个对应比值我们称为比值们,或者百分比们。而它们又联系着大量的所谓概率分布。显然群体内各个比值的代数和应当 =1. 1= ∑ (比值) = ∑ f i 从概率论角度看 , 比值们对应一个离散、完备的概率分布。 2. 比值的平方和 有了群体内不同身高的学生数,自然可以计算群体的学生平均身高。现在思想转个弯 , 以每个学生的身高所属于的 对应比值 来代替身高本身,自然也可以计算出 另外含义的平均值。它就是本群体内各比值的平均值 。根据文献 , ] ,而不难知道这些 比值的平均值恰好是比值的平方和 。所以一个群体内各个个体(如学生)属性(如学生身高)占有的比值的平方和具有特殊的意义。于是有 比值的平均值 = 比值平方和 m= ∑ f i 2 用概率语言说,就是离散的诸概率值的平方和就是概率的代数平均值。 3. 信息熵的类比 我们知道,概率(比值)的 几何 平均值的对数的负值 = 信息熵,而这里的比值平方和 = 比值的 代数 平均值。所以从平均值的角度看 , 比值的平方和与信息熵具有类似的身份。这使我们考虑:信息熵引出了那么多的有益知识,难道它的弟兄,比值平方和就不值得探讨探讨?下面就是我们的初步探讨。 4. 小试牛刀 一条长为 L 的绳子,它可以围出一个矩形来。设矩形的宽度 =x, 显然 x/L, 就是本问题中的一个比值,而长度显然 = ( L-2x ) /2, 长度对应的比值 = ( L-2x ) /2. (宽度、长度值现在直接对应群体内仅存的两个比值)是本问题中的另外一个比值。于是我们就有了本问题中的两个比值的平方和。现在求 比值的平方和最小 时的 x 。由于其平方和 ,m=x 2 +(L-2x) 2 /4, 通过令它对 x 的微分 =0 ,不难获得平方和最小时的 x 值 =0.25 ,于是这个平方和最小所要求的矩形应当是正方形。 这个结果说明 比值们的最小平方和 所对应的矩形是大家早就知道的相同边长情况下的正方形。“比值平方和最小”导致了面积最大。看来比值平方和最小是一个有利用价值的判断原则。 5. 另外一个例子 王彬的《熵与信息》一书中 133-139 页有个不同考试分数的学生人数问题。说分数有 3 种, 80 , 90 , 100 ,而且平均值是 90 分,求在信息熵最大的要求下不同分数的人数。结果是用最大熵求得应当是 80 、 90 、 100 分的学生各占 1/3 ,这意味着熵最大(最复杂)时,各类考试成绩的学生数量相等。 现在我们用不同分数的学生的比值的平方和最大分析它,看看结果如何。 设学生总人数是 N ,而三个档次的学生人数分别是 n1,n2,n3, 那么比值的平方和 m 就是 m=(n1/N) 2 +(n2/N) 2 +(n3/N) 2 , 现在求 m 的最小值,即分别求 m 对 n1,n2,n3, 的偏微分,并且令它们等于 0 ,考虑到三个 n 值的和 =N ,不难得到三个 n 值都是 N/3 ,这说明现在求比值最小平方和所获得的结果与最大熵方法获得的结果是相同的。这提示比值平方和最小与熵最大有相同的功能,它们都可以帮助你寻找一个比值的分布。而此比值的分布,也就是离散情况的概率分布。 6. 暂缓一步 我们已经看到一个群体内各个比值的平方和的最小值有一些特殊的价值。现在暂缓深入,而是初步理一下思路。 l 由于比值本身都是小于或者等于 1 的数,所以它们的平方和只能是大于 0 ,而小于 =1 的正数。其最大值 =1 l 平方和 不是个生疏的词, N 维矢量的各个分量的平方和对应矢量绝对值的平方 l 最小平方和 也不是生疏的词, 最小二乘法 就是它的重要应用。 l 所以发掘这种特殊平方和的特殊价值是值得的,比值的平方和会有新境界? 7. 转为连续变量的分析 百分比是孤立的数,百分比们是一串数,而且其和 =1 ,这些在概率论的视角下都是离散变量下的语言。现在我们把语言换为连续变量。 于是百分比们就变成了连续变化的所谓概率密度分布函数,而百分比们的平方和 m 就变成了概率密度分布函数 f(x) 的平方的积分, m= ∫ f(x) 2 dx 。于是老问题的新提法变成了这个积分的值最小有什么特别含义? 8. 泛函 m 的极值 … m 是一个数值。它的值依赖一个未知函数 f(x) ,于是数学上称为泛函数。研究它的极值就是所谓变分法的事。利用泛函处于极值这个要求,可以反求 f(x) 。一般的问题可以利用所谓欧拉方程去求 f(x) 。而在我们的这个平方和形式的积分情况下,它就简化为下面的等式 (dm/df)=0=2f(x) 于是我们初步获得了函数的平方的积分的最小值应当是函数值始终 =0 的这个似乎不合理的局面,但是,不要急 9. 关注约束条件! 上面我们勇敢地用了泛函、变分、欧拉方程等概念和技术,获得了连续的概率密度分布函数的平方和如果最小,它就应当 =0 ,但是概率密度是不可能 =0 的。概率密度本身对自变量的积分就应当 =1 ,所以它的平方和不可能 =0. 这使我们注意到求泛函极值时,必须补充进去一个约束,它就是未知函数本身的积分应当 =1 。此时所谓拉哥朗日乘子法就用上了。 10. 仅带一个约束时的概率分布函数 依拉哥朗日乘子法,我们要求的极值就成为 m1 , m1= ∫ f(x) 2 dx+ λ∫ f(x)dx ( 1 ) 这里的 λ 是一个待定常数。现在的问题是 f(x) 是什么函数可以使 m1 达到极值。 11. 用欧拉方程求解( 1 ) 原来我们仅要求平方和最小,现在补入了条件 λ∫ f(x)dx ,而它是常数,不影响求极值。可此时解欧拉方程,容易得到 f(x)=c ,即分布函数是不随 x 而变化的常数。或者说概率密度在平方和最小的要求下,它是一个常数。回顾我们对概率分布的认识,这就是指概率分布函数是所谓均匀分布。看,我们已经求得了一个分布函数了,它很简单,是常数! 12. 比比看 我们过去知道在信息熵最大的要求下,可以证明不提出其他要求仅是指出分布函数的积分 =1 时,该分布函数是均匀分布。现在我们回避了信息熵最大,使用了概率分布的平方和最小的要求,居然也获得了概率分布应当是均匀分布的结论。这是值得深思的。这也算新思路的初步成绩吧。 13. 再补一个约束条件试试看 上面是在仅要求分布函数的积分 =1 这个附加的合理要求时,平方和最小而获得了均匀分布的结果。现在再补入一个要求:变量的 n 次方的平均值为常数,看有什么结果。这个要求是数学表达自然是 ∫x n f(x)dx=c1, 于是我们求的极值就是 m2 达到最小,这里 m2= ∫ f(x) 2 dx+ λ∫ f(x)dx+ λ 1 ∫x n f(x)dx λ 1 是新补入的常数。 求 m2 对 f 的微分,并且让它 =0 ,则有 f(x)=-(1/2)( λ+λ 1 x n ) 显然,变量x 必须大于 0 ,而 λ应当=0, f(x)=-(1/2)( λ 1 x n ) 这个样子的概率密度分布我们不生疏,它就是时髦的所谓 幂律 了。 这样我们就在 最小平方和的要求下轻易地获得了时髦的幂律分布 ,它原来是满足最小平方和的一种分布函数! 14. 暂到此为止 我的初步分析到此为止。用这个思路还可以获得那些好处,获得那些新认识?我认为都值得继续探索。 15. 补充 关注“平方和的极值”固然是最近的事,但是概率分布的平方和具有特殊意义的事我在与冯向军讨论组成论时,就从他那里领会和认可了( 2004- )。后来他提示 tsallisentropy 我也知道一点。最近几天看有关的文章,我的分析大概属于他的 q=2 的情况。但是他是否看作最小二乘法,是否从特定的平均值思路分析、是否关注和分析了与我类似的问题,我目前不清楚。所以我的这些努力也可能是一种学习,也可能是探新。 张学文 2012/1/1 于乌鲁木齐 张学文,周少祥:空中水文学初探, 146 页,2010,气象出版社 张学文,个体通论第四章, http://blog.sciencenet.cn/blog-2024-351291.html
个人分类: 统计、概率、熵、信息、复杂性.1.|6104 次阅读|5 个评论
2014年的又一个幂律:中国富人榜
热度 3 zhangxw 2014-10-28 21:35
2014 年的又一个幂律 : 中国富人榜 张学文 ,2014/10/28 今天看到新公布的中国富人榜 , http://sports.ifeng.com/a/20141028/42317165_0.shtml , 于是就下载数据 , 分析 . 其名次 - 财富值在双对数坐标系中为直线 , 并且 R 平方值高达 0.9963 ,这应当算很好的幂律了。 欢迎参考本人关于,幂律的博客们: http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space 其他的话不多说了。 由于原始数据名单太长,有接近 400 行,这里从略了。
个人分类: 幂律|3402 次阅读|8 个评论
科学网新的周博客浏览量符合幂律
热度 3 zhangxw 2014-10-28 18:39
科学网新的周博客浏览量符合幂律 张学文 ,2014/10/28 昨天科学网突然改变了周博客浏览量的排名游戏规则 . 现在大家慢慢理解 / 认可这个新规则 . 我过去统计过老的周浏览量并且指出它符合幂律 . 即排名的对数 , 与浏览量的对数基本在双对数坐标下是直线 . 现在的新的浏览量出来了 , 它也符合幂律 ?! 我今天下午取其数据做了分析 , 结论是 : 它 依然基本符合幂律 ( 自然其参数值有变动 ). 本人在我的博客中有不少关于幂律的实验文稿 , 欢迎参考 : http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=14138 附原始数据: 1 氢分子医学 孙学军 60241 2 留连深夜 王进 48836 3 微纳世界大,和谐天.. 张海霞 24910 4 刘娜的博客 刘娜 19898 5 岳中琦的博客 岳中琦 19292 6 赵美娣的博客 赵美娣 18360 7 谢平的博客 谢平 17976 8 鲍海飞的博客 鲍海飞 17796 9 PhenixInRocky的个人.. 邵鹏 16905 10 中国科学报官方微博.. 科学报 14951 11 卢倩云的博客 卢倩云 14610 12 王云才的博客 王云才 14452 13 吴立的博客 吴立 13954 14 马老师的博客 马臻 12147 15 Power Electronics .. 李子欣 12018 16 许培扬博客 许培扬 11791 17 学到老 Never too o.. 唐常杰 11782 18 生态学时空 赵斌 11533 19 郭开周的个人博客 郭开周 11034 20 刘向的博客 刘向 10505 21 美国作品精选 代伟 10133 22 天桥陨石 陈儒军 10115 23 翟志刚的博客 翟志刚 10004 24 张忆文的博客 张忆文 9536 25 We could have had .. 王小平 9292 26 邓涛的个人博客 邓涛 8997 27 沈友明的博客 沈友明 8551 28 乔中东的博客 乔中东 8534 29 霍梅俊的博客 霍梅俊 8410 30 supdesign的个人博客.. 姚攀峰 8219 31 尤明庆的博客 尤明庆 8082 32 植物天堂-Saraca 李璐 7944 33 意得辑 - 全球学术论.. Editag 7393 34 嵇少丞的博客 嵇少丞 6905 35 贺建奎的博客 贺建奎 6900 36 武夷山 武夷山 6897 37 天空中的一个模式 蒋迅 6833 38 晴朗的天空 彭思龙 6669 39 黄安年的博客 黄安年 6485 40 万谦宏的博客 万谦宏 6440 41 路漫漫其修远兮 诸平 6350 42 Control is hopeles.. 谢力 6137 43 韩枫的博客 韩枫 5973 44 林中祥的博客 林中祥 5839 45 李泳的博客 李泳 5612 46 李连达的个人博客 李连达 5553 47 肖建华的博客 肖建华 5338 48 易富贤的博客 易富贤 5033 49 张天蓉的博客 张天蓉 4760 50 全球变化- 杨学祥工.. 杨学祥 4658 51 博客乎?茶馆乎? 曹广福 4638 52 坚守底线的60后 方唯硕 4448 53 走进平常 刘玉仙 4382 54 lix 李小文 4372 55 胡懋仁的博客 胡懋仁 4262 56 郑小康的博客 郑小康 4244 57 曾泳春的博客 曾泳春 4144 58 田晖的博客 田晖 3960 59 孙友甫的博客 孙友甫 3938 60 生命中的一点缠结 王晓明 3927 61 LANXUM 李健 3900 62 冯兆东的博客 冯兆东 3811 63 laserdai的柠檬茶间 戴德昌 3768 64 蒋永华的博客 蒋永华 3640 65 大工至善|大学至真 刘春静 3498 66 高登义的个人博客 高登义 3454 67 罗琴的博客 罗琴 3399 68 欧阳峰的博客 欧阳峰 3281 69 陈昌晔的博客 陈昌晔 3231 70 思想散步 聂广 3221 71 李明阳的博客 李明阳 3199 72 图谋博客 王启云 3187 73 思想海洋的远航 应行仁 3096 74 文克玲的博客 文克玲 3061 75 化学人生 肖重发 2998 76 极端科学主义者 李铭 2980 77 《镜子大全》《朝华.. 李维 2965 78 齐鲁名士博客 苗元华 2893 79 Dr Xuefeng Pan's W.. 潘学峰 2871 80 姚远程的博客 姚远程 2775 81 科学出版社 科学出 2714 82 刘洋的博客 刘洋 2619 83 陈楷翰的博客 陈楷翰 2616 84 高山的博客 高山 2525 85 系统医学与幻象艺术 曾杰 2445 86 清雅百合的博客 施玉梅 2416 87 心海泊栈 庄世宇 2274 88 求真 杨正瓴 2266 89 任晓丹的博客 任晓丹 2260 90 蒋高明的博客 蒋高明 2187 91 时空可变系多线矢世.. 吴中祥 2176 92 登高望远 秦四清 2094 93 哲学驿站 李侠 2078 94 分享办博苦乐 倾听博.. 科学网 1951 95 健康列车员 蒋新正 1945 96 kepusuowdp的个人博.. 王大鹏 1920 97 刘进平的博客 刘进平 1903 98 Scifotainment 张艺琼 1877 99 complexityworld 周涛 1868 100 姚小鸥的博客 姚小鸥 1809
个人分类: 幂律|1563 次阅读|10 个评论
城市生长的七大定律
supermac 2014-10-27 17:58
摘自 The new science of cities, by Michael Batty l Metcalfe’s Law :随着城市增长,其潜在的连接数量随着人口的平方变化; l Bettencourt-West Law/Marshall’s Law :随着城市增长,其平均真实收入 / 财富随着人口超线性增长; l Zipf’s Law :规模越大的城市数量越少; l Von Thunen’s Law :当城市从一个中心聚集区开始生长时,其各个地区的密度随着该地区距离中心的距离或者出行成本非线性降低; l Alonso-Wilson Law :当城市增长时,两个城市之间人们的交往次数随着其规模的乘积增长,随着二者之间的距离或出行成本而降低; l Bussiere’s Law :当城市增长时,其中心区域的人口密度会降低,密度分布会变得平缓; l Brand’s Law :城市越大就越具有可持续性,即越“绿色”。
个人分类: 科研资料|2729 次阅读|0 个评论
11届亚运会奖牌数与名次的关系符合幂律
热度 1 zhangxw 2014-10-4 12:30
11 届亚运会奖牌数与名次的关系符合幂律 张学文, 2014/10/4 今天公布了我分析的 2014.10.4 的 17 届亚运会的奖牌 - 名次关系 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=832976 现在把 1990 年的 11 届(北京)亚运会的对应分析给出。它也符合幂律,质量比 2014 年的好。
个人分类: 幂律|2618 次阅读|2 个评论
17届亚运会奖牌数-名次关系符合幂律
zhangxw 2014-10-4 11:26
17 届亚运会奖牌数 - 名次关系符合幂律 张学文 2014/10/4 第 17 届亚运会于 2014,10,4在韩国仁川 闭幕 , 中国取得金牌 / 奖牌总数第一的成绩 . 特此祝贺 ! 我过去分析过多次运动会的名次与奖牌数的关系 , 它们大多数符合幂律 , 即两者是幂函数关系 . 而在双对数坐标下 . 它们体现为一条直线 . 这里给出本次亚运会的名次与奖牌总量的双对数图 . 看来点子比较集中在一条直线附近 . 算基本符合幂律 .R 平方值达到 0.8 也算不错了。 有关分析欢迎参考本人博客的幂律栏目 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space 。 附16届亚运会的对应的文章和图的地址: http://blog.sciencenet.cn/blog-2024-388082.html
个人分类: 幂律|3103 次阅读|0 个评论
科学网的统计数据体现的数学公式有多少?
zhangxw 2014-9-23 10:35
科学网的统计数据体现的数学公式有多少 ? 张学文 ,2014/9/23 有含义清楚的大量客观数据 , 就可以做分析以致获得关于它们的规律性 . 而公式就是规律性的重要表达手段。科学网的博主多,浏览量大,博客多,于是围绕这些数据人们可以做各种分析而获得有关的公式。 ( 1 )这不,今天看到姬扬博主的: http://blog.sciencenet.cn/blog-1319915-829993.html 就给出了两个公式: 对于科学网上的普通博客(博客天数大于 200 天、精选博文数小于 20% 的博客) 博客的总点击数 = 1.3 × 博文 的总点击数 博文 的总点击数 = 1.8 × 博文 总数 × 博客天数 / 2 相对误差大约是 ± 20% ( 2 ) 9 月 2 日我统计了 2011 年以来我的博客逐日访问量,发现用二次方程拟合,其 R 平方值高达 0.9964 ,这也是经验公式。 ( 3 )最近李杰公布了一个他的博客的访问量者的所在国度图,这虽然没有公式但是这也是对博客的一种地理学分析 ( 4 ) 2014.8.13 李杰给出前 100 名博客的访问量与名次的关系符合幂律,其 R 平方值达到 0.9919 http://blog.sciencenet.cn/blog-554179-819314.html , …. ( 5 ) 2014. 我还统计、分析了前 100 名博主的好友数量与名次的关系。 ( 6 )今年 1 月我统计了李杰博客的不同地区的粉丝数量符合幂律: http://blog.sciencenet.cn/blog-2024-763278.html 总之,已经公布的针对科学网的统计数据的数学公式不下 10 篇了。 我估计关于网站数据中关系比较好的公式可能不止 10 个。难道我们不能以科学网的数据为实验室,搞一个网站的相关数学公式讨论会吗?
个人分类: 幂律|3214 次阅读|0 个评论
生态学者能帮助回答我的疑问吗?
热度 2 zhangxw 2014-7-8 10:14
生态学者能帮助回答我的疑问吗? 张学文, 2014 , 7,8 昨天我公布了自己在 1992 年写的关于生物物种丰度分布律一文 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=809773 。该文把生物个体的体重(实为其对数)作为横坐标,把地球上该生物活体的数量作为纵坐标(实为其对数)而初步获得了一个生物数量与其体重的关系线。该关系线在双对数坐标下呈现直线的体征。并且给出了对应的公式。 鉴于我根本不是搞生态学的,我希望科学网上的生态学学着帮助我解答以下的问题: 1. 把地球(或者某岛屿、大陆)的生物数量与该生物体重做的关系作数量分析是否具有价值?为什么? 2. 我得出的关系(几乎是幂律的一类)是早已经被生态学者发现了,还是从来没有人把问题提的如此清楚(变成直角坐标的两个变量)来分? 3. 我这种分析方法有错误吗? 4. 如果这个问题确实重要、又具有基础意义,是否应当进一步收集数据,以提炼更有权威的经验公式理论公式?
个人分类: 幂律|2703 次阅读|4 个评论
22年前我发现的生物物种丰度分布律
热度 4 zhangxw 2014-7-7 16:54
22 年前我发现的生物物种丰度分布律 注:应网友( huazai2068 ) 要求,我 OCR 了 1992 年我的一篇文章,现在也贴于此。它说明 22 年前我发现了关于生物物种丰度服从幂律。欢迎各位说三道四。张学文, 2014/7/7 张学文 , 湖南科协主办的“自然信息”杂志, 1992.3 期, 35-38 页 欢迎参考: http://blog.sciencenet.cn/blog-2024-408901.html http://blog.sciencenet.cn/blog-2024-599324.html 1 .问题的提出 当今的人类一方面为地球上的人口过多而担忧,另一方面又为某些物种的灭绝而惊呼.那么在这个小小的地球上各种不同的物种 ( 生物体 ) 各应当存活着多少才是“适宜的 、“理所当然”的呢 ?l 不同物种的生物数量之间有没有客观的定量的规律性存在呢 ? 本世纪 40 年代人们发现了生态学中的十一律,即甲种生物如果是乙种生物的食物,那甲的数量与乙的数量的比例是 10 比 1 。这应当看成人们在研究物种数量关系的一个重要的进展。 我们这里想把问题提得更广一些。地球上存在着数百万种生物。当把地球上所有存活着的生物物种都考虑进去的时候,是否也应当存在着关于它们的存活数量的内在关系 ? 在化学中人们研究星体内各种化学元素各占多少。化学家以不同化学元素的原子序数作为横坐标,以对应的元素在该星体上占有的数量 ( 称为丰度 ) 为纵坐标,他们把众多学者多年研究的各类元素的丰度一种一种地点绘到这张坐标图 ( 参见图 l.a) 上。这样他们就十分有效地把一大批知识组织到一起,使人一目了然地看到了不同的化学物质 ( 以原子序数表示 ) 在星体上的数量的分布规律。 (图见最后) 在物理学中人们对黑体的吸收光、发射光的能力做了研究。普朗克在本世纪初开创了量子论。他得出的黑体辐射的公式就是说明不同波长(或频率)光的光子个数的多少与波长 ( 或频率 ) 的关系 ( 见图 1-b) 。这是物理学中的一个很重要的分布律。 在数学中专门有个分支称为概率论。它研究一个集合内各个元素在随机抽样时被抽中的相对个数的分布规律。数学家把这种抽象的分布律叫做概率分布。它也常常用一条曲线表示出来。 可见“分布律 早已渗入数学,物理和化学的领域。 既然数学、物理和化学上的分布律都可以用直角坐标系把分布律定量地,形象地显示出来。那么我们相信,生物学中的分布律也可以定量地、形象地在对的平面直角坐标系中显示出来。 数学中的概率分布图的横坐标是随机变量的值,物理中的光谱分布图的横坐标是光的波长 ( 或频率 ) ,化学分布图的横坐标是原子序数,那么在生物物种分布图上横坐标应当以什么为对应的变量 ? ——这显然是个重要的问题。 我们考虑再三,认为以活着的各种生物体的体重 ( 质量, mass) 作为一个统一的测度上百万种生物的指标是科学的。活生物体的体重应选为分布图的横坐标 ( 实际用的是其对数值,见后 ) 。 地球不同生物物种的特性千差万别,但小到细菌、病毒,大到象、鲸,每种活体都有一个体重。这样,当我们以体重作为一个坐标轴就把上百万种生物物种有序地列成了一列横队。 同时,我们取对应的物种的个数作为物种分布律坐标图的纵坐标。 这样我们就在数学的,物理的,化学的分布律的启发下绘出了一个表现生物物种丰度分布律的坐标图,其横坐标对应各种生物体的体,其纵坐标对应地球这个生态系统中各对应物种的存活着的总量 ( 总个数 ) ,或者说对应物种的丰富程度。 在表 l 中我们把上述对比事例列在一起,以使问题更加清楚。 表 1 不同学科中丰富程度分布律的个例对比 学科 数学 物理 化学 生物 对象 不同取值的变量 不同性质的电磁波 不同性质的原子 不同性质的生物 分布图上纵坐标的含义 - 集合内各元素的丰富程度 不同取值的随机变量的相对出现次数 (丰富程度) 不同波长的光子的个数 (丰富程度) 不同原子序数的原子个数 (丰富程度) 不同体重的生物体的存活个数(丰富程度) 分布图上横坐标的含义 随机变量的不同取值 光 ( 电磁波 ) 的 波长 ( 或频率 ) 原子的原子序数 生物体的体重 分布律的形态 如正态分布等多 达几十种 参见图 1 . a 参见图 1 . b 参见图 2 研究程度 已有 200 多 年很成熟 本世纪初已成熟 有近 50 年研究史 尚未被意识到 2 .物种丰度分布律 整个地球上不同物种各有多少个存活着 ? 我们把生物体的体重与其在地球上的存活个数的关系称为物种丰度分布律。“丰度”是仿化学中的词汇表示该物质的丰富程度。“分布”的含义是生物体的总体重如何分布在各个不同物种上的。 为了逐步逼近这个设想存在的规律,我们先从表现这个规律的分布图上的坐标轴如何选择开始,步步深入下去。 。 2 . 1 坐标轴的选择 上一节我们明确了可以用平面上的直角坐标来展现这个分布律。而且明确了横坐标与物种体重相对应,纵坐标与个数“相对应 。 如何去“相对应” ? !最简单的办法是让坐标轴的几何长度与变最值成正比 ( 线性关系 ) 。然而我们知道生物体大的如鲸、象、巨杉……其体重多赶过 10 8 公斤( Kg) 。而细菌等微生物体重大多小于 10 -9 克 (g) 。以数量论全球大象不足百万而细菌则是若干亿个。可见体重和个数的变化范围都很大。它们大约跨越了 20 个数量级。 有鉴于此,我们仿工程学中有时用到的双对数坐标。即横坐标的几何长度与生物体的体重的对成正比,而纵坐标长度与个数的对数成正比 ( 见图 2) 。不过为了直观,在个别位置也标注了克、斤、吨或千、万、亿等变量值。 2 . 2 实测数据如何处理 如果确实有了每个物种的体重 ( 应当说是其均体重 ) 和在全球上的存活个数,我们能简单地它们一个个的填到上述坐标图上吗 ? ! 世界上有数百万种生物,照此作法,我们要图上点上百万个“点”综合出一张物种分布图来.而图 1 . a 上仅有不足 100 个点子。 我们认为这么作精确有余而困难太大。估计 21 纪我们也难得有那么多实测数据来完成这一张分布律的图。 另一种或许简单一些而数学上也还合理的处理办法是把体重不同的物种排在一起仅计算它们的总个数。这么作就把“点子”从上百万个压缩到几十个就可以了。 体重介于 1.0 克到 10.00 的小昆虫、小草可能不只几千种,可是我们可以把它们总计起来估算出来它们在全球上的总个数,这样在质量为 1-10 克的范围内我们在分布图上仅点一个点就够了。 在此思路下.又结合选用双的对数坐标,我们认为为生物、生态学家只要能把表 2 中的 20 多个未知数 ( 生物的存活个致 ) 估测出来。物种丰度分布律的曲线就能草绘出来。我们就可以说从实验上初步找到了这个定律。 表 2 中的最小生物体重取为 10 -I 9 克,这大概是类病毒的体重。而最重的生物为蓝鲸,其体重超过百吨 ( 即 10 8 克 ) 。 表 2 依本表整理数据后即可得出分布律曲线 (1) 生物体重的变化范围 10 -19 -10 -18 10 -18 -10 -17 …… 10-10 1 …… 10 8 -10 9 (2) 平均体重的对数值 -18.5 -17.5 0.5 8.5 (3) 地球上体重在此范围的生物个数( n ) n 1 n 2 n 20 n 28 (4) 生物存活个数的对数 log n 1 log n 2 log n 20 log n 28 表中 n 1 , n 1 … 是生物、生态观测的实际数据 2.3 少数数据的提示 由于笔者没有表 2 中需要的 n 1 , n 2 等这 28 个数据.所以粗线条的分布律尚绘不出来。但是零星收集了几个数据 ( 见表 8) 或许有启发性。我们把这些数据也点在物种丰度分布图 ( 见图 2) 上。 从图 2 看出这些点子近乎靠近一条斜直线这对我们是个重要的启发。它提示我们可用一条双对数坐标系中的线性回归直线来表示物种分布律。 用一个较好的计算器,就可以从表 8 中体重的对数,个数的对数这五对数据算出一个最小二乘方含义下的最佳的线性回归方程。其结果是: log n =-1.098log m +12.62 (1) 此处 m 代表体重, n 为个数。而 log n 与 log m 的五对数据的相关系数为 -0.978. 它如此接近 -1 ,表示这个线性相关十分好。难道方程 (1) 就是我要找的生物物种的体重与个数的内在规律吗 ? 表 3 少数生物物种的体重与个数 (体重取对数前,先统一划成以克为单位,体重取的是大人,小孩的平均值) 名称 体重 体重的对数 存活个数 n 个数 n 的对数 资料来源 蓝鲸 10 吨 8 1000 3 常识 象 2.5 吨 6.4 10 万 5 常识 人 30kg 4.5 5 × 10 9 9.7 常识 鼠 125g 2.1 1.2 × 10 10 10.1 1990 年 3 月 16 日人民日报海外版 白蚁 2 × 10 -5 g -4.7 2.5 × 10 17 17.4 电视台的动物世界节目 细菌 10 -12 g -12 10 24 24 不详 2 . 4 生物物种丰度分布律 图 2 中实线为推测的分布律,虚线为 6 个实测值算得的线性回归线,生物体体重的单位为克。 2014 年 7.7 注:原图 2 ,不慎丢失(待补),这里是根据 2011 年作者依据原文的原始数据另外作的图。它与下面的文章内容有一点不尽配合之处。 图 2 中的 6 个点子显示的直线型的关系对我们是重大启示。可是,由于这 6 个点子并不很符合表 2 所要求的数据格式,我们也不宜把公式 (1) 完全当作物种丰度分布律来看待。 我们的考虑是初步承认 log m 和 log n 的线性关系.但是对 (1) 式中的两个参数作些修改。 公式 (1) 可以抽象化为 (2) 式 log n =alog m +b (2) 在 (1) 中 a=-1.098 , b=12.62 。 a 是否会是别的值 ? ! 我们注意 (1) 中的 a 值很接近 -1 。如果对 a 仅保留 1 位有效字,可以取 a=-1 。而此时 (2) 式进一步简化,因为 a=-1 导致 log n =-log m +b 经整理可以把对效去掉,从而变成 Nm=10 b (3) 这个式子的含义是体重与个数的乘积是一个常数,在 n , m 的坐标系中 ( 不再是对数坐标 !) 它对应于一个双曲线 ( 此图省略了 ) . 由于 (3) 式比 (1) 式简单,在知识不足的条件下,我们建议把 (3) 式暂且粗略地视为物种体重丰度的分布律。 a 的值成 -l 了,那么 b 的值也要改吗 ? 我们说表 3 中列的仅是某一特定物种的个数代表性 不够 ( 如果取频临灭绝的物种则误差更大! ) 所以 根据什么来改动 b 的值呢 ? 如把小到类病毒 (10 -19 g) ,大到鲸 (10 9 g) 的全部生物的总质量计算出来,它也就是地球上存活生物的总生物量。而这个值生态学者已经有了一个估计,即大约等于把全地球的表面都铺上 2 毫米厚的一层生物。 取生物的身体的密度与水相同,取地球半径为 6400 公里,可算得全球生物总量约为 10 16 克。 然而根据丰度分布律的公式( 3 )也可以求出上述生物总量 Q ,这只要作如下积分,并代入 (3) Q = ∫ n d m 此积分从 m 小 积分到 m 大 Q =10b ∫ d m/m 此积分从 m 小 积分到 m 大 Q =10b(ln m 大 -ln m 小 ) (4) 此处 ln 为自然对数, m 大 , m 小 分别为最大,最小生物的个体体重。取 m 大 =10 9 克, m 小 =10 -19 克, Q =10 16 克,可从 (4) 式求得新 b 值约为 16 . 这样就有 nm =10 16 (5) 公式 (5) 是我们初步推荐推测的生物物种丰度度分布律。 如何利用 (5) 式计算质量介于 m a → m b 之间的生物个体的个数 ? 如何求它们的总质量 ? 只要注意到 n 的精确含义是质量 ( 体重 ) 有单位增置时生物体个数的增量,利用 (5) 式和 (4) 式的微分形式都易于求得。 总结一下本节的结论: 体重为 m 克 ( 实为介于 m → m+l 之间的地球上的一切存活着的生物的个数 n 由 n × m=10 16 这个公式算出。 这就是初步推测“物种度分布律”。它在双对数坐标系下是一条直线 ( 斜率为 -1) 。在 n,m 的线性坐标系下是一条双数线。 物种丰度分布律描述了生物的体重与个数的相互关系。 参考文献 饭田修一等,物理学常用数表第二版. ( 中译本 ) ,第 377 页.科学出版社, 1987 . 图 1a 不同原子序数的元素的数量(星体上) 图 1.b 黑体辐射中不同频率的光子占的相对比例 1992 年湖南科协办的自然信息杂志封面
个人分类: 幂律|5189 次阅读|12 个评论
中国的国际重要湿地面积与名次的关系
zhangxw 2014-6-4 18:44
中国的国际重要湿地面积与名次的关系 张学文 ,2014/6/4 每个大的区域(如亚洲、如中国 … )内的各个湿地的面积有大有小。我们自然可以问:该区域不同面积的湿地,与该面积的排名的关系如何?它们是个漂亮的函数关系?不知道! 今天收集了被国际承认的我国的湿地的前 4 批的名单。统计了它们的面积、名次,以及它们的对数所构成的散布图。下面是由此而绘出的图。 依我看它们勉强算符合幂律。 关于名次函数多符合幂律的事,欢迎参考本人的其他博客。它们集中在: http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=14138 的幂律栏目中。
个人分类: 幂律|2948 次阅读|0 个评论
我又发现了两个幂律?(下)
热度 1 zhangxw 2014-1-30 20:03
我又发现了两个幂律?(下) 张学文, 2014/1/29-30 本文分析了中国的前 31 个面积最大的湖泊的蓄水量,并且依其蓄水量重新排序而获得新的序列。即湖泊蓄水量的名次与降水量也应当有一种关系值得分析。下面是蓄水量名次、蓄水量、它们的对数值的有关的表。我们发现 31 对数据中的前 28 对的对数值比较好地集中在一条直线附近(即把最后的三对向下掉的快的数据砍了去! - 这不是很合适)。即它们也算符合幂律关系?下面是对应的表。 中国前 31 名(按面积)的湖泊的蓄水量(亿立方米)与名次表 蓄水量的名次 湖泊蓄水量 Log ( 名次) Log ( 蓄水 量) 1 768 0 2.885361 2 742 0.30103 2.870404 3 492 0.477121 2.691965 4 259 0.60206 2.4133 5 210 0.69897 2.322219 6 202 0.778151 2.305351 7 189 0.845098 2.276462 8 178 0.90309 2.25042 9 161 0.954243 2.206826 10 160 1 2.20412 11 111 1.041393 2.045323 12 108 1.079181 2.033424 13 77.3 1.113943 1.888179 14 74 1.146128 1.869232 15 59 1.176091 1.770852 16 46.7 1.20412 1.669317 17 27.1 1.230449 1.432969 18 26 1.255273 1.414973 19 24.4 1.278754 1.38739 20 21.6 1.30103 1.334454 21 20 1.322219 1.30103 22 19.6 1.342423 1.292256 23 18 1.361728 1.255273 24 16.3 1.380211 1.212188 25 13 1.39794 1.113943 26 12.8 1.414973 1.10721 27 12 1.431364 1.079181 28 8.7 1.447158 0.939519 29 7.5 1.462398 0.875061 30 6.5 1.477121 0.812913 31 4.8 1.491362 0.681241 下面是对应的图和公式(在图中)。其关系的质量比湖泊面积的幂律的质量略微低一点( R 平方是 0.89 )。其他的话就不多说了。
个人分类: 气象变量的笼罩面积分布|2469 次阅读|2 个评论
李杰:你的粉丝们符合幂律?
热度 1 zhangxw 2014-1-29 19:32
李杰:你的粉丝们符合幂律? 张学文, 2014/1/29 今天我发一博客,科学网博主李杰看了并且做了推荐。我随即去他的博客 http://blog.sciencenet.cn/home.php?mod=spaceuid=554179 处,注意到哪里有不同属地的读者的数量。那两排数字固然不多,但是从多到少的排列,又使我猜疑这些数据与名次是否也符合幂律,于是我动手,获得了下面的图。 难道幂律俯拾即是?我开始疑惑。另外 李杰粉丝们不同属地的数量与名次符合幂律 这个标题可以概括这个图?大家考虑吧。
个人分类: 幂律|3173 次阅读|1 个评论
我又发现了两个幂律?(上)
热度 1 zhangxw 2014-1-29 16:41
我又发现了两个幂律?(上) 张学文, 2014/1/29 昨天在一册中国的湖泊的书的 3-4 页上,我收集到了中国前 31 名的湖泊的面积、积水量的数据。我把它整理为下表。 名次 湖泊.省份 面积 Km 2 水量 亿立方米 Log( 名次) Log( 面积) 1 青海湖.青海 4200 742 0 3.623249 2 鄱阳湖.江西 3960 259 0.30103 3.597695 3 洞庭湖.湖南 2740 178 0.477121 3.437751 4 呼伦湖.内蒙 2000 111 0.60206 3.30103 5 纳木错.西藏 1920 768 0.69897 3.283301 6 洪泽湖.江苏 1805 24.4 0.778151 3.256477 7 色林错.西藏 1640 492 0.845098 3.214844 8 南四湖.山东 1225 19.6 0.90309 3.088136 9 博斯腾湖.新疆 960 77.3 0.954243 2.982271 10 巢湖.安徽 753 18 1 2.876795 11 布伦托海.新疆 730 59 1.041393 2.863323 12 羊卓雍错.西藏 678 160 1.079181 2.83123 13 高邮湖.江苏 650 8.7 1.113943 2.812913 14 鄂陵湖.青海 610 108 1.146128 2.78533 15 哈拉湖.青海 588 161 1.176091 2.769377 16 札陵湖.青海 526 46.7 1.20412 2.720986 17 赛里木湖.新疆 454 210 1.230449 2.657056 18 班公错.西藏 412 74 1.255273 2.614897 19 玛旁雍错.西藏 412 202 1.278754 2.614897 20 洪湖.湖北 402 7.5 1.30103 2.604226 21 滇池.云南 297 12 1.322219 2.472756 22 梁子湖.湖北 256 6.5 1.342423 2.40824 23 洱海.云南 253 26 1.361728 2.403121 24 达里诺尔内.蒙古 214 21.6 1.380211 2.330414 25 抚仙湖.云南 211 189 1.39794 2.324282 26 月亮泡.吉林 206 4.8 1.414973 2.313867 27 波特港湖.新疆 165 12.8 1.431364 2.217484 28 岱海内.蒙古 160 13 1.447158 2.20412 29 镜泊湖.黑龙江 95 16.3 1.462398 1.977724 30 兴凯湖.黑龙江 43.8 27.1 1.477121 1.641474 31 白头山天池.吉林 9.8 20 1.491362 0.991226 湖泊面积是一个变量,而它在中国湖泊这个集合中名次又是一个变量,这两个变量有什么关系? 上面的表还给出了名次的对数值与面积的对数值。我发现前 29 对数据比较好地在一条直线上( R 平方的值达到 0.9 )。即中国湖泊的名次函数基本符合幂律(指数函数)。下面是对应的函数图。更多的关于幂律的认识关于参考本人博客中的幂律栏目这的有关文章。 又,除了湖泊面积可以分析名次函数,湖泊的水量也可以分析其是否符合幂律,这我们在昨天的(下)一博客中给出(旁白:您现在已经可以根据这里的数据自己做对应的图、并且求对应的公式了!)。
个人分类: 幂律|2514 次阅读|3 个评论
这算我发现的地理学规律?
热度 5 zhangxw 2014-1-25 12:12
这算我发现的地理学规律? 张学文, 2014/1/24 多年前读闲书,知道德国一位地理学家看着地图,突发奇想,从而提出了著名的地球大陆漂移学说,记得他的名字可能是:魏格纳? 现在来说我最近的想法,这也来自看地球仪。 我问自己,这地球上的大陆有大有小,我可以问:不同面积的陆地各有多少“块”,这“块数”与面积之间有规律性吗?它也符合时髦的幂律吗?不知道 ! 我想求这个关系,但是收集数据也难,于是我把问题简化为:如果把面积第 1 大(欧亚大陆 + 非洲),第 2 大, …. ,第 N 大的陆地面积一一列出来,看看陆地面积 A 与其对应的名次 M 是否存在什么关系也是有趣的事。于是 于是我就初步收集了其前 19 名(我认为的)陆地面积,对一些情况也事先、事后做了一点通融处理,而获得了下面的表 名次 名称 面积 万平方公里 log (名次) log (面积) 1 亚洲 + 欧洲 + 非洲 9107 0 3.959375 2 北美洲 + 南美洲 4219 0.30103 3.62521 3 南极洲 1400 0.477121 3.146128 4 大洋洲 768 0.60206 2.885361 5 格陵兰 217 0.69897 2.33646 6 印度尼西亚诸岛 140 0.778151 2.146128 7 巴布亚新几内亚全岛 100 0.845098 2 8 马达加斯加岛 62.7 0.90309 1.797268 9 日本岛 38 0.954243 1.579784 10 英伦三岛 31 1 1.491362 11 菲律宾 29 1.041393 1.462398 12 新西兰岛 26 1.079181 1.414973 13 纽芬兰岛 11.1 1.113943 1.045323 14 古巴 11 1.146128 1.041393 15 冰岛 10 1.176091 1 16 新地岛 8.3 1.20412 0.919078 17 库页岛 7.6 1.230449 0.880814 18 斯里兰卡岛 6.5 1.255273 0.812913 19 台湾岛 3.6 1.278754 0.556303 在表中,我也给出各个陆地的名次的对数值和对应面积的对数值(是否有遗漏现在难说,把印度尼西亚作为一个岛也不尽合理)。于是我用这两组数据点绘出它们的关系图,现在显示于下面 获得这样的图,我比较满意。它说明名次 M 的对数 LOGM 与面积 A 的对数 LOGA 为线性关系,即名次与面积符合幂律关系(对此请参考我的博客分类中的关于幂律的博客)。其公式是 公式: logA = -2.8064logM + 4.3183 , R 2 = 0.9814 (精度指标接近于 1 ) 其 R 平方的值达到了 0.98 这是不错了。 所以我觉得自己发现了地球上陆地面积的一种规律性,您认可吗? 这里关于岛屿的面积我 做的一些通融处理: 1. 欧亚大陆,自然是合为一个统一的面积处理的,但是非洲本来就与亚欧是连着的,是苏伊士运河把它切开的。所以我们把三大洲和为一体处理。 2. 没有人工的巴拿马运河,南北美洲也是连着的,所以我们统一看作是一块陆地。 3. 把由很多靠得比较近的岛屿组成的印度尼西亚列为一快陆地,但是把它与巴布亚新几内亚相连的面积,按 50 万平方公里处理统一划入另外一个面积单元(称为巴布亚新几内亚全岛) 4. 日本诸岛作为统一的面积对待 5. 英伦三岛作为统一的一个面积单元对待了 这些处理也可能不尽合理,但是总的看比较合理。 不知道是否有地理学者先我而发现了这个关系 现在我就在这个博客上公布了我的发现。 这个结果显然有待进一步细化、准确化。
个人分类: 幂律|3427 次阅读|13 个评论
一个思路:马太效应-幂律-熵最大原理…
热度 2 zhangxw 2013-11-17 21:24
一个思路:马太效应 - 幂律 - 熵最大原理 … 张学文 ,2013/11/17 今天李东风教授的一篇神奇的马太效应的博客被广泛关注和认同。 http://blog.sciencenet.cn/blog-729911-742399.html 。 马太效应作为一个社会现象,在非共产主义社会普遍存在,这是学者的一般看法和承认的事实。 作为社会现象的分析可以仅谈到此,也可以再深入一层分析。例如是否可以把它量化,如果量化,量化的具体对象是什么,如何收集量化的数据以及如何解释它 … 即从定性认识走向定量,再设法理论化,以致利用、改造它 … 我的一个认识如下,欢迎供大家说三道四。 马太效应体现可以表现在知名度等很多方面。它在财富视角下,就是一个有限的社会中少数人富有,而多数人很穷。因为财富可以用钞票数量计量,我们就以此讨论它的量化问题 … 于是我们可以问这个社会中,具有不同财富的人数各有多少,并且请统计局或者统计人员调查之。 于是我们获得一个财富为 x 者的人数 y 的关系。马太效应的量化大致体现为这个 x,y 的关系类似负指数函数或者现在时髦的所谓幂律(负的幂函数)。而 2-8 律是幂律现象前期的对这个现象的表达。 现在我们初步认可财富多的人数少,财富少的人数多,这个 x-y 为例如幂函数关系(如请统计局提供)。 这样我们的分析就从感性认识向数量化认识迈进了一步,并且获得了一个大家比较熟悉的函数关系。 Y=ax^(-m), 这里 a,m 是常数。 下一步我们问,为什么会是这样?!我的认识是这样的: 1. 在财富总量为有限值(等价于代数平均值不变)的情况下,如果它被 m 个人占有而不附加其他的约束,那么根据最大熵原理(我把它成为最复杂原理),财富的分配就符合负指数函数。这与有限长的绳子被随机地切割以后不同长度的线头符合负指数函数的数学证明思路一致。它在数学上对应变量的代数平均值为常数的假设下的熵最大。 2. 在财富总量为有限值的情况下,如果把前述的代数平均值为常数改为几何平均值为常数,那么相同的原理下数学推导出来的财富分配关系就不是负指数关系而是尾巴更长的幂律。这些在我写的组成论一书的 16-17 章里有说明,这里不细说了。 3. 财富分配不均匀会引发革命、动乱,于是一些理论家说我们应当搞一个太富的人和太穷的人都比较少的,中产阶级比较多的社会(曲线是两头小中间大)。这对应的 x,y 的关系类似与正态分布函数。这是不希望在发生革命的理论家的希望。这个希望在理论上有什么参考点呢? 4. 我的认识是:负指数分布对应于一群猴子去抢一袋花生米,幂律分布对应于社会(法律、政府 … )把“人”分等级,相对等级保持比例关系,这对应几何平均值不变下的自由竞争。但是 5. 但是,在代数平均值不变并且同时也要求几何平均值不变的情况下,在自由竞争(熵最大原理)下,这个社会反而成为类似正态分布的所谓 gamma 分布了。这大概是一个和谐社会。 6. 好了这里不能谈更多了,总之,我认为把最大熵原理配合不同的约束对于我们认识与马太效应有联系的社会现象是一个定量的、很有启发的思路,甚至为改造我们的社会,提供思路。
个人分类: 组成论|4500 次阅读|4 个评论
我发现中国主要河流年径流量排序(名次)符合幂律
热度 2 zhangxw 2013-10-25 12:19
我发现中国主要河流年径流量排序 ( 名次 ) 符合幂律 张学文 ,2013.10.25 Ø 把一批具有共同属性 ( 本案中是中国的年径流量,并且以亿立方米/年为单位 ) 的 N 个数据 s 1 ,s 2 ,s 3 ,…s n 排序 , 于是有第 1 名,第 2 名, … 第 N 名, Ø 对 s 1 ,s 2 ,s 3 ,…s n ,分别取以 10 为底的对数,作为各个 y i ,并且对顺序值(1,2,3,…,52)也取对数 , 作为各个 x i ,并且做直角坐标图,于是我们获得中国平均流量大于1000立方米/秒的河流年径流量的排序大体符合这种双对数坐标下的直线关系,这经常被称为幂律。 Ø 中国主要河流流量的这个幂律关系的质量,可以用 R 平方值衡量,它现在它的值是0.90,很接近于 1 ,不错了! Ø 这是今天的发现,我就公布在这里了。本人关于幂律的其他博客,见 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space http://blog.sciencenet.cn/blog-2024-734025.html http://blog.sciencenet.cn/blog-2024-735959.html 等等 Ø 如有引入请注明出处。
个人分类: 幂律|7027 次阅读|5 个评论
我发现新疆湖泊面积排序(名次)符合幂律
热度 1 zhangxw 2013-10-18 17:47
我发现新疆湖泊面积排序 ( 名次 ) 符合幂律 张学文 ,2013.10.18 Ø 把一批具有共同属性 ( 本案中是新疆湖泊面积,以平方公里计,并且仅取大约 2.5 平方公里的湖泊 ) 的 N 个数据 s1,s2,s3,…sn 排序 , 于是有第 1 名,第 2 名, … 第 N 名, Ø 对 s1,s2,s3,…sn ,分别取以 10 为底的对数,作为各个 y ,并且对顺序值也取对数 , 作为各个 x ,并且做直角坐标图,于是我们获得新疆湖泊面积的排序大体符合这种双对数坐标下的直线关系,这经常被称为幂律 Ø 新疆湖泊的这个幂律关系的质量,可以用 R 平方值衡量,它现在=0.97,很接近于 1 ,不错了! Ø 这是今天的发现,我就公布在这里了。本人关于幂律的其他博客,见 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space 如有引入请注明出处。
个人分类: 幂律|4291 次阅读|3 个评论
水汽密度与大气压力的关系符合幂律
热度 1 zhangxw 2013-5-19 16:58
水汽密度与大气压力的关系符合幂律 张学文 ,2013/5/19 今天上午把最近分析的南京的水汽密度等与大气压力的关系贴了出去 , 下午分析其关系 , 发现它们很好地符合所谓幂律 , 即变量们的对数是很好的线性关系 ( 对此的简单说明请见本人的幂律博客中的有关文章 ). 体现拟合程度的 R 平方值冬,夏分别是0.997、0.993,它们都十分接近于 1 。
个人分类: 空中水科学|2896 次阅读|1 个评论
不同水体的数量与循环周期的关系满足幂律
热度 1 zhangxw 2013-4-14 12:40
不同水体的数量与循环周期的关系满足幂律 张学文, 2013/4/14 2012.1.4 我写了一博客 http://blog.sciencenet.cn/blog-2024-525470.html ,给出地球上不同水体与其循环一次需要的时间之间的函数关系。昨天再看该文发现表中最后一个数据错了一位。现在把它改正过来,连图带表,贴于此。我发现改正后的数据使原先发现它们符合幂律关系的统计学质量从原来的 0.86 ,提高到 0.89 了。即更接近于理想的 1 了。 再次提示:我认为这是水科学中的新发现,欢迎关注,也希望引用时,给出本博客地址。 水体名称 循环一次时间 水体数量 循环周期 10 12 m 3 以年为单位 数量对数 周期对数 海水 2500 年 1338000 2500 6.126456 3.39794 深层地下水 1400 年 23400 1400 4.369216 3.146128 极地冰川 9700 年 24064 9700 4.381368 3.986772 湖泊 17 年 176 17 2.245513 1.230449 沼泽 5 年 11.47 5 1.059563 0.69897 土壤水 1 年 16.5 1 1.217484 0 河水 16 天 2.12 0.043836 0.326336 -1.35817 生物水 30 天 1.12 0.082192 0.049218 -1.08517 空中水汽 9 天 12.9 0.024658 1.11059 -1.60805 云中的水滴、冰晶 1.8 小时 0.09 0.000205 -1.04576 -3.68723 下降中的雨滴、雪花 13 分钟 0.013 2.47E-05 -1.88606 -4.60671 利用以上数据可以点绘出下面的关系图,注意它意味着变量之间符合幂律,而相关的质量是 0.8971 。对于时间跨度为 10 的 9 次方,数量跨度为 8 个数量级的变量,具有这样的关系,应当认为很不错了。
个人分类: 水科学|4109 次阅读|1 个评论
商业订单行为中的标度律分析、建模与仿真
热度 2 supermac 2012-10-17 18:51
我们认为对人类行为动力学的分析应该从个体、团体(组织)、群体三个方面进行,目前的研究由于数据采集困难等原因,常见于个体和群体,而对团体的研究较少。 我们最近的一篇文章恰好弥补了这样的缺失,以某全球500强企业的采购订单为研究对象,来考察某个组织的行为,看其与个体或者群体行为有何分别,统计量仍然为人类动力学研究中的关键量——时间间隔分布,具体从个体(区分不同客户的订单)和群体(不区分客户整体考虑)两个层面进行研究。 研究发现,当不区分各个供应商时,个体行为标度律表现为较好的幂律分布,指数约为2.0;当将供应商混合考虑时,群体行为表现为幂律和指数混合的分布形式。对后者, 我们建立了一个以产品生命周期驱动的模型,并给出数值解析和仿真,结果显示可以很好的刻画这种幂律与指数混合的分布律。 Individual and group dynamics in purchasing activity Lei Gao, Jin-Li Guo,Chao Fan, Xue-Jiao Liu Physica A, Volume 392, Issue 2, 15 January 2013, Pages 343–349 Abstract As a major part of the daily operation in an enterprise, purchasing frequency is in constant change. Recent approaches on the human dynamics can provide some new insights into the economic behavior of companies in the supply chain. This paper captures the attributes of creation times of purchase orders to an individual vendor, as well as to all vendors, and further investigates whether they have some kind of dynamics by applying logarithmic binning to the construction of distribution plots. It’s found that the former displays a power-law distribution with approximate exponent 2.0, while the latter is fitted by a mixture distribution with both power-law and exponential characteristics. Obviously, two distinctive characteristics are presented for the interval time distribution from the perspective of individual dynamics and group dynamics. Actually, this mixing feature can be attributed to the fitting deviations as they are negligible for individual dynamics, but those of different vendors are cumulated and then lead to an exponential factor for group dynamics. To better describe the mechanism generating the heterogeneity of the purchase order assignment process from the objective company to all its vendors, a model driven by product life cycle is introduced, and then the analytical distribution and the simulation result are obtained, which are in good agreement with the empirical data. Keywords Human dynamics; Supply chain; Power-law distribution; Mixture distribution; Individual dynamics; Group dynamics http://www.sciencedirect.com/science/article/pii/S0378437112007169 Corresponding author. E-mail address: phd5816@163.com (J.-L. Guo).
个人分类: 成果交流|4061 次阅读|13 个评论
就名次函数的尾巴等问题,回李杰
热度 1 zhangxw 2012-8-19 14:24
就名次函数的尾巴等问题,回李杰 张学文, 2012/8/19 1. 在前面的一博客 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=602409 中我们已经说清楚,每个数据集合不仅对应一个概率分布,其中有的数据集合对应幂律。也指出针对这个数据集合的高值端,我们可以把它们以大小排序。而排序值(名次)的对数与数据的具体值的对数在双对数坐标系中是直线关系。这体现着幂律的特点。 2. 前面我已经看到,均匀分布、负指数分布、幂分布对应的名次分布有下垂的尾巴。目前我希望知道我们经常用的 10 多概率分布的数据集合的名次函数是否都是如此。希望你做这 10 多个数值实验。我认为这是很有价值的。它使我们对极值的分布有新认识。
个人分类: 幂律|3069 次阅读|3 个评论
对幂律、名次函数的一些认识
zhangxw 2012-8-15 11:24
对幂律、名次函数的一些认识 张学文 ,2012/8/13 最近李杰等在博客上对幂律做了一些探索,我随着也想到一些问题,现在说几句认识: 1. 圆的面积是其半径的 2 次幂, s= π r 2 , 小学生都知道。幂函数本来就中学的数学知识。在科学中符合幂函数的确定性关系(公式)很多。它们的形成原因应当从对应学科里找答案。把幂函数转而单独称为“幂律( power low )” , 我认为是特指一定含义的问题。我理解主要是指一些具有随机性的自然现象所体现、对应的概率分布不是 50 年前时髦的正态分布,而是具有幂函数形式的概率密度分布函数。其基本公式是 p=a/x b . 这里 p 是变量 x 的概率密度, a,b 是两个常数,变量 x 具有的基本特点是它大于 0 。另外 ,b 是大于 0 的一个数。当 b=1, 则 p,x 是双曲线关系。 2. 所谓对应着概率分布问题,可以设想存在一大批( N 个)个体。每个个体就特征变量 x 有一个确定值。问 具有不同特征值的个体各有多少就对应一个概率分布 (这个问“问题”的格式很重要)。这个情况对应于存在 N 个数据。例如 800 学生 ( 个体们 ) 中不同身高的学生个有多少,不同级别的地震发生了多少次,不同财富的家庭分别占有多少百分比等,这些问题太多了。它们构成了统计学与概率论中的核心问题(采样结果,其特征量被称为随机变量)。 3. 对上面的“ 具有不同特征值的个体各有多少 ” 的答案对应一个概率分布(函数)。而不同的问题其答案对应的概率分布是不同的。正态分布曾经是很多统计学者认为的重要的一类概率分布,但是二项分布,均匀分布等 10 多种分布都被概率论所研究,并且认为比较常见。而幂律是其一 , 也仅是其一。 4. 符合“ 具有不同特征值的个体各有多少 ”模型的事物千千万万,而常见的对应分布仅 10 多种。是否存在一个统一的理论来回答这些结局不同的分布?在我写的《组成论》( 中国科学技术大学出版社, 2003 ,其实在 1992 年的《熵气象学》一书已经有了)从随机性事件对应熵(我称为复杂程度)最大配合不同的约束条件可以推出很多基本分布来。即最大熵 + 约束条件为基本概率分布类型提供统一的物理思路(不是数学游戏!)。幂律也在其中。 5. 牛顿不是用 f=ma 的力学公式配合不同的条件从而获得自由落体的直线运动公式,抛物线的公式、圆周运动、椭圆运动的公式吗?从最大熵配上不同的条件也得出不同的公式(概率分布公式),这说明最大熵原理与牛顿力学原理有类似又独立的地位! 6. 幂律概率分布可以从(熵最大 + 该个体们占有的变量的几何平均值不变)这个简单模型中逻辑地推出。我认为这应当成为我们理解随机性事件中的概率分布的主要理论思路。《组成论》 http://zxw.xjxnw.com/ 17 章对此已经有了相当仔细的说明,并且给出了数值试验的方法。那里也对为什么是几何平均值为确定值,而不是代数平均值为固定值的含义给了说明。 7. 对幂律型的概率分布公式两侧取对数,则新变量就在直角坐标系中变成了直线关系。所以检验数据是否满足幂律的直观方法就是看双对数坐标下的数据点 ( 变量的对数 , 出现次数的对数 ) 是否都在一条直线附近。 8. 在概率分析、统计与社会实践中,人们有时对随机变量的数值特别大的那些数据特别注意。跑得特别快的人,考得特别好的人,雨量特别大的降水就是代表。在工程上,特别大的暴雨、积雪、风力的数值联系着所谓工程的安全系数标准。不能抵抗强自然灾害的工程成本低,但是不安全,抵抗自然灾害能力很强则造价又高。所以随机变量高值端固然出现机会不多,但是准确认识其规律性具有实际的重要性。 9. 难道不同的概率分布在随机变量的高端有什么统一共同规律性?过去的教科书经常推荐一个极值分布律。它也被称为 Gumbel 分布。据说很多原始分布对应的极值都符合这个分布。 10. 关于随机变量的取值靠近高值端的一般规律性问题,人们有时也用另外一个思路去分析。这就是不去分析什么出现概率,而仅分析现有数据集合中的老大(最大值)、老二、老三 … 的变量值与其名次排序的关系。这好像被称为名次函数。而一个重要的实践经验是随机变量的高端值被排序以后,随机变量值 x 与排序的第 n 名之间,居然在双对数坐标系中也是直线。于是人们认为,这也是幂律! 11. 我认为这个发现很重要,但是变量值与第几名的关系与概率分布问题不是一个含义。不能用最大熵加几何平均值的思路去解释它。而且在数据很多时人们发现所谓满足幂律也仅是在数据的高端部分,如果你选取全部数据,那么随机变量数值不大的那些数据则偏离双对数坐标系中的直线,而向下垂。这又如何理解?我尊重和注意这个统计实践的结果,但是需要对这些另外给出说明。 12. 我目前谈不出对此的理论说明,但是我做了两个数值试验它们说明原始分布为负指数分布,或者幂分布(即符合幂律)的原始数据系列,其变量的 log 值与 logn (名次值的对数)在 n 小于 100 时符合幂函数(幂律),但是 n 再大,它就偏离双对数下的“幂律”直线而下垂。 13. 对此我准备在另外一文中说明有关情况。见: http://blog.sciencenet.cn/blog-2024-602409.html
个人分类: 幂律|5480 次阅读|0 个评论
就生物物种丰度符合幂律事,回王德华教授
热度 2 zhangxw 2012-8-5 17:35
就生物物种丰度符合幂律事,回王德华教授 王教授 , 您好 ! 感谢您关注我的一个博客文章 http://blog.sciencenet.cn/blog-2024-599250.html 。 针对我的文章中的第 7 部分,您提出了如下认识: “ 关于 7 :生物学上很早就有学者发现了这种现象,称为 Allometry 。 http://blog.sciencenet.cn/blog-41757-407955.html ” 于是我就看了对应的网页上您的介绍文章。核心点“生物体的生物学特征与体型的这种依赖性关系称为异速增长关系 (Allometry) 。”随后您就展开讨论了这种关系与一般的公式表示 … 对此现在我的认识是这样的: 我原来文章的第 7 段谈的问题是“我个人最得意的关于幂律的发现是 90 年代的事,那时我在一篇文章中研究了不同体重的生物活体的数量与体重的关系。这就最大的蓝鲸、人、老鼠、直到细菌这些体重不同的活体,发现它们的存活量与个体体重为幂律关系。这个文章发表在一个小杂志上。我很希望大家重视这个跨动物、植物、微生物的数量分析结果,希望有人认识其意义,并且补充资料。” 我认为,您提的议题与我的议题有相同部分,它就是都涉及了生物体的体重,而且都是跨越很多个数量级来分析这个特征。但是我们的论题也有不相同的部分,即您论及的是生物个体的体重与该生物体自己的代谢速率的关系之类的问题。而我考虑的是在地球这个狭小范围内生物体重与该类生物的存活数量的关系问题(其前身应当说对应所谓“十一律”)。这更具体生态学的意义,而缺少生理学的意义。所以我理解您指出的问题与我讨论的问题依然不是一类问题。 我记得 2-4 年前我在您的博客留言中问过您,我感兴趣的生物数量与体重关系的事,当时您给我的回复是,您没有考虑或者不了解情况(原话记不住了,但是没有正面回答我的提问)于是您的回答也继续使我认为是我提出了这个重要问题。 我是退休者,纯属业余爱好把大象的数量、人的数量、老鼠的数量一致细菌的数量的对数与其体重的对数作为两个坐标,我发现它们在一条直线上。我很高兴,也自知我的数据很少。可我难以收罗这类数据。(这些活动自然基于 90 年代初我已经注意幂律现象与幂律成因)我认为这是生态学上的重要问题。我乐见有学者早就研究了这个重要问题,并且给出了这样或者另外的结论。如果学者们尚没有意识到这个问题,我提示我在 90 年代已经在一个小杂志(自然信息,湖南办的杂志,后来蒸发了,我的文章标题:生物物种丰度分布律, 1992,3 期, 35-38 页上)指出了它们符合幂律。您是本领域的专家。希望您能告诉我是否此前早就有人揭露了这个规律。
个人分类: 幂律|4681 次阅读|4 个评论
幂律-幂律书…
热度 3 zhangxw 2012-8-5 12:53
幂律 - 幂律书 … 张学文, 2012/8/5 1. 昨天看到龚明的博客 http://blog.sciencenet.cn/blog-709494-594491.html%20 上各国人口密度的文章中有对应数据,就顺手探索人口密度与名次的关系,发现了它们比较好地符合幂律。于是写成一博文。随后李杰写 6 博客验证与发展这些认识。这对我是支持 + 考验,更是唤起大家对幂律知识的重视。 2. 幂律,简单地说就是两个变量为幂函数关系。问题在于这种十分简单的关系符合很多领域的物理量的实况。 2% 的人掌握了 80% 的财富,是它在经济学中的最早表述,不同数量 x 字母的词的出现次数 y 符合幂函数关系是重要的例子,而互联网中关于浏览量也存在很多幂律。可以说从社会现象到自然现象,符合幂律的很多。科学界有义务回答这是为什么?幂律还是跨很多数量级的物理量的规律性的优秀个例。 3. 很多符合幂律的现象的因变量具有出现概率的含义。而自变量可能是社会与自然界的很多变量。于是我们要承认幂律也是一种非常重要的概率密度分布函数。把幂律知识编入概率论教程是完全应当,十分迫切的事。这扩大了统计学关注的基本概率类型,是我们及时认识新事物的重要一环。 4. 本人是 90 年代认识到这个幂律可以从最大熵原理配合几何平均值不变而从理论上推导出来。最后见诸文献是在《组成论》( 2003 ,中国科学技术大学出版社)的 17 章中。那里从最大熵原理给出系统证明(我称为最复杂原理),并且补充了一个数值实验和一些个例。随后冯向军等人就此开展了大量的讨论。 90 年代以来我国关于幂律的检验性的实例文章逐步加多。科学网上有的老师呼吁把幂律写入统计概率论教程中。我积极支持。 5. 2005 年前后我介绍《组成论》的三篇博客文章中的第 2 篇是名称是幂律成因。当时在奇迹网站上的该文的访问量居然达到 5 万多。有人说张学文首先证明了形成幂律的原因。 6. 2008 ?在科学网处,原本几个人同意写一本介绍幂律的高级科普书,我对应解决出版费。可后来这个事没有弄成。我一直认为应当写。 7. 我个人最得意的关于幂律的发现是 90 年代的事,那时我在一篇文章中研究了不同体重的生物活体的数量与体重的关系。这把最大的蓝鲸、人、老鼠、直到细菌这些体重不同的活体的数量,发现它们的存活量与体重为幂律关系。这个文章发表在一个小杂志上。我很希望大家重视这个跨动物、植物、微生物的数量分析结果,希望有人认识其意义,并且补充资料。 8. 幂律联系着互联网、联系者分形大师 B.B.Manddebort 的分形艺术,是横跨自然与社会科学现象的简单、得力、又很“普适”的规律。应当在学者大量发布个例性的论文的同时有科学书籍对它做系统介绍。我期待介绍幂律的书早日成稿、出版;期待概率论书籍中有幂律。 9. 昨天李杰在博客中热心验证我最近点的一个幂律,发了 6 篇文章。使我在这里补这些闲话。
个人分类: 幂律|5490 次阅读|7 个评论
又发现一个幂律--世界各国(含地区)人口密度的排名
热度 2 zhangxw 2012-8-4 10:36
又发现一个幂律--世界各国(含地区)人口密度的排名
又发现一个幂律 -- 世界各国(含地区)人口密度的排名 张学文, 2012.8.4 世界上各个国家(含地区)的人口密度(每平方公里的人口数)不同,其前 75 名中排名顺序数与人口密度数是两个数列,这两个数列是否存在什么函数关系? 今天有幸从龚明的博客 http://blog.sciencenet.cn/blog-709494-594491.html 上抄了列出的国家地区的人口密度数与顺序。我把它们分别取对数,再做图,发现它们基本在一条直线上。这显示了我们发现的规律。按照我前面的一些分析与说明,这种双对数坐标系下的直线对应于原变量之间是所谓 幂律关系 。 所以,世界各个国家(地区)的人口密度(前 75 名)的顺序数(名次数)与人口密度符合幂律关系。写成为公式是: log( 人口密度, y ) = -1.0974 (该国家在全球的排名名次的对数值, x ) + 4.1845 这个统计关系的精度, R 2 =0.9846 这样我就又发现一个幂律规律。 本人关于幂律的一些说明见:组成论一书 http://zxw.xjxnw.com/ZCL/index.htm 17 章 下面是对应的数据和图 顺序 人口密度 顺序数对数 人口密度对数 顺序 人口密度 顺序数对数 人口密度对数 1 15,661 0 4.194819 39 312 1.591065 2.494155 2 6,844 0.30103 3.83531 40 289 1.60206 2.460898 3 6,522 0.477121 3.814381 41 275 1.612784 2.439333 4 4,603 0.60206 3.663041 42 267 1.623249 2.426511 5 4,455 0.69897 3.648848 43 262 1.633468 2.418301 6 1,891 0.778151 3.276692 44 261 1.643453 2.416641 7 1,827 0.845098 3.261739 45 256 1.653213 2.40824 8 1,317 0.90309 3.119586 46 239 1.662758 2.378398 9 1,292 0.954243 3.111263 47 233 1.672098 2.367356 10 1,289 1 3.110253 48 228 1.681241 2.357935 11 1,101 1.041393 3.041787 49 220 1.690196 2.342423 12 834 1.079181 2.921166 50 209 1.69897 2.320146 13 812 1.113943 2.909556 51 204 1.70757 2.30963 14 699 1.146128 2.844477 52 203 1.716003 2.307496 15 665 1.176091 2.822822 53 203 1.724276 2.307496 16 642 1.20412 2.807535 54 198 1.732394 2.296665 17 550 1.230449 2.740363 55 196 1.740363 2.292256 18 520 1.255273 2.716003 56 196 1.748188 2.292256 19 495 1.278754 2.694605 57 195 1.755875 2.290035 20 444 1.30103 2.647383 58 193 1.763428 2.285557 21 438 1.322219 2.641474 59 185 1.770852 2.267172 22 438 1.342423 2.641474 60 181 1.778151 2.257679 23 432 1.361728 2.635484 61 179 1.78533 2.252853 24 406 1.380211 2.608526 62 168 1.792392 2.225309 25 406 1.39794 2.608526 63 168 1.799341 2.225309 26 398 1.414973 2.599883 64 166 1.80618 2.220108 27 371 1.431364 2.569374 65 159 1.812913 2.201397 28 367 1.447158 2.564666 66 152 1.819544 2.181844 29 366 1.462398 2.563481 67 148 1.826075 2.170262 30 362 1.477121 2.558709 68 148 1.832509 2.170262 31 360 1.491362 2.556303 69 147 1.838849 2.167317 32 350 1.50515 2.544068 70 146 1.845098 2.164353 33 342 1.518514 2.534026 71 142 1.851258 2.152288 34 339 1.531479 2.5302 72 139 1.857332 2.143015 35 338 1.544068 2.528917 73 138 1.863323 2.139879 36 335 1.556303 2.525045 74 134 1.869232 2.127105 37 324 1.568202 2.510545 75 130 1.875061 2.113943 38 315 1.579784 2.498311 致谢:感谢 龚明博客提供的数据。这是本文的原料。 世界人口密度的排序符合幂律
个人分类: 幂律|6088 次阅读|7 个评论
关于地球上国土面积前80名的一个幂律
热度 4 zhangxw 2011-3-24 13:15
关于地球上国土面积前80名的一个幂律
关于地球上国土面积前 80 名的一个幂律 地球上的国家很多,在任何时刻我们总可以问这样一个符合我的《组成论》的问题:不同面积的国家各有多少。最近翟远征的博客文章就给出了对应的 172 个国家面积的原始数据。根据这个数据可以回答和分析上述问题。由于不同国家的面积可以相差好几个数量级。于是我就以面积(百万平方公里)的对数值做分界。获得了下面的表 面积的 对数值 具有该面积 的国家数量 -2 以下 0 -2 到 -1.5 2 -1.5 到 -1 7 -1 到 -0.5 3 -.5 到 0 5 0 到 0.5 23 0.5 到 1 27 1 到 1.5 37 1.5 到 2 39 2 到 2.5 22 2.5 到 3 6 3 到 3.5 1 以面积的对数为横坐标绘图,以国家数量为纵坐标做图,它们类似正态分布,但是偏差也明显(图略)。 可是如果仅取国土面积最大的前 80 名,单独分析,则国土面积的对数与名次的对数基本是直线关系。这等价于这两个变量的幂函数关系,即它们基本符合所谓幂律。下面是对应的图。 感谢翟远征在文章: http://bbs.sciencenet.cn/home.php?mod=spaceuid=238437do=blogid=424969 中 . 提供的数据 张学文分析于 2011-3-24 国土面积前80名的面积与名次基本符合幂律
个人分类: 幂律|4119 次阅读|9 个评论
《神秘又简单的幂律》科普书提纲
热度 3 zhangxw 2011-2-16 12:48
《神秘又简单的幂律》科普书提纲 2011-2-16 初稿,张学文 1. 认识: 10 多年来,我逐步认识到外形简单的幂律,在社会现象和自然现象中有大量实例。幂律几乎成为很多学者喜欢玩的规律而又难以道出它的形成背景。有的研究者鼓吹不知道它形成的原因反而增加它的神秘性。在这个背景下,概况一下不同领域揭露的幂律本身就具有推进研究,引向统一认识的意义。大约在 1993 年,本人认识到最大信息熵原理加上变量的几何平均值不变的约束就可以从理论上推出幂律,幂律是与正态分布等著名概论分布并列的分布函数。在 2003 年出版的《组成论》的 17 章中,我以 3 节讨论幂律问题。该书出版以后在奇迹论坛和潜科学论坛等处就此开展过比较广泛的讨论。在讨论中也提出过编写一本小册子,专门介绍有关幂律的方方面面,成为一本比较专业的科普书的想法。近年来在科学网上不止一位学者提出把幂律列入概率论应当介绍的基本概率分布之一。而关心幂律的学者更多。我确实想写一本通俗的关于幂律的书,可个人能力不足。 2. 为了不让这些认识流失,这里我提出关于幂律小册子的一个可能的提纲。欢迎大家关注并且提出认识。我期待有人可以参与合著,完成其中的一部分。出版事宜我解决。拟议中的《神秘又简单的幂律分布》是中级科普书,大约 7 万字。 3. 《神秘又简单的幂律分布》提纲 l 横跨自然与社会的规律 l 财富在人群中的分布 l 英文字母的 zipf 律、文献数量的规律 l 幂律公式 n=a/xm l 分形、名次、网络 … 中的幂分布 l 幂律公式本身提供了什么信息 l 我能发现新幂律吗( 1 ) l 幂律分布的用途、成因 l 从确定性归结出来的成因 l 概率分布家族是幂律的朋友 l 熵最大原理给幂律的说明 l 让数值试验来佐证 l 在动态中幂律得以维持的秘密 l 我能发现新幂律吗( 2 ) l 幂律等待荣升 l 附录:从最大熵看概率分布
个人分类: 幂律|7244 次阅读|13 个评论
对幂律成因的一种说明
热度 1 zhangxw 2011-2-1 13:08
对幂律成因的一种说明 本文是 2005 , 9 , 4 发表在奇迹论坛上的三篇连贯文章中的第 2 篇,刊出后数年有 5 万多的浏览量,有 60 多个跟贴,但是 2010 年该网站的有关论坛关闭了。另外由于我这个博客上也随手发了一些幂律现象,这里把我对幂律成因的简要认识补贴于此 -- 张学文 2011.2.1 1. 幂律成因 -- 斩乱麻问题、幂律成因与组成理论之二 --2005-9-4-- 张学文 斩乱麻问题是利用复杂程度最大(跳出热力学的熵原理)求一个函数的生动例子,现在利用类似思路研究为什么很多自然和社会现象中体现着 Zipf ,或者分型学说的创立者大力宣扬的幂分布(幂律分布)。 2. 大约 50 年前 G.K.Zipf 发现英文的文本中 a , the 等字母少的词出现的机会多,而字母多的词(如 Basketball )很少出现,他发现组成一个词用的字母的数量 n 与该词在文章中出现的概率 p 为负幂函数关系: p=c(n^a) , a 是个小于 0 的常数, c 是系数。 Zipf 热情地寻找这个规律在其他社会现象领域的实用个例,目前有专门讨论这个定律的网站。多数城市的人口比较少,少数城市人很多;多数网页看它的人数很少,少数网页很多人看,这里的城市数量与人口数量的关系,网页数量与看它的人数都满足幂律关系的。 3. 显然把幂函数的两边取对数,那么变量(如组成词的字母数)与其出现概率的对数恰好是线性关系,或者说在双对数坐标下,变量关系是一条直线。所以变量对数为直线关系就成为判定是否为幂律的简单依据。 4. B.B. Mandebort 倡导的分型几何学,他弄出来的美丽图案已经让人们承认他是一个新的分支的领袖了。其实, Mandebort 研究的所谓分型问题中包括了大量的幂律分布,其他人也在这种热情中又发现新的幂律。所以目前从自然科学里的原子核到社会现象,人们在非常广泛的领域里都发现幂律存在。 统计数学里经常介绍很多广为应用的概率分布函数,著名的如正态分布,那里对幂律的关注比较少,其实,幂律也是概率分布中的一种。鉴于在不同语言下发现了大量的事例,幂分布应当在概率论中占有比较重要的地位。 5. 为什么这些十分不同的现象都服从幂律,其共同的制约因素是什么?我也看过分析一些文章,不谈形成原因的文章多 ( 甚至说不知道原因反而体现这个分布的神秘性 ) ,理论分析文章少,而指明它们的共同原因的文章,我到目前依然没有看到(也可能我看的文章少)。 6. 大约在 15 年前,我们就收集和自己证明,很多概率分布函数都可以利用熵最大(复杂性最大)原理配合不同的约束而推导出来。《熵气象学》(气象出版社, 1992 )中就汇集了我们给出的多种概论分布所要求的约束条件。但是书里没有提幂分布。 7. 大约在 1991 年《熵气象学》交稿后我们发现用最大熵原理配合上 “ 变量的几何平均值为常数 ” 这个简单约束条件就很容易得到幂分布。它与斩乱麻的约束条件的差别很小,一个的变量的平均值为常数,一个是其几何平均值不变。可以说这个简单认识道出了幂分布的形成原因。 8. 遗憾的是这个认识我们一直没有写成文章。 1999 年我为网易的科技栏目写 “ 改造后的熵 ” ,就把这个认识公布到网上了。见诸书面文字则是 2003 年出版的组成论里比较系统地说明了这个认识。 9. 所以可以说:关于 Zipf 律、分型的自相似律、幂分布律的形成原因就是变量具有随机性(可以引用熵最大原理 — 最复杂的结局出现的概论最高),而且变量的几何平均值(对于与百分比的平均)不变,这么两条。它类似斩乱麻问题但是那里的约束是代数平均值不变。所以在我看来幂律形成的统一原因在熵原理那里是个已经解决的问题。有兴趣的同志可以到组成论的网页版 http://zxw.idm.cn/ZCL/index.htm 看其中的 17 章 .6-8 节 10. 略
个人分类: 幂律|4855 次阅读|1 个评论
科学网博客新的周浏览量基本符合幂律
热度 3 zhangxw 2011-1-31 17:07
科学网博客新的周浏览量基本符合幂律
科学网博客新的周浏览量基本符合幂律 张学文, 2011-1-31 科学网 2011 , 1,17 日改版,大家有不同意见,对访问量也有人质疑。现在我从新数据是否依然符合幂律的角度做了分析。供大家审核新数据是否不正常。 过去我曾经就这里的访问量等多个指标比较符合幂律的事有披露(请见我的博客的幂律文件夹)。今天我发现新数据,具体是指周访问量与名次顺序的关系,依然符合所谓的幂律。这体现在访问量的对数与名次的对数的关系(指前 100 名)比较集中在一条直线上 ( R 平方的值到达 0.9453 ) 。见附图。 我认为从这里看,新的访问量的规律性与过去数据的规律性是一致的。对此分布的其他解释,请参考我过去的博客,这里不赘述了。 科学网周访问量与名次基本符合幂律
个人分类: 幂律|3303 次阅读|4 个评论
关于生物量的幂律-回王德华老师的询问
热度 2 zhangxw 2011-1-29 13:01
关于生物量的幂律-回王德华老师的询问
关于生物量的幂律 - 回王德华老师的询问: 感谢王德华老师在其博客文章后面对对本人闲话的关注。下面就是对王老师所问的回答,希望获得指教。 我不是搞生态的,也不懂生物学。但是鉴于思想比较自由,就难免想得宽一些。 1992 年,长沙的“自然信息”杂志发表了我的“生物物种丰度分布律一文( 3 期, 35-38 页)。该文我没有电子版。它提出的核心问题是:地球上不同体重的生物数量 n 与该生物的体重 m 是否存在什么关系。 在这个粗糙的提法下,我去分析存活的生物体个体的体重与种群数量的宏观关系。我根据十分稀少的资料得出下表: 名称 体重 生物体重的对数 (划一为以克后取对数) 存活数量 存活数量的对数 兰鲸 10 吨 8 10 的三次方 3 大象 2.5 吨 6.4 10 的 5 次方 5 人 30 公斤 4.5 5*10 的 9 次方 9.7 鼠 125 克 2.1 1.2*10 的 10 次方 10.1 白蚁 2*10 负 5 次方克 -4.7 2.5*10 的 17 次方 17.4 细菌 10 的负 12 次方克 -12 10 的 24 次方 24 把取对数以后的 6 种生物的体重和数量关系点绘在坐标图上, 6 个点子几乎在一条直线上。这表明生物体重与其存活量服从幂律关系。考虑到它把体重跨度到达 20 个数量级的对象归到一起分析,获得这个关系,我是很高兴的。它也是我获得的第 1 个幂函数关系。 该文应当是 1991 年成文的, 1992 年我认识到变量(如体重)的几何平均值为固定值时,复杂程度最大(熵最大,是扩大的热力学第 2 定律)所对应的变量特征值与其存在数量的关系应当的幂律(如家庭的财富数量,与家庭数量),这些最后写在我的《组成论》书里( 2003 年中国科学技术对象出版社)。该书第 17 章的 6/7/8 三节讨论幂律(见 http://zxw.idm.cn 中组成论的 17 章),但是该书没有引我的这个工作。 我关于幂律的认识散见于我的科学网博客中的幂律栏目内。欢迎关注。张学文 2011.1.29
个人分类: 幂律|4248 次阅读|5 个评论
人类行为动力学中常见的标度律
热度 1 supermac 2011-1-2 22:21
指数分布 过去,当通信运营商需要估计移动通信中占线的电话数量并优化资源配置、交通部门想要模拟交通流量的模式或事故发生频率、以及网络和街区零售业意欲改进仓储和服务设置时,人们往往用齐次泊松过程来描述这些问题。即人类行为发生的时间间隔服从负指数分布,事件发生的数量服从泊松分布。所以指数分布是大家都熟悉的一种分布,在不同坐标下的图形如下所示: 幂律分布 幂律分布实际上很早就被发现了,但是直到 Barabasi 在 Nature 上发了那篇开山之作后这种默默无闻的分布律一下子就火了起来,在随后的两三年中,现实生活中大量的幂律分布集中涌现,仿佛不说幂律就没人重视,文章就发不出来。幂律分布在双对数坐标下表现为直线形式,暗示事件发生的概率极不均匀,小观测值的事件大量发生而大观测值的事件虽然数量众多但是发生的概率却都非常的小,表现在时间间隔的分布上即长时间的静默和短时间的爆发交织共存。下图即引自 Barabasi 的那篇文献,幂律分布与指数分布下事件发生模式的区别可见一斑。 指数截断的幂律分布 实际上很多现实的分布规律都难以用单一的分布函数来拟合或者预测,而是者混合的,一种常见的混合分布即带有指数截断的幂律分布。这种分布我们在博客发布和商业订单中均有发现。如下图所示,两个分布分别可由包含一个幂律和两个幂律部分 的函数式 表示。 漂移幂率分布 漂移幂率 (shifted power-law) 也是一种综合了幂律与指数特征的分布形式,其中参数 可以控制分布在幂律 ( ) 与指数 ( ) 之间自由转换。示例如下: References: 1. Chang Hui, Su Beibei, Zhou Yueping, et al. Assortativity and act degree distribution of some collaboration networks . Physica A, 2007, 383: 687-702. 2. Wang Yongli, Zhou Tao, Shi Jianjun, et al. Empirical analysis of dependence between stations in Chinese railway network . Physica A, 2009, 388:2949-2955. 3. Wang Peng, Zhou Tao, Han Xiao-Pu, Wang Bing-Hong. Modeling correlated human dynamics. arXiv:1007.4440v3. 除了混合形式的分布还有分段形式的分布被观测到,如: 单峰分布 如图所示,作者在考察物流运输的各个环节后发现,时间间隔分布表现为 一种特殊的单峰形态特征:左半部分具有较小波峰且含有极大值,右半部分具有明显的重尾特征并可用幂律函数近似拟合。 Wang Qing, Guo Jin-Li. Human dynamics scaling characteristics for aerial inbound logistics operation. Physica A, 2010, 389:2127-2133. 双峰分布 如上图,作者统计了手机用户互发短消息的时间间隔后发现该分布表现为以上形式,幂律分布后跟着一个指数分布,作者称之为为双峰分布,因为该指数分布位于幂律拟合直线的上方,而不是指数截断那样在拟合直线的下方。个人认为这种说法并不准确,因为指数部分并没有峰值,所以谈不上双峰除非把坐标系逆时针旋转让拟合直线成为横坐标才会出现两个峰值点。 Ye Wu, Changsong Zhoud, Jinghua Xiao, et al. Evidence for a bimodal distribution in human communication. PNAS, 1013140107.
个人分类: 科研资料|11433 次阅读|3 个评论
16届亚运会奖牌数量分布符合幂律
zhangxw 2010-11-27 22:36
16 届亚运会奖牌数量分布符合幂律 张学文, 2010.11.27 2010,11,27 日第 16 届亚运会已经顺利闭幕。各个代表团获得的奖牌数与其名次之间是什么关系?经过分析,认为它们符合所谓幂律关系,即这两个变量的对数(取 LOG 以后)形成的新变量应当基本在一条直线上。见附图。 Excel 软件计算出来的 R 平方的值是 0.8457 ,它比我计算的 15 届多哈亚运会的对应值 0.825 要更接近于 1 。这也许体现着亚运会的自由竞争体现的更明显。 本人过去指出过,幂律关系体现着一个系统内,在其几何平均值不变的情况下,体现了复杂程度的最大化(信息熵最大、最混乱)。关于这些更多的说明欢迎参考我的博客文章中的幂律部分 http://www.sciencenet.cn/m/user_index1.aspx?typeid=141380userid=2024 ,或者我写的《组成论》里的 17 章 http://zxw.idm.cn/ZCL/index.htm 。
个人分类: 幂律|3981 次阅读|0 个评论
科学网博客文章推荐数量与名次的关于基本符合幂律
zhangxw 2010-8-10 22:22
科学网博客文章推荐数量与名次的关于基本符合幂律 张学文,2010.8.10 科学网博客文章推荐数量与名次的关于基本符合幂律。资料是刘洋提供给大家的。我的分析类似过去就不多说了。还是看图吧。 欢迎参考 http://www.sciencenet.cn/m/user_content.aspx?id=2506
个人分类: 幂律|3615 次阅读|0 个评论
科学网博客文章评论量与名次的关系符合幂律(前300名)
zhangxw 2010-8-9 22:22
科学网博客文章评论量与名次的关系符合幂律(前 300 名) 张学文 2010.8.9 最近刘洋又公布了他辛苦的统计 http://www.sciencenet.cn/blog/user_content.aspx?id=351049 。我这个不做辛苦(实验)工作,又来吃现成的了:我在刘洋数据的基础上发现科学网博客文章评论量与名次的关系符合幂律(前 300 名,数据截止到 2010 年 8 月 8 日 )。有关的图附后。让我感到比较吃惊的是这个关系的 R 值居然高达 0.9947 (如此接近 =1 ),几乎是好得出奇!至于它为什么是幂律等问题欢迎参考我前面的类似文章。这里就不多说了。 附带指出,我也做了科学网博客单篇文章浏览量与名次的关系分析,它们也比较符合幂律公式。但是关系的质量没有这个好。尤其是前 10 名,偏差比较大。对应的图也附在本博客上,我就不多记述了。 感谢刘洋先生提供的有关数据。 欢迎参考 http://www.sciencenet.cn/m/user_content.aspx?id=2506
个人分类: 幂律|3840 次阅读|2 个评论
科学网博客名次与访问量为幂律关系
zhangxw 2010-7-16 18:37
科学网博客名次与访问量为幂律关系 张学文, 2010-7-16 十分感谢刘洋以科学网博客数据所做的大量统计分析工作。我下载了刘洋的原始数据 (2007-2010.6.18 期间的数据 ) 。这里仅依其中的访问量数据,重新按访问量大小排序。于是顺序,也就是访问量排名的名次,与访问量就存在对应的关系。即刘洋博客提供的数据可以分析访问量与名次的关系。 这个关系是什么函数? 其实, 2007 年我就利用类似数据分析过当时前 50 名的科学网博客访问量与名称是幂律(幂函数, power-law )关系 http://www.sciencenet.cn/m/user_content.aspx?id=12655 。现在数据更丰富了,这个关系依然存在? 附图是我做的分析:在双对数坐标下的直线,它等价于原变量(名次 - 访问量)为幂函数关系(最初的点子偏差比较大)。 即访问量与名次符合幂律。 今天就此我已经发了一篇类似博客,它结构类似,但是对象不同 http://www.sciencenet.cn/m/user_content.aspx?id=344494 ,所以大家可以比照着看。过多的话就不说了。
个人分类: 幂律|4681 次阅读|3 个评论
科学网博客名次与文章数为幂律关系
zhangxw 2010-7-16 11:45
科学网博客名次与文章数为幂律关系 张学文, 2010-7-16 十分感谢刘洋以科学网博客数据所做的大量统计分析工作 http://www.sciencenet.cn/blog/user_content.aspx?id=343985 。我下载了刘洋的原始数据 (2007-2010.6.18) 。这里仅依该数据 , 分析其中前 300 名博客的文章数量与名次的关系。发现它们符合所谓幂律关系(见图)。 利用 excel 获得的前 300 名的文章数 n 的对数(纵坐标)与名次数 m 的对数为很好的直线关系,其 R 平方的值达到 0.9937 (接近 1 )。公式是 logn=-0.7097logm+3.7851 经过简单变换,得 n=6096*m(^-0.7097) 即名次 n 与变量 m (文章数)是简单的幂函数关系 . 我们知道很多情况下的名次量与变量的关系,尤其是前若干名,都很接近幂律关系。如访问量与名次 http://www.sciencenet.cn/m/user_content.aspx?id=12655 , 500 强与名次 http://www.sciencenet.cn/m/user_content.aspx?id=6785 、体育比赛的名次与成绩等都是。 关于幂律的成因,本人有短文 http://www.qiji.cn/forum/ftopic2530.html 细致的说明在《组成论》里。
个人分类: 幂律|5477 次阅读|14 个评论
重新燃起对自然生命系统的好奇!
zjie 2010-3-5 00:04
作为我第一篇在科学网的博客,一直难以落笔。 作为一名70后,这是我第35个春秋的开始…… 小学时代开始接触娃娃电脑,中学时代对物理、数学、模型制作十分的狂热,参加了一些竞赛,本科读了计算机,之后去了电信行业。2000年前后揣着满腔热情开始创业,起起伏伏若干年至今。经历了很多,体验了很多。不知何时,突然重新撩起了对科学研究的兴趣和好奇心,突然震撼于冬日里树木枝杈的形状、震撼于嫩芽突破泥土的一刹那、震撼于没有外界的干扰下一个鸡蛋化学汤发育成小鸡并激活、震撼于自己手指关节在意识驱动下自如的活动…… 仿佛回到中学时,那时不知为什么买了那本《混沌学传奇》,还自己动手用BISIC语言编程实现了其中的一组方程,当参数变化,那种分崩、混乱的现象出现时,激动莫明!那是一种隐晦的直觉和神奇,里面的奥秘无以形容! 去年重新翻书柜,庆幸那本泛黄的《复杂》之书还在,再一次细细研读。10年前还感觉晦涩的内容,如今确突然让自己获得无法言语的共鸣!于是重新开始自己的第二次读书历程,继续少年时的好奇,遨游于生命、系统、大自然的美妙中…… 熵、混沌、分形、幂律、自相似、复杂、正反馈、太极阴阳…..仿佛有无形的手将他们串在一起…… 引述张嗣瀛院士的文章《复杂性科学,整体规律与定性研究》(2005)中结尾所写: 大千世界间何其相似乃尔!从一叶看宇宙!
个人分类: 科学体悟|4242 次阅读|2 个评论
29届奥运会金牌数与名次的幂律
zhangxw 2008-8-25 10:26
29届奥运会金牌数与名次的关系符合幂律 20080825,张学文 1.汶川地震后抢先发表有关学术论文是国外杂志。29届奥运会后抢先发表学术论文的是谁家?不知道。我这里凑热闹,在这里就29届奥运会的金牌数量与名次的关系提供一个统计分析图。 2.这个统计分析显示获得金牌的数量的对数与该国家(地区)占的排名名次的对数这两组数据比较符合直线关系。见图 3.这个关系与金牌数与名次呈幂函数关系是等价的。即29届奥运会金牌-名次关系比较符合幂律。 4.附带指出,我还分析过亚运会的类似数据,也符合幂律
个人分类: 幂律|7633 次阅读|1 个评论
个人文章平均浏览量与名次服从幂律
zhangxw 2008-8-13 18:33
个人文章平均浏览量与名次服从幂律 张学文 080813 最近科学时报网站博客编辑们选取了一个新的指标,个人博客文章的平均浏览量,并且给出了前 100 名的排序。它为分析问题提供了新角度。应当肯定、欢迎和感谢。 面对新概念(个人文章的平均浏览量)和对应的统计数据,大家自然有所思所得。由于我曾经指出过(总浏览量)与(名次)符合幂律, 刘全慧 教授得出类似的结论,并且补充了(一周浏览量)也是如此,现在我继续沿着过去关心的幂律问题分析了(个人博客文章的平均浏览量)与(名次)是什么关系。结果是:(个人博客文章的平均浏览量)与(该作者的名次)为幂函数关系(服从幂律)。这体现在把以上两个量取对数以后,新变量之间为线性关系,即在直角坐标系下二变量的点子基本在一条直线附近 ( 见图 ) 。 这是广泛存在的幂律关系的又一个实例。 关于幂律的成因,欢迎参考 http://www.qiji.cn/forum/ftopic2530.html 一文和那里的讨论。
个人分类: 幂律|4701 次阅读|0 个评论
关于“幂率成因”文章的...
zhangxw 2008-1-2 11:15
2008 新年第1天,我在奇迹论坛 http://www.qiji.cn/forum/ftopic2530.html 上的关于幂率成因的文章的累积浏览量超过了5万。这对我是个鼓励。我也在考虑是否应当就此写个小册子。 很多对象(包括社会现象)的统计特点符合幂率关系,这其中的道理确实值得我们用统一的眼光去认识...
个人分类: 幂律|4325 次阅读|1 个评论
科学时报博客访问量与名次基本符合幂律
zhangxw 2007-12-14 17:36
科学时报博客访问量与名次基本符合幂律 我曾经在本博客说明过,企业500强的名次符合幂率关系,如 http://www.sciencenet.cn/blog/user_content.aspx?id=7064 今天2007.12.14看到有人点了博客访问量前50名的名次与访问量的关系,我认为它也应当基本符合幂律,即,两组数据分别取对数以后,应当接近直线。 于是我补充下面的两张图(如果图看不到,请点击附录:博客访问量的幂律)。 我关于幂律问题的分析,欢迎访问下面地址 http://www.qiji.cn/forum/ftopic2530.html 下面是我过去用2007年7月科学时报博客总访问量数据做的图和2007-12-14做的图 下面是2007-12-14的数据做的图 张学文2007-12-14 博客访问量的幂律
个人分类: 幂律|4953 次阅读|5 个评论
中国2006纳税100强数据也符合幂函数关系
zhangxw 2007-9-8 19:53
中国2006纳税100强数据也符合幂函数关系 9月2日我们给出3个符合幂律的数据例子,今天(20070908)看到2006年中国纳税100强数据,其纳税金额的对数与名次的对数也是几乎在一条直线上。这是幂函数的又一例 。下面是对应的图。 关于幂律的某些分析,欢迎参考我在奇迹论坛上的言论 http://www.qiji.cn/forum/ftopic2530.html 。 (20070908,张学文)
个人分类: 幂律|5338 次阅读|0 个评论
2007年中国500强的数据几乎在一条直线上
zhangxw 2007-9-2 18:49
2007年公布的中国500强的数据几乎在一条直线上 (2007-9-2张学文) (名次函数3例--中国、世界500强,科学网博克浏览量) 最近2007年中国500强的数据公布(应当是2006年数据),我借机分析了营业额(成绩,y)与名次(x)的关系,并且做成logy-logx图。结果是它们很好的符合一条直线。 确实,世界上的统计五花八门,其中成绩(y)与名次(x)的关系是一类。而很多对象的y,x是幂函数关系,也就是y,x取对数以后,它们是直线关系。今天是又看到一例。 这里顺着公布它与另外2个名次函数(世界500强,博客浏览量)供思考。 问题:不同类型的名次函数为什么有类似的幂律形式? 关于幂律的某些分析,欢迎参考我在奇迹论坛上的言论 http://www.qiji.cn/forum/ftopic2530.html 。 (有关的图请敲3张图这个附件): 3张图
个人分类: 幂律|5642 次阅读|1 个评论
幂律成因
zhangxw 2007-5-28 10:14
幂律成因 --斩乱麻问题、幂律成因与组成理论之二--2005-9-4--张学文 ( 注:本篇2005,9,4到2005年年底在奇迹论坛被浏览5576次) 2007.5.28注:到目前,那里的访问量是27000的水平。 随贴发表的言论有97条,其中冯向军做了大量的考证,说明这个理论说明已经在国外被不同的学者从不同的侧面提出过。我的态度是不否认这些贡献,但是也不认为他们已经把问题得十分透了(以后会继续有这方面的文章发表),另外,那些文献在中国没有得到传播。而目前有近3万的浏览量说明我国的读者还是认为我这里是有新知识的。我估计我国每年发表的有关幂率的文章不少于100篇,但是都不谈原因,只谈事实。所以我认为我的论述依然是有价值的--2007.5.28) 斩乱麻问题是利用复杂程度最大(跳出热力学的熵原理)求一个函数的生动例子,现在利用类似思路研究为什么很多自然和社会现象中体现着Zipf,或者分型学说的创立者大力宣扬的幂分布。 大约50年前G.K.Zipf发现英文的文本中a,the等字母少的词出现的机会多,而字母多的词(如Basketball)很少出现,他发现组成一个词用的字母的数量n与该词在文章中出现的概率p为负幂函数关系:p=c(n^a),a是个小于0的常数,c是系数。Zipf热情地寻找这个规律在其他社会现象领域的实用个例,目前有专门讨论这个定律的网站。多数城市的人口比较少,少数城市人很多;多数网页看它的人数很少,少数网页很多人看,这里的城市数量与人口数量的关系,网页数量与看它的人数都满足幂律关系的。 显然把幂函数的两边取对数,那么变量(如组成词的字母数)与其出现概率的对数恰好是线性关系,或者说在双对数坐标下,变量关系是一条直线。所以变量对数为直线关系就成为判定是否为幂律的简单依据。 B.B. Mandebort倡导分型几何学,他弄出来的美丽图案已经让人们承认他是一个新的分支的领袖了。其实,Mandebort研究的所谓分型问题中包括了大量的幂律分布,其他人也在这种热情中又发现新的幂律。所以目前从自然科学里的原子核到社会现象,人们在非常广泛的领域里都发现幂律存在。 统计数学里经常介绍很多广为应用的概率分布函数,著名的如正态分布,那里对幂律的关注比较少,其实,幂律也是概率分布中的一种。鉴于在不同语言下发现了大量的事例,幂分布应当在概率论中占有比较重要的地位。 为什么这些十分不同的现象都服从幂律,其共同的制约因素是什么?我也看过分析一些文章,不谈形成原因的文章多(甚至说不知道原因反而体现这个分布的神秘性),理论分析文章少,而指明它们的共同原因的文章,我到目前依然没有看到(也可能我看的文章少)。 大约在15年前,我们就收集和自己证明,很多概率分布函数都可以利用熵最大(复杂性最大)原理配合不同的约束而推导出来。《熵气象学》(气象出版社,1992)中就汇集了我们给出的多种概论分布所要求的约束条件。但是书里没有提幂分布。 大约在1991年《熵气象学》交稿后我们发现用最大熵原理配合上变量的几何平均值为常数这个简单约束条件就很容易得到幂分布。它与斩乱麻的约束条件的差别很小,一个的变量的平均值为常数,一个是其几何平均值不变。可以说这个简单认识道出了幂分布的形成原因。 遗憾的是这个认识我们一直没有写成文章。1999年我为网易的科技栏目写改造后的熵,就把这个认识公布到网上了。见诸书面文字则是2003年出版的组成论里比较系统地说明了这个认识。 所以可以说:关于Zipf律、分型的自相似律、幂分布律的形成原因就是变量具有随机性(可以引用熵最大原理最复杂的结局出现的概论最高),而且变量的几何平均值(对于与百分比的平均)不变,这么两条。它类似斩乱麻问题但是那里的约束是代数平均值不变。所以在我看来幂律形成的统一原因在熵原理那里是个已经解决的问题。有兴趣的同志可以到组成论的网页版 2010.7.17注 http://zxw.idm.cn/ZCL/part3/C17b.htm#17.6分数维与幂分布(1) 。 这里一再提到组成论这本书,下一段再简单介绍这个关于组成问题的理论知识体系。
个人分类: 幂律|7602 次阅读|4 个评论
斩乱麻问题
zhangxw 2007-5-28 10:07
斩乱麻问题-- 斩乱麻问题、幂律成因与组成理论之一--2005-9-4--张学文 今年春发现奇迹网站的理念和内容都比较适合我的认识。就向这里投了些我的文章算参加活动。10天前我把关于个这个概念的讨论稿贴到这里,10天内居然有300次的阅读量。我感到这里学物理的比较多,年轻人多,是个值得关注和活动的地方。于是决定动笔写这个半介绍性的文章与大家交流。希望青年朋友喜欢(最好是继续做些工作)。 斩乱麻问题是我们10年前提出的问题、幂律就是50年前Zipf发现的负幂分布函数,也是分型创始人Mandebort大力宣扬的函数,它适用于大量的社会现象和自然现象中。组成理论是我提出的一个知识系统,(见中国科技大学2003年出版的组成论一书)。本文就把这3个知识点串联起来。 斩乱麻问题是这样一个简单问题:有一段长度为L的麻绳(如L=100米)。用一把快刀随机地砍上N刀(如N=9999刀),结果自然形成一堆(N+1段)麻线头(10000段)。问不同长度的线头各占多大的比例(的事件最容易出现)。 您打算如何解决这个问题的? 我们认为本问题不是求一个得数,而是求一个函数:长度(l)与具有该长度的线头的数量(n)的关系 。这个函数体现了N+1段线头是如何分布在不同长度范围(区间)内的。我们称为分布函数。 砍出来的线段都恰好具有相同的长度的事件固然可能出现,但是它出现的可能性太低了。随机的砍,必然容易出现有的长有的短的复杂局面。应当认为最复杂、最任意(熵最大)的局面(结局)是最容易出现的。 如果不同的分布函数对应(代表着)不同的复杂程度、任意程度、混乱程度(熵的数值),那么利用复杂程度最大(熵最大,类似求极值)就可以反求这个函数,那么我们的问题就有了解决的途径。 确实,我们在《组成论》(网页版:http://xjqxsc.idm.cn/zhangxw%20web/ZCL/index.htm ) 里就是用这个思路解决这个问题的。那里对这个问题的数学推导仅占1页纸面,它并不复杂。在解这个问题时我们利用了一个约束条件:各个线段的长度的合计值应当等于原长度L,这自然是合理的。它对应线段的长度的平均值为固定值。 利用上面方法得到的函数是个负指数函数,即多数的线段很短,特别长的比例非常少。这个函数联系着物理学中的玻耳兹曼分布,我们是用另外的思路分析了玻耳兹曼的分子能量分布。负指数分布是统计学中的著名分布,它有很多实用例子。斩乱麻问题是利用熵最大求负指数分布的生动例子。 下一短文沿这里的思路讨论幂律分布的形成原因。
个人分类: 统计、概率、熵、信息、复杂性.1.|4917 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-11 14:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部