科学网

 找回密码
  注册

tag 标签: 名次

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

台风“妮妲”的雨量-名次关系也符合幂函数(20160803)
zhangxw 2016-8-3 10:45
台风 “ 妮妲 ” 的雨量 - 名次关系也符合幂函数( 20160803 ) 张学文, 2016/8/3 昨天,我国广东广西继续受台风 “ 妮妲 ” 的影响,降水量不小。全国 24 小时, 6 小时降水量的前数名都是台风在广东、广西的降水。其降水与排名的关系依然是很接近幂函数。 下面是对应的图和资料分析表:( 24 小时, 6 小时) 24 小时降雨量 ( 前 30 城市 ) 2016-08-02 08:00 ~ 2016-08-03 08:00 184.629 名次 站点编号 站点名称 所在地区 降水量 (mm) 站点预报 名次对数值 雨量对数值 1 59485 中山 广东省 162.5 详细预报 0 2.210853 2 59287 广州 广东省 132.1 详细预报 0.30103 2.120903 3 59456 信宜 广东省 132.1 详细预报 0.477121 2.120903 4 59481 番禺 广东省 122.8 详细预报 0.60206 2.089198 5 59487 斗门 广东省 118.8 详细预报 0.69897 2.074816 6 59278 高要 广东省 101.6 详细预报 0.778151 2.006894 7 59493 深圳 广东省 99.5 详细预报 0.845098 1.997823 8 59271 广宁 广东省 97.8 详细预报 0.90309 1.990339 9 45011 澳门 澳门特别行政区 93.2 详细预报 0.954243 1.969416 10 59488 珠海 广东省 90.9 详细预报 1 1.958564 11 56492 宜宾 四川省 88.4 详细预报 1.041393 1.946452 12 59475 开平 广东省 84 详细预报 1.079181 1.924279 13 59478 台山 广东省 78.3 详细预报 1.113943 1.893762 14 58429 铜陵 安徽省 77.5 详细预报 1.146128 1.889302 15 59473 鹤山 广东省 76.3 详细预报 1.176091 1.882525 16 59754 徐闻 广东省 75.7 详细预报 1.20412 1.879096 17 58314 霍山 安徽省 75.6 详细预报 1.230449 1.878522 18 59462 罗定 广东省 70.5 详细预报 1.255273 1.848189 19 59096 连平 广东省 69.2 详细预报 1.278754 1.840106 20 58448 临安 浙江省 67.5 详细预报 1.30103 1.829304 21 59294 增城 广东省 67.3 详细预报 1.322219 1.828015 22 59640 合浦 广西壮族自治区 65.4 详细预报 1.342423 1.815578 23 59293 河源 广东省 65.4 详细预报 1.361728 1.815578 24 59476 新会 广东省 63.3 详细预报 1.380211 1.801404 25 58436 宁国 安徽省 61.1 详细预报 1.39794 1.786041 26 59065 贺州 广西壮族自治区 59.9 详细预报 1.414973 1.777427 27 59431 南宁 广西壮族自治区 58.9 详细预报 1.431364 1.770115 28 59289 东莞 广东省 57.2 详细预报 1.447158 1.757396 29 59058 蒙山 广西壮族自治区 56 详细预报 1.462398 1.748188 30 57839 黎平 贵州省 55.9 详细预报 1.477121 1.747412 6 小时降雨量 ( 前 30 城市 ) 2016-08-02 20:00 ~ 2016-08-03 02:00 104.5683 序名次 站点编号 站点名称 所在地区 降水量 (mm) 站点预报 名次对数值 雨量对数值 1 59481 番禺 广东省 74.6 详细预报 0 1.872739 2 59485 中山 广东省 66.6 详细预报 0.30103 1.823474 3 58448 临安 浙江省 62.5 详细预报 0.477121 1.79588 4 59287 广州 广东省 55.6 详细预报 0.60206 1.745075 5 59456 信宜 广东省 53.2 详细预报 0.69897 1.725912 6 59640 合浦 广西壮族自治区 40.5 详细预报 0.778151 1.607455 7 59487 斗门 广东省 39 详细预报 0.845098 1.591065 8 59626 东兴 广西壮族自治区 35.6 详细预报 0.90309 1.55145 9 59058 蒙山 广西壮族自治区 35.5 详细预报 0.954243 1.550228 10 59654 廉江 广东省 32.6 详细预报 1 1.513218 11 58549 金华 浙江省 30.5 详细预报 1.041393 1.4843 12 58457 杭州 浙江省 29 详细预报 1.079181 1.462398 13 57358 秭归 湖北省 26.2 详细预报 1.113943 1.418301 14 57803 黔西 贵州省 25.7 详细预报 1.146128 1.409933 15 58450 湖州 浙江省 24.1 详细预报 1.176091 1.382017 16 57707 毕节 贵州省 23.7 详细预报 1.20412 1.374748 17 58553 上虞 浙江省 23.4 详细预报 1.230449 1.369216 18 59502 陆丰 广东省 22.9 详细预报 1.255273 1.359835 19 59065 贺州 广西壮族自治区 20.7 详细预报 1.278754 1.31597 20 59431 南宁 广西壮族自治区 19.8 详细预报 1.30103 1.296665 21 59644 北海 广西壮族自治区 19.8 详细预报 1.322219 1.296665 22 59655 化州 广东省 19.7 详细预报 1.342423 1.294466 23 58336 马鞍山 安徽省 19.2 详细预报 1.361728 1.283301 24 59478 台山 广东省 18.2 详细预报 1.380211 1.260071 25 57083 郑州 河南省 17.7 详细预报 1.39794 1.247973 26 53915 崆峒 甘肃省 16.6 详细预报 1.414973 1.220108 27 59254 桂平 广西壮族自治区 16.5 详细预报 1.431364 1.217484 28 58464 平湖 浙江省 15.4 详细预报 1.447158 1.187521 29 58543 淳安 浙江省 14.9 详细预报 1.462398 1.173186 30 59647 涠洲 广西壮族自治区 14.9 详细预报 1.477121 1.173186
个人分类: 幂律|3369 次阅读|0 个评论
今日(2016.7.29)中国降水幂律特征
zhangxw 2016-7-29 10:11
今日(2016. 7.29 )中国降水幂律特征 张学文, 2016-7-29 昨天 08 时到今天 08 时中国境内 1800 多降水量数据集的前 30 名的雨量与名次的双对数关系不仅依然符合直线关系(对应原变量的幂函数),而且其 R 平方值高达 0.98 ,是我最近分析的大约 30 个关系中质量最好的。 本组数据中的第 1 名应当是减弱消失的台风形成的降水,其数值居然高于幂律关系的直线,这也我第 1 次遇到。 下面是对应的图和计算数据: 2016-07-28 08:00 ~ 2016-07-29 08:00 24 小时降雨量 ( 前 30 城市 ) 序号 站点编号 站点名称 所在地区 降水量 (mm) 名次对数值 雨量对数值 1 59631 防城 广西壮族自治区 135.4 0 2.131619 2 59945 保亭 海南省 77.4 0.30103 1.888741 3 54063 扶余 吉林省 58.1 0.477121 1.764176 4 59635 防城港 广西壮族自治区 56.3 0.60206 1.750508 5 54254 开原 辽宁省 55.9 0.69897 1.747412 6 54237 阜新 辽宁省 51.3 0.778151 1.710117 7 54243 昌图 辽宁省 47 0.845098 1.672098 8 58847 福州 福建省 46.4 0.90309 1.666518 9 54041 通榆 吉林省 36.9 0.954243 1.567026 10 54335 黑山 辽宁省 36.8 1 1.565848 11 59632 钦州 广西壮族自治区 35 1.041393 1.544068 12 56666 攀枝花 四川省 34 1.079181 1.531479 13 57889 桂东 湖南省 33.6 1.113943 1.526339 14 55248 改则 西藏自治区 32.7 1.146128 1.514548 15 50949 前郭 吉林省 32.1 1.176091 1.506505 16 59941 五指山 海南省 29.1 1.20412 1.463893 17 59750 雷州 广东省 29 1.230449 1.462398 18 59218 靖西 广西壮族自治区 28.4 1.255273 1.453318 19 56986 屏边 云南省 27.1 1.278754 1.432969 20 54161 长春 吉林省 27 1.30103 1.431364 21 59626 东兴 广西壮族自治区 26.7 1.322219 1.426511 22 59431 南宁 广西壮族自治区 26.6 1.342423 1.424882 23 59209 那坡 广西壮族自治区 26.1 1.361728 1.416641 24 54049 长岭 吉林省 25.9 1.380211 1.4133 25 55589 贡噶 西藏自治区 25.3 1.39794 1.403121 26 54337 锦州 辽宁省 25.2 1.414973 1.401401 27 50862 铁力 黑龙江省 24.2 1.431364 1.383815 28 56991 砚山 云南省 23.9 1.447158 1.378398 29 54454 绥中 辽宁省 22.9 1.462398 1.359835 30 58040 赣榆 江苏省 22.8 1.477121 1.357935
个人分类: 幂律|3048 次阅读|0 个评论
又一些面上的“降水量-名次”关系符合幂律
zhangxw 2016-7-27 11:17
又一些面上的“降水量 - 名次”关系符合幂律 张学文, 2016-7-27 我近来每天分析一点中国 大约 1800 个气象站的 24 小时、 22 小时 6 小时降水量的前 30 名( 1 小时为前 10 名)的雨量对数与名次的对数的关系。它们无例外地比较符合所谓幂律(双对数坐标下的直线)。有关说明欢迎参考我在幂律栏目下的各个有关 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space 博客。 下面公布其中的 4 个对应的图(含公式、日期):
个人分类: 幂律|5544 次阅读|0 个评论
发明:推测面上的最大点雨量的幂律方法(2)-初步验证
zhangxw 2016-7-25 11:46
发明:推测面上的最大点雨量的幂律方法( 2 ) - 初步验证 张学文, 2016-7-25 前天给出了用幂律推测一个区域在一个时间段内的最大降水量的方法的基本思路与计算方法 http://blog.sciencenet.cn/blog-2024-992390.html 。现在给出 10 个例子。注意它们不是特意挑的,而是把获取的资料逐一分析都用上了。这些例子质量最差的是 R 平方值 =0.8 ,其他的 R 平方值都高于 0.9. 。 10 个例子中每个的实测最大降水量(行业内好像称为老大)都小于我们的预测值。 看来这个预测技术是值得业务部门参考的 。 下面是 10 个例子的有关数据表(表中的推测最大降水量就是根据公式中的常数项 b ,用 10 的 b 次方求得的,即它 =10^ b )资料仅针对中国这个区域(不是更多或者更小) 个例 时间段2016年月日时 推测最大面雨量mm 观测最大雨量 经验幂律公式 y:降水量的对数,x:降水量排名值的对数 公式的R平方 1 2016-07-16 20:00 ~ 07-17 02:00 38.72576 15.3 y = -0.8295x + 1.5877 0.8069 2 2016-07-17 02:00 ~ 07-17 08:00 140.2814 70.3 y = -1.1447x + 2.1474 0.9553 3 2016-07-17 08:00 ~ 07-17 14:00 209.894 155.4 y = -0.9063x + 2.322 0.9331 4 2016-07-18 20:00 ~ 07-19 02:00 161.0646 99.3 y = -0.7663x + 2.2073 0.9386 5 2016-07-20 20:00 ~ 07-21 02:00 243.7811 157.6 y = -0.9268x + 2.3871 0.9644 6 2016-07-21 20:00 ~ 07-22 02:00 52.48075 40.3 y = -0.4129x + 1.7199 0.9286 7 2016-07-22 20:00 ~ 07-23 02:00 79.43282 60.1 y = -0.7415x + 1.9016 0.9678 8 2016-07-23 20:00 ~ 07-24 02:00 59.26523 45 y = -0.5209x + 1.7728 0.9613 9 2016-07-24 20:00 ~ 07-25 02:00 73.06342 56.7 y = -0.5927x + 1.8637 0.946 10 2016-07-25 02:00 ~ 07-25 08:00 79.3597 74.1 y = -0.5585x + 1.8996 0.9394
个人分类: 幂律|3672 次阅读|0 个评论
关于降水量面分布的排名的幂律关系的一般说明等等
zhangxw 2016-7-21 17:12
关于降水量面分布的排名的幂律关系的一般说明等等 张学文, 2016-7-21 最近注意到 http://www.nmc.cn/ 提供全国 1800 多个气象站(应当是比较均匀分布在我国各地)中降水量最大的前 30 名的数据。猜想到它们可能符合所谓幂律。或者说名次函数:降水量的值与降水量的排名值是幂函数关系。于是我就做了初步验证。 5 天下来发现我国每天 22 小时的雨量每天都符合幂律,这已经公布在我的 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=991140 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogid=991961 等博客中。现在补充五个 6 小时的降水的类似分析,并且对此做初步整体说明。 我羡慕公式(科学规律的重要表达形式)。也期待自己可以发现一个或者一些公式。所以发现每天的中国区域的降水量都符合一个简单的公式(尽管每天的公式参数不同)很高兴。 这 5 天我统计了 10 组中国地区的有关数据,其中 只有一组 数据我认为不宜说它符合幂律(尽管其 R 平方值也达到了 0.8 以上)。 10 组数据有关情况见于下表: 个例 日期与时间段 雨量时间长度 是否符合幂律 r 平方值 1 2016-07-16 20:00 ~ 2016-07-17 02:00 6 小时 否 0.8069 2 2016-07-17 02:00 ~ 2016-07-17 08:00 6 小时 是 0.9553 3 2016-07-17 08:00 ~ 2016-07-17 14:00 6 小时 是 0.9331 4 2016-07-18 20:00 ~ 2016-07-19 02:00 6 小时 是 0.9386 5 2016-07-20 20:00 ~ 2016-07-21 02:00 6 小时 是 0.9644 6 2016 年 07 月 16 日 08 时 ~ 2016 年 07 月 17 日 06 时 22 小时 是 0.9844 7 2016 年 07 月 17 日 08 时 ~ 2016 年 07 月 18 日 06 时 22 小时 是 0.9794 8 2016 年 07 月 18 日 08 时 ~ 2016 年 07 月 19 日 06 时 22 小时 是 0.9544 9 2016 年 07 月 19 日 08 时 ~ 2016 年 07 月 20 日 06 时 22 小时 是 0.9628 10 2016 年 07 月 20 日 08 时 ~ 2016 年 07 月 21 日 06 时 22 小时 是 0.9299 这 10 组数据中的五个 6 小时降水量的分析没有公布,这里统一列出其是否符合幂律,以及体现公式质量的 R 平方值(接近 1 是最好的)。 关于这种名次函数符合幂律的例子在其他领域很多,但是在气象上,就不同地点的雨量进行这种统计分析,我估计是第 1 次进行。 也许这样表达问题比较合适: 在一个很大的区域(中国)内存 N 个面积相等的面积元。每个面积元上有一个降水值(统一的某时刻段内,如 1 小时。 6 小时,一天,一月) . 于是相同时间段内,就有 N 个降水数据。把这些降水量数据按从大到小排序,并且仅取其前 30 ( 20 、 10 )名,如果名次(排名)与降水量的关系符合幂函数关系,就说此降水系列的名次函数符合幂律 。这等价于降水量的对数与名次的对数为直线关系。 我这 5 天对 5 个 22 小时的降水量和 5 个 6 小时降水量的分析提示 10 个分析中 9 个数据组符合幂律。 6 小时降水量的具体数据与图从略。 我猜测:任何一个与中国面积差不多或者更大的区域的 6 小时以上的降水量面分布的排名(名次) - 降水量关系都符合幂函数。 欢迎大家关注这个分析思路、并且证实它或者否定它。 以后我会进一步提供新的分析情况和认识。我对幂律的认识欢迎参考我的幂律博客栏目 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space
个人分类: 幂律|2530 次阅读|0 个评论
我国各气象站22小时降水量的排名前30名符合幂律?
zhangxw 2016-7-17 10:23
我国各气象站 22 小时降水量的排名前 30 名符合幂律? 张学文, 2016-7-17 今天无意间分析了我国气象站的最近 22 小时的降水量(中央气象台称为 24 小时)的前 30 名 (的数据, http://www.nmc.cn/publish/observations/24hour-precipitation.html 每天更新!)的排序名次与降水量的关系。发现它们的对数是比较好的直线函数关系( R 平方 =0.9844 )。特写此博客公布之。其关系图如下 其原始数据是 ; 序号 站点编号 站点名称 所在地区 降水量 (mm) 站点预报 名次对数值 雨量对数值 1 53796 宁晋 河北省 106.1 详细预报 0 2.025715 2 58614 进贤 江西省 91.5 详细预报 0.30103 1.961421 3 53687 平定 山西省 70.1 详细预报 0.477121 1.845718 4 53784 赵县 河北省 67.1 详细预报 0.60206 1.826723 5 58659 温州 浙江省 67.1 详细预报 0.69897 1.826723 6 54909 定陶 山东省 62.3 详细预报 0.778151 1.794488 7 58667 玉环 浙江省 59.2 详细预报 0.845098 1.772322 8 57796 新余 江西省 54 详细预报 0.90309 1.732394 9 58627 鹰潭 江西省 53.8 详细预报 0.954243 1.730782 10 57792 分宜 江西省 51.8 详细预报 1 1.71433 11 58664 温岭 浙江省 50.8 详细预报 1.041393 1.705864 12 58618 东乡 江西省 48.7 详细预报 1.079181 1.687529 13 53565 偏关 山西省 46.6 详细预报 1.113943 1.668386 14 58626 贵溪 江西省 44.7 详细预报 1.146128 1.650308 15 58734 建阳 福建省 44.3 详细预报 1.176091 1.646404 16 58847 福州 福建省 44.3 详细预报 1.20412 1.646404 17 53695 新乐 河北省 44.2 详细预报 1.230449 1.645422 18 57905 贞丰 贵州省 44.1 详细预报 1.255273 1.644439 19 58635 广丰 江西省 43.9 详细预报 1.278754 1.642465 20 58609 丰城 江西省 42.8 详细预报 1.30103 1.631444 21 57798 安福 江西省 42.5 详细预报 1.322219 1.628389 22 53689 晋州 河北省 42.4 详细预报 1.342423 1.627366 23 58751 平阳 浙江省 42.4 详细预报 1.361728 1.627366 24 58616 余江 江西省 42 详细预报 1.380211 1.623249 25 58731 浦城 福建省 40.2 详细预报 1.39794 1.604226 26 58710 崇仁 江西省 40.1 详细预报 1.414973 1.603144 27 53697 藁城 河北省 39.5 详细预报 1.431364 1.596597 28 58608 樟树 江西省 39 详细预报 1.447158 1.591065 29 53699 无极 河北省 38.8 详细预报 1.462398 1.588832 30 58725 邵武 福建省 38.8 详细预报 1.477121 1.588832 本人关于幂律以及名次关系也算幂律的一些认识这里就不一一说明了。有兴趣者和质疑者欢迎参考我的博客中的幂律栏目 http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space 。 附言:我也分析了今天的6小时降水量的类似数据。他们偏离幂函数关系是比较明显的(图略)。
个人分类: 空中水科学|3596 次阅读|0 个评论
2014年的又一个幂律:中国富人榜
热度 3 zhangxw 2014-10-28 21:35
2014 年的又一个幂律 : 中国富人榜 张学文 ,2014/10/28 今天看到新公布的中国富人榜 , http://sports.ifeng.com/a/20141028/42317165_0.shtml , 于是就下载数据 , 分析 . 其名次 - 财富值在双对数坐标系中为直线 , 并且 R 平方值高达 0.9963 ,这应当算很好的幂律了。 欢迎参考本人关于,幂律的博客们: http://blog.sciencenet.cn/home.php?mod=spaceuid=2024do=blogclassid=141380view=mefrom=space 其他的话不多说了。 由于原始数据名单太长,有接近 400 行,这里从略了。
个人分类: 幂律|3402 次阅读|8 个评论
前100名博客主人与其发表的博客文章数量表、图
热度 3 zhangxw 2014-8-12 12:01
前 100 名博客主人与其发表的博客文章数量表、图 张学文, 2014 , 8 , 12 , 科学网博客已经 8 年,各位博客努力奉献,2014年8月12日其访问量前 100 名的姓名、名次、文章数见下表。 其名次的对数与文章数量的对数的关系见附图。闲话是它们的幂律关系不算明显。 更多的分析大家自己探讨、补充吧。 名次 姓名 博客访问量 文章数量 名次 姓名 博客访问量 文章数量 1 黄安年 19176084 13072 51 冯用军 2379031 1756 2 许培扬 15504332 20056 52 杨玲 2353356 706 3 杨学祥 12379266 8938 53 王修慧 2270324 1392 4 陈安 11789781 5650 54 廖俊林 2241969 689 5 武夷山 9996144 4101 55 王鹰 2223495 903 6 王鸿飞 8110149 1111 56 蒋继平 2155501 1001 7 饶毅 7917409 365 57 蒋新正 2145398 1222 8 嵇少丞 7554810 1518 58 施一公 2139699 26 9 王德华 6596038 1270 59 黄秀清 2046078 711 10 周可真 6196688 2927 60 文双春 2027787 346 11 孙学军 5965392 1671 61 桂耀荣 1974962 786 12 曹广福 5868860 1499 62 刘立 1951113 4038 13 吴宝俊 5700639 2132 63 徐耀 1925756 508 14 李小文 5282400 1809 64 潘学峰 1900657 1869 15 王飞跃 4740354 336 65 王海辉 1895422 1386 16 刘进平 4677679 3604 66 曾泳春 1886096 422 17 喻海良 4659839 741 67 戴启广 1874741 499 18 李维 4635708 3884 68 廖景平 1871041 1097 19 吴中祥 4623671 4580 69 王号 1869123 2382 20 蔣勁松 4553206 3623 70 黄庆 1820301 726 21 李世春 4401352 1777 71 杨永田 1791445 2572 22 马臻 4271128 1242 72 吴飞鹏 1782367 248 23 蒋高明 4165808 2402 73 彭思龙 1773325 273 24 何毓琦 3858247 598 74 曾新林 1756145 1546 25 林中祥 3796639 1896 75 吕乃基 1754968 728 26 陈儒军 3681883 1114 76 陈永金 1749174 1324 27 王铮 3674801 1175 77 陈永江 1742680 1277 28 李泳 3495769 1516 78 诸平 1734364 1168 29 陈龙珠 3463286 1947 79 张祖锦 1722479 1960 30 吕喆 3307274 1200 80 王云才 1681079 320 31 任胜利 3287522 678 81 沈海军 1669484 927 32 迟菲 3050773 1217 82 唐常杰 1651865 249 33 孟津 3026825 446 83 张海霞 1635079 433 34 万跃华 3016843 766 84 李毅伟 1616148 2690 35 曾庆平 2920066 1159 85 毛宁波 1615112 1171 36 韩健 2774277 724 86 戴德昌 1609963 1171 37 周涛 2770505 634 87 刘广明 1598169 438 38 籍利平 2740356 1682 88 方锦清 1575301 1343 39 科学网 2698659 551 89 张檀琴 1564692 1515 40 王汉森 2685703 3292 90 黄晓磊 1564024 420 41 戴世强 2652905 603 91 胡业生 1537749 2255 42 张学文 2604894 2629 92 赵美娣 1536870 721 43 科技导 2570956 2614 93 聂广 1533408 1651 44 曹聪 2555033 615 94 贾伟 1510375 151 45 邢志忠 2534490 361 95 李宁 1505155 264 46 赵明 2476259 1104 96 刘玉仙 1490763 1150 47 刘洋 2436085 1695 97 翟保平 1471079 304 48 李学宽 2419162 770 98 武际可 1468062 269 49 李侠 2414846 914 99 杨秀海 1466694 789 50 严家新 2389041 672 100 肖重发 1464520 1164 遗憾,图没有能贴出!
个人分类: 幂律|1766 次阅读|7 个评论
中国朝代寿命与其名次符合线性函数!
热度 3 zhangxw 2014-6-17 17:12
中国朝代寿命与其名次符合线性函数! 张学文 ,2014.6.17 今天下午温景嵩教授寄了他的新著文件 . 其中包括对中国 15 个朝代的长度的资料。随后我为这些朝代长度排序 , 并且统计了朝代长度与其名次关系 , 结果发现通常用的幂律关系并不好 , 反到是线性关系的质量达到了 0.93 。现在公布我的分析图、公式、资料(温景嵩的)。 不知道历史学者对这种数学小游戏是否有兴趣!从幂律的偏爱者角度看这固然不顺眼,但它至少也是一种数字游戏。 下面是资料与统计 名次 朝代长度(年数) 1 510 2 471 3 296 4 289 5 279 6 275 7 210 8 195 9 167 10 152 11 104 12 97 13 37 14 37 15 15 夏朝:471年; 商朝:510年; 西周:279年; 秦朝:15年; 西汉:210年; 东汉:195年; 西晋:37年; 东晋:104年; 隋朝:37年; 唐朝:289年; 北宋:167年; 南宋:152年; 元朝:97年; 明朝:276年; 清朝:296年。
个人分类: 幂律|8511 次阅读|6 个评论
博主朋友数量排序(名次)表
热度 2 zhangxw 2014-5-30 14:41
博主朋友数量排序(名次)表 张学文, 2014/5/30 说明: 1. 本表是前面对应博客 http://blog.sciencenet.cn/blog-2024-798953.html 的副产品,它列出了科学网的总浏览量前 100 名的博主的朋友数量。统计日期的 2014.5.21-24 这三天的,(现在的数量、名次可能有变化)。 2. 本博客仅是提供数据,有关的一些统计学分析欢迎参考: http://blog.sciencenet.cn/blog-2024-798953.html 。注意总浏览量不在前 100 名的博主的朋友数量没有参与统计,请理解、原谅。 姓名 名次 朋友数量 姓名 名次 朋友数量 饶毅 1 4216 毛宁波 51 652 孙学军 2 3131 方锦清 52 650 戴世强 3 2664 王号 53 633 喻海良 4 2308 王飞跃 54 614 武夷山 5 2142 李维 55 608 王德华 6 2120 李泳 56 592 马臻 7 2051 蒋高明 57 585 彭思龙 8 2017 曾新林 58 584 陈儒军 9 2002 王修慧 59 563 曾泳春 10 1994 黄晓磊 60 559 陈安 11 1771 杨学祥 61 555 曹广福 12 1694 王海辉 62 547 嵇少丞 13 1686 周可真 63 541 李小文 14 1556 刘广明 64 510 周涛 15 1518 廖俊林 65 506 唐常杰 16 1329 赵明 66 503 任胜利 17 1326 吴中祥 67 483 贾伟 18 1322 张学文 68 482 文双春 19 1313 戴德昌 69 458 吴飞鹏 20 1248 陈龙珠 70 452 张海霞 21 1246 吕乃基 71 390 韩健 22 1240 王鹰 72 382 蒋继平 23 1232 杨永田 73 369 邢志忠 24 1221 李世春 74 360 吕喆 25 1206 杨秀海 75 330 迟菲 26 1185 桂耀荣 76 319 许培扬 27 1165 沈海军 77 316 曾庆平 28 1163 科技导 78 313 刘立 29 1133 李毅伟 79 293 李学宽 30 1095 聂广 80 270 林中祥 31 1069 蒋新正 81 251 孟津 32 1029 潘学峰 82 246 王云才 33 1029 王应宽 83 245 王鸿飞 34 1026 陈永金 84 240 严家新 35 996 胡业生 85 225 徐耀 36 932 冯用军 86 187 张祖锦 37 926 籍利平 87 185 曹聪 38 924 杨玲 88 176 黄秀清 39 921 黄庆 89 129 刘洋 40 884 戴启广 90 112 李侠 41 877 廖景平 91 112 武际可 42 869 张檀琴 92 89 吴宝俊 43 868 翟保平 93 85 万跃华 44 795 刘玉平 94 85 刘进平 45 773 刘俊明 95 74 肖重发 46 771 陈永江 96 50 蔣勁松 47 729 王汉森 97 10 诸平 48 715 何毓琦 98 0 黄安年 49 713 科学网 99 0 王铮 50 670 施一公 100 0
个人分类: 统计、概率、熵、信息、复杂性.2.|1799 次阅读|6 个评论
对幂律、名次函数的一些认识
zhangxw 2012-8-15 11:24
对幂律、名次函数的一些认识 张学文 ,2012/8/13 最近李杰等在博客上对幂律做了一些探索,我随着也想到一些问题,现在说几句认识: 1. 圆的面积是其半径的 2 次幂, s= π r 2 , 小学生都知道。幂函数本来就中学的数学知识。在科学中符合幂函数的确定性关系(公式)很多。它们的形成原因应当从对应学科里找答案。把幂函数转而单独称为“幂律( power low )” , 我认为是特指一定含义的问题。我理解主要是指一些具有随机性的自然现象所体现、对应的概率分布不是 50 年前时髦的正态分布,而是具有幂函数形式的概率密度分布函数。其基本公式是 p=a/x b . 这里 p 是变量 x 的概率密度, a,b 是两个常数,变量 x 具有的基本特点是它大于 0 。另外 ,b 是大于 0 的一个数。当 b=1, 则 p,x 是双曲线关系。 2. 所谓对应着概率分布问题,可以设想存在一大批( N 个)个体。每个个体就特征变量 x 有一个确定值。问 具有不同特征值的个体各有多少就对应一个概率分布 (这个问“问题”的格式很重要)。这个情况对应于存在 N 个数据。例如 800 学生 ( 个体们 ) 中不同身高的学生个有多少,不同级别的地震发生了多少次,不同财富的家庭分别占有多少百分比等,这些问题太多了。它们构成了统计学与概率论中的核心问题(采样结果,其特征量被称为随机变量)。 3. 对上面的“ 具有不同特征值的个体各有多少 ” 的答案对应一个概率分布(函数)。而不同的问题其答案对应的概率分布是不同的。正态分布曾经是很多统计学者认为的重要的一类概率分布,但是二项分布,均匀分布等 10 多种分布都被概率论所研究,并且认为比较常见。而幂律是其一 , 也仅是其一。 4. 符合“ 具有不同特征值的个体各有多少 ”模型的事物千千万万,而常见的对应分布仅 10 多种。是否存在一个统一的理论来回答这些结局不同的分布?在我写的《组成论》( 中国科学技术大学出版社, 2003 ,其实在 1992 年的《熵气象学》一书已经有了)从随机性事件对应熵(我称为复杂程度)最大配合不同的约束条件可以推出很多基本分布来。即最大熵 + 约束条件为基本概率分布类型提供统一的物理思路(不是数学游戏!)。幂律也在其中。 5. 牛顿不是用 f=ma 的力学公式配合不同的条件从而获得自由落体的直线运动公式,抛物线的公式、圆周运动、椭圆运动的公式吗?从最大熵配上不同的条件也得出不同的公式(概率分布公式),这说明最大熵原理与牛顿力学原理有类似又独立的地位! 6. 幂律概率分布可以从(熵最大 + 该个体们占有的变量的几何平均值不变)这个简单模型中逻辑地推出。我认为这应当成为我们理解随机性事件中的概率分布的主要理论思路。《组成论》 http://zxw.xjxnw.com/ 17 章对此已经有了相当仔细的说明,并且给出了数值试验的方法。那里也对为什么是几何平均值为确定值,而不是代数平均值为固定值的含义给了说明。 7. 对幂律型的概率分布公式两侧取对数,则新变量就在直角坐标系中变成了直线关系。所以检验数据是否满足幂律的直观方法就是看双对数坐标下的数据点 ( 变量的对数 , 出现次数的对数 ) 是否都在一条直线附近。 8. 在概率分析、统计与社会实践中,人们有时对随机变量的数值特别大的那些数据特别注意。跑得特别快的人,考得特别好的人,雨量特别大的降水就是代表。在工程上,特别大的暴雨、积雪、风力的数值联系着所谓工程的安全系数标准。不能抵抗强自然灾害的工程成本低,但是不安全,抵抗自然灾害能力很强则造价又高。所以随机变量高值端固然出现机会不多,但是准确认识其规律性具有实际的重要性。 9. 难道不同的概率分布在随机变量的高端有什么统一共同规律性?过去的教科书经常推荐一个极值分布律。它也被称为 Gumbel 分布。据说很多原始分布对应的极值都符合这个分布。 10. 关于随机变量的取值靠近高值端的一般规律性问题,人们有时也用另外一个思路去分析。这就是不去分析什么出现概率,而仅分析现有数据集合中的老大(最大值)、老二、老三 … 的变量值与其名次排序的关系。这好像被称为名次函数。而一个重要的实践经验是随机变量的高端值被排序以后,随机变量值 x 与排序的第 n 名之间,居然在双对数坐标系中也是直线。于是人们认为,这也是幂律! 11. 我认为这个发现很重要,但是变量值与第几名的关系与概率分布问题不是一个含义。不能用最大熵加几何平均值的思路去解释它。而且在数据很多时人们发现所谓满足幂律也仅是在数据的高端部分,如果你选取全部数据,那么随机变量数值不大的那些数据则偏离双对数坐标系中的直线,而向下垂。这又如何理解?我尊重和注意这个统计实践的结果,但是需要对这些另外给出说明。 12. 我目前谈不出对此的理论说明,但是我做了两个数值试验它们说明原始分布为负指数分布,或者幂分布(即符合幂律)的原始数据系列,其变量的 log 值与 logn (名次值的对数)在 n 小于 100 时符合幂函数(幂律),但是 n 再大,它就偏离双对数下的“幂律”直线而下垂。 13. 对此我准备在另外一文中说明有关情况。见: http://blog.sciencenet.cn/blog-2024-602409.html
个人分类: 幂律|5483 次阅读|0 个评论
科学网博客文章推荐数量与名次的关于基本符合幂律
zhangxw 2010-8-10 22:22
科学网博客文章推荐数量与名次的关于基本符合幂律 张学文,2010.8.10 科学网博客文章推荐数量与名次的关于基本符合幂律。资料是刘洋提供给大家的。我的分析类似过去就不多说了。还是看图吧。 欢迎参考 http://www.sciencenet.cn/m/user_content.aspx?id=2506
个人分类: 幂律|3616 次阅读|0 个评论
科学网博客文章评论量与名次的关系符合幂律(前300名)
zhangxw 2010-8-9 22:22
科学网博客文章评论量与名次的关系符合幂律(前 300 名) 张学文 2010.8.9 最近刘洋又公布了他辛苦的统计 http://www.sciencenet.cn/blog/user_content.aspx?id=351049 。我这个不做辛苦(实验)工作,又来吃现成的了:我在刘洋数据的基础上发现科学网博客文章评论量与名次的关系符合幂律(前 300 名,数据截止到 2010 年 8 月 8 日 )。有关的图附后。让我感到比较吃惊的是这个关系的 R 值居然高达 0.9947 (如此接近 =1 ),几乎是好得出奇!至于它为什么是幂律等问题欢迎参考我前面的类似文章。这里就不多说了。 附带指出,我也做了科学网博客单篇文章浏览量与名次的关系分析,它们也比较符合幂律公式。但是关系的质量没有这个好。尤其是前 10 名,偏差比较大。对应的图也附在本博客上,我就不多记述了。 感谢刘洋先生提供的有关数据。 欢迎参考 http://www.sciencenet.cn/m/user_content.aspx?id=2506
个人分类: 幂律|3841 次阅读|2 个评论
科学网博客名次与访问量为幂律关系
zhangxw 2010-7-16 18:37
科学网博客名次与访问量为幂律关系 张学文, 2010-7-16 十分感谢刘洋以科学网博客数据所做的大量统计分析工作。我下载了刘洋的原始数据 (2007-2010.6.18 期间的数据 ) 。这里仅依其中的访问量数据,重新按访问量大小排序。于是顺序,也就是访问量排名的名次,与访问量就存在对应的关系。即刘洋博客提供的数据可以分析访问量与名次的关系。 这个关系是什么函数? 其实, 2007 年我就利用类似数据分析过当时前 50 名的科学网博客访问量与名称是幂律(幂函数, power-law )关系 http://www.sciencenet.cn/m/user_content.aspx?id=12655 。现在数据更丰富了,这个关系依然存在? 附图是我做的分析:在双对数坐标下的直线,它等价于原变量(名次 - 访问量)为幂函数关系(最初的点子偏差比较大)。 即访问量与名次符合幂律。 今天就此我已经发了一篇类似博客,它结构类似,但是对象不同 http://www.sciencenet.cn/m/user_content.aspx?id=344494 ,所以大家可以比照着看。过多的话就不说了。
个人分类: 幂律|4682 次阅读|3 个评论
科学网博客名次与文章数为幂律关系
zhangxw 2010-7-16 11:45
科学网博客名次与文章数为幂律关系 张学文, 2010-7-16 十分感谢刘洋以科学网博客数据所做的大量统计分析工作 http://www.sciencenet.cn/blog/user_content.aspx?id=343985 。我下载了刘洋的原始数据 (2007-2010.6.18) 。这里仅依该数据 , 分析其中前 300 名博客的文章数量与名次的关系。发现它们符合所谓幂律关系(见图)。 利用 excel 获得的前 300 名的文章数 n 的对数(纵坐标)与名次数 m 的对数为很好的直线关系,其 R 平方的值达到 0.9937 (接近 1 )。公式是 logn=-0.7097logm+3.7851 经过简单变换,得 n=6096*m(^-0.7097) 即名次 n 与变量 m (文章数)是简单的幂函数关系 . 我们知道很多情况下的名次量与变量的关系,尤其是前若干名,都很接近幂律关系。如访问量与名次 http://www.sciencenet.cn/m/user_content.aspx?id=12655 , 500 强与名次 http://www.sciencenet.cn/m/user_content.aspx?id=6785 、体育比赛的名次与成绩等都是。 关于幂律的成因,本人有短文 http://www.qiji.cn/forum/ftopic2530.html 细致的说明在《组成论》里。
个人分类: 幂律|5478 次阅读|14 个评论
绝不回头
liuxiaod 2010-2-8 04:48
上学的时候,每个班都有一个成绩排行榜,从第一名列到最后一名,贴在教室的后墙上,就在我的身后,我的成绩不好,所以从来不看这个排行榜,每天都要告诫自己绝不回头!,不知道自己排第几。 毕业前,一位同学对我的成绩很感兴趣,反复询问我的分数,原来他的父亲许诺,只要他的成绩不在倒数前10名,就奖给他10元奖金。我终于知道了自己的排名,当时的10元钱可是一笔巨款,我告诉这位同学,可以让老师把我们的名次倒个个,最终他还是没有得到那笔奖金。
个人分类: 生活点滴|1425 次阅读|1 个评论
个人文章平均浏览量与名次服从幂律
zhangxw 2008-8-13 18:33
个人文章平均浏览量与名次服从幂律 张学文 080813 最近科学时报网站博客编辑们选取了一个新的指标,个人博客文章的平均浏览量,并且给出了前 100 名的排序。它为分析问题提供了新角度。应当肯定、欢迎和感谢。 面对新概念(个人文章的平均浏览量)和对应的统计数据,大家自然有所思所得。由于我曾经指出过(总浏览量)与(名次)符合幂律, 刘全慧 教授得出类似的结论,并且补充了(一周浏览量)也是如此,现在我继续沿着过去关心的幂律问题分析了(个人博客文章的平均浏览量)与(名次)是什么关系。结果是:(个人博客文章的平均浏览量)与(该作者的名次)为幂函数关系(服从幂律)。这体现在把以上两个量取对数以后,新变量之间为线性关系,即在直角坐标系下二变量的点子基本在一条直线附近 ( 见图 ) 。 这是广泛存在的幂律关系的又一个实例。 关于幂律的成因,欢迎参考 http://www.qiji.cn/forum/ftopic2530.html 一文和那里的讨论。
个人分类: 幂律|4701 次阅读|0 个评论
科学时报博客访问量与名次基本符合幂律
zhangxw 2007-12-14 17:36
科学时报博客访问量与名次基本符合幂律 我曾经在本博客说明过,企业500强的名次符合幂率关系,如 http://www.sciencenet.cn/blog/user_content.aspx?id=7064 今天2007.12.14看到有人点了博客访问量前50名的名次与访问量的关系,我认为它也应当基本符合幂律,即,两组数据分别取对数以后,应当接近直线。 于是我补充下面的两张图(如果图看不到,请点击附录:博客访问量的幂律)。 我关于幂律问题的分析,欢迎访问下面地址 http://www.qiji.cn/forum/ftopic2530.html 下面是我过去用2007年7月科学时报博客总访问量数据做的图和2007-12-14做的图 下面是2007-12-14的数据做的图 张学文2007-12-14 博客访问量的幂律
个人分类: 幂律|4955 次阅读|5 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-12 01:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部