最近,在拟合一些样本概率分布时候,用对数正态分布对整个样本拟合还不错,但是尾分布用幂律分布拟合也不错。正纠结于选择什么分布比较合适的时候?我发现Sornette教授提出了一个有效的方法 来判断究竟尾分布究竟是对数正态,还是幂律? 想法源于1999年Journal of the American Statistical Association上一篇关于指数和正态分布检验的论文。因为将服从幂律分布或对数正态分布的随机变量取自然对数之后,即转化为服从指数或正态分布的变量。因此,通过对样本参数的简单变换,就可以将目标问题转化为样本变量服从 指数分布, 还是服从 正态分布 的问题 (个人认为很巧妙!)。 如何计算分布参数?如何进行统计检验?具体就不做介绍了,请重点看文献 第三节的第二小节。 Y. Malevergne, V. Pisarenko, D. Sornette, Physical Review E 83 , 036111 (2011). J. D. Castillo, P. Puig, Journal of the American Statistical Association 94 529-532 (1999).
到底哪些实证数据真正服从幂律分布呢? 在此特向大家推荐Newman最新发表在SIAM Review上的文章。 Aaron Clauset, Cosma Rohilla Shalizi, and M. E. J. Newman, Power-law distributions in empirical data , SIAM Review 51 , 661-703 (2009). 文章发表版本的摘要与PDF链接如下: http://siamdl.aip.org/getabs/servlet/GetabsServlet?prog=normalid=SIREAD000051000004000661000001idtype=cvipsgifs=Yes