科学网

 找回密码
  注册

tag 标签: 人类动力学

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

人动笔记3(活跃性)
热度 3 supermac 2013-12-10 12:06
关于活跃性 每个人做事都是有一定的活跃性,有的时候很频繁,有的时候却被抛在脑后。可以定义活跃性为单位时间内个体进行某种行为的次数。小结人类动力学研究中关于活跃性的工作: l Role of activity in human dynamics, EPL, 82 (2008) 28002. 第一次提出人类行为动力学中的活跃性问题,文章将所有个体按照行为的活跃性进行排序后分成 20 个组,然后计算每个组内平均活跃性和时间间隔分布,发现活跃性与幂指数之间存在非线性正比关系,个体层面也存在类似的规律,即活跃性越高、幂指数越大、分布越宽广。本文的活跃性是一种个体的活跃性,即每个个体的行为次数除以第一次和最后一次行为的时间差。 核心结论:活跃性与时间间隔分布幂指数之间存在非平凡的单调正相关。 l Relative clock verifies endogenous bursts of human dynamics, EPL, 97 (2012) 18006. 本文提出了一种相对时钟的概念,用某个个体两次行为之间所有其他个体发出的行为的总数来代替这两次行为之间的时间间隔,这样的方法可以消除外部周期性节律的影响。论文设计了四种情形,即个体行为的时间间隔服从泊松或者幂律分布,群体活跃性为常数或者均匀分布。然后用“相对时钟”代替“绝对时钟”观察时间间隔分布。模拟结果显示: 情形 个体时间间隔 群体活跃性 群体时间间隔 群体事件间隔 1 指数 恒定 指数 指数 2 指数 均匀 幂律 指数 3 幂律 恒定 幂律 幂律 4 幂律 均匀 幂律 幂律 结论: 1. 从情形 234 得出,可变活跃性的均匀个体、可变或不变活跃性的幂律个体都可以汇聚形成幂律的群体——群体幂律的三种情况。 2. 从情形 2 可得出,由全局活跃性的异质性(象征外部周期性节律)引发的幂律分布是可以被消除的。 3. 而从情形 34 可看出,内在的个体的幂律分布带来的群体幂律分布是不会被消除的,这样的特征与活跃性无关。 本文的活跃性是一种全局活跃性,即某时段内群体行为发生的密度。模拟时,每个时段内个体的活跃性按照相同概率取值(独立同分布或者取相同值不影响结果)。 核心结论: 由全局活跃性的异质性引起的阵发可以被相对时钟消除,而个体行为内在的阵发性仍然存在。 l Scaling behavior of online human activity, EPL, 100 (2012) 48004. 讨论了活跃性、时间间隔分布、长程相关性等话题。 将用户分为三组后发现活跃性与长程相关指数存在联系,但并未明确指出二者之间的关系(三个样本不足以支撑相关性)。将数据打乱后,时序变为随机序列,长程相关性消失。采用多标度熵方法计算发现,用户活跃度越高,标度因子越大时时间序列的熵越大。这样的结果说明行为越活跃,间隔时间序列相对来说会越均匀,即极大的间隔越少出现。 核心结论:群体层面上,活跃性与长相关指数有关联但未明确给出(只分三组,难以确定定量关系);个体层面上,活跃性与长相关指数不具有明确关系。 l Communication activity in a social network: relation between long-term correlations and inter-event clustering, Scientific Report, 2 (2012) 560. 讨论了个体层面的活跃性与长相关指数的关系,发现个体行为的数量越多,其长相关指数越大,即正比关系。 核心结论:个体层面的长相关是幂律的时间间隔分布引起的,而群体层面的长相关则是固有的,与幂律分布无关。 l Empirical analysis of online human dynamics, Physica A, 391 (2012) 3308–3315. 用 6 个数据集对各种上网行为进行实证分析,涉及活跃性的研究包括: 1. 活跃性的累计分布非常宽广,具有重尾特征; 2. 用户行为的数量与活跃性之间在一定范围内存在正相关关系; 3. 按照活跃性分组后,平均活跃性与幂律指数正相关; 4. 用时间间隔的平均值对原数据进行重标度,发现新的结果中原先具有不同活跃性的各个组的时间间隔分布趋同,表现为相同的规律,即不同活跃性的个体的行为规律本质上是相同的。 l Human Activity in the Web, Phys. Rev. E, 80 (2009) 026118. 讨论时间间隔分布和等待时间分布,用户行为数量具有重尾特征,会影响时间间隔分布和网络行为的活跃性。 l Heterogenous scaling in the inter-event time of on-line bookmarking, Physica A, 390 (2011) 2395–2400. 1. 时间间隔分布呈现幂律,但以一天为分界点会有幂指数的明显变化。 2. 群体活跃性服从对数正态分布,幂律指数非单调依赖于活跃性,在取得峰值后会有一个略微下降。 3. 不活跃的个体的时间间隔分布更接近于指数,而活跃个体更偏向幂律。 从上述review可以看出,人类行为的活跃性在群体层面上已经得到了很好的研究。由于活跃性是由行为次数除以时间跨度得到的,故一般来说行为次数越多的个体活跃性也越大;相对偶尔发生几次的行为,有着大量重复次数的行为时序的长相关指数也越大;此时,时间间隔相对较短,长时间静默较少出现,因此分布的异质性较小,幂指数较大。 简言之,普遍的结论是:行为的数量、活跃性、时间间隔幂律指数、长相关指数之间是正相关关系。群体行为的活跃性的变化可以带来幂律的时间间隔分布,但不是阵发现象的根本源泉。
个人分类: 科研资料|4368 次阅读|5 个评论
人动笔记2(进阶版)
热度 1 supermac 2013-10-14 09:47
人动笔记(二)——读《综述》 (一)引言 读过六位神人的神作《人类行为时空特性的统计力学》后,我才意识到这两年的教学工作使得自己从科研前沿脱离略远,好多新成果都没有听说过。我拿到这篇综述时,先通读了一遍,对于结尾“本文首次尝试在一篇综述中同时介绍人类的时间和空间特性”报以微微一笑。想当年我发表在《复杂系统与复杂性科学》上的人动综述已经这样做了,那篇文章长度达到 17000 字,在当时已经是最长最完整的综述了。可我细细研读完这篇综述时,我知道我彻底弱爆了,我知道了什么叫做高屋建瓴,融会贯通。 文章全面介绍了人类动力学在发展了七八年后逐渐形成的体系结构,包括基础理论、时间特性和建模、空间特性和建模以及尚处初始阶段的应用研究。几位作者能够深入理解现有成果的精髓,并且触类旁通,给出恰如其分的评价。相比之下,我曾经引以为荣的综述就相形见绌,几乎是科普读物了。不过对于对人类动力学完全不了解的人来说,我的那篇综述或许更容易上手,所以对于这个研究方向的好奇者来说,先去读我的文章可能更合适。 广告完毕,进入正题。 (二)人类动力学模型的核心思想 对于人类行为在时间和空间上表现出的标度特征,我曾经做过比较完整的总结,这里我想对现有的动力学机制和模型的核心思想进行一个大致的归纳,毕竟翻阅一篇长达 60 页的论文不是很方便。 1. 人类行为时间特性建模 1) 经典任务队列模型: 给生活中的每一项活动分配优先级,以 p 的概率选择高优先级任务执行,以 1-p 的概率随机选择一个任务执行。 2) 记忆、兴趣和节律模型: ① 记忆:人们根据过去活动的频率来调节当前活动的频率。 ② 兴趣:人们根据自身的兴趣来调节当前活动的频率,即凭借时间间隔自动调节事件频率,间隔过小则抑制,间隔过大则激发,适当则不变。 ③ 节律:周期性的泊松过程可以在每个事件点上激发一系列子事件,从而在整体上产生幂律。 ④ 周期:用事件次数代替时间间隔,以去掉生理周期的影响。 ⑤ 网络关联:考虑现实中人类各种行为之间所具有的关联网络,把人类行为视为关联网络上的随机游走。 3) 社会交互模型 ①OV模型:将经典排队模型中的任务分为两类,交互与非交互任务,则交互任务可产生具有不同指数的幂律分布。 ②基于交互行为影响的模型:排队模型的丰富扩展,在进入时间、优先权、任务交互、发生概率方面都有精确的控制。 ③社会结构对人类行为的影响:社会网络中每个节点是一个人,他与邻居有交互任务,自己本身也有非交互任务,按照优先级选择执行。 ④社会交互模型 ⑤个体行为与社会网络结构的共同演化 ⑥多种社会交互模式 2. 人类行为空间特性建模 1) 偏好返回:同时考虑探索新地点和偏好返回两种机制。 2) 随机游走:周期性的随机游走,考虑出行时间、工作时间、作息时间、出行次数和距离的限制等等。 3) 层次交通:在层次网络上的随机游走。 4) 信息熵优化:利用访问地的熵值度量信息的多样化程度。 (三)一些问题及思考 1. 人类行为的“强阵发弱记忆”效应 人类行为的强阵发性是比较容易解释的,但对于弱记忆性则不那么好理解。一般来说,我们的神经活动、肌肉活动都具有记忆性,这样的效应会极大的影响一个人后面的行为。大量的人类行为时间序列分析(包括 DFA 和 R/S 等方法)结果显示,数量时序和间隔时序的 Hurst 指数都不近似于 0.5 ,即人类行为具有长期的持续性(相关性)或反持续性。这样的表现应该是强记忆的一种佐证。人类行为是具有记忆效应的。并且这种记忆效应在社会、经济、自然现象如台风地震等等方面都被观测到,故记忆效应是自然界中普遍存在的现象。 EPL_81_2008_428002--Burstiness and memory in complex systems 这篇文章中用于衡量记忆的指数 M 定义存在一定的数学缺陷,故如何观测和定量分析尚待进一步考虑。 2. 幂律的涌现 《综述》中多次提到了幂律的涌现现象,传统随机过程理论中泊松过程在叠加后仍然是泊松过程,且指数相加。但是在人动的实证中却发现,个体层面的不同分布在群体层面可以汇聚为幂律,齐次泊松过程在激发子事件后可以产生群体的幂律。 Hidalgor 也从数学上证明了在一定的前提条件之下,若干泊松个体聚集后可以在群体层面产生幂律。我们的一些实证也发现不同的时间间隔分布叠加后可以得到幂律分布,不同的输入过程和服务过程可以导致不同的输出过程。因此,幂律的涌现还需要进一步的实证、解析和模拟。 3. 该用什么样的函数形式来描述实证中观测到的分布 数学应以简单为美,但是太过简单必然会缺失信息。对于实证结果,我们通常用一种分布函数去拟合,这样的方法存在很多争议。实践中发现,当数据取值范围变化时,最适合的函数形式也会变化。装箱的方法不适合连续值,而分布在做累计函数后可能会表现为奇怪的形态而难以拟合。实际上,鲜有能用单一函数完美拟合的分布,分段或者混合分布或许更靠谱。 4. 是否存在人类动力学的离散普适类 这种分类应该是很不靠谱的。不论是从数值、队列长度是否有限、群体个体的区别等等层面,都不存在能够区分人类行为普适类的本质差别。 5. 个体活跃性分布的异质性是否会对群体层面的标度律产生影响 个体层面的活跃性还需要进一步研究,如活跃性和阵发性之间的关系,详见综述。 6. 个体出行方式的预测 记得 n 年前在某次复杂网络会议上看到了一个来自香港的非常有趣的研究,作者将莫扎特的钢琴曲转换为了复杂网络,分析了其中频繁出现的模体,并由此构造算法模仿莫扎特的曲风进行创作,居然也奏出了动听的音乐。我猜想基于模体或者链路预测的思想是不是可以用于人类出行的轨迹预测? 后记:这些文字其实很早就写好了,感谢几位作者的邮件回复,热情解惑。本想把后面所列的几点想法继续改进待成熟后再贴出来,后面发现这是一个重复无休止的过程,完善的想法恐怕就去发paper而不是博客了,所以先发出来,还请各位看到此文的大侠不吝赐教!
个人分类: 见闻杂谈|4017 次阅读|4 个评论
人动笔记1(初级版)
热度 2 supermac 2013-9-16 14:46
人动笔记(一)——读《爆发》 半消遣半认真地读完了巴拉巴斯的第二本专著——《爆发》。感觉用专著二字形容此书有些过头,这本书虽然有 27 万字之多,毕竟充其量还是一本针对非科研人员的人类行为动力学科普读物,搭大数据的顺风车向公众宣传探索人类行为的奥秘和可预测性是个非常有趣的事情。但凡对人类动力学研究略知一二的人来说,书中提到的成果可谓耳熟能详了。所以我是在工作之余把此书作为故事书读完的,此所谓消遣;然而各个章节读罢之后却会给人回味的念想,有些内容甚至要返回来仔细研读,这算是认真吧。 就像老巴的第一本书《链接》一样,这本《爆发》同样不算学术著作,没有图表、公式和方程,甚至没有字母,因此读起来很轻松。然而,一个个为我们所熟知的论文背后的研究经历,却能给人些许启发。太多重量级的文章历经艰辛才终成正果,当然也有一些研究的突破充满了意外的戏剧色彩。比如 Brockmann 在和木匠朋友的聊天中得知了 WheresGeorge.com 网站,从而获得研究人类流动规律的灵感,而这个网站在创立初期仅仅是被作为一个游戏。所以对世界充满好奇心,敏锐观察身边发生的一切,应该是一个非纯理论科研工作者应该保有的状态。 记得研一的时候刚刚知道什么是科研,对研三师姐能发 2 篇 SCI 无比仰望;经过一年的基础知识学习,在读文献的时候开始对个别 SCI 不屑一顾;再到研三的时候,自己已经能够写 SCI 论文了,前后恰好两年的时间。近来,随着科研能力和层次的提高,有了自己一作的 SCI ,却又再次对高水平的论文产生了仰望之心,也时时反省,别人貌似很普通的文章,为什么能发那么高级别的杂志? 仔细研读好论文,会有一种如饥似渴、醍醐灌顶,同时又觉得密不透风的感觉。首先,题材新颖,数据新奇,世间万物都是物以稀为贵,论文也如此,这样的文章一下子就能引起人们的好奇心和注意力。其次,内容上应该是论证严谨,规范准确,尽可能消除任何质疑的可能。同时,在行文上还能做到美观,漂亮的可视化效果实在是魅力无限。最重要的,当然是高水平的文章能够引领潮流,指引方向,而低水平的研究,只能是一味的跟风。 《爆发》的编排很有趣,每个章节都分两部分,前半部分是关于人类行为规律的介绍,而后半部分却是一部中篇小说。我对古代欧洲的教派斗争没有什么兴趣,但这种写书的方式却别具一格,且不论上浮几成定价,至少,能吸引另外一大批读者。我想,过几年我也到了提职称的时候,也可能需要出一本书,没有这样的小说,没有背后的故事,没有大牌的推荐人……结局省略一万字。为什么课堂上的经典教材都要用老外写的?我们的思维太过僵化和禁锢了,至少,我已经牺牲了。 人类行为动力学这个新方向诞生八年了,我经历了前些年大跃进式的盲从跟风,到现在同级别期刊越来越难发,也算有幸见证了这个学术方向的发展和进步。目前,人类行为在宏观层面不同方面的行为规律已经有了很好的呈现。我们知道,人类行为有时是均匀的泊松,有时却是阵发的幂律。泊松仍然是普遍存在的客观规律,而当我们在每天的工作中给任务安排优先权时,在生活中对某项娱乐活动产生兴趣时,以及出差或者利用假期到远处游玩时,都会导致幂律的产生。尽管已经有多种不同的模型可以再现这种标度规律,可仍有很多现象无法用现有的模型解释,比如人体的微观生理节律,以及经济社会的宏观系统行为。我们还知道,我们的行为是可以被预测的。当然这里面也存在一个矛盾,随着越来越详实的历史数据被记录,我们可能被更精确地预测,就像天气预报。但与此同时,数据量越大,熵就越大,行为趋势可能会越杂乱,反而更难以精确预测,这就好比一个全国各地出差的技术支持人员同一个看守所里的囚犯,显然后者的行为更容易预测。在众多实证结果中,我们可以发现人类行为在个体、团体和群体层面上都可能表现出幂律特征,但是这三个层面行为的汇聚过程却还不是很清晰,比如,为什么泊松的叠加有时候是泊松,有时候却会形成幂律? 人类动力学研究目前还处于理论阶段,任何理论研究成果应该是努力实现应用的。对人类行为模式的研究也不能仅仅停留在规律层面,挖掘其深层的产生机制,并为传播、推荐算法提供借鉴,是进一步研究应该考虑的问题。
个人分类: 见闻杂谈|3292 次阅读|4 个评论
商业订单行为中的标度律分析、建模与仿真
热度 2 supermac 2012-10-17 18:51
我们认为对人类行为动力学的分析应该从个体、团体(组织)、群体三个方面进行,目前的研究由于数据采集困难等原因,常见于个体和群体,而对团体的研究较少。 我们最近的一篇文章恰好弥补了这样的缺失,以某全球500强企业的采购订单为研究对象,来考察某个组织的行为,看其与个体或者群体行为有何分别,统计量仍然为人类动力学研究中的关键量——时间间隔分布,具体从个体(区分不同客户的订单)和群体(不区分客户整体考虑)两个层面进行研究。 研究发现,当不区分各个供应商时,个体行为标度律表现为较好的幂律分布,指数约为2.0;当将供应商混合考虑时,群体行为表现为幂律和指数混合的分布形式。对后者, 我们建立了一个以产品生命周期驱动的模型,并给出数值解析和仿真,结果显示可以很好的刻画这种幂律与指数混合的分布律。 Individual and group dynamics in purchasing activity Lei Gao, Jin-Li Guo,Chao Fan, Xue-Jiao Liu Physica A, Volume 392, Issue 2, 15 January 2013, Pages 343–349 Abstract As a major part of the daily operation in an enterprise, purchasing frequency is in constant change. Recent approaches on the human dynamics can provide some new insights into the economic behavior of companies in the supply chain. This paper captures the attributes of creation times of purchase orders to an individual vendor, as well as to all vendors, and further investigates whether they have some kind of dynamics by applying logarithmic binning to the construction of distribution plots. It’s found that the former displays a power-law distribution with approximate exponent 2.0, while the latter is fitted by a mixture distribution with both power-law and exponential characteristics. Obviously, two distinctive characteristics are presented for the interval time distribution from the perspective of individual dynamics and group dynamics. Actually, this mixing feature can be attributed to the fitting deviations as they are negligible for individual dynamics, but those of different vendors are cumulated and then lead to an exponential factor for group dynamics. To better describe the mechanism generating the heterogeneity of the purchase order assignment process from the objective company to all its vendors, a model driven by product life cycle is introduced, and then the analytical distribution and the simulation result are obtained, which are in good agreement with the empirical data. Keywords Human dynamics; Supply chain; Power-law distribution; Mixture distribution; Individual dynamics; Group dynamics http://www.sciencedirect.com/science/article/pii/S0378437112007169 Corresponding author. E-mail address: phd5816@163.com (J.-L. Guo).
个人分类: 成果交流|4080 次阅读|13 个评论
人类行为的分形特征初探
热度 4 supermac 2012-8-24 22:39
分形和自相似性是自然界中的普遍现象,近年来,一些学者先后在短信通信、股票交易和人体的生理活动上发现了人类行为的分形特征,我们尝试从时间序列和复杂网络的角度挖掘图书借阅行为中十分存在分形特征。文章前不久被Physica A接受,详见附件。 Fractal analysis on human dynamics of library loans Chao Fan, Jin-Li Guo, Yi-Long Zha Physica A Volume 391, Issue 24, 15 December 2012, Pages 6617–6625 Abstract In this paper, the fractal characteristic of human behaviors is investigated from the perspective of time series constructed with the amount of library loans. The values of the Hurst exponent and length of non-periodic cycle calculated through rescaled range analysis indicate that the time series of human behaviors and their sub-series are fractal with self-similarity and long-range dependence. Then the time series are converted into complex networks by the visibility algorithm. The topological properties of the networks such as scale-free property and small-world effect imply that there is a close relationship among the numbers of repetitious behaviors performed by people during certain periods of time. Our work implies that there is intrinsic regularity in the human collective repetitious behaviors. The conclusions may be helpful to develop some new approaches to investigate the fractal feature and mechanism of human dynamics, and provide some references for the management and forecast of human collective behaviors. Keywords Human dynamics; Time series analysis; Long-range dependence; Complex network; Visibility graph 文章PDF: PHYSA_13934_proof.pdf http://www.sciencedirect.com/science/article/pii/S0378437112006231 我们采用的数据是两所图书馆的借阅量,以及借阅的间隔时间。用重标极差法计算了以借阅量为观测值构成的时间序列的Hurst指数和非周期循环长度,发现人类行为具有长期正相关性和持续性,记忆效应对借阅行为有强烈影响,并与时间标度有关。群体用户的分形特征表现较为明显,而个体用户的时间序列中则有一定的波动性;并且不同的用户群之间,以及同一个数据集中的不同用户之间表现出了显著的个体差异。 通过可视算法将人类行为的时间序列和复杂网络结合在一起,计算了由时间序列转化得到的复杂网络的拓扑参数,发现群体用户的网络具有无标度特征、小世界效应和等级结构,而个体用户的网络则只具有以上部分性质。可以认为,人类的重复性行为发生的时间序列中各个观测值之间存在潜在的密切联系,特别是对于日常生活中的某些重要时刻。我们还发现只有部分的个体行为网络具有分形结构和自相似的特征。此外,本文的分析也对于找寻时间序列和复杂网络之间的关系、网络属性之间的关系以及网络分形结构的起源具有一定的借鉴意义。 注:中文内容中部分结论是笔者硕士论文中的一部分,没有写进这篇英文版本中,也欢迎同行批评指正! 《从图书借阅看人类群体和个体行为的动力学机制》,樊超,上海理工大学,2011年。
个人分类: 成果交流|7547 次阅读|15 个评论
复杂性科学研究中常见分布律及数据拟合方法
热度 5 supermac 2012-8-12 15:46
以前总结的复杂网络和人类动力学研究中常见的分布律及拟合方法,挂在博客上方便取用,也欢迎各位同行指教! 目录: 基本术语英汉对照 常见的分布律 l 正态 / 高斯分布 Normal distribution / Gaussian distribution l 对数正态分布 Log-normal distribution l 指数 / 负指数分布 Exponential distribution / Negative exponential distribution l 泊松分布 Poisson distribution l 幂律分布 Power law distribution l 指数截断的幂律分布 Power law with exponential cutoff l 截断幂律 Truncated power law l 广延指数分布 Stretched exponential distribution l 漂移幂律 Shifted power law 数据拟合与参数估计(7步) 重要参考文献 常见分布律及数据拟合总结.docx
个人分类: 科研资料|13260 次阅读|11 个评论
又一个研究对象——微博
热度 4 supermac 2011-5-26 18:45
玩微博四五个月了,最近新浪微博出了很多新功能,一个比较有意思的就是为用户推荐好友,即在首页中显示你的好友都关注了谁,推荐的好友往往是具有共同兴趣,经常会发布一些共同话题的人。这个在社会关系中俗称二度人脉,在复杂网络中为邻居节点的邻居节点,即与自己距离为2的节点。 另外一个新功能是在首页中显示关注好友的新微博时,在原先只能按照发布的时间顺序罗列全部微博的基础上增加了一个按兴趣排序的功能,估计是系统会记录下用户会点击哪些微博查看具体内容,然后据此判断用户的兴趣倾向进行推荐。这个功能也挺实用的,我关注的好友虽然不多,但有些人却经常发些无关痛痒的微博刷屏,有了这个功能后只需要点一下就能屏蔽掉这些是自己关心的好友发布的,但是自己不感兴趣的微博。 据说已经有复杂网络的研究者用网络爬虫爬到微博网络的数据了,估计不久会发出不错的文章,为什么自己不会这个技术啊! 复杂网络的拓扑结构、推荐系统、舆论传播、人类动力学等方向都能做,微博这个研究对象,我看行。 最后宣传下自己的微博: http://weibo.com/supermacfan ,欢迎关注。
个人分类: 见闻杂谈|3757 次阅读|7 个评论
关于博客评论的实证和兴趣衰减模型
热度 2 supermac 2011-4-16 23:01
计算机技术、网络通信和数据库技术的快速发展和广泛应用记录了大量的人类行为发生的精确时间,为人类动力学的研究提供了详实的数据来源,关于电子邮件、网页浏览、网络游戏、电影点播、音乐欣赏等等网络应用的人类动力学实证研究大量问世。人们在网络上的行为表现出的一个重要特征就是对某一事物或话题一开始时兴趣高涨,随着时间推移逐渐衰退,很快衰减为很低的水平。近期,我们对博客的发布和评论进行了实证分析,并使用非齐次泊松过程提出了两个人类动力学模型来描述这种兴趣衰减行为,分别生成时间间隔的幂律分布和带指数截断的幂律分布,在此做简要介绍。 1. 博客评论的实证和建模 网络上的博客在发布之初会吸引大量关注和评论,随着时间推移评论数越来越少,也就是说无论博文多么吸引人,也会慢慢淡出人们的视线。实证发现,网友对博客评论的时间间隔分布服从幂律,指数在 1-2 之间。 对这类兴趣消失的人类行为动力学现象刻画为: a. 在不同的时间间隔事件发生的次数是相互独立的; b. 事件发生率随时间线性递减,即在时刻 t 事件的发生率为 Lamda(t)=b/(at+1) ,其中a》0,b0 ; c. 在 t 与 t+dt 之间事件发生一次的概率为 Lamda(t)dt ,短时间 at 内事件几乎不会发生两次以上。 事件的发生率为 Lamda(t)=b/(at+1) 体现出人们对这个事件的兴趣随时间不断衰减,长时间后兴趣完全消失。两个参数用于调节兴趣衰减的速度, a 越大兴趣衰减越快, b 越大兴趣衰减越慢。用非齐次泊松过程解析模型得到事件的时间间隔分布服从指数为 b/a+1 的幂律。 郭进利 . 博客评论的人类行为动力学实证研究和建模 . 计算机应用研究 , 2011,28(4):1422-1424. 2. 博客发布的实证和建模 博主在网络上发布博文的行为也具有兴趣衰减特征,刚开始或许经常写博客,时间长了更新的频率会下降。我们对科学网上的四个博客进行了实证分析,发现博客发布的时间间隔的累积分布表现为一种带有指数截断的幂律分布形式。 对上述模型进行改进,事件的发生率为 Lamda(t)=beta+alpha/(bt+1) ,类似的,参数 b 和 alpha 用于调节衰减速度,当 t 趋于无穷大时, beta 表示兴趣行为的稳定程度。解析结果显示,该模型可以通过调节参数得到不同的人类行为时间间隔分布,如: alpha=0,beta0时,时间间隔分布服从指数分布,参数为 beta ; alpha0,beta=0 时,若 b0 ,时间间隔为幂律分布,若 b=0 ,时间间隔为指数分布,参数为 alpha ; alpha0,beta0 时,若 b0 ,时间间隔为指数截断的幂律分布,若 b=0 ,时间间隔为指数分布,参数为 alpha+beta. J.-L. Guo, C. Fan, Z.-H. Guo. Weblog patterns and human dynamics with decreasing interest. Eur. Phys. J. B (2011). DOI: 10.1140/epjb/e2011-10722-1.
个人分类: 成果交流|6232 次阅读|10 个评论
世界"六度分离"的起源,记研究生阶段我的第一篇PRL
热度 19 yhu 2011-3-10 01:52
傍晚散步回来,打开邮箱,发现编辑部的通知,我们最近的一篇论文已经在网上发表了。看见她正式发出来,稍微有点兴奋,当然发表的杂志影响力高是原因之一,最主要的是这篇多磨难的论文终于发表出来了。从 2009 年初,我开始思考这个问题,到 2009 年末基本完成,包括附录中的数学解析,再到和编辑审稿人两个来回,终于让编辑和审稿人明白这个问题重要性直到发表历时 2 年有余。 本文实际上可能解决了复杂网络和人类动力学研究中的一个及其重要的问题。半个世纪前( 1969 Sociometry )著名的社会心理学家 Milgram 做了一个很有影响的社会实验,用以研究真实社会中朋友关系网络传递信息的能力。试验开始阶段随机选择了 296 位实验者让他们传递一封信件给居住在波士顿郊区的一个股票经纪人,实验者仅被告知包括该股票经纪人的居住地点等在内的个人信息。同时要求实验对象只能够通过认识的朋友传递信件。最终共有 64 封信件被成功送达,并且所有成功路径的平均长度大约为 6 。该实验结果显示我们的世界是 六度分离 的。 Mligram 的实验使人们意识到真实的社会网络中任意两个人之间都存在着很短的平均路径。但是这个实验所揭示的除了( 1 )社会网络中任意两个人之间都存在着很短的平均路径外还有一个重要的事实就是( 2 )社会网络中的个体能够根据局域信息高效地找到短的路径( 1999 Kleinberg Nature )。 Kleinberg 给出了一个非常绝妙的证明,他严格证明了如果假设朋友之间的距离分布为幂侓分布的话,当且仅当幂侓指数为 -1 时,个人才能通过局域信息高效的进行信件传递,也就是 Navigation (个人将信息传递给他 / 她所有朋友中离目标点地里位置上距离最近的人直到传给目标点为止)。这在计算机等领域有着及其重要的潜在用途,也正是出自于对此证明的欣赏和论文的优美才引导我去继续思考这个问题。 Kleinberg 的论文实际上带给我们一个重要的问题,如果 Kleinberg 对社会网络空间结构及其 Navigation 猜想是正确的,那么社会网络中为什么会存在这种特殊的幂侓结构呢?如果 Kleinberg 的猜想是错误的,那什么又是正确的 Navigation 呢?不论如何,这里必须有个非常重要问题没有解决。带着这个疑问,查阅了一些论文,由于不同领域在写法上误解,很多人都认为 Kleinberg 证明的最优幂侓分布(密度函数)指数为 -2 (只看结论不看详细证明的人几乎都这样认为,详细见论文)。实证中最容易测得的是分布函数的指数为 -1 ,这连个指数意义是不一样的。通过分析后来我们发现实际上所有的实证都指向 Kleinberg 的猜想是正确的!居然幂侓指数为 -1 的这个分布在如此复杂的社会中,如此色彩缤纷的社会网络中竟然是普适的!普适的,就是物理的! 接下来要回答的是,为什么社会网络中会存在这种普适的物理的空间结构?这种结构对个人有什么好处?放在心中不时地思考大概 2 个多月,有很多种方案,在这种特殊的空间结构下也看到了一些有趣的现象。最后在考虑到人们之间保持朋友关系需要代价并且这个代价和朋友之间的距离正相关时,一个人最佳的交朋友的方式就是在他能够给出的代价下,使得朋友关系网络的多样性最大,这也意味着他的朋友关系网络能给他带来最大的信息量,在这样约束条件与目标函数下,最优的空间分布就应该是实际的分布。当计算机模拟显示出这一猜想对应的和实际情况分布完全一样时,虽然没法做社会实验,但是自觉告诉我们这个理论及有可能是正确的,因为模型十分简单,有人也评价为优美。往往简单优美的东西就是自然地东西!无论如何至少我们发现并在国际上第一次提出这个重要问题。记得 2010 年在威尼斯国际复杂网络会议上,狄老师介绍讲完这个工作后 ( 狄老师开始让我去讲,我英语不好,不敢上 ) ,由于当时把我们安排在一个比较偏僻的报告厅,很多人都没有听着,后来与会者不少知道我们可能解决了这个问题,散会后,很多人都围着狄老师又重新讲了至少 3,4 遍,他们才放我们去吃饭,当时狄老师樊老师带着我们组的几个同学(我第一次出国),大家都觉得特别有面子。(博文如有错别字都是输入法的问题,呵呵)。 论文PhysRevLett.pdf SupplementaryEntropy.pdf
个人分类: 未分类|10573 次阅读|42 个评论
从复杂系统研究看人类动力学研究的意义和价值
热度 12 pb00011127 2011-3-9 11:05
霍金认为,复杂性科学是二十一世纪的科学!对复杂系统的深入研究,不仅产生了新的理论体系,例如耗散结构理论、突变论、微循环论、协同学等等,而且带来了从还原论到系统论这一研究理念和方法论上的革新。复杂系统的研究成果,极大地拓展了我们理解世界的广度和深度,并在若干问题中发挥了巨大的实用价值。复杂性科学也是最广泛最深入的一门交叉学科,其中物理学、数学、信息科学、系统科学、管理学、生物学、化学、地球科学、经济学、金融学等等我们能够想象到的学科,几乎都涉足其中。 大量典型的复杂系统,都直接或间接和人发生关系。经济金融系统和社会系统是由人的意志和行为驱动的,如计算机互联网这样的大规模技术网络是由人建造的,被很多学者认为最复杂的系统之一的大脑及神经系统,是人身体的一部分。从人的社会属性出发,我们研究社会经济系统中通过人的相互作用和策略博弈涌现出来的复杂性;从人的生物属性出发,我们研究人体内的神经系统、代谢系统、基因调控系统等等。尽管这方面的研究已经是硕果累累,我们还是注意到 前者把人看得太小,后者把人看得太大,对于与人相关的复杂系统的整体认识,尚缺失一个环节,就是人自身行为,特别是个体行为,在时间和空间上表现出来的复杂性 。 人类动力学通过对大量的人类行为事件进行定量统计,研究其中所隐藏的统计性规律,并根据所研究的问题,提出基本假设,建立理论模型,来探索这些规律的产生机制和可能的动力学影响。基于这样的研究方法,近年来人们发现了人类行为中所存在的大量的特殊的现象和规律,这些发现引发了人们对更深一步地探索人类的社会行为的热潮,并可能导致理论上新的认识和重大的应用创新。人类动力学时间方面的研究,主要牟始于 2005 年 Barabasi 在《自然》杂志上开创性的工作 ;空间方面的研究,主要得益于 2006 年 Brockmann 在《自然》杂志上原创性的工作 。从 2005 年算起,人类动力学的研究,仅在 Nature系列, Science, PNAS, Physical Review Letters, PLoS系列,BMC系列 就发表了超过 50 篇研究论文,涉及人类时空行为实证分析、理论模型和具体应用的方方面面。 总结起来,针对人类行为复杂性的研究方兴未艾,希望我国学者能够做出给力的结果!!
个人分类: 生活点滴|30839 次阅读|29 个评论
人类行为动力学中常见的标度律
热度 1 supermac 2011-1-2 22:21
指数分布 过去,当通信运营商需要估计移动通信中占线的电话数量并优化资源配置、交通部门想要模拟交通流量的模式或事故发生频率、以及网络和街区零售业意欲改进仓储和服务设置时,人们往往用齐次泊松过程来描述这些问题。即人类行为发生的时间间隔服从负指数分布,事件发生的数量服从泊松分布。所以指数分布是大家都熟悉的一种分布,在不同坐标下的图形如下所示: 幂律分布 幂律分布实际上很早就被发现了,但是直到 Barabasi 在 Nature 上发了那篇开山之作后这种默默无闻的分布律一下子就火了起来,在随后的两三年中,现实生活中大量的幂律分布集中涌现,仿佛不说幂律就没人重视,文章就发不出来。幂律分布在双对数坐标下表现为直线形式,暗示事件发生的概率极不均匀,小观测值的事件大量发生而大观测值的事件虽然数量众多但是发生的概率却都非常的小,表现在时间间隔的分布上即长时间的静默和短时间的爆发交织共存。下图即引自 Barabasi 的那篇文献,幂律分布与指数分布下事件发生模式的区别可见一斑。 指数截断的幂律分布 实际上很多现实的分布规律都难以用单一的分布函数来拟合或者预测,而是者混合的,一种常见的混合分布即带有指数截断的幂律分布。这种分布我们在博客发布和商业订单中均有发现。如下图所示,两个分布分别可由包含一个幂律和两个幂律部分 的函数式 表示。 漂移幂率分布 漂移幂率 (shifted power-law) 也是一种综合了幂律与指数特征的分布形式,其中参数 可以控制分布在幂律 ( ) 与指数 ( ) 之间自由转换。示例如下: References: 1. Chang Hui, Su Beibei, Zhou Yueping, et al. Assortativity and act degree distribution of some collaboration networks . Physica A, 2007, 383: 687-702. 2. Wang Yongli, Zhou Tao, Shi Jianjun, et al. Empirical analysis of dependence between stations in Chinese railway network . Physica A, 2009, 388:2949-2955. 3. Wang Peng, Zhou Tao, Han Xiao-Pu, Wang Bing-Hong. Modeling correlated human dynamics. arXiv:1007.4440v3. 除了混合形式的分布还有分段形式的分布被观测到,如: 单峰分布 如图所示,作者在考察物流运输的各个环节后发现,时间间隔分布表现为 一种特殊的单峰形态特征:左半部分具有较小波峰且含有极大值,右半部分具有明显的重尾特征并可用幂律函数近似拟合。 Wang Qing, Guo Jin-Li. Human dynamics scaling characteristics for aerial inbound logistics operation. Physica A, 2010, 389:2127-2133. 双峰分布 如上图,作者统计了手机用户互发短消息的时间间隔后发现该分布表现为以上形式,幂律分布后跟着一个指数分布,作者称之为为双峰分布,因为该指数分布位于幂律拟合直线的上方,而不是指数截断那样在拟合直线的下方。个人认为这种说法并不准确,因为指数部分并没有峰值,所以谈不上双峰除非把坐标系逆时针旋转让拟合直线成为横坐标才会出现两个峰值点。 Ye Wu, Changsong Zhoud, Jinghua Xiao, et al. Evidence for a bimodal distribution in human communication. PNAS, 1013140107.
个人分类: 科研资料|11484 次阅读|3 个评论
本年度我们的几项人类动力学实证工作
热度 1 supermac 2010-12-30 13:39
年末了,把我们小组在2010年做的关于人类动力学的几项实证工作做个小结,很多想法只是尝试,还请各位老师不吝赐教! 樊超 , 郭进利 , 纪雅莉 , 等 . 基于图书借阅的人类行为标度律分析 . 图书情报工 作 , 2010, 54(15): 35-39. 我们研究了两所大学图书馆数据库中的真实借阅资料,从群体和个体两个层面分析一次借阅过程中图书的借阅时间和用户连续两次借阅或还回图书的时间间隔等借阅行为的基本统计特征。 实证结果表明,对于图书借阅时间,群体行为服从指数分布,而个体行为服从幂律分布。对于借还书的间隔时间,群体和个体行为都服从幂律分布,但幂指数有所不同,大致分布在 1 至 3 的范围内;而在群体行为和个体行为上表现出了明显的区别,即前者的幂指数要大于后者。同时发现个体用户的幂指数与借阅量成正比关系。所有的统计量都表现出了明显的偏离泊松分布的统计特征。本章的研究证实了人类行为中存在多重标度规律,在群体层面和个体层面可能表现为不同的特征,即一种均匀性和非均匀性的交织。 Wang Qing, Guo Jin-Li. Human dynamics scaling characteristics for aerial inbound logistics operation. Physica A , 2010, 389:2127-2133. 我们以某物流企业的进境物流运作流程为研究对象,详细统计了完成整个运输过程中各个流程以及进出境供应链的关键三方主体相关业务行为的间隔时间和等待时间的分布规律,发现它们都表现出一种特殊的单峰形态特征:左半部分具有较小波峰且含有极大值,右半部分具有明显的重尾特征并可用幂律函数近似拟合,幂指数在 1.2 到 2.6 之间。这样分段形式的分布兼有泊松和幂律的特征,说明人类的工作行为不能由单一的规律刻画。这是因为人们的工作效率是有一定限度的,当任务的到达率不超过人们的能力范围时,人们可以轻松自如的处理任务,长时间的等待时间几乎不存在;而一旦超负荷工作,则必然会有一部分任务被长时间搁置而得不到处理。 Gao Lei, Guo Jin-Li, Fan Chao, et al. Individual and Group Dynamics in Purchasing Activity. ArXiv: 1010.3815v2. 在目前的人类动力学研究中,大多数是关于基于群体或者个体的研究,涉及到团体层面的组织行为比较少,上面的文献 2 是关于企业物流运作的一项研究,随后我们对某 国际 500 强企业的采购订单的研究中又发现,若从个体角度考察该企业对一家供应商下发的订单,则间隔时间服从幂律分布;而从群体角度考察所有数千家供应商的全部订单时,间隔时间分布的密度函数表现为一种兼具指数和幂律特征的函数形式 。这说明人类行为的时间规律满足幂律特征可能具有一定的局限性,当在个体层面可以忽略的微小偏差在群体层面得到叠加的时候,群体性行为必然会表现出偏离幂律的特征。 Zhang Li-Jiang, Guo Jin-Li, Wang Qing. Empirical analysis on human dynamics of hospital treatment. Physica A , unpublished. 我们分析了两家专科医院( A 和 B )患者就诊的时间间隔分布,在该分布中观察到了明显的峰值或拐点,拐点右侧均可由幂律很好的拟合,而左侧服从指数分布( A )或者单峰分布( B ),峰值对应间隔时间的最大概率值。另外我们还分析了就诊量的波动规律,挖掘就诊量与节假日、天象的关系。 Fan Chao, Guo Jin-Li Zha Yi-Long. Fractal Analysis on Human Behaviors Dynamics. ArXiv: 1012.4088v1. 沿用文献 1 的数据尝试从分形的角度探索人类行为中隐藏的规律。以人们日常生活和工作中发生的大量的重复性行为为研究对象,运用分形的原理和方法对图书借阅量构成的时间序列进行分析,用重标极差法计算了时间序列的 Hurst 指数和非周期循环长度;然后根据可视算法,将时间序列转化为复杂网络,计算了网络的拓扑参数;最后用盒计数法对网络进行分形和自相似分析。 我们以月、天、小时为时间单位分别构造了时间序列,从两个角度证明了人类行为具有分形特征:一,使用重标极差法进行时间序列分析,计算了借阅量序列和间隔时间序列的 Hurst 指数和非周期循环长度,发现所有的序列都有 ,因此人类行为发生的次数是正相关的分形时间序列;二,借助可视算法将时间序列转化为复杂网络,通过分析网络的拓扑性质发现网络具有无标度特征、小世界效应和等级结构,因此原序列是分形的,并且数据点、特别是极大值点之间存在紧密的内在联系。由此认为,人类行为发生的次数不服从随机游走,而是有着内在的规律性,记忆效应使得行为发生的未来趋势在一定程度倾向于和过去相同。
个人分类: 成果交流|5304 次阅读|1 个评论
[转载]《物理》39卷1期(2010)28-37 人类行为的动力学与统计力学研究
bhwangustc 2010-2-13 15:40
《物理》 39 卷 1 期( 2010 ) 28-37 人类行为的动力学与统计力学研究 * 汪秉宏 1,2, 韩筱璞 1 1 中国科学技术大学 近代物理系 理论物理研究所 及 非线性科学中心 230026 合肥 2 上海理工大学 复杂系统科学研究中心 及 上海系统科学研究院 200093 上海 摘要:对人类行为的统计特性的研究,涉及研究经济、心理、交通、社会学等学科的根本问题。在最近一个时期以来,针对人类行为的统计揭示出了大量的出乎人们意料的规律,吸引了众多研究者的注意。这些规律对于认识人类自身、大量的社会学科的基础研究有着重要价值,而且在实际应用中有着广阔的前景。在本文中,我们将回顾这一新近发展起来的领域的主要研究成果,并重点对中国科学技术大学的相关研究进行介绍。 关键词:人类行为,人类动力学,时间间隔分布,空间移动斑图,非泊松分布 Study of Dynamics and Statistical Mechanics for Human Behaviors Bing-Hong Wang 1,2 and Xiao-Pu Han 1 1 Department of Modern Physics, University of Science and Technology of China, Hefei 230026, 2 Research Center for Complex System Science, University of Shanghai for Science and Technology, Shanghai 200093 Abstract: To research statistical characteristics of human temporal and spacial behaviors involves the study of many fundamental problems in economics, psychologics, transportation, and sociology. I n a recent period of time, the statistical study of human behaviors reveals a lot of new laws beyond peoples expecting which attract the attention of many researchers. These new found laws are important for understanding of mankind itself, and for basic research of a large number of problems in social sciences. There are also broad prospects in their practical applications. In this article, we will review the main research results in this newly developed area, with an emphasis to introduce the related progress obtained by the Complex System Research Group at University of Science and Technology of China. Key words: Human behaviors, Human dynamics, Inter-event time distribution, Mobility pattern, Non-Poisson distribution characteristics. ------------------------------------------------------------------ * 本工作受到 以下基金项目的资助:国家重点基础研究发展计划( 973 项目编号: 2006CB705500 ),国家自然科学基金(批准号: 10975126 , 60744003, 10635040 , 10532060 ) 及高校博士点专项基金(批准号: 20060358065 )。 通讯地址:中国科学技术大学近代物理系,合肥 230026 Email Address: bhwang@ustc.edu.cn 1 、前言 人类的行为具有高度的复杂性。探索人类行为的统计特性,对于研究经济、心理、交通、社会学等学科,认识人类自身,有着重要的意义。在以往一些的对社会、经济系统的研究中,常常把单个人的行为简化为可以使用泊松过程描述的稳态随机过程。这种假设必然导致的推论是人的行为的时间统计特征应该是较为均匀的,两个相继行为之间存在极大的时间间隔的概率很小。但是,自 2005 年 Barabsi 通过对电子邮件发送与回复、邮件通信等人类行为的时间间隔的实际统计,人们发现这些行为存在与上述假设极为不同的特性 :长时间的静默与短期内的高频率的爆发,同时呈现在这些人类行为中,其时间间隔分布存在满足反比幂函数的胖尾,也就是说,这些行为的发生过程是不能用泊松过程描述的。这一出人意料的研究结论提示人们,人类的个体行为可能存在复杂的动力学机制,而随之而来的一个重要的问题是,这种非泊松特性在人类行为中是不是普遍存在的?人们对这一问题进行了极为广泛的研究。 通过各种不同的数据收集方法,人们的研究涉及市场交易 、网站浏览 ,电影点播 ,欣赏网络音乐 ,手机通讯 ,在游戏及虚拟社区中的行为 ,计算机指令的使用行为 等,包含了商业行为、娱乐行为、日常使用习惯等众多的人类行为,在这些行为中,普遍发现有类似的偏离泊松过程的特性。这些现象显示出,除了受到生理周期强烈影响的部分行为外,时间间隔统计所显示的非泊松特性可能是在人类行为中普遍存在的。 Vzquez 等将人类行为分为幂指数为 -1 和 -1.5 的两大普适类 , 而近期的更为深入的实证研究发现了更为广泛的行为特性,已经突破了这两大普适类的范围 。除了时间间隔分布,部分人类行为事件前后时间间隔的相关性也得到了研究者的注意。研究发现,这些人类行为相邻时间间隔的相关性并不明显,而其他同样存在爆发性和长期静默性的自然现象(如地震等)常常存在正的相关性 。这一项研究初步把人类行为和其他复杂系统中的行为特性进行了比较,暗示可能存在统一的深层机制。 上述统计特性说明人类的众多行为是不能使用泊松过程来描述的,那么一个重要的问题是:这种胖尾分布的行为特征的来源是什么?目前的一种重要的解释是基于任务队列理论的 ,它把人的各种日常行为视作处理一系列的任务,并根据日常生活经验假设对这些待处理任务进行优先级划分,首先处理高优先级者,指出这种具有优先权的行为模式是造成胖尾分布的重要原因。这种基于任务队列的理论模型可以合理地解释很多人类行为中的非泊松特性,例如电子邮件和水陆邮件的发送等,而且可以相当容易的推广到存在多个个体之间的交互的情况 ,在解释人类行为时间统计胖尾分布特征方面取得了很大的成功。 此外,由于影响人类行为的因素是多种多样的,所以,有部分研究从不同于任务队列的方面出发,提出了多种非排队论模型。例如,有的工作考虑了人类行为中的记忆效应 ,有的研究了行为的周期性和季节性对非泊松机制的影响 ,近期的一种理论从多重泊松分布的角度解释了人类的行为特性 。 最后,国际上有少数工作研究了人类行为的非泊松特性对网络传播、通讯等动力学过程的影响。例如,发现相比于一般的泊送特性,这种非泊松特性可以给系统带来一些特殊性质,比如更快的传播速度等 。 除了发现人类行为的时间间隔分布中广泛存在有非泊松特性,最近也发现在人类行为的空间分布中也存在有非泊松特性等复杂现象。 2006 年通过统计帐单传递 ,人们间接地发现了人类的旅行行程分布存在接近于幂律的胖尾; 2008 年, Gonzalez 等通过统计移动电话用户在不同基站区域的漫游过程 ,更进一步的研究了人的旅行行程分布,同样发现该分布具有无标度特性,与早期的结果基本一致。更为直接的基于 GPS 数据的统计结论 也支持人类行程分布中存在无标度特性。此外,在生物学观测也发现大量的动物物种的运动具有类似的幂律形式的行程分布 。由于这种幂律形式的行程分布存在较高频率的远程运动,它无法通过经典的随机行走进行描述。这种行程分布的广泛性,使得人们需要去思考它背后的动力学机制是什么。虽然对于动物行为中的幂律行程分布已经提出了觅食效率优化 、嗅觉梯度机制 、确定性行走 等。目前对人类的这种行程分布模式的产生机制的解释方面的研究仍然非常缺乏。 这一领域已经成为国际复杂性研究的一个新兴热点,近年来仅在 Nature 、 Science 、 Physics Review letters 这些国际顶级学术期刊上就出现 10 余篇相关的研究论文。该领域的兴起也引起了国内研究者的注意。目前,中国科学技术大学、上海理工大学、上海交通大学等都有相关工作在国内外学术期刊发表。这些工作可以简述如下: 在实证方面,中国科学技术大学复杂系统课题组的周涛等人与韩国成均馆大学及瑞典皇家学院合作研究了电影点播中的人类行为模式以及与个体活动性之间的关系 , 洪伟等研究了人类短消息通讯中的时间间隔分布 ,发现了多种无标度特性;上海理工大学课题组的张宁、李楠楠和周涛合作分析了鲁迅、钱学森等名人的邮件通讯数据 ;上海交通大学的胡海波等人研究了网络在线音乐的收听行为 . 在理论模型方面,中国科学技术大学的韩筱璞等提出可自适应调节的兴趣机制来解释人类行为的非泊松特性 . 此外,上海理工大学方面还发表了针对人类动力学的中文综述 ,上海理工大学的郭进利等和中国科学技术大学的周涛等人合作编写出版了专著《人类行为动力学模型》 ,中国科学技术大学的周涛、韩筱璞、汪秉宏也在世界科学出版社出版的专著《 Science Matters: Humanities as Complex Systems 》中撰写了关于人类动力学研究的一个专门章节 。 在本文中,我们将回顾这一领域的主要研究成果,并重点对中国科学技术大学的相关研究进行介绍。 2 、人类行为的时间统计特性研究 2.1 .人类行为的时间统计特性的实证统计 目前人们已经对大量的人类行为的时间分布特性进行了统计,内容涉及工作、日常生活和娱乐等,除了部分强烈受到生理节律或工作时间安排限制的行为外,在各种具有较高自主选择性的行为中普遍的发现了非泊松特性。在本文中,将对 Email 的发送和回复行为、普通邮件的发送和回复行为、电影点播行为这三种典型的日常行为的统计进行介绍。 (i) . Email 发送时间间隔分布与回复等待时间分布 2005 年 Barabsi 最早研究了 Email 用户的发送时间间隔分布与回复等待时间分布。如图 2.1 所示,该图显示了某个 Email 用户在 3 个月内使用电子邮件的行为特性,其中不论是相邻两次电子邮件的发送时间间隔分布,还是回复一个电子邮件所需要的等待时间分布,都满足于幂指数为 -1 的幂律关系。这种幂律分布是极不均匀的,显示出电子邮件用户的发送与回复行为同时具有强烈的爆发性和长期的静默共存的特性。这种特性显然是不能通过泊松过程有效的加以描述。 图 2.1, 一个电子邮件用户在 3 个月内的 (a) 邮件发送时间间隔分布 (b) 电子邮件回复时间分布,均满足指数为 -1 的幂律。图引自文献 。 (注:横坐标 是时间间隔长度,单位是秒;纵坐标 P 是该时间间隔出现的相对概率。注意:原作者对该概率没有进行归一化。) (ii) .水陆邮件回复等待时间分布 图 2.2 .爱因斯坦 (a) 、达尔文 (b) 和弗洛伊德 (c) 等的邮件回复时间分布, 均满足指数为 -1.5 的幂律。图引自文献 。 (注: 是曲线在双对数坐标图中的拟合直线斜率, 所以是曲线使用幂函数拟合所得的幂指数的绝对值) 人们同样也对人发送普通水陆邮件的行为特性进行了研究。一些名人有着详细的邮件通讯记录,这为研究这一问题提供了很大的便利性。最为典型的统计结果如图 2.2 所示,该研究统计了爱因斯坦、达尔文和弗洛伊德的邮件回复时间分布,发现他们三人的该分布都呈现出高度一致的指数为 -1.5 的幂律形式。而且,这些名人的邮件活动模式在长达数十年的观察期内是不断变化的,从开始时每年仅有不多的邮件,到后期平均每年多达数百封。因此,这一跨越整体统计时间的统计虽然显示出共同的幂律特性,但它并非是稳定的。 Vzquez 等曾经基于以上这些统计结果提出了人类非泊松性行为模式的两大普适类:一个是分布指数为 -1 的,如 Email 使用等,另一个分布指数为 -1.5 ,如发送普通水陆邮件的行为等。 上海理工大学的李楠楠等也对钱学森的邮件通讯记录进行了统计,统计结果表明,钱学森的邮件发送时间间隔分布满足指数为 -2.1 的幂律,同样具有非泊松特性,但已经超出了两个普适类的范围。 图 2.3 .钱学森的邮件通讯时间间隔分布。图引自文献 。 (iii) .电影点播时间间隔分布 中国科学技术大学的周涛等统计分析了在线电影网站 Netflix 的公开数据。这一数据库包含了 17770 部电影和来自 447139 个用户的近 1 亿条点播记录。在不对用户进行区分的情况下,统计所有用户的电影点播时间间隔分布,如图 2.4 所示,这一分布具有指数为 -2.08 的幂律尾部,也超出了两个普适类的范围。 图 2.4 .所有用户的时间间隔分布。该分布接近幂指数为 -2.08 的幂律。分布曲线中存在周期为一星期的波动,这一波动在电子邮件通讯行为中也曾被观察到。 图引自文献 。 考虑到在现实中用户点播电影的行为具有活跃程度的区别,部分用户具有更高的平均点播频率,为了考察用户的活跃程度对点播行为的影响,定义用户的活跃程度为在统计时间范围内该用户的单位时间内的平均点播次数,把所有用户按照活跃程度按照递减顺序排序,然后把这些排序后的用户依次分为 20 个所包含的用户数目基本相同的群体。统计发现,这 20 个群体的时间间隔分布都满足幂律,其幂指数变化范围从 -1.5 到 -2.7 ,指数绝对值与群体的平均活跃程度的关系如图 2.5 所示,两者呈现单调的非线性正相关关系。 图 2.5 .幂指数和平均活跃程度之间的关系。图引自文献 。 2.2 .人类行为的非泊松特性的任务队列理论 任务队列理论是目前研究人类行为统计特性的主流理论。这一理论将人的日常行为视作处理一系列的任务,而人面临的主要问题是如何从这一系列的任务中选择首先处理的对象。 Barabsi 排队论模型中考虑了三种情况:第一种是按照先进先出的原则,优先处理首先到来的任务,这种处理方式可以导致指数型的等待时间分布尾部;第二种是从任务队列中任意选取一个任务进行处理;第三种方式是优先处理任务队列中的高优先级任务。基于这样的前提,模型可以构造如下: 假设个体的任务列表长度为 L ,每个任务都被赋予一个优先权 x i ,其中 i = 1 , 2 , , L ;该优先权由一个均匀分布生成。在每一个时步,该个体执行一个任务,并把该任务从任务队列中移除,同时向队列中添加一个新的任务,新任务具有一个新的优先权。在个体选择要处理的任务时,个体以概率 p 执行优先级最高的任务,以概率 1 p 任意挑选一个任务处理。这样,当 p 趋向于 1 时,该模型对应与优先处理任务队列中的高优先级任务的情况,当 p 趋向于 0 时,对应于从任务队列中任意选取一个任务进行处理的情况。 该模型所考察的是当一个任务进入队列到被处理所需要的等待时间分布。模型的计算结果如图 2.6 所示,当 p 趋向于 1 时,该模型可以获得指数为 -1 的幂律尾部形式的任务等待时间分布,这个指数同人类电子邮件回复等待时间分布的实证统计是一致的;而当 p 趋向于 0 时,这一分布趋向于指数形式。这一结果说明,人类行为中所存在的胖尾特性来自于人在日常处理事务时常常优先处理某些较重要的任务,有效地解释了一批人类行为中的非泊松特性的机制。 图 2.6 . Barabsi 排队论模型生成的时间间隔分布。优先权从一个 之间的平均分布中抽取,队列长度为 L = 100 ,共模拟统计 10 6 时步。图 a 为双对数坐标下的时间间隔分布的尾部,取 p = 0.9999 ,为模型的确定性选择高优先级任务的极限情况,其中直线对应于指数为 -1 的幂律;图 b 为单对数坐标下的时间间隔分布,取 p = 0.00001 的情况,为随机选取任务的极限情况,满足指数分布。图引自文献 。 2.3 .人类行为的非泊松特性的自适应兴趣驱动模型 不同于排队理论,中国科学技术大学的研究者提出了自适应兴趣模型,来研究人类行为中的非泊松特性 。在现实中,如果观察某个人所做的某种具体的事情,如玩游戏、看电影等,常常可以看到一种调节机制:即做完该事后,人会改变此后做该事的概率或频率。比如,当一个人在很久没有玩游戏后,偶尔玩一次游戏常常会激起他的兴趣使得他玩游戏的频率增加,又如吃到一种很久没吃的食物会使人在短时间内对该食物产生很大兴趣,而如果该频率过高(如同吃该种食物太多倒了胃口),他常常又会出现对这种行为的节制而使得频率下降。但是,这种调节的范围常常是非常宽的,最低频率和最高频率之间可能存在几个数量级的差别。这种调节机制可能会使人的兴趣或活性出现准周期的变化 , 可能会造成人类行为中时间间隔分布的标度性。该模型假设:对某种行为,每做一次都会改变下一次做该事件的概率。考虑最简单的情况,即每次概率改变的比例是相同的。事件的时间间隔存在两个阈值,即间隔过小或过大都会改变做该事的概率变化的趋势:即如果两次事件的间隔过小,会使做该事的概率以固定的比例减小,反之使概率以相反的比例增大。 模型规则为:时间为离散的,在时步 t 某事件发生的概率为 r(t) ;每发生一次该事件, r(t) 要进行一次更新,更新规则为: r(t + 1) = a(t)r(t) ,其中, a(t) 只能取两个值:如果本次事件与上次的时间间隔小于或等于 T 1 ,则 a(t) = a 0 ;如果该时间间隔大于 T 2 ,则 a(t) = a 0 1 ;对于其他情况, a(t) = a(t 1) ;其中 T 1 、 T 2 为固定的正整数, a 0 为固定的参数,分别满足 T 1 T 2 , 0 a 0 1 。 图 2.7 .数值模拟所的时间间隔分布。 左栏:固定 T 1 = 1 , a 0 = 0.5 , T 2 与时间间隔分布的关系; 右栏:固定 T 2 = 10000 , T 1 = 1 , a 0 与时间间隔分布的关系; 数据由 100 次独立模拟,每次模拟 10000 个事件,取平均获得。 图中虚线表示指数为 -1 的严格幂律。图引自文献 。 根据以上规则,一般本次事件与上次的时间间隔小于或等于 T 1 的情况大多出现在当 r(t) 等于或者接近于 T 1 -1 时。因此, T 1 的取值决定了 r(t) 所能够达到的最高值;同样 T 2 的取值决定了 r(t) 所能够达到的最小值在 T 2 -1 附近。如果同时将 T 1 和模型的最小时间尺度放大同样的倍数,并保持 T 1 和 T 2 的比值不变,那么在该时间尺度下 r(t) 的最大最小值之间的平均比率与原来相比是不变的,因此所得到的在新的时间间隔分布与原来的也是相同的。所以, T 1 实际也表示了该模型最小有效的时间尺度,因此,在以下的讨论中,不失一般性,我们固定 T 1 = 1 。 在数值模拟中,取 r(t) 的初始值固定为 1.0 。通过数值模拟,当 T 1 和 T 2 存在有三个数量级以上的差别时,可以生成接近幂律的时间间隔分布,幂指数为 -1 ;随着 T 2 的缩小,该分布逐渐偏离幂律趋向于指数,如图 2.7 左栏所示; 对于相同的 T 1 和 T 2 ,较大的 a 0 也会使得分布曲线偏离幂律,如图 2.7 右栏所示。 3 、人类和其他生物行为的空间统计特性 3.1 .生物行为的空间统计特性的实证统计 图 3.1 .多种海生动物运动行程分布。 (b). sub-adult and adult basking shark 未成年和成年的姥鲛, (c) 、 bigeye tuna 大眼鲔, (d) 、 Atlantic cod 大西洋鳕鱼, (e) 、 leatherback turtle 棱龟, (f) 、 Magellanic penguin 麦哲伦企鹅, (g) 、 1-year-old basking shark 一岁的姥鲛 . 图引自文献 。 长期以来,在人们的常规认识中,生物或者人类的运动行为常常被简单地视作简单的经典的随机行走。在这种经典随机行走中,发生远大于平均行程的长距离迁移的概率是极低的。然而,实证研究发现,很多生物的运动行为的统计特性并非如此简单。 1996 年 Viswanathan 等基于针对信天翁的统计数据进行的研究 ,显示出信天翁的飞行时间分布接近于幂律,具有无标度特性,但由于该数据较为粗糙,其幂律分布特性尚存在疑义 。但是,对更广泛的物种的运动行程分布所作的更精确的统计,包括对浮游微生物 、蜘蛛猴 等的行为的统计研究,显示出这种标度性的行程分布行为特性是现实存在的。特别是 Sims 等对多种海生动物(涉及鱼类、爬行类、鸟类等)的运动行为的统计 显示出了清晰的幂律特性的行程分布 p( l ) ~ l - ,一般幂指数绝对值 介于 1.7 到 2.4 ,如图 3.1 所示。在这些统计中,一次运动的行程被定义为运动中相邻两次停留之间所行走的距离。这种 幂律行程分布 行为特性可以用 Levy 飞行来进行描述,说明生物在运动过程中,存在大量的短途运动的同时,也常常进行远距离的移动,不能使用经典的随机运动进行描述。与经典的随机行走相比,这种运动模式的行程分布极不均匀,具有较高的长程运动概率。 3.2 .人类行为的空间统计特性的实证统计 最近,人类出行行为中也存在着标度性的行程分布。近年来, Brockmann 等 通过对帐单的统计研究了现实中人类的空间运动行为,随后 Gonzalez 等 通过统计移动电话用户在不同基站之间的漫游信息,获得了更为直接的人类空间运动数据,对人类空间运动行为进行了更为深入的探讨。这些研究发现,人类的运动行为具有着迥异于经典随机行走的特性: 图 3.2 . Gonzalez 等基于移动电话数据统计得到的两组数据的人类行程分布, 其中指数 值在 1.65 附近。图引自文献 。 ( 注:图中对于分布曲线采取了函数为 的拟合。其中 K 是一个拟合参数,表征了该分布函数的尾部相对于严格幂律的偏离大小。之所以采用该函数进行拟合,是因为该函数在幂律形式的基础上,可以清晰地表达出实证中常常观察到的指数尾现象。 K 实际上表示了截断发生的位置:当 rK 的时候,指数项影响不明显,而当 rK 的时候,指数衰减项起主要作用。 K 从数量级上指出了截断发生的位置。) 首先,与很多动物的运动行为类似,人类的空间行程分布是很不均匀的,其行程分布满足指数约为 -1.5 到 -1.7 的具有明显尾部截断的幂律分布,说明其远大于平均行程的长程运动的概率远高于传统的随机运动描述,例如图 3.2 所示。 但是,统计结果还揭示出人类空间运动具有较明显的局域性,远离某个小区域的概率随时间的衰减较慢。这一特性也可以从个体的回旋半径的增加趋势上来观察。个体在 t 时间内的回旋半径 r g (t) 定义为: 其中 r cm 表示该个体在统计时间段内的平均位置, r i 为各个曾到达的位置, n c (t) 为在 t 时间段内到达的位置数,上标 a 指示对个体 a 进行的统计。如图 3.3 所示,对于经典的随机行走和 Levy 飞行,回旋半径随时间为幂函数增加,但是实证发现,实际人的回旋半径增加速度非常缓慢,接近于对数增长,显示出强烈的局域性。 这一特性显示出人类空间运动行为不但不能使用传统的随机行走进行描述,也不能使用 Levy 飞行进行描述,因为尽管 Levy 飞行同样具有较高的长程运动概率,但它不具有局域性;而且对于个体而言,常常存在少数几个经常前往的地点,到不同地点的平均频率也满足幂律分布,而且具有明显的各向异性。 图 3.3 .基于移动电话数据统计得到人类运动的局域性特征。 (a) 、双对数坐标系下,具有不同运动活跃性的个体的回旋半径随时间的变化,显示出对随机行走和 Levy 飞行所对应的幂函数增加律的偏离; (b) 、个体的回旋半径增加趋势满足对数律。 图引自文献 的支持文档。 (注: RW 表示随机行走( random walk ), LF 表示 Levy 飞行 (Levy flight) , 即行程分布满足幂律的随机运动方式) 3.3 .生物运动的驱利性模型 根据生物行为所具有两种普遍的行为准则 趋利性 和 最小努力性 ,中国科学技术大学的研究者提出了趋利性生物运动模型 。趋利性常常表现为生物体一般倾向于向能够提供更为丰富的生活资源、有着更为适宜的环境的区域生长或移动。而最小努力性即生物一般在保证能够获得足够的资源的同时,会尽可能地减小相应的代价(比如时间、营养、能量、机会等)的付出。对于众多生物物种而言,这两者是生物行为适应性的保证,也是决定其各种宏观行为的基础。在该模型中,由于实际的生物个体一般具有较稳定的有限的生活区域,因此设定个体在一个 N*N 大小的离散格子空间中运动。 每个格子具有一定的资源,对于坐标为 (i, j) 的格子使用 V(i, j) ( 0 V(i, j) V m )表示,其中 V m 表示资源的上限。 一般生物体所需的资源,特别是食物资源,是可有限地再生的,因此在该模型中资源可以有限度地缓慢恢复。在该空间上,M个个体同时进行运动。如图 3.4 所示,基于趋利性原则和最小努力原则,在每一时步个体的运动规则和格点状态更新规则如下:各个个体寻找距离各自的当前位置最近的具有资源最大值 V m 的格点作为其目标位置。如果满足这样条件的格点有多个,则随机选择其中一个作为目标位置;个体移动到目标位置上,并把该位置的资源 V 置为 0 ,表示资源已经被消耗;所有个体的位置更新完毕后,对于所有资源小于 V m 的格子,其资源 V 增长 1 ,表示资源的有限度的再生。 定义比率 r = MV m /N 2 ,该值表示在各个体运动时,空间中资源小于 V m 的格点所占的稳定的比例,也表示资源相对于消耗的剩余程度。当 r = 1 时,表示资源的再生恰好满足各个个体的消耗,无任何多余的资源; r 越小,资源剩余量越大,也就是说资源越充足。该值是这个模型的一个主要参数,在数值模拟中, V m 的取值由 r 来确定。 图 3.4 .模型中一个个体在三个连续时步的运动示意图。 其中蓝色实球表示个体当前所占据的格点,白色虚球表示在下一时刻个体所可能占据的位置,格子的颜色深浅表示资源 V 的大小,白色表示 V = V m ,颜色越深表示 V 值越小。 图引自文献 。 行程分布 p(d) 是我们主要关心的统计学量。模拟所得行程分布如图 3.5 所示,幂指数 的绝对值随 r 的减小而增大。当 r 0.8 时, p(d) 的分布曲线已经偏离了常规的幂函数, 而更为接近指数分布, 此时的运动方式已经不是 Levy 飞行,说明如果资源(比如食物等)的丰富程度增加,生物的运动中的长程运动的概率会趋向减小,甚至可能导致幂律运动特性的丧失。这种的生物运动方式随食物丰富程度而改变的现象在实际观测中也有发现,比如蜂类在食物匮乏时行程分布的幂指数绝对值小于食物丰富时 ,该模型的结果与此基本一致。同时,这一结果也暗示,在部分观测中所观察到的偏离 Levy 飞行模式的生物运动可能来自于资源较为丰富的区域。 个体数目 M 的大小对 p(d) 也有一定影响。在该模型中, M 的大小并不表示生物种群密度,而是表示生物活动区域的重叠程度,或者说对资源的共享程度。如图 3.5 (b) 所示,当 r 值接近 1 时, M 越大,所得分布函数 p(d) 的幂指数 越小,同时较大的 M 也会使分布函数出现明显的尾部截断。目前尚无实际的观测数据对我们认为生物活动区域的重叠程度和其运动行为的关系进行定量的考察,但是该模型的结果暗示,当食物资源趋向临界时,相比于一些有着严格领地的物种,那些无明显领地区分的物种的行程分布可能存在更大的长程运动几率,同时其运动行为也会更多地受到食物资源状况的影响。在这一方面,目前尚无可对应的实证结果,这一结论需要更深入的实测数据的支持。 图 3.5 . (a). 当 M = 100 时,当 r = 0.50, 0.80, 0.90, 0.95, 0.99 和 1.00 时所得行程分布 p(d) 。 (b). 当 r = 0.99 时, M = 1 , 10 , 100 , 500 , 1250 时所得行程分布 p(d) 。以上各组数据均是在 N = 500 时,统计了初始化后的 10 6 个移动事件,并进行 100 次独立模拟取平均所得。红色虚线表示指数为 -2 的幂律分布。图引自文献 。 3.4 .人类空间运动的层次性交通模型 根据实际的行政区划以及行政区内的交通常常具有便利性等情况,中国科学技术大学的研究者提出了基于层次性交通网络的人类运动模型 。现实中,因为行政区内的交通常常具有便利性,人的出行常常是这样的:如果一个人试图从属于某个中心城市的乡村(属于 A 城市辖区的 a1 小镇)到属于另一个城市的乡村(属于 B 城市辖区的 b2 小镇)去,那么他常常选择首先前往所属中心城市( A 城市),然后由 A 城市到目标所在中心城市( B 城市),再从 B 城市到达目标 b2 小镇。 在大多数情况下,这样的旅行方式常常最为便利。这样的旅行方式,使得从个体层面来看,交通系统具有明显的层次性。 该模型即基于这种层次性的地理交通网络结构。在现实中,这种层次一般有 3 到 5 级,比如在中国,省会-市-县-镇-村可视为是 5 级结构。因此,在模型中,我们将所有的城市分为 3 到 5 个级别。以一个 3 级结构为例,中心位置的城市为最高级城市( 1 级城市),整个区域被划分成 3 * 3 共 9 个子区域,除了中间 1 级城市所在子区域,每个子区域的中心位置的城市定义为各个辖区的中心城市( 2 级城市)(中间区域的中心城市仍是该 1 级城市),同时在每个 2 级城市周围分布着 8 个 3 级城市,同样 1 级城市周围也分布有 8 个 3 级城市(相当于每个子区域又被分为 9 个次级区域)。在实际数值模拟中,我们常常定义 1 级城市并不止 1 个。属于同一个高级城市的低级城市(在相应的同一子区域内)之间全连通,同时全都和该高级城市直接连接。但属于不同高级城市的低级城市之间没有连边。每个小区域内的 3 级城市之间是全连通的,同时也都和所属 2 级城市相连,而每个 2 级城市之间(同属该 1 级城市)也是全连通的,并也都和 1 级城市直接相连。 图 3.6 .层次性交通模型所得到的空间运动斑图和行程分布。 图引自文献 。 在这样的网络中,一个个体沿着该层次性网络的连边(而不是地理连边)进行随机行走。显然,该模型不允许直接进行跨子区域的运动,除非是处在该子区域的中心城市。因此,在该层次性网络上的随机行走具有这种特性:人要到达不从属于同一个中心城市的目的地时需要经过两者所从属的中心城市。一般情况下,这种特性是符合现 实中人们的旅行方式的。每一时步该个体所移动的空间距离 L ,被定义为该时步移动的初始城市 A( 地理坐标 ( x a , y a )) 到终点城市 B( 坐标 ( x b , y b )) 之间的几何距离 : 注意: L 完全是基于地理位置计算,与该层次网络完全无关。 L 的分布函数 p(d) ,就是该模型所主要关注的。 该模型的主要参数包括:结构层次数目 N( 3 N 5 ), 第一级城市数 k ,每个上级区域被分为次级区域的个数 M 。在这种结构中,第 2 级城市总数目为 (M-1)k 个, 3 级城市 (M-1)Mk 个, ,第 n 级城市数为 k(M-1) M (n-2) 个 (2 n N ) 。在数值模拟中, k 固定为 9 个。图 3.6 所示为取 5 级结构, M = 9 时所得结果。其中,图 3.6 (a) 所示,尽管大多数的行走是在同一区域低级的城市之间完成的,但仍会出现爆发性的长距离行走(图 3.6(a) )。行程分布呈幂律关系,其指数接近于 -2 。这一结果显示出,沿这种层次性地理网络的运动,可以导致标度性的行程分布。 在现实中,中心城市往往有着较大的城市规模和较多的人口,一般对于居住下属城市的居民而言,总体上前往中心城市的概率要大于到其他同级城市的概率。因此,在随机性城市分布模型的基础上,引入了各个城市的权重 w ,来表示各城市对人流的影响力。对第 n 级城市 , 其权重 w n = w 0 r (N-n) 。其中 w 0 为常数,固定为 1 ; r 1 ,是一个主要参数。个体沿连边运动时,到达某个相邻城市的概率 p = w j /(w i ) 。在这种情况下,高级城市的权重随着 r 的增大而增大,个体具有较高的概率向较高级城市行走 , 因此也具有较高的长程运动概率。模拟所得行程分布仍然具有胖尾特性,当 r 在 1 到 2 之间时,所得行程分布指数可在 -1.2 到 -2.7 之间连续变化。该结果可以覆盖实证统计所得的指数 -1.5 的结果。这一结果说明,城市的差异性以及所导致的人流方向的不均等性,是行程分布指数绝对值低于该层次系统所决定的分布指数的主要原因。 4 .结束语 由于该领域的发展时间短暂,目前在存在有大量的问题有待于深入的研究:首先目前已有的实证统计主要针对个体行为,但仍然存在大量的个体行为的特性并未被研究,已有的研究结果尚难以根据统计特性区分个体行为的主要类别;而针对团体行为的实证研究更几乎是空白。事实上,人类的行为常常受到起社会关系的影响,在这方面定量的实证研究仍然非常欠缺。另外,一些最近发展的理论,例如人类动力学的普适类假说,受到了新的实证数据的挑战,更清晰和令人信服的图景需要更多和更深入的实证分析。除了人类的个体行为,一些最新的统计也发现,一些社会团体的宏观行为也具有类似的非泊松特性,例如国家之间的战争的时间间隔分布等;由于目前的实证统计有限,对于社会团体而言,这些特性在多大范围内存在,是否与人类个体行为具有相似的生成机制,都仍然是未知问题,需要进行深入的研究。而在研究人类行为的空间分布方面,目前的实证数据全是根据帐单、手机漫游等数据间接获得的,缺少对人类行为空间分布的直接观察;而其产生机制和动力学效应方面的研究目前几乎没有。目前的理论模型研究,虽然已经提出了多种唯相机制来解释人类行为中的非泊松特性,但是这些机制难以覆盖全部的人类行为中的非泊松特性现象,需要新的更具有普适性的模型的提出。人类行为特性对各种社会系统的动力学效应的影响研究,尽管已经出现了少数这方面的研究,但是所涉及的问题众多,研究空白特别多,需要大量的工作深入进行。总而言之,这个领域的发展还处在初始阶段,有着众多的研究空白和问题需要等待解决,其重要理论意义和广阔的应用前景,目前仅仅是露出了冰山一角,有待于研究者的深入发掘。 参考文献: A.-L. Barabsi, Nature 435, (2005) 207. J.G. Oliveira, A.-L. Barabsi, Nature 437, (2005) 1251. V. Plerou, P. Gopikrishnan, L. A. N. Amaral, X. Gabaix, and H. E. Stanley, Phys. Rev. E 62, (2000) 3023(R). J. Masoliver, and M. Montero, Phys. Rev. E 67, (2003) 021112. M. Politi, and E. Scalas , 2008 Physica A 387 2025. Z. Q. Jiang, et al, Physica A, 387 (2008) 5818. Z. Dezs?, E. Almaas1, A. Lukcs, B. Rcz, I. Szakadt, and A.-L. Barabsi, Phys. Rev. E 73, (2006) 066132. B. Goncalves, and J. J. Ramasco, Phys. Rev. E 78 , (2008) 026123. T. Zhou, H. A.-T. Kiet, B.J. Kim, and B.-H. Wang, Europhys. Lett. 82, (2008) 28002. H. B. Hu, and D. Y. Han, Physica A 387, (2008) 5916. J. Candia, M.C. Gonzlez, P. Wang, T. Schoenhar, G. Madey and A.-L. Barabsi, J. Phys. A: Math. Theor. 41 (2008) 224015. T. Henderson, and S. Nhatti, Proc. 9th ACM Int. Conf. on Multimetia, pp. 212, ACM Press 2001. A. Grabowski, N. Kruszewska, and R. A. Kosiński, Phys. Rev. E 78, (2008) 066110. S. K. Baek, T. Y. Kim, and B. J. Kim, Physica A 387, (2008) 3660. K.-I. Goh, and A.-L. Barabsi, Europhys. Lett. 81, (2008) 48002. A. Vzquez, Phys. Rev. Lett. 95, (2005) 248710. A. Vzquez, J. G. Oliveira, Z. Dezs ? , K.-I. Goh, I. Kondor, and A.-L. Barabsi, Phys. Rev. E 73, (2006) 036127. A. Gabrielli and G. Caldarelli, Phys. Rev. Lett. 98, (2007) 208701. J.G. Oliveira, and A. Vzquez, Physica A 388, (2009) 187. A. Vazquez, Physica A 373 (2006) 747. A. Cesar, R. Hidalgo, Physica A 369 (2006) 877. R. Dean Malmgren, Daniel B. Stouffer, A. E. Motter and L. A. N. Amaral, Proc. Natl. Acad. Sci. USA 105, (2008) 18153. A. Vzquez, B. Rcz, A. Lukcs, and A.-L. Barabsi, Phys. Rev. Lett. 98, (2007) 158702. D. Brockmann, L. Hufnagel, and T. Geisel, Nature 439, (2006) 462. M. C. Gonzalez, C. A. Hidalgo, and A. -L. Barabasi, Nature 453, (2008) 779. L. Rhee, M. Shin, S. Hong, K. Lee K, and S. Chong, On the Levy-walk nature of human mobility, Proc. 27th IEEE Conf. Comput. Commun (INFCOM, IEEE Press, 2008). F. Bartumeus, F. Peters, S.Pueyo, C. Marrase, and J. Catalan, Proc. Natl. Acad. Sci. USA 100, (2003) 12771. G. Ramos-Fernandez, J. L. Mateos, O. Miramontes, G. Cocho, H. Larralde, and B. Ayala-Orozco, Behav. Ecol. Sociobiol. 55, (2004) 223. D. W. Sims, E. J. Southall, N. E. Humphries, G. C. Hays, C. J. A. Bradshaw, J. W. Pitchford, A. James, M. Z. Ahmed, A. S. Brierley, M. A. Hindell, D. Morritt, M. K. Musyl, D. Righton, E. L. C. Shepard, V. J. Wearmouth, R. P. Wilson, M. J. Witt, and J. D. Metcalfe, Nature 451, (2008) 1098. G. M. Viswanathan, S. V. Buldyrev, S. Havlin, M. G. E. da Luzk, E. P. Raposok, and H. E. Stanley, Nature 401, (1999) 911. F. Bartumeus, J. Catalan, U. L. Fulco, M. L. Lyra, and G. M. Viswanathan, Phys. Rev. Lett. 88, (2002) 097901. A. M. Reynolds, Phys. Rev. E 72, (2005) 041928. M. C. Santos, D. Boyer, O. Miramontes, G. M. Viswanathan, E. P. Raposo, J. L. Mateos, and M. G. E. da Luz, Phys. Rev. E 75, (2007) 061114. 周涛 , 在线电影点播中的人类动力学模式 , 复杂系统与复杂性科学 5(1), (2008) 1. W.Hong, X.-P. Han, T. Zhou, and B.-H. Wang, Chin. Phys. Lett. 26, (2009) 028902. 李楠楠,张宁,周涛 , 人类通信模式中基于时间统计的实证研究 , 复杂系统与复杂性科学 5(3), (2008) 43. N.-N. Li, N. Zhang , Tao Zhou, Physica A 387, (2008) 6391. 韩筱璞,周涛,汪秉宏 , 基于自适应调节的人类动力学模型 , 复杂系统与复杂性科学 4(4), (2007) 1. X.-P. Han, T. Zhou, and B.-H. Wang, New J. Phys., 10 (2008) 073010. 李楠楠,周涛,张宁 , 人类动力学基本概念与实证分析 , 复杂系统与复杂性科学 5(2), (2008), 15. 郭进利,周涛,李季明,张宁,《人类动力学模型》, 上海系统科学出版社,香港 2008. Jinli Guo, Tao Zhou, Jiming Li, Ning Zhang ( editors ) , Models of Human Dynamics, Shanghai System Science Publishing House , Hong Kong 2008. T. Zhou, X.-P. Han, B.-H. Wang, Towards the understanding of human dynamics, pp. 207-233 (M. Burguete and L. Lam eds., Science Matters Humanities as Complex Systems, World Scientific Publishing, Singapore 2008). A. M. Edwards, R. A. Phillips, N. W. Watkins, M. P. Freeman, E. J. Murphy, V. Afanasyev, S. V. Buldyrev, M. G. E. da Luz, E. P. Raposo, H. E. Stanley, and G. M. Viswanathan, Nature 449, (2007) 1044 1048. X.-P. Han, Q. Hao, T. Zhou, and B.H. Wang, Origin of Levy Flight in Biological Mobility Pattern , unpublished Q. Hao, X.-P. Han, T. Zhou, and B.H. Wang, Origin of the Scaling Law in Human Mobility: Hierarchical Organization of Traffic System, unpublished
个人分类: 生活点滴|6719 次阅读|1 个评论
最近的工作
bupt1419 2009-6-7 22:52
最近的工作 前3个月,去了香港浸会大学一个老师那访问。重新拾起了自己很久之间就一直在脑海里的一个课题,曾经去思考过,但总是没有成功,这次有人指导,有点进步。 可以说自己很失败,或者说机会不好,在我进入研究生的时候,就拿到了这份sms的数据,老师很早就让我分析这份数据,开始因为没人指导,一直不指导怎么搞科研,后来慢慢摸索,在写了很多个垃圾程序后,终于发现一个地方可以写文章,这就是第一篇文章的来源。 之后老师又给了我一篇关于human dynamic 的第一篇文章,关于达尔文,爱因斯坦的写信规律研究以及建模,看了很久没认真看懂,被老师批了好几次,批的很惨很惨,说的一些话到现在还记得,比如我招你来干吗,要是只会写程序,不如直接招一个计算机编程的人。北师大现在的学生怎么成这样了等等。在连续一个礼拜每天晚上的教训之后,终于在一天下午的半争论中,把这个文章给理解了,也重复出来了。因为缺少眼光,也没有对这个课题继续下去,这是最大的失败,到现在才发现一个老师和学生的差别在哪,老师给我文章是发现了这是一个新的热点方向,而我一点都没感觉。对于那份sms数据,心里也一直觉得不好,没有特别想着去用。 之后就是到了德国,在一段时间没有课题的时候,又想起来这个课题,查了查文章一看,一大堆相关的PRL的文章出来了,那时候大叫可惜可惜,要是我也早进入这个题目,这些文章中可能就有我的了。后来也思考过这个题目,有一个很好的idea,也在空余时间写了一些程序,但因为缺少指导,也没人真正愿意和我交流,又放下了。之后电脑坏了,程序都丢了,就暂时放一边了。 这次去香港,本来是找那个老师要一个课题来当毕业论文的,但是第一次讨论,他就对我说的这个题目产生了很大的兴趣,觉得这个可以当一个切入点,然后接下来的时间就全耗在这个题目上了。得到的结果还不错,老师说有希望发PNAS,但我缺少信心,这个题目已经不是很新了。我已经错过了最佳时机了,碰碰自己的运气了。 这个题目自我感觉很有意思,和实际联系很紧密,关于具体内容等下次再写。
个人分类: 未分类|4047 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-28 05:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部