科学网

 找回密码
  注册

tag 标签: 人类行为动力学模型

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

人类行为复杂网络及信息挖掘的统计物理研究
热度 3 bhwangustc 2012-2-23 15:07
人类行为、复杂网络及信息挖掘的 统计物理研究 汪秉宏 , *) 、周涛 , *) ,周昌松 中国科学技术大学 近代物理系 理论物理研究所及 非线性科学中心 合肥 230026 上海理工大学 复杂系统科学中心 及 上海系统科学研究院 上海 200093 电子科技大学 网络科学中心 成都 610054 香港浸会大学 物理系及非线性研究中心 *) 通讯作者 : bhwang@ustc.edu.cn ; zhutouster@gmail.com ; zhutou@ustc.edu ; 摘要:我们正处于一个统计物理大革新的时代。许多重要复杂体系(生命、经济和社会体系:互联网、人类行为、城市交通流、社会关系网络、大脑神经网络)正迫切等待我们发展新的统计物理研究方法,通过实证统计与理论模型分析相结合的手段进行全新的认识和探索。我们建议从人类行为的统计特性,复杂网络同步与复杂神经网络,信息挖掘与复杂网络链路预测三个方面,基于大量的实证统计和分析,结合有效的动力学模型,针对人类自身行为的规律特性、社会个体之间的相互作用、神经系统的动力学演化、信息的有效推荐和网络演化的有效预测等多个重要问题,进行基于统计物理理论的全方位探索,深入挖掘各种决定复杂系统演化过程的基本机制与规律。 引言: 在自然界,工程、经济和社会的各个领域都有大量复杂体系。十二五提出的可持续和谐发展的长远规划对复杂体系 , 尤其是与人相关的复杂系统的研究提出了前所未有的要求。特别是近十几年来,科学研究的一个巨大变化,就是越来越多地对复杂体系进行系统层次的综合的统计物理学研究。这一趋势的形成是由科学研究在几个方面长期积累的合力所引起的,包括 : (1) 复杂性研究的进展 ——几十年以来,非线性和复杂性统计物理研究通过模型的理论研究发展了一套概念和方法来分析耦合体系中复杂的涌现行为 , 比如人和动物的集群行为。这些行为只出现在系统层次,为分离的系统单元所不具有。这些理论进展导致了科学概念的革命性变化,出现了新兴的学科方向,例如系统生物学等。特别是过去十多年来统计物理从传统研究相对独立的多粒子体中的标度与普适现象转移到研究大规模复杂体系中各单元或子系统之间相互作用的复杂的结构关系,形成了一个跨学科的,影响至深的复杂网络领域。 (2) 海量数据采集和处理技术的发展 ——计算机技术的进步使得大规模的数据采集取得突飞猛进的变化,提供了大量研究复杂体系结构与演化的实证数据,比如计算机网络,万维网,交通运输网等。大量有关人类个体和集体行为的数据也为定量研究复杂社会体系提供了前所未有的契机。 我们正处于一个统计物理大革新的时代,许多史无前例的事关社会经济发展的复杂体系正迫切等待我们发展新的统计物理的分析手段和理论模型来对它进行全面深入的认识。复杂体系的系统层次统计物理研究虽然已成潮流,然而它却面临巨大的挑战。最大的问题是理论模型及计算研究与大规模真实数据之间还存在一个巨大的鸿沟。复杂性统计理论模型往往没有考虑到许多真实体系,特别是与人个体或群体有关的生命和社会体系是变化过程中经过选择优化的结果,对他们的多重的约束在这样一个优化问题中没有得到足够的重视和认识。其次,作为开放系统,它与环境交换能量和物质的边界条件对优化结果的选择起到至关重要的作用。这些是研究真实的复杂体系的真正挑战所在。当模型的构建和分析没有足够考虑这些重要方面 , 理论结果往往与真实系统很难相符,甚至于不相关。对这些内在约束和外在边界条件的了解有赖于对具体的复杂体系进行细致深入的实验实证研究。 虽然技术的进步为在系统层次观测和收集数据提供了前所未有的机会,大规模的数据积累也非常之快,然而,有组织、有针对性地从实验实证数据探索系统的内外约束条件还处于初步的阶段。因而,如何分析应用这些数据来全面理解真实系统的行为却进展甚微。关键的问题是缺乏有效的理论框架 , 所获得的数据在数量上可能很大,却不一定有很强的针对性 , 信息比较散杂。数据中大量貌似杂乱可往往包含有用的系统组织的信息,由于缺乏有效的理论指导 , 在数据挖掘中很可能当作噪声被丢弃了。所得的系统信息不易串联在一起形成有效的关于体系在所受到多重约束和边界条件下的组织图像。如在认知神经科学领域,大脑自发的复杂活动通常作为噪声处理,大大限制了对这样一个动态复杂体系结构和功能的认识。经济、社会领域的数据积累也往往缺乏有系统的理论指导。 由于对这些根本性的挑战还缺乏比较全面深入的认识,复杂体系的统计物理研究还处于初步阶段。在我国国内有不少学者在复杂性一般模型和理论方面展开了比较活跃的研究,但还缺乏有意识、有组织和有规模的在理论和数据的有机结合上进行系统化的发展。因此,很有必要基于当前国内研究团队的分布,组织国内的科研合作力量,把理论研究和实证分析紧密地结合起来,缩小理论及计算研究与大模型实验实证数据之间的鸿沟 , 从而在根本上推动我国在复杂系统统计物理这一新兴领域的进步,在国际学术竞争中占一席之地,甚至处于领军位置。 下面我们将对 人类行为、复杂网络、信息挖掘等三种复杂系统的统计物理 研究之最新进展和主要问题分别进行详细阐述并分析。 ( 一 ) 人类行为动力学 人类行为具有高度的复杂性。研究人类行为中的规律,对于经济学、社会学、管理学的研究和应用有着极为重要的价值。长期以来,对人类的社会行为的研究主要为心理学所关注,通过心理学实验的方法,研究人类在各种环境下的心理反应是其主要的研究手段。 最近数十年来,人们在复杂系统研究领域内取得了令人瞩目的成就。复杂系统的研究具有着天然的综合性和交叉性,它所涉及的问题几乎遍及人们所研究的绝大多数领域,不但包括物理学、生物学等自然科学学科,也包括了经济学、社会学等社会学科。随着对复杂系统研究的不断深入,该领域的研究对各种社会学科的渗透越来越强烈,其理论影响和实际应用也越来越广泛。近年来,对人类行为的统计研究已经成为复杂系统中的一个重要议题。 不同于传统的心理学实验的方法,复杂系统研究者对于人类行为的研究主要通过统计物理的方法:通过对大量的人类行为事件进行定量统计,研究其中所隐藏的统计性规律,并根据所研究的问题,提出基本假设,建立理论模型,来探索这些规律的产生机制和可能的动力学影响。基于这样的研究方法,近年来人们发现了人类行为中所存在的大量的特殊的现象和规律,这些发现引发了人们对更深一步地探索人类的社会行为的热潮。特别是从 2005 年以来,仅在 Nature, Science, PNAS , PRL 等强影响因子期刊上就已经发表了三十余篇文章。 1.1 ,人类行为时间统计特性的实证研究 在以往一些的对社会、经济系统的研究中,常常把单个人的行为简化为可以使用泊松过程描述的稳态随机过程。这种假设必然导致的推论是人的行为的时间统计特征应该是较为均匀的,两个相继行为之间存在极大的时间间隔的概率很小。但是,自 2005 年以来,通过对电子邮件发送与回复、邮件通信等人类行为的时间间隔的实际统计,人们发现这些行为存在与上述假设极为不同的特性 :长时间的静默与短期内的高频率的爆发,同时呈现在这些人类行为中,其时间间隔分布存在满足反比幂函数的胖尾,也就是说,这些行为的发生过程是不能用泊松过程描述的。这一出人意料的研究结论提示人们,人类的个体行为可能存在复杂的动力学机制,而随之而来的一个重要的问题是,这种非泊松特性在人类行为中是不是普遍存在的?人们对这一问题进行了极为广泛的研究。 通过各种不同的数据收集方法,人们的研究涉及市场交易 、网站浏览 ,电影点播 ,欣赏网络音乐 ,手机通讯 ,在游戏及虚拟社区中的行为 ,计算机指令的使用行为 等,包含了商业行为、娱乐行为、日常使用习惯等众多的人类行为,在这些行为中,普遍发现有类似的偏离泊松过程的特性。这些现象显示出,除了受到生理周期强烈影响的部分行为外,时间间隔统计所显示的非泊松特性可能是在人类行为中普遍存在的。 除了时间间隔分布,部分人类行为事件前后时间间隔的相关性也得到了研究者的注意。研究发现,这些人类行为相邻时间间隔的相关性并不明显,而其他同样存在爆发性和长期静默性的自然现象(如地震等)常常存在正的相关性 。这一项研究初步把人类行为和其他复杂系统中的行为特性进行了比较,暗示可能存在统一的深层机制。 1.2 ,人类行为动力学模型研究 上述统计特性说明人类的众多行为是不能使用泊松过程来描述的,那么一个重要的问题是:这种胖尾分布的行为特征的来源是什么?目前的一种重要的解释是基于任务队列理论的 ,它把人的各种日常行为视作处理一系列的任务,并根据日常生活经验假设对这些待处理任务进行优先级划分,首先处理高优先级者,指出这种具有优先权的行为模式是造成胖尾分布的重要原因。这种基于任务队列的理论模型可以合理地解释很多人类行为中的非泊松特性,例如电子邮件和水陆邮件的发送等,而且可以相当容易的推广到存在多个个体之间的交互的情况 ,在解释人类行为时间统计胖尾分布特征方面取得了很大的成功。 此外,由于人类行为的复杂性,影响人类行为的因素是多种多样的,所以,有部分研究从不同于任务队列的方面出发,提出了多种非排队论模型。例如,有的工作考虑了人类行为中的记忆效应 ,有的研究了行为的周期性和季节性对非泊松机制的影响 ,近期的一种理论从多重泊松分布的角度解释了人类的行为特性 。 最后,国际上有少数工作研究了人类行为的非泊松特性对网络传播、通讯等动力学过程的影响。例如,发现相比于一般的泊送特性,这种非泊松特性可以给系统带来一些特殊性质,比如更快的传播速度等 。由于这一领域发展时间很短,在这一问题上还有海量的工作等待研究。 1.3 ,人类行为空间统计特性的研究 除了发现人类行为的时间间隔分布中广泛存在有非泊松特性,最近也发现在人类行为的空间分布中也存在有非泊松特性等复杂现象。 2006 年通过统计帐单传递 ,人们间接地发现了人类的旅行行程分布存在接近于幂律的胖尾; 2008 年, Gonzalez 等通过统计移动电话用户在不同基站区域的漫游过程 ,更进一步的研究了人的旅行行程分布,同样发现该分布具有无标度特性,与早期的结果基本一致。更为直接的基于 GPS 数据的统计结论 也支持人类行程分布中存在无标度特性。此外,在生物学观测也发现大量的动物物种的运动具有类似的幂律形式的行程分布 。由于这种幂律形式的行程分布存在较高频率的远程运动,它无法通过经典的随机行走进行描述。这种行程分布的广泛性,使得人们需要去思考它背后的动力学机制是什么。虽然对于动物行为中的幂律行程分布已经提出了觅食效率优化 、嗅觉梯度机制 、确定性行走 等。目前对人类的这种行程分布模式的产生机制的解释方面的研究仍然是空白。在另一方面,由于这类非泊松特性常常会使得系统出现若干特殊性质,那么这种人类行为的空间分布上的非泊松特性同样可能影响到城市交通、人流控制、紧急避险等系统的运作,可能会使其带有若干特殊性质,这些问题目前尚未被研究,也值得研究者的注意。 1.4 ,人类行为动力学对传播的影响 人类行为的特性,不仅帮助人们更好的了解自己的行为特征,进一步挖掘这些统计数据背后所隐藏的人类特性,还关系到了人们对于多个方向的模拟和理解,其中讨论最多的,应属人类动力学对于疾病在人群中传播的影响。在这里主要从时间和空间两个方向来介绍人类行为对于传播的速度、波及的范围、预防的策略等的影响。 经典的疾病传播模型,都基于一些有悖于人类真实行为的假设: 1 、人活动的时间间隔相同,即所有人都均匀的在每个时间步活动一次,这里的“活动”,是指传播或康复的行为; 2 、所有人活动的频率在群体中是无差别的,即每个个体的活动密度一样。然而,参考前文人类时间间隔实证统计发现,这些假设与人类行为具有的阵发性、记忆性和活跃性有着很大的出入。 为关注人类活动的阵发性对于病毒传播的影响, V á zquez 等人用人们查收 E-mail 的两组数据,分别为 3188 个用户之间发送的 129135 封邮件, 1729165 个用户之间互发的 39046030 封邮件,在实证数据的网络上,根据真实时间间隔,模拟了网络上计算机病毒的传播情况 。以天和小时为单位的统计结果,都表明人类行为的时间间隔满足幂率分布,会极大程度上减慢病毒的传播。人类活动的阵发性对于病毒传播具有明显的延迟作用。 文献 也运用 SIR 模型通过模拟,讨论了时间分布的阵发性对于传播过程的影响,设置了存在等待时间的模型,并得到结论:时间的异质性越强,病毒存活的概率越小。 在人类活动时间间隔满足阵发性的基础上,为探讨时间序列的记忆性对传播过程的影响, Karsai 等人基于电话网络的实证数据,时间跨度为 9 个月,在规模为 N=4.6 × 106 的网络上模拟传播 。通过对比网络是否含权重、网络是否有向、通话时间分布是否有记忆性,模拟结果表明,人类行为时间和空间上的异质性会一定程度的减慢传播过程。 时间的异质性又体现在个体与群体两个层面上,也有工作进一步比较了二者对于疾病传播的速度的影响 。所谓群体层面的时间异质性,是指每个人活动的时间序列,间隔平均,而人与人之间的频率有较大差别,满足幂律分布,而个体层面的时间异质性,表现为人与人之间活动的频率相同,而单人活动的时间间隔满足幂律分布。群体层面上时间的异质性对传播速度的影响非常大,相比之下,个体层面上的对传播影响很小。 为了揭示人类的行程分布对于传播过程的影响, Ni 等人利用连接概率与度成正比,与欧氏距离成反比的机制,构造网络,并在网络上模拟传播过程 。研究发现,行程分布的几何特征越鲜明,即人们更倾向于去到距离自己欧氏距离比较近的地方,病毒传播所波及的范围就越小 , 持续时间也就越短。 相比于个体形成分布的活动特征,更多人关注,在宏观的意义上,人类的长程旅行对于病毒在城市间扩散的影响。早在 2004 年, Hufnagel 等人就在美国的航空网络上,假设人口密度随机分布,建立了 SARS 病毒传播的模型 。该模型考虑了局部病毒传播,和城市间由于飞行造成病毒传播两种因素,模拟出的结果与实证很好的吻合,并提出了有效地预防及抑制疾病传播的策略。针对以上模拟及解析结果, Hufnagel 等人还提出了相应的预防策略,通过模拟,比较了减少局部地区个体接触和减少长程出行两种预防策略,得出孤立城市,即减少城市间的长程旅行可以更有效地防治疾病扩散,并给出了集中早期进行疫苗注射的显著效果 。此后, 2006 年 Colizza 等人专门就人类长程出行的拓扑结构对于病毒扩散造成的影响进行了研究 。为了进一步探究网络的拓扑结构对于疾病人数分布的影响,还提出了病毒分布熵的概念,来刻画病毒流行的地区异质性。通过与实际网络病毒传播情况的对比,发现以前很多刻画人类行程拓扑结构的模型在细节上还需改进。 1.5 ,国内相关研究进展 该领域兴起也引起了国内研究者的注意。目前,中国科学技术大学复杂系统课题组、上海理工大学管理学院、上海交通大学自动化系等都已经有相关的研究论文在国内外学术期刊发表。这些工作可以简述如下: 在实证方面,中国科学技术大学复杂系统课题组的周涛等人与韩国成均馆大学及瑞典皇家学院合作研究了电影点播中的人类行为模式以及与个体活动性之间的关系 , 洪伟等研究了人类短消息通讯中的时间间隔分布 ,发现了多种无标度特性;上海理工大学课题组的张宁、李楠楠和周涛合作分析了鲁迅、钱学森等名人的邮件通讯数据 ;上海交通大学的胡海波等人研究了网络在线音乐的收听行为 . 在理论模型方面,中国科学技术大学的韩筱璞等提出可自适应调节的兴趣机制来解释人类行为的非泊松特性 . 此外,上海理工大学方面还发表了针对人类动力学的中文综述 ,上海理工大学的郭进利等和中国科学技术大学的周涛等人合作编写出版了专著《人类行为动力学模型》 ,中国科学技术大学的周涛、韩筱璞、汪秉宏也在世界科学出版社出版的专著《 Science Matters: Humanities as Complex Systems 》中撰写了关于人类动力学研究的一个专门章节 。 1.6 ,面临的主要问题 由于该领域的发展时间短暂,目前在存在有大量的问题有待于深入的研究: 第一,已有的实证统计主要针对个体行为,但仍然存在大量的个体行为的特性并未被研究,已有的研究结果尚难以根据统计特性区分个体行为的主要类别;而针对团体行为的实证研究更几乎是空白。事实上,人类的行为常常受到起社会关系的影响,在这方面定量的实证研究仍然非常欠缺。另外,一些最近发展的理论,例如人类动力学的普适类假说,受到了新的实证数据的挑战,更清晰和令人信服的图景需要更多和更深入的实证分析。 第二,除了人类的个体行为,我们所做的一些最新的统计也发现,一些社会团体的宏观行为也具有类似的非泊松特性,例如国家之间的战争的时间间隔分布等;由于目前的实证统计有限,对于社会团体而言,这些特性在多大范围内存在,是否与人类个体行为具有相似的生成机制,都仍然是未知问题,需要进行深入的研究。 第三,在研究人类行为的空间分布方面,目前的实证数据全是根据帐单、手机漫游等数据间接获得的,缺少对人类行为空间分布的直接观察;而其产生机制和动力学效应方面的研究目前几乎没有。 第四,目前的理论模型研究,虽然已经提出了多种唯相机制来解释人类行为中的非泊松特性,但是这些机制难以覆盖全部的人类行为中的非泊松特性现象,需要新的更具有普适性的模型的提出。 第五,人类行为特性对各种社会系统的动力学效应的影响研究,尽管已经出现了少数这方面的研究,但是所涉及的问题众多,研究空白特别多,需要大量的工作深入进行。例如人类行为的空间分布特性是如何影响城市交通等。 ( 二 ) 复杂网络动力学——同步与神经动力学 2.1 复杂网络:科学与技术的新前沿 在过去的十多年里我们见证了由一个影响深远的交叉学科 “ 复杂网络 ” 的出现带来的复杂系统研究上的重大革新(见终述 )。在很多真实世界中的复杂系统中,系统基本元素之间相互作用构成了复杂的拓扑连接 。来自不同学科领域的这些复杂网络既不是规则连接也不是随机连接,而是具备两个共同的特性。这两个共同的特性分别是由较短路径长度所描述的小世界特性 和具有很大的连接(度)的中心节点的无标度特点 。 复杂网络领域的主要方向是图理论分析工具的发展以及将这些工具应用于刻画不同领域里的复杂系统 。在复杂网络领域的研究方法中,复杂系统的基本元素是由节点来表示,元素之间的相互作用是由边来表示,而元素和相互作用的一些细节的特点通常被忽略考虑。 在对复杂系统的研究中,上述过度简化的研究方式限制了方法的效能。一个很大的挑战是,对整个网络的全局统计量(如平均路径长度,簇系数等)进行测量时,网络的结构并不能够真正决定系统的行为。例如,由脑皮层区域之间长程连接所构成的大脑网络的小世界和无标度特点 确实能为结构基础对大脑的功能表现提供一些视角,但是要想对大脑功能作出更重要的深入理解需要基于对神经元和复杂网络结构的重要特性综合之后对大脑的动力学进行深入细致的分析。 将网络的结构和复杂系统的行为联系起来的重要一步是对在网络上发生的动力学过程的研究 。在很多复杂系统的动力学研究中,特别是对于神经系统 ,复杂网络的振子同步作为共同行为的自组织现象的重要机制已经成为深入探索的一个重要课题(见我们在综述 )。 2.2 复杂网络同步研究的成就及重大挑战 在振子同步性问题上,研究的焦点集中考虑网络拓扑结构方面,特别是小世界和无标度特性的影响上 。在整个网络的全局同步方面,很多工作要么考虑全同振子实现的完全同步或者是非全同振子由于锁相实现的协作振动 。之前已经有很多研究主要使用主稳定性方程来探索完全同步状态的稳定性,而在这个方法中,根本不考虑振子的特殊属性,而是将网络同步性与网络的特征谱挂钩 。文献主体部分是通过对权重和耦合强度的拓扑结构进行调整来加强振子的全局同步性 。 虽然完全同步非常方便进行稳定性分析,但是它不是真实的复杂系统中最自然的状态。相反,大尺度的强同步对应的是系统病态情况,比如社会灾难,癫痫发作,真实系统是不希望这些状态的。真实的系统特别是神经系统,为了实现正常的功能需要不同层次的同步,使得系统通过分割成不同动力学模块在各自的子系统里实现特殊的功能,同时,这些专门的模块间的相互作用有效地实现了分割处理的信息的整合。 最近网络研究中将网络分成不同的拓扑模块的研究方法已经引起了广泛的关注 。除了小世界和无标度特性,模块化是真实网络另一个普适特征。例如在神经系统中,数十亿神经元被耦合形成不同层次的(从单神经元连接组成的神经柱,由不同神经柱连接再形成的功能区域)模块网络。通过模块之间不同层次上的合作同步,模块结构为系统实现功能的分类和整合提供了一个天然的基础。虽然关于模块研究的最近的一些工作仍然考虑完全同步态的稳定性问题 ,但是主流的趋势已经转移来研究系统在并未完全同步时的动力学模块的形成,这个方法同时用于探测网络结构模块 。 值得注意的是很多之前著名的研究仍然将网络的随时间变化的动力学(如网络演化 )和动力学行为在网络上的表现(如同步,信息传播 )分开考虑。然而在大量真实的复杂网络系统中,结构与动力学的相互影响是至关重要的。不只是结构决定了动力学斑图,反过来动力学也使得结构进行了与之相适应的调整,后者在众所周知的神经系统的学习机制中表现得尤为明显。很多真实系统自组织了网络结构,并且在两者共同演化中实现了对功能的优化。有些工作开始关注在适应性网络上来对结构和功能的相互影响进行分析 。 综上所述,在振子网络的理论分析和模型研究中的主要挑战是:( i )刻画复杂同步斑图的复杂性程度与网络不同层次结构之间的关联( ii )探索在各个层次里通过结构模块和动力学模块的相互影响实现两者的自组织。这个方向的探索刚刚起步,将长期影响我们对可以用振子及其同步来根本表现其功能的真实复杂系统,特别是神经系统的理解 。 2.3 神经网络与神经动力学 由几百亿个神经元通过极其复杂的,多层次连接而形成的大脑皮层神经系统是自然界中所知的最为复杂的动力学网络体系。它的结构与动力学直接关系到大脑的各种功能及相应的精神疾病及认知障碍。最近十多年来,由于脑造影技术的进步,人们已在系统层次对大脑的连接及活动积累了非常多的有益的数据。如何分析理解这些数据从而获得对大脑大规模的复杂结构,动态活动及认知功能之间的关系,必将是未来研究大脑会蓬勃发展的新方向。 在过去几十年内,非线性与复杂性物理科学的各种理论和方法得到长足的发展,并将其应用于神经科学领域 . 特别是复杂网络方法的应用已经勾勒出一个关于大脑的新的图景,使得我们可以从解剖学上的神经连接层面以及动力学,也就是大脑功能上的区域相互关联层面上来研究这个复杂的神经网络结构 。在大脑的系统层面上,根据之前的研究 ,由哺乳动物的脑区间的长程连接所构成的脑皮层网络已经展示出小世界和无标度特性。这个发现的意义是巨大的:它暗示着每个脑区的活动都可能同时被其他脑区的活动影响。由测量到的不同脑区活动的相关性所得到的大脑功能区之间的相互作用的功能网络也展示了这个复杂的大脑斑图,这一点甚至当大脑处于静息态,也就是说大脑在没有外感觉输入,只有完全自发的自组织活动的状态下也同样存在 。传统的认知神经科学在过去的 10 多年也开始转而研究大脑自发活动在功能上的影响 。然而,认知科学方面的分析还是主要局限在考虑由少量脑区所组成的自下而上(前馈)或者从上而下的(反馈)机制 。与只研究少量脑区相比,从复杂网络角度同时研究神经系统中各部分的相互作用将会带来关于动力学和功能的相互关系方面更多的信息。但是我们究竟要如何解读这些信息呢? 大脑的复杂网络假设呼唤着新的方法来揭示出大脑大尺度的功能网络和认知过程的关联。如今基于网络的分析和测量工具不足以应付研究复杂的大尺度动力学相互作用的斑图,并将它们与只在 50-100 毫秒的短时间窗口里发生的各种认知过程相联系的需要。( i )现在这些复杂的大脑网络的特征分析只是局限在讨论网络的全局统计量,例如簇系数,平均路径长度等等。而对于功能网络的分析也主要是考虑在长时间尺度下统计意义上,脑区活动相互作用的斑图。( ii )普适的网络理论对于结构和动力学关系的探索只是局限在一些理想的情况下。例如:复杂网络中振子同步问题已经被大量研究(见我们最近的一篇综述 )。但是,这些研究主要是集中在全局同步上 ,也就是,整个网络的完全同步。通过理论的稳定性分析可知,大尺度完全同步并不允许信息的分割处理,这一点与神经系统中需要信息的分隔处理与整合的恰当平衡相抵触,因而与神经系统的疾病状态相对应,如癫痫发作 。 因而,对大脑复杂的联结结构与活动的统计分析和模拟研究的挑战是如何把复杂网络和复杂动力学系统的一般理论同真实神经系统的特异性有机结合,发展新的理论方法并把它应用到真实的数据分析和模型的建立上。这需要从事复杂性统计物理研究的学者与神经科学家之间的紧密合作。 (三)信息挖掘的统计物理分析 随着因特网的迅猛发展,接入因特网的服务器数量 和 World-Wide-Web 上网页 的数目都呈现出快速增长的态势。用户可得信息量的激增使得人民的生活变得多元化,但与此同时,也带来了信息过载的问题。例如, Netflix 上有数万部电影, Amazon 上有数百万本书, Del.icio.us 上面有超过 10 亿的网页收藏,如此多的信息,别说找到自己感兴趣的部分,即使是浏览一遍标题也是不可能的。信息过载,简单来说,就是信息量的激增使得信息的利用率反而降低。高效准确的信息推荐技术,特别是针对不同用户不同喜好的个性化推荐技术,是解决信息过载问题最有前途的方案 。另外需要注意的是链路预测技术,这是一种不完整信息重构的有效手段。下面,我们将从信息推荐理论和算法以及链路预测理论和算法两方面进行叙述。 3.1 关于信息推荐 个性化推荐系统,本质上讲是根据用户对相关产品的历史评价,代替用户评估他尚未接触的产品的一种工具 。这些产品包括书、电影、 CD 、网页,甚至可以是饭店、音乐、绘画等等。个性化推荐系统作为一个独立的概念,在上世纪九十年代已经被提出。由于 Web2.0 技术的发展和成熟,用户可以方便地针对网上服务提供反馈信息,这些反馈信息可以反映用户的喜好,从而被网络服务提供商用来进行推荐。因此,最近几年,个性化推荐系统的研究得以迅猛发展。 虽然早在 1992 年开发的 Tapestry 系统就己经是真正意义上的信息推荐系统了,但推荐系统的概念直到 1997 年才由 Resnick 和 Varian 正式定义 ,推荐技术也才逐步发展为一个独立的研究领域。《 Communications of ACM 》分别于 1992 年和 1997 年出版了两期推荐系统的专刊,国际著名期刊《 Journal of Information Technology and Tourism 》、《 ACM Transactions on Information System 》、《 ACM Transactions on Computer-Human Interaction 》、《 International Journal of Electronic Commerce 》、《 IEEE Intelligent Systems 》、《 AI Communications 》等也分别于 2003 年、 2004 年、 2005 年、 2007 年出版了推荐系统的专刊。除这些专刊外,多个顶级的国际会议,如 CHI 、 ACM SIGIR 、 ECAI 、 AAAI 、 ReColl 等都设立专门的推荐系统的工作组。由于推荐系统的重要地位, ACM SIGIR 设立了专门的推荐系统会议,其第一届会议于 2007 年在美国明尼苏达大学召开,第二届会议于 2008 年在瑞士洛桑理工大学召开。 一般而言,信息推荐系统通常包括三个组成要素 :推荐候选对象、用户和推荐方法,其中推荐方法是整个推荐系统中最核心、最关键的部分,在很大程度上决定了推荐系统的性能。目前针对推荐方法的分类也有好几种,其中多数研究者将推荐技术分为三类:基于协同的推荐(协同过滤)、基于内容的推荐和混合推荐技术。 (1) 协同过滤系统 ——协同过滤系统是最早被提出并得到广泛应用的推荐系统,其核心思想可以分为两部分 :首先,利用用户的历史信息计算用户之间的相似性;然后,利用与目标用户相似性较高的邻居对其它产品的评价来预测目标用户对特定产品的喜好程度。系统根据这一喜好程度来对目标用户进行推荐。协同过滤推荐系统最大的优点是对推荐对象没有特殊的要求,能处理音乐、电影等难以进行文本结构化表示的对象。 Grundy 被认为是第一个投入应用的协同过滤系统 ,该系统通过建立用户兴趣模型给用户推荐相关的书籍; Tapestry 邮件处理系统人工确定用户之间的相似度 ; GroupLens 建立用户信息群,群内的用户可以发布自己的信息,依据社会信息过滤系统计算用户之间的相似性,进而向群内的其它用户进行协同推荐 。 Ringo 利用社会信息过滤方法向用户推荐音乐 。其它利用协同过滤方法进行推荐的系统还有 Amazon 的书籍推荐系统 等。虽然协同过滤推荐系统得到了广泛的应用,但是也面临很多问题,例如针对新用户或新产品推荐问题(冷启动问题),打分稀疏性问题,算法可扩展性问题等等。 (2) 基于内容的推荐 ——基于内容的推荐不是依据用户对项目的评价意见,而是依据用户已经选择的产品内容信息来计算用户和产品之间的匹配度,进而进行相应的推荐。基于内容的推荐算法的根本在于信息获取和信息过滤 ,关键在于内容信息的获取和匹配。因为文本信息获取与过滤方面的研究较为成熟,多数基于内容的推荐系统都建立在对产品的文本分析上。在大多数的基于内容的推荐系统中,产品的内容常常被描述成关键词。 Fab 系统 就是一个典型的例子,它用一个网页中最重要的 100 个关键词来表征这个网页;而 Syskill Webert 系统 则用 128 个信息量最多的词表示一个文件。系统根据文本相似性推荐与用户过去喜欢的产品最为相似的产品 。基于内容的推荐系统中,用户的配置文件构建与更新是其中最为核心的部分之一,也是目前研究人员关注的焦点。例如 Somlo 和 Howe 以及 Zhang 等人 提出了利用自适应过滤技术更新用户配置文件; Chang 等人 通过区分长期感兴趣与短期感兴趣的关键词,赋予短期感兴趣的关键词更高的权重,在此基础上建立新的关键词更新树,从而大大减少了更新配置文件的代价。 Degemmis 等人 利用 WordNet 构建基于语义学的用户配置文件,配置文件通过机器学习和文本分类算法得到,里面包含了用户喜好的语义信息,而不仅仅是关键词集。基于内容的推荐系统不可避免地受到信息获取技术的约束,例如自动提取多媒体数据(图形、视频流、声音流等)的内容特征具有技术上的困难,使得这方面的相关应用受到了很大限制。 (3) 混合推荐技术 ——如前所述,协同过滤和基于内容的推荐算法在投入实际运营的时候都有各自的缺陷,因此实际运营的推荐系统常将两种甚至多种推荐算法进行结合,即采用混合推荐算法。针对实际数据的研究显示这些混合推荐系统普遍具有比上述独立的推荐系统更好的准确率 。建立混合推荐系统的方法之一即是独立地实现协同过滤和基于内容的推荐算法,然后将两种推荐结果结合起来,利用预测打分的线性组合进行推荐 。又或者,只推荐某一时刻在某一个评价指标下表现更好的算法的结果。例如, Daily Learner 系统 就选择在某一时刻更可信的结果进行推荐,而文献 选择一个与用户过去的打分相一致的结果进行推荐。另外常见的方法是在一种推荐算法的框架中嵌入另外的算法作为某一个辅助部分。例如, Melville 等人 利用基于文本分析的方法在协同过滤系统中用户的打分向量上增加一个附加打分,附加分高的用户的信息优先推荐给其它用户; Aciar 等人 利用文本挖掘技术分析用户对产品的评论信息,提出基于知识和协同过滤的混合推荐系统。 除了上面三类方法以外,多种数据分析技术,如数据分类、数据聚类、 Bayesian 网络、关联规则、 K-means 方法、神经网络、线性回归、最大熵方法、云模型、多示例学习等等均被用于推荐系统,此处不再赘述。此外,用户的行为特征、个性化的领域知识等也被用于个性化推荐系统。 3.2 关于链路预测 链路预测 (Link Prediction) 问题是指通过对已知网络结构的分析,包括一些可能的节点的其他信息,来评估尚不相连的两个点之间产生链接的可能性,进而实现预测 。该问题具有重要的应用价值,并且可以对网络科学的理论研究,特别是网络演化规则和节点相似性指标的评判问题,起到重要的贡献。下面我们从实际应用和理论意义两个方面叙述。 很多生物网络,例如蛋白质相互作用网络和新陈代谢网络,节点之间是否存在链路,或者说是否存在相互作用,是需要通过大量实验结果进行推断。仅以蛋白质相互作用网络为例,酵母菌蛋白质之间 80% 的相互作用不为我们所知 ,而对于人类自身,我们知道的仅有可怜的 0.3% 。由于揭示这类网络中隐而未现的链接需要耗费高额的实验成本,如果能够在已知结构的基础上设计出足够精确的链路预测算法,再利用预测的结果指导试验,就有可能非常明显地降低试验成本并加快揭开这类网络真实面目的步伐!实际上,社会网络分析中也会遇到数据不全的问题,这时候链路预测同样可以作为准确分析社会网络结构的有力的辅助工具 。除了帮助分析数据缺失的网络,链路预测算法还可以用于分析演化网络。举例来说,近几年在线社会网络发展非常迅速 ,链路预测可以基于当前的网络结构去预测哪些现在尚未结交的用户“ 应该是朋友” ,并将此结果作为“ 朋友推荐” 发送给用户:如果预测足够准确,显然有助于提高相关网站在用户心目中的地位。另外,链路预测的思想和方法,还可以用于在已知部分节点类型的网络 (partially labeled networks) 中预测未标签节点的类型——这可以用于判断一篇学术论文的类型 或者判断一个手机用户是否产生了切换运营商 ( 例如从移动到联通 ) 的念头 ;以及用于纠正观察到的网络结构中可能存在的错误 ,因为很多构建生物网络的实验中存在暧昧不清甚至自相矛盾的数据 。 链路预测的研究可以从理论上帮助认识复杂网络演化的机制。针对同一个或者同一类网络,很多模型都提供了可能的网络演化机制 。由于刻画网络结构特征的统计量非常多,很难比较不同的机制孰优孰劣。链路预测机制有望为演化网络提供一个简单统一且较为公平的比较平台,从而大大推动复杂网络演化模型的理论研究。另外,如何刻画网络中节点的相似性也是一个重大的理论问题 ,这个问题和网络聚类等应用息息相关 。类似地,相似性的度量指标数不胜数,只有能够快速准确地评估某种相似性定义是否能够很好刻画一个给定网络节点间的关系,才能进一步研究网络特征对相似性指标选择的影响。在这个方面,链路预测可以起到核心技术的作用。链路预测问题本身也带来了有趣且有重要价值的理论问题,也就是通过构造网络系综并藉此利用最大似然估计的方法进行链路预测的可能性和可行性研究。这方面的研究对于链路预测本身以及复杂网络研究的理论基础的建立和完善,可以起到推动和借鉴的作用。 近几年,基于节点相似性的链路预测框架受到了广泛的关注,在该框架中,两个节点之间相似性 ( 或者相近性 ) 越大,就认为它们之间存在链接的可能性越大。尽管这个框架非常简单,但是相似性定义本身内涵丰富,它既可以是非常简单的共同邻居的个数,也可以是包含了复杂数学物理内容的诸如随机游走的平均通讯时间 或者矩阵森林数目 。因此这个简单的框架事实上提供了无穷无尽的可能性。 Liben-Nowell 和 Kleinberg 将相似性指标分为基于节点和基于路径的两类,并分析了若干指标对社会合作网络中链路预测的效果,他们发现,在仅考虑节点邻居信息的若干指标中, Adamic-Adar 参数 表现最好。周涛、吕琳媛和张翼成 在 6 种不同网络中比较了 9 种局部相似性指标在链路预测中的效果,并提出了两种新指标:资源分配指标 (resource allocation index) 和局部路径指标 (local path index) 。研究发现,新提出来的这两种指标具有明显好于包括 Adamic-Adar 参数在内的 9 种已知指标的预测能力。最近其他小组的研究结果显示,新提出来的相似性指标在进行群落划分和含权网络权重设置 的时候也比原有指标好。吕琳媛、金慈航和周涛 进一步在噪音强度可控的网络模型与真实网络中细致分析了局部路径指标的性能,发现这个指标具有与依赖于网络全局结构信息的指标,例如 Katz 参数 ,可匹敌的预测能力,甚至在噪声较大的情况下可以比 Katz 参数预测得更加准确。考虑到局部路径指标是一个计算量非常小的局部参数,其应用前景可观。刘伟平和吕琳媛 比较研究了一些基于随机游走的相似性指标,并提出了两种局部随机游走指标,他们发现有限步的随机游走反而可以给出超过全局收敛后的预测精度,而最优的游走步数受到网络平均距离的强烈影响。另外, Huang 等人的实验结果暗示 ,在得到节点间的直接相似性后,利用协同过滤技术对相似性指标进行一轮加权处理,一般而言可以得到更好的结果。 最近,最大似然估计方法被尝试应用于链路预测中。 Clauset, Moore 和 Newman 认为很多网络的连接可以看作某种内在的层次结构的反映,基于此,他们提出了一种最大似然估计的算法进行链路预测,这种方法在处理具有明显层次组织的网络,如恐怖袭击网络和草原食物链,具有较好的精确度。 Guimera 和 Sales-Pardo 假设我们观察到的网络是一个随机分块模型 (Stochastic Block Model) 的一次实现,在该模型中节点被分作若干的集合,两个节点间连接的概率只和相应的集合有关。 Guimera 和 Sales-Pardo 提出了基于随机分块模型的最大似然估计方法,将其用于链路预测,可以得到比 Clauset, Moore 和 Newman 更好的结果。 另外一个需要特别注意的趋势,是随着一些原来从事复杂网络研究的学者对链路预测问题的关注,很多复杂网络,特别是社会网络分析中遇到的理论与方法被应用到链路预测中。例如吕琳媛和周涛 发现在针对某些含权网络进行链路预测的时候,权重很小的边反而起到了比高权重边更大的作用,这与社会网络研究中广为人知的“ 弱连接理论” 有深刻的关联。 Leskovec, Huttenlocher 和 Kleinberg 则注意到了近期“ 社会平衡理论” 的定量化研究成果 ,并在此启发下设计了可以预测网络中的正负(友敌)链接的算法。 我们注意到一方面受阻于网络节点外在属性在获取上的难度,另一方面受益于复杂网络研究的快速发展,链路预测问题的主要研究热点逐渐从依赖于节点属性的方法转移到只利用网络结构信息的方法上。显然,后者在理论上也更优美简洁。不过,这个方面的研究主要集中在社会网络上,尚欠对于大量算法在各种不同网络中的预测能力的系统分析和总结,另外,目前还没有算法性能和网络结构特征之间关系的较深入的研究。对于比较复杂的网络,例如含权网络、有向网络和多部分网络的讨论虽然有,但非常少,也不系统。相关的研究应该是近几年该方向的主流。 网络系综理论和与之关联的网络熵的概念以及最大似然估计方法有望推动形成复杂网络的统计力学理论基础。这方面研究存在的一个问题是熵的精确计算复杂性非常大,对于大规模网络而言往往不能实现。最近的一些链路预测算法已经应用了网络系综和最大似然的概念,但是这些算法计算复杂性很大,精确性也不是很高 ,例如文献 的方法目前只能处理数千节点的网络,且其预测效果对于不具有明确层次结构的网络并不好。我们认为以下两个问题应该是目前国际上相关研究小组比较关注的:一是如何以网络系综理论为基础,建立网络链路预测的理论框架,并产生对实际预测有指导作用的理论结论,例如通过对网络结构的统计分析估算可预测的极限,指导选择不同的预测方法等等;二是如何设计高效的算法来处理大规模网络的链路预测问题。网络系综理论和链路预测的深度结合很可能成为西北大学研究组最近关注的焦点。 最近十年,复杂网络研究在很多科学分支,包括物理、生物、计算机等等掀起高潮 ,其中相当一部分研究立足于揭示网络演化的内在驱动因素。仅以无标度网络 (scale-free networks) 为例 ,已经报道的可以产生幂律度分布的机制就包括了富者愈富 (rich-get-richer) 机制 ,好者变富 (good-get-richer) 机制 ,优化设计 (optimal design) 驱动 ,哈密顿动力学 (Hamiltonian dynamics) 驱动 ,聚生 (merging and regeneration) 机制 ,稳定性限制 (stability constraints) 驱动 ,等等。可是,由于刻画网络结构特征的统计指标非常多,很难比较和判定什么样的机制能够更好再现真实网络的生长特性。利用链路预测有望建立简单的比较平台,能够在知道目标网络演化情况的基础上量化比较各种不同机制对于真实生长行为的预测能力,从而可以大大推动复杂网络演化机制的相关研究。 Guimera 和 Sales-Pardo 在提到网络重建 (network reconstruction) 的时候已经表达了相近的思想,但是这方面的研究尚未见报道。尽管有论文讨论了如何将链路预测的方法和思想与一些应用问题,例如部分标号网络的节点类型预测 与信息推荐问题 ,相联系的可能性与方法,但是,目前尚缺乏对于大规模真实数据在应用层面的深入分析和研究。这方面的研究不仅仅具有实用价值,而且有助于揭示链路预测这个问题本身存在的优势与局限性。 A.-L. Barabási, Nature 435, (2005) 207. J.G. Oliveira, A.-L. Barabási, Nature 437, (2005) 1251. V. Plerou, P. Gopikrishnan, L. A. N. Amaral, X. Gabaix, and H. E. Stanley, Phys. Rev. E 62, (2000) 3023(R). J. Masoliver, and M. Montero, Phys. Rev. E 67, (2003) 021112. M. Politi, and E. Scalas, Physica A 2008, 387 2025. Z. Q. Jiang, et al, Physica A, 387 (2008) 5818. Z. Dezs ő , E. Almaas1, A. Lukács, B. Rácz, I. Szakadát, and A.-L. Barabási, Phys. Rev. E 73, (2006) 066132. B. Goncalves, and J. J. Ramasco, Phys. Rev. E 78 , (2008) 026123. T. Zhou, H. A.-T. Kiet, B.J. Kim, and B.-H. Wang, Europhys. Lett. 82, (2008) 28002. H. B. Hu, and D. Y. Han, Physica A 387, (2008) 5916. J. Candia, M.C. González, P. Wang, T. Schoenhar, G. Madey and A.-L. Barabási, J. Phys. A: Math. Theor. 41 (2008) 224015. T. Henderson, and S. Nhatti, Proc. 9th ACM Int. Conf. on Multimetia, pp. 212, ACM Press 2001. A. Grabowski, N. Kruszewska, and R. A. Kosiński, Phys. Rev. E 78, (2008) 066110. S. K. Baek, T. Y. Kim, and B. J. Kim, Physica A 387, (2008) 3660. K.-I. Goh, and A.-L. Barabási, Europhys. Lett. 81, (2008) 48002. A. Vázquez, Phys. Rev. Lett. 95, (2005) 248710. A. Vázquez, J. G. Oliveira, Z. Dezs ő , K.-I. Goh, I. Kondor, and A.-L. Barabási, Phys. Rev. E 73, (2006) 036127. A. Gabrielli and G. Caldarelli, Phys. Rev. Lett. 98, (2007) 208701. J.G. Oliveira, and A. Vázquez, Physica A 388, (2009) 187. A. Vazquez, Physica A 373 (2006) 747. A. Cesar, R. Hidalgo, Physica A 369 (2006) 877. R. Dean Malmgren, Daniel B. Stouffer, A. E. Motter and L. A. N. Amaral, Proc. Natl. Acad. Sci. USA 105, (2008) 18153. A. Vázquez, B. Rácz, A. Lukács, and A.-L. Barabási, Phys. Rev. Lett. 98, (2007) 158702. D. Brockmann, L. Hufnagel, and T. Geisel, Nature 439, (2006) 462. M. C. Gonzalez, C. A. Hidalgo, and A. -L. Barabasi, Nature 453, (2008) 779. L. Rhee, M. Shin, S. Hong, K. Lee K, and S. Chong, On the Levy-walk nature of human mobility, Proc. 27th IEEE Conf. Comput. Commun (INFCOM, IEEE Press, 2008). F. Bartumeus, F. Peters, S.Pueyo, C. Marrase, and J. Catalan, Proc. Natl. Acad. Sci. USA 100, (2003) 12771. G. Ramos-Fernandez, J. L. Mateos, O. Miramontes, G. Cocho, H. Larralde, and B. Ayala-Orozco, Behav. Ecol. Sociobiol. 55, (2004) 223. D. W. Sims, E. J. Southall, N. E. Humphries, G. C. Hays, C. J. A. Bradshaw, J. W. Pitchford, A. James, M. Z. Ahmed, A. S. Brierley, M. A. Hindell, D. Morritt, M. K. Musyl, D. Righton, E. L. C. Shepard, V. J. Wearmouth, R. P. Wilson, M. J. Witt, and J. D. Metcalfe, Nature 451, (2008) 1098. G. M. Viswanathan, S. V. Buldyrev, S. Havlin, M. G. E. da Luzk, E. P. Raposok, and H. E. Stanley, Nature 401, (1999) 911. F. Bartumeus, J. Catalan, U. L. Fulco, M. L. Lyra, and G. M. Viswanathan, Phys. Rev. Lett. 88, (2002) 097901. A. M. Reynolds, Phys. Rev. E 72, (2005) 041928. M. C. Santos, D. Boyer, O. Miramontes, G. M. Viswanathan, E. P. Raposo, J. L. Mateos, and M. G. E. da Luz, Phys. Rev. E 75, (2007) 061114. 周涛 , 在线电影点播中的人类动力学模式 , 复杂系统与复杂性科学 5(1), (2008) 1. W.Hong, X.-P. Han, T. Zhou, and B.-H. Wang, Chin. Phys. Lett. 26, (2009) 028902. 李楠楠,张宁,周涛 , 人类通信模式中基于时间统计的实证研究 , 复杂系统与复杂性科学 5(3), (2008) 43. N.-N. Li, N. Zhang, Tao Zhou, Physica A 387, (2008) 6391. 韩筱璞,周涛,汪秉宏 , 基于自适应调节的人类动力学模型 , 复杂系统与复杂性科学 4(4), (2007) 1. X.-P. Han, T. Zhou, and B.-H. Wang, New J. Phys., 10 (2008) 073010. 李楠楠,周涛,张宁 , 人类动力学基本概念与实证分析 , 复杂系统与复杂性科学 5(2), (2008), 15. 郭进利,周涛,李季明,张宁,《人类动力学模型》,上海系统科学出版社,香港 2008. T. Zhou, X.-P. Han, B.-H. Wang, “Towards the understanding of human dynamics”, pp. 207-233 (M. Burguete and L. Lam eds., “Science Matters – Humanities as Complex Systems”, World Scientific Publishing, Singapore 2008). A. Vázquez, B. Rácz, A. Lukács, A.-L. Barabási, Impact of Non-Poissonian Activity Patterns on Spreading Processes, Phys. Rev. Lett. 98, 158702 (2007). D. H. Zanette, Dynamics of rumor propagation on small-world networks, Phy. Rev. E 65, 041908(2002). M. Karsai, M. Kivel, R. K. Pan, K. Kaski, J. Kertész, A.-L. Barabási, J. Saramki , Small But Slow World: How Network Topology and Burstiness Slow Down Spreading Z. Yang, A. Cui, T. Zhou, Impact of Heterogeneous Human Activities on Epidemic Spreading S. Ni, W. Weng, Impact of ttravel patterns on epidemic dynamics in heterogeneous spatial metapopulation networks, Phys. Rev. E 79,016111(2009). L. Hufnagel, D. Brockmann, T. Geisel, Forecast and control of epidemics in a globalized world, Proc. Natl. Acad. Sci. U.S.A. 101,15124(2004). V. Colizza, A. Barrat, M. Barthelemy, A. Vespignani, The role of the airline transportation network in the prediction and predictability of global epidemics, Proc. Natl. Acad. Sci. U.S.A. 103,2015(2006). R. Albert and A.-L. Barabasi, Statistical mechanics of complex networks, Rev. Mod. Phys. 74, 47-97 (2002). S. Boccaletti, V. Latora, Y. Moreno,M. Chavez, D.-U. Hwang, Complex networks: structure and dynamics, Phys. Rep. 424, 175-308 (2006). H. Jeong, S.P. Mason, A.-L. Barabasi and Z.N. Oltvai, Lethality and centrality in protein networks±, Nature 411, 41 (2001); SH. Jeong, B. Tomber, R. Albert, Z.N. Oltvai, and A.-L. Barabasi, The large-scale organization of metabolic networks±, Nature 407, 651 (2000); A.-L. Barabasi, R. Albert, H. Jeong, and G. Bianconi, ±Power-Law Distribution of the World Wide Web±, Science 287, 2115a (2000). D.J.Watts and S.H. Strogatz, Collective dynamics of small-world networks, Nature 393, 440 (1998). A.-L. Barabasi and R. Albert, Emergence of scaling in random networks, J.W. Scannell, G.A.P.C. Burns, C.C. Hilgetag, M.A. O’Neil, and M.P. Young, The connectional organization of the cortico-thalamic system of the cat, Cereb. Cortex 9 (1999) 277-299. O. Sporns, R. Chialvo, M. Kaiser and C.C. Hilgetag, Organization, development and function of complex brain networks. Trends Cogn. Sci. 8, 418 (2004). A. E. Motter, M. A. Matias, J. Kurths and E. Ott(eds), Dynamics on Complex Networks and Applications Phys. D 224 (1-2), 1-214 (2006). A.K. Engel, P. Fries and W. Singer, Dynamic predictions: oscillations and synchrony in top-down processing, Nat. Rev. Neurosci 2, 705 (2001). P. Fries, Amechanismfor cognitive dynamics: neuronal communication through neuronal coherence, Trends Cogn. Sci. 9, 474 (2005). A. Arenas, A. Diaz-Guilera, J. Kurths, Y. Moreno, and C.S. Zhou, Synchronization in complex networks (review article), Physics Reports (in press). Hiroshi Kori and Alexander S. Mikhailov, Entrainment of randomly coupled oscillator networks by a pacemaker Phys. Rev. Lett, Vol 93, 254101 (2004); Hiroshi Kori and Alexander S. Mikhailov, Strong effects of network architecture in the entrainment of coupled oscillator systems Phys. Rev. E, Vol 74, 066115 (2006); Istvan Z. Kiss, Craig Rusin, Hiroshi Kori, John L. Hudson, Engineering Complex Dynamical Structures: Sequential Patterns and Desynchronization, Science 316, 1886-1889 (2007) M. Barahona and L. M. Pecora, Synchronization in small-world systems, Phys. Rev. Lett. 89 054101 (2002); T. Nishikawa, A.E. Motter, Y.-C. Lai, and F.C. Hoppensteadt, Heterogeneity in oscillator networks: are smaller world easier to synchronize?, Phys. Rev. Lett. 91 , 014101 (2003). D.-U. Hwang, M. Chavez, A. Amann, and S. Boccaletti, Synchronization in Complex Networks with Age Ordering, Phys. Rev. Lett. 94, 138701 (2005); M. Chavez, D.-U. Hwang,1 A. Amann, H. G. E. Hentschel, and S. Boccaletti, Synchronization is Enhanced in Weighted Complex Networks, Phys. Rev. Lett. 94, 218701 (2005); M. Zhao, T. Zhou, B.H. Wang, and W.X. Wang, Enhanced synchronizability by structural perturbations, Phys Rev. E., 72, 057102 (2005). Y. VF. Lu, M. Zhao, T. Zhou, and B. H. Wang, Enhance synchronizability via age-based coupling, Phys. Rev. E 76, 057103 (2007). L. Donetti, P.I. Hurtado and M.A. Munoz, Entangled Networks, Synchronization, and Optimal Network Topology, Phys. Rev. lett. 95, 188701 (2005). M.E.J. Newman, and M. Girvan, Finding and evaluating community structure in networks, Phys. Rev. E. 69 (2004) 026113; G. Palla et al, Uncovering the overlapping community structure of complex networks in nature and society, Nature 435 (2005) 814-818; L. Danon, A. Diaz-Aguilera, J. Duch and A. Arenas, Comparing community structure identification, J. Stat. Mechs. P09008 (2005); I.J. Farkas1,, D. Abel1, G. Palla1, and T. Vicsek, Weighted network modules, New. J. Phys. 9, 180 (2007). L. Huang, K.Park, Y.-C. Lai, L. Yang and K. Yang, Abnormal Synchronization in Complex Clustered Networks, Phys. Rev. Lett. 97, 164101 (2006). J. Gomez-Gardebes, Y. Moreno, and A. Arenas,Synchronization Reveals Topological Scales in Complex Networks, Phys. Rev. Lett. 98, 034101 (2007); J. Gomez-Gardebes, Yamir Moreno, and Alex Arenas, Synchronizability determined by coupling strengths and topology on complex networks, Phys. Rev. E. 75, 066106 (2007): S. Boccaletti, M. Ivanchenko, V. Latora, A. Pluchino, and A. Rapisarda, Detecting complex network modularity by dynamical clustering, Phys. Rev. E. 75, 045102 (2007); E. Oh, K. Rho, H. Hong, and B. Kahng, Modular synchronization in complex networks, Phys. Rev. E 72, 047101 (2005); E. Oh, C. Choi, B. Kahng, and D. Kim, Modular synchronization in complex networks with a gauge Kuramoto model, Europhys. Lett. 83, 68003 (2008). J. Gomez-Gardebes, Yamir Moreno, and Alex Arenas, Paths to Synchronization on Complex Networks, Phys. Rev. Lett. 98, 034101 (2007). J. Ito and K. Kaneko, Spontaneous Structure Formation in a Network of Chaotic Units with Variable Connection Strengths, Phys. Rev. Lett. 88, 028701 (2002); T. Gross, D.L.C Dommar, B. Blasius, Epidemic dynamics on an adaptive network. Phys. Rev. Let, 96 , 208701 (2006); C.S. Zhou, J. Kurths, Dynamical weights and enhanced synchronization in adaptive complex networks. Phys. Rev. Lett.96, 164102 (2006). O. Sporns, R. Chialvo, M. Kaiser and C.C. Hilgetag, Organization, development and function of complex brain networks. Trends Cogn. Sci. 8, 418 (2004). D.S. Bassett and E. Bullmore, Small-world Brain Networks, The Neuroscientist 12,521-523 (2006). E. Bullmore and O. Sporns, Complex brain networks: graph theoretical analysis of the structural and functional systems, Nature Reviews (Neuroscience), 10, 186-198 (2009); O. Sporns and J.D. Zwi, The small world of the cerebral cortex, Neuroinformatics 2, 145-162 (2004). M. Kaiser, and C.C Hilgetag, Edge vulnerability in neural and metabolic networks, Biol Cybernetics 90, 311 - 317 (2004). C.J. Stam, Functional connectivity patterns of human magnetoencephalographic recordings: a small-world network? Neurosci. Lett. 355 (2004) 25-28. C.J. Stam and E.A. de Bruin, Scale-free dynamics of global functional connectivity in the human brain, Hum. Brain Mapp. 22 (2004) 97-109. R. Salvador, J. Suckling,M.R. Coleman, J.D. Pickard, D.Menon, and E. Bullmore, Neurophysiological architecture of functional magnetic resonance images of human brain, Cereb. Cortex 15 (2005) 1332-1342. M.D. Fox, A.Z. Snyder, J.L. Vincent, M. Corbetta, D.C. Essen, and M.E. Raichle, Proc. Natl. Acad. Sci. U.S.A. 102, 9673-9678 (2006). A.K. Engel, P. Fries and W. Singer, Dynamic predictions: oscillations and synchrony in topdown processing, Nat. Rev. Neurosci 2, 705 (2001). T. Womelsdorf, J.M. Schoffelen, R. Oostenveld, W. Singer, R. Desimone, A.K. Engel, and P. Fries, Modulation of neuronal interactions through neuronal synchronization, Science, 316, 1609 (2007); Y.B. Saalmann, I.N. Pigarev, and T.R. Vidyasagar, Science, 316, 1612 (2007); T.J. Buschman and E.K. Miller, Top-down versus bottom-up control of attention in the prefrontal and posterior parietal cortices, Science 316, 1860 (2007). A. Arenas, A. Diaz-Guilera, J. Kurths, Y. Moreno, and C.S. Zhou, Synchronization in complex networks (review article), Physics Reports (in press). Hiroshi Kori and Alexander S. Mikhailov, Entrainment of randomly coupled oscillator networks by a pacemaker, Phys. Rev. Lett, Vol 93, 254101 (2004); Hiroshi Kori and Alexander S. Mikhailov, Strong effects of network architecture in the entrainment of coupled oscillator systems Phys. Rev. E, Vol 74, 066115 (2006); Istvan Z. Kiss, Craig Rusin, Hiroshi Kori, John L. Hudson, Engineering Complex Dynamical Structures: Sequential Patterns and Desynchronization, Science 316, 1886-1889 (2007) Zhang G.-Q., Zhang G.-Q., Yang Q.-F., et al., Evolution of the Internet and its cores. New Journal of Physics , 2008, 10:123027 Broder A., Kumar R., Moghoul F., et al., Graph structure in the Web. Computer Networks , 2000, 33:309-320 Adomavicius G., Tuzhilin A., Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions. IEEE Trans. on Knowledge and Data Engineering , 2005, 17(6): 734-749 Resnick P., Varian H. R., Recommender Systems. Communications of the ACM , 1997, 40(3): 56-58 Herlocker J., Konstan J., Terveen L., et al., Evaluating Collaborative Filtering Recommender Systems. ACM Trans. on Information Systems , 2004, 22:5-53 Rich E., User Modeling via Stereotypes. Cognitive Science , 1979, 3(4): 329-354 Goldberg D., Nichols D., Oki B. M., et al., Using Collaborative Filtering to Weave an Information Tapestry. Comm. ACM , 1992, 35(12): 61-70 Konstan J. A., Miller B. N., Maltz D., et al., GroupLens: Applying Collaborative Filtering to Usenet News. Comm. ACM , 1997, 40(3):77-87 Shardanand U., Maes P., Social Information Filtering: Algorithms for Automating ‘Word of Mouth’. Proc. Human Factors in Computing Systems . Denver, 1995 : 210-217 Linden G., Smith B., York J., Amazon.com Recommendations: Item-to-Item Collaborative Filtering. IEEE Internet Computing , 2003, 7(1):76-80 Belkin N., Croft B., Information Filtering and Information Retrieval. Comm. ACM , 1992, 35(12): 29-37 Balabanovic M., Shoham Y., Fab: Content-Based, Collaborative Recommendation. Comm. ACM , 1997, 40(3): 66-72 Pazzani M., Billsus D., Learning and Revising User Profiles: The Identification of Interesting Web Sites. Machine Learning , 1997, 27: 313-331 Somlo G., Howe A., Adaptive Lightweight Text Filtering. Proc. Lecture Notes in Computer Science , 2001, 2189: 319-329 Zhang Y., Callan J., Minka T., Novelty and Redundancy Detection in Adaptive Filtering. Proc. 25th Ann. Int’l ACM SIGIR Conf. , Tampere, 2002: 81-88 Chang Y. I., Shen J. H., Chen T. I., A data mining-based method for the incremental update of supporting personalized information filtering . Journal of information science and engineering ,2008, 24(1): 129-142 Degemmis M., Lops P., Semeraro G., A content-collaborative recommender that exploits WordNet-based user profiles for neighborhood formation. User modeling and user-adapted interaction ,2007, 17(3): 217-255 高滢 , 齐红 , 刘杰 , 刘大有 . 结合似然关系模型和用户等级的协同过滤推荐算法 . 计算机研究与发展 ,2007,44(6):1044~1052 Yoshii K., Goto M., Komatani K., et al., An efficient hybrid music recommender system using an incrementally trainable probabilistic generative model . IEEE Transactions on audio speech and language processing , 2008, 16(2): 435-447 Girardi R., Marinho L. B., A domain model of Web recommender systems based on usage mining and collaborative filtering . Requirements engineering ,2007, 12(1): 23-40 Pazzani M., A Framework for Collaborative, Con4ent-Based,and Demographic Filtering. Artificia l Intelligence Rev. , 1999,13(5-6): 393-408 Billsus D. 눬 Pazzani M., User Modeling for Adaptive News Access. User Modelinc and Qser-Adapted Interaction , 2000, 10(2-3): 147-180 Tran T., Cohen R., Hybrid Recommender Systems for Electronic Commerce. Proc. Knowledge-Based Electronic Markets , Menlo Park, 2000: 78-83 Melville P., Mooney R. J., Nagarajan R. Content-Boosted Collaborative Filtering for Improved Recommendations. Proc. 18 th Nat’l Conf. Artificial Intelligence, Edmonton , 2002: 187-192 Aciar S., Zhang D., Simoff S., et al., Informed Recommender: Basing Recommendations on Consumer Product Reviews. IEEE Intelligent systems , 2007, 22(3): 39-47 L. Getoor, C. P. Diehl, Link Mining: A Survey, ACM SIGKDD Explorations Newsletter 7 (2005) 3. H. Yu, et al., High-quality binary protein interaction map of the yeast interactome network, Science 322 (2008) 104. M. P. H. Stumpf, T. Thorne, E. de Silva, R. Stewart, H. J. An, M. Lappe, C. Wiuf, Estimating the size of the human interactome, Proc. Natl. Sci. Acad. U.S.A. 105 (2008) 6959. L. A. N. Amaral, A truer measure of our ignorance, Proc. Natl. Sci. Acad. U.S.A. 105 (2008) 6795. L. Schafer, J. W. Graham, Missing data: Our view of the state of the art, Psychol. Methods 7 (2002) 147. G. Kossinets, Effects of missing data in social networks, Social Networks 28 (2006) 247. R. Kumar, J. Novak, A. Tomkins, Structure and evolution of online social networks, Proc. ACM SIGKDD 2006, ACM Press, New York, 2006, p. 611. B. Gallagher, H. Tong, T. Eliassi-Rad, C. Falousos, Using ghost edges for classification in sparselylabelednetworks, Proc. ACM SIGKDD 2008, ACM Press, New York, 2008, p. 256. K. Dasgupta, R. Singh, B. Viswanathan, D. Chakraborty, S. Mukherjea, A. A. Nanavati, A. Joshi, Social Ties and their Relevance to Churn in Mobile Telecom Networks, Proc. EDBT’08, ACM Press, New York, 2008, p. 668. R. Guimera, M. Sales-Pardo, Missing and spurious interactions and the reconstruction of complex networks, Proc. Natl. Sci. Acad. U.S.A. 106 (2009) 22073. C. von Mering, R. Krause, B. Snel, M. Cornell, S. G. Oliver, S. Field, P. Bork, Comparative assessment of large-scale data sets of protein-protein interactions, Nature 417 (2002) 399. R. Albert, A.-L. Barabasi, Statisrical Mechanics of Complex Networks, Rev. Mod. Phys. 74 (2002) 47. S. N. Dorogovtsev, J. F. F.Mendes, Evolution of networks, Adv. Phys. 51 (2002) 1079. E. A. Leicht, P. Holme, M. E. J. Newman, Vertex similarity in networks, Phys. Rev. E 73 (2006) 026120. Y. Pan, D.-H. Li, J.-G. Liu, J.-Z. Liang, Detecting community structure in complex networks via node similarity, Physica A (to be published). F. Fouss, A. Pirotte, J.-M. Renders, M. Saerens, Random-walk computation of similarities between nodes of a graph with application to collaborative recommendation, IEEE Trans. Knowl. Data. Eng. 19 (2007) 355. P. Chebotarev, E. Shamis, The matrix-forest theorem and measuring relations in small social groups, Automat. Remote Contr. 58 (1997) 1505. D. Liben-Nowell, J. Kleinberg, The Link-Prediction Problem for Social Networks, J. Am. Soc. Inform. Sci. Technol. 58 (2007) 1019. L. A. Adamic, E. Adar, Friends and neighbors on the web, Social Networks 25 (2003) 211. T. Zhou, L. Lü, Y.-C. Zhang, Predicting missing links via local information, Eur. Phys. J. B 71 (2009) 623. Y.-L. Wang, T. Zhou, J.-J. Shi, J. Wang, D.-R. He, Emipirical analysis of dependence between stations in Chinese railway network, Physica A 388 (2009) 2949. L. Lü, C.-H. Jin, T. Zhou, Similarity index based on local paths for link prediction of complex networks, Phys. Rev.E 80 (2009) 046122. L. Katz, A new status index derived from sociometric analysis, Psychometrika 18 (1953) 39. W.-P. Liu, L. Lü, Link Prediction Based on Local Random Walk, Europhys. Lett. (to be published). Z. Huang, X. Li, H. Chen, Link prediction approach to collaborative filtering, Proc. 5th ACM/IEEE-CS Joint Conf. Digital Libraries, ACM Press, New York, 2005. A. Clauset, C. Moore, M. E. J. Newman, Hierarchical structure and the prediction of missing links in networks, Nature 453 (2008) 98. P. W. Holland, K. B. Laskey, S. Leinhard, Stochastic blockmodels: First steps, Social Networks 5 (1983) 109. L. Lü, T. Zhou, Link Prediction in Weighted Networks: The Role of Weak Ties, Europhys. Lett. 89 (2010) 18001. M. S. Granovetter, The strength of weak ties, Am. J. Sociology 78 (1973) 1360. J. Leskovec, D. Huttenlocher, J. Kleinberg, Predicting Positive and Negative Links in Online Social Networks, Proc. WWW 2010, ACM, New York, 2010. T. Antal, P. Krapivsky, S. Redner, Dynamics of social balance on networks, Phys. Rev. E 72 (2005) 036121. S. Marvel, S. Strogatz, J. Kleinberg, Energy landscape of social balance, Phys. Rev. Lett. 103 (2009) 198701. A.-L. Barabasi, Scale-Free Networks: A Decade and Beyond, Science 325 (2009) 412. G. Caldarelli, Scale-Free Networks: Complex webs in nature and technology, Oxford Press, New York, 2007. A.-L. Barabasi, R. Albert, Emergence of scaling in random networks, Science 286 (1999) 509. D. Garlaschelli, A. Capocci, G. Caldarelli, Self-organized network evolution coupled to extremal dynamics, Nat. Phys. 3 (2007) 813. S. Valverde, R. F. Cancho, R. V. Sole, Scale-free networks from optimal design, Europhys. Lett. 60 (2002) 512. M. Baiesi, S. S. Manna, Scale-free networks from a Hamiltonian dynamics, Phys. Rev. E 68 (2003) 047103. B. J. Kim, A. Trusina, P. Minnhagen, K. Sneppen, Self organized scale-free networks from merging and regeneration, Eur. Phys. J. B 43 (2005) 369. J. I. Perotti, O. V. Billoni, F. A. Tamarit, D. R. Chialvo, S. A. Cannas, Emergent self-organized complex network topology out of stability constraints, Phys. Rev. Lett. 103 (2009) 108701. P. Sen, G. Namata, M. Bilgic, L. Getoor, B. Gallagher, T. Eliassi-Rad, Collective classification in network data, AI Magazine 29 (2008) 93. T. Zhou, Statistical Mechanics of Information Systems: Information Filtering on Complex Networks, Ph. D. Thesis, University of Fribourg, 2010. Statistical Physics Research for Human Behaviors, Complex Networks, and Information Mining Bing-Hong Wang 1 ) , 2 ) , *) , Tao Zhou 3 ) , *) , and Chang-Song Zhou 4 ) 1 ) Institute of Theoretical Physics and Nonlinear Science Center , Department of Modern Physics, University of Science and Technology of China , Hefei, 230026 2 ) Complex System Science Center, University of Shanghai for Science and Technology, and Shanghai Academy for System Science, Shanghai, 200093 3 ) The Center of Web Science, University of Electro Science and Technology of China, Chengdu, 610054 4 ) Department of Physics, Hong Kong Baptist University *) Corresponding Author : bhwang@ustc.edu . cn , zhutouster@gmail.com ; zhutou@ustc.edu ; We are being in a great era for the big innovation of statistical physics. Many important complex systems ( including life, economy and social system; the Internet, the human behavior, the traffic flow in cities, the social relation network, and the cerebrum neural network etc. ) are waiting urgently for developing innovative research technique of statistical physics, and for new understanding and deep exploration based on the unifying method to carry on the real diagnosis statistics and the theoretical model analysis both. Based on the massive real diagnosis statistics and analysis, unifying the effective dynamics model, focusing on the rule and characteristics of human behavior, the interaction among the social individuals, the dynamical evolution of the nervous system; the effective recommendation for information and the impactful forecasting of the network evolution; and so many other important questions, we suggest carry on the all directional statistical physics theoretical exploration for complex systems and the deep excavation of all kinds of basic mechanisms and the rules to determine the evolutionary process of the complex systems from the following three aspects: (1) the human behavior's statistical property; (2) the complex network synchronization and the complex neural network; and (3) the information mining and the complex network link forecasting.
个人分类: 统计物理复杂系统研究进展|10851 次阅读|3 个评论
人类行为动力学研究
bhwangustc 2010-9-14 16:00
此文拟送《复杂系统与复杂性科学》专刊发表 中国科技大学的人类行为动力学研究 韩筱璞 1 汪秉宏 1 , 2 周涛 1,3 1: 中国科学技术大学近代物理系,合肥; 2: 上海理工大学复杂系统科学研究中心,上海 3: 电子科学技术大学互联网研究中心,成都 摘要:近年来,对人类行为的特性统计显示出了多种非平庸的普遍特征。其中之一是在对时间行为和空间运动行为的统计中广泛发现了满足幂律分布的统计量。我们对于各种人类行为中的统计特性进行了广泛的经验研究,发现了多种形式的越来越多的经验性证据表明许多人类行为的事件之间的时间间隔分布普遍存在宽尾特征。同时,针对对各种人类行为中的非泊松时间行为特性和空间运动特性的动力学机制,我们还进行了广泛的模型研究,发现了自适应兴趣、层次性交通网络影响等多种影响人类行为特性的基本机制。 1 、前言 探索人类的各种行为的统计特性,是探索自然界、认知人类自身的一个重要方面,对于研究经济、心理和众多社会学类学科有着重要的意义。在研究涉及人类行为特性的问题时,一个常常采用的传统近似是,把人的行为简化为可以使用泊松过程描述的稳态随机过程。这种假设导致的一个推论是人的行为的时间统计特征是较为均匀的,两个相继行为之间的时间间隔的偏离其平均值很多的概率很小。但是, Barab si 通过对用户电子邮件和普通邮件的发送与回复行为的时间间隔的实际统计,展示了与此截然不同的特性 :人类行为同时具有长时间的静默与短期的高频率爆发,相邻两个事件的时间间隔分布存在满足反比幂函数的胖尾特性。这些行为的统计特性不能用传统的泊松过程进行描述,说明人类的个体行为可能存在复杂的动力学机制。随即研究者对这一问题展开了极为广泛的实证探索。当前,人们的研究已经涉及到市场交易活动 、网站浏览 ,电影点播 ,欣赏网络音乐 ,手机通讯 ,在游戏及虚拟社区中的行为 ,计算机指令的使用行为 等等,普遍发现有类似的非泊松特性。这些现象显示出,时间统计的非泊松特性可能是在人类行为中普遍存在的一种现象。 V zquez 等曾将人类行为分为幂指数为 -1 和 -1.5 的两大普适类 ,然而近期的更为广泛的实证研究的发现已经大大突破了这两大普适类的范围 ,目前这种普适类的观点已经失去了其普遍性意义。除了时间间隔,一些人类行为时间间隔的相关性和其他一些统计特性也得到了研究者的注意。研究发现,相比于同样存在非泊松时间间隔特性的自然现象常常存在的正相关性 ,这些人类行为相邻时间间隔的相关性并不明显。最近的一些研究表明,这种人类行为缺少相关性的结论可能因自于所用相关函数 ,因此它仍然有待于更深入和更广泛的实证研究的确认,但是这项研究初步把人类行为和其他复杂系统中的行为特性放在同一框架下进行了的比较,暗示其中可能存在统一的深层机制。 人类动力学研究的一个重要方面是探索这种非泊松行为特征的动力学机制与来源。目前的一种重要的解释是基于任务队列理论的 ,它把人的各种日常行为视作处理一系列的任务,并根据日常生活经验,假设人们在处理这些任务的时候会进行优先级划分,首先处理高优先级者。该研究指出,这种具有优先权的行为模式是造成非泊松行为特征的重要原因。这种基于任务队列的理论模型可以相当合理地解释很多人类行为中的非泊松特性,例如电子邮件和普通邮件的发送等。任务队列理论也可以非常容易的推广到存在多个个体之间的社会交互的情况 。近年来一系列研究,使得基于排队论的社会交互模型已经成为了理解人类社会交互行为的一种基本建模范式。 尽管任务队列理论 模型在解释人类行为时间统计胖尾分布特征方面取得了很大的成功,但是 由于影响人类行为的因素是多种多样的, 还有很多的人类行为是 任务队列理论模型 所不适用的。 所以也有部分研究从不同于任务队列的方面出发,提出了多种非排队论模型。例如,人类行为中的记忆效应 ,行为的周期性和季节性对非泊松机制的影响 ,任务本身的关联 等等。近期的一种理论则从多重泊松分布的角度解释了人类的行为特性 。 人类动力学的另外一个重要的研究方面是在人类行为特性对社会系统的影响。目前国际上有部分工作研究了人类行为的非泊松特性对网络传播、通讯等动力学过程的影响。例如,发现相比于一般的泊松特性行为,非泊松特性可以给系统带来一些特殊性质,比如更加迅速的传播速度等 。相比于其他方面,目前这部分研究仍然相对较少。 近年来,人们也对人类活动的空间运动特性进行了大量的实证研究,发现其中也普遍存在有非泊松特性等复杂现象。 2006 年通过统计银行帐单传递 ,人们发现人类的旅行行程分布也存在接近于幂律的胖尾; Gonzalez 等通过统计移动电话用户的漫游过程 ,同样发现该分布同样具有无标度特性,与前面的结果基本一致。更为直接的基于 GPS 数据的统计结论 也支持人类行程分布中存在无标度特性。这些研究所发现的人类空间运动特性总体如下:首先,人类的空间行程分布是很不均匀的,其行程分布满足指数约为 -1.5 到 -1.7 的具有明显尾部截断的幂律分布,说明其远大于平均行程的长程运动的概率远高于传统的随机运动描述;其次,人类空间运动具有较明显的局域性,远离某个小区域的概率随时间的衰减较慢,这一特性显示出人类空间运动行为也不能使用 Levy 飞行进行描述,因为尽管 Levy 飞行具有较高的长程运动概率,但它不具有局域性;最后,对于个体而言,一般存在少数几个经常前往的地点,到不同地点的平均频率也满足幂律分布,而且具有明显的各向异性。而近期对手机用户的实证研究又指出,人类的日常出行活动具有较强的规则性和可预测性,与传统的基于随机行走的理解高度相悖 。此外,生物学观测也发现大量动物的运动具有类似的幂律形式的行程分布 。由于这种幂律形式的行程分布存在较高概率的远程运动,它无法通过经典的随机行走进行描述。虽然对于动物行为中的幂律行程分布已经从多个角度提出了多种模型解释 ,但是这些解释能在多大程度上适用于解释人类的这种行程分布模式的产生机制仍然是一个问题。同样,这种运动特性对社会动力学的影响也是一个非常引人关注的问题 。 人类动力学这一新兴领域已经成为当前国际复杂性研究的一个新兴热点,也引起了国内研究者的广泛注意。在实证方面,中国科学技术大学复杂系统课题组的周涛等人与韩国成均馆大学及瑞典皇家学院合作研究了电影点播中的人类行为模式以及与个体活动性之间的关系 ;洪伟等研究了人类短消息通讯中的时间间隔分布 ,陈冠雄等研究了 QICQ 用户行为的统计特征 ,发现了即时通讯中存在的多种无标度特性;王澎等探讨了博客写作与交互行为的统计特性 ;上海理工大学课题组的张宁、李楠楠和周涛合作分析了鲁迅、钱学森等名人的邮件通讯数据 ;上海交通大学的胡海波等人研究了网络在线音乐的收听行为 。在理论模型方面,中国科学技术大学的韩筱璞等提出可自适应调节的兴趣机制来解释人类行为的非泊松特性 ,还提出了层次性交通系统对空间运动行为的影响等 。北京师范大学的胡延庆等研究了人类空间运动行为中的优化效应 。此外,上海理工大学方面还发表了针对人类动力学的中文综述 ,上海理工大学的郭进利等和中国科学技术大学的周涛等人合作编写出版了专著《人类行为动力学模型》 ,中国科学技术大学的周涛、韩筱璞、汪秉宏也在世界科学出版社出版的专著《 Science Matters: Humanities as Complex Systems 》中撰写了关于人类动力学研究的一个专门章节 。在本文中,我们将对其中的部分研究结果进行详细介绍。 2 、实证统计研究 (1). 电影点播行为 中国科学技术大学的周涛等统计分析了在线电影网站 Netflix 的公开数据 。这一数据库包含了 17770 部电影和来自 447139 个用户的近 1 亿条点播记录。在不对用户进行区分的情况下,统计所有用户的电影点播时间间隔分布,如图 2.1 所示,这一分布具有指数为 -2.08 的幂律尾部。 考虑到在现实中用户点播电影的行为具有活跃程度的区别,部分用户具有更高的平均点播频率,为了考察用户的活跃程度对点播行为的影响,定义用户的活跃程度为在统计时间范围内该用户的单位时间内的平均点播次数,把所有用户按照活跃程度按照递减顺序排序,然后把这些排序后的用户依次分为 20 个所包含的用户数目基本相同的群体。统计发现,这 20 个群体的时间间隔分布都满足幂律,其幂指数变化范围从 -1.5 到 -2.7 ,指数绝对值与群体的平均活跃程度的关系如图 2.5 所示,两者呈现单调的非线性正相关关系。 图 2.1 .所有用户的时间间隔分布,为接近幂指数为 -2.08 的幂律。分布曲线中存在周期为一星期的波动,这一波动在电子邮件通讯行为中也曾被观察到。图引自文献 。 图 2.2 .幂指数和平均活跃程度之间的关系。图引自文献 。 (2). 短消息通讯行为 中国科学技术大学的洪伟等从多个不同的角度对用户发送短消息的行为特性进行了研究 。研究收集了多位用户的手机短消息通讯记录,重点分析了各个用户的相邻两次发生消息的时间间隔分布(如图 2.3 )、相邻两次完整对话的时间间隔分布和每次对话中发送消息数量分布(如图 2.4 )等。该项研究发现,在用户短消息发送行为中,广泛的存在有幂律特性。而且时间间隔分布的指数与发送频率之间存在明显相关。这一研究不仅涉及到用户行为的时间统计特性,还涉及到用户的联系强度等统计特性,揭示出非泊松特性在人类行为的多个层次上的广泛存在。 图 2.3. 八 个用户的短消息发送时间间隔分布。图引自文献 。 图 2.4. 其中四个用户的短消息会话长度(每次会话包含消息个数)分布。图引自文献 。 (3). QICQ 即时通讯用户信息发送行为统计特性 图 2.5. 五 个 QICQ 用户的消息发送时间间隔分布 , 图引自文献 。 中国科学技术大学的陈冠雄等探讨了 QICQ 用户的行为特性 ,不考虑区分通讯对象,对各个志愿者的相邻两次发送信息的时间间隔进行了统计,来获得即时通讯行为的整体的统计特征。如图 2.5 所示,这些用户的信息发送时间间隔都呈现为相类似的幂尾分布,通过简单拟合,发现其胖尾的幂指数介于 -2.0 到 -2.5 之间。此外,通过区分通讯对象,统计用户与其一个联系人之间的相邻两次通讯的时间间隔,还获得了用户与其具体联系人之间的时间统计行为斑图:与特定联系人之间的通讯时间间隔也都近似呈现为幂律分布,其幂指数在 -1.5 到 -3.0 之间。这些结果暗示,这种胖尾特性可能是即时通讯行为的共同统计特性,同时也揭示出人的即时通讯行为所具有的非泊松特性。 2. 时间统计特性模型研究 任务排队理论是当前研究人类动力学机制的一个主流思想,但是并不能涵盖一切人类行为。不同于排队理论,中国科学技术大学的韩筱璞等提出了自适应兴趣模型 ,来研究人类行为中的非泊松特性。在现实中,如果观察某个人所做的某种具体的事情,如玩游戏、看电影等,常常可以看到一种调节机制:即做完该事后,人会改变此后做该事的概率。比如,当一个人在很久没有玩游戏后,偶尔玩一次游戏常常会激起他的兴趣使得他玩游戏的频率增加,又如吃到一种很久没吃的食物会使人在短时间内对该食物产生很大兴趣,而如果该频率过高,他常常又会出现对这种行为的节制而使得频率下降。但是,这种调节的范围常常是非常宽的,最低频率和最高频率之间可能存在几个数量级的差别。基于这种机制,该模型假设:对某种行为,每做一次都会改变下一次做该事件的概率。考虑最简单的情况,即每次概率改变的比例是相同的。事件的时间间隔存在两个阈值,即间隔过小或过大都会改变做该事的概率变化的趋势:即如果两次事件的间隔过小,会使做该事的概率以固定的比例减小,反之使概率以相反的比例增大。 模型规则为:时间离散,在时步 t 某事件发生的概率为 r(t) ;每发生一次该事件, r(t) 要进行一次更新,更新规则为: r(t + 1) = a(t)r(t) ,其中, a(t) 只能取两个值:如果本次事件与上次的时间间隔小于或等于 T 1 ,则 a(t) = a 0 ;如果该时间间隔大于 T 2 ,则 a(t) = a 0 1 ;对于其他情况, a(t) = a(t 1) ;其中 T 1 、 T 2 为固定的正整数, a 0 为固定的参数,分别满足 T 1 T 2 , 0 a 0 1 。 根据以上规则,一般本次事件与上次的时间间隔小于或等于 T 1 的情况大多出现在当 r(t) 等于或者接近于 T 1 -1 时。因此, T 1 的取值决定了 r(t) 所能够达到的最高值;同样 T2 的取值决定了 r(t) 所能够达到的最小值在 T 2 -1 附近。 T 1 实际也表示了该模型最小有效的时间尺度,我们固定 T 1 = 1 。 图 3.1 .数值模拟所的时间间隔分布。左栏:固定 T 1 = 1 , a 0 = 0.5 , T 2 与时间间隔分布的关系;右栏:固定 T 2 = 10000 , T 1 = 1 , a0 与时间间隔分布的关系;数据由 100 次独立模拟,每次模拟 10000 个事件,取平均获得。图中虚线表示指数为 -1 的严格幂律。图引自文献 。 在数值模拟中,取 r(t) 的初始值固定为 1.0 。通过数值模拟,当 T 1 和 T 2 存在有三个数量级以上的差别时,可以生成接近幂律的时间间隔分布,幂指数为 -1 ;随着 T 2 的缩小,该分布逐渐偏离幂律趋向于指数,如图 3.1 左栏所示; 对于相同的 T 1 和 T 2 ,较大的 a 0 也会使得分布曲线偏离幂律,如图 3.1 右栏所示。这一结果显示出,人们对自身行为的适应性调节也是人类行为的非泊松特性的一个重要来源。 3. 空间统计特性模型研究 (1). 基于层次性交通网络模型 人类的空间运动高度收到现实的交通系统的影响和制约。 中国科学技术大学的研究者提出了基于层次性交通网络的人类 空间 运动模型 。现实中,因为行政区内的交通常常具有便利性,人的出行常常是这样的:如果一个人试图从属于某个中心城市的乡村(属于 A 城市辖区的 a1 小镇)到属于另一个城市的乡村(属于 B 城市辖区的 b2 小镇)去,那么他常常选择首先前往所属中心城市( A 城市),然后由 A 城市到目标所在中心城市( B 城市),再从 B 城市到达目标 b2 小镇在大多数情况下,这样的旅行方式常常最为便利。这样的旅行方式,使得交通系统具有 了 明显的层次性。 该模型即基于这种层次性的地理交通网络结构。在模型中,我们将所有的城市分为 若干 个级别。以一个 3 级结构为例,中心位置的城市为最高级城市( 1 级城市),整个区域被划分成 若干 个子区域,除了 1 级城市所在子区域,每个子区域的中心位置的城市定义为各个辖区的中心城市( 2 级城市)(中间区域的中心城市仍是该 1 级城市),同时在每个 2 级城市周围分布着 若干 个 3 级城市,同样 1 级城市周围也分布有 若干 个 3 级城市(相当于每个子区域又被分为 若干 个次级区域)。属于同一个高级城市的低级城市之间全连通,同时全都和该高级城市直接连接。但属于不同高级城市的低级城市之间没有连边。每个小区域内的 3 级城市之间是全连通的,同时也都和所属 2 级城市相连,而每个 2 级城市之间(同属该 1 级城市)也是全连通的,并也都和 1 级城市直接相连。 在这样的网络中,一个个体沿着该层次性网络的连边(而不是地理连边)进行随机行走。显然,该模型不允许直接进行跨子区域的运动,除非是处在该子区域的中心城市。因此,在该层次性网络上的随机行走具有这种特性:人要到达不从属于同一个中心城市的目的地时需要经过两者所从属的中心城市。一般情况下,这种特性是符合现 实中人们的旅行方式的。每一时步该个体所移动的空间距离 L ,被定义为该时步移动的初始城市到终点城市之间的几何距离。 L 的分布函数 p(L) ,就是该模型所主要关注的。 在现实中,中心城市往往有着较大的城市规模和较多的人口,一般对于居住下属城市的居民而言,总体上前往中心城市的概率要大于到其他同级城市的概率。因此,引入了各个城市的权重 w ,来表示各城市对人流的影响力。对第 n 级城市 , 其权重 w n = w 0 r (N-n) 。其中 w 0 为常数,固定为 1 ; r 1 ,是一个主要参数。个体沿连边运动时,到达某个相邻城市的概率 p = w j /( w i ) 。在这种情况下,高级城市的权重随着 r 的增大而增大,个体具有较高的概率向较高级城市行走 。 该模型的主要参数包括:结构层次数目 N(3 N 5), 第一级城市数 K ,每个上级区域被分为次级区域的个数 M ,和权证因子 r 。图 4 . 2 所示为取 N = 5 , M = 9 时所得结果。其中,图 4 . 2 (a) 所示,尽管大多数的行走是在同一区域低级的城市之间完成的,但仍会出现爆发性的长距离行走(图 4.2 (a) )。行程分布呈幂律关系,当 r 在 1 .0 到 2 .0 之间时,所得行程分布指数可在 -1. 5 到 - 3 . 0 之间连续变化。该结果可以覆盖实证统计所得的指数 范围 。 该模型的解析结果也与数值结果高度一致。 这一结果显示出, 交通 网络 本身所具有的 层次性, 可能是 导致 人类的 标度性的行程分布 的重要原因 。 详细的模型介绍,可参考文献 。 图 4.1. (a). 一个 N= 3, K= 2, M = 5 的层次性交通网络示意图。 (b) 和 (c) 分别显示了其第 3 层和第 2 层的某个指示区域内的同层节点之间的全部连边。图引自文献 。 图 4.2. 左图:该层次性模型模拟得到的空间运动径迹;右图: N = M = K = 9 时,不同 r 模拟所得的行程分布,红色线为拟合结果。图引自文献 。 (2). 生物运动的趋利性确定性行走模型和其群集效应 在生物运动中中国科学技术大学的研究者提出了趋利性生物运动模型。对于众多生物物种而言,趋利性是生物行为适应性的保证,也是决定其各种宏观行为的基础。在该模型中,由于实际的生物个体一般具有较稳定的有限的生活区域,因此设定个体在一个 N N 大小的离散方格子空间中运动。 每个格子具有一定的资源,对于坐标为(i, j)的格子使用V(i, j)(0 V(i, j) V m )表示,其中V m 表示资源的上限。 在该模型中资源可以有限度地缓慢恢复。在该空间上,M个个体同时进行运动。基于趋利性原则,在每一时步个体的运动规则和格点状态更新规则如下:各个个体寻找距离各自的当前位置最近的具有资源最大值 V m 的格点作为其目标位置。如果满足这样条件的格点有多个,则随机选择其中一个作为目标位置;个体移动到目标位置上,并把该位置的资源 V 置为 0 ,表示资源已经被消耗;所有个体的位置更新完毕后,对于所有资源小于 V m 的格子,其资源 V 增长 1 ,表示资源的有限度的再生。 定义比率 r = MV m /N 2 ,该值表示在各个体运动时,空间中资源小于 V m 的格点所占的稳定的比例,也表示资源相对于消耗的剩余程度。当 r = 1 时,表示资源的再生恰好满足各个个体的消耗,无任何多余的资源; r 越小,资源剩余量越大,也就是说资源越充足。 模拟所得行程分布如图 4 . 4 所示,幂指数 的绝对值随 r 的减小而增大。当 r 0.8 时, p(d) 的分布曲线已经偏离了常规的幂函数, 而更为接近指数分布, 说明如果资源(比如食物等)的丰富程度增加,生物的运动中的长程运动的概率会趋向减小,甚至可能导致幂律运动特性的丧失。这种的生物运动方式随食物丰富程度而改变的现象在实际观测中也有发现。 个体数目 M 的大小对 p( l ) 也有一定影响。在该模型中, M 的大小并不表示生物种群密度,而是表示生物活动区域的重叠程度,或者说对资源的共享程度。如图 4 . 4 (b) 所示,当 r 值接近 1 时, M 越大,所得分布函数 p( l ) 的幂指数越小,同时较大的 M 也会使分布函数出现明显的尾部截断。该模型的结果暗示,当食物资源趋向临界时,相比于一些有着严格领地的物种,那些无明显领地区分的物种的行程分布可能存在更大的长程运动几率,同时其运动行为也会更多地受到食物资源状况的影响。 此外,通过数值模拟,该模型还显示出,当食物较为匮乏时,生物运动更有可能形成有序的集体运动,揭示出环境因素对生物群集运动的影响,如图 4.5 所示。详细的模型介绍,可参考文献 。 图 4.4 . (a). 当 M = 100 时,当 r = 0.50, 0.80, 0.90, 0.95, 0.99 和 1.00 时所得行程分布 p(l) 。 (b). 当 r = 0.99 时, M = 1 , 10 , 100 , 500 , 1250 时所得行程分布 p(l) 。图引自文献 。 图 4.5. 当 r = 0.99 , M = 500 时模型生成的群集运动斑图。图引自文献 。 (3). 空间运动中的记忆效应和距离影响 图 4.6. 不同和时模拟所得的行程分布。图引自文献 。 图 4.7. 不同和时模拟所得的到达不同位置时的频率分布。图引自文献 。 在日常生活中, 人之所以去某地常常是因为需要到该地办理一定的事务或者满足一定的需求 。当人在决定去什么地点的时候,一方面,常常需要同时考虑其中的距离因素和所做事务的重要性,一些路程距离较远而且不太重要的事情常常会被放弃,甚至部分较重要但距离很远的事务也可能会被放弃;另一方面,人们的决定常常也受到记忆的信息和前后任务的关联性的影响:对于很多的日常事务,人们常常会优先选择去一些自己较为熟悉的地点(大多是一些短期内曾经去过的地点)去办理,而且一些事务本身具有一定的前后关联性,需要多次处理。依据这样的日常经验,我们的模型假设:视人的运动或旅行的目的是处理来自各个地方的任务,这些任务本身具有重要性的区别,人们依据任务距离的远近和记忆的熟悉程度(或任务时间关联)来确定优先处理哪些任务,那些来自距离较近的任务和较熟悉的地点的任务具有较大的优先权。基于以上假设,模型的规则可以描述如下: i) ,模型中,一个个体在大小为 S S 的二维离散四方形格点空间中行走 ;从空间的格点中随机均匀抽取 N 个点( N S 2 ),每个点表示一个可能出现任务的位置。 ii) , 每个点上存在一个等待处理的任务 ;对于一个任意的点 i( 坐标 (x i ,y i )) ,定义 p i 为该点的任务的重要性,其中 p i 为 1 - 100 之间的随机整数;点 i 实际被个体选中为目标位置的概率为: q i = (p i t i - d i - )/ (p j t j - d j - ) (1) 其中 d i 为该点到行走者当前位置的几何距离 ,为: d i = ((x i - x t ) 2 + (y i - y t ) 2 ) 1/2 (2) 其中 (x t , y t ) 为当前位置坐标; t i = t t i0 , 为从行走者上次到达该点的时刻到当前时刻的时间间隔 ,其中 t 为当前时步, t i0 为行走者上次到达点 i 的时刻。 和 为固定的常数。 iii) ,当点 i 被选中为目标位置时 ,行走者移动到该点,该点的 p i 置 0 ,表示任务被处理;而当下一时步个体在离开该点后,该点将被赋予一个新的随机的 p i 值。注意:其他非目标位置各点的重要性 p 不会改变。 在以上规则中, q i 实际表示了该点的有效优先级,这一优先级由任务本身的重要性 p i 、空间距离 d i 和时间差 t i 决定。这里使用时间间隔的衰减函数 t i - 表征了人类行为中的记忆效应的影响, 即人类更有可能去那些在近期曾经去过的地方 ,其中表示了时间记忆效应(或任务时间关联性)的影响强度,取值越大,表示个体对较短时间前到达过的位置的选择偏好越强烈。与此类似,空间距离效应也使用 d i - 来描述,其中表示了个体对距离较近的任务的选择偏好,同样是取值越大该偏好越强烈。常数和为该模型的主要参数。 图 4.6 显示了该模型所产生的行程分布为幂律形式。同时该模型中,个体访问不同位置的频率分布也接近幂律形式,如图 4.7 所示。详细的模型介绍,可参考文献 。 5. 结束语 经过五年来的蓬勃发展,人类动力学已经成为复杂性科学中非常活跃的一个新兴科学领域,大大拓宽了对复杂性科学研究领域的视野,并显示出了广泛的应用前景。经过研究者的努力,目前在该领域已经大体形成了若干类基本研究范式。目前虽然已经发现并解释了大量的人类活动特点,但仍然存在有大量的问题有待于更为深入的研究:首先目前已有的实证统计主要针对个体行为,但仍然存在大量的个体行为的特性并未被研究,已有的研究结果尚难以根据统计特性区分个体行为的主要类别;而针对团体行为的实证研究更几乎是空白。其次,人类的行为常常受到起社会关系的影响,而且人类行为也会反过来直接影响到其社会关系,在这里人的个性特征、社会性普遍行为特性和社会网络结构等多种因素交织在一起,造成了相当的研究困难性;尽管在这方面已经进行了相当深入的实证和理论模型的研究,但是所获得的成果距离真正认识这个问题本身还很远;因此,当前对各类社会交互行为的实证研究,和通过理论模型的手段来有效探讨社会关系与人的个体行为之间的相互作用,是当前人类动力学研究的一个重点问题。除了人类的个体行为,一些统计也发现某些社会团体的行为也具有类似的非泊松特性,例如战争、恐怖袭击等的时间间隔分布 等;但是由于目前的实证统计有限,这些特性究竟在多大范围内存在,是否与人类个体行为具有相似的生成机制,仍然需要进行深入的研究。而在研究人类行为的空间分布方面,目前的实证统计研究尚缺少对人类行为空间分布的直接观察;而在其产生机制和动力学效应方面,目前的研究也不能有效解释其所有基本统计特性;人类空间运动行为的实证和理论模型也是今后有待于深入研究的一个重要方面。总体而言,目前的人类动力学的理论模型研究,虽然已经提出了多种唯相机制来解释人类行为中的非泊松特性,但是这些机制难以覆盖全部的人类行为中的非泊松特性现象,需要新的更具有普适性的模型的提出。这个新兴领域的发展,仍然有待于研究者的更为深入的发掘。 参考文献: A.-L. Barabsi, Nature 435, (2005) 207. J.G. Oliveira, A.-L. Barabsi, Nature 437, (2005) 1251. V. Plerou, P. Gopikrishnan, L. A. N. Amaral, X. Gabaix, and H. E. Stanley, Phys. Rev. E 62, (2000) 3023(R). J. Masoliver, and M. Montero, Phys. Rev. E 67, (2003) 021112. M. Politi, and E. Scalas , 2008 Physica A 387 2025. Z. Q. Jiang, et al, Physica A, 387 (2008) 5818. Z. Dezs?, E. Almaas1, A. Lukcs, B. Rcz, I. Szakadt, and A.-L. Barabsi, Phys. Rev. E 73, (2006) 066132. B. Goncalves, and J. J. Ramasco, Phys. Rev. E 78 , (2008) 026123. T. Zhou, H. A.-T. Kiet, B.J. Kim, and B.-H. Wang, Europhys. Lett. 82, (2008) 28002. H. B. Hu, and D. Y. Han, Physica A 387, (2008) 5916. J. Candia, M.C. Gonzlez, P. Wang, T. Schoenhar, G. Madey and A.-L. Barabsi, J. Phys. A: Math. Theor. 41 (2008) 224015. T. Henderson, and S. Nhatti, Proc. 9th ACM Int. Conf. on Multimetia, pp. 212, ACM Press 2001. A. Grabowski, N. Kruszewska, and R. A. Kosiński, Phys. Rev. E 78, (2008) 066110. S. K. Baek, T. Y. Kim, and B. J. Kim, Physica A 387, (2008) 3660. A. Vzquez, J. G. Oliveira, Z. Dezs ? , K.-I. Goh, I. Kondor, and A.-L. Barabsi, Phys. Rev. E 73, (2006) 036127. K.-I. Goh, and A.-L. Barabsi, Europhys. Lett. 81, (2008) 48002. P. Wang, T. Zhou, X.-P.Han, and B.-H. Wang, arxiv: 1007.4440. A. Vzquez, Phys. Rev. Lett. 95, (2005) 248710. A. Gabrielli and G. Caldarelli, Phys. Rev. Lett. 98, (2007) 208701. J.G. Oliveira, and A. Vzquez, Physica A 388, (2009) 187. A. Vazquez, Physica A 373 (2006) 747. A. Cesar, R. Hidalgo, Physica A 369 (2006) 877. A. Chmiel, et al. Phys. Rev. E. 80, (2009) 166122. R. Dean Malmgren, Daniel B. Stouffer, A. E. Motter and L. A. N. Amaral, Proc. Natl. Acad. Sci. USA 105, (2008) 18153. A. Vzquez, B. Rcz, A. Lukcs, and A.-L. Barabsi, Phys. Rev. Lett. 98, (2007) 158702. J. L. Iribarren, E. Moro, Phys. Rev. Lett. 103, (2009) 038702. B. Min, K.-I. Goh, and A. Vazquez, arxiv: 1006.2643 D. Brockmann, L. Hufnagel, and T. Geisel, Nature 439, (2006) 462. M. C. Gonzalez, C. A. Hidalgo, and A. -L. Barabasi, Nature 453, (2008) 779. L. Rhee, M. Shin, S. Hong, K. Lee K, and S. Chong , On the Levy-walk nature of human mobility, Proc. 27th IEEE Conf. Comput. Commun (INFCOM, IEEE Press, 2008). F. Bartumeus, F. Peters, S.Pueyo, C. Marrase, and J. Catalan, Proc. Natl. Acad. Sci. USA 100, (2003) 12771. S.M. Song, et al. Science 327, 1018 (2010). G. Ramos-Fernandez, J. L. Mateos, O. Miramontes, G. Cocho, H. Larralde, and B. Ayala-Orozco, Behav. Ecol. Sociobiol. 55, (2004) 223. D. W. Sims, E. J. Southall, N. E. Humphries, G. C. Hays, C. J. A. Bradshaw, J. W. Pitchford, A. James, M. Z. Ahmed, A. S. Brierley, M. A. Hindell, D. Morritt, M. K. Musyl, D. Righton, E. L. C. Shepard, V. J. Wearmouth, R. P. Wilson, M. J. Witt, and J. D. Metcalfe, Nature 451, (2008) 1098. G. M. Viswanathan, S. V. Buldyrev, S. Havlin, M. G. E. da Luzk, E. P. Raposok, and H. E. Stanley, Nature 401, (1999) 911. F. Bartumeus, J. Catalan, U. L. Fulco, M. L. Lyra, and G. M. Viswanathan, Phys. Rev. Lett. 88, (2002) 097901. A. M. Reynolds, Phys. Rev. E 72, (2005) 041928. M. C. Santos, D. Boyer, O. Miramontes, G. M. Viswanathan, E. P. Raposo, J. L. Mateos, and M. G. E. da Luz, Phys. Rev. E 75, (2007) 061114. S. J. Ni, W. G.Weng, Phys. Rev. E 79, (2009) 016111. T. Zhou, Human Activity Pattern on On-line Movie Watching, Complex Syst. Complex Sci. 5(1), (2008) 1 (in Chinese). W. Hong, X.-P. Han, T. Zhou, and B.-H. Wang, Chin. Phys. Lett. 26, (2009) 028902. G.-X. Chen, X.-P. Han, and B.-H. Wang, Physics Procedia 3 (2010) 1897. N.-N. Li , N. Zhang , T. Zhou, Empirical Analysis on Temporal Statistics of Human Correspondence Patterns, Complex Syst. Complex Sci. 5(3), (2008) 43 (In Chinese) N.-N. Li, N. Zhang , Tao Zhou, Physica A 387, (2008) 6391. X.-P. Han , T. Zhou , B.-H. Wang, Human Dynamic Model Based on Adaptive Adjustment, Complex Syst. Complex Sci. 4(4), (2007) 1 (In Chinese). X.-P. Han, T. Zhou, and B.-H. Wang, New J. Phys., 10 (2008) 073010. X.-P. Han, Q. Hao, T. Zhou, and B.-H. Wang, arxiv: 0908.1221 Y.Q. Hu , J. Zhang , D. Huan , Z.R. Di , arxiv:1008.4394 N.-N. Li , T. Zhou , N. Zhang, Concept and Empirical Results of Human Dynamics, Complex Syst. Complex Sci. 5(2), (2008), 15 (In Chinese). J.-L. Guo,T. Zhou, J.-M. Li , N. Zhang , Modeling for Human dynamics, Shanghai Publishing House for System Sciences, Hong Kong, 2008. T. Zhou, X.-P. Han, B.-H. Wang, Towards the understanding of human dynamics, pp. 207-233 (M. Burguete and L. Lam eds., Science Matters Humanities as Complex Systems, World Scientific Publishing, Singapore 2008). X.-P. Han, T. Zhou, and B.H. Wang, Scaling mobility patterns and collective movements: deterministic walks in lattice , unpublished X.-P. Han, and B.H. Wang, Physics Procedia, 3 (2010) 1907. D.-H. Tang, X.-P. Han and and B.H. Wang, Physica A, 389 (2010) 2637. J.-F. Zhu, X.-P. Han and and B.H. Wang, Chin. Phys. Lett. 27, (2010) 068902. --------------------------------------------- 注: * 本文研究受国家重大研究计划( 91024026 ),国家自然科学基金( 10635040 , 10975126 )、国家重点基础研究计划( 973 项目, 2006CB705500 )、高校博士点基金( 20093402110032 )等资助。 韩筱璞(男, 1981-5-18 出生于山东),博士生。主要研究方向:复杂系统,复杂网络,人类行为的动力学与统计力学 汪秉宏(男, 1944-10-4 出生于江西婺源),教授,博士生导师,主要研究方向为统计物理、复杂系统与复杂网络理论。 周涛(男, 1982-4-9 出生于四川 ),教授。主要研究方向:复杂网络,互联网,信息物理。 --------------------------------------------- Researches of Human Dynamics Han Xiao-Pu 1 , Wang Bing-Hong 1,2 , Zhou Tao 1,3 1 Department of Modern Physics, University of Science and Technology of China , Hefei 230026 2Research Center for Complex System Science, University of Shanghai for Science and Technology, Shanghai 200093, 3Web Sciences Center , University of Electronic Science and Technology of China , Chengdu 61005 Abstract: Recently, many abnormal properties are found out in the statistical researches of human behaviors. One of these is the power-law distribution in many empirical studies for the inter-event time of human behaviors and mobility patterns of human travels. We investigated such non-Poisson properties in many types of human behaviors, and found out many empirical results supporting the fat-tail property in human behaviors. And also, we have proposed several dynamical models to explain the origin of these non-Poisson Properties in human behaviors, and found out several basic mechanisms impacting on human behaviors, such as adaptive interest, and hierarchy of traffic systems, and so on.
个人分类: 生活点滴|11252 次阅读|6 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 03:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部