科学网

 找回密码
  注册

tag 标签: 小世界

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

六度分隔的扩展应用--穿越几次见欧拉(科普+科幻)
热度 24 tangchangjie 2014-3-24 17:04
(根据23楼意见改名,原名:四维空间也是小世界 ) 学术服务 与 六度定理应用 最近,有几位国内外年轻学者 Dr.XXX写来请求推荐信件,说他们的导师是Prof YYY(与我们有过学术交往),通过网页得知我是今年某国际会议的主席,希望能作为PC(程序委员会)member,为会议做学术服务,随信还寄来CV(Curriculum Vitae,履历,比Resume详细)。 看了他们的CV,觉得他们年纪轻轻而成果累累,思想活跃且服务积极;随即把来信转给了会议程序委员会主席Prof ZZZ,请他们作为PC member候选,进一步考察。 此过程中,他们 只通过两次中间介绍,三步,就联系到目标人物, : Dr.XXX ---Prof.YYY---Tang CJ -- Prof ZZZ 这是典型的 六度分隔理论的实践应用。    六度分隔(Six Degrees of Separation) 有个奇妙的 六度分隔理论,说,在地球上,想认识某个特定的人,如果人脉路子找对了,可通过不多于六个中间人的引荐,就能实现。    不严格的 说明或 证明思路 作为科普解释,这里仅给一个思路,疏漏之处,请高手指正。 设人脉路径上的中间人平均认识100人(此条件并不苛刻),每人向社会网络发出100条人脉触须或探针,用类似传销的方式,积累6个层次,触须连成的路径总数为100 6 = 10 12 ,即1万亿,是地球人数的若干倍,当然,由鸽笼原理,路径中有重复,而且是很多重复;用社会现象中普遍使用的二八分布规律,在社交能力方面,能力普通的 占 80%,能力特高或特低人群占20%;如此,在 1万亿条路径中,有 20%(2千亿,是地球人口若干倍),落在80%的普通人集合上;如果再假定普通人知名度有个适当的上限,不会有少数人消耗太多路径,由鸽笼原理可知,每个普通人都会分到一些路径(否则,路径分不完) 。 换言之,如果想认识的目标人物是普通的而不是不是十分特殊的(如闭关练功的独孤求败之类),则六度理论说,他将被那2千亿路径覆盖,即在众多的路径中,存在某一条,能达到那个目标人物(但这并不是说,某人预先指定的某一条一定能达到他),这是一个关于存在性的命题。    信任网络并不太复杂 用学术味道浓厚一点的描述说,在地球社会中,可以用不超过步长为6的路径建立信任圈子。呵呵,这世界真小!所以六度分隔又称为小世界理论。 社会网络中的关注网络,好友网络都是小世界;专害熟人、亲人的 传销网,最后跟踪并消灭拉登的联络网,都是小世界、小圈子。       清明时节忆导师 清明之前,不仅怀念起去世的亲人、也还念过去的朋友和老师,也许是老之将至,这些年的清明情结越来越重。特别地,想起了30年前在美国南加大(USC)学习时的指导教师S. Ginsburg 。   上世纪八十年代初,笔者曾在美国洛杉矶的南加利福尼亚大学(USC)计算机系学习,那几年,该系在全美计算机专业的排名区间是 ,相当不错。该系奠基者是形式语言和数据库理论先驱Seymour Ginsburg,他的研究团队中有三位外来学者:田中克己(Katrumi Tanaka,现日本著名数据库专家之一),现在颇有名气的Rich Hull,以及相对平凡的笔者; 现任复旦大学计算机学院院长王晓阳是他的关门弟子,S.Ginsburg的众多学生现在大都在数据库、大数据处理这块沃土上耕耘。   Seymour Ginsburg 于2004年因病去世,记得J.D. Ullman专门写过一本书,Dedicated 他,SIGMOD Record 还出一期专辑纪念他在计算机形式语言理论和数据库理论方面的卓越贡献( Vol. 34, No. 1, March 2005)。       访问晓阳主页的意外收获 为收集导师的素材,网络时代自然用网络。网搜“S. Ginsburg”,网址链网址,几步就链到了晓阳的网页,其中 有份珍贵的材料 My Academic Lineage, 列出了(自下而上)的 生-师关系谱 。 没想到的是,其中竟然出现了 欧拉、 伯努利和 莱布尼兹! (其中的汉字是笔者加的)。 咱们先看图谱,再发议论: =================================================================================== My Academic Lineage 1) X. Sean Wang, PhD, University of Southern California, 1992. 王 晓阳 2) Advisor: Seymour Ginsburg , PhD, University of Michigan in 1952, 3) Advisor: Ben Dushnik, Ph.D. University of Michigan 1931 4) Advisor: Theophil Henry Hildebrandt, Ph.D. The University of Chicago 1910 5) Advisor: E. H. Moore, Ph.D. Yale University 1885 6) Advisor: H. A. Newton, B.S.Yale University 1850 7) Advisor: Michel Chasles, Ph.D. cole Polytechnique 1814 8) Advisor: Simon Denis Poisson 泊松 9) Advisor:Joseph Louis Lagrange 拉格朗日 10) Advisor:Leonhard Euler, Ph.D.Universit at Basel 1726 欧拉 11) Advisor:Johann Bernoulli,1694 约翰 伯努利 12) Advisor:Jacob Bernoulli?1684 雅各布·伯努利 (是约翰 伯努利的 老师兼老兄) 13) Advisor:Gottfried Wilhelm Leibniz1666 莱布尼兹 ( 在和牛顿争微积分知识产权时,其学生雅各布·伯努利是力挺他的忠实粉丝) 14) Advisor:Erhard Weigel 1650 ===================================================================================   感叹, 四维空间也是小世界 ,总有一天,我们都会到天国去,到了天国,也想见大师,带着一生求索而不得其解的问题,想问大师, 问灵感:当初那个发明或发现的灵感来自何处? 问 诀窍 :学术能取得如此多的成果,有什么诀窍? 问辛苦:几多辛苦成果中? ........ 穿越几次见欧拉 如解决了时空穿越,上述访问的难点就转化为人脉;需人引荐,学生请老师,请老师的老师,请老师的老师的老师,都比较自然。 沿着晓阳列出的“生-师谱”,做系列穿越,8次可见到拉格朗日。9次见到大数学家欧拉,10次见到约翰.伯努利,….,12次见到莱布尼兹!   原来,四维空间也是小世界! 相关科普博文 关于 Leonard . Adleman的系列博文    1 一位狂热科学家的工作照 2 图灵奖得主是怎样炼成的-----侧应钱学森之问 3 他凭什么得到图灵奖 ? (在RSA中的贡献,+RSA科普) 4 一不小心,成了计算机病毒的教父 (科普) 5 奇思妙想,客串艾滋病免疫研究 (科普 ) 6 沧海横流,谁开辟了DNA计算? (DNA计算简介,科普) 其他科普博文 网上流行云计算 --云计算漫谈之一 天边飘来几朵计算的云 ---云计算漫谈之二 圈内焦点座谈:假日议购平板和手机 假日聚会,戏说云物人海 -- 漫谈大数据 卷积,小波的科普直观解释 六度分隔的扩展应用--穿越几次见欧拉(科普+科幻) 大数据 与 马航MH370 其它系列博文的入口 唐常杰博客主页 科学博客主页
个人分类: 人物故事|13500 次阅读|48 个评论
“傻”博士的初恋-5-世界真小
热度 8 tianrong1945 2012-12-17 06:33
“傻”博士的初恋-5-世界真小
第五章:世界真小 说到有关科技的问题,萨沙的话就越来越流利: “比如,你知道吗,遍布地球的万维网的直径是多大﹖” “当然应该是一个天文数字喽。” “答案一定让你吃惊。它不是一個天文数字,也不等于地球的直径,而是等于 19 。” “奇怪,这个 19 是哪里冒出来的?不过,我首先需要知道万维网的直径是如何定义的。”嘿,我毕竟是学科学的,可不能那么容易被你唬住。 萨沙说,我不是给你讲过图论吗?首先,让我们给万维网这样的网络的大小下一个定义。任何网络都可以抽象为一个由许多顶点和连线组成的‘图’。比如万维网吧,每一个网页就是一个顶点,网页之间的关系,就用点与点之间的连线表示。 如何理解‘网络图’的大小呢?在几何中,可以用点和点之间的最大距离,也就是‘直径’,来描述几何体的‘大小’。因此,要定义图的大小,首先需要在图论中,也引进‘距离’,或‘直径’的概念。 我说:“对呀,万维网的网页和连接都那么多,直径也应该很大啊……” 但萨沙说,顶点数和连线数并不等同于图的大小。 我有些不服气:“可能不会等同,但总该有点关系吧!” 萨沙想了想,确定地说:没什么关系。举个通俗例子吧,小皮球和吹足了气的大气球都用橡胶做成,小皮球中的橡胶分子数目可以比大气球中的多得多吧,但你说哪个的直径更大些呢? 这个例子有点意思,难道万维网就是个吹起来的大气球?会不会爆炸啊?萨沙不理睬我的随意引申,继续解释‘图的直径’。在纸上画了下面这两个图: “你看,上面图中网络 a 的直径等于 1 ,因为任何两点之间都只走一步就能到达。而网络 b 呢,它和 a 的顶点数一样, 5 个,连线数却更少,但它的直径却更大:等于 2 !因为网络 b 中两点之间的最大距离是两步……” 一步、两步?啊,原来网络的直径就定义为‘最多有多少步’!不等萨沙解释完,我突然开窍了,抢着说: “明白了,明白了!万维网的直径等于 19 是什么意思?那就是说:从万维网的任何一个网页,要到另一个网页,最多是 19 步。或者说,最多只需要经过 19 个其它的网页就能到达……,对不对?” “差不多是这样吧。” 萨沙说,像万维网这种网络,所对应的是具有成千上万个顶点和连线的巨大的‘图’,这种图已经与二百多年欧拉所研究的图有了本质的区别:这些巨大的图不是固定不变的,而是随机的、统计的、算法的。 不过,我们仍然可以用与固定图类似的方式来定义它的大小,只不过,现在的数学量都应该是统计意义上的,所以,任何量的前面,都应隐含着‘平均’二字。比如,对万维网应该说:一个网頁連到任意另一个网頁,‘平均’最多需要按 19 次鼠标。 “平均、最多?是否说实际上,某一个特殊的连接,有可能要按 20 几次鼠标?” 萨沙不屑回答我的笨问题,继续说: “人际关系网的直径更有意思,它的直径小于 6 ……” 对人际关系网来说,每个人就是图中的一个顶点,人与人之间的关系,比如:认识或不认识,就构成图中顶点之间的连线。 人类社会中的各种社团组织,小到家庭、朋友圈、教会、公司、学校,大如党派、政府、国家,都是人际关系网的具体社会体现。随着计算机通信技术的进步,互联网的发展,更有了各种虚拟世界的人际关系网。这个‘六度分隔’,指的是所有人构成的巨大的人际关系网。 要知道,全世界的人口大约有 60 多亿,如果还将死去的人都包括在内的话,应该是几百个亿的数量级啊。这样一个人类大社会的关系网,它的‘直径’却只等于 6 !也就是说,地球上任何两个人之间,最多通过 6 次关联,就能互相到达。这就是所谓“六度分隔”说法的来源。这个‘大社会,小世界’的现象,的确可用一句人们在聚会时偶然碰见意料之外的熟人时常用的话来概括: “世界真小!” 萨沙又举了一个衡量‘关系网直径’的好例子:比如,我们考虑一个有 200 个人的教堂,如果这个教堂的每个人都互相认识,意味着任意两人之间都有 1 条连线互相到达。因此,这个教堂的‘人际关系网直径’是 1 。 我们再考虑一个只有 100 人的小公司,分成部门一和部门二,分别有经理 A 和 B 。公司员工之间互相认识的不多,两个经理 A 、 B 互相认识,且分别认识自己部门的所有员工。这种情形下,在每个部门内部,员工之间互相到达,需要通过自己的部门经理,也就是:经过 2 条连线。而部门一的员工 C ,要到达部门二的员工 D ,则需通过 3 层关系: C-A , A-B , B-D ,三条连线。因此,这个公司的‘人际关系网直径’是 3 。 从刚才的两个例子不难看出,如此定义的关系网的大小,与关系网的人数是无关的。从人数来看,上例中 200 人的教堂大于 100 人的公司;而从关系网来看,公司的直径为 3 ,大于教堂直径 1 。所以,关系网的直径所度量的,不是人的多少,而是人与人之间关系紧密的程度。 在我们刚才所考虑的教堂和公司的例子中,图的连线并无方向性。也就是说,人们的关系只是一种简单 ‘互相认识’ 的关系。如此而构成的图,称之为‘简单图’。如果我们还进一步考虑‘我认识布什,布什不认识我’之类的情况的话,就得在连线上画上单向或双向的箭头,这样构成的关系网络,称之为‘有向网络’。 萨沙又说,除了‘直径’之外,还有两个有趣的特性表征与人际关系网大小有关的性质:那是‘聚类系数’和‘度分布曲线’。 聚类系数可以用来描述人际关系中的“物以类聚,人以群分”的抱团聚类现象。 聚类系数的数值从 0 到 1 变化。用通俗的话来说,如果在一个人际关系网中,每个人所有的朋友互相都是朋友,这个网的聚类系数就是 1 。反之,如果每个人的朋友互相之间全都不认识,这个网的聚类系数就是 0 。因此,聚类系数越大,说明抱团抱得越紧;聚类系数越小,说明组织越松散。 对人际关系网聚类系数的研究表明,人际关系网的聚类系数是一个小于 1 ,但大大地大于 1/N 的数,这儿 N 是关系网的总人数。人类社会有明显的社团现象。各社团内部联系紧密,社团和社团之间,有相对少得多的连线相连,称之为所谓的“弱纽带”。而正是这些弱纽带,在形成“小世界”模型上,发挥着非常强大的作用。有很多人在找工作时会体会到这种弱纽带的效果。 通过弱纽带的连接,人际关系网的‘直径’迅速变小,人与人之间的距离变得非常“相近”,错综复杂扑朔迷离的人际关系网,因此才表现出了‘六度分隔’的现象。 度分布曲线则可描述人际关系中各种人物的重要程度。人际关系网中的度分布曲线,用通俗的说法,就是网中朋友数目的分布曲线 p(k) ,这儿 k 是‘朋友数’, p(k) 是‘朋友数’为 k 的人数。比如说,如果有一个 100 人的社团,每个成员都是完全同等重要的,每个人都有而且只有 10 个朋友,那么,除了 10 之外,朋友数为别的数目( 1 , 2 , 3 , 4 , 5 , 6 , 7 …… 11 , 12 等等)的概率(人数)都是 0 。所以,这个人际关系网的朋友数分布曲线就是一个只在在 10 这个数值处等于 100 的 delta 函数。但实际上的人类社会,显然不是一个平均同等的社会。每个人的重要性由他所处的社会位置所决定。比如说,总统、社会名流、或是影视明星的社交圈要比普通人大得多。举例说,大多数的人(上亿个人)平均每人有 10-100 个朋友,而名人们则可能平均每人有多于 120 个朋友,性格孤僻的一伙人可能平均每人只有几个朋友,这样的话,度分布曲线看起来是一条在 10-100 之间出现高峰的一条钟形曲线。 据说一个心理学教授在课堂上提出一个问题:“要认识多少人?才能接触到全世界?”同学们一阵静默后,教授意味深长地说:“你只需要认识一个人!” 这个教授的言外之意是:这个世界事实上是紧密相连着的,也许我们没有察觉出来而已。 萨沙编了一个新三字经,来描述这个‘既大又小’的人际关系网: 大社会,小世界。强作用,弱纽带。物聚类,人分群。六度隔,远朋来。 名流士,多宾客。孤僻人,少往来。勤社交,扩人脉。地球村,温暖在。 上一篇:HE教授 目录 系列科普目录 下一篇:情人节
个人分类: 故事+谜语|8551 次阅读|9 个评论
大数据与小世界的聚会三道茶
热度 18 tangchangjie 2012-10-16 19:58
大数据与小世界的聚会三道茶 - NDBC2012闭幕式发言(唐常杰)   (说明,NDBC2012于10月12-14日在合肥召开,受数据库专委会指派,在闭幕仪式上做总结发言,大会内容既关注了大数据技术,又关注小世界理论,承办会议的东道主索取发言稿,拟发在会议网页,现将发言提纲整理,略去一些细节,去掉口语元素,改成这篇博文。)     很高兴能在这里和大家交流心得, 希望明年有年轻教授来作总结发言,年轻人一定会与计算机科学日新月异的发展步伐更合拍,更精彩。      合肥与数据库之缘 ,合肥这一地名,来源于在此点曾经汇合了两条淝河。如果乘坐飞船,穿越时空,回到唐代,俯瞰江淮大地,可看到当时的南淝河(流向巢湖)和东淝河(流入淮河)在这里归并一源,上溯到鸡鸣山(历经千年沧桑,水系已变,现在看不到两淝归一的景观了)。 两淝归并后,河流以及其中的生命群体,既“团结同行”,又有“交流”,立刻就联想起我们数据库专委会的二十字方针, “团结同行,交流学术,发展学科 培养人才 服务国家”,这是由何新贵院士提出的。“合肥”在千年以前就隐约暗示了我们的专委会方针前几个字;而且,NDBC的第一届学术会议,也是35年前,由中科大罗晓沛教授等前辈承办的;合肥真是与数据库有缘,与NDBC有缘。 合肥是个园林城市,绿色城市,是读书治学、以文会友,且与数据库有缘的地方,感谢承办会议的东道主中国科技大!    发生在合肥的竞争 对合肥立城两千多年的历史进行挖掘,提取特征和分类,看到有三类竞争: ( 1)无战则商争 ,和平时,这里是商家必争之地,在两条淝河交汇的年代,方便的水运,使这里成为徽商通南达北的重要转运站。   (2)有战则兵争 ,战争时期是兵家必争之地。三国魏吴之争,记在正史上,活在演义中,“曹操平定汉中地,张辽威震逍遥津”脍炙人口;南北朝时期有淝水之战,战场虽不在合肥,但发生在从这里流出去的东淝河下游,在合肥北面100 + 公里的八公山一带,有许多人们耳熟能详的故事和成语:八公山上草木皆兵,东山再起,投鞭断流,风声鹤唳等,等等;抗日战争时有合肥会战;解放战争时,指挥百万雄师渡江作战的总前委就在合肥的瑶岗,下图中,用塑像表现的五位开国元勋的伟岸身影来自当年在瑶岗的那张著名照片。 (3)人和则文争 。公元2012年,中国数据库界在合肥以文会友,争出了NDBC首次评选的最佳论文。争出了萨师煊优秀论文奖和优秀系统演示(Demo)奖。在此,用热烈的掌声,祝贺几位论文获得者。   历史上这里也有很多名人,包公、杨振宁,还有李鸿章和政治生涯中六上六下的段祺瑞,后两位评价虽较复杂,但绝对是名人。   能和包公,杨振宁等名人一起在合肥脱颖而出,殊为难得,获奖者一定会在自己的履历上,写上在合肥得到的殊荣;今天把NDBC写进了自己的历史, 明天,不远的将来,NDBC会把你们的业绩写进NDBC的历史。看到获奖者的老师们笑得很开心,学生得到最佳论文奖。老师当然快乐着学生的快乐。 最佳论文的评选程序 今年3月,在北京例会上,专委会主任周立柱教授提出了和国际会议进一步接轨,设评最佳论文。专委会出台了最佳论文评选试行办法:双向匿名+三级筛评+现场考察+必要的回避,其中三级筛评是:   (a)程序委员会,通讯评审出 6-8名;   (b)专委会和程序委员会组成的一个推荐组,推荐出4名;   (c)由海外知名数据库专家组成的独立评审组,评选出一篇最佳论文奖,一篇提名奖。      合肥有铁面无私的包公,想到包公,我们评审组就肃然起敬,想到包公旁的威严的王朝、马汉、张龙、赵虎,还有公堂上那三把维护公正的铡刀,就不敢不敬畏规则。   有一首描写合肥风景的诗:“孝肃祠边古树森,小桥一曲倚城阴。清溪流出荷花水,犹是龙图不染心”。在参加评审的过程中,评委们的心态就是:“清溪流出荷花水,犹是龙图不染心”。 增加了最佳论文评选,使得NDBC的结构与外在形式与国际会议几乎全面接轨,当然,还有两个内在的高度没有达到,一是论文质量的高度,这是我们希望并努力达到的,二是会议注册费用的高度,这是我们并不急于希望达到的。 值得回味的三道茶 到过大理的朋友,品尝过三道茶,在苍山上长,用洱海水泡,茶到三巡,才品出回味甜。如果把第一天的研究生学术辅导和大数据Panel比喻为头道茶,一天半的大会和小会则是二道茶,颁奖的闭幕式就是第三道茶。 现在正当其时,让我们一起,看着议程,凭着记忆,复习那些深刻的学术内容,回味NDBC12中的那些精彩片段。       研究生 学 术辅导--授渔。 新南威大学的林学民教授和人民大学的陆嘉恒教授给研究生们讲了写论文、发论文的功夫和修养,讲学术规范,也讲写作技巧;清华的李国良博士向研究生们介绍愉快科研、游戏科研的心态和方法;香港中文大学的于旭教授,通过“挖掘和查询处理的多样性”实例,把科研方法讲得的深入浅出。研究生们反馈,在学术辅导中得鱼又得渔,受益匪浅。       研讨会和特邀报告:大、 快、 高、 新, Panel和大会报告的靓点大致可归纳为:大大的大数 据,快快的闪存库,高高的数据云,新新的小世界。    大大的大数据 :会议浓浓地关注了大数据,关注大数据时代及其处理技术; 大会前一天晚上的Panel以大数据为中心议题。来了多位知名教授:复旦王晓阳(Panel主持)、哈工大李建中、人大孟小峰、武大刘梦赤,...,.在这个研究圈子里可以说,群贤毕至,少长咸集,不但座无虚席,还加了许多站票(准备会场时,低估了受众的热情,座位少而听众多)。   李建中教授强调了大数据中不可忽视的部分:海量的科学数据和商务数据的特殊矛盾和特殊需求,还对大数据处理的算法,包括线性算法和亚线性算法,做了深刻的分析和展望,......   在大会特邀报告中,新泽西州立大学的熊辉教授,对移动环境的大数据处理,特别对新的计算模型,做了深刻的解析,展示了自己的创见,...... 华师大周傲英教授在特邀报告中对大数据的解析别开生面,他检阅了数据库技术成果,批评了传统技术发展过程中偶尔的自我陶醉,反思了经典数据库技术的得失,阐明了数据库人在大数据时代的优势和当仁不让的责任, .....   不太可能在这里复述报告的全部内容,这些报告描述、解释或评论了大数据的特征,俗而言之,即—大、二变、三快(要求处理快),四随便(无约束或较少约束,因而并非条条数据是精品); 可能还要补充一些特征,因为上述四条主要来源于Web网页数据,作为大数据的当然成员,科学数据和商务数据不仅大,而且从采集开始,就尽可能地有了格式,有了约束,因而有特殊难点,需要特殊的技术。    快快的闪存库 :孟小峰教授报告了闪存数据库系统技术,报告了在国家自然科学基金重点项目中的累累成果,通过对数据库传统技术的扩展,老技术开出了崭新的花朵,为提高大数据处理速度提供了基础支撑。   高高的数据云: 王晓阳教授在关于大数据管理抽象层的特邀报告中,提出了“数据云”这一新概念和新的理论体系,一系列高观点,把我们带上高高的蓝天白云。 新新的小世界 :北大李晓明教授,在一片“大”声之中,漂亮转身,把听众带进了“小”世界,好像黄河大合唱冲过了激流险难,进入一段宽阔平缓的河段面,让大家都舒了一口气。他妙口演绎,轻松解释了小世界理论的研究过程和精彩结论,最后还上升到科研方法论:观察—假说—建模—实践检验,好像是一场生动的自然辩证法和科学研究方法课。 令人耳目一新的新技术报告 来自微软亚洲研究院的谢幸研究员,报告了移动社交和与定位预测研究成果,在报告末尾,讲了一个真实的故事,用“移动社交+定位+数据挖掘”,找回了遗失的钱包和手机,听完故事后,深信知识就是力量、数据挖掘技术是力量、定位预测技术也是力量。 华盛顿大学的陈一昕教授 报告了在医疗大数据挖掘的实时诊断报警的成果,听完之后觉得,知识发现可以救人一命,数据挖掘可以普度众生,数据挖掘也胜造七级浮图。 来自新加坡的杨颖博士,报告了差分隐私保护技术,概念新,方法新,听后感是:隐私居然也能用差分技术,做到了用数据而不泄隐私,又要马儿跑,又要马儿少吃草,   此外, NDBC2012 有 15 个分会和一个大会演示,分会场里洋溢着数据库人的认真和执着;4个工业界报告,充满了大数据时代的特色,既实在,又有创新。 两个第一 NDBC是第二次由中国科大承办,请来了多位国内外的知名教授,大会报告质量高;其中还有两个第一:第一次评选最佳论文,第一次有西藏大学协助承办。 让把我们把热烈的掌声 ,送给西藏大学,他们今天走出西藏来协助承办,下一步,在不远的将来,将把NDBC办进西藏,办到雪域高原,办一个世界上最高(至少在海拔方面)的数据库学术会议。 焉知来者不如今也 。大会期间,数据库专委会增选了13位委员,聆听他们的一分钟陈述,感觉到小小的震撼:后生可畏,焉知来者不如今也? 他们之中,有全国百篇优秀博士论文奖获得者,有的人年纪轻轻,就在几大顶级公议、顶级杂志发表了几十篇论文,得到顶级会议最佳论文奖,他们给我们专委会带来了活力和希望,也给年龄稍大一点的委员带来了压力。   差额选举,有人当选,也有人落选。计算机科学家是最能承受失败的科学家。想当年,我们的技术才开张,第一次学编C语言程序时,写进10行程序,编译出来的警告和错误可能就有50条,从那个时候起,我们就习惯了承受失败,习惯了从失败中站起来,那以后,在晋升职称、申请基金和论文投稿中,又不知受过多少挫折。 就像一首歌中唱的,春去春会来,花谢花会再开,只要你愿意,让梦划向你心海。        志愿者和东道主 , 曾经用拆字(或汉字结构语义分析)来说志愿者, 志=士+心,愿=原+心;两个字下面都有心,自愿要用心,用士之心、用博士、硕士和学士的心。   这里想说广义的志愿者,NDBC2012的志愿者中,最忙、最累、做事最多的是中科大的岳丽华教授,陈恩红教授和金培权教授;为什么?首先他们也是“士”,他们为会议尽全心、出大力;其次,申办NDBC和申办奥运会一样,纯属志愿行为,不但自愿,还要软硬实力,去挣,去争。 从申办到现在开完会,共三年时间,三年岁月,终于凝聚成这一刻,等客人走完,他们才能轻松。 这些天来,来自中科大和志愿者们,付出了辛勤和努力,为会议提供很好的服务。 让我们用热烈的掌声, 感谢志愿者们,感谢所有的承办单位,支持单位和赞助单位。 向他们致以最衷心的感谢! 相关博文( 不说套话更精彩 系列 ) 一个任遐想驰骋的Logo --- 它包容了执着、团结与潇洒 NDBC10 为什么这些专家比较长寿 (NDBC2010闭幕式发言 ) 科技接力与青春寄语 牛年,NDBC在南昌刷新成绩 (NDBC2009闭幕式发言 ) 群星正灿烂,科学有希望 第十五届中创软件基金人才奖励颁奖仪式 三十年回回头,看看走过的路 东西方文化在这里碰撞 (NDBC2011闭幕式发言 ) 大数据与小世界的聚会三道茶 - NDBC2012闭幕式发言 如今老去才华尽, 犹盼春来草上笺 (NDBC2015 闭幕式发言 ) 其它系列博文的入口 唐常杰博客主页 科学博客主页
个人分类: 教学科研|15982 次阅读|37 个评论
[转载][论文交流】小世界网络的同步能力
Fangjinqin 2012-5-4 07:20
TLC-Chaos12 .pdf Synchronizability of small-world networks generated from ring networks with equal-distance edge additions Longkun Tang,1,2,a) Jun-an Lu,2,b) and Guanrong Chen3,c) 1School of Mathematical Science, Huaqiao University, 362021 Fujian, China 2School of Mathematics and Statistics, Wuhan University, 430072 Hubei, China 3Department of Electronic Engineering, City University of Hong Kong, Hong Kong, China (Received 11 January 2012; accepted 18 April 2012; published online 3 May 2012) This paper investigates the impact of edge-adding number m and edge-adding distance d on both synchronizability and average path length of NW small-world networks generated from ring networks via random edge-adding. It is found that the synchronizability of the network as a function of the distance d is fluctuant and there exist some d that have almost no impact on the synchronizability and may only scarcely shorten the average path length of the network. Numerical simulations on a network of Lorenz oscillators confirm the above results. This phenomenon shows that the contributions of randomly added edges to both the synchronizability and the average path length are not uniform nor monotone in building an NW small-world network with equal-distance edge additions, implying that only if appropriately adding edges when building up the NW small-word network can help enhance the synchronizability and/or reduce the average path length of the resultant network. Finally, it is shown that this NW small-world network has worse synchronizability and longer average path length, when compared with the conventional NW small-world network, with random-distance edge additions. This may be due to the fact that with equal-distance edge additions, there is only one shortcut distance for better information exchange among nodes and for shortening the average path length, while with random-distance edge additions, there existmany different distances for doing so. VC 2012 American Institute of Physics. As a typical network model, small-world network has been widely investigated. A small-world network usually has a stronger synchronizability as the edge-adding probability increases in its generation. It has been noticed, however, that it is impractical to enhance the network synchronizability by randomly adding some edges when building up a real network. In this contribution, therefore, a new type of small-world networks is proposed to be built on ring networks by equal-distance edge additions. The influence of edge addition on both synchronizability and average path length of such networks is further studied and compared via adding the same number of new edges in different ways. The findings are new, interesting, and may have implication on better understanding of network synchronization. I. INTRODUCTION Synchronization has been a focal subject for scientific research for a long time due to its ubiquity and importance in nature and society. Since the small-world network models1,2 typically have better synchronizability than many other types of complex networks, synchronization on small-world networks has attracted considerable attention recently. There are two effective ways to generate a small-world network: by random edge-rewiring, which yields the WS model,1 and by random edge-adding, which leads to the NW model.2 Both are generated from a nearest-neighbor coupling network, among which the ring network is the simplest. Small-world networks not only have relatively high cluster coefficients but also possess relatively short average path lengths in general. The concerned issue of synchronizability of small-world networks has been extensively investigated.3–13 In particular, Refs. 3–6 discussed the synchronizability of a small-world network generated by randomly adding a fraction of longrange shortcuts into a ring network. The results show that the synchronizability of the network becomes stronger as the edge-adding probability p increases, namely as the number of long-range shortcuts increases. On the other hand, Refs. 9–11 studies the correlation between the synchronizability and the average path length of a small-world network. The results show that as p increases, the synchronizability of the network is enhanced and correspondingly the average path length is reduced. That the synchronizability of the network becomes stronger probably results from the decreasing of the average path length, which motivates the present study. This paper tries to answer the following question: how does the distance between two connected nodes affect the synchronizability and the average path length of an NW small-world network? Specifically, this paper considers an NW small-world network of size N, generated by adding m edges on m pairs of randomly chosen nodes from among all possible node pairs in a given ring network of size N. The a)Electronic mail: tomlk@hqu.edu.cn . b)Electronic mail: jalu@whu.edu.cn . c)Electronic mail: eegchen@cityu.edu.hk . 1054-1500/2012/22(2)/023121/7/$30.00 22, 023121-1 VC 2012 American Institute of Physics CHAOS 22, 023121 (2012) distance between node i and node j is denoted dij. Only the case of equal distance dij ¼ d is considered in this paper. It is to explore the impact of both the distance d and the edgeadding number m on the synchronizability and the average path length of the NW small-world network. II. PRELIMINARY Consider an undirected and unweighted ring network with N nodes, labeled as 1; 2;    ;N, according to a counterclockwise or clockwise arrangement. The distance between node i and node j, denoted as dij, is defined by dij ¼ min j  i; modi N  j;N; j i: (1) Here, modx; y is the modulo function, which returns the remainder after the number x is divided by the divisor y, and the result has the same sign as the divisor. Since the network topology is undirected, the connectivity is symmetric with dij ¼ dji. For illustration, a ring network with 12 nodes has distances between node 1 and node 4, node 3 and node 8, and node 10 and node 2, given by d14 ¼ 3; d38 ¼ 5; and d10;2 ¼ 4, respectively. When new edges are added to these three pairs of nodes, the new edges are said to have distance 3, 5, and 4, respectively, as shown in Figure 1. In this paper, the effect of random adding-edges with an equal distance is examined; that is, adding m new edges to m randomly chosen pairs of nodes from the following node set: fi; j ¼ 1; 2;    ;Njdij ¼ d; 1 d  ½N=2g: (2) Here, is the rounding function retaining the integer part of a real number. Note that there are N pairs of nodes for every such distance d, except when N is even, there are only N=2 pairs with distance d ¼ N=2. As an example, consider again the ring network with 12 nodes, and select 4 pairs of nodes with distance d ¼ 4 (for instance, choose pairs of node 1 and node 5, node 4 and node 8, node 10 and node 2, and node 11 and node 3), and then add new edges to link these pairs of nodes, respectively, as shown in Figure 2. The corresponding Laplacian matrix L is as follows: L ¼ zfflfflfflfflfflfflfflfflfflfflfflfflfflfflfflfflfflfflfflffl}|fflfflfflfflfflfflfflfflfflfflfflfflfflfflfflfflfflfflfflffl{ d¼4 zfflfflfflfflfflfflfflfflfflfflfflfflfflfflffl}|fflfflfflfflfflfflfflfflfflfflfflfflfflfflffl{ d¼4 3 1 1 0 1 1 3 1 0 1 1 3 1 . . . 1 1 3 1 1 0 1 1 3 1 0 0 1 2 1 . . . . . . 1 2 1 . . . 1 1 3 1 . . . 0 0 1 2 1 1 . . . 1 3 1 1 . . . 1 3 1 1 0 . . . 1 2 0BBBBBBBBBBB BBBBBBBBBBBB@ 1CCCCCCCCCCCCCCCCCCCCCCCA (3) III. NETWORK SYNCHRONIZATION PRELIMINARIES Consider a network of N identical dynamics nodes, described by _ xi ¼ Fxi  cXN j¼1 aijHxj: (4) Here, xi 2 Rn is the state vector of the ith node, F : Rn ! Rn is a well-defined nonlinear function, c is a positive constant coupling strength, H : Rn ! Rn is the inner coupling matrix, A ¼ aijNN is the outer coupling matrix satisfying dissipative condition Pj aij ¼ 0, i; j ¼ 1; 2;    ; N. Set nit ¼ xit  s, i ¼ 1; 2;    ; N, and linearize the state Eq. (4) at a desired state s. Then, one obtains the following linear system of variational equations: _n i ¼ DFsni  cXN j¼1 aijDHsnj; i ¼ 1; 2;    ;N: (5) Here, DFs and DHs are the Jacobian matrix of Fs and Hs evaluated at s, respectively. Let n ¼ ½n1; n2;    ; nN. Then, Eq. (5) can be rewritten as _n ¼ DFsn  cDHsnAT: (6) Denote K ¼ diagk1; k2;    ; kN, with kii ¼ 1; 2;    ; N being the eigenvalues of the symmetrical matrix A, which can be decomposed into the Jordan form AT ¼ SKS1, and let g ¼ ½g1; g2;    ; gN ¼ nS. Then, one has _gi ¼ ½DFs  ckiDHsgi; i ¼ 1; 2;    ;N: (7) Since A is symmetrical, the master stability equation can be defined as follows: 023121-2 Tang, Lu, and Chen Chaos 22, 023121 (2012) y_ ¼ ½DFs  aDHsy: (8) Here, a is a real constant determined by the coupling strength and the eigenvalues of matrix A. One can calculate the largest Lyapunov exponent Lmaxa of the linear system (8), as a function of a, to obtain the so-called master stability function.14 It is known that Lmaxa 0 is a necessary condition for ni ! 0 namely xit ! 0 as t!1, i ¼ 1; 2;    ;N, achieving completely synchronization in network (4). Note that since the network is undirected and unweighted, its coupling matrix A is a symmetrical and irreducible Laplacian matrix, which has only one zero eigenvalue along with N  1 positive real eigenvalues, denoted as 0 ¼ k1 k2      kN. If the synchronized region of the network is bounded, where Lmaxa 0 within a finite interval a1 a a2, then to achieve network synchronization, it is necessary that a1 ck2 ck2    ckN a2 (9) Or, more conveniently, it is required that the eigenratio R satisfies R ¼ kN=k2 a2=a1: (10) The smaller the ratio R, the easier the condition (10) is satisfied, so the better the network synchronizability. If the synchronized region is unbounded, where Lmaxa 0 within an infinite interval a1 cki 1, i ¼ 1; 2;    ;N, then the larger the k2, the better the network synchronizability, because the coupling strength c can be smaller. To some extent, the impact of k2 on the network synchronizability is higher than that of kN.15,16 FIG. 1. Adding edges with several different d in a ring network with 12 nodes. FIG. 2. Adding 4 edges with d ¼ 4 in a ring network with 12 nodes. FIG. 3. k2 as a function of d for N ¼ 1000. From bottom up: m is, respectively, (a) 10, 20, 30, 40, 50, 60, 80, and100 and (b) 100, 150, 200, 250, and 300. FIG. 4. k2=kN as a function of d for N ¼ 1000. From bottom up: m is, respectively, (a) 10, 20, 30, 40, 50, 60, 80, and 100 and (b) 100, 150, 200, 250, and 300. 023121-3 Tang, Lu, and Chen Chaos 22, 023121 (2012) IV. INFLUENCE OF DISTANCE ON NETWORK SYNCHRONIZABILITY This section is devoted to an extensive numerical investigation to the influence of equal-distance edges additions on the network synchronizability. Specifically, consider two ring networks with N ¼ 1000 and N ¼ 2000, respectively, in which all nodes have identical dynamics, so that the synchronizability of the two networks can be characterized by both k2 and k2=kN. For each m, randomly pick up m pairs of nodes from all possible pairs with an equal distance d, and then connect each pair of nodes by a new edge, thereby adding totally m new edges to the ring. Then, for each resulting network, calculate the eigenvalues of its corresponding Laplacian matrix. Since the new edges were added at random, the Laplacian matrix would be different on each trial, so in the simulation, 50 different realizations were performed and the results were averaged. For the network with N ¼ 1000 nodes, let d ¼ 2; 3;    ; N=2, while for the network of N ¼ 2000 nodes, d ¼ 10; 20;    ;N=2 were used. Their corresponding Laplacian eigenvalues k2 and k2=kN as functions of d and m were found, respectively, as shown in Figures 3 and 4 for the network with N ¼ 1000 and Figures 5 and 6 for N ¼ 2000. From Figures 3–6, one can see that for both criteria characterizing the synchronizability of the networks, namely with k2 or k2=kN, the synchronizability of the simulated small-world networks is always correlated with the distance d, and the network synchronizability as a function of d is non-monotonous, but fluctuant. Moreover, one can see that the fluctuations become fiercer as the edge-adding number m increases. The most striking phenomenon is that as m becomes bigger than a certain threshold value, there exist FIG. 5. k2 as a function of d for N ¼ 2000. From bottom up: m is, respectively, (a) 20, 40, 60, 80, 100, and 120 and (b) 160, 200, 300, 400, 500, and 600. FIG. 6. k2=kN as a function of d for N ¼ 2000. From bottom up: m is, respectively, (a) 20, 40, 60, 80, 100, and 120 and (b) 160, 200, 300, 400, 500, and 600. FIG. 7. k2 or k2=kN as a function of m for several different distances for N ¼ 1000. 023121-4 Tang, Lu, and Chen Chaos 22, 023121 (2012) some distances d such that the value of k2 will be saturated, namely will not be further increased by adding even more edges of such distances (for example, d ¼ 200; 250; 333; 400; and 500 for the network with N ¼ 1000, and d ¼ 400; 500; 670; 800; and 1000 for N ¼ 2000). Actually, the value of k2=kN becomes even slightly smaller. This can be seen more clearly from Figure 7. In other words, the synchronizability of a forming small-world network is not continuously and monotonically enhanced by the operation of “equal-distance edge addition” to an initial ring network. In fact, it turns out to be closely related with the distance of the added edges: for some values of d, the synchronizability either remains unchanged or is slightly decreased. It shows that one should avoid adding new edges with such distances in order to enhance the synchronizability of the growing small-world network with this method, or on the contrary should add new edges with such distances when synchronization is undesirable. Moreover, one can see from the figures that the number of the distance d corresponding to the minimum values of k2 (or k2=kN) increases as m increases, and the set of those minimum distances with bigger values of m contains that with smaller m. There were perception and tendency to add some longrange connections into a nearest-neighbor network, so as to shorten the average path length of the overall network thus improving the synchronizability of a small-world network.9–11 Moreover, it was believed that by increasing the number m of edge additions, one could shorten the average path length thereby improving the synchronizability of the small-world network. However, our investigation reveals that these are not always true. Figure 8 shows the impact of the equal-distance d on the average path length of the resulting small-world network. One can see that the average path length is not always significantly reduced as m increases. When m is bigger than a certain threshold value, there exists some values of distance d such that the average path length is saturated. For example, for the ring network with N ¼ 1000, the average path length deceases from 65.7685 to 63.5979 (the difference is very small) as m increases from 40 to 300 (the difference is very large) with d ¼ 250. Such values of distance d are exactly those corresponding to the minima of k2 (or k2=kN), but the curves of the average path, Ps, are opposite to that of k2 (or k2=kN). To verify the above theoretical results, a linearly coupled small-world network consisting of N ¼ 100 identical Lorenz oscillators is simulated x_i1 ¼ axi2  xi1 x_i2 ¼ cxi1  xi1xi3  xi2 x_i3 ¼ xi1xi2  bxi3 i ¼ 1; 2;    ; N: 8: (11) Here, a ¼ 10; b ¼ 8=3; c ¼ 28, and H ¼ ½100; 000; 000; namely, the coupling is through the “x” component. The error of synchronization among the N nodes is defined as follows: Et ¼ 1 NXN i¼1 k xit  xt k (12) FIG. 8. Ps as a function of d. From bottom up: m is, respectively, (a) 10, 20, 30, 40, 50, 60, 80, 100, 150, 200, 250, and 300 (N ¼ 1000) and (b) 10, 20, 40, 60, 80, 100, 120, 160, 200, 300, 400, 500, and 600(N ¼ 2000). FIG. 9. The errors of synchronization among 100 different Lorenz dynamics oscillators over time for d ¼ 22 and 25 and m ¼ 40 and 50. The inset is an amplified figure on some time interval. FIG. 10. k2 (a) and k2=kN (b) as a function of d for N ¼ 100. From bottom up: m is 20, 25, 30, 35, 40, 45, 50, 55, 60, and 65. 023121-5 Tang, Lu, and Chen Chaos 22, 023121 (2012) Let the coupling strengthen c ¼ 120, d ¼ 22 and 25, and m ¼ 40 and 50. The synchronization error is shown in Figure 9, which implies that when m is larger than a threshold, the synchronization error and the synchronization time of the network with d ¼ 22 are both significantly less than that of the network with d ¼ 25. The value of k2 or k2=kN at d ¼ 22 is much larger than that at d ¼ 25, as can be seen in Figure 10. In addition, it is shown that the synchronization error and synchronization time for d ¼ 25 are about the same for both cases of m ¼ 40 and m ¼ 50, but this is not the case for d ¼ 22. These findings are fully consistent with the above theoretical results. Finally, the synchronizability and average shortest path length of the conventional NW small-world networks are given as comparison with those of the fixed-shortcut-distance NW small-world networks. For the networks with N ¼ 1000 nodes, the eigenvalue k2 (or eigen ratio k2=kN) and average shortest path length Ps with m edges additions are shown in Figure 11, while Figure 12 shows those of the networks with N ¼ 2000 nodes. From both figures, it is clear that for the same number m of edges additions, k2 and k2=kN (or the average shortest path length Ps) are much larger (or shorter) than that of the fixed-shortcut-distance NW small-world network, implying that the conventional NW small-world network has better synchronizability and shorter average shortest path length. It also indicates that, without considering shortcut distance limitation, one should not fix but randomize shortcut distance for enhancing the synchronizability via adding some edges into a ring network. V. CONCLUSIONS AND DISCUSSIONS In summary, this paper has explored the relationships between the edge-adding number m or the edge-adding distance d with the synchronizability and the average path length of the NW small-world networks generated from ring networks via random edge-adding. The impacts of m and d on both synchronizability and average path length have been investigated. Extensive numerical simulations have shown that the resulting average path length of the network is not FIG. 11. NW small-world network with conventional algorithm and N ¼ 1000, m ¼ 10, 20, 30, 40, 60, 80, 100, 150, 200, 250, and 300. (a) k2 and k2=kN vs m and (b) Ps vs m. FIG. 12. NW small-world network with conventional algorithm and N ¼ 2000, m ¼ 20, 40, 60, 80, 120, 160, 200, 300, 400, 500, and 600. (a) k2 and k2=kN vs m and (b) Ps vs m. 023121-6 Tang, Lu, and Chen Chaos 22, 023121 (2012) always shortened and so the synchronizability is not always enhanced in forming a fixed-shortcut-distance NW smallworld network. Nevertheless, when m is bigger than a certain threshold value, some values of distance d have almost no influence on the synchronizablity, but may scarcely shorten the average path length as m increases. This phenomenon indicates that the contributions of randomly added edges to both the synchronizability and the average path length are not uniform nor monotone. The present study also reveals that there are significant differences in the synchronizability and average path length for the NW small-world networks between the fixed-shortcutdistance strategy and the non-fixed-shortcut-distance strategy. Conventional NW small-world network has better synchronizability and shorter average shortest path length, which is perhaps because there exist many different distances for better information exchange among nodes and for shortening the average path length, while with the fixed-shortcut-distance strategy, there exists only one shortcut distance to be used. However, if it is necessary to fix the shortcut distance for some practical considerations. Since the distances of the adding-edges are important to the building of an NW smallworld network and, therefore, one should avoid adding new edges with inadequate distances in order to enhance the synchronizability of a growing small-world network. However, what are the exact values for such distances? And, what are their correlations with the size of the underlying network? These questions call for more investigations, from which a new mathematical theory may be further developed. ACKNOWLEDGMENTS This work was supported by the National Natural Science Foundation of China under Grants 60974081 and 11172215, the Hong Kong RGC under the GRF Grant CityU1114/11E, and the Fundamental Research Funds for the Central Universities. 1D. J. Watts and S. H. Strogatz, Nature (London) 393,440 (1998). 2M. E. J. Newman and D. J. Watts, Phys. Lett. A 263, 341 (1999). 3X. F. Wang and G. Chen, Int. J. Bifurcation Chaos 12,187(2002). 4F. Qi, Z. Hou, and H. Xin, Phys. Rev. Lett. 91, 064102 (2003). 5I. V. Belykh, V. N. Belykh, and M. Hasler, Physica D 195, 159 (2004). 6I. V. Belykh, V. N. Belykh, and M. Hasler, Physica D 195, 188 (2004). 7H. Hong, M. Y. Choi, and B. J. Kim, Phys. Rev. E 65, 026139 (2002). 8K. Park, L. Huang, and Y.C. Lai, Phys. Rev. E 75, 026211 (2007). 9T. Nishikawa, A. E. Motter, Y. C. Lai, and F. C. Hoppensteadt, Phys. Rev. Lett. 91, 014101 (2003). 10M. Zhao et al., Physica A 371, 773 (2006). 11X. F. Wang, X. Li, and G. R. Chen, Complex Network and Application (Tsinghua University Press, Beijing, 2006). 12X. P. Han and J. A. Lu, Sci. China, Ser. E 50, 615 (2007). 13C. Y. Yin, B. H. Wang, W. X. Wang, and G. R. Chen, Phys. Rev. E 77, 027102 (2008). 14L. M. Pecora and T. L. Carroll, Phys. Rev. Lett. 80, 2109 (1998). 15F. M. Atay, T. Biyikoglu, and J. Jost, Physica D 224, 35 (2006). 16L. Huang, Q. F. Chen, Y.-C. Lai, and L. M. Pecora, Phys. Rev. E 80, 036204 (2009). 023121-7 Tang, Lu, and Chen Chaos 22, 023121 (2012)
个人分类: 学术文章|2692 次阅读|0 个评论
柳暗花明又一机,见证六度小世界
热度 7 Fangjinqin 2012-5-2 17:03
柳暗花明又一机,见证六度小世界
柳暗花明又一机,见证六度小世界 2012 年4月29日 4 :45,在论坛即将落下帷幕时,我即兴在大会发言:让我们对中国传媒大学的大力支持和以沈浩-丁迈教授为首的筹备组的辛勤工作表示衷心的感谢!论坛三天来,特别是今天到现在,在座各位仍有好几百人,你们能够这么坚持到最后,显示论坛的魅力所在!成功所在!希望所在!为此,我向所有参加论坛的朋友们表示真诚的感谢!并祝大家一路平安!身体健康!后会有期!我们下次论坛见! 抱歉,由于赶单位回去的班车,我不得不匆匆离开了会场了。 正是如此匆忙,我把照相机忘在座位前面桌子上了。照相机里面有不少这次中国网络科学论坛的珍贵照片和录相视频,我必须把它找回来,于是我怀着信心,开始我寻找照相机之旅。从4月30日开始,我首先打手机告诉沈浩老师和丁迈老师,他(她)们两人是我联系的头2步,希望他们问会务组同学,他们又去联系当时参加会场服务的2位同学是否看到,于是又增加了2步,然后5月31日上午约10点我与中国科技会堂报告厅的主管孙涛联系,达到第5步了,结果11点15分,奇迹终于出现了,孙涛告诉我检到照相机了。于是,我12点马上乘车又到《中国科技会堂》,他带我到会堂保卫科负责收管的警卫,终于第6步我领回了阔别3天的宝贝照相机。我很高兴宝贝相机失而复得了,我志在必得的决心和愿望实现了。由此可见, 这个寻找照相机的过程再次验证了六度分离理论,无处不在的小世界现象。 同时,应证了我国著名诗人 陆游 《 游山西村 》诗中:“ 山重水复疑无路, 柳暗花明 又一村 。 ”的惊喜快感,可谓: 柳暗花明 又一机,见证六度小分离(世界). 这里让我们重温: 陆游 《 游山西村 》全诗: 莫笑农家腊酒浑,丰年留客足鸡豚。 山重水复疑无路, 柳暗花明 又一村 。 箫鼓追随春社近,衣冠简朴古风存。 从今若许闲乘月,拄杖无时夜叩门。 我非常感谢网友对我关心和帮助,并深深体会我国古代诗人的伟大。
个人分类: 科学论坛|2544 次阅读|14 个评论
随机加边才让世界变得更小
热度 6 jalu 2012-5-1 12:12
随机加边才让世界变得更小 我们投 Chaos 的稿件《 Synchronizability of Small-world Networks Generated from Ring Networks with Equal-Distance Edge Additions 》(作者:汤龙坤,陆君安,陈关荣)最近刚刚录用,这篇文章我们大概做了将近一年,在研究过程中,对 NW 小世界网络模型有了新的认识,真正体会到:随机加边 才让世界变得更小 ! NW 小世界网络模型是在邻近规则网络基础上随机化加少量的边生成的网络。我们把邻近规则网络(就取环状网络)上两个节点 i 和 j 的距离记为 dij, 我们做的事情是 构建了一种 等距随机加边的网络 ,在 环状网络基础上 固定相同的加边距离 进行 加边,大规模多次地计算这种 固定加边距离的 网络的平均距离和 Laplacian 矩阵的最小非零特征值。选节点数 N=2000 的环状网络上,固定相同的加边距离 d (譬如 d=50,100,150,…,1000 )加边(边数由加边概率 p 控制),加的边数从 10 到 600 ,显然,加的边数越多,网络的平均距离越小(同时 Laplacian 矩阵的最小非零特征值也越大,同步能力提高)。可是, 没有预料到的现象 发生了,当固定加边概率 p 条件下,平均距离(或者最小非零特征值) 关于加边距离 d 是波动的 ,而且在某些 d 值上达到极小值(或者极大值),也就是某些 d 值的加边方式比另外一些 d 值的加边方式产生的网络平均距离小,同时这个极小值(或者极大值)不随加边概率 p 而变化。然后我们计算在环状网络上随机地加边( NW 网络 ),边数与 固定相同加边距离的方式一样多 ,于是 发现了更重要的结果:随机加边网络的平均距离比固定加边距离的网络的平均距离的极小值还小得多,最小非零特征值比固定加边距离的网络的最小非零特征值的极大值也大得多 。这就说明人为 刻意地固定加边距离构造的网络,远不如随机加边构造的网络具有小世界的性质,同步能力也远不如随机加边的网络来得好 。 那么 这究竟 是什么原因呢?当在 邻近规则网络上随机加边时,对于固定的两点,就能够提供 “ 丰富多彩”的 d 的加边可能 ,从一个点到另一个点,就有 很多优选的可能 ,从而很容易取得最短路径,而 固定加边距离却不能提供“ 丰富多彩”的 d 的加边可能,所以 随机加边 更有利于平均距离的缩小,更加 有利于节点之间的 “ 信息交流 ” ,从而更有利于同步;而刻意的取一种 d 的加边方式并不有利于节点之间的 “ 信息交流 ” 和平均距离的缩小。这一发现使我们对 NW 小世界网络有了新的认识: 随机加边的 NW 小世界网络具有天然的优越性,随机加边才让世界变得更小! CHAOS_accepted_April-2012.pdf
个人分类: 生活点滴|7029 次阅读|10 个评论
小世界网络上的信息传播
热度 15 babyann519 2011-11-24 15:58
小世界网络上的信息传播
The small world yields the most effective information spreading Linyuan Lu, Duan-Bing Chen and Tao Zhou NJP 13 (2011)123005 The small world yields the most effective information spreading.pdf 在以往的文献中,人们在研究网络的传播过程时通常采用统一的模型如 SIR ,或基于此模型的变种。网络中有一条谣言,所有知道这个谣言的人都是已感染人群( I ),所有不知道该谣言的人群都是易感人群( S )。那些知道了但是没有兴趣再传播的人被视为免疫的人( R )。开始的时候随机选择一个节点释放谣言,而且只有他的邻居有可能知道这个谣言。当网络中没有易感染人群(谣言活跃用户)的时候传播结束。 Sudbury 最早在完全随机网络中进行研究,发现可以感染 80% 的人。 Zanette 在小世界网络中进行研究发现可以感染的人数小于 80% 。以上的两个研究都是基于同质网络的,即度相同。 Liu 研究了传播比例和网络结构的关系。他考察的是异质度网络。 Zhou 进一步考察了不同的网络结构的影响,发现随机网络(度不相同)的传播比无标度好,而同质的随机网络传播最好可达到 80% ,这与 Ssudbury 的结论一致。 总的来说已有的工作结论很明显,使用 SIR 模型后发现规则网络传播能力最差, SW 好一些,最好的是随机网络,而同质的随机网络( HMER )效果最好。即 RESWERHMER 那么使用 SIR 模型来研究信息(或者行为)的传播是否合适呢? Centola 在 Science 上发表的实验结果给了我们一定的启发。 显然,信息的传播和疾病的传播有着明显的本质上的区别,体现在如下几点: 1) 信息传播具有记忆性,疾病传播没有。( Memory effects ) 在疾病传播中,这次接触有没有感染疾病与下次接触的结果是相互独立的,因此没有记忆效应。而信息传播具有记忆性,这次传播可能不成功,但是这个结果会累积,并影响下一次的结果。 2) 信息传播具有社会加强作用,疾病传播没有。( Social reinforcement ) 一条信息如果我只听到一次可能有所怀疑,但是听多了就可能相信了。 3) 对一条信息来说,传播的每条链接一般只用一次,疾病传播可用多次。( Non-redundancy of contact ) 人们可以进行多次的身体接触,但是一般不会将一条信息告诉同一个人多次。最恰当的比喻就是“一个妓女可能会孜孜不倦试图把艾滋病传染给你,如果她自己不知道而且你持续付钱的话;但是,一个八卦消息同一个人不会向你说十遍,祥林嫂除外!——周涛” 特别注意的是,对于那些可信性不容易被验证的信息而言,如谣言等, 1 )和 2 )的效应更加明显。而对于那些可信性强的信息,如权威网站发布的官方信息, 1 )和 2 )的效应较弱,使得传播过程更倾向于传统的 SIR 模型。 基于以上三点考虑,我们提出一个简单的模型。每一时间步,每一个体处于四种状态之一: 1 )不知道( Unknown )——个体还不知道该信息,类似于 SIR 模型中的易感人群。 2 )知道( Known )——个体听到了这个信息,但是由于不确定信息的准确性因此不愿意传播(在此假设人们只愿意传播可信的消息)。 3 )确认( Approved )——个体确认了该消息并进一步传播给他的邻居。 4 )疲惫( Exhausted )——个体传播了信息后对该信息失去兴趣,相当于 SIR 模型中的免疫态。 模型假设节点在时间 t 确认该信息的概率为 P(m)=(lambda-T)exp +T , 其中 m 为截止到 t 时刻,个体接收到的信息次数, m 在此体现了信息传播的记忆性特征。 T 为最大确认概率。参数 b 体现了社会加强作用的强度, b 越大,社会加强作用越大。 Lambda=P ( 1 )表示只听到一次信息就确认的概率。 在规则网,小世界和随机网络上做实验。结果发现,在 lambda 较小的时候规则网络的传播比随机网络更快更广。随着 lambda 的增加,随机网络的优势逐渐体现,达到某一临界值的时候随机网络表现得更好。而当 lambda 很大的时候,也就是说只听到一次就确信的时候(权威发布的信息)网络结构对最终确认人数的影响并不大,但是随机网络的传播速度更快。进一步的,实验结果显示临界值随网络规模呈现一个非单调递增的趋势:先迅速减小,当规模足够大的时候基本稳定在一个很小的值。这个结果使得我们有些质疑 Centola 的实验是否能够在更大规模的网络上成功。 在规则网络上引入一个很小的随机重连的概率后,网络具有了小世界特性。实验发现,在我们新提出的模型框架下小世界网络的传播效果更好。最优的断边重连概率随参数 b 的增加呈现单调递减的趋势,并且这种趋势不受网络规模的影响。 除本文考虑的三点区别外,信息和疾病的传播还存在以下不同: 1) 信息传播随时间衰减迅速,人们的兴趣本身就会随时间衰减。在当今的社会,信息的时效性是信息价值的重要组成部分。试想,当你兴致勃勃的告诉大家一个消息的时候,却换来这样的回应“你不是吧,这个我们早知道了!”是多么尴尬的事啊。而疾病可以存在上千年,不管是昨天,今天还是明天他都在那里,阴魂不散! 2) 信息传播中不同类型的边的传播能力和方式不同,而疾病传播则没有太多区分,疾病传播中接触强度只会造成传播概率差异。 3) 信息传播的效果受到信息内容的影响。人们更容易关注,接受和传播感兴趣的内容。而疾病,不管你爱或不爱,他就在那里等着你。 4) 信息传播中每个节点的影响力不同,人们更倾向于相信权威的话。而在疾病传播中人们不会因为经常与权威人士接触而更容易得病。 可见在信息传播中,人们的主观能动性起到很重要的作用,而在疾病传播中人们完全是被动的。 虽然本文模型很简单,但是实验结果在很大程度上纠正和完善了人们对信息传播的传统认识。当然,文章还有很多不足之处,谨以此小文抛砖引玉,期待更多的相关研究。 参考文献: 1. A. Sudbury, J. Appl. Prob. 22 (1985) 443. 2. D. H. Zanette, Phys. Rev. E 64 (2001) 050901 (R). 3. D. H. Zanette, Phys. Rev. E 65 (2002) 041908. 4. Z. Liu, Y.-C. Lai, N. Ye, Phys. Rev. E 67 (2003) 031911. 5. Y. Moreno, M. Nekovee, A. F. Pacheco, Phys. Rev. E 69 (2004) 066130. 6. J. Zhou, Z. Liu, B. Li, Physics Letters A 368 (2007) 458. 7. Damon Centola, The Spread of Behavior in an Online Social Network Experiment, Science 329 (2010) 3.
个人分类: 科研工作|12775 次阅读|46 个评论
世界"六度分离"的起源,记研究生阶段我的第一篇PRL
热度 19 yhu 2011-3-10 01:52
傍晚散步回来,打开邮箱,发现编辑部的通知,我们最近的一篇论文已经在网上发表了。看见她正式发出来,稍微有点兴奋,当然发表的杂志影响力高是原因之一,最主要的是这篇多磨难的论文终于发表出来了。从 2009 年初,我开始思考这个问题,到 2009 年末基本完成,包括附录中的数学解析,再到和编辑审稿人两个来回,终于让编辑和审稿人明白这个问题重要性直到发表历时 2 年有余。 本文实际上可能解决了复杂网络和人类动力学研究中的一个及其重要的问题。半个世纪前( 1969 Sociometry )著名的社会心理学家 Milgram 做了一个很有影响的社会实验,用以研究真实社会中朋友关系网络传递信息的能力。试验开始阶段随机选择了 296 位实验者让他们传递一封信件给居住在波士顿郊区的一个股票经纪人,实验者仅被告知包括该股票经纪人的居住地点等在内的个人信息。同时要求实验对象只能够通过认识的朋友传递信件。最终共有 64 封信件被成功送达,并且所有成功路径的平均长度大约为 6 。该实验结果显示我们的世界是 六度分离 的。 Mligram 的实验使人们意识到真实的社会网络中任意两个人之间都存在着很短的平均路径。但是这个实验所揭示的除了( 1 )社会网络中任意两个人之间都存在着很短的平均路径外还有一个重要的事实就是( 2 )社会网络中的个体能够根据局域信息高效地找到短的路径( 1999 Kleinberg Nature )。 Kleinberg 给出了一个非常绝妙的证明,他严格证明了如果假设朋友之间的距离分布为幂侓分布的话,当且仅当幂侓指数为 -1 时,个人才能通过局域信息高效的进行信件传递,也就是 Navigation (个人将信息传递给他 / 她所有朋友中离目标点地里位置上距离最近的人直到传给目标点为止)。这在计算机等领域有着及其重要的潜在用途,也正是出自于对此证明的欣赏和论文的优美才引导我去继续思考这个问题。 Kleinberg 的论文实际上带给我们一个重要的问题,如果 Kleinberg 对社会网络空间结构及其 Navigation 猜想是正确的,那么社会网络中为什么会存在这种特殊的幂侓结构呢?如果 Kleinberg 的猜想是错误的,那什么又是正确的 Navigation 呢?不论如何,这里必须有个非常重要问题没有解决。带着这个疑问,查阅了一些论文,由于不同领域在写法上误解,很多人都认为 Kleinberg 证明的最优幂侓分布(密度函数)指数为 -2 (只看结论不看详细证明的人几乎都这样认为,详细见论文)。实证中最容易测得的是分布函数的指数为 -1 ,这连个指数意义是不一样的。通过分析后来我们发现实际上所有的实证都指向 Kleinberg 的猜想是正确的!居然幂侓指数为 -1 的这个分布在如此复杂的社会中,如此色彩缤纷的社会网络中竟然是普适的!普适的,就是物理的! 接下来要回答的是,为什么社会网络中会存在这种普适的物理的空间结构?这种结构对个人有什么好处?放在心中不时地思考大概 2 个多月,有很多种方案,在这种特殊的空间结构下也看到了一些有趣的现象。最后在考虑到人们之间保持朋友关系需要代价并且这个代价和朋友之间的距离正相关时,一个人最佳的交朋友的方式就是在他能够给出的代价下,使得朋友关系网络的多样性最大,这也意味着他的朋友关系网络能给他带来最大的信息量,在这样约束条件与目标函数下,最优的空间分布就应该是实际的分布。当计算机模拟显示出这一猜想对应的和实际情况分布完全一样时,虽然没法做社会实验,但是自觉告诉我们这个理论及有可能是正确的,因为模型十分简单,有人也评价为优美。往往简单优美的东西就是自然地东西!无论如何至少我们发现并在国际上第一次提出这个重要问题。记得 2010 年在威尼斯国际复杂网络会议上,狄老师介绍讲完这个工作后 ( 狄老师开始让我去讲,我英语不好,不敢上 ) ,由于当时把我们安排在一个比较偏僻的报告厅,很多人都没有听着,后来与会者不少知道我们可能解决了这个问题,散会后,很多人都围着狄老师又重新讲了至少 3,4 遍,他们才放我们去吃饭,当时狄老师樊老师带着我们组的几个同学(我第一次出国),大家都觉得特别有面子。(博文如有错别字都是输入法的问题,呵呵)。 论文PhysRevLett.pdf SupplementaryEntropy.pdf
个人分类: 未分类|10547 次阅读|42 个评论
复杂网络的分形与自相似
热度 3 supermac 2010-11-5 20:13
复杂网络的分形与自相似 用模块生成的等级网络具有一个明显的特征就是自相似性,是分形的一个基本特征。讨论复杂网络中的自相似问题有如下几篇重要文献: 显然, Song 、 Havlin 和 Makse 的两篇文章享有最高的引用率。 在文献 中,作者先提出了一个疑问,即现实世界中的很多网络具有小世界特征,意味着网络的平均路径长度随网络规模对数增长,L(N)~logN ,等价表达式为 ,自相似则要求二者之间是幂律关系。但是,跟多具有小世界特征的网络,如 WWW 、社会网、 PIN 、细胞网等在某种长度标度下具有自相似性。那么该如何协调这个矛盾呢?作者将 20 世纪 30 年代就已经开始在整形空间中使用的盒计数法推广到了复杂网络中,定义盒子尺寸lB 为盒子中任意两点之间的距离都小于lB ,然后节点不重叠地覆盖整个网络,并保证所用盒子数NB 最少。如果有 ,则网络是自相似的,dB 为分形维数,也称为自相似指数。然后作者对网络进行了重整化,证明在整个粗粒化过程中,网络都具有无标度性和自相似性,即度分布在重整化下的标度不变性。作者还介绍了一种簇增长法并与盒覆盖法进行了对比,研究了多个标度指数之间的关系,这里暂不讨论。这篇文章的最大价值应该在于找到了判断复杂网络是否自相似的途径,就是用盒覆盖法对网络进行重整化,若这个过程中度分布的标度不变,则网络是自相似的。 随后,他们三人又写了另一篇文章 来讨论复杂网络上分形结构的起源。开头提到分形的概念 the structures of which look the same on all length scales 显然是一种各个标度上的相似。文章通篇以具有拓扑分形的 WWW 、 PIN 、新陈代谢网和不具有拓扑分形的 Internet 为例来介绍展开讨论。作者认为分形网络一般具有小世界特征和无标度特征以及等级结构,随机连接和优先连接都不能解释分形现象。作者发现无标度网络模型不具有分形特征。分形结构源自一种相关的自相似模块方式增长,而不是优先连接模型的不相关式的增长。自相似的分形网络的出现是由于所有长度标度上 hub 节点的强烈相互排斥引起的。换句话说, hub 节点倾向于连接具有较少连接的节点而不是其它的 hub 节点,这种效应可看作有效的 hub 排斥。在这样的模式下,尽管还有穷人,但富人更富。换句话说, hub 节点通过优先连接那些连接较少的节点来增长,以生成鲁棒性更强的分形拓扑。相比之下,较弱的反相关或不相关增长则导致非分形的拓扑结构,如 Internet ,这样的结构是自相似也有小世界特征,但非分形, hub 节点相互连接使得网络容易遭受蓄意攻击。这种自相似的组织方式也可以产生等级结构。 这两篇文章中,作者并不严格区分分形和自相似的概念,基本是等同的,只是表达的侧重点不同。自相似偏重于描述标度不变性,整体与部分,部分与部分相似;而分形则侧重于描述整体的拓扑结构和鲁棒性。 不久后, Gallos 又与 Song 和 Makse 合作写了一篇关于网络分形和自相似的小综述。文中澄清或阐明了这么几个问题: 1.fractality 指的就是不同标度上的自相似。 2. 分形与小世界的矛盾点在于网络中甚至不存在不同的长度标度,因此这两个特征在同一个网络中无法共存。这句是原文翻译,我没大看懂,大概是因为这句话原本就是讲不通的,分形和小世界可以和平共处。 3. 判断网络分形的方法就是盒覆盖法,然后看是否满足 。分形网络具有有限的维数,而非分形网络的维数趋于无穷大 。 4. 尽管传统的分形理论并不严格区分分形和自相似,但是在复杂网络的研究领域中这两个性质是截然不同的。分形网络指那些维数取有限值的情况,而自相似网络指在重整化过程中具有标度不变性的网络。 5. 所有的分形网络都属于无标度网络类。 6. 分形结构对网络的影响在于鲁棒性、网络流和模块化。 文献 研究的也是无标度网络中分形的起源,用的工具是最小支撑树。文章引言部分先对几个重要概念下了定义,小世界和无标度无须赘述,作者将NB 和lB 之间的幂律关系 定义为分形标度 (fractal scaling) ,而自相似性指度分布的标度不变性 (scale invariance) 。作者证明了网络的分形拓扑源自于低层的支撑树结构。作者验证网络是自相似的方法是用盒覆盖法对网络进行粗粒化,如果用不同尺寸的盒子覆盖网络,以及在连续的重整化过程中网络都具有标度不变性,则称网络是自相似的。 类似的,文献 将幂律关系 定义为分形行为 (fractal behavior) ,那么于是产生疑问是否可以理解为,判断是否分形的标准是 而判断自相似的标准是标度不变性?是否需要同时满足标度不变性在用不同尺寸的盒子覆盖网络和连续的重整化过程中都成立才能称为自相似?若满足关系 的网络就是分形的,如果又发现标度不变性不存在,则网络就不具有自相似性了?分形但不自相似这岂不与分形的概念相左?文献 还提到在等级网络中,除了小世界和无标度特征,存在聚类系数和节点度之间的幂律关系 ,是否意味着等级网络必然是小世界和无标度的? 网络拓扑性质之间的相互关系 1. 无标度与小世界:二者是复杂网络的两个重要特征,没有必然联系,小世界网络的度分布可以服从幂律,也可以服从指数分布,如 WS 小世界模型。 2. 无标度与等级结构:无标度网络中必然有少量节点拥有大量连边,即 hub 节点,其它节点只需要连在 hub 节点上就可以连入网络,因此不需要太大的度,也不需要相互连接。因此 hub 节点的聚类系数必然小,也就是度与聚类系数的反比关系,这样就有可能出现等级结构要求的幂律关系 。当然了 hub 节点之间的连接方式对网络结构也有重要影响,如前文所述的 hub 吸引与 hub 排斥。 3. 小世界与分形:完全的 hub 吸引( hub 节点只和其它 hub 节点连接)使网络任意两点间存在捷径的可能性大大增大,最短路径长度缩短,即小世界,但此时是没有分形结构的;而完全的 hub 排斥会产生分形结构但与此同时会破坏小世界效应。但实际上网络的形成机制不可能这么单一,必然是两种方式的结合,因此网络既可以是小世界的,同时又是分形的。 4. 无标度与分形:目前的无标度网络模型如 BA 模型等都不能产生分形结构,但是实际中存在分形无标度网络,二者并不矛盾。 5. 分形与自相似:很多现实网络无论是否分形都具有长度标度不变性,即自相似网络未必都有分形结构。 6. 分形与等级结构:分形 / 自相似网络经常是具有等级结构的,描述了系统的模块性。 关于上面提到的几点疑问,哪位老师能不吝赐教,小生不胜感激! 参考文献: 1. 苗东升,系统科学大学讲稿,中国人民大学出版社, 2007 ,第 24 讲,分形理论。 2. 汪小帆等,复杂网络理论及其应用,清华大学出版社, 2006 ,第 2.8 节,复杂网络的自相似。 3. NATURE_433_2005_392--Self-similarity of complex networks. 4. Nature Physics_2_2006_275-281--Origins of fractality in the growth of complex networks. 5. Physica A-386-2007-686-691--A review of fractality and self-similarity in complex networks. 6. PhysRevLett_96_018701_2006--Skeleton and fractal scaling in complex networks. 7. PhysRevE_77_045101_2009--Self-affine fractals embedded in spectra of complex networks. 8. Physica A-375-2007-741-752--Exploring self-similarity of complex cellular networks. 9. Physica A-388-2009-2227-2233--Modeling complex networks with self-similar outerplanar unclustered graphs.
个人分类: 科研资料|17829 次阅读|18 个评论
小世界与超级村长
songshuhui 2010-2-28 11:51
奥卡姆剃刀 发表于 2010-02-28 10:08 首先考考您,是这么道题:说村里的一位王嫂从电视里看到了海地的地震孤儿,精心准备了一份小礼物想送给他,但是通过电视只了解到了孤儿的姓名和所在的地区,王嫂从来没出过门,也不认识出过国的朋友,这份礼物该如何送达呢?于是想到了找村长代转,虽然她知道村长跟那个孤儿也是八竿子打不着,但在她认识的所有人当中,村长是交际最广的一个。村长也很帮忙,找人代转,一级级直到完成任务。 凭您的想象力,您认为代转的中间人大约会有多少个呢? 美国哈佛大学社会心理学家斯坦利.米尔格拉姆(Stanley Milgram)在1967年做了一项社会调查,其结论是:地球上任意两个人之间的平均距离是6,也就是说,平均只要通过5个人,你就能与地球上任何一个角落的任何一个人发生联系,六度分离的说法由此确立。2003年8月,Science杂志报道了一项在互联网上进行的类似实验,研究方在13个国家里随机确定了18名目标对象,并征集了166个国家和地区的6万名志愿者,要求他们通过找熟人转发的方式把邮件发给这些目标对象,其中有384封邮件完成了任务,考察其送达过程,发现邮件平均转发了6次。所以,我们可以推断,王嫂大概只需要5个中间人帮忙就可以把礼物转给孤儿,如果运气好的话,3、4个就行了,这个数字是不是要比您想像的要小得多呢? Kevin Bacon 为了验证六度分离推断的正确性,人们又做了很多实验,其中一个名为Kevin Bacon游戏的实验非常有趣,这个游戏的主角是美国电影演员Kevin Bacon,就是上图中那个不太帅的小伙子。游戏给每一个演员都赋予了一个Bacon数:如果某人跟Bacon共同演过电影,则他的Bacon数就是1,如果某人没跟Bacon共同演过电影,但跟Bacon数为1的演员共同演过,那他的Bacon数就是2,以此类推。实验涉及60万名世界各地演员和30万部电影,并得出了Bacon数统计表,如下图所示。通过这个表可以看出,绝大多数演员通过不超过4部影片就与Bacon发生了联系。当时设计这个实验的计算机专家Brett Tjaden称Bacon是世界电影界的中心,这当然是戏谑,其实换任何一个人当这个游戏的主角,例如王宝强,结果也差不多。Bacon数数据库支持在线查询,输入任何一个演员的英文名,就可以查到他的Bacon数,地址是: http://www.cs.virginia.edu/oracle/ ,你可以去输入自己心目中的偶像过把瘾。 Bacon数统计表 一群人或团体按某种关系连接在一起,将会构成不同的社会网络,例如人际关系网、电话网、交通网等。自上世纪60年代以来,这些网络都是按随机网络来进行研究的。下面图中的a图就是随机网络,b图是无标度网络,两者都包含130个节点和215条链路,红色节点是连接度最高的几个节点,绿色节点是红色节点的直接邻居,在随机网络里面,绿色节点占27%,无标度网络里面占60%。 以人际关系网为例,随机网络指每个节点与外界的联系是随机的,绿色节点没有刻意要先跟红节点连接,而无标度网络中,周边的绿色节点跟其它节点的联系很少,好像王嫂一样,但她谁都可以不认识,却不能不认识村长。村长则认识一些靠近关系中心的人,这些人在社会上神通广大,之间的联系更多更紧密。无论王嫂是想去城里看病还是打官司,人托人找关系,用不了3、4步总给找到能给她办成事的人,当然人家愿不愿意给她办就是另一回事了。 当前的各种社会网络已经越来越脱离了随机网络的形态,而向小世界模式迅速转变。大家在建立自己的社会关系时,都是以最快找到能帮我办事的人为原则。于是乎,社会关系广的人被结识的速度,就远远大于像王嫂这样的人。随着网络中人数的增加,这种人际关系权重的差别就越来越大,形成了极端不平衡状态。b图是无标度网络,无标度表明的是一种差距巨大的状况:一头大象和一只跳蚤比体重,用什么标度单位呢?若用毫克,大象的值就大得惊人,若用吨,跳蚤的值又小得可怜,它们的体重差异度太大,以致于用什么标度都不合适,干脆就不使用标度了。 无标度网络有两个核心特性,一是增长性,二是优先连接性。增长性是指网络在不断扩充,网络节点权重的巨大差别,是在网络规模不断扩充的情况下形成的,而不是静态的结构重组。优先连接是指新加入的节点,总是倾向于跟重要的节点相连接,从而使其愈加重要。 上面这段话好像有点晦涩,但其实讲的道理非常简单,还是以上面的村子为例,里头人际关系网的无标度性是如何形成的呢?首先要有外来户不断加进来,而不是为了突显差异性,去命令人们都跟王嫂绝交而去结识村长。外来户要想在村里立住脚,就要以最快速度结识村里更多的人,找交际广的人当然最方便,不二之选就是村长,长此以往,随着村子规模扩展,村长结识新人的数量与王嫂结识的人数相比,差距越来越悬殊。 不是你不明白,这世界变化快。不仅人际关系网,电话网、互联网、交通网等等也都越来越向无标度的小世界网络方向发展。特别是互联网,它的增长性和优先选择性特别突出,其结构就非常不平衡,以前有人说20%的人掌握着80%的财富,现在则是1%的博客吸引着99%的眼球。如果您想找到失去联系的前女友,我建议您在韩寒这位超级村长的博客蹲点,抢占沙发并把寻人启示贴上去,言辞一定要悲切得呕血让人觉得不帮忙就跟看《孔子》不哭一样简直不是人这招绝对比在电线杆子上刷一万张寻人广告有效得多。 北美航线图 由上面的北美航线图可以看出,纽约或休斯顿机场的航路比其它小机场多得多,根本不在同一个数量级,而且随着经济的发展,这种差别会越来越大。与传统领域相比,信息领域的无标度化更为惊人,下图是国际电话网的流量示意图,红线的流量是蓝线的1千万倍,而且越红的线越倾向于聚集在一起,聚集后形成了不断加速扩张的超级节点。 国际电话网的流量示意图 当下,各种社会网络正在变得越来越不平衡,越来越无标度化,这给我们带来前所未有的高效率,但同时也带来了前所未有的危险,由于对超级节点的过份依赖,使得因超级节点的崩溃而造成的损伤也越来越惊人,美国一个工厂事故导致了半个美国停电,中国一场大雪就引起了重大的灾难。 不过,现在已经有了一些成功的应对办法,举例来说,美国的电信网络管理中心一定是个聚集度越来越大的超级大节点,如果它失效了,星条国就会乱套。于是该国有关部门分别在东西海岸建了两个网管中心,各备全套的数据,都能独立支撑起全部业务。平时两个中心完成的任务量三七开,而且轮流唱主角,一旦某个中心崩溃,另一个能几乎实时地把全部业务接过来。这就是对超级节点的热备份方法。 无标度网络不怕随机攻击,因为影响全局的超级大节点的数量是极少的,例如上级随机关闭几个博客,几乎可以肯定,倒霉的一定会是那些基本无人问津的博客,因为这种博客一抓一把,访问过千万的博客则寥寥可数。但是上级往往更想收拾那些访问过千万的超级博客,比如找韩寒开涮,这种方式就是智能攻击了。无标度网络怕就怕智能攻击,几个超级大节点一被毁,网络可能就崩溃了,因此某市的黑社会网络,恐怕没十年是重组不起来了。 韩寒这位超级村长该如何保护自己博客的安全呢?备份当然是个好办法,而且备份方式的差异度越大越好,以应对不同的攻击手段和策略。例如在传统媒体而不是网络上备份,一旦网络全面崩溃,再多的镜像也化为乌有,但我的杂志还在。但是,这招对文化市场整顿无效,韩寒可以把备份放在美国和俄罗斯,毕竟,中美俄三国联合发文对文化市场进行整顿,在可以遇见的未来不可能发生。 科学编辑: fwjmath 文字编辑: 小庄
个人分类: 计算机科学|1886 次阅读|1 个评论
[转载]世界是如此的小(附简评)
Fangjinqin 2010-2-25 08:51
◇◇新语丝 (www.xys.org)(xys4.dxiong.com)(www.xinyusi.info)(xys2.dropin.org) ◇◇ 世界是如此的小 方舟子 简评:方舟子在这篇科普文章中通俗地介绍了小世界现象(效应),文章还发在中国青年报上,有利科学知识的普及。但是,该文的不足是,没有介绍 Duncan J. Watts and Steven Strogatz 1998 年发表在 Nature (英国自然)杂志上,题为 Collective dynamics of. 'small-world' networks的 文章内容,这篇关于复杂网络中的小世界特性,近 12 年来几乎是众所周知了,难道谁还不了解?为什么没有一点点介绍?这对于善于撰写科普文章的方家同胞,我觉得多少令人有点惊讶!?也恐怕没能完全满足广大中国青年的求知的愿望。因此,我建议,如果有可能进一步调研后,能够加以完善。 1967 年,美国社会心理学家米尔格兰姆从哈佛大学向内布拉斯加州和堪萨斯 州的 296 名居民写了一封信,请他们参与一项科学实验,将一本印刷精美的哈 佛大学护照转寄给波士顿的一位股票经纪人。米尔格兰姆给出这位经纪人的 名字,但是没有告知地址。如果参与实验者认识这位经纪人,就直接寄给他, 否则就寄给他们认为最可能认识此人的亲友代为转寄,如此持续下去,直到寄 到经纪人手里。寄的时候在护照上记下邮寄记录,并给米尔格兰姆寄一张明 信片,让他知道这些护照的行踪。 大部分的护照没有到达目的地,因为收到它的人并没有按要求继续去 寄它。有 64 份护照最终寄到了经济人手里。有的只经过一、两个人就寄到 了,有的则经过九、十人的辗转相托,平均来说,寄了 5.5 次。这个实验似乎 验证了此前有人提出的一个假说:最多经过 5 个人,也就是经过 6 步,就可以把 世界上的任意两个人联系在一起。这后来被称为六度分离。 虽然米尔格兰姆的实验结果由于设计和操作上的缺陷,受到了一些心理学家 的质疑,但是其他的实验结果也表明,世界的确不大。在互联网的时代,人们 不再习惯通过邮局寄信,可以改用电子邮件重复米尔格兰的实验。 2002 年,美 国哥伦比亚大学大学的研究人员向 166 个国家的 6 万多网民发去一封连环信,请 他们转给随机选中的位于 13 个国家的 18 名收信者之一,结果发现大部分信件在 转了 5 ~ 7 次后就寄到了收信人。 2007 年,微软研究人员对 2 亿 4 千万名 MSN 用户 的 300 亿条短信进行分析,发现 MSN 用户之间的距离是 6.6 步。 世界是如此的小,因为这并不是一个有序的世界。如果世界是有序的, 人与人之间的距离有时会非常遥远。如果你要把一个围棋子从棋盘的一端 很有秩序地沿着连线一步一步地移到棋盘的另一端,将会有很多步。但是如果 在移动时允许时不时地走捷径一步跳到远处的点,就会很快地抵达目的地。 在现实世界中,人们的交往有一定的秩序(例如有相似背景的人容易相互认识), 组成朋友小圈子,但是也时不时会结识其他朋友圈的人正是这些捷径 让世界变得很小。在这个小世界中,如果有 3 亿人(等于美国人口的 90 %, 假定剩下的 10 %为忽略不计的儿童),每人认识 30 个亲友,那么可以算出人与 人之间的距离是 5.7 。如果有 60 亿人(等于世界人口的 90 %),人与人之间的 距离则是 6.6 。 在世界上还有很多更小的世界,其成员通过某种特殊的形式联系在一起。 例如在数学界,数学家们通过共同发表论文发生联系。有史以来发表论文最多 的数学家据说是匈牙利数学家鄂尔多斯( 1913 ~ 1996 ),他一生发表了大约 1500 篇论文。这些论文大部分是和人合写的,鄂尔多斯的合作者多达 511 位。 鄂尔多斯的多产在 1969 年引起注意后,数学界开始用鄂尔多斯数来表示某 个数学家与鄂尔多斯的距离:鄂尔多斯本人的鄂尔多斯数是 0 ,他的论文共同 作者的鄂尔多斯数是 1 ,与这些人合写过论文的人的鄂尔多斯数是 2 ,依此类推。 当代大部分数学家( 20 多万人)都能如此这般与鄂尔多斯发生关系,获得自己 的鄂尔多斯数,平均是 4.65 。 在电影界也有一个培根数。美国演员凯文培根以多产著称,他在网 上被称为好莱坞宇宙的中心,据说好莱坞的所有演员都能在银幕上直接或 间接地与他联系上,不多于 6 步。在上个世纪 90 年代美国因此出现一种凯文 培根的六度游戏。在现在网上有程序可以自动算出某个演员的培根数, 比如章子怡的培根数是 2 :她在 2007 年动画片《忍者神龟》中与劳伦斯费 歇本一起配音,而后者在 2003 年《神秘河》中与培根一起出演。对互联网电 影数据库的统计表明,全世界有一百多万名演员都能和培根拉上关系,平均 培根数只有 2.98 。 实际上培根并不是好莱坞宇宙的中心,有 500 余名演员比培根更中心 其他演员更容易和他们联系上。他们的差别并不大,与他们联系的平均步数都 在 2.7 ~ 2.9 。并没有哪个演员特别突出。类似的,在物理学界有爱因斯坦数, 在围棋界有秀策数(秀策是 19 世纪日本棋圣)。有趣的是,由于鄂尔多斯 曾经在纪录片中露过脸,又喜欢下围棋,所以他既有培根数( 4 ),也有 秀策数(不多于 5 )。 世界很小,这个发现并不只是用来玩游戏,还有更实际的意义。例如,它 让我们明白,一种新兴的传染病能够以可怕的速度传播,从一个偏远的地方很 快地传遍全世界,只需要一、两个远途旅行者,他们提供了联结世界的捷径。 只有当人们彼此能够交流时,世界才会变得很小,否则,世界就会大到像 是在不同的世界。当米尔格兰姆做连环信实验的时候,中国正在进行文化大 革命。如果米尔格兰姆把收信人设为某个中国人,其结果可想而知:那些 护照将会被挡在国门之外。外来的糟粕,例如传染病,也难以进入闭锁的 国门,代价是,新的思想、观念同样难以传入。一个与世隔绝的世界,注定是 一个落后的世界。 2010.2.21 (《中国青年报》 2010.2.24 ) (XYS20100224)
个人分类: 信息交流|2857 次阅读|5 个评论
Beyond scale-free and small-world---庆祝复杂网络论坛圈子成立
热度 1 yangfanman 2009-11-26 13:55
在复杂网络研究领域有很多经典文章,但有两篇可以称为经典中的经典,是绝大多数研究者都读过的。一篇是98年Watts和Strogatz的Collective dynamics of 'small-world' networks,提出了改造规则网络成为小世界网络的WS网络模型,同时指出很多实际网络都具有非平凡的small-world特性:同时具有较高的聚类系数和较短的平均路径长度。 另一篇是99年Barabasi和Albert的Emergence of scaling in random networks,提出了基于增长和优先连接的BA模型,并指出很多实际网络的度分布都具有无标度scale-free特性。 这两篇文章掀起了复杂网络研究的热潮,同时也让后来的研究者不断探索各种网络中的small-world和scale-free现象。现在我们已经知道,很多很多的网络具有这两种性质,甚至有些人将这两种性质看成是所有(或大部分)网络的普遍属性。在研究中大家也确实都有这种倾向:做实证网络的,如果研究的网络不具有small-world特性,结果都不好意思给别人看;建立网络模型的,度分布如果不是power-law,都不好意思投稿,直接扔到垃圾堆里面了。 那么这两种特性究竟是否是所有(或大部分)网络的普遍属性呢?先从无标度特性来说,很明显这不是所有网络的普遍特性,否则就没有barabasi在的话早期发现带来的喜悦也不是没有负面影响,促使一些研究者甚至在缺少好的证据的情况下来标注许多无标度网络。呵呵,几位前辈已经指出他自己就是他自己是始作俑者呀(如 http://www.sciencenet.cn/m/user_content.aspx?id=269815 )。而且即便现实中确实有很多满足幂率分布的网络,其物理机制也没有研究明白。barabasi99年的经典文章和以后的书籍《Linked: How Everything Is Connected to Everything Else》里面用增长和优先连接来解释了幂率存在的原因,刚看的时候感觉确实很新鲜也很有道理。可经过这么多年的研究,大家发现能造出幂率分布的方法太多太多了,因此增长和优先连接的机制肯定不能解释所有的幂率分布现象。 另外对于一个实际网络的度分布,固然可以采用非常严密的统计方法,如Power-law distributions in empirical data里面讲的方法进行分析(这一点章老师已经提到,见 http://www.sciencenet.cn/m/user_content.aspx?id=272540 ),但并不意味着确定了网络的度分布以后,对于理解这个网络的特性就有多大的帮助。比如说我们建立了两个科学家合作网,一个网络的度分布刚好够显著性满足幂率分布,一个就差那么一点点不满足,不能看成幂率分布,那么这两个网络的生成机制就一定不同吗?网络的度分布是不是幂律分布已经变成了一个统计学上的游戏了。 对于复杂网络中的小世界现象,从98年的经典论文我们知道,一个规则网络中如果有一些长程边的话,那么这个网络就会具有small-world特性。因此只要一个网络中具有一些确定性(固定的结构模式)外加一些随机性(变化的结构模式),小世界特性就应该存在。我常常问自己,小世界特性是否仅仅是复杂网络的一种平凡性质,有这样性质的网络究竟是不是一个很奇特的网络。 即使我们都相信这种性质确实是复杂网络中很重要的性质,但在不同网络中这种性质的成因也应该是不同的。 在社会网络中,朋友的朋友相互认识是一种普遍现象。配合着社会网络的同配性,我们很容易理解社会网络中人与人是一个又一个小的社团结构形成大的社会。但对于像AS层internet这样的科技或生物网络,它具有较高的聚类系数和强烈的异配性就让人费解了。从异配性的角度理解,度高的点连向度低的点,度低的点再连向度高的点。因此度低的点相互之间不相连,度高的点之间相互之间不相连,那么较高的聚类系数究竟是怎么形成的呢? 实际上internet的聚类系数更多是如下图这样形成的,几个度大的节点形成了richclub,同时也是较大聚类系数的原因。从这个网络的结构可以看到,两个红色节点的朋友之间相互都不认识,因此高的聚类系数并不一定就表示网络中朋友的朋友是朋友这种现象普遍存在。 从以上的分析可以看出,scale-free并不是所有网络的普遍属性,虽然绝大多数网络都具有small-world现象,但其内在机制也可能是不同的。复杂网络的相关研究经历了漫长而又短暂的10个年头,10年来我们最大的收获是加深了对复杂系统的理解,最深入人心的无疑就是很多复杂网络都具有scale-free和small-world特性。 在今后的研究中,我们的目标就是超越scale-free和small-world来更深入地理解和应用复杂系统。一方面,我们要批判地审视这些早已存在的经典概念,固然他们曾经是时代进步的发动机,但目前的研究有理由让我们怀疑复杂网络中是否真的存在这种一统天下的性质或理论。这些批判性思维对我们是一种很好的促进,是绝对需要的声音。(如 http://www.sciencenet.cn/m/user_content.aspx?id=271471 )另一方面,只有在今后十年中出现堪比scale-free和small-world这样经典的工作,复杂网络研究领域才会有较大发展,这一领域才会继续欣欣向荣下去。 虽然科学不断的细化和分工让研究者的日常工作就是在自己的小天地里面精雕细刻,但我们建立的复杂网络论坛圈子给了我们一个更大尺度上相互交流相互理解的机会,期待着这种持续的、不断增强的社会网络交互环境促进我们相互成长,成就我们共同热衷的复杂网络事业。我们的圈子是总结这十年的研究工作而起( http://www.sciencenet.cn/m/user_content.aspx?id=269309 ,方老的一系列评述让我们受益匪浅: http://www.sciencenet.cn/m/user_content.aspx?id=271388 ),也期待着十年以后,不辜负时光的我们能在这一领域描绘出更美好的美景。 后记:作为一名复杂网络领域的后来者,我的粗浅看法可能既不全面,也不正确,欢迎大家批评指正。
个人分类: 时效网络|5048 次阅读|6 个评论
复杂网络之无标度网络与小世界网络生成程序
热度 5 bupt1419 2009-9-21 17:33
近日需要用到无标度网络与小世界网络,早上用matlab写了这两种网络的matlab程序,放在这,有用者可以拿去用,请自己验证正确性后使用。 共有三个文件,swnet.m 是sw小世界模型 sfnet.m 是无标度网络BA模型 scalefree.m 是BA模型的子程序,放在和sfnet.m同一个文件夹里即可 均有简单注释 点此下载complexnetworks
个人分类: 科研笔记|23554 次阅读|26 个评论
网络科学的三大发现
Fangjinqin 2009-7-21 12:10
按语: 本文已经发表在百科知识 2005 年 11 月上半月总第 326 期第 21-22 页.出乎意外的是,去年在网上偶然发现共检索到 10 条读者推荐文章(请看上篇最后附录),这篇科普文章名列首位.现在,我找出来提供有兴趣者看看。我过去写过一些关于非线性和混沌的科普文章发表在报刊上,以后有时间放在这里,希望能够起到科学知识普及作用,我认为这是我的一个责任,与大家交流,并请大家批评指正。 我附上文章的扫描件. 网上读者推荐
个人分类: 科普文章|5164 次阅读|3 个评论
“小世界”(small world)研究五十周年
yangfanman 2009-5-7 16:50
今天看了科学网这个帖子 ,小世界原理、世界小现象实证研究 http://www.sciencenet.cn/blog/user_content.aspx?id=230314 , 好歹咱也是研究复杂网络了,外加今年在social networks正好有两篇有关50年来小世界现象研究的综述,链接放到下面送给感兴趣的人吧。 作者均为:Sebastian Schnettler Center for Research on Inequalities and the Life Course, Department of Sociology, Yale University, New Haven, CT, United States 1. A structured overview of 50 years of small-world research http://dx.doi.org/10.1016/j.socnet.2008.12.004 Abstract This paper offers a structured overview of 50 years of small-world research. Initially formulated by Pool and Kochen in the mid-1950s, the small-world concept can be divided into six research foci, based on three dimensions (structural, process-related, psychological), and two process-related themes (diffusion, search). Building on this analytical distinction, the article provides a historical summary of the different phases of research on the small-world problem, and summarizes the empirical and theoretical progress on different facets of the small-world phenomenon. The paper concludes with a brief assessment of accomplishments and open questions, suggesting some possible future research areas. Keywords: Small-world phenomenon; Social networks; Six degrees of separation; Small-world experiment; Social process; Social structure; Complex networks; New science of networks; Milgram; Social capital; Network dynamics 2. A small world on feet of clay? A comparison of empirical small-world studies against best-practice criteria http://dx.doi.org/10.1016/j.socnet.2008.12.005 Abstract Small-world studies were introduced by Milgram and others in the 1960s and 1970s. These studies, and a majority of variants conducted by others, display a number of methodological weaknesses that bias their results. While no explicit methodological standard exists for these studies, here I derive a number of best-practice criteria for small-world studies by pointing out mistakes of previous studies, and by applying methodological standards from other empirical research areas. Improving the methodology of letter referral studies is important, because such studies could still be useful in a number of contexts today, especially for the exploration of factors affecting targeted search processes. Keywords: Small-world phenomenon; Six degrees of separation; Milgram; Social process; Social structure; Small-world experiment; Experiment; Search; Best practice 想了解小世界现象前世今生的可以看看第一篇文献,想进一步做实证研究的可以读读第二篇文献。
个人分类: 复杂网络|6161 次阅读|1 个评论
概率与复杂性之三:小世界和随机游动
zhouda1112 2009-4-27 12:34
复杂网络中的小世界现象是有点哲学意味的。 它揭示出咱们这个社会,或者其它的一些复杂系统,都存在某种“厚尾”扰动。这种扰动不大不小,恰能使得一些规则系统在经历扰动之后,变得有些混乱,但又没有混乱到杂乱无章的地步。 基础数学研究是以美为最高追求的。所以数学的传统课题所针对的对象都较为规则。即便引入“扰动”,数学家习惯的是“轻尾”扰动,因为轻尾扰动一般不会对系统造成太大的影响。另一个极端是把随机扰动弄得很大。比如大家熟知的ER随机图。 那么当随机扰动不能忽略不计,但又不至于太强势的时候,系统的现象会如何?这也许成为复杂性研究的一个思路。 对应到随机游动。我们可以把简单对称随机游动(就是抛硬币模型)模型看成是规则系统。现在加入扰动,就是隔一段时间,就让粒子“不听话”地蹦到远端,而不是规则的跳到邻居点。这样一来,这种带扰动的随机游动就有可能实现小世界现象。 从测度的观点来看,带扰动的概率模型可以看成是原有概率测度和噪声测度的线性凸组合。这种模型已经得到了很多学科的关注,影响较大的是演化博弈论中的“随机演化策略”理论。
个人分类: 概率论问题讨论|5261 次阅读|1 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-12 08:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部