今天中午Imperial College London商学院的一个博士生Tore Opsahl给我们做一个报告。他并非研究链路预测的,但是却启发了我的研究思路。他关注的是在线社会网络的交流模式,因此报告的题目是Communication in a Facebook-like Community,这篇论文刚刚挂在arXiv上,下载地址是:arxiv:1010.2141. 他的研究思路这样的,利用Facebook中的用户配置文件(留下了很多用户的信息,例如年龄,性别,学校等等信息)考察社会网络中的通讯到底和什么因素相关。用的方法很简单:Logistic回归。抽取数百万条用户的朋友数据,如果一个人加另外一个人为好友,则可以根据这个信息建立一条有向边。根据边的存在与否,利用Logistic做二元回归,即观察有朋友关系和没有朋友关系与哪些因素相关。利用独立变量回归发现,我们倾向与我们同龄,异性,有一些共同朋友的人通讯。进一步用多元回归发现其实我们是愿意与我们具有相同学历,Reinforcement和Reciprocity(sorry这两个因素我没太理解)的人交流。 其实方法和结论都蛮有意思的。也是我喜欢的研究方法将网络中的故事读出来,而并非把所有的故事都抽象成枯燥的点和边。该工作其实严格地讲属于链路预测的范畴,但是讲出的故事,得到的信息比单纯的链路存在与否要丰满许多。不仅知道了交流的存在与否,而且符合哪些特征的人更倾向于交流。但是该工作也有很大的缺陷。第一,Logistic回归的时候输入变量之间的相关性没有检验。也就是说很多因素,例如学历,年龄,学校之间的相关性忽略了。另外,我觉得更为有意思的新加入系统的节点倾向与谁交流没有回答。新加入节点的行为模式对于提高网站的知名度非常重要,没有做这个分析有点可惜了。另外时间序列因素没有考虑到也有些不解。
从10月7日抵达牛津到今天已经近一个星期了,总算把生活琐事都安顿下来了。学院秘书Jennie发来一个本地租房网的信息,找打了一个当地人家。在国内就约好了10月7号上午来看房子,如果可以直接入住。还好一切都很顺利。房东人很好,不用交押金也不用交当月的房租直接让我入住,晚上还开车带我去附近的超市采购了吃的,这样这几天内我不愁没有东西吃。第三天从一个中国人手中花了70镑买了辆二手自行车。说是二手的,其实怎么也有9成心。尽管算成人民币已经700块了,但是觉得车子真好,在国内也要上千了。还好,他也有头盔,车灯,车锁之类的东西,统统全部拿下。 今天已经是正式上班第三天了,三天里其实没干什么活。除了读了一篇关于facebook数据统计的工作,大部分时间都在跑着办银行卡,办初入门卡等等之类的琐事。有意思的是我对facebook是情有独钟,记得8月中欧暑期班的时候我就讲过facebook的用户数已经超过5亿,流量也超过了google,称为天下第一。这才真正标志着Web2.0时代的到来。只有超过google,才能证明Web2.0的力量。很巧,昨天晚上电影院放映讲述Facebook故事的电影《the social network》。由于与研究课题非常相关,于是实验室的所有人都去看了,去了才知道免费。真实太爽了。看了片头才知道,这个故事我在暑假的时候看过了。记得当时当当网刚刚把《facebook:性,金钱,天才,背叛》的书挂出来不久,我就买了一本。电影的情节与书差不多。有兴趣的可以去买本书看看。电影也很有意思,不知道国内能不能看。 看着世界上最年轻的百万富翁的人生轨迹,大家都很兴奋,很开心。CABDyN的负责人很激动地说,明天告诉你们老板好好干,前景太光明了。其实并不尽然,商业和科学研究有相通之处,但链接彼此的通道太过漫长。在我看来,web2.0的兴起为社会网络的研究提供了非常好的契机。我们可以研究个性化时代中在线社会网络中的行为模式,进而分析疾病传播,集群行为,产品营销,知识共享等诸多非常具有实际意义的课题。 手头的这篇文章已经被PNAS接收,马上就要正式发表了,题目是《Spontaneous emergence of social influence in online systems》。分析了facebook中两千多个应用程序在用户间传播的过程。发现这些应用程序可以分类两大类:或者扩散到全网,或者很快消亡。分析过程做的非常漂亮,很干净。这和我最近在做个性化推荐算法时候的发现类似:用户的兴趣分类两大类(流行产品和非常不流行的产品),我想流行的应该是适合大众口味的东西,非流行的才是个性化口味的东西。即一味地追求的流行或非流行的都是不对的。在手头这篇论文中,我猜测流行的应用应该是大众化的东西,例如聊天程序等,而快速消亡的应该就是个性化的应用。
Science , 24 July 2009 (Volume 325, Issue 5939) Special Issue: Complex Systems and Networks Introduction to special issue Connections B. R. Jasny et al. http://www.sciencemag.org/cgi/content/full/325/5939/405 News Ourselves and Our Interactions: The Ultimate Physics Problem? Adrian Cho In the field of complex socioeconomic systems, physicists and others analyze people almost as if they were interchangeable electrons. Can that approach decipher society and what ails it? http://www.sciencemag.org/cgi/content/summary/325/5939/406 Econophysics: Still Controversial After All These Years Adrian Cho Econophysics is the biggest branch of complex-systems research, and physicists have flocked into finance. But many economists view econophysicists as dilettantes. http://www.sciencemag.org/cgi/content/summary/325/5939/408 Counterterrorism's New Tool: Metanetwork Analysis John Bohannon Researchers have created sophisticated new programs to probe beneath the surface of social interactions. How well do they work against terrorists? http://www.sciencemag.org/cgi/content/summary/325/5939/409 Investigating Networks: The Dark Side John Bohannon A few months ago, Lawrence Wilkerson, a former U.S. State Department official and Army colonel, painted a nightmare scenario of how social network science can be applied in a battle zone, outlining something he called the mosaic philosophy. http://www.sciencemag.org/cgi/content/summary/325/5939/410 Perspective Scale-Free Networks: A Decade and Beyond Albert-Lszl Barabsi http://www.sciencemag.org/cgi/content/abstract/325/5939/412 Revisiting the Foundations of Network Analysis Carter T. Butts http://www.sciencemag.org/cgi/content/abstract/325/5939/414 Disentangling the Web of Life Jordi Bascompte http://www.sciencemag.org/cgi/content/abstract/325/5939/416 A General Framework for Analyzing Sustainability of Social-Ecological Systems Elinor Ostrom http://www.sciencemag.org/cgi/content/abstract/325/5939/419 Economic Networks: The New Challenges F. Schweitzer et al. http://www.sciencemag.org/cgi/content/abstract/325/5939/422 Predicting the Behavior of Techno-Social Systems Alessandro Vespignani http://www.sciencemag.org/cgi/content/abstract/325/5939/425 Review Transcriptional Regulatory Circuits: Predicting Numbers from Alphabets H. D. Kim et al. http://www.sciencemag.org/cgi/content/abstract/325/5939/429