科学网

 找回密码
  注册

tag 标签: 社团结构探测

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

欧洲物理快报 (EPL): 半监督的复杂网络社团结构探测框架
shamolvzhou79 2012-10-31 09:06
尽管带约束的聚类问题已经在无监督学习领域中得到了广泛的研究. 然而, 对于复杂网络中的社团结构探测问题, 如何将先验信息作为约束放到模型/算法中来引导探测过程仍然是一个有挑战性的问题. 在本文中, 我们提出一个半监督的网络社团结构探测框架. 这个框架根据先验信息来适当地修改网络的邻接矩阵,从而达到引导探测过程的目的. 这种修改亦可看做是对社团结构一致性矩阵的降噪和重现过程. 简言之, 我们提出的框架兼顾了网络的拓扑结构性质和网络中点的功能信息, 从而能够大幅度提高社团结构探测模型/算法的成绩. 我们将该框架应用于人工合成数据 (GN 网络和 LFR 网络) 和实际数据, 结果表明提出的框架确实能够显著提高探测成绩. 我们觉得这一框架是有趣的, 值得进一步研究. 证据表明复杂网络中经常是有社团结构的. 目前还难于对社团结构给出一个明确的和能够被广泛接受的定义, 一般认为, 网络中的社团结构指的是一个顶点集, 其内部连接是紧密的, 而与网络中其它点的连接稀疏. 社团结构经常是有特别功能和含义的, 发现网络中的社团结构对于从中观视角理解网络具有很重要的意义. 因此, 网络社团结构探测问题已经成为复杂网络分析领域中的一个热点问题. 然而, 几乎目前提出的所有模型/算法都属于无监督学习的范畴, 即意味着这些模型/算法都仅仅利用了网络本身的拓扑结构. 而在许多实际应用中, 我们经常会获得一些关于网络的背景信息和先验知识, 这些信息对于我们发现网络中的社团结构是有用的. 如何结合网络的拓扑结构性质和这些先验信息, 来引导社团结构探测过程是一个有趣的问题, 值得深入研究. 我们提出了一个半监督学习框架试图来解决此问题. 在所提出的框架下, 我们可以很容易地加入两种先验信息: i) Must-link: 即两个点必须是属于一个社团结构的; ii) Cannot-link: 即两个点一定是不属于一个社团结构的. 这两类信息我们在分析网络之前经常能够得到, 比如说, 在蛋白质相互作用网络中, 有相似功能的蛋白质就很可能是属于 Must-link的, 而在社会关系网中, 那些持不同政治观点的人就很可能是属于 Cannot-link的. 实验结果表明我们提出的框架是很有效的. 这里需要说明的是, 我们提出的框架是独立于具体的社团结构探测模型/算法的, 即在基于我们的框架将先验信息导入邻接矩阵之后, 可以使用任何你喜欢的模型来进一步得到社团结构. 文章链接地址: http://iopscience.iop.org/0295-5075/101/4/48005
4152 次阅读|0 个评论
网络社团结构探测和矩阵分解模型
热度 5 shamolvzhou79 2011-10-31 13:24
复杂网络中经常是有社团结构的。对社团结构目前还难于给出一个明确的数学化的定义,可以大体上将社团结构描述为网络中的一个顶点集,其内部连接是紧密的,而与外部的连接是疏松的。许多证据表明,社团结构经常是有其特殊含义的。比如说,在生物网络中,社团结构经常是一个功能模块或者通路,而在社会网中,社团结构经常是由一群持相同观点的人组成,在科研合作网中,社团结构则经常是某一个科研领域等等。比较经典的例子是空手道俱乐部人际关系网,里面有34名成员,分成两个社团结构( )。文献中已经发展了大量有趣的模型来探测复杂社会网络中的社团结构。这些模型根据研究视角的不同大体可以分为两类:图分割模型和分层模型。 图分割模型将网络看做一个整体,经常是通过优化某些描述网络结构的目标函数来达到分割网络的目的, 比如优化模块化函数 Q( )。 具体的模型包括文献 中的方法, 谱聚类模型 ( )以及基于非负矩阵分解的模型( )等.而分层模型则正好相反,正如其名字所表达的那样,其试图建立一个网络中顶点的分层结构或者是树状的聚类结构,该类模型一般有两种:"从下至上"和"从上到下"。第一种类型的模型开始的时候,将每一个顶点看做一个独立的社团,然后逐步地将这些社团合并,而第二种类型的模型开始的时候,将所有的顶点放在一起,看做一个大的社团,然后将这个社团逐步地分割开。具体的模型包括文献 中的方法。 就我个人的看法,我比较喜欢非负矩阵分解类型的模型来处理社团结构探测问题,这个原因主要有两点,第一,网络社团结构探测问题本质上是属于无监督学习的范畴,而非负矩阵分解模型(Nonnegative Matrix Factorization, NMF, )在无监督学习领域获得了成功的应用,包括图像处理,基因表达,文本处理,多媒体数据分析等。总之,NMF具有自动探测数据背后隐藏模式方面的良好能力;第二,本人之前在矩阵分解方面做了一些工作,在感情上比较喜欢这个模型, :-) 事实上,已经有一些工作,使用NMF来探测网络社团结构了,包括 等,其中最近一个有趣的工作是对称非负矩阵分解模型. 尽管已经发展了各种不同的基于NMF的模型来探测网络社团结构,几乎所有这些模型都是通过 multiplicative update rules ( )来求解的。这个算法收敛速度慢,比较费时,因此并不适合处理大规模问题. 我们提出使用字典学习算法 (DL) 来探测网络社团结构. DL 首先是为图像数据和生物数据而提出的 ( ),并且已经被成功应用于数据聚类和分类问题 ( )。我们提出了一种简化的字典学习算法,并将其应用于社团结构探测问题。在人工合成数据集和实际网络数据集上的实验结果表明:1) 标准字典学习算法和简化算法都比现有算法收敛的更快; 2) 并且, 相较于现有模型/算法,包括标准字典学习算法,我们提出的简化算法能得到更好的数值结果. 简言之,我们的工作有三个方面值得一提: 1. 当然是提出了新的模型来做社团结构探测; 2. 提出了新的人工数据生成准则. 当前做社团结构探测所用的人工数据都太过简单,规模不够大,结构单一,所以我们提出了新的生成办法,这是一个贡献; 3. 据我们所知,比较而言(包括Physica A上的同类文献)我们所使用的实际数据数量是最多的,包括7个网络数据和4个文本数据. 基于这些人工数据和实际数据,我们比同类文献的数值分析更彻底和全面.因而我们对我们的模型很有信心,呵呵呵呵. 欢迎各位博友的批评和建议.如果各位博友有兴趣,我还可以对各种矩阵分解模型做一个介绍. 文章网址: http://www.springerlink.com/content/p841234566513303/ http://info.scichina.com:8083/sciF/CN/volumn/current.shtml 【1】 Zachary W, An informative flow model for conflict and fission in small groups, J. Anthropos Res., 1977,33:452-473. 【2】 Newman M, Girvan M, Finding and evaluating community structure in networks, Phys. Rev. E., 2004,69: 026113 【3】 Pujol J, Bejar J, Delgado J, Clustering algorithm for determining community structure in large networks, Phys. Rev. E, 2006, 71:016107 【4】 White S, Smyth P, A spectral clustering approach to finding communities in graphs, In SDM, 2005:76-84 【5】 Wang F, Li T, Wang X, Community discovery using nonnegative matrix factorization, Dat. Min. Know. Dis., 2011,22:493-521 【6】 Ma X, Gao L, Yong X, Fu L, Semi-supervised clustering algorithm for community structure detection in complex netwroks, Physica A, 2010, 389: 187-197 【7】Newman M, Detecting community structure in networks, Eur.Phys.J, 2004,38: 321-330 【8】 Wasserman S,Faust K, Social network analysis: methods and applications, structrual analysis in the social sciences, Cambirdge,1994 【9】 Lee D, Seung H, Learning the parts of objects by nonnegative matrix factorization, Nature, 1999, 401:788-791 【10】Lee D, Seung H, Algorithms for nonnegative matrix factorization, NIPS, 2001: 556-562 【11】Mairal J, Bach F, Ponce J, Online learning for matrix factorization and sparse coding, J Mach. Learn. Res., 2010,11: 19-60 【12】Ramirez I, Sprechmann P, Sapiro G, Classification and clustering via dictionary learning with structured incoherence and shared features, CVPR, 2010: 3501-3508
8181 次阅读|10 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-20 09:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部