科学网

 找回密码
  注册

tag 标签: 大数据时代

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

大数据时代(6)
maohelu 2016-11-16 17:30
“取之不尽,用之不竭”的数据创新 我们所处的时代之所以与众不同,是因为数据的收集不再存在固有的局限性。大量信息可以被廉价地捕捉和记录,数据经常会被动地收集,人们无须投入太多精力甚至不需要认识这些数据。而且,由于存储成本的大幅下降,使得以较低成本获得更多数据的可能性较大。 数据再利用: 不同于物质性的东西,数据的价值不会随着它的使用而减少或有所损耗,而是可以不断地被处理。而且个人的使用不会妨碍其他人的使用。数据的价值不限于特定的用途,它可以为了同一目的而被多次使用,也可以用于其他目的。判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考虑其目前的用途。很多互联网和科技公司甚至直到最近才知道数据再利用具有多大的价值。 数据重组: 如今,互联网用户都熟悉基本的混搭式应用,即将两个或多个数据源以一种新颖的方式结合起来。例如,房地产网站将房地产信息和价格添加在美国的社区地图上,同时还聚合了社区近期的交易和物业规格等大量信息,以此来预测区域内具体每套住宅的价值。 数据的折旧值: 随着时间的推移,大多数数据都会失去一部分基本用途。在这种情况下,继续依赖于旧的数据不仅不能增加价值,实际上还会破坏新数据的价值。但潜在价值的概念表明,组织机构应收集尽可能多的使用数据并保存尽可能长的时间。保存并不代表每种用途要全部用,要用复杂的算法将一些折旧数据剔除掉,这样才能保证结果的准确性。 数据开放: 这个就不多说了,看到标题就知道要说什么了。中国很难迈出的一步。
个人分类: 读书笔记|2857 次阅读|0 个评论
大数据时代(5)
热度 1 maohelu 2016-11-11 15:26
数据化:一切皆可“量化” 信息技术变革随处可见,但是如今的信息技术变革的重点在“技术”上,不在“信息”上。 大数据最早实践之一的莫里导航图向我们说明远在信息数字化之前,对数据的运用就已经开始了。很多事例表明,数据可以从最不可能的地方提取出来。但这里应该区分两个概念,“数据化”和“数字化”。数据代表着对某件事物的描述,数据可以记录、分析和重组它。我们总是把数据化当成数字化,两者是完全不同的概念,数据化是指把现象转变为可制表分析的量化形式的过程。而数字化是指把模拟数据转换成用 0 和 1 表示的二进制码,这样电脑就可以处理这些数据了。书中举了个例子来帮我们理解这两个概念,谷歌在 2004 年的时候,开始将所有版权允许的书本内容进行数字化,即将每一页都被扫描,然后存储在服务器的一个高分辨率数字图像文件中。书本上的内容完成了网络上的数字文本,方便了人们的查阅,但是它不能做到根据关键词来搜索自己感兴趣的内容,因为这些数字文本没有被数据化,谷歌拥有的只是一些图像,因此,谷歌使用了能识别数字图像的光学字符识别软件来识别文本中的字,如此一来,书页的数字化图像就转化成了数据化文本。 一旦世界被数据化,就只有你想不到,而没有信息做不到的事情了。在大数据时代,惊喜无处不在!我最喜欢这句话。回头我们生活中大数据的例子,你总是会惊讶的发出赞叹,好棒!
个人分类: 读书笔记|3218 次阅读|1 个评论
大数据时代(4)
maohelu 2016-11-9 09:32
思维变革第二条:不是精确性,而是混杂性 “大数据”通常用概率说话,而不是板着“确凿无疑”的面孔。 执迷于精确性是信息缺乏时代和模拟时代的产物。只有 5% 的数据是结构化且能适用于传统数据库的,而剩下 95% 的非结构化数据都无法被利用。 在不断涌现的新情况里,不精确的出现被允许,同时,我们需要与各种各样的混乱做斗争。即数据的错误,数据的格式等等都会造成一种混乱的局面,但不管怎么说,不太准确的结果是有助于我们把握整个事情的大致情况的。 人们已经慢慢接受这种混杂性。互联网上最火的网址都表明,他们欣赏不准确而不会假装精确。 在这种环境的要求下,新的数据库设计诞生了,非关系型数据库的出现,它不需要预设记录结构,允许处理超大量五花八门的数据。因为包容了结构多样性,这些数据库设计就要求更多的处理和存储资源。来自微软的世界上权威的数据库设计专家帕特·赫兰德说我们再也不能假装活在一个齐整的世界里。他认为,处理海量数据会不可避免地导致部分信息的缺失。虽然这本来就是有“损耗性”的,但是能快速得到想要的结果弥补了这个缺陷。 大的数据库为了确保其运行的稳定性和速度,一个记录可能会分开存储在两三个地方。如果一个地方的记录更新了,其他地方的记录则只有同步更新才不会产生错误。传统的系统会一直等到所有地方的记录都更新,然而,当数据广泛地分布在多台服务器上而且服务器每秒钟都会接受成千上万条搜索指令的时候,同步更新就比较不现实了。所以,多样性是一种解决的方法。 思维变革第三条:不是因果关系,而是相关关系 在大数据时代,知道是什么就够了,没必要知道为什么,毕竟当我们知道了“是什么”的时候,“为什么”其实没那么重要了。相关关系通过识别有用的关联物来帮助我们分析一个现象,而不是通过揭示其内部的运作机制。当然,即使很强的相关关系也不一定能解释每一种情况,很可能只是一种巧合,相关关系没有绝对,只有可能性。亚马逊的推荐读书功能很好的说明了顾客购书与推荐图书的相关关系,是一种完美的正相关。
个人分类: 读书笔记|3123 次阅读|0 个评论
大数据时代(3)
maohelu 2016-11-4 17:19
思维变革第一条:利用所有数据,而不是少量的数据样本。 过去,因为记录、存储和分析数据的工具不够好,我们只能将数据缩减到最小,来使得分析变得简单。这变成了一种无意识的自省:我们把与数据交流的困难看成是自然的,而没有意识到这只是当时技术条件下的一种人为的限制。在某些方面,我们依然没有完全意识到自己拥有了能够收集和处理更大规模数据的能力。我们还是在信息匮乏的假设下做很多事情,建立很多机构组织。我们甚至发展了一些使用尽可能少的信息的技术。别忘了,统计学的一个目的就是用尽可能少的数据来证实尽可能重大的发现。事实上,我们形成了一种习惯,那就是在我们的制度、处理过程和激励机制中尽可能地减少数据的使用。 过去,统计学专家们证明:采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大。随机采样取得了巨大的成功,成为现代社会、现代测量领域的主心骨。但这只是一条捷径,是在不可收集和分析全部数据的情况下的选择。 如今,计算和制表不再像过去一样困难,传感器,网站点击等被动地收集了大量数据,数据处理技术已经发生了翻天覆地的改变,但我们的方法和思维却没有跟上这种变化。
个人分类: 读书笔记|2514 次阅读|0 个评论
大数据时代(2)
热度 1 maohelu 2016-10-28 16:57
大数据,变革思维 大数据时代,首先需要变革的就是原来的思维模式。社会需要放弃它对因果关系的渴求,而仅需关注相关关系。也就是说只需要知道是什么,而不需要知道为什么。 大数据,开启重大的时代转型 我们周围到底有多少数据?增长的速度有多快?我们来看南加利福尼亚大学安嫩伯格通信学院的马丁·希尔伯特研究的结果。 2007 年,人类大约存储可超过 300EB ( 2 60 字节)的数据,其中只有 7% 的数据是存储在报纸、书籍、图片等媒介上的模拟数据,其余全部是数字数据。而在 2000 年的时候,数字存储信息仍只占全球数据量的四分之一。按照希尔伯特的说法,数字数据的数量每三年多就会翻一倍,而模拟数据则基本上没有增加。到 2013 年,世界上存储的数据预计能达到约 1.2ZB ( 2 70 字节),其中非数字数据只占不到 2% 。 大数据洞察 寻找原因是一种现代社会的申论,大数据推翻了这个论断,我们曾经坚守的信念动摇了。那么,从经验中得来的与证据相矛盾的直觉、信念和迷惘应该充当什么角色呢?当世界由探索因果关系变成挖掘相关关系,我们怎样才能既不损坏建立在因果推理基础之上的社会繁荣和人类前行的基石,又取得实际的进步呢?本书意在解释我们身在何处,我们从何而来,并且提供当下亟需的指导,以应对眼前的利益和危险。 明天将开始正式内容的阅读。
个人分类: 读书笔记|4377 次阅读|2 个评论
大数据时代(1)
maohelu 2016-10-27 17:22
手头上设计方面的书读完了,有了点设计的思路,在工作中也有了更多的设计想象空间,渐渐能够在同事的设计中找到缺陷,也能看懂同事设计成果的良苦用心之处,很是开心。 今天开始读《大数据时代》这本书,这本书在我这存了不少时间了,一直说看,也没看,错过了很好的阅读时机,不过为了防止自己被这个时代落下太远还是想要拾起来看看。 特别赞成周涛译者在书中序部分写的一句话:在大数据时代,要允许一点点的错误和不完美,因为效率可能更加重要。在当今时代,理念一出来就应该立马付诸行动。晚一步市场先机就被别人抢了先,其他人只能是慢慢往里面挤,不然就只有喝骨头汤的份了。我表哥在 n 年前给我说了智能手环的东西,他当时已经有了完整的想法。苦于我没有手机编程能力,没有一起做,然后过了一两个月他给我发了个链接,市场上智能手环已经出现了,紧接着就是铺天盖地的智能手环。他感叹说太快了,还没下手肉就被抢没了,汤都没剩。其实他在滴滴出现的一年之前,就有了租车的概念,就是自己做不了,停留在了想法上,有个那次教训,智能手环说要做出来,结果太快了,还是没赶上。 在大数据时代,维克迈抛给我们在数据处理概念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。了解维克迈的都知道,他有一本书叫《删除》,这本书当时也是风靡一时。这里有个小故事,维克托的继父去世时留下了 16000 张收藏的周游世界时的照片,维克托制定了两条原则对这些照片做了筛选,首先,照片上有认识或可能认识的人,其次,照片拍摄的很漂亮。经过筛选,维克托最终留下了 53 张照片。但在大数据时代,删除里面的理论就要对比着看了。
个人分类: 读书笔记|2261 次阅读|0 个评论
【大数据时代】浅析金融企业如何利用大数据洞察客户
raincent 2015-3-18 15:14
大数据 _大数据时代_ 大数据概念 _网络大数据 随着 大数据时代 的来临, 大数据 也吸引了越来越多的关注。 网络大数据 整合了大数据, 大数据概念 ,cdn,cdn加速,idc, 网络测量 ,网络监测,网络安全测量, 网站性能监测 ,行业分析报告, 行业研究报告 ,免费行业报告等服务为一体,力争打造中国最大的 网络大数据 中心。 移动互联网已经成为商业的下一个前沿,关注移动 APP 或扫二维码下载 APP 俨然成了所有金融行业商业广告中的重点。金融行业的 APP 将成为线上金融服务的主要入口,无论是企业金融服务和个人金融服务,都将离不开 APP 这个客户和 大数据 入口。金融企业该如何利用大数据洞察客户? 一、移动互联网 APP 数字分析的特点 1 、移动数据中包含地理位置信息 移动互联网同传统互联网的一个区别是,移动互联网包含了 LBS 数据即位置数据信息,这些信息具有非结构化特点,以文本日志信息为主,可以连接用户,揭示客户的日常习惯和行为轨迹,帮助金融行业了解客户特点和喜好。 2 、移动 APP 具有离线使用的特点 传统互联网只能在用户在线的情况下进行访问,其通过网页抓包软件将用户访问行为记录在网站上,称之为在线数据记录。但是移动 APP 所有的数据都存在 APP 自身的日志里面,无论在线与否都需要通过 API (专业的 SDK )进行收集。 3 、移动 APP 的数据是活的数据,其生命周期较短 移动 App 的数据由于包含了位置信息,反映用户的生活轨迹和个人喜好,可以认为移动数据是活的数据,是更有价值的数据。但是由于智能手机的更换周期一般为两年,因此采集到移动 APP 的数据,其生命周期最长不应超过两年。 4 、移动互联网数字分析需专业的分析工具 由于移动 App 数据不能被搜索,数据采集上就需要采用专业的数据采集工具。互联网行业都利用专业 SDK 工具包的 API 来采集数据,上传到移动 APP 运营统计分析平台上进行分析,因此移动 App 运营统计分析平台就成为金融行业了解移动运营的必备工具。 二、移动 APP 运营标准建设 移动 APP 数据的产生大多数为客户的点击数据和行为,代表了客户的声音,如何听取客户的声音,来了解客户,提高客户体验成了所有金融企业需要面对的问题。金融企业应该建立移动 APP 运营统一技术标准来帮助金融行业分析移动 APP 运营情况。 金融行业可以向互联网行业学习,特别是像移动运营方面比较领先的手游行业学习。手游行业的竞争激烈,用户对手游 APP 体验要求较高,如游戏的地图路线,颜色搭配,魔法工具的使用,宝物出现的地点,怪物出现的时间和地点,人物升级的点数和方式都会影响用户体验;手机游戏生命周期较短,一般都少于 6 个月,游戏用户高峰一般出现在注册的前几个星期等;这些特点要求手机游戏 APP 开发者必须对其游戏的运营情况及时进行了解,因此手游移动 APP 运营统计分析平台对手游行业发展具有重大意义。 三、移动 APP 运营统计分析平台的商业价值 1 、采集客户点击数据,洞察客户特点,提高客户体验 金融企业借助于移动 APP 运营统计分析平台,可以采集客户 APP 点击数据和位置数据。利用客户的点击数据,金融企业可以了解 APP 的设计情况,设计出用户喜爱的移动 APP 。 2 、精细化营销方案,优先推广客户需要并为企业创造更大价值的产品 移动 APP 的界面可视空间有限,金融企业的产品众多,到底排放哪些产品来吸引客户,成了各个产品部门的争夺焦点。有了移动 App 运营统计分析平台后,让统计数据说话,金融企业可以依据客户点击数,点击趋势,购买趋势等数据来进行选择。 3 、依据客户点击数据和购买数据来设计优化产品 平台记录了客户的点击和购买数据,通过这些数据金融行业可以了解客户需求,为客户设计其需要的金融产品,提高单个客户的价值。另外可以利用这些行为数据进行分析,优化已经上线的产品,增加新产品的销售份额。 4 、移动 APP 的运营管控和产品的绩效管理 平台的数据可以监控移动 APP 的运营情况,了解客户的活跃度,了解营销方案的效果、市场推广活动的运营效果,帮助金融企业进行营销决策。针对客户活跃度高的营销活动加大投入,创造更大的价值。对于效果不好的市场活动及时进行撤离,减少不必要的投入,同时释放 APP 中具有价值的界面和时间给更好的营销活动。 三、移动 APP 运营统计分析平台的选择 移动 APP 运营统计分析平台技术更新较快,用于数据采集的 API 需要不断增加,平台依据客户采集的需求要不断地进行升级,因此平台技术更新的速度是金融行业自身开发中心无法达到的。 综上所述,在 大数据 金融 2.0 时代,金融企业应该向互联网企业学习,借助移动 APP 运营统计分析平台,采集具有生命力的移动大数据。金融企业利用这些数据来洞察客户,了解客户的特点和需求,取得同互联网企业一样的技术优势。 更多互联网行业最新资讯信息 敬请关注网络大数据
1128 次阅读|0 个评论
大数据时代、数据分享和数据腐败
热度 6 janenana 2014-11-27 04:26
自从 Viktor Mayer-Schonberger 写了B ig Data:A Revolution That Will Transform How We Live, Work And Think这本书,就被认为是大数据时代来临的先河之作,大数据涉及最多的领域为计算机、生物,生态学、经济学,地理学、天文物理和公共卫生(public health)等等。在我听说比较多一些的方向比如网络分析、交通系统、犯罪区域、human right,动植物保护 ,和传染性性疾病和感冒预测etc~~~~ 这个世界部分人(或国家)已经开始纠结于大数据分析技能和计算水平提升。 大数据时代的来临源于不同领域,不同部门的合作和数据分享,可以说是数据分享的更高层次。 但是不得不说我们国内做事情却在纠结于数据分享,和数据腐败斗争这个事实。 什么算数据?在我看来所有可以进一步分析和推理用的知识点,逐年累月的记录,基础数据,加工过的数据都可以作为数据分析中的数据。 在提到数据分享,我开始时觉得就像幼儿园的小朋友交换玩具一样的,如果你不自愿交换就没人和你玩,那你就得自己玩,自己玩也挺好就是要注定孤独终老。 一起玩这个动作延伸到科研领域其实就是一种合作,就是大家一起玩一堆数据,一起玩出一些有趣的结果— --这个形式本身和幼儿园的小朋友的行为并无大异。但是这个游戏被放到成人的世界就变得异常复杂,至少数据在手中变成了一种稀缺资源和一种权力之后,基本上就属于我要看得起你我才和你分享或者你给我什么好处我才给你---在国内总体上是这样的! 那么,在科研中我们为什么要分享数据? 当然就是为了更好的合作,为了做出更好的工作。“分享”这个动作基本上是出于互相信任,并且有期待的时候发生的。 即你期待着给比你厉害的人,或者懂你的人,分享并得出更好的更有用的结果。个人觉得这应该是每个科研人员应该不停问自己的问题:为什么为什么为什么我们要分享数据??? 那么,为什么我们又不能互相分享数据呢?我认为这其中涉及到三个层面的问题: 第一,出于国家安全的考虑。 即数据分享泄密过程中可能损害到非常多人的利益,或者损害了某一些人的利益。这个就不详述了,因为每个国家和每个地区对国家安全的定义不一样。比如贫困人口比率和饥饿在非洲各国是敏感数据,在其他国家多少可能都是,只是机密级别不一样。“安全”这个词本来也很难界定边界,而且和国际环境,国家利益,财团利益相勾结,就太模糊。 前几天看美国的 Jon Stewart的Daily show,这个show差不多每一期节目都邀请一位嘉宾,上次请到的是当时斯诺登逃离美国的时候在香港约见的第一位记者。Jon问记者,你觉得斯诺登这样泄密naive吗?记者说他有一点理想主义,觉得自己泄露了机密还是相信国家公正的司法系统。另外大家知道当时名声大振的维基解密事件,使得很多国家和政府的机密数据被曝光。不管出发点怎样,最后的泄密者基本上要么背井离乡要么沦为囚下之徒。这个级别太高,我也没办法接触到,所以我个人最感兴趣的第二点和第三点,即技术安全和腐败。 第二,技术安全。 这个说起来是有点意思。记得我当时和一位老师讨要卫星影像(他后来给我数据了),他和我提了国家安全了技术安全这两个词。所以这两个词我是借用了他的,并不是我个人发明的。这里说的技术安全其实是--要是我给了你数据,你做出比我更出色的工作怎么办?作为做科研的人,每个人都多少会问自己这样的问题。我们到底要不要分享自己的数据,到底是怕别人超过自己?还是因为获取数据的成本太大你输不起?还是你认真分析所有的利弊之后作出的决定?如果单单出于“怕别人做出别自己更出色的工作”的心态,这个科研前途令人堪忧。这里面涉及到一个长远性的问题。长远性也有三个层次:眼前利益,中长期利益和长期利益。通常普通人关心的柴米油盐是今天和明天的事情,政策决策者(政府、公务人员)做决定至少看到的是十几二十年的后的结果,但是 作为科研人员应该看到更长远的未来。 不过作为每天都要吃穿用度的科研人员,我们很容易把身份给混淆了---所以有的人出名了有的人默默无闻了。 在我碰到的各国功成名就的科学家里面,在我看来都是秉承着,你需要这个数据你就拿去分析,我们一起看看会有什么有趣的结果。这里说的首先是“我们” 然后“一起”,我觉得就非常有意思,首先“我们一起”的情况是给你数据的人是尊敬你的知识和能力之下和你讨教切磋的。记得看《为奴十二载 12 years a slave》这本书的时候(书是作者沦为奴隶的十二年经历写的),声讨奴隶制度之下奴隶主们的种种罪恶,他们骑着马扬着鞭,催促奴隶干活稍有不顺就被往死里打。但是其中作者碰到奴隶主福特斯老爷时说福特斯老爷是一个善良而且体惜奴隶们的老爷,所以大家干活的时候非常卖力--仅为了讨好他听到他的赞扬。虽然扯得有点远,但是,从当时完全不允许受教育的奴隶和当今收到高等教育的科研人员,人的本性都是一样的:即 当你被人欣赏、尊重和信任---这种转化成的正能量其实还是蛮强大的。 从小处的说起就是尽心尽力的完成被交代的事情,说严重点就是肝脑涂地两肋插刀也在所不辞。 第三,数据分享和数据腐败。 这两者的关系有点千丝万缕,理不清头绪的意思。但是数据其实是可以转化成为一种稀缺资源而演化成为权力的---和中国地方政府合作你就会深深体会到这一点,这不仅仅有我个人部分的经历,也听到周围人太多的抱怨。有些称之为“不能分享的数据“,其实看了之后你根本不用分析就能对着 xxx声嘶力竭的嘶吼:“这么十几二十年的你们就干了这点事??!!!” “什么?你们竟然连这个数据都不知道”“没改过的--原--始--数--据--在--哪--里--”。可以理解新中国建立就这么多年,很多数据没有,也没测过,但是你也不用编吧?很多社会经济收据采集其实: 1.数据采集部门的工作可以做得更好,和科研部门更好的合作和交流; 2.拿的是纳税人的钱工作就应该有实实在在可以测量业绩的数据; 3.分享数据虽然要承担风险但是对未来的政府工作开展更有用; 4.人民公仆是神马意思? 所以总体来说,我们先过了把数据当成权力使用的腐败时代,向着数据分享的时代迈进,才能看到激动人心的大数据时代的来临。总之,心里多多少少对我们这一代人抱着这么一点点的希望,大家一起开心地玩吧。 (图片来源于网络) 该文已经发表在《中国科学报》 (2014-12-01 第7版 窗口),文章链接请看:http://news.sciencenet.cn//sbhtmlnews/2014/12/294571.shtm
个人分类: 科研发现|3650 次阅读|12 个评论
第六届全国生物信息学与系统生物学学术大会
jgu 2014-4-16 22:01
第六届全国生物信息学与系统生物学学术大会 暨国际生物信息学前沿研讨会 (第二轮通知) 第六届全国生物信息学与系统生物学学术大会暨国际生物信息学前沿研讨会将于 2014 年 10 月 6 日至 9 日在南京举行。本次会议由 中国细胞生物学学会功能基因组信息学与系统生物学分会主办,清华大学生物信息学教育部重点实验室协办,东南大学承办。 一.学术大会征文 1. 征文范围 大会欢迎广泛来稿。 本次会议的 主题 是“ 大数据时代的 生物信息学与系统生物学”,具体内容包括: (1) 大数据时代的测序技术发展与应用 (2) 生物网络与系统的构建及功能分析 (3) 医学系统生物学及转化医学 (4) 转录调控与表观遗传修饰 (5) 非编码 RNA 的辨识和功能分析 (6) 生物大分子结构与功能研究 (7) 合成生物学 (8) 生物信息学的新概念新思想和发展趋势 2. 征文要求 大会投稿只需递交论文摘要,论文摘要内容为英文,论文摘要字数控制在 1000 字以内。 论文模板见附件 。 会议论文需通过网络在线提交( http://bioinfo.seu.edu.cn/CCBSB )。提交摘要时必须注明其所属的会议主题。 3. 论文录用 论文截止日期 2014 年 6 月 20 日,所有递交的论文摘要将由会议学术委员会评审讨论,择优收录大会论文集并遴选确定主题和专题报告人。被收录论文相关信息将于 2014 年 8 月 15 日前在大会网站上公布。 4. 学术墙报要求 按照国际惯例,学术墙报是一种非常好的参会者之间学术交流的形式,大会支持并鼓励参会者制作墙报进行展示与交流。 二.会议报告及会议交流 会议报告类型:特邀报告( 35 分钟),主题报告( 25 分钟),专题报告( 20 分钟),提问与讨论时间包含在内,为 5 分钟;墙报展讲。大会报告和主题报告由学术委员会邀请、协商产生,专题报告和部分主题报告将由学术委员会从会议投稿中遴选产生。 会议工作语言为中文,论文摘要、墙报、幻灯片均要求用英文(其中工作单位和姓名需中、英文对照)。 三.重要时间节点 投稿截止日期:2014年6月20日 会议注册日期:2014年8月1日前注册可减免100元 论文录用日期:2014年8月15日 正式会议日期:2014年10月6日—9日 四.会议地点 中国南京市中山东路307号 南京钟山宾馆( 江苏省会议中心)。 2014年10月6日12:00 开始会议报到。 五. 已经确认的大会特邀报告人 (以姓名拼音或字母为序) 陈润生院士、 郝柏林 院士、贺福初院士、张春霆 院士 、韩敬东研究员、孙之荣教授、 HaiyanHuang(UC Berkeley) 、 Hao Li ( UCSF )、 XiaoleShirley Liu ( Harvard )、 Manyuan Long ( University of Chicago )、 Ying Xu (UGA) 、 MichaelQ. Zhang ( UTDallas ), Sheng Zhong ( UCSD )。 此外,主题报告人名单还在确认中,已经确认的部分主题报告人名单请查看会议网站( http://bioinfo.seu.edu.cn/CCBSB ) 。 六.大会费用: 1. 差旅费和住宿费自理; 2. 注册费标准: 参会代表 2014.8.1 之前 2014.8.1 以后及现场缴费 专家代表 1200 1300 学 生 900 1000 注: Ø 以上收费标准以参会代表实际付款时间为准; Ø 中国细胞生物学学会会员注册费为 1100 元; Ø 注册为学生的代表在会场报到时必须出示有效学生证; Ø 交费后不能参会者, 9 月 1 日之前申请退款者将扣除 200 元后退还余款, 9 月 1 日后将不再退款。 Ø 发票领取:与会代表参会时请携带本人身份证,学生代表需携带学生证,已缴费代表请带好汇款凭证,在报到注册或参会期间领取。 3. 缴费方式: 通过银行汇款方式缴费。 帐 户:东南大学 开户行:建设银行南京四牌楼支行 帐 号: 32001594 1380 5912 3456 请务必注明:生物信息学大会(代表姓名)注册费 汇款后将汇款凭据发 email 至 gaoqh@seu.edu.cn 或传真至 025-83792349 (高庆华老师收),以确保汇款安全到帐。也可以在大会报到时提交汇款凭据,以便查找。 七.会议网站和联系方式: 第六届全国生物信息学与系统生物学学术大会暨国际生物信息学前沿研讨会网站( http://bioinfo.seu.edu.cn/CCBSB )已开通,相关信息通过该网站发布,代表可登录网站提交论文,及时了解更详细的会议信息和筹备动态。 东南大学会务组联系人: 侯越,谢建明,孙啸 电 话: 025-83795174 , 025-83790881 E-mail : ccbsb@seu.edu.cn ; xiejm@seu.edu.cn ; xsun@seu.edu.cn 参展联系人:刘宏德( 025-83795174 , liuhongde@seu.edu.cn ) 中国细胞生物学学会功能基因组信息学与系统生物学分会 清华大学生物信息学教育部重点实验室 东南大学生物电子学国家重点实验室 生物科学与医学工程学院 第六届全国生物信息学与系统生物学学术大会秘书处
4408 次阅读|0 个评论
[转载]新周刊:大数据时代如何找到真爱——2013中国情爱报告
fqng1008 2014-2-25 08:18
这一年,爱情终于登上了头版头条。 送不起土豪金,做彼此的爱情余额宝也不错。 2013年,爱情终于登上了头版头条。 影视歌艺人的情事婚事孕事让人应接不暇,《非诚勿扰》连换三任导师,电视屏幕上的爱情导师急剧扩编,都快赶上爱情的数量了。 这一年,丈母娘的宾利车钥匙、未婚夫的18担钞票、演唱会上的8分钟爱情宣言,跟你我无关;有关的是,通过一场场约会相亲来脱单、用交友App展开罗曼史、在雾霾中找到对方。 这一年,不送土豪金,做彼此的爱情余额宝也不错。 怎样才能找到他?你得有4次失败约会,经历2次心碎,吻过15个男人。 怎样才能找到她?你得谈8次恋爱,试过6次一夜情,吻过16个女人。 情路何等艰辛,在一项英国调查中,甚至有60%的人认为自己不会再爱了。而在中国,如果选择比自己大2—5岁的配偶,80后女性将没有足够的适龄男性作为婚配对象。 大家都说物质时代消费社会没有单纯的爱情,爱情总是被外化成其他东西:誓言、信物、文字游戏。追求浪漫体验是生物学的,追求利益最大化是社会学的。男男女女有了爱想要钱,有了钱又想要爱。 是爱情变质了吗? 爱情既原始又精密,既古老又新鲜。它总是变化莫测,让每一种定义和坚持都显得机械教条。感人的爱有千千万万种,它可以是在100岁时还守在你的病床前,也可以是过马路时牵着你的手。 再卑微的生命也受爱神眷顾,荷尔蒙是让生命发光的试剂。试图贬低或放弃爱情都是徒劳,你无法驱赶对爱的渴望,就像孩子忘不了柜顶的糖。 大数据时代如何找到真爱? 如果你不与人进行摒弃身份地位、物质要求、现实考量的交流,又怎能让灵魂坦诚相见?爱情是盲目的,但试错就是走向那个对的人的过程。 “赢得爱情比统率军队需要更多的天赋”(《诱惑的艺术》),还有为爱付出的勇气,你爱上的每一个人都是你的爱情导师,将帮助你体会爱的真意。 爱情流派之现实派 “30 岁了还不结婚才违法,该判刑!” “我爱的人是一个盖世英雄,有一天他会驾着七彩祥云来娶我。”这句《大话西游》的台词放在今天的语境可改为:我爱的人是一个成功人士,有一天他会驾着劳斯莱斯来娶我。 中国首富的独子在微博上说自己26岁了,下边评论近3万条,有求嫁的,有求捡肥皂的,有求发钱的。因为他的富二代身份,评论里半真半假地上演了一场求交往秀,既是世相,也是对世相的嘲讽。 市场咨询公司益普索(IPSOS)的调查称,71%的中国人用物质来衡量成功(全球平均值为34%)。在婚姻方面,中国女人通常要求对方比自己年龄大、收入高。根据第6次全国人口普查数据,“向上找”使得70后、80后非婚男女比例严重失调,70后为136:100,80后达到206:100。而2012年教育部的统计数据显示,全国女大学生人数已连续4年超过男生,她们中的很多人将是优质剩女。 非婚男性多,高富帅却并不缺爱。中山大学岭南学院发布的《广东大众富裕阶层财富白皮书》显示,个人可投资资产在10万美元至100万美元的中产阶层,80%的人已婚。 父母催婚是来自现实层面的最大压力。在一个电视采访中,老大爷咬牙切齿地说:“不回家看我们违什么法?30岁了还不结婚才违法,该判刑!” 上海人民公园里帮子女找对象已经从自发行为变成市场行为。跟二手房交易类似,适龄男女的个人信息被贴成一面墙,20块钱可以挂两个月。在自荐信息里,最受追捧的男性价值是有房、有车、收入高,最受追捧的女性价值是年轻、绝对好看。 在成为情感共同体之前先要缔结利益共同体,这是当代的不平等条约,而主导者是父母。有女博士相亲带老妈出场,19次相亲其实是伯乐相了19次马。 中国男人是全世界最慷慨的,大多数只要认定你是他的女人,就会心甘情愿为你、为你的家族买单。但是这项女人的福利同时也是女人的麻烦,人人都想找有买单能力的男人,甚至不惜当小三,宁财神将这种关系看作“三方角力和妥协的最终结果”。 爱情流派之浪漫派 “待我长发及腰,少年娶我可好?” 数字被玩味成概念,“201413”(2014年1月3日)因为与“爱你一世一生”谐音而被追捧成“万年真爱日”。这是偶然的浪漫。 “待我长发及腰,少年娶我可好?”一对在剑桥大学留学的中国情侣从中学一起走到本科毕业。这是青梅竹马的浪漫。 广西大四女孩在微博上发布自己的背影与南宁各大地标的合影,希望找到男朋友陪她“从13走到14”,她的背影牵出了无数寂寞女生的背影。这是“背影女神”的浪漫。 63岁的莱特与58岁的克里斯相爱20年后在马尔代夫举办水下婚礼,并卸下呼吸设备进行高难度的“水下激吻”。这是屏住呼吸的浪漫。 上海外公为了让常州外婆不感到孤单,学了一口常州话;78岁的保罗·布罗克曼(Paul Brockman)永远记着妻子在校园舞会上穿裙子的样子,56年给她买了5.5万条裙子。这是细水长流的浪漫。 听张靓颖唱《终于等到你》,看高圆圆在《咱们结婚吧》里披嫁衣,这不会是你2013年唯一的浪漫吧? 爱情流派之数据派 “我情愿做个犯错的人,也不愿错过你。” 美国俄亥俄州肯特大学的研究发现,总爱接电话或看短信的人比较不幸福。感谢手机应用,我们在不幸中也找到了不少乐子。 2013年,社交媒体产生了很多针对两性交往的热门产品,Bang with Friends基于Facebook,你可以选择想跟哪位好友睡,一旦对方也选了你,那就直接约地方吧。而通过Snapchat发送的照片最多只能在对方手机上停留10秒,所以大家都用它来向心仪的那位发送限制级私密照。 但是在现实生活中,日本家庭计划协会的调查却与虚拟世界的情况相反,16—24岁的女性中,45%对性接触不感兴趣甚至感到厌恶,超过1/4男性有同感。 当日本的年轻人对做爱兴趣索然,中国正掀起一轮基于交友软件的荷尔蒙狂潮。 跟约炮沾边的App几乎都能火一把,“陌陌”的用户人数已经达到8000万。新产品还在不断推出,有面向微博好友的“某某”,有针对校园恋情的“师兄帮帮忙”和tataUFO,有寂寞宅人专用的“有爱提醒”、“谁叫我起床”,有号称约炮成功率72.48%的“友加”,还有付费越多越好用的“宠爱”、“秀色”、“遇见”等。 “某某”的宣传语写道:“我情愿做个犯错的人,也不愿错过你。”意思是约炮本身是个错?反正通过交友App展开罗曼史的用户之间很难有长期关系,一旦涉及到婚姻,就要考验整个家庭的线下投入了。 目前比“摇一摇”更科学的寻爱手段是依靠大数据。《大数据云图》作者大卫·芬雷布相信,爱情也可以通过大数据分析出来。比如说,运用代码名为Synapse的算法,就可以将社交网站上的用户精准配对。 爱情流派之印象派 “不要长时间盯着美女看。” 世人都爱姣好的容颜,这有时也会带来麻烦。2013年12月,巴黎交通管理局公布12条地铁礼貌规范,其中一条规定:不要长时间盯着美女看。(英国《每日邮报》) 弗洛伊德说:“禁忌意味着诱惑,凡是被禁止的都是被强烈渴望的。因此,你要想方设法使自己成为一颗禁果。” 成为诱人禁果的渴望让女人离不开镜子。英国一项研究发现,女人一个月要花12小时零4分钟来担心自己的曲线、体重或是该穿什么,一年有26天在为外貌操心。 整容广告劝你新年换新脸,既招桃花又开运。整形医生擅长制造特定模式的外表——丰满的胸部、锥子脸、欧式鼻,这些器官组合似乎更能引起男人的兴趣,这也是为什么海天盛筵提供那么多一个模子的女模特。 总是这几种人让男男女女神魂颠倒:妖女、浪子、领袖、影视明星。但如果那个人只给你看最完美的一面,关系往往没戏。 爱情流派之学院派 “我对你的感情,就像以自然对数e 为底的指数函数。” 爱情没有教科书,但学生还是爱听老师讲这个,以恋爱或情感为主题的课总是人气爆棚。华师大一位马哲老师开设的“婚姻与爱情”选修课,只招84人,报名接近500人。 日本早稻田大学也有一门人气讲座“恋爱学”,开这门课的老师森川友义还把上课成果写成《结婚要从交往的第4人以后考虑》。他在书中给出公式:接吻价值=约会次数×饮食费,算出恋爱男女的平均接吻价值约为2500元。 中国高校里的学霸也纷纷想出表情达意的妙招。哈尔滨工业大学男生张华州利用高数公式写下三行情书;武汉长江工商学院女生吴华杰用数学符号“-∞”、“ ∞”和几个英文单词表示“你若不离不弃,我定生死相依”;吉林大学汽车工程学院也出现了一封名为“爱情公式”的情书,把爱情比作高数极限公式,并把公式拆分成地域距离和心灵距离,最后用“我们的爱情e直都在”阐释公式结果。 清华博士生王召健则用数学语言搭建了一个谈恋爱的目标函数:假设a为男生,b为女生。a在t1时间段喜欢b,b在T1时间段喜欢a。若t1∩T1≠φ(t1交T1不为空集),则a和b可能发展成为男女朋友,反之则不能。其实这个公式表达的意思是:在对的时间和对的地点遇见对的人。好消息是,他的高中同学已经成功应用这个公式脱光了。 爱情流派之表现派 “人家俩在离婚,就让人家好好离吧。” 娱乐圈的爱情总是高调的,一边说“冷暖自知”,一边晒幸福,有时甚至连不幸也要大声说出来,见不得光才是最大的痛苦。不过,娱乐圈的分合故事是最吸引眼球的,也是最容易被忘记的。 2013年,一大拨艺人扎堆公开恋情、发布婚讯、发表分手声明。男神女神,新欢旧爱,他们喜欢单方面表态,不喜欢公众指手画脚,一个男演员在回应绯闻关系时对媒体说:“人家俩在离婚,就让人家好好离吧。” 谈到艺人的婚姻状况,新浪娱乐博主 @圈少爷说:“《我不是明星》里的明星家长离婚率高达75%,不过我看《爸爸去哪儿》里的还好嘛,是因为孩子还小结婚时间还不长吗?” 2013年,电视相亲节目、矛盾调解节目、社会话题节目统统带有婚恋服务功能。一批万金油嘉宾转型成情感专家,仿佛已经掌握了男女相处的诀窍。最不靠谱的是《非诚勿扰》的“痴情”男嘉宾,送上所谓“一生只能送一人”的玫瑰牵手成功,几个月后换了一把花又向别人求婚去了。 爱情流派之野兽派 “丘比特没有用弓和箭,用了一把SKS 步枪。” 基于虚拟关系的方便的性,使“以身相许”这个说法成为过去时,今天的年轻人喜欢说“肉偿”,其中最惨痛的偿还是人流。人流无痛是谎言,更不要说无害了。每年全球有8万女性死于流产,数百万人致病致残。一个残酷的现实是,中国有全世界最高的人工流产率,每年至少1300万例。 而在另一个虽痛苦却喜悦的时刻,宁波一个20岁出头的年轻人却干了件粗暴事。他在宁波市妇女儿童医院陪妻子分娩时,抚慰半小时见她还是大哭大叫,一气之下竟然动手打了她。 2013年11月29日,在广州打工的四川90后阿英,因为与男朋友吵架,一气之下往自己身上泼汽油威胁,没想到引火上身烧成重伤。2013年12月6日,只因为挂自己电话,广州大学生小茹暴打在顺德容桂打工的男友1小时,致他右手肌腱断裂,双手缝了40多针。 以爱情之名行暴力之实,这么危险看来有必要买一份人身伤害险,而不是投资5年内与指定对象结婚的爱情险。 唯一暴力却美好的消息来自美国,小伙子马修·泰勒·韦布猎鹿时擦枪走火,打中普通朋友奥德丽·梅奥,两人竟然因此谈起恋爱。梅奥的姐夫说:“丘比特没有用弓和箭,用了一把SKS步枪。” 爱情流派之分离派 “老婆,我有苦衷,也没快乐,奉上9000 元。” 2013年,82岁的默多克与邓文迪的关系“已经无可挽回地破裂”了;60岁的普京宣布与夫人柳德米拉因为聚少离多离婚;而白宫内幕人士称,51岁的奥巴马被妻子赶出卧室睡沙发。 男的想尝鲜,女的想保鲜,男女在两性关系里的诉求完全背道而驰。66岁台湾新北老翁背着妻子与37岁的越南酒女交往,酒女怀孕后,他干脆留下“老婆,我有苦衷,也没快乐,奉上9000元”字条私奔了。 平淡爱情总是比艰难爱情更考验人。曼德拉在狱中思念妻子温妮,写信说:“婚姻的真正意义不仅在于互相爱恋,而且在于相互间的永恒的支持。这种支持是摧不垮的,即使在危险关头也始终如一。”但是出狱后两人却闹矛盾离婚了。 分手亦是朋友那种事只可遇不可求,有人想到留一手。哈尔滨一对情侣同居三年后分手,拿着《解除同居关系协议》到当地公证处为“从此互不纠缠”申办公证,可是公证处还没有这项业务呢。 2013年没能找到的爱情,愿你在2014年找到。
个人分类: 谈情说爱|2144 次阅读|0 个评论
大数据时代电子商务战略决策走向博弈
shuz 2013-12-19 14:50
文/李伟钢 郑建亚 互联网的迅速发展使得人类的社会活动可以通过网络快速便捷的实现。电子商务就是个典型的例子,不仅繁荣了商业活动,给人们提供了更多、更优质的选择,还节约了买卖双方的时间。阿里巴巴(alibaba.com)通过多年对电子商务的经营,已经成为该行业的翘楚,被著名期刊《经济学人(Economist)》称为世界上最大的网络集市。传统商家也积极开拓网上销售模式,进一步促进了电子商务的广泛应用。 然而,2013年9月初咨询公司Canalys的一项研究报告表明,阿里巴巴面临移动互联网崛起的挑战。在阿里旗下的天猫和淘宝两个电子商务网络集市的总交易额中超过90%款项来自个人电脑,仅有7%的来自移动网络终端。初步分析表明,在中国中小城市和乡镇地区,低端智能手机会给没有用过个人电脑的消费者带来首次上网的机会。2013年中国市场预计增加3.5亿部手机等移动设施,而美国市场会增加1.4亿部。移动网络市场的空间可能达到个人电脑市场的10倍之多。相比之下,美国社交网络龙头企业Facebook的商业赢利模式已伴随这种发展趋势,最新一季度数据显示,移动业务已为公司带来41%的广告收入。 回顾阿里电子商务的发展历程,长期以来,阿里平台和淘宝店家展开着持续激烈的商业模式抗争。2011年10月10日,淘宝商城发布了《2012年度淘宝商城商家招商续签及规则调整公告》,将技术服务年费从以往的6000元提高至3和6万元两个档次,涨幅为5到10倍。同时,商铺的违约保证金数额全线提高,由以往的1万元涨至5、10、15万元不等,最高涨幅高达150%。10月11日,淘宝商城的中小卖家结成“反淘宝联盟”,掀起声势浩大的攻击阿里大卖家行动。实施“拍商品、给差评、拒付款”的恶意操作行为,几天内共有数十家大型淘宝商城店铺被“攻陷”,在YY语音的虚拟空间里一度聚集了五万网友,发生了著名的“十月围城”事件。以致国家商务部随后出面表示,希望有关方面做好淘宝商城这次冲突的善后工作,加快网络零售法律管理体系建设,推动《网络零售管理条例》尽快出台。而2013年3月份,阿里集团创始人马云先生又提出:“互联网免费必死”的观点,对电子商务发展提出战略性建议。 无论是上述移动网络发展的挑战,还是阿里平台和淘宝店家间展开的商业模式抗争。阿里巴巴电子商务的发展需要一个战略性的决策支持模型,来模拟商务发展模式和因果变化,顺应互联网日益发展的需求。 电子商务的另一个特点是在线即时,动态销售。客户访问和购买流动性大,紧俏货物的销售量会急速增长,形成指数分布。与此同时,经营平台的信息管理系统会累积大量数据,形成具有丰富的经济价值和社会意义的大数据。深入的挖掘,对研究电子商务的经营规律,提高销售额,有积极意义。 可喜的是,阿里集团积极与科研机构联姻,创办“首届阿里数据平台创新大赛”,邀请全球40余家相关大学和科研机构的研究团队参赛。结合阿里数据平台提供的2012年11月份有关营运记录,包括购买成交表和用户旺通信记录等四组数据,利用大数据技术掘金,研究阿里电子商务,为企业经营发展献计献策。 巴西利亚大学TransLab实验室参与了这项竞赛活动,在对阿里平台提供的海量数据的初步分析中,发现天猫商城的销售量和营业额明显高于淘宝店家,并且随着商品价位提高,这种趋势更加明显。这个有趣的发现对电子商务的研究,产生了新的挑战,如何确定平台对加盟店家的托管服务费(亦可称为租金)的合理标准和促进各方的销售利润,仅用数据挖掘技术,显然是不够的,构建适宜的数学模型,势在必行。 考虑到电子商务是一项具有竞争意义的经济活动。著名经济学家Wassily Leontief 曾提出了通过与工会的协商博弈,解决企业和雇员的劳资博弈模型。该模型讨论了一个企业和其中垄断的工会组织之间的相互关系。在动态的博弈进程中,企业通过工会对工资标准的反应来获取自己的最大利润,而工会通过对工资的制定,使工会自身的效益得到最大化。团队通过改进此模型,首次应用博弈理论,来研究平台和加盟店家的互动行为。建立针对电子商务参与者:运营平台和加盟店家的相应策略和收益函数,使其能够解决平台合理收费问题,实现电子商务中平台和店家的利益最大化。 经过两月余的开发研究,TransLab团队专门为阿里平台量体裁衣,建立电子商务博弈模型(E-commerce Game Model - E-CGM)。通过该模型计算平台和加盟店家在非合作博弈行为下的选择结果,发现经营和销售规律,形成与加盟店家的共赢局面。另一方面的学术贡献在于提出经营平台的企业和加盟店家的效益函数,采用逆向归纳算法,计算出各自效益。 E-CGM模型将阿里平台和加盟店家看作博弈的双方,设定各方的收益函数,制定对应的博弈时序,使所研究的对店家收费问题转变成动态博弈论的均衡求解问题,通过逆向归纳计算方法,得到了该模型下电子商务平台的最佳收费标准,并分析了博弈双方在此标准下的收益。 阿里平台的历史交易记录提供了检验模型的数据,E-CGM模型在此数据集上的结果对平台和店家双方的收益都有了很好的提升。在纳什均衡条件下,平台收益提升5.87倍,加盟店家总体收益也提升1.41倍。此结果说明了团队研发出E-CGM模型适于描述电子商务行为,能为参与伙伴提高盈利提供参考依据和为达到均衡协商提供博弈仿真。 电子商务博弈模型的建立具有一定的假设和限制条件,比如加盟店家的增加不会减少平台的交易额、平台内只允许存在付租店家、以及店家的利润指标取自所有店家的平均值等等。但是这些假设具有理论依据,是博弈理论的具体实践,使得E-CGM的建模更加有效和简练。值得说明的是,该模型对实际情况的考虑还仅限于对阿里商务平台内一个月的流水数据分析,尚有一定欠缺。今后的工作会对此模型进一步完善,减少限制条件,增加实用性,使其成为研究电子商务运营发展策略和制定平台收费标准的通用性数学模型。 来源:千人杂志
1210 次阅读|0 个评论
[转载]大数据时代下复杂网络的机遇与挑战
bhwangustc 2013-9-3 17:17
大数据时代下复杂网络的机遇与挑战 发布者前言: 尊敬的老师们,大家好, 在各位老师们的大力支持下,今年全国复杂网络大会各项准备活动也进行的较为顺利。其中之一便是5月份在杭州举行的“数据时代下复杂网络的机遇与挑战”研讨会。期间,诸位与会专家对于复杂网络中的核心问题进行了热情讨论。 会后,我们综合与会专家和因故未能成行的专家们所共同关注和提出的建议和意见,提炼出供参考的问题荟萃版【见附件】。欢迎诸位专家提出宝贵意见,我们将根据所提意见进行修改。 最终定稿版本将作为此次大会论文集的序言,由“科学出版社”结集出版。 再次感谢大家的热心支持和帮助,九月杭州见! 第九届全国复杂网络大会组委会 ============================================================ 复杂网络的相关研究进入中国已经十年,同时一年一度的全国复杂网络大会也已经进入了第九届。在过去的十年中,很多研究方向受到来自不同研究领域学者们的广泛关注,并极大的推动了复杂网络和复杂性科学的发展。同时,我们也注意到,随着信息技术的飞速发展,使得可供研究的数据也越来越丰富。基于大数据的定量化分析对重塑社会学、心理学、管理学等多个学科范式,通过理论研究、算法设计、应用实施、平台架构等多种手段推复杂性科学和多个学科的结合和发展。因此,如何适应并推动大数据时代下复杂网络的研究和发展,为复杂网络领域的年轻一代指明研究方向也就成为了当务之急。 2013 年 5 月 11 日,由杭州师范大学商学院信息经济研究所、阿里研究中心、阿里复杂与多样性研究中心(筹)共同组织的“大数据时代下复杂网络的机遇与挑战”研讨会在杭州市香格里拉大酒店举行。汪秉宏、史定华、陆君安、汪小帆、狄增如、吕金虎、周涛,樊瑛、章忠志、刘建国、许小可、荣智海、张子柯、吕琳媛、韩筱璞、刘润然 等专家出席会议,此外,陈关荣、方锦清、刘宗华等因故未能出席的专家们也发来了自己的意见稿。来自复杂研究相关领域研究人员共 30 余人参加研讨。经过激烈地讨论,专家们根据学科特点和时代背景,拟定了大数据时代下复杂网络研究所亟需解决的问题。这些问题旨在为对复杂网络研究感兴趣的青年学者们提供具有参考意义的研究方向,与此同时,我们应当意识到,复杂网络的研究并不仅局限于这些方向,更广阔的领域有待广大学者们在实际研究工作中更深入地发掘。 1 、基本理论问题 目前关于复杂网络的基本理论遇到了很多困难。我们需要提出统一的理论去描述网络科学中的概念及规律。例如关于幂律分布的定义问题,现在判断一个分布是否为幂律分布,很多时候就是观察双对数下的分布图是否成一条直线。其实幂律分布分为严格幂律分布、具有幂律行为和广义幂律分布,具体是从概率密度函数还是补分布来判断是否为幂律,都需要得到科学的论证。在这种严格的科学定义没有有效解决的情况下,各种对它的研究讨论也很难说是严格的。 在这方面的另一个重要问题是抽样问题。2012年May在《自然》杂志发表了一篇论文,证明任何幂律分布的网络的子网络都不是幂律的。而我们实际上所用的数据大多都是抽样的结果。反过来,抽样得到了一个具有幂律度分布的网络,原网络的分布形式如何,——这个问题也没有严格清晰的答案。更复杂的是,不同的抽样方式,原网络和抽样得到的网络的关系也不尽相同!抽样得到的研究结论多大程度能代表整个网络?怎样的抽样才是合理的?这些都需要得到严谨回答。 2 、复杂系统理论在实际系统中的应用问题 针对具体的实际系统和实际问题,例如实际交通系统的优化、传染病的防控等,提出具体的解决方案。在这方面,虽然暂时可能无法达到理论与实际的统一,形成一个普适性的研究方法和成果,但是对于实际系统的理解是一个认识逐渐深化的过程,需要在这方面进行逐步的探索,比如我们实际遇到的超大规模网络、智能电网、移动互联网、物联网等的研究。特别地,复杂网络分析在社会科学和生命科学领域应该大有可为! 3 、算法问题 算法问题涉及非常广泛,包含网络结构和动力学的基本分析工具、社区挖掘问题、图的匹配问题、有向图的motif识别问题等。可以说,算法是进行网络分析的技术基础,也是包括信息推荐、人工智能优化等一系列具有极为广泛的科学意义和应用价值的研究问题的出发点。 复杂网络的算法问题,特别是算法复杂性问题、快速近似算法问题、并行计算问题、分布式存储问题等等,是在大数据背景下新挑战——我们如何快速、准确处理包含数千万乃至数亿数十亿的巨网络?基于大数据的算法问题将成为未来大科学化的复杂性科学研究的技术基石之一。 4、网络中动力学的普适性和差异性问题 传播、同步、交通、博弈等等动力学具备各自独特的特征,同时有具有很多共同的特点和相似性,特别地,它们都是受到信息流或物质流驱动的动力学。已有的研究也显示,各种网络动力学之间存在着很大的相似性。在跨越具体动力学种类的层面,高屋建瓴地讨论不同类型动力学的普适性和差异性,特别是建立网络流动力学的全景框架,具有重要意义。 5 、网络信息挖掘和预测问题 这里主要涉及两个问题,一个是反问题,也就是从动力学表征挖掘网络结构;一个是预测问题,也就是如何挖掘网络中的缺失信息,并进行网络趋势预测。在反问题这个研究方向上,很多学者都强调了压缩感知的重要性,该方法最大程度反映了动力学和结构的耦合关系,具有广泛的应用价值。在预测问题这个研究方向上,较成熟也最有活力的研究是链路预测,另外,关于包含社交关系的人类行为预测,生物网络中的时间序列预测,生物网络中结构链接和功能链接之间的耦合预测等等,都是近期受到关注的发展方向。 6 、网络控制问题 在很大程度上,解释现象的目的是为了预测,进而希望能够进行控制。甚至可以说,科学研究的最终目的就是控制,或者称为人工干预。 现代控制论的提出本身就是复杂性科学兴起的早期标志之一。近年来,随着网络可控性问题的提出,对复杂网络和复杂系统的可控性和控制方法的研究已经成为一个热点问题。复杂网络乃至各种复杂系统是否可控、是否自反馈可控、能否实现自反馈控制、如何模糊控制、如何精确控制、如何实现最小成本控制和自发可控等问题,都是非常关键而且有着广泛科学意义和应用价值的研究问题。 7 、含有时空信息的网络科学问题 现实的网络大多数是随时间和空间持续变化的,结构完全固定的网络非常少见。例如,实际的社会网络中,人与人之间的联系与交互是遵循一定时空统计规律出现,而不是一直保持的,这使得现实的社会网络传播过程中,在连边上有效传播的出现总是暂态进行,并且总的来说,距离较远的连接发生感染的可能性小,但是感染后危害性大。在这种含有时间空间的新型网络上的动力学过程可能会呈现出与静态网络和非空间网络极为不同的规律。探索这种随时空演化的动态网络上的动力学特性,以及节点、连边的活跃特性与动力学的关联规律,是一个重要的问题,也有望促进复杂网络研究的理论成果与真实应用的结合。 8 、网络中微观个体的角色界定问题 现实网络大多是异质性的。不同节点和连边在网络动力学演化过程中所扮演的角色往往差异巨大。这使得,如何有效衡量节点、连边的重要性,以及节点、连边在相应动力学过程中所扮演的具体角色和意义,成为一个重要的研究问题。具体来说,重要节点和重要连边的界定,每个点与每条边各自的角色,以及针对不同的动力学如何找到重要的节点和连边等问题,都值得我们去关注。 9 、不同类型网络的普适性和差异性问题 以往的研究挖掘出了众多的具有一定普适性的网络统计特性,例如无标度特性、小世界特性、社团性等,并研究得到了对这些统计特性的产生规律和动力学效应的基本认知。同时研究也发现,现实网络的结构极为丰富。以往的研究更多关注了这些网络在统计意义上的共性问题,而实际网络中,即使两种网络有着高度相似的统计特性,也有可能出现迥异的动力学现象。对于不同网络,例如无向网络、含权网络、有向网络、多部分网络、耦合网络乃至网络的网络等,它们的普适性和差异性,是一个值得注意的基本问题。总的来说,复杂网络的研究热点也正在经历从挖掘不同类型网络普适性到发现不同类型网络独特性的转型中。 10 、从微观到宏观结构的自组织演化问题 复杂性科学研究的核心理念之一就是深刻理解从微观基本单元到宏观复杂结构和统计规律之间的涌现机制。可以说,当前复杂网络研究中的众多问题都与该问题相关,例如宏观动力学过程、宏观结构和宏观统计规律的涌现等。很多学者都注意到,直接找到从微观个体到全网的宏观结构比较困难,两个端点之间尚需要一个中间过渡,也就是以模体(motif)和群落(community)为代表的中观结构。这些中观结构的分布、在动力学过程中扮演的作用,以及从微观到中观,从中观到宏观的涌现过程,都是值得高度关注的。
个人分类: 统计物理复杂系统研究进展|5297 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-6 00:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部