科学网

 找回密码
  注册
科学网 标签 云计算 相关日志

tag 标签: 云计算

相关日志

喂人民服雾——雾霾彰显汉语的强大魅力
热度 3 sheep021 2013-3-6 14:57
现在网上大家纷纷议论要给 PM2.5 取中文名字,有人认为严肃点就叫“公雾源”,高端点就叫“京尘”,霸气点就叫“尘疾思汉”,乐观点就叫“尘世美”,娱乐点就叫“尘惯吸”。时尚点可以叫“伊能净”,经典点可以囊括西游记中唐僧的三大高徒——雾空,雾能,雾净! 但看到这五个字,我才明白中文的强大魅力 : “喂人民服雾” 有记者去采访 PM2.5 :你们为啥飘在空中不下来呢,把中国人民给折腾得够呛。 PM2.5 的回答竟然紧跟当今科技潮流:我们不是捣乱,我们是在搞“云计算”啊!现在不是流行“滞灰城市”、“雾联网”吗,今年好好搞,明年争取到美国“哪颗打丝”上市!
个人分类: 生活点滴|3671 次阅读|3 个评论
里约大数据暑期班巡礼
热度 13 Liweigang 2013-2-8 08:30
里约大数据暑期班巡礼
由 EMC 2 巴西研发中心和里约联邦大学 (UFRJ) 联合举办的大数据暑期班于 2 月 4 - 7 日在里约热内卢的科学园举行 。据组织方介绍,本来打算邀请 60 位人员参加,但前后共有 700 余人报名,只好请示总部,增加拨款,扩招为 160 名,最后实际录取 180 名 。 EMC 美国本部领军国际大数据市场,资源有的是,不但 免收学费,还 为大家提供酒店到会场的交通、茶点和午餐。看得出大数据在巴西也是十分时髦,深受欢迎。前来的学者有巴西政府部门和公私营企业技术人员和高校、研究机构师生等。 1. “云”改变现代人生活也将改变世界 图 1 是三位同事在咖啡厅的网游激战,在喝咖啡和品茶之前,签下君子协议,谁输谁埋单。当然“幸运者”只需在退出游戏后直接在手机上用信用卡付账。现代人就是这样,利用信息技术带来的便利,不停地制造数据。 Universo Digital 的研究结果表明,到 2011 年,人类共生成 1.8 Zettabytes 的信息量,形象一点说吧,这些信息需要有 1 万亿个 16GB 的 iPad 来分装。遗憾的是,少部分的这些数据经过某种处理或分析,而 90% 的大部分都成为非结构数据白白浪费了。 图 1 咖啡厅激战,谁输谁埋单。 人们随时把看到的、身边的事情用手机等随身移动设备记录下来,和家人朋友分享。据统计, 75% 的海量数据由个体网民或移动用户产生:他们在全球每分钟平均发出 1.68 亿个电邮、给 YouTube 发 6 百个录像或在 Flickr 上放 6600 个图形文件。但是这些数据流的 85% 是由大型网络运营商处理和存储的。图 2 是本次暑期班最年轻的柱柱同学,课间放弃心爱的咖啡小点,忙里偷闲给朋友和妈妈“云发送”他在里约的工作和风景照。 图 2 柱柱同学在课间忙着“云发送”在里约的照片 2. 电视传媒、大数据与云计算 巴西龙头传媒企业环球电视台 (Globo.com) 在使用云计算和大数据技术方面,和里约联邦大学合作,用高科技处理大批量的电视节目,提高工作效率,方便签约客户,赢得利润,走到同行前面。 仅以该台各频道电视节目的视频网络重博为例,说明媒体传播业使用大数据和云计算技术的案例。环球台的几个重点节目是新闻联播、体育台和电视连续剧。特别是晚间八点黄金时段的连续剧和周三周日的足球大赛,在本台的网页上的重播,是吸引签约客户的卖点。这些客户甚至在电视播放结束几分钟内就能在环球台网上看到视频。 环球台已经实现了不同网速的视频制作和网上发布技术。有两个解决方案:一是本台的数据中心存放;二是云运营商存放。后者甚至更便宜和方便。现在的问题是,在客户看完此段视频后,环球台还希望给他们推荐相关视频。该商务手段在亚马逊和 YouTube 都有,图 3 显示 YouTube 在主视频旁边推荐相关视频情况。看来《非诚勿扰》节目满受网民欢迎的,需要声明的是,本文截图均无任何商业目的。 图 3 YouTube 视频推荐系统示意 如果只是百十个视频和数千位用户,在 Excel 上算算相关性指数就是了。但环球台视频信息组的技术人员面临的挑战是 2 百万视频, 1 千 5 百万在线用户,和极其有限的时间内,动态列出客户视频点击推荐表。这就涉及到大数据有关的 MapReduce 技术,正是下文要介绍的。 3. 大数据利器 Hadoop 理念 本次暑期班的重头戏是介绍 Apache Hadoop ,这是一个开源软件框架, 以 Google 的 MapReduce 技术为基础,查找有用的索引数据及其它 “ 有价值 ” 的信息,将此结果返回给相关用户。 Hadoop 支持 4000 个节点和 PB 级数据的数据密集型、分布式分析。 EMC 本部推出了 Hadoop 衍生产品,这次暑期班的主要目的也是对其软件技术的推广。 主讲 Hadoop 的是 2005 年 Yahoo 该项目研发小组参与者之一, Milind B. 老师,见图 4 。尽管略带印式英语口音的演讲,但由于 Hadoop 的精湛技术,引起与会者的热切关注。第二天,还有实习课,大家使用V MWare Player 工具,直接体验 Hadoop 的实际操作。 Google 能前展性提出如此新颖的理念,而 Yahoo 能在 7-8 年前坚定不移地开发 Hadoop, 进而有效推广至今,真是让人信服。 图 4 Milind B. 老师介绍 Hadoop 技术 4 .雄心勃勃的 EMC 巴西研发中心 主办今次大数据暑期班的 EMC 巴西研发中心设在里约科学园区,依托里约联邦大学。其 CEO 就是毕业于该大学工程系的优秀生。该中心有 60 名技术人员,主要从事大数据技术的应用研发。目前的主要工作是和巴西石油公司合作,在石油勘探、运输、提炼和天然气等方面,开发应用大数据和云计算技术。 这次暑期班的活动非常紧促,前后安排的 16 个精彩演讲均按时实现,与会者收获颇丰。课余时间,草草把基本情况写下来与科学网网友分享,也算是对大家的新春祝福吧。其它技术资料,容日后慢慢消化后,在与博友分享。 15位专家的演讲稿已在活动网页发布,感兴趣的网友可以下载: http://emcbigdataschool.nce.ufrj.br/index.php/speakers-and-schedule/slides.html
个人分类: 社交网络|5273 次阅读|34 个评论
产业发展是靠市场驱动还是政府推动?(130127)
热度 31 ymin 2013-1-27 08:12
产业发展是靠市场驱动还是政府推动?( 130127 ) 闵应骅 李小文在他的博客“ 大数据 ―― 一朵新的云? ” 中说:“ 云计算热渐近尾声,花了大把银子,没什么用户。”这问题提得好。在中国, 2010 年云计算热; 2011 年物联网热;去年以来,大数据热。这就提出了一个问题:产业发展,特别是新兴产业的创立与发展是靠市场驱动,还是靠政府推动?云计算热真的是到了尾声吗?我看不是,问题不在这。 我在 2009 年发表过博文“ 云计算杂谈( 090909 ) ” 就提出了“一定要以取得效益为目标”。报道说中国已有 30 多个地方政府发布了云计算产业规划,并提出了土地、税收、资金等方面的优惠政策。美国 2011 年公共云市场规模为 235.8 亿美元,硬件投入占 12.5% ,而中国相应比例高达 70% 。这么大的投入,效益如何呢?没有用户就拿不来效益。中科院计算所徐志伟研究员在一个会上说,“我国云计算主要落后在应用方面。据 2012 年年初的统计,国内较大的几家云服务提供商中,阿里云用户规模为 1 万户,售出虚拟机实例 3 万多个;盛大云注册用户 3 万多个,售出虚拟机实例约 1 万个。 而著名的亚马逊仅其在弗吉尼亚的一个数据中心 ( 它在全球共有 7 个数据中心提供云计算服务 ) 在 2010 年售出虚拟机实例峰值就达到 14 万个。”我们的思维方式常常是政府搭好了台,找一批人唱戏,然后再去叫观众。观众来得多,当然是一场大戏。如果来得少,那也没办法,只有硬撑着演下去。这就是先搭架子,后找应用。用户少,政府不得不出面搞什么电子政务云、旅游云、医疗云、制造云等。可政府是花钱的机构,不是挣钱的机构。政府的大投入不可能持久地让你这产业赚钱。近几年,我国中小企业面临许多问题,云服务不能解决他们迫切需要解决的问题,还提不到日程上来。于是,云计算就显得不那么热了。换一个大题目,政府还大投入,可能还是不赚钱。当然,云计算还存在其它问题,譬如电源消耗、安全和标准等,在技术上需要解决。所以技术研究还有发展空间。但没有效益企业就没有动力来解决这些问题。只有科技界有写文章、发 SCI 的动力,以便获得更多科研经费。 为什么会出现这种情况呢?我觉得,政府根据某些受到重用的知识分子的意见投资搞大项目,先搞基本建设,盖房子,增单位,然后再去找用户。这是一种计划经济的思维。而当年,亚马逊是先有中小企业的需求,企业赚了钱,才开始铺摊子、搞云计算。然后扩大,其它大公司也跟进,云计算就搞起来了。这是市场经济推动的。我们国家,现在是市场经济和计划经济并存。怎么掌握这个尺度,就大有学问了。该用市场经济的地方,用计划经济的办法,就要吃苦头。搞物联网、大数据,现在看来问题也类似。所以,我不但希望我们写论文、搞研究,要讲究实际,面向实际问题;搞经济、搞大项目也应该面向实际问题,根据需求来搞大项目。
个人分类: 计算机|6031 次阅读|72 个评论
从云计算到大数据
bigdataage 2013-1-13 10:01
从云计算到大数据 作者:田溯宁 2013年01月12日 22:14 (第2次修改, Final Version) 从2011年年底开始,大数据成了行业内的时髦的名词。那么什么是大数据?   这个世界的数据由两类组成:交易型的数据,是线性的,在牛顿力学的范畴之内,由理性思考的右脑产生并进行逻辑运算;大数据,则是离散的,属于量子力学的范畴,由感性思维的左脑生成情感类的信息。   典型的传统数据多是来自银行的金融交易活动、运营商的计费信息,以及其他公共服务类公司的大量用户信息。但今天,除了线性的交易型数据之外,来自雅虎、谷歌、Facebook这些门户网站、搜索网站和社交网站的用户生成信息,则产生了随机的、发散的、弹性的、爆发式的大数据。相较于传统数据,大数据更能反映这个世界的真实情况,比如,人们会上传和公布大量的图片来记录个人的生活和社会的变化。如今,一天之内人们上传的照片数量就相当于柯达发明胶卷之后拍摄的图像总和。在过去,用于解决大企业交易型数据的计算机并不记录这些信息,只有在云计算产业已经规模化发展 3 年之后,分布式结构计算才给大数据提供了记录的载体。可以说,云计算使大数据变成可能,打个比方,云计算充当了工业革命时期的发动机的角色,而大数据则是电。   总之,云计算带来了硬件存储的条件——更便宜的分布式运算存储,互联网时代的今天呼唤数据应用和服务。技术和需求的双重推动会让越来越多的政府机构、公司企业和个人意识到数据是巨大的经济资产,像货币或黄金一样,它将带来全新的创业方向、商业模式和投资机会。   硅谷与北京零距离   从美国《自然》杂志在2008年9月4日提出大数据的概念,到IBM 定义的大数据4V理论(规模性化Volume、多样性Variety、高速率Velocity和真实性 Veracity),今天硅谷的大数据科技公司已经分成以下三类。   首先,像亚马逊、谷歌和Facebook 这类公司,因其拥有大 量的用户信息,通过对用户信息的大数据分析解决自己公司的精准营销和个性化广告推介等问题。   其次,像IBM和惠普这类公司,是通过整合大数据的信息和应用给其他公司提供硬件+软件+数据的整体解决方案。   最后,新兴的创业公司则通过出售数据和服务更有针对性地提供单个解决方案。这些公司更接近与把大数据商业化、商品化的模式。   第一类公司将改变营销学的根基,精准营销和个性化营销将有针对性地找到用户,多重渠道的营销手段将逐渐消失。第二类公司将改变公司的管理理念和策略制定方式,没有数据分析支撑的决定将越来越不具有可靠性。第三类公司将大数据商品化,这将带来继门户网站、搜索引擎、社交媒体之后的新一波创业浪潮和产业革命。同时,第三类大数据公司的针对性咨询服务会对传统的咨询公司产生强烈的冲击。即使是第二类提供整合服务的科技公司,也会因其系统和软件的垄断封闭性受到第三类开源大数据的挑战。   这三种公司类型在中国也不会有太大的不同。互联网兴起的时代,人们常说中国的科技公司与硅谷有20年的差距,社交媒体时代这个距离缩短至5年,但在大数据的浪潮中硅谷与北京零距离。中国宽带产业基金投资的大数据公司中有很多也是雅虎Hadoop平台的主要工程师,联合投资伙伴也有来自硅谷的杨致远,我们也在和Hortonworks和Cloudera密切合作。在这一轮科技浪潮中,中国企业比任何一次反应速度都快。   我认为还会有新的商业模式出现,就像互联网创造了搜索、电子商务、竞价排名一系列商业模式一样,大数据会孕育更多新的公司类型,这也是大数据最有投资潜力的原因。“数据矿”就在那里,分析平台也已经成熟,现阶段是要用解决问题的视角,寻找数据分析师和懂得商业操作的人才,把数据分析产品化。    大数据的挑战   大数据带来的挑战是跨行业、跨领域的。   在公司内部,从公司的管理层到董事会,都应该认识到大数据即将带来的转型。将公司和行业之外的数据纳入分析并作为决策依据,则是要公司董事会、高管们重新认识的内容。   当移动互联网时代渗透进你的客户、你的员工团队时,公司的决策和管理无法不受到影响。比如,SOHO中国的首席执行官张欣就已经看到传统的营销渠道已经无法准确找到针对性的客户,而微营销、微传播的力量巨大。很多公司也在使用企业内部的Facebook或者Evernote这样的APP来进行信息分享与交流,而传统的企业资源计划(ERP)已经悄然退场。   同时,大数据发展的最大障碍在于数据的“流动性”和“可获取性”。2009年,美国政府创建了Data.gov网站,为大数据敞开了大门,公众能够通过这个网站获得各种政府数据。现在,在印度也有“数据公开”运动。中国要赶上这样一场数据的变革,首先从政府开始公开数据,其次是企业,最后在个人。开放的、流通的数据是时代趋势的要求,闭关锁国最终拒绝的是财富创造。   国有企业也有其独特的优势,集中化的资源使其积累了大量数据,国有企业如何将数据资产化是他们面临的问题。另外,无论是电信行业、金融业还是数字油田的发展,国有企业都要开放API端口,拓展平台,鼓励独立开发者参与国有企业的数据分析。   这是一个大数据的时代,对于成长在这一代的年轻人来说,数据的实时性、公开性、可流通性是毋庸置疑、自然而然的。一个等级的不公平的社会,最大的问题就在于信息的垄断和封闭。这涉及到个人隐私,但也是权力扁平化的社会需要。   云计算和大数据将注定带来一次革命,无论是对社会、公司和个人来说,都是一次世界观的改变。互联网不再是一个展示公司的工具或平台,而是属于未来的生产方式,是关乎竞争和生存的关键。就像工业经济时代,人们无法拒绝用电;个人计算机时代,公司无法拒绝用电脑办公;大数据将带来的是竞争形态的改变,当你的客户都在互联网上,你的市场就在互联网上,如果缺乏对客户数据的判断对市场的了解,缺少的就是核心竞争力——企业的IQ。政府和个人也一样,需要拥抱大数据时代的来临。    田溯宁 中国宽带产业基金董事长 来自于 哈佛商业评论 中文版: http://www.hbrchina.org/2013-01-12/112429912.html
2348 次阅读|0 个评论
[转载]云计算和大数据引发信息安全创新
libing 2013-1-7 12:48
 IT环境已经出现了新的变化,第一方面是新的计算环境,即云计算和虚拟化;第二方面是新的网络环境,包括移动互联网、物联网、智能电脑、软件定义网络(SDN)等等;第三方面是大数据。这些新的计算资源、新的计算方式、新的网络环境和新的数据类型,促使整个信息安全行业的关注焦点,从系统层面慢慢向应用服务,向数据资源转移。它们既对信息安全提出了新的需求和挑战,也给信息安全带来了新的思路。    多样手段应对云计算安全挑战   云计算给信息安全带来的挑战包括:第一,传统安全产品无法应对云计算环境下的网络结构和协议。在云计算环境中,可能前端的Web服务器和后端的数据库都在一个物理服务器上,这样它们之间的网络交互直接用虚拟交换机就可以了,数据根本不经过物理交换机,如果不到物理交换机,则信息安全设备拿不到它的数据,导致对它的访问控制、审计、攻击的检测,都没办法实现。第二,云计算环境对安全产品的计算性能提出了非常大的挑战。目前,安全产品的性能已经远远落后于网络设备。第三,云计算业务特性带来一些新的安全需求,比如产生了一些新的攻击方式,例如虚拟机逃逸,就是分配的用户级虚拟机,通过特殊的指令或者攻击方式,被攻击者获得整个虚拟化底层的根权限。这种攻击是以前的环境中没有出现过的。   针对种种挑战,启明星辰也一直在因时而变。首先,把启明星辰的安全产品以虚拟化软件的方式或者说以虚拟化层组件的方式,来融入到整个云计算的监控系统中。其次,研发高性能的硬件平台,提升性能。第三,和国家部委、相关机构合作,争取把云计算的普通管理和它的安全管理分离出来,即正常的云计算平台的管理可以用通用组件,例如用思科、微软的云计算管理平台,而安全性的管理,启明星辰正在研发并测试单独的云计算安全管理平台,来对整个云进行统一的安全管理。    大数据化解APT危机   在大数据时代,必须进一步强化IP治理和审计,审计的目标是为了降低用户整个IP的规避风险和法律风险。在IP地址的审计工作方面,国外有很好的思路,他们的法律法规制订的非常及时。对于IP 治理和审计,启明星辰也有一系列的解决方案,包括终端审计、终端数据防泄露、日志审计,通过综合审计平台来帮助用户解决IP 治理需求。   近两年,APT(高级持续威胁)攻击是非常热门的话题。简单的说,APT就是黑客组织针对一个有价值的目标,进行长期的、缓慢的,但是非常有技术含量的攻击。   通过和大数据结合,有没有办法可以缩短发现APT攻击的时间呢?启明星辰目前正在给某些大型客户定制开发“APT检测及预警体系”,这里面的数据采集和存储采用Hadoop结构,然后进行数据的浓缩和降解。启明星辰采用数据灰度的理念,每次拿来的数据中,把无用的数据剔除之后,我们把它的默认灰度设为10。过了一段时间,可能没有什么新的与该数据关联的可疑行为出现,它的灰度就会变成9,随着时间的推移,这个数据就会变成0,变白了,那么我们就扔掉这个数据了。假如还有一个新的可疑的东西,那么它的灰度可能又恢复到10,甚至更高。当某个数据块变黑的时候,我们就认为这个地方需要安全专家进行分析了。   启明星辰通过这种浓缩的方式,解决第一个问题,就是在大数据环境下,如何进行一个全流量的存储和浓缩。第二块就是对APT攻击的检测。我们会把它的整个过程进行一个展开,将对APT攻击的检测,在经济代价和时间代价这两方面,提升到用户可以接受的程度。   大数据和云计算推动了下一代安全数据的创新。大数据和云计算扩展了整个IT领域的计算和存储资源,给信息安全提供了信息平台和大数据处理的技术支撑,为信息安全技术和整个信息安全产品的革新创造了一个更大的可能性。
个人分类: 云与服务|1753 次阅读|0 个评论
[转载]软件定义网络在云计算中的角色
libing 2012-12-26 12:18
看起来似乎很讽刺,但是关于软件定义网络中大多数的困难都是关于如何定义它的。用一种较为弹性的观点来看的话,就是一点都奇怪SDN在云中的具体作用难以捉摸。云计算中有两个软件定义网络模型和两个不同的SDN任务,由于网络创造了云,管理这两个方面之间的相互作用是云有效和成功的关键所在。 作为一种信息服务,互联网将网络看作是透明的合作伙伴。在云端,一个用户的应用存在于云内,成为云的一部分。大多数人认为至少意味着一些网络必须同云整合。当前的共事就是数据中心必须让云具体化,但是WAN也应成为云的“资源”吗? 为了回答这个问题,首先看一下为什么数据中心必须包括SDN。 在云计算中,用户加入一个云创建的社区。云计算服务提供商面临着网络层级的多租户问题,和他们在CPU/服务器和数据库层面的所面临的多租户问题差不多。共享资源必须以一种一个用户的应用不能影响另一个用户的应用的方式来共享,因此,所有的用户资源必须分区,以便确定他们的隐私性和安全。同时网络技术,比如IP和以太网每一个都有虚拟网络容量,这些功能会由于可以支持的租户的多少而受到限制,限制了如何分离租户。 云软件提供商将网络看作是数据中心网络和云之间的合作伙伴关系。亚马逊Web服务的弹性IP地址应用驱动方法整合了网络和云;OpenStack包含网络服务,将其作为虚拟化资源之一,同存储和CPU/服务器一起。比如OpenStack的Quantum接口定义了一个虚拟网络如何创建为“托管”CPU和数据库元素。然而,Quantum没有定义用户创建这个虚拟网络的技术。每一个厂商都负责映射其技术到Quantum定义的虚拟网络模型中。 云计算的两个SDN模型 首先调整多租户,其次支持网络服务云控制的需求将我们带到了SDN技术上。SDN的两个模型出现:“叠加模型(overlay model)”和“网络模型(network model)”。 在叠加模型中,软件(通常是云连接的软件)创建了一个虚拟网络;在网络模型中,网络设备创建了这些虚拟网络。 叠加SDN,比如VMware最近收购的Nicira技术,使用软件来分区IP或者以太网地址到多个虚拟子网络中,类似TCP对端口所做的事情。新一套网络API允许应用通过他们是IP或者以太网络访问这些子网络。软件保证了多子网流量安全和分离。网络设备“看”不到叠加虚拟网络,因此不会区别对待流量。 网络托管的SDN用网络设备构建;因此,他们直接管理SDN流量。一些网络厂商,比如思科,通过采用当前的符合SDN规则网络技术和设备增加软件控制到当前设备和网络,创建“革命性SDN”。 其他网络厂商,包括大多数SDN初创公司,都希望将网络设备发展成简单的形式,迁移路由智能和路径/流量管理,这些都在设备中,并集中在云托管的软件上。 但是叠加和网络模型和任务在WAN中抵触。如果云虚拟网络必须扩展额外的云中数据中心和向外的用户,就很难看到虚拟化的网络托管的SDN实现如何回避,有三个原因: 叠加SDN依赖软件元素创建虚拟网络。很难确保用户请求软件进行参与。网络设备上的软件不能轻易更新,就不能使用叠加虚拟化。 叠加SDN不能确保WAN服务质量(QoS),因为SDN不能管理流量现成。网络托管SDN可以提供和用户以前使用的相同的精确的接口和服务,对于软件或者服务的请求没有变化。也管理流量并保证QoS。因此,端到端的SDN任务更青睐在网络中实现的SDN模型。 SDN作为“云网络”的采纳逐渐增多,意味着网络和服务的转换能支持大范围的云计算使用。操作各种SDN任务和技术模型是合适的位置的云服务和实现云计算好处的关键。对于云用户而言,知道他们的云提供商的SDN计划,以及私有云软件堆栈厂商的计划,是确保这些提供商长期价值最关键的因素。
个人分类: 云与服务|2093 次阅读|0 个评论
[转载]云计算中的创新与安全
热度 2 libing 2012-12-26 12:05
想一下,如果未来,用户与企业的数据都高度集中在一个个的计算云或数据中心中,而这些计算云有可能会成为恐怖分子的首要攻击目标,一旦恐怖分子得手,是否就会导致整个世界倒退几年、甚至几十年呢?  云计算是今年来炒得很热的名词,各大IT巨头:亚马逊、Google、微软、雅虎、IBM等纷纷试水,推出云计算的平台以及多种云计算的服务模式来吸引大众眼球,不仅是大公司,中小企业也蜂拥而上,并且从中尝到了云计算带来的诸多好处。    那么到底何谓云计算呢?   通俗地讲。云计算就是庞大的 服务器 集群,根据用户需要动态调动资源,提供各种IT服务。云计算的基本原理是,通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将更与互联网相似。这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。“云”就是计算机群,每一群包括了几十万台,甚至上百万台计算机。之所以称为“云“,是因为它在某些方面具有现实中云的特征云一般都较大,可以动态伸缩,边界是模糊的,在空中飘忽不定,你无法也无需确定它的具体位置,但它确实存在于某处。   云计算是人类使用计算资源方式的重大变革。正如有人所打的比方一样,好比从古老的单台发电机模式转向了电厂集中供电的模式。它意味着计算能力也可以像煤气、水电一样,取用方便,费用低廉。最大的不同在于它是通过互联网进行传输的。美林预计,未来5年中,云计算在全球的市场总额将超过950亿美元,全球软件市场的12%将转向云计算。    云计算是21世纪的创新   众所周知。IT业的新陈代谢是最快的,因为IT技术发展迅猛,从计算机、 手机 等高科技产品的贬值速度就可见一斑。据最近一次全球CEO调查显示,80%的CEO表示他们准备在未来有更快的变革,以便能够在领域内创造更多的价值。而这种变革不是简单地抛弃旧的,创造新的,而是在旧的基础上重新加以考虑,重新概念化、重新创新。互联网出现已经有16年的时间,而真正的计算在数据中心运行已经远远超过16年了,这需要我们去重新加以思考,重新给它注入活力,而云计算是为解决数据中心面临的间题所提供的一种创新的平台。   目前,我们大部分人还是使用PC处理文档、存储资料,通过 电子邮件 或移动存储介质与他人分享信息。一旦PC 硬盘 或者移动存储介质坏了,我们会因为资料丢失而束手无策。而在“云计算”时代,“云”会替我们做存储和计算的工作。“云”的好处还在于,其中的计算机可以随时更新,保证“云”长生不老。届时,我们只需要一台能上网的电脑,不需关心存储或计算发生在哪朵“云”上,但一旦有需要,我们可以在任何地点用任何设备。如电脑、 手机 等,快速地计算和找到这些资料,再也不用担心资料丢失。   云计算的蓝图已经呼之欲出在未来,只需要一台笔记本或者一个手机,就可以通过网络服务来实现我们需要的一切。甚至包括超级计算这样的任务。从这个角度而言,最终用户才是云计算的真正拥有者。显然,云计算是为改变人们生活方式的一种实实在在的创新。 云计算的特点   云计算的发展非常迅速,而这里有6项我们无法回避,也是使企业备受推崇的原因:   一是超大规模。“云”具有相当的规模,Google云计算已经拥有100多万台 服务器 ,Amazon、IBM.微软、Yahoo等的“云”均拥有几十万台服务器。正是因为Google拥有超大规模的服务器,才造就了它搜索引擎全球第一的地位。   二是虚拟化。云计算支持用户在任意位置使用各种终端获取应用服务。所请求的资源来自“云”,而不是固定的有形的实体应用在“云”中某处运行,但实际上用户无需了解、也不用担心应用运行的具体位置;只需要一台笔记本或者一个 手机 ,就可以通过网络服务来实现我们需要的一切,甚至包括超级计算这样的任务。   三是高可靠性和高可扩展性。“云“使用了数据多副本容错、计算节点l司构可互换等措施来保障服务的高可靠性,使用云计算比使用本地计算机可靠。“云”的规模可以动态伸缩,满足应用和用户规模增长的需要。   四是通用性。云计算不针对特定的应用,在“云”的支撑下可以构造出千变万化的应用,同一个“云”可以同时支撑不同的应用运行。不管你的电脑是什么配置,只要能连上一根网线,有一个浏览器,就可以在石端获取服务。   五是按需服务。“云”是一个庞大的资源池,按需购关云可以像自来水、电、煤气那样计费。   六是极其廉价。由于“云”的特殊容错措施可以采用极其廉价的节点来构成石;“云”的自动化集中式管理使大量企业无需负担日益高昂的数据中心管理成本;“云”的通用性使资源的利用率较之传统系统大幅提升,因此,用户可以充分享受“云’的低成本优势。这也是云计算备受中小企业青睐的原因。    云计算的几大形式   InfoWorld网站同数十家公司、分析家和IT用户讨论出了云计算的几大形式:   (1)SAAS(软件即服务)。这种类型的云计算通过浏览器把程序传给成千上万的用户。在用户眼中看来,这样会省去在 服务器 和软件授权上的开尤从供应商角度来看,这样只需要维待一个程序就够了,这样能够减少成本SAAS在人力资源管理程序和FRP中比较常用。   (2)实用计算(Utility Computing)。这种云计算是为IT行业创造虚拟的数据中心,使其能够把 内存 、I/O设备、存储和计算能力集中起来成为一个虚拟的资源池来为整个网络提供服务。   (3)网络服务。同SAAS关系密切,网络服务提供者们能够提供API,让开发者能够开发更多基于互联网的应用,而不是提供单机程序。   (4)PaaS(平台即服务)。另一种SAAS,这种形式的云计算把开发环境作为一种服务来提供。你可以使用中间商的设备来开发自己的程序并通过互联网和其服务器传到用户手中。   (5)MSP(管理服务提供商)。最古老的云计算运用之一。这种应用更多的是面向IT行业而不是终端用户,常用于邮件病毒扫描、程序监控等等。   (6)商业服务平台。SAAS和MSP的混合应用。该类云计算为用户和提供商之间的互动提供了一个平台,比如用户个人开支管理系统,能够根据用户的设置来管理其开支并协调其订购的各种服务。   (7)互联网整合。将互联网上提供类似服务的公司整合起来,以便用户能够更方便地比较和选择自已的服务供应商。 云计算应用遍地开花   因为是多种技术混合演进的结果,云计算成熟度较高,发展极为迅速。Amazon、 Google、IBM、微软和Yahoo等大公司是云计算的先行者。云计算领域的众多成功公司还包括Salesforce、 Facebook、Youtube、Myspace等。   两年多以前,Amazon作为首批进军云计算新兴市场的厂商之一,为尝试进入该领域的企业开创了良好的开端。Amazon使用弹性计算云((EC2)和简单存储服务(S3)为企业提供计算和存储服务。收费的服务项R包括存储 服务器 带宽、 CPU 资源以及月租费。有第三方统计机构提供的数据显示,Amazon与云计算相关的业务收入已达1亿美元。可见,云计算是Amazon增长最快的亚务之一。   目前正在使用的最著名的云计算例了是亚马逊的EC2网格。《纽约时报》最近租用了这个网格创建厂数据容量达4 TB的PDF文件库,包含了从1851l年至1920年之间纽约时报发表的1100万篇文章。据《纽约时报》的Derek Gottfrid说.他使用了100个亚马逊的EC2实例和一个Hadoop应用程序在不到24小时内就编排完成了全部的1100万篇文章,并且生成了另外1.5 TB的数据。累计用了240美元。即使云计算没有作为一项主流的服务应用,它能提供这种难得的处理能力也是一种可行的选择·   Google当数最大的云计算使用者。Google搜索引擎就建立在分布于200多个地点,超过100万台 服务器 的支撑之上,这些设施的数量正在迅猛增长。Google地球、地图、Gmail. Docs等也同样使用了这些基础设施。采用Goopte Docs之类的应用,用户数据会保存在互联网上的某个位置,可以通过任何一个与互联网相连的系统十分便利地访问这些数据。目前,Google已经允许第三方在Google的云计算中通过Google App Engine运行大型并行应用程序。如今,他们又以应用托管、企业搜索以及其他更多形式向企业开放了他们的“云”。   IBM在2007年11月推出了“蓝云”计算平台,为客户带来即买即用的云计算平台。它包括一系列的自动化、自我管理和自我修复的虚拟化云计算软件,使来自全球的应用可以访问分布式的大型服务器池,使得数据中心在类似于互联网的环境下运行计算。IBM计划2009年在10个国家投资3亿美元建13个云计算中心。   微软紧跟云计算步伐,于2008年10月推出了Windows Azure 操作系统 。A zure(译为“蓝天”)是继Windows取代DoS之后,微软的又一次颠覆性转型—通过在互联网架构上打造新云计算平台,让Windows真正由PC延伸到“蓝天”上。微软拥有全世界数以亿计的Windows用户桌面和浏览器,现在它将它们连接到“蓝天”上。Azure的底层是微软全球基础服务系统,由遍布全球的第四代数据中心构成。   在我国,云计算发展也非常迅猛。2008年5月10日,IBM在中国无锡太湖新城科教产业园建立的中国第一个云计算中心投入运营。2008年6月24日,IBM在北京IBM中国创新中心成立了第二家中国的云计算中心——IBM大中华区云计算中心;2008年I1月28日,广东电子工业研究院与东莞松山湖科技产业园管委会签约,广东电子工业研究院将在东莞松山湖投资2亿元人民币建立云计算平台;2008年12月30日,阿里巴巴集团旗下子公司阿里软件与江苏省南京市政府正式签订了2009年战略合作框架协议,计划于2009年初在南京建立国内首个“电子商务云计算中心”。首期投资额将达上亿元人民币;世纪互联推出了CloudEx产品线,包括完整的互联网主机服务“CloudExComputing Service",基十在线存储虚拟化的"C1oudEx Storage Service",供个人及企业进行互联网云端备份的数据保全服务等互联网云计算服务;中国移动研究院在云计算的探索方面起步较早,已经完成了云计算中心试验。中移动董事长兼CEO王建宙认为云计算和互联网的移动化是未来的发展方向。   如果说云计算给大型企业的IT部门带来了实惠,那么对于中小型企业而言,它可算得上是上天的恩赐了。过去,小公司人力资源不足,IT预算吃紧,那种动辄数百万美元的IT设备所带来的生产力对他们而言真是如梦一般遥远,而如今,云计算为他们送来了大企业级的技术,并且先期成本极低,升级也很方便。这一新兴趋势的重要性毋庸置疑,不过,它还仅仅是一系列变革的起步阶段而已。云计算不但抹平了企业规模所导致的优劣差距,而且极有可能让优劣之势易主。简单地说,当今世上最强大最具革新意义的技术已不再为大型企业所独有。云计算让每个普通人都能以极低的成本接触到顶尖的IT技术。 安全隐忧如影随形   云计算的未来蓝图是如此美好,那么它真的是无懈可击、无所不能吗?   事实并非如此,今年2月,Google Gmail邮箱爆发全球性故障,服务中断时间长达4小时。据悉,此次故障是由于位十欧洲的数据中心例行性维护,导致欧洲另一个数据中心过载,连锁效应扩及其他数据杯口,最终致使全球性的断线。   3月中旬,微软的云计算平台Azure停止运行约22个小时,微软至今没有给出详细的故障原因。不过,业内人士分析认为,Azure平台的这次宕机与其中心处理和存储设备故障有关。   除了Google和微软的云计算服务出状况外,去年亚马逊S3服务曾断网6小时。由此看来,云计算也未必百分百安全。虽然云计算厂商们屡次信誓以旦地宣称,能够保证高达99.99%的可靠性与安全,但用户要相信,那0.01%微小的可能万一降临到自己的头上,带来的损失也是不可估量的。   当然,除了系统故障外,还存在以下隐患:    云计算安全缺乏标准   现在有一大批标准适用于IT安全与法规遵从,其中包括SAS交互管理(SAS Interaction Management)等服务,这此标准用于管理大部分业务交互关系,而这些交互关系肯定会不断迁移到云计算环境上。   而与此同时,除非出现针对云计算架构的安全模型和标准,否则大部分风险以及出现问题后的责怪会直接落在IT部门的肩上,而不是云计算服务提供商。   IBM公司的安全、治理和风险管理部门主管Kristin Lovejoy也认为,最终,云服务的消费者要负责维护数据的保密性、完整性和可用性。所以对企业来说,必须有选择地采用云服务,如果是非关键任务,可以放在云计算环境电如果是核心的、又是关键任务,肯定要把它放在 防火墙 后面。    云计算面临潜在的隐私问题   据世界隐私论坛近日发布的一份报告声称,如果企业期望通过利用云计算服务来降低IT成本和复杂性,那么占先应确保在这个过程中不会带来任何潜在的隐私问题。   你一旦把数据交给外人存储,就会面临潜在问题。企业可能常常甚至不知道自己的数据到底存储在什么地方。信息有时最终出现在多个地方,每个地方可能需要遵守不同的隐私需求。企业还应当事先对托管服务提供商作一番调查,确保云环境中的数据安全和隐私措施至少与自己的措施一样可靠知道云计算服务提供商落实了哪种业务连续性和灾难恢复措施以及处理数据泄密事件的政策也很重要。一心想通过云计算削减成本的用户往往会忽视这类问题,需要在合同中阐明隐私保护方面的内容。   那么是不是我们就对云计算可能存在的风险而对其避而远之呢?事实上,任何创新都会有风险,我们总会找到降低和消除风险的办法:   (1)控制数据位置。影响大小客户的另一个问题就是数据所在位置,因为不同国家适用不同的隐私和数据管理法律.所以这对从事跨国生意的公司来说特别重要。比方说,欧盟对于个人方面的哪典数据可以保存及保存多久有着严格规定。许多银行监管部门也要求客户的财务数据保留在本国,而许多遵从法规要求数据不能与共享 服务器 或者数据库上面的其他数据放在一起。   如今,用户可能根本不知道自己的数据放在云计算环境中的哪个地方。而这个事实带来了数据隐私、隔离和安全等方面的各种法规遵从问题。但数据位置不确定的这个问题正在开始变化,比如Google允许客户指定把自己的Google Apps数据保存在何处,这归功于它收购了 电子邮件 安全公司Postinie再比如瑞士银行要求客户数据文件保存在瑞士本国,Google现在就能做到这一点。   更深入一步就是能够在云计算环境的多租户架构上,把用户的数据与其他客户的数据实现物理隔离。但这种隔离技术有望通过目前尚处于初级阶段但功能日益强大的虚拟化技术来实现。   (2)数据加密。数据加密能缓解无意或恶意透露信息有关的一部分隐私风险—这种加密既针对存储在云计算服务提供商的 服务器 上的数据,还针对传送给最终用户的数据。另外,实施双因子验证方案来控制有人访问云计算服务提供商存储的数据,有望确保只有可以访问数据的用户才能看到数据。当然,如果企业各方面都做到位,并且事先都做好了工作,那么是自己存储数据还是由云计算服务提供商存储数据并没有太大区别。   (3)数据丢失与备份的处理。数据存放在何处?哪些人有权访问?数据安全吗?这此都是大问题,因为除了软件及服务((Software asa Service, SaaS)供应商之外,云服务供应商很少具备长期处理敏感数据的经验。一般说来,数据在云服务中是共享存储的,因此具有潜在危险。其实,我们就是把数据存放在公司内部也是有风险的,更别提云服务了。经常对企业内数据访问的风险/利益进行评估的这种方法同样也可套用到云服务上。判断可将哪些数据转移到云服务中,以及如何保护数据,需要我们了解井核实供应商的标准,搞清楚是否可以对它们进行修改。   在使用云服务(如亚马逊公司的弹性计算云)时,企业可对虚拟实例中运行的 操作系统 、应用程序或数据库管理系统进行数据加密。在使用其他服务(如应用程序托管)时,IT组织需要在开发程序时多留个心眼,确保在程序中内置安全措施(如数据加密)。   不论数据存放在何处,企业都应该慎重考虑数据丢失风险。亚马逊公司明白电脑会时不时发生故障,所以建议其客户通过冗余和备份计划应对电脑故障。有些云供应商提供备份服务或数据导出功能,这样企业就可以自行创建数据备做另一些供应商则要求客户使用企业自行开发或第三方开发的备份程序。 云计算的未来趋势   毫无疑问,云计算的广泛应用会给人们的生活带来改变。它将很有可能彻底改变用户使用电脑的习惯,使用户从以桌而为核心使用各项应用转移到以Web为核心进行各种活动。而计算机也有可能退化成一个简单的终端,不用再像现在一样需要安装各种软件,同时为这些软件的配置和升级费心费神。未来的计算机可能仅仅用作网络连接以及使用云计算之上的各项服务.   改变最大的应该是企业(尤其是中小企业),他们能够快速搭建自己想要的各种应用,而不用再为 服务器 资源而烦恼。而云计算最终能否普及至个人,恐怕还需看未来一段时间的发展。   当然,云计算在未来的发展也面临着各种挑战,其中安全和隐私将成为首要问题。试想一下,如果未来,用户与企业的数据都高度集中在一个个的计算云或数据中心中,而这些计算云有可能会成为恐怖分子的首要攻击目标,一旦恐怖分子得手,是否就会导致整个世界倒退几年、甚至几十年呢?同时。用户该如何信赖提供云存储以及云服务的那些公司,如何确保那些公司不泄露用户的隐私呢?所有这些,都是云计算真正普及时必须要解决的问题。   Google中国研究院副院长张智威表示,当前业界炒作的v计算概念,不可否认里面有不少商业推广的因素,但没有人敢否认这是互联网发展的大势所趋。任何新的革命性的事物从出现到被用户广泛接受都要经历一个过程。看来,云计算如何在创新和安全之间取得平衡,还取决于时间,随着带宽和相应的服务模式足够成熟,云端会越来越庞大,到时云计算将给互联网带来一场革命性的变化。   在今年4月旧金山举行的RSA安全会议上,思科总裁兼首席执行官钱伯斯表示,通过石计算的方式,许多项日都将以免费服务的形式在互联网上进行提供,这使企业在得到便利的同时,也承担着被竞争对手窃取核心机密的风险。钱伯斯说:“毫无疑问,创新总是与安全问题并存,因此,人们必须谨慎地处理好两者之间的平衡。那么,人们怎样才能远离安全问题所带来的困扰呢,一个最好的解决办法就是构建一个完善的安全监控系统。”
个人分类: 云与服务|2591 次阅读|3 个评论
虚拟化不是云计算
isaer 2012-12-15 22:57
虚拟化不是云计算的本质。虚拟化不是云计算,最多只能是云计算发展过程中遗留软件生命周期延续的一个支持技术。 云计算也不一定是未来计算机几首发展的真正方向。当前一台终端的计算能力都很强大,计算能力都迁移到云端,则终端的计算能力会造成大量浪费,且网络负载同时也会加大,这些都不符合当前技术发展的真实情况。可能有人反驳提出,带宽越来越大,根本不用担心,在我看来,带宽宽了,但浪费依然是浪费。云端的利用率提高了,但云端+客户端总体的利用率并没本质提高,有可能确是降低了。 大规模分布式计算,充分利用终端的计算能力,才应是计算机及网络技术发展的方向。
2088 次阅读|0 个评论
[转载]第七届科技信息资源共享促进国际会议举办,数据堂应邀做专题报告
热度 1 shawn360 2012-12-10 08:59
11月24日-25日,第七届科技信息资源共享促进国际会议(COINFO 2012)在南京大学成功举办。南京大学常务副校长张荣在开幕式上致欢迎辞,科技部郑国安副秘书长、中国科学技术信息研究所贺德方所长、江苏省科技厅蒋跃建副厅长等嘉宾出席开幕式。 本届大会为期两天,主题是“云环境下的科技信息资源共享”。大会由中国科学技术信息研究所、南京大学、北京理工大学和澳大利亚南昆士兰大学主办,南京大学信息管理学院承办。来自中国、芬兰、加拿大、澳大利亚、西班牙、印度、缅甸、尼泊尔等十几个国家和地区的210多名专家学者与会。 本届大会由大会主题报告和5个分论坛组成,分论坛分别是:1、云环境与信息共享论坛,2、科学数据共享暨兴都库什-喜马拉雅地区数据共享论坛,3、信息质量与数据治理论坛,4、行业、区域科技信息共享应用论坛,5、人本电子健康与中国养老服务创新论坛。与会专家学者围绕“云环境与信息共享,科学数据共享,信息质量与数据治理,行业、区域科技信息共享应用,人本电子健康”等方面的内容进行了充分的交流,分享了他们在云环境下科技资源开放共享方面的最新研究成果。 数据堂应邀做了“ 科研数据共享服务实践 ”主题报告,引起参会人员的广泛关注。
2812 次阅读|2 个评论
智慧城市能走多远,美国说了算
热度 1 sheep021 2012-12-6 13:51
智慧城市能走多远,互联网说了算。互联网能走多远,美国说了算。因此智慧城市能走多远,美国说了算。 有人说,智慧城市这个东西,美国在研究,亚洲在发展,中国在发烧。现在看来,智慧城市就是那个云上的风筝,看似飞得很高,很自由,但风筝线却在美国人手里攥着呢! 为什么这么说? 因为智慧城市是基于云计算和物联网的,而云计算和物联网都以互联网为基础。所以,本质是哪个智慧城市是基于互联网的,而互联网的命根子却攥在美国一个国家的手里。至今还没打算交出来。 美欧与中俄争夺网络管控权_新闻中心_中国网 2012年12月5日 为期12天的国际电信世界大会3日在迪拜开幕,会议将就《国际电信规则》进行审议和修订,这被称为一场“欧美和中俄之间的互联网战争”。俄罗斯此次提议修改《国际电信规则》,主张成员国对互联网的管理应当有平等的权利,得到中国、印度等众多新兴国家的支持。美联社4日报道称,美国与会代表正在游说各方,试图发起一项提议,禁止该大会讨论任何关于修改互联网规则的议题。 《纽约时报》报道称,来自193个国家政府及电信公司、互联网企业的约2000名代表齐聚迪拜,参加一个“将在商业和意识形态层面展开冲突的会议”。国际电信大会上次磋商《国际电信规则》还是在1988年,此后的近30年间,国际互联网一直由美国政府实际控制。美联社称,围绕互联网规则的冲突将是此次会议的“亮点”。去年9月,俄中等国就曾向联合国提交世界网络空间行为国际准则,希望各国尽早就规范网络空间行为规则达成共识。《纽约时报》称,俄罗斯提议成员国对互联网的管理应当有平等的权利,其中包括对互联网数字、名称、地址和身份验证资源的分配、指定和回收,“实际上是试图把互联网基础架构的控制权从美国手中夺走”。 对于美国反对大会讨论俄中等国的提议,国际电信联盟秘书长哈马德-图埃称,该大会不会限制任何言论,但大会主旨是促进通信基础设施建设,为目前无法接触网络的数十亿人口提供互联网服务。美联社称,美国担心修改互联网规则将使该行业“复杂化”,“并被中国和俄罗斯利用、为其打压互联网正名”。福克斯新闻4日以“警告:联合国正走向互联网”为题报道称,与会各国试图将美国对互联网的管控权夺走交给联合国下辖的国际电信联盟,“这将是联合国历史上拥有的最大权力”。 除了美国政府,谷歌等互联网企业、非政府组织也加入论战,为美国摇旗呐喊。3日,谷歌在其搜索引擎上打出标语:“喜爱自由和开放的网络吗?请告诉世界各国政府坚持这样做”。俄罗斯《生意人报》3日引述国立莫斯科大学信息安全问题研究所副所长亚先科的话称:“俄罗斯的提议并非限制网络自由,而是要求将可能影响国家安全的互联网部分权力从美国手中交给联合国。俄罗斯这一建议被西方进行了有偏见和欺骗性的解释。”
个人分类: 智慧城市|1703 次阅读|1 个评论
云计算,多少是技术,多少是商业?
热度 3 hyperthink 2012-12-5 11:23
看到有一些依靠政府投资的科技项目,动则以“云计算”这类新颖的名词来唬弄人、唬弄钱,买上几台服务器,集群一下,跑个数据库,跑几个应用就算云计算平台了。我觉得,还是有必要看看云计算里面,到底哪些是技术成分,哪些是商业成分。 云计算,如果从最普通的意义来讲,其实主要还是一种商业形态的变化,即从过去的自建软硬件环境到现在用户可以购买软件服务了,是基于用户角度的一种新的商业模式。反应到具体的业务上,也可以看成是生产组织方式变化了,即原来需要用自己的软件和硬件进行计算或业务处理,现在可以购买第三方的软件和硬件为自己提供计算或业务处理的服务了,用户不需要关心这个软件和硬件在哪里(属于谁),只要有一个接口或界面供自己接入就行了。 云计算反映到技术层面,即云计算的供应商,需要把软硬件集成起来,特别是要把大量的硬件集成起来,需要解决并行计算、分布式计算、以及通信方面的问题,这些是技术层面的。但是这些技术层面的事情,其实应该是在“云计算”这个概念之外。因为在云计算概念之前,这些问题就已经独立成为技术问题一直在研究和发展当中。云计算概念的提出,只不过激发了更多的市场需求,推动了这些技术的发展(到底在多大程度上推动了这些技术发展,不知道有没有人研究过,我也不是很清楚,只是个猜想)。 因此,如果那些云计算项目,是在解决并行计算、分布式计算、通信方面的硬件或软件上做技术研发,那么这样的云计算项目是值得以科技项目的名义投入的。如果仅仅是买服务器、买软件,卖服务,那么似乎不应该冠以科技项目的名义,而直接作为商业项目进行投资管理更为合适。
1790 次阅读|3 个评论
大数据挖掘与云计算
shizz 2012-10-25 11:34
big data mining in the cloud.pdf
个人分类: 大数据挖掘|2249 次阅读|0 个评论
[转载]云计算推荐阅读清单 Reading List for Cloud Computing
liruijiao 2012-9-29 17:02
无意间发现了一个好东西, 想了解学习云计算的朋友可以看看。 Reading list Datacenters form the backbone of cloud-based systems. Barroso et al. introduced the Google search system, which provides a good starting point for understanding Internet-scale systems and datacenters: Luiz Barroso, Jeffrey Dean, Urs Hoelzle. Web Search for a Planet: The Google Cluster Architecture. IEEE Micro, Vol. 23, No. 2, pp. 22-28, Mar./Apr. 2003. http://baijia.info/showthread.php?tid=133 The datacenter software builds on techniques in distributed computing. Among these techniques, Paxos plays an important role in many core services in cloud systems. The following papers describe Paxos and a few systems using it: Lamport, L. The part-time parliament. ACM Trans. Comput. Syst. 16, 2 (May. 1998), 133-169. http://baijia.info/showthread.php?tid=188 L. Lamport. Paxos made simple. ACM SIGACT News, 32(4:(18-25, 2001. http://baijia.info/showthread.php?tid=414 Burrows, M. The Chubby lock service for loosely-coupled distributed systems. In Proceedings of the 7th Symposium on Operating Systems Design and Implementation (Seattle, Washington, November 06 - 08, 2006). 335-350. http://baijia.info/showthread.php?tid=59 The MapReduce framework is a pioneer of large-scale data-intensive computing in datacenters: Dean, J. and Ghemawat, S. 2004. MapReduce: simplified data processing on large clusters. In Proceedings of the 6th Conference on Symposium on Opearting Systems Design Implementation - Volume 6 (San Francisco, CA, December 06 - 08, 2004). http://baijia.info/showthread.php?tid=2 Our recent development, DVM, shows an efficient way to extend instruction-level virtualization to a large number of physical hosts, and can potentially provide an abstraction of a "single computer" for a datacenter: Zhiqiang Ma, Zhonghua Sheng, Lin Gu, Liufei Wen and Gong Zhang. DVM: Towards a Datacenter-Scale Virtual Machine. In Proc. of ACM VEE'12, London, UK, Mar. 3-4, 2012. http://baijia.info/showthread.php?tid=1114 The foundation of a series of recent large-scale file systems in datacenters is the GFS system, which provides a systematic solution to scalability, consistency, and software fault tolerance: Ghemawat, S., Gobioff, H., and Leung, S. The Google file system. In Proceedings of the Nineteenth ACM Symposium on Operating Systems Principles (SOSP'03), Bolton Landing, NY, USA, October 19 - 22, 2003. 29-43. http://baijia.info/showthread.php?tid=1 Above the file system abstraction, researchers have constructed key value stores and databases. Often not supporting the full ACID semantics, the database design is often referred to as a NoSQL database. DeCandia, G., Hastorun, D., Jampani, M., Kakulapati, G., Lakshman, A., Pilchin, A., Sivasubramanian, S., Vosshall, P., and Vogels, W. 2007. Dynamo: amazon's highly available key-value store. In Proceedings of Twenty-First ACM SIGOPS Symposium on Operating Systems Principles (Stevenson, Washington, USA, October 14 - 17, 2007). SOSP '07. ACM, New York, NY, 205-220. http://baijia.info/showthread.php?tid=120 Chang, F., Dean, J., Ghemawat, S., Hsieh, W. C., Wallach, D. A., Burrows, M., Chandra, T., Fikes, A., and Gruber, R. E. Bigtable: a distributed storage system for structured data. In Proceedings of the 7th Symposium on Operating Systems Design and Implementation (Seattle, Washington, November 06 - 08, 2006). 205-218. http://baijia.info/showthread.php?tid=4 As the technology evolves, it becomes clear that reasonably strong semantics cannot be entirely ignored. While it is relatively easy to provide atomicity on single records, it is a tremendous technical challenge to support distributed transactions in high throughput, at affordable cost and in a large distributed system. Recent systems have made certain progress in this direction. Megastore: Providing Scalable, Highly Available Storage for Interactive Services, Jason Baker, Chris Bond, James C. Corbett, JJ Furman, Andrey Khorlin, James Larson, Jean-Michel Leon, Yawei Li, Alexander Lloyd, Vadim Yushprakh, Proceedings of the Conference on Innovative Data system Research (CIDR), 2011, pp. 223-234. http://baijia.info/showthread.php?tid=805 An earlier system, PNUTS, showcases another design with several similar goals. Cooper, B. F., Ramakrishnan, R., Srivastava, U., Silberstein, A., Bohannon, P., Jacobsen, H., Puz, N., Weaver, D., and Yerneni, R. PNUTS: Yahoo!'s hosted data serving platform. Proc. VLDB Endow. 1, 2 (Aug. 2008), 1277-1288. http://baijia.info/showthread.php?tid=126
个人分类: Tech|2982 次阅读|0 个评论
Google云计算与系统生物学
热度 4 sunon77 2012-9-28 13:07
Google云计算与系统生物学
Google 云计算与系统生物学 Google 今年推出了海量云计算服务。作为衡量云计算效率的一个标杆性工作,是所里 Ilya 小组为全美癌症全基因组工程 (TCGA) 做的全基因组癌症关联计算。 The Cancer Genome Atlas (TCGA) 工程始于 2009 年,两年内投资 2.75 亿美元,五年内计划对主要的二十种癌症有关基因变化的林林种种全部搞清楚 (最近在Hutchinson癌症中心听的一个报告,未来一到两年这些都会被实现)。 Eric Lander 在 Youtube 上有一个很精彩的综述,我就不用罗嗦了。 Eric Lander 在 Youtube 上 Cancer Genome Atlas (TCGA) 工程的综述 http://www.youtube.com/watch?v=gGdcgUub6YQ TCGA未来五年的路线图 Ilya 小组有一个 1000 个 CPU 的计算机集群,但对这样一个浩大的工程也显得势单力薄。比如,计算一对基因的在某种癌症中的关联性需要大概十分钟(人类大概有 25000 个基因,想想看这得多长时间)。 今年他们和 Google 合作,使用了云计算中大概 60 万个 CPU ,计算速度大为提高。在 Google 云计算的主题演讲 (Google IO Keynote speech) 中被作为一个标杆性工作。当屏幕上蓝色连接在‘塔塔’声响中飞速出现时,台下掌声四起,欢呼一片。 http://www.youtube.com/watch?v=3igX-ebL-PY
个人分类: SystemsBiology-系统生物学|6544 次阅读|5 个评论
百度公司未来几年投资云计算16亿美元
热度 1 zhpd55 2012-9-4 15:55
百度公司未来几年投资云计算16亿美元
据 PhysOrg 网站 2012 年 9 月 3 日 报道,百度财务总监当天透露,百度作为中国领先的搜索引擎,在未来的几年里对于云计算方面的投资将超过 100 亿元人民币 ( 折合 16 亿美元 ) 。投资将用于构建数据中心和招聘人员为其在线数据存储服务 , 百度公司对于上述投资的陈述仅仅是引用了 李昕晢 (LI Xin-zhe) 的话 , 但没有提供细节。百度还宣布了一款新型的手机浏览器 , 成为今年在国内最受欢迎的访问网络浏览器。道琼斯通讯社报道,百度的新浏览器将提供更快的下载速度和定制应用程序 , 百度约有 80% 的中国市场 , 得益于中国政府的支持和谷歌搜索引擎的影响。详细结果请浏览以下网址: http://phys.org/news/2012-09-china-baidu-invest-bn-cloud.html .
个人分类: 新观察|2697 次阅读|1 个评论
[转载]千奇百怪的云
libing 2012-8-29 23:30
国内外有多少与一个“云”字相关的名称呢?经过编者的这么一问,您是否也很想知道目前有哪些与“云”相关的名称和服务呢?通过编者的收集,发现当前有几十种与“云”字相关的云服务名称。这些名字使用的是否合适,加上了“云”的产品或服务与原来的区别在哪里呢? 一个新概念的兴起,一个新时代的到来,总是首先会有一些新鲜名词被创造出来。云计算便是这样被创造出来,像“云”一样计算。所以,当众多商家意识到,这个新鲜的词语有多么吸引客户关注之后,纷纷更换自己的产品或服务的商标,美其名曰“云XX”。 不可否认,有些商家是换汤不换药的做法,挂羊头卖狗肉,但是也不能忽略了一大批技术优势的厂商正在通过技术融合创新,为云服务的推出做出不懈的努力。那么,如何判断“首先,我想通过简单的陈述,表达自己对于云计算的看法,然后再把这个帽子加到一些应用上去,让大家看看,这个名字,是不是符合云计算的真实意图。 那么,如何判断某个云名称是否准确呢,先来看看名家是如何定义云计算的吧。Gartner最开始是这样定义的:“云计算是一种计算风格,在这里可扩展性及弹性的IT能力都是通过基于互联网的服务向用户提供的。”编者曾经也看过,一遍文章提到20位专题阐述自己对于云计算的理解,没有重复的。甚至也有业界人士声称,你让一百位专家谈云计算的定义,他会告诉你一百个答案。 我们发现,对于一个新事物的定义始终要经历了一个百家争鸣的阶段,这似乎是一种常态。但是,大多数业界专家都统一认为,云计算将要在全球掀起一场IT变革。这场革命不正在影响着每个人的工作和生活。 维基百科是这样描述云计算的:云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备。整个运行方式很像电网。 云计算是继1980年代大型计算机到客户端-服务器的大转变之后的又一种巨变。用户不再需要了解“云”中基础设施的细节,不必具有相应的专业知识,也无需直接进行控制。云计算描述了一种基于互联网的新的IT服务增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展而且经常是虚拟化的资源。云其实是网络、互联网的一种比喻说法。因为过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。典型的云计算提供商往往提供通用的网络业务应用,可以通过浏览器等软件或者其他Web服务来访问,而软件和数据都存储在服务器上。云计算关键的要素,还包括个性化的用户体验。 编者认为云计算是一个非常广泛和笼统的说法。编者的理解,它是一个思想,一个概念,它将用户手头的闲散的IT资源集中起来再分配,按需供给。有点类似,一些描述战争的电影中经常看到的场面,某小分队被敌人围困,武器和粮食都非常珍贵,队长要将所有物资集中起来分配到最需要的队员手中,以达到最大化的利用。而这种情况,也只有到了万不得已的情况下,才会出现,正常情况下的补给都是不受这么多限制的。而这种事情,也绝非常态。 但是,到了IT领域,这种集中再分配,如果要演变为一种常态,而与其相关的技术都是在不断的填充和完善的过程中。虚拟化、自动化管理、IT管理,IT监控等。 如果到如今,您还认为云计算只不过是一朵“浮云”,这些高科技与自己的工作和生活相距甚远。那么,编者要告诉您,就在您的身边,有很多云计算已经转化成为让您触手可及的云应用了。 IT基础类云服务包括,云服务器、云存储、云主机、云数据库、云操作系统(云管理)、云安全、云平台、云外包等。下面是这些云服务的具体定义。 云数据库 即CloudDB,或者简称为“云库”。它把各种关系型数据库看成一系列简单的二维表,并基于简化版本的SQL或访问对象进行操作。传统关系型数据库通过提交一个有效地链接字符串即可加入云数据库。云数据库解决了数据集中与共享的问题,剩下的是前端设计、应用逻辑和各种应用层开发资源的问题。使用云数据库的用户不能控制运行着原始数据库的机器,也不必了解它身在何处。 云安全 “云安全(Cloud Security)”计划是网络时代信息安全的最新体现,它融合了并行处理、网格计算、未知病毒行为判断等新兴技术和概念,通过网状的大量客户端对网络中软件行为的异常监测,获取互联网中木马、恶意程序的最新信息,传送到Server端进行自动分析和处理,再把病毒和木马的解决方案分发到每一个客户端。 云操作系统 又称为云计算中心操作系统,又称云计算操作系统(Cloud OS),它是云计算后台数据中心的整体管理运营系统(也有人认为云计算系统包括云终端操作系统,例如现在流行的各类手机操作系统,这与先行的单机操作系统区别不大,在此不做讨论),它是指构架于服务器、存储、网络等基础硬件资源和单机操作系统、中间件、数据库等基础软件管理海量的基础硬件、软资源之上的云平台综合管理系统。 云计算中心操作系统通常包含以下几个模块:大规模基础软硬件管理、虚拟计算管理、分布式文件系统、业务/资源调度管理、安全管理控制等几大模块组成。 简单来讲,云计算中心操作系统有以下几个作用,一是治众如治寡,能管理和驱动海量服务器、存储等基础硬件,将一个数据中心的硬件资源逻辑上整合成一台服务器;二是为云应用软件提供统一、标准的接口;三是管理海量的计算任务以及资源调配。 云平台 转向云计算(cloud computing),是业界将要面临的一个重大改变。各种云平台(cloud platforms)的出现是该转变的最重要环节之一。顾名思义,这种平台允许开发者们或是将写好的程序放在“云”里运行,或是使用“云”里提供的服务,或二者皆是。 至于这种平台的名称,现在我们可以听到不止一种称呼,比如按需平台(on-demand platform)、平台即服务(platform as a service,PaaS)等等。但无论称呼它什么,这种新的支持应用的方式有着巨大的潜力。 云主机 云主机是云计算在基础设施应用上的重要组成部分,位于云计算产业链金字塔底层,产品源自云计算平台。该平台整合了互联网应用三大核心要素:计算、存储、网络,面向用户提供公用化的互联网基础设施服务。 云主机是一种类似VPS主机的虚拟化技术, VPS是采用虚拟软件,VZ或VM在一台主机上虚拟出多个类似独立主机的部分,每个部分都可以做单独的操作系统,管理方法同主机一样。 而云主机是在一组集群主机上虚拟出多个类似独立主机的部分,集群中每个主机上都有云主机的一个镜像,从而大大提高了虚拟主机的安全稳定性,除非所有的集群内主机全部出现问题,云主机才会无法访问。 云主机是新一代的主机租用服务,它整合了高性能服务器与优质网络带宽,有效解决了传统主机租用价格偏高、服务品参差不齐等缺点,可全面满足中小企业、个人站长用户对主机租用服务低成本,高可靠,易管理的需求。 云服务器 云服务器是一种类似VPS服务器的虚拟化技术, VPS是采用虚拟软件,VZ或VM在一台服务器上虚拟出多个类似独立服务器的部分,每个部分都可以做单独的操作系统,管理方法同服务器一样。 而云服务器是在一组集群服务器上虚拟出多个类似独立服务器的部分,集群中每个服务器上都有云服务器的一个镜像,从而大大提高了虚拟服务器的安全稳定性,除非所有的集群内服务器全部出现问题,云服务器才会无法访问。 云服务器是,是一种基于WEB服务,提供可调整云主机配置的弹性云技术,整合了计算、存储与网络资源的Iaas服务,具备按需使用和按需即时付费能力的云主机租用服务。在灵活性、可控性、扩展性及资源复用性上都有很大的提高。 云外包 对云外包的定义,鼎韬认为所谓云外包,就是基于“云”平台,“云”模式和“云”理念的外包服务。其包括三个层面的内容,一是基于“云平台”的外包,即“云计算”和SaaS模式的外包服务;二是基于“云”模式的外包,即外包企业将自己的服务模式从线性的传统点状服务模式转变为非线性的PaaS的平台服务模式;三基于“云”理念的外包,即是聚集海量个人和企业服务资源的“服务云”,即众包的升级版。 云外包的核心就是外包企业建立标准化的统一外包服务处理平台,通过标准化,模块化和流程化将服务集成到统一云平台上,在数据库里面进行统一处理。而后根据客户的需求,再针对企业的个性需求定制部分流程,这样服务就可以在云外包系统上进行流水线式的操作处理。同时,它也是云端的服务,云和端要有很好的耦合。设施和平台是云,服务是端。只有在“云端”,才能形成云外包:不管是软件开发,软件服务,还是财务管理,人力资源,所有的服务器都变成了一种服务;云可以是私有的,公共的,或者第三方的,而端则必须是私有的。 云外包服务的核心就是外包企业建立标准化的统一外包服务处理平台,通过标准化,模块化和流程化将服务运用到云计算平台中。而后根据客户的需求,再针对企业的个性需求定制部分流程。 企业为了控制人力成本、保证IT的质量、时间和应用效果,把企业业务的全部或部分交给专业化的服务商来做。同时,企业也需要在有限的资源条件下选择最合适的外包服务以实现利润最大化。 云存储 云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。 当云计算系统运算和处理的核心是大量数据的存储和管理时,云计算系统中就需要配置大量的存储设备,那么云计算系统就转变成为一个云存储系统,所以云存储是一个以数据存储和管理为核心的云计算系统。例如,云笔记、云硬盘、网盘等都是这个概念。 商业应用类服务包括:云办公、云会议、云打印、云电脑。下面是这些云服务的具体定义。 云办公 很早以前,谷歌就推出针对市场上一些收费的办公软件的免费在线办公服务。所谓“云办公”就是用户可以随时随地,通过互联网和浏览器登录已注册的账号和密码,就可以实现在线办公,包括新建、编辑、保存和共享办公文档,不需在本地安装任何软件,而且这类云办公服务多为永久免费。这类服务要求不同的服务之间和平台之间必须具有良好的兼容性,以及传输和存储在互联网上的文档的安全性。当前积极推出“云办公”服务的厂商有,谷歌Docs、微软365 Office、百会等。 云会议 云会议是基于云计算技术的一种高效、便捷、低成本的会议形式。使用者只需要通过互联网界面,进行简单易用的操作,便可快速高效地与全球各地团队及客户同步分享语音、数据文件及视频,而会议中数据的传输、处理等复杂技术由云会议服务商帮助使用者进行操作。 云计算上的网络视频会议,是云计算在远程会议上的最新应用。全时是国内第一家提出云会议概念并已推出云会议产品的厂商,它实现了电话会议、网络会议和视频会议的完美结合,企业只需要支付极少的服务费用,即可享受随时随地开会,而不需要投入其他任何费用。 目前国内云会议主要集中在以SAAS(软件及服务)模式为主体的服务内容,包括电话、网络、视频等服务形式,基于云计算的视频会议就叫云会议。 云打印   所谓的“云打印”(Cloud Print),既是支持所有类型的打印机,用户不需要安装打印机的驱动程序,通过云打印技术标准,所有设备,在运行任何应用程序(网络版、桌面版和手机版应用程序)过程中,都能够同身边的任何打印机相连接,以完成各种打印任务。在此过程中,用户并不需要为相应打印机安装驱动程序。 云打印的工作原理是:任何应用程序,可通过应用编程接口(API)来支持云打印技术标准。如此一来,用户就可直接通过应用程序来执行打印命令。目前,据了解云打印的服务是由谷歌在Chrome OS中提出。 云打印这个功能,目前获得了惠普打印机的支持。任何一台云打印机都拥有独一无二的邮件地址,打印变得像发邮件一样简单,用户只要能发邮件,就可以进行打印。这使得人们无论在哪里,都可以通过身边的移动设备,轻松打印需要的文件或照片。 云电脑 云电脑是采用现在最新的云计算技术开发出的一款智能终端产品。云电脑看起来就是一个小盒子,可以替代普通电脑来使用。原来用10台电脑的地方,现在只需1台电脑,然后加上10个小盒子,就可以像原来一样的使用了。 我们用一台电脑来管控这10个小盒子,使每一个使用小盒子的人,看到的界面和操作都和原来使用的电脑一样,而且每个用户端各用各的,互不影响。这就是云计算技术。"云电脑" 这个名词是由 "电脑" 一词创始人范光陵院士 Dr. Fan Kuanling 所创始。 一个处理进程被划分为几部分,然后并发地执行各部分的指令分别在不同的CPU上同时运行,这些CPU可以存在于单台机器中,也可以存在于多台机器上,它们通过连接起来共同运作。 早期的计算里,程序一般是被串行执行的程序是指令的序列,在单处理器的机器里,程序从开始到结束,这些指令一条接一条的执行。 云浏览器:阿里巴巴自主开发的阿里云浏览器浮出水面。产品包括PC端和手机端浏览器。近来,各大互联网巨头都开始研发自有浏览器,阿里巴巴在浏览器的布局,有利于巩固阿里巴巴的用户入口,在整个“大阿里”的内循环中起到数据保护的作用。 云消费类服务产品和服务包括:云手机、云电视、云音乐、云输入法、云翻译、云设计、云厨房。下面,编者具体解读这些云计算服务。 云手机 云手机Cloudphone,就是将云计算技术运用于网络终端服务,通过云服务器实现云服务的手机。简单说,就是“云”化的手机。每一个应用、每一个功能都是云。主要包括云助手、云便签、云图片、云聊、云搜索、云邮、云浏览器等几大功能特色,所有的云功能都基于一个云账号,这个账号代表了个人在云服务器的身份证。同时云服务器可以在手机和浏览器当中共同登陆。 “云手机”虽然名字听上去有些深不可测,但其实没有那么神秘,无需下载云端应用程序。“云手机”最核心的2个字就是“网络”,没有网络就没有所谓的“云手机”,手机用户终端无需足够强大,只需要联网即可。同时,云计算可以备份用户的数据,让网络成为用户的“硬盘”,随时随地接入,不怕文件丢失。海量的信息将会为用户服务。可以说云计算是移动互联网的切入点,目前各大厂商都非常的重视。 云电视 云电视是应用云计算、云存储技术的电视产品,是云设备的一种。通俗地讲,就是用户不需要单独再为自家的电视配备所有互联网功能或内容,将电视连上网络,就可以随时从外界调取自己需要的资源或信息,比如说,可以在云电视里安装使用各种即时通讯软件,在看电视的同时,进行社交、办公等等。 云电视不是虚无缥缈的概念,而是能实现海量存储、远程控制等众多应用优势的重要技术成果。只要有网线接口,云技术可以配置在3D、LED、LCD等各种电视上,是对智能电视现有应用的升级,也是智能电视发展到高级阶段的必要配置,它极大提升了智能电视的实用性。 云电视是指在智能电视基础上,运用云计算、云存储等技术对现有应用进行升级的智能化云设备,它拥有海量存储、远程控制等众多应用优势,并能实现软件更新和内容的无限扩充。企业通过“云”来控制后台数据和软件平台,包括基础操作平台和应用操作系统,彩电用户不需要为自家的电视进行任何升级、维护、资源下载,只需将电视连上网络,就可即时实现最新应用和海量资源的共享。 云音乐 所谓“音乐云计算”,简单的讲就是用户通过音乐软件,可以将存储在云端的音乐内容在手机、PC和电视等多种设备上进行播放、分享,无需用户再费时费力从电脑存储器中拷贝到其他终端设备。 按照传统意义,音乐发烧友在获取、收藏、整理和收听音乐时,首先要在浩瀚网络空间中寻找、下载歌曲,再整理到移动终端上进行收听。为此,很多消费者可能需要在电脑硬盘中存储数十GB容量的数字音乐。这时,手机等移动设备可能会受制于容量空间而无法全盘拷贝。而即使能够拷贝,也无法将这些音乐以最便捷、有效的方式和朋友共享。 在“音乐云计算”开发中,苹果、谷歌等公司意欲解决的就是这些问题,其目标是,只要在上网环境下,音乐爱好者就可以通过从“云端”获取内容,而不必再劳师动众去做上述一系列工作,因为云端的服务器已经帮助完成。 云输入法 传统输入法受限于内存和CPU能力,使用规模较小的词库和语言模型,输入准确率有限;云输入法利用服务器的无限量的存储和计算能力,大幅提升输入准确率 云输入法跨平台、免安装,对于Linux、Mac OS等操作系统的用户,或在网吧等临时使用环境,都能在上网冲浪时享受输入法的流畅输入体验。 云输入法是依托于云计算技术的输入法,其与一般输入法最明显的区别在于,没有本地输入法文件,完全靠服务器支持。此外,云输入法是搜索引擎和自然语言处理的集大成者,具有云计算的特点,代表了未来技术发展的方向。云输入法做到了中文输入领域空前的大、全、准。同传统输入法相比,云输入法更加精准,将中文输入的语义正确率提高到90%,更是将用户短句的覆盖率和首选率提高到了96%以上。 目前已经正式推出的云输入法有搜狗云输入法,qq云输入法,百度在线输入法等。 云翻译 云翻译又被称为在线翻译,通常是指借助互联网的资源,利用实用性极强、内容动态更新的经典翻译语料库,将网络技术和语言精华完美结合,为网民提供即时网络响应的在线翻译或者人工翻译服务;在线翻译是目前较多的企业使用的工具之一,在线翻译可以很完善地翻译出各类翻译语句和材料,是不可或缺的工具。在线翻译的质量标准:运用了强大的后台数据库调取相应的翻译内容传输到求翻译者的本地。 云设计 又称为在线设计,指用户无需在本机上安装任何设计工具,可以同在任何可以上网的设备上通过浏览器使用设计工具,享受厂商已经定制好的设计环境。这个环境,可以快速响应用户的调用,二维生成三维图像,以及保存和上传设计图等环节。同时,还可以从厂商预先订制的图像库中快速提取模型为我所用。 云厨房 厨房中小家电的种类数量越来越多,这些电器产品在给我们带来便利生活享受的同时,也给我们增添了不小的烦恼。种类繁多的电源线,使您为电源插座的不够用而不知所措;不停地插拔电源插头,云厨房为您提供一种全新的厨房生活体验。 云厨房功能:1、便利:烟灶互联,当用户打开燃气灶时,抽油烟机自动打开,方便;2、娱乐:客厅电视上的视频(电影、图片)可以拉回到PAD或手机上观看,随时随地娱乐;3、无尾:无线牵绊,更多安全、更多方便。 行业云应用类 前面提到更多的是公有云服务,然而很多人认为,云计算对于企业来说,最有价值的是私有云。很多IT资源都集中在以大中型企业,政府、医疗行业、金融、电信、保险等等行业内,最大化地利用好这些资源,将在很大程度上提供了行业以及政府的运作效率提供了技术保证。 这些云服务,由行业内或某个区域内起主导作用或者掌握关键资源的组织建立和维护,以公开或者半公开的方式,向行业内部或相关组织和公众提供有偿或无偿服务的云平台。下面编者向您一一揭示当前市场上出现的行业云。  政府云 “政府云”是干什么用的?报道告诉我们,它可提供对海量数据存储、分享、挖掘、搜索、分析和服务的能力,使得数据能够作为无形资产进行统一有效的管理。通过对数据集成和融合技术,打破政府部门间的数据堡垒,实现部门间的信息共享和业务协同。通过对数据的分析处理,将数据以更清晰直观的方式展现给领导,为领导更好的决策提供数据支持。 一个强大的云数据将成为城市的“大脑”,它能够按照规定的程序帮助政府思考怎样让老百姓的生活变的更加便捷高效,从而推动智慧城市的建设与发展,使市民生活品质得到提升、政府行政效率和公共服务能力得到提升、城乡建设和管理科学化水平得到提高。 政府云数据中心可提供对海量数据存储、分享、挖掘、搜索、分析和服务的能力,使得数据能够作为无形资产进行统一有效的管理。通过对数据集成和融合技术,打破政府部门间的数据堡垒,实现部门间的信息共享和业务协同。通过对数据的分析处理,将数据以更清晰直观的方式展现给领导,为领导更好的决策提供数据支持。 对政府用户而言,云计算不仅能够提高办公效率、节约信息化成本,还能够帮助其实现管理创新和服务型政府转型。政府不仅是云计算重要应用主体,更是重要的市场规则制定者、产业运营监督者和产业发展推动者。政府可以在以下四个方面发挥重要作用: 第一,制定相对宽松的政策和标准,细化云安全、云可靠性和市场准入机制 第二,支持建立本地云计算中心,积极与行业龙头企业合作,鼓励扶持新的云服务供应商 第三,提高中国网络基础设施的质量,尤其要提高中国宽带网络的速度和可用性 第四,政府机关应当率先应用云服务,支持诸如“政务云”、“公共服务云”的建设,起到行业表率和带动作用。 而在中国的行业信息化进程中,政府起到了非常大的作用,除了规则制定和产业监督职能之外,政府还应该起到行业标杆的作用。在国家“十二五”计划提出之后,创新的主题为云计算的发展铺平了道路,政府的云计算探索也逐渐起步。 政府跨入云地带将是一个必然的趋势,云计算将促进政府职能转变并提升服务质量,从而达到便民利民的效果。 与其他行业不同,政府内部的数据信息不仅涉及到经济利益,更会涉及到国家安全等敏感问题。政府在信息安全方面的特殊性,必然会对政府云应用的推进和发展起到阻碍作用。无论是信息化程度较高的欧美、日本,还是中国,政府在实施云计算时都需要面对安全问题所带来的挑战,在实战方面,我们倒是可以借鉴一下发达国家的经验。 作为最特殊的云计算用户,政府机构的云计算应用必须使用专用的数据中心,且与普通用户的云服务在物理上进行隔离,并在这一基础之上尽可能把握“私有”和“公有”的关系。此外,建立完善的信息安全法规体系也是非常重要的。通过法律法规来规范云计算的发展,规范之下必定更加完善,从而安全问题也会随之减少。 教育云 云计算在教育领域中的迁移称之为“教育云”,是未来教育信息化的基础架构,包括了教育信息化所必须的一切硬件计算资源,这些资源经虚拟化之后,向教育机构、教育从业人员和学员提供一个良好的平台,该平台的作用就是为教育领域提供云服务。 教育云包括“云计算辅助教学”( Cloud Computing Assisted Instructions,CCAI)和云计算辅助教育(Clouds Computing Based Education,CCBE)多种形式。 云计算辅助教学是指学校和教师利用“云计算”支持的教育“云服务”,构建个性化教学的信息化环境,支持教师的有效教学和学生的主动学习,促进学生高级思维能力和群体智慧发展,提高教育质量。也就是充分利用云计算所带来的云服务为我们的教学提供资源共享,存储空间无限的便利条件。 云计算辅助教育或者称为“基于云计算的教育”,是指在教育的各个领域中,利用云计算提供的服务来辅助教育教学活动。云计算辅助教育是一个新兴的学科概念,属于计算机科学和教育科学的交叉领域,它关注未来云计算时代的教育活动中各种要素的总和,主要探索云计算提供的服务在教育教学中的应用规律,与主流学习理论的支持和融合,相应的教育教学资源和过程的设计与管理等。 测试云 测试云就是,面向行业客户推出的测试服务整体解决方案。通过使用测试云服务,可以更加简便和快速地构建测试环境,实现测试资源的动态管理,同时基于专业化测试管理工具定制出规范的测试管理流程,并提供专业化的测试服务,从而大大缩短项目周期,降低测试成本,提高软件质量。 对于提供IT产品和服务的企业,谁能在比别人短的周期内提供和推出高质量产品和服务,谁就占市场。 测试云可以大大节省时间和成本,企业可以将更多的精力放在项目管理和提高测试的质量上。“通常,企业在推出IT产品和服务过程中,花在测试和编码的时间比为3:1,在实际中可能更大。 通过测试云将服务器、存储、网络和各种平台等基础设施进行虚拟化,为企业组织提供一个共享可用的自动化测试环境交付平台。技术人员可通过一个简单的WEB界面就非常容易地进行自动化配置,构建不同的测试模板,为企业配置不同的测试环境,并可根据需要提供随意扩展的数量和类型。同时,还能对每个测试云进行动态的全生命周期的监控管理。当测试发生中断时,能够自动回滚,保证了测试的进度和质量。 园区云 眼下,有很多新兴的产业园区的云计算基地诞生,它们包括开发区、科技园区、生物园区、动漫园区在内的政府扶植的新兴产业孵化园区。这些园区内新兴中小企业较多。对于正处于成长期的中小企业而言,自己投资建设IT基础架构的投资回报率较低。基于降低中小企业IT投资成本和提升政府服务质量,改善投资环境,提升园区吸引力,政府为园区内企业构建数据中心、提供云计算平台成为改善投资环境重要方面。 医疗云 医疗云是在医疗护理领域采用现代计算技术,使用“云计算”的理念来构建医疗保健服务的系统。这种医疗保健服务系统能有效地提高医疗保健的质量、控制成本和能够便捷访问的医疗保健服务。 随着医疗云的发展和推广,可以解决疗资源分配不均的问题,在偏远的地方居民也能享受到大城市的医疗资源,同时,一些慢性病的患者可以受远程指导,在家进行治疗。 云计算不仅为他们的软件提供了强大的计算能力,更重要的是云计算可以把不同地区不同医院都联系起来,共享患者和器官捐赠者数据库。Jacobs表示,正是因为一直在思考云计算,所以他写出了这个基于云的应用。 云计算让区域信息共享的天然优势可以解决这一集团化问题。利用云计算,一个数据中心、一套系统,就可以解决医院集团化问题,从而节省大量投资。云将不同的临床管理平台统一到一个临床管理平台,这个平台还包含数据仓库和分析工具。整合到一个平台意味着医生不需要重复录入病人数据了。 医疗云有以下几大优势: 1、 数据安全。利用中心的网络安全措施,断绝了数据被盗走的风险;利用存储安全措施,使得医疗信息数据定期的本地及异地备份,提高了数据的冗余度,使得数据的安全性大幅提升。 2、 信息共享。将多个县市的信息整合到一个环境中,有利于各个部门的信息共享,提升服务质量。 3、 动态扩展。利用无锡云计算中心的云环境,可使医疗云系统的访问性能、存储性能、灾备性能等进行无缝扩展升级。 4、 布局全国。借助曙光在全国各地的云计算中心,可使各地的一朵朵小云最终连片,形成覆盖全国的医疗云,医疗信息在整个云内共享,惠及更广大的群众。 与“云”有关的故事 其实,编者在此只是搜集了部分云应用,应该会有一些遗漏,编者将在以后的文章中补充报道。不过,一下还有一些与云计算相关的故事,请听编者为您道来。 1、与云有关的餐厅 最近编者在上海出差,汽车在晚上经过浦西世博园原址的时候,编者看见165米高,号称“世界最大的温度计”旁边的餐馆打出一个牌子“云餐厅”。编者感叹,云计算的力量已经辐射到了餐饮行业。真不知道,待在云端进餐到底是什么滋味。或许,餐厅老板也应该是与IT相关的人士,否则餐厅怎么也上了“云”呢? 2、姓云的云计算专家 编者遇到一位研究院的总监云浪生,详细聊一聊关于云这个姓氏。而这位专家本身就是从事云服务项目的研究和开发的总监。 3、与有关的电影 同事说起一部由大美女苏菲玛索出演的电影《云上的日子》。 4、与云有关的文章 还记得小学时候,学习过的一篇文章叫“火烧云”。作者在里面描写了瞬息万变的“火烧云”。它们轻盈地漂浮在天空中,可望而不可可望而不可及。这些云一会变成大白狗、红公鸡、黑母鸡、小金猪,一会又变成骏马、狮子。 小结: 编者将如此多的云名称罗列出来的时候,同事们都说,他们几乎都不认识“云”了。这还是当初我们看见的云吗?所以,编者希望罗列出来这样在线服务或者云服务,让您更清楚地看到它的本质。 尽管,云计算的名称变得越来越千奇百怪,但是无论取什么样的名字,云计算始终还是要从神坛走下之后,来到了平凡的生活中。
个人分类: 云与服务|2836 次阅读|0 个评论
2012 国家自然科学基金中标项目:云计算相关方向
热度 2 libing 2012-8-22 22:50
项目批准号/ 申请代码1 项目名称 项目负责人 依托单位 批准 金额 项目起止年月 61272072/ F020306 基于容错代价的云计算可生存性理论与关键技术研究 邹德清 华中科技大学 80 2013-01至2016-12 61203259/ F030405 移动云计算模式下的场景文本感知方法研究 朱远平 天津师范大学 24 2013-01至2015-12 61201447/ F010406 云计算Hadoop框架中高效迭代机制的研究 朱颢东 郑州轻工业学院 24 2013-01至2015-12 61262082/ F020806 多媒体云计算中基于QoS和可信性的资源协同管理研究 周建涛 内蒙古大学 43 2013-01至2016-12 61202361/ F020803 动态云环境中基于SLA的工作流调度 郑炜 厦门大学 23 2013-01至2015-12 61272181/ F020204 云计算环境下海量XML数据管理关键技术研究 赵相国 东北大学 81 2013-01至2016-12 61272468/ F020808 基于物联网的身份认证云计算平台研究 赵建民 浙江师范大学 80 2013-01至2016-12 51278274/ E0805 基于云计算的建筑全生命期BIM集成与应用关键技术研究 张建平 清华大学 80 2013-01至2016-12 61272391/ F0205 云计算环境中基于水印的多媒体认证技术研究 张大兴 杭州电子科技大学 20 2013-01至2013-12 61272486/ F020701 云计算安全中的密码新理论及关键技术研究 张串绒 中国人民解放军空军工程大学 79 2013-01至2016-12 61262088/ F020806 云计算环境下应用数据层节能计算研究 于炯 新疆大学 51 2013-01至2016-12 61202408/ F020806 面向云服务的网络协同工作环境关键技术研究 于建军 中国科学院计算机网络信息中心 22 2013-01至2015-12 61272179/ F020204 云计算环境下基于BSP模型的大规模图数据查询处理技术 于戈 东北大学 81 2013-01至2016-12 61202025/ F020204 基于近似关键字的大规模空间数据查询与处理 姚斌 上海交通大学 25 2013-01至2015-12 61262057/ F020513 云计算环境下跨域身份认证与多授权访问控制的关键问题研究 杨小东 西北师范大学 45 2013-01至2016-12 U1233108/ F01 民航空管私有云的全同态加密的关键技术研究 杨浩淼 电子科技大学 38 2013-01至2015-12 61272084/ F020304 云计算环境下的新型访问控制理论与关键技术研究 杨庚 南京邮电大学 80 2013-01至2016-12 61272521/ F020806 可靠性约束下的高收益云服务提供机制研究 杨放春 北京邮电大学 85 2013-01至2016-12 61272046/ F020204 云计算中TB/PB级海量数据近似查询处理技术的研究 杨东华 哈尔滨工业大学 80 2013-01至2016-12 61272543/ F020702 云计算平台的安全性增强技术研究 许峰 河海大学 80 2013-01至2016-12 61202004/ F020306 基于安全Agent的可信云计算与对等计算融合模型及关键技术的研究 徐小龙 南京邮电大学 23 2013-01至2015-12 61272029/ F020510 云计算环境下支持复杂并行业务的高铁数据中心关键技术研究 徐维祥 北京交通大学 61 2013-01至2016-12 61202466/ F020701 云计算环境下的安全外包计算研究 徐玲玲 华南理工大学 23 2013-01至2015-12 41275104/ D0508 东亚季风区云计算参数化方案研究 徐国强 国家气象中心 80 2013-01至2016-12 61202340/ F0205 基于云计算的视频监控系统能耗优化研究 熊永华 中南大学 23 2013-01至2015-12 61202047/ F020204 支持大型社交网络的云存储系统 伍赛 浙江大学 23 2013-01至2015-12 61202067/ F020403 云计算环境下键值存储系统查询优化技术研究 吴广君 中国科学院信息工程研究所 22 2013-01至2015-12 61272119/ F020102 基于大数据和云环境的两类关键问题优化建模与优化方法研究 王宇平 西安电子科技大学 70 2013-01至2016-12 61273080/ F030308 基于云架构的物联网传感器数据管理技术研究 王永炎 中国科学院软件研究所 82 2013-01至2016-12 61271275/ F010201 面向云计算系统的协作式数据消冗传输理论及方法研究 王树鹏 中国科学院信息工程研究所 80 2013-01至2016-12 61272522/ F020805 云计算环境中身份基海量数据分布式PDP的研究 王化群 大连海洋大学 80 2013-01至2016-12 61202043/ F020304 面向云计算实时服务的调度模型与算法研究 滕飞 西南交通大学 25 2013-01至2015-12 11271003/ A010206 云计算中高效安全外包计算协议的研究 唐春明 广州大学 68 2013-01至2016-12 61232016/ F0207 云计算环境中数据安全的理论与关键技术研究 孙星明 南京信息工程大学 275 2013-01至2017-12 61202062/ F020305 面向虚拟化云服务器的智能高速缓存管理 隋秀峰 中国科学院计算技术研究所 25 2013-01至2015-12 61202088/ F020204 云数据库系统能耗优化方法的研究 宋杰 东北大学 24 2013-01至2015-12 61272241/ F020513 云计算环境下面向多租户应用的个性化数据隐私保护机制研究 史玉良 山东大学 80 2013-01至2016-12 61202494/ F020803 基于云计算的虚拟实验平台关键技术研究 盛羽 中南大学 24 2013-01至2015-12 61202113/ F020304 云计算中基于多维空间拓扑映射的资源机会复用技术研究 钱柱中 南京大学 23 2013-01至2015-12 61272460/ F020803 云计算环境下数据中心的power capping关键问题研究 齐勇 西安交通大学 81 2013-01至2016-12 71263006/ G0314 基于云计算的公共信息服务机制研究 漆贤军 广西大学 37 2013-01至2016-12 61272382/ F020509 云计算中虚拟机资源与应用系统参数的协同自适应配置研究 彭志平 广东石油化工学院 80 2013-01至2016-12 61272093/ F020106 可重写Petri网理论及在大规模动态分布式系统中的应用 庞善臣 山东科技大学 82 2013-01至2016-12 41271398/ D010701 云计算环境下空间数据访问规律的动态统计方法研究 潘少明 武汉大学 70 2013-01至2016-12 71271071/ G011203 云计算环境下基于分形数据挖掘技术的商务智能系统的研究 倪志伟 合肥工业大学 55 2013-01至2016-12 81202856/ H2903 非接触式动态光电3D脉象信息检测及多维分析识别技术研究 刘志臻 福建中医药大学 23 2013-01至2015-12 61202429/ F020803 云计算中多目标驱动的虚拟机安置技术研究 刘真 北京交通大学 22 2013-01至2015-12 61272306/ F020512 云服务环境下知识发现与数据挖掘的安全与隐私保护关键技术 刘君强 浙江工商大学 77 2013-01至2016-12 61202081/ F0203 云提供商可信性审计与验证研究 刘川意 北京邮电大学 23 2013-01至2015-12 61202136/ F020513 云计算环境下服务组合的自治愈关键技术研究 李雯睿 南京晓庄学院 24 2013-01至2015-12 61272435/ F020701 云计算与云存储若干关键安全问题研究 李顺东 陕西师范大学 82 2013-01至2016-12 61272165/ F020208 云环境中软件服务的高可用模型与关键技术研究 李建欣 北京航空航天大学 20 2013-01至2013-12 61272316/ F020502 基于云计算的视频智能处理与编码 李厚强 中国科学技术大学 82 2013-01至2016-12 61222205/ F020304 分布式计算 李东升 中国人民解放军国防科学技术大学 100 2013-01至2015-12 61232008/ F020304 云计算环境下面向复杂工程应用的资源管理调度方法研究 金海 华中科技大学 280 2013-01至2017-12 61272128/ F020304 虚拟计算系统的能耗管理方法研究 姜晓红 浙江大学 20 2013-01至2013-12 61263022/ F030207 云计算环境下基于信息熵的安全风险管理决策基础理论研究 姜茸 云南财经大学 44 2013-01至2016-12 61272083/ F020202 云计算演化环境中的隐私建模与检测方法研究 黄志球 南京航空航天大学 80 2013-01至2016-12 61272148/ F020304 云计算环境中面向虚拟资源的能效模型及算法研究 胡志刚 中南大学 81 2013-01至2016-12 71201117/ G0114 模拟仿真的输入不确定性及其在金融风险管理中的应用 胡照林 同济大学 19 2013-01至2015-12 61202130/ F020107 基于云计算模型的自组织差分进化算法及其应用研究 胡晓敏 中山大学 26 2013-01至2015-12 61272188/ F020201 云计算环境中面向科学工作流管理的关键技术研究 胡华 杭州电子科技大学 80 2013-01至2016-12 61273232/ F030207 云计算环境下的可信服务组合及运行保障研究 胡春华 湖南商学院 80 2013-01至2016-12 61202354/ F020803 高可用云存储系统中数据复制研究 付雄 南京邮电大学 24 2013-01至2015-12 61202056/ F0203 片上网络虚拟化关键技术研究 付斌章 中国科学院计算技术研究所 25 2013-01至2015-12 61202449/ F020801 云计算环境下面向科学工作流应用的弹性调度机制研究 东方 东南大学 25 2013-01至2015-12 61262023/ F020205 基于云的多语种软件仿真平台关键技术的研究 崔青 新疆大学 43 2013-01至2016-12 U1231108/ A03 无缝式天文数据访问关键技术研究 崔辰州 中国科学院国家天文台 64 2013-01至2015-12 71201179/ G0106 云环境下考虑用户偏好的会计信息系统可信性动态评估模型研究 程平 重庆理工大学 22 2013-01至2015-12 61272455/ F020701 云计算平台下数据安全的关键密码技术研究 陈晓峰 西安电子科技大学 80 2013-01至2016-12 61210306034/ F0101 首届IEEE中国国际通信大会 陈巍 清华大学 4 2012-08至2012-09 61272399/ F020805 云计算服务异常检测关键技术研究 陈蜀宇 重庆大学 81 2013-01至2016-12 61272236/ F020513 面向水电机组维护的增强现实云数据获取与虚实融合方法研究 陈鹏 三峡大学 80 2013-01至2016-12 61272438/ F020806 分布式云工作流服务的自适应模型与机制 曹健 上海交通大学 80 2013-01至2016-12 41271387/ D010701 云计算环境下旅游信息个性化服务模型研究 曹菡 陕西师范大学 75 2013-01至2016-12 61202041/ F020304 云数据中心并行计算模型与作业调度研究 曹海军 西安交通大学 26 2013-01至2015-12 61202040/ F020206 公有云计算服务组合系统收益优化研究 鲍亮 西安电子科技大学 25 2013-01至2015-12
个人分类: 新闻报道|14497 次阅读|2 个评论
[转载]推荐------云计算论文集和----本人看了三十
nefujwp 2012-8-11 09:59
研究云计算与大数据分析处理领域建议看的学术论文列表 (2011-10-07 21:10:59) var $tag='杂谈'; var $tag_code='4dec86f4688bfa6a9c3675ce2bfe749a'; var $r_quote_bligid='46d817650100urjq'; var $worldcup='0'; var $worldcupball='0'; 标签: 杂谈 Zhou AY. Data intensive computing-challenges of data management techniques. Communications of CCF, 2009,5(7):50.53 (in Chinese with English abstract). Cohen J, Dolan B, Dunlap M, Hellerstein JM, Welton C. MAD skills: New analysis practices for big data. PVLDB, 2009,2(2): 1481.1492. Schroeder B, Gibson GA. Understanding failures in petascale computers. Journal of Physics: Conf. Series, 2007,78(1):1.11. Dean J, Ghemawat S. MapReduce: Simplified data processing on large clusters. In: Brewer E, Chen P, eds. Proc. of the OSDI. California: USENIX Association, 2004. 137.150. Pavlo A, Paulson E, Rasin A, Abadi DJ, Dewitt DJ, Madden S, Stonebraker M. A comparison of approaches to large-scale data analysis. In: Cetintemel U, Zdonik SB, Kossmann D, Tatbul N, eds. Proc. of the SIGMOD. Rhode Island: ACM Press, 2009. 165.178. Chu CT, Kim SK, Lin YA, Yu YY, Bradski G, Ng AY, Olukotun K. Map-Reduce for machine learning on multicore. In: Scholkopf B, Platt JC, Hoffman T, eds. Proc. of the NIPS. Vancouver: MIT Press, 2006. 281.288. Wang CK, Wang JM, Lin XM, Wang W, Wang HX, Li HS, Tian WP, Xu J, Li R. MapDupReducer: Detecting near duplicates over massive datasets. In: Elmagarmid AK, Agrawal D, eds. Proc. of the SIGMOD. Indiana: ACM Press, 2010. 1119.1122. Liu C, Guo F, Faloutsos C. BBM: Bayesian browsing model from petabyte-scale data. In: Elder JF IV, Fogelman-Soulié F, Flach PA, Zaki MJ, eds. Proc. of the KDD. Paris: ACM Press, 2009. 537.546. Panda B, Herbach JS, Basu S, Bayardo RJ. PLANET: Massively parallel learning of tree ensembles with MapReduce. PVLDB, 2009,2(2):1426.1437. Lin J, Schatz M. Design patterns for efficient graph algorithms in MapReduce. In: Rao B, Krishnapuram B, Tomkins A, Yang Q, eds. Proc. of the KDD. Washington: ACM Press, 2010. 78.85. Zhang CJ, Ma Q, Wang XL, Zhou AY. Distributed SLCA-based XML keyword search by Map-Reduce. In: Yoshikawa M, Meng XF, Yumoto T, Ma Q, Sun LF, Watanabe C, eds. Proc. of the DASFAA. Tsukuba: Springer-Verlag, 2010. 386.397. Stupar A, Michel S, Schenkel R. RankReduce—Processing K-nearest neighbor queries on top of MapReduce. In: Crestani F, Marchand-Maillet S, Chen HH, Efthimiadis EN, Savoy J, eds. Proc. of the SIGIR. Geneva: ACM Press, 2010. 13.18. Wang GZ, Salles MV, Sowell B, Wang X, Cao T, Demers A, Gehrke J, White W. Behavioral simulations in MapReduce. PVLDB, 2010,3(1-2):952.963. Gunarathne T, Wu TL, Qiu J, Fox G. Cloud computing paradigms for pleasingly parallel biomedical applications. In: Hariri S, Keahey K, eds. Proc. of the HPDC. Chicago: ACM Press, 2010. 460−469. Delmerico JA, Byrnesy NA, Brunoz AE, Jonesz MD, Galloz SM, Chaudhary V. Comparing the performance of clusters, hadoop, and active disks on microarray correlation computations. In: Yang YY, Parashar M, Muralidhar R, Prasanna VK, eds. Proc. of the HiPC. Kochi: IEEE Press, 2009. 378−387. Das S, Sismanis Y, Beyer KS, Gemulla R, Haas PJ, McPherson J. Ricardo: Integrating R and hadoop. In: Elmagarmid AK, Agrawal D, eds. Proc. of the SIGMOD. Indiana: ACM Press, 2010. 987−998. Wegener D, Mock M, Adranale D, Wrobel S. Toolkit-Based high-performance data mining of large data on MapReduce clusters. In: Saygin Y, Yu JX, Kargupta H, Wang W, Ranka S, Yu PS, Wu XD, eds. Proc. of the ICDM Workshop. Washington: IEEE Computer Society, 2009. 296−301. Kovoor G, Singer J, Lujan M. Building a Java Map-Reduce framework for multi-core architectures. In: Ayguade E, Gioiosa R, Stenstrom P, Unsal O, eds. Proc. of the HiPEAC. Pisa: HiPEAC Endowment, 2010. 87−98. De Kruijf M, Sankaralingam K. MapReduce for the cell broadband engine architecture. IBM Journal of Research and Development, 2009,53(5):1−12. Becerra Y, Beltran V, Carrera D, Gonzalez M, Torres J, Ayguade E. Speeding up distributed MapReduce applications using hardware accelerators. In: Barolli L, Feng WC, eds. Proc. of the ICPP. Vienna: IEEE Computer Society, 2009. 42−49. Ranger C, Raghuraman R, Penmetsa A, Bradski G, Kozyrakis C. Evaluating MapReduce for multi-core and multiprocessor systems. In: Dally WJ, ed. Proc. of the HPCA. Phoenix: IEEE Computer Society, 2007. 13−24. Ma WJ, Agrawal G. A translation system for enabling data mining applications on GPUs. In: Zhou P, ed. Proc. of the Supercomputing (SC). New York: ACM Press, 2009. 400−409. He BS, Fang WB, Govindaraju NK, Luo Q, Wang TY. Mars: A MapReduce framework on graphics processors. In: Moshovos A, Tarditi D, Olukotun K, eds. Proc. of the PACT. Ontario: ACM Press, 2008. 260−269. Stuart JA, Chen CK, Ma KL, Owens JD. Multi-GPU volume rendering using MapReduce. In: Hariri S, Keahey K, eds. Proc. of the MapReduce Workshop (HPDC 2010). New York: ACM Press, 2010. 841−848. Hong CT, Chen DH, Chen WG, Zheng WM, Lin HB. MapCG: Writing parallel program portable between CPU and GPU. In: Salapura V, Gschwind M, Knoop J, eds. Proc. of the PACT. Vienna: ACM Press, 2010. 217−226. Jiang W, Ravi VT, Agrawal G. A Map-Reduce system with an alternate API for multi-core environments. In: Chiba T, ed. Proc. of the CCGRID. Melbourne: IEEE Press, 2010. 84−93. Liao HJ, Han JZ, Fang JY. Multi-Dimensional index on hadoop distributed file system. In: Xu ZW, ed. Proc. of the Networking, Architecture, and Storage (NAS). Macau: IEEE Computer Society, 2010. 240−249. Zou YQ, Liu J, Wang SC, Zha L, Xu ZW. CCIndex: A complemental clustering index on distributed ordered tables for multi- dimensional range queries. In: Ding C, Shao ZY, Zheng R, eds. Proc. of the NPC. Zhengzhou: Springer-Verlag, 2010. 247−261. Zhang SB, Han JZ, Liu ZY, Wang K, Feng SZ. Accelerating MapReduce with distributed memory cache. In: Huang XX, ed. Proc. of the ICPADS. Shenzhen: IEEE Press, 2009. 472−478. Dittrich J, Quian′e-Ruiz JA, Jindal A, Kargin Y, Setty V, Schad J. Hadoop++: Making a yellow elephant run like a cheetah (without it even noticing). PVLDB, 2010,3(1-2):518−529. Chen ST. Cheetah: A high performance, custom data warehouse on top of MapReduce. PVLDB, 2010,3(1-2):1459−1468. Iu MY, Zwaenepoel W. HadoopToSQL: A MapReduce query optimizer. In: Morin C, Muller G, eds. Proc. of the EuroSys. Paris: ACM Press, 2010. 251−264. Blanas S, Patel JM, Ercegovac V, Rao J, Shekita EJ, Tian YY. A comparison of join algorithms for log processing in MapReduce. In: Elmagarmid AK, Agrawal D, eds. Proc. of the SIGMOD. Indiana: ACM Press, 2010. 975−986. Zhou MQ, Zhang R, Zeng DD, Qian WN, Zhou AY. Join optimization in the MapReduce environment for column-wise data store. In: Fang YF, Huang ZX, eds. Proc. of the SKG. Ningbo: EEE Computer Society, 2010. 97−104. Afrati FN, Ullman JD. Optimizing joins in a Map-Reduce environment. In: Manolescu I, Spaccapietra S, Teubner J, Kitsuregawa M, Léger A, Naumann F, Ailamaki A, Ozcan F, eds. Proc. of the EDBT. Lausanne: ACM Press, 2010. 99−110. Sandholm T, Lai K. MapReduce optimization using regulated dynamic prioritization. In: Douceur JR, Greenberg AG, Bonald T, Nieh J, eds. Proc. of the SIGMETRICS. Seattle: ACM Press, 2009. 299.310. Hoefler T, Lumsdaine A, Dongarra J. Towards efficient MapReduce using MPI. In: Oster P, ed. Proc. of the EuroPVM/MPI. Berlin: Springer-Verlag, 2009. 240.249. Nykiel T, Potamias M, Mishra C, Kollios G, Koudas N. MRShare: Sharing across multiple queries in MapReduce. PVLDB, 2010, 3(1-2):494.505. Kambatla K, Rapolu N, Jagannathan S, Grama A. Asynchronous algorithms in MapReduce. In: Moreira JE, Matsuoka S, Pakin S, Cortes T, eds. Proc. of the CLUSTER. Crete: IEEE Press, 2010. 245.254. Polo J, Carrera D, Becerra Y, Torres J, Ayguade E, Steinder M, Whalley I. Performance-Driven task co-scheduling for MapReduce environments. In: Tonouchi T, Kim MS, eds. Proc. of the IEEE Network Operations and Management Symp. (NOMS). Osaka: IEEE Press, 2010. 373.380. Zaharia M, Konwinski A, Joseph AD, Katz R, Stoica I. Improving MapReduce performance in heterogeneous environments. In: Draves R, van Renesse R, eds. Proc. of the ODSI. Berkeley: USENIX Association, 2008. 29.42. Xie J, Yin S, Ruan XJ, Ding ZY, Tian Y, Majors J, Manzanares A, Qin X. Improving MapReduce performance through data placement in heterogeneous hadoop clusters. In: Taufer M, Rünger G, Du ZH, eds. Proc. of the Workshop on Heterogeneity in Computing (IPDPS 2010). Atlanta: IEEE Press, 2010. 1.9. Polo J, Carrera D, Becerra Y, Beltran V, Torres J, Ayguade E. Performance management of accelerated MapReduce workloads in heterogeneous clusters. In: Qin F, Barolli L, Cho SY, eds. Proc. of the ICPP. San Diego: IEEE Press, 2010. 653.662. Papagiannis A, Nikolopoulos DS. Rearchitecting MapReduce for heterogeneous multicore processors with explicitly managed memories. In: Qin F, Barolli L, Cho SY, eds. Proc. of the ICPP. San Diego: IEEE Press, 2010. 121.130. Jiang DW, Ooi BC, Shi L, Wu S. The performance of MapReduce: An in-depth study. PVLDB, 2010,3(1-2):472.483. Berthold J, Dieterle M, Loogen R. Implementing parallel Google Map-Reduce in Eden. In: Sips HJ, Epema DHJ, Lin HX, eds. Proc. of the Euro-Par. Delft: Springer-Verlag, 2009. 990.1002. Verma A, Zea N, Cho B, Gupta I, Campbell RH. Breaking the MapReduce stage barrier. In: Moreira JE, Matsuoka S, Pakin S, Cortes T, eds. Proc. of the CLUSTER. Crete: IEEE Press, 2010. 235.244. Yang HC, Dasdan A, Hsiao RL, Parker DS. Map-Reduce-Merge simplified relational data processing on large clusters. In: Chan CY, Ooi BC, Zhou AY, eds. Proc. of the SIGMOD. Beijing: ACM Press, 2007. 1029.1040. Seo SW, Jang I, Woo KC, Kim I, Kim JS, Maeng S. HPMR: Prefetching and pre-shuffling in shared MapReduce computation environment. In: Rana O, Tang FL, Kosar T, eds. Proc. of the CLUSTER. New Orleans: IEEE Press, 2009. 1.8. Babu S. Towards automatic optimization of MapReduce programs. In: Kansal A, ed. Proc. of the ACM Symp. on Cloud Computing (SoCC). New York: ACM Press, 2010. 137.142. Olston C, Reed B, Srivastava U, Kumar R, Tomkins A. Pig Latin: A not-so-foreign language for data processing. In: Wang JTL, ed. Proc. of the SIGMOD. Vancouver: ACM Press, 2008. 1099.1110. Isard M, Budiu M, Yu Y, Birrell A, Fetterly D. Dryad: Distributed data-parallel programs from sequential building blocks. ACM SIGOPS Operating Systems Review, 2007,41(3):59.72. Isard M, Yu Y. Distributed data-parallel computing using a high-level programming language. In: Cetintemel U, Zdonik SB, Kossmann D, Tatbul N, eds. Proc. of the SIGMOD. Rhode Island: ACM Press, 2009. 987.994. Chaiken R, Jenkins B, Larson P, Ramsey B, Shakib D, Weaver S, Zhou JR. SCOPE: Easy and efficient parallel processing of massive data sets. PVLDB, 2008,1(2):1265.1276. Condie T, Conway N, Alvaro P, Hellerstein JM, Gerth J, Talbot J, Elmeleegy K, Sears R. Online aggregation and continuous query support in MapReduce. In: Elmagarmid AK, Agrawal D, eds. Proc. of the SIGMOD. Indianapolis: ACM Press, 2010. 1115.1118. Thusoo A, Sarma JS, Jain N, Shao Z, Chakka P, Anthony S, Liu H, Wyckoff P, Murthy R. Hive a warehousing solution over a MapReduce framework. PVLDB, 2009,2(2):938.941. Ghoting A, Pednault E. Hadoop-ML: An infrastructure for the rapid implementation of parallel reusable analytics. In: Culotta A, ed. Proc. of the Large-Scale Machine Learning: Parallelism and Massive Datasets Workshop (NIPS 2009). Vancouver: MIT Press, 2009. 6. Yang C, Yen C, Tan C, Madden S. Osprey: Implementing MapReduce-style fault tolerance in a shared-nothing distributed database. In: Li FF, Moro MM, Ghandeharizadeh S, Haritsa JR, Weikum G, Carey MJ, Casati F, Chang EY, Manolescu I, Mehrotra S, Dayal U, Tsotras VJ, eds. Proc. of the ICDE. Long Beach: IEEE Press, 2010. 657.668. Abouzeid A, Bajda-Pawlikowski K, Abadi D, Silberschatz A, Rasin A. HadoopDB: An architectural hybrid of MapReduce and DBMS technologes for analytical workloads. PVLDB, 2009,2(1):922.933. Abouzied A, Bajda-Pawlikowski K, Huang JW, Abadi DJ, Silberschatz A. HadoopDB in action: Building real world applications. In: Elmagarmid AK, Agrawal D, eds. Proc. of the SIGMOD. Indiana: ACM Press, 2010. 1111.1114. Friedman E, Pawlowski P, Cieslewicz J. SQL/MapReduce: A practical approach to self describing, polymorphic, and parallelizable user defined functions. PVLDB, 2009,2(2):1402.1413. Stonebraker M, Abadi D, DeWitt DJ, Maden S, Paulson E, Pavlo A, Rasin A. MapReduce and parallel DBMSs: Friends or foes? Communications of the ACM, 2010,53(1):64.71. Dean J, Ghemawat S. MapReduce: A flexible data processing tool. Communications of ACM, 2010,53(1):72.77. Xu Y, Kostamaa P, Gao LK. Integrating hadoop and parallel DBMS. In: Elmagarmid AK, Agrawal D, eds. Proc. of the SIGMOD. Indianapolis: ACM Press, 2010. 969.974. Thusoo A, Shao Z, Anthony S, Borthakur D, Jain N, Sarma JS, Murthy R, Liu H. Data warehousing and analytics infrastructure at facebook. In: Elmagarmid AK, Agrawal D, eds. Proc. of the SIGMOD. Indianapolis: ACM Press, 2010. 1013.1020. Mcnabb AW, Monson CK, Seppi KD. MRPSO: MapReduce particle swarm optimization. In: Ryan C, Keijzer M, eds. Proc. of the GECCO. Atlanta: ACM Press, 2007. 177.185. Kang U, Tsourakakis CE, Faloutsos C. PEGASUS: A peta-scale graph mining system—Implementation and observations. In: Wang W, Kargupta H, Ranka S, Yu PS, Wu XD, eds. Proc. of the ICDM. Miami: IEEE Computer Society, 2009. 229.238. Kang S, Bader DA. Large scale complex network analysis using the hybrid combination of a MapReduce cluster and a highly multithreaded system. In: Taufer M, Rünger G, Du ZH, eds. Proc. of the Workshops and Phd Forum (IPDPS 2010). Atlanta: IEEE Presss, 2010. 11.19. Logothetis D, Yocum K. AdHoc data processing in the cloud. PVLDB, 2008,1(1):1472.1475. Olston C, Bortnikov E, Elmeleegy K, Junqueira F, Reed B. Interactive analysis of WebScale data. In: DeWitt D, ed. Proc. of the CIDR. Asilomar: Online www.crdrdb.org , 2009. Bose JH, Andrzejak A, Hogqvist M. Beyond online aggregation: Parallel and incremental data mining with online Map-Reduce. In: Tanaka K, Zhou XF, Zhang M, Jatowt A, eds. Proc. of the Workshop on Massive Data Analytics on the Cloud (WWW 2010). Raleigh: ACM Press, 2010. 3. Kumar V, Andrade H, Gedik B, Wu KL. DEDUCE: At the intersection of MapReduce and stream processing. In: Manolescu I, Spaccapietra S, Teubner J, Kitsuregawa M, Léger A, Naumann F, Ailamaki A, Ozcan F, eds. Proc. of the EDBT. Lausanne: ACM Press, 2010. 657.662. Abramson D, Dinh MN, Kurniawan D, Moench B, DeRose L. Data centric highly parallel debugging. In: Hariri S, Keahey K, eds. Proc. of the HPDC. Chicago: ACM Press, 2010. 119.129. Morton K, Friesen A, Balazinska M, Grossman D. Estimating the progress of MapReduce pipelines. In: Li FF, Moro MM, Ghandeharizadeh S, et al., eds. Proc. of the ICDE. Long Beach: IEEE Press, 2010. 681.684. Morton K, Balazinska M, Grossman D. ParaTimer: A progress indicator for MapReduce DAGs. In: Elmagarmid AK, Agrawal D, eds. Proc. of the SIGMOD. Indianapolis: ACM Press, 2010. 507.518. Lang W, Patel JM. Energy management for MapReduce clusters. PVLDB, 2010,3(1-2):129.139. Wieder A, Bhatotia P, Post A, Rodrigues R. Brief announcement: Modeling MapReduce for optimal execution in the cloud. In: Richa AW, Guerraoui R, eds. Proc. of the PODC. Zurich: ACM Press, 2010. 408.409. Zheng Q. Improving MapReduce fault tolerance in the cloud. In: Taufer M, Rünger G, Du ZH, eds. Proc. of the Workshops and Phd Forum (IPDPS 2010). Atlanta: IEEE Presss, 2010. 1.6. Groot S. Jumbo: Beyond MapReduce for workload balancing. In: Mylopoulos J, Zhou LZ, Zhou XF, eds. Proc. of the PhD Workshop (VLDB 2010). Singapore: VLDB Endowment, 2010. 7.12. Chatziantoniou D, Tzortzakakis E. ASSET queries: A declarative alternative to MapReduce. SIGMOD Record, 2009,38(2):35.41. Bu YY, Howe B, Balazinska M, Ernst MD. HaLoop: Efficient iterative data processing on large clusters. PVLDB, 2010,3(1-2): 285−296. Wang HJ, Qin XP, Zhang YS, Wang S, Wang ZW. LinearDB: A relational approach to make data warehouse scale like MapReduce. In: Yu JX, Kim MH, Unland R, eds. Proc. of the DASFAA. Hong Kong: Springer-Verlag, 2011. 306−320.
5146 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-25 17:49

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部