科学网

 找回密码
  注册

tag 标签: 《Science》

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

“DNA喷泉算法”诞生:1克DNA将能存储2.2亿部高清电影
热度 2 SciLondon 2017-3-6 10:49
又一项革命性突破诞生!《科学》杂志于2017年3月3日刊登了来自纽约基因组中心(New York Genome Center,NYGC)和哥伦比亚大学(Columbia University)的 最新研究成果,一项即可靠又高效的DNA存储策略- 被称作“DNA喷泉(DNA Fountain)”算法。利用这种的新编码技术,研究人员可以最大化 DNA 分子的数据存储能力,使其接近核酸的理论信息存储量。该研究推动了DNA数据存储的极限,令人兴奋。研究论文标题为“DNA Fountain enables a robust and efficient storage architecture”,链接如下:DOI: 10.1126/science.aaj2038 。 图1 研究人员(论文作者)Yaniv Erlich(论文通讯作者、哥伦比亚大学计算机科学家、哥伦比亚数据科学研究所成员、NYGC核心成员)和Dina Zielinski(NYGC副研究员)展示了一种新颖的编码技术,能够最大化DNA分子的数据存储能力。 1. “黑科技”的背后是什么? 脱氧核糖核酸分子,即DNA分子,高度紧凑,具有提供大容量信息存储的能力,是一种具有巨大潜力的数字信息存储介质。然而,当前的技术只能利用其理论最大存储能力的一小部分。 图2 DNA双链分子的形象说明。来自《大英百科全书》。 研究人员Erlich和Zielinshi则开发了一项新的存储策略/算法(“DNA喷泉”技术,如图3所示),用于编码和解码数据,将存储在单个核酸分子的信息接近理论最大值。 他们选择6份文件,其中包括一个大小为1.4MB的完整计算机操作系统,一部1895年的法国电影《Arrival of a train at La Ciotat》,一份价值50美元的亚马逊礼品卡,一个计算机病毒,一份先驱者徽章(Pioneer plaque)图片文件和1948年信息学家Claude Shannon的一项研究文件。 图3 “DNA喷泉“编码技术。左图:3个主要的算法步骤。右图:32位的一个小文件实例。简单起见,这个文件被分成8个区,每个区占4个位。图中这些“种子”以2-比特的数字呈现,仅作示范。 他们首先将文件压缩成一个主文件,然后将数据拆分为由1和0组成的二进制双编码的短字符串。 他们设计了一种容错算法-- DNA喷泉码 ,将这些字符串随机地封装成所谓的“液滴”,并将每个小滴中的1和0映射到DNA中的 四个核苷酸碱基(A,G,C和T) 中。该算法会自行删除易产生错误的字母组合,同时后每个液滴添加了额外的标签,以便于以后(指解码时)以正确的顺序重组这些文件。 最终,研究人员创建了含72000个DNA链的数字列表,每个DNA长度为200个碱基。 他们以 文本文件 的形式把这些信息发送给了一家位于旧金山的擅长将数字信号转换成生物信号的 D NA合成初创公司(Twist Bioscience) , 在那里这些文本被合成了DNA链。 两周后,Erlich和 Zielinski 收到一个小玻璃瓶,里面装着编码了他们文件的DNA 产品。 为了解码/读取这些文件,他们首先使用二代DNA测序技术检测DNA链,然后运用特殊软件将这些遗传密码翻译回二进制码,并使用标签重组了六个原始文件。 根据《科学》上发表的文章,这种方法效果很好,新的文件全部被零差错地恢复。 他们还能够通过 聚合酶链式反应技术(PCR,一种标准的DNA复制技术) 复制几乎无限数量的无错误文件,甚至这些复制品的复制品也可以做到零差错。可见,这项技术也极为可靠。 这项编码技术可以将215PB(petabytes)的数据打包进仅一克的DNA分子中,也即能够为每个核苷酸编码1.6比特(bits)的数据,比之前存储了至少60%多的信息,逼近理论极限(1.8比特)。 这个存储容量比以前由哈佛大学George Church和欧洲生物信息研究所的Nick Goldman和Ewan Birney的方法高出100倍。Erlich说,他们认为, 这可以算是史上密度最高的数据存储设备了。 215PB到底有多大?简单来说,1PB=1024TB, 而1TB=1024GB。目前,市面上常规的电脑硬盘不过2TB的容量 - 按照高清电影每部10GB的大小,215PB能够存储2.2亿部电影! 《科学》杂志的编辑称赞道:“这项技术不但能将包括完整电脑操作系统在内的数字信息有效编码进DNA,又能将存储于DNA中的信息经过多轮PCR(聚合酶链式反应)后批量提取出来,他们实现了有效的、强大的信息编译”。 2. DNA存储技术经历过哪些发展? 科学家开始使用DNA存储数字数据,要追溯到2012年。 当时哈佛大学的遗传学家George Church,Sri Kosuri和其他同事使用 DNA 的四种碱基 A、G、T和C来编码数字化文件的0和1,把一本52000字的书编码到数千个DNA片段中。然而,他们的编码方案相对低效,每克DNA仅能存储1.28PB。后来也有一些方法做得更好, 但没有一个能够存储超过研究人员对DNA存储能力的预测值(每个DNA 核苷酸约1.8比特)一半的存储量。 (研究人员认为每个DNA 核苷酸可以存储约1.8比特,而不是2比特,是考虑到DNA写入和读取中罕见但不可避免的错误)。 由于多年来,科学家已经推理并且证明DNA可以用作数据存储介质,并且它具有理想存储介质的显著特征。 因而,本研究的价值更多地体现在,设法在DNA当中存储比以往任何时候更多的数据 - 并且证明它可以被复制和检索几乎无限多次,具有零错误。 3. DNA存储技术有什么优点? 采用DNA存储数字信息具有许多优势,主要体现在两个方面: 1. 存储能力强,容量大。 通过使用流式传输和在线压缩视频的数据技术,研究人员能够将1.6位数据包装到每个核苷酸中,接近理论极限的1.8。这听起来不是很多,但科学家证明他们可以有效地在一克DNA当中存储215PB数据。 2. 存储时间久,可靠性高。 DNA是超小型且高度紧凑,如果保存在阴凉、干燥的地方,它可以保存几十万年不损坏。 最近,这已经被西班牙一项关于43万年前人类祖先的骨骼DNA的研究所证明。只要人类文明的技术确保我们还可以阅读和编写DNA,就能够对其进行读取和解码。也就是说,几乎可以实现永久保存。“DNA不会像盒式磁带和CD光盘那样随着时间的推移而衰减,它也不会过期。” Yaniv Erlich教授说。也不像其他高密度的存储方式,比如操纵表面上的个别原子,这项新技术可以一次写入和读取大量的DNA,且可以放大。 4. 走向大众?还没有那么快 除了技术本身发展外,限制其存储的最主要几个因素如下: 1. 首先是成本太高。 研究人员将2兆字节(MB)的数据写入到DNA中花费了 7000美元 ,然后读取这些数据又花了 2000美元 。Erlich也表示,新的方法现在还不具备大规模使用的条件。 2. 其次,存储与读取的速度太慢 。 与其他形式的数据存储相比,将数据写入DNA 以及读取其中的数据都相对较慢。因此,这种方法就不适合即时处理数据,而更适合应用于档案管理。 5. 互联网时代的刚需 人类在过去2年中产生的数据比之前人类历史产生的全部数据还要多。 信息时代下,爆炸的信息和数据如洪流般袭来,这可能很快就会超过硬盘和磁盘为主的存储设备的承受力。 而如何找到既能存储大量数据,又可靠且不会占据大量的资源,仍然是计算机工程师的一个难题。然而,答案可能来自自然界----即生物DNA存储。 就像本研究能够在一克DNA中存储215PB(2.15亿GB),原则上可以将人类记录的每一点数据存储在几个卡车大小和重量的容器中。 从长远的角度,DNA存储技术必然有着广阔的应用前景。 尽管DNA存储很可靠,且效率高,存储能力强,但目前仍面临着成本问题。使用这种技术存储和检索仅仅几兆字节的数据仍需要数千美元,因此我们不太可能在任何设备上看到DNA存储。 如今的产业需求和技术发展,已经使得DNA测序的成本呈指数下降。然而对于DNA合成,目前未必有这么大的需求,导致产业成本仍然巨大。比如,加州大学洛杉矶分校(UCLA)的生物化学家Sri Kosuri就认为,投资者不会花费巨资来降低成本。 然而,像谷歌和微软那样必须处理不可想象的数据量的公司来说,DNA存储在经济上其实是可行的。这些互联网巨头们每一秒种都在运行着巨量的云计算- 举例来说,Google搜索引擎天要运行30亿次搜索查询!这对于现有的服务器系统无疑是一个挑战。随着电商平台,直播平台,大数据处理等互联网商业的发展,对高效存储设备的需求将会越来越大- 而DNA存储技术将极大地激发未来互联网时代的潜能! 随着时间推移,更多研究工作取得突破,成本可能会下降 - 但这样的研究仍有很长的路要走, 我们期待这一天早日到来! 参考资料 https://www.sciencedaily.com/releases/2017/03/170302143947.htm Yaniv Erlich, Dina Zielinski. DNA Fountain enables a robust and efficient storage architecture. Science , 2017; 355 (6328): 950 DOI: 10.1126/science.aaj2038 ( 未止科技 原创。转载请联系我们,原文: DNA存储技术革命 )
7525 次阅读|2 个评论
《Science》跟进质疑“透明计算”
热度 41 outcrop 2015-2-3 14:41
经konard网友提醒,发现《Science》也介绍了“透明计算”获奖的质疑声;感谢郝老师跟进,《Science》英文报道如下: Critics pounce on China’s top science prize Tweet Email Hao By Hao Xin 2 February 2015 12:15 pm 0 Comments Controversy has erupted over China’s highest science prize for 2014. Critics are blasting the winning project, on network computing, as not innovative and undeserving. On 9 January, the State First-Class Natural Science Award went to Zhang Yaoxue, a computer scientist and member of the prestigious Chinese Academy of Engineering, and his team. The 200,000 yuan ($32,000) annual prize is considered prestigious because it is awarded sparingly: Nine times in the past 15 years there have been no winners. The government has said that it is better to have no winners than to award the prize to undeserving work. That’s why many scientists are fuming over the selection of Zhang’s “transparent computing” research for the 2014 award. Zhang’s work is “too engineering-oriented and too ordinary” to warrant the top science prize, and the award has drawn “a barrage of criticism” from China’s information technology community, says Liu Yang, a computer engineer who builds and hosts websites. Liu was the first to question the merit of Zhang’s work on ScienceNet.cn; he wrote in a blog post (later deleted by censors) that Zhang’s work “at most is an application of some open-source software.” Many people share Liu’s view. Wang Xiaoping, a computer scientist at Tongji University in Shanghai, wrote in a blog post that Zhang’s work is “a far cry” from the standard required for winning the science award. In an interview in Science and Technology Daily , the mouthpiece of China’s science ministry, which oversees the nation’s science prizes, Zhang describes his work as a “meta–operating system” that allows operating systems to be run on any hardware. The breakthrough, he says, lies in “separating computing from storage and making software independent of hardware.” He gave a link to a video demonstrating “transparent computing” on personal computers, tablets, and smart phones. Comments posted at that site say that Zhang’s model is no different from a remote desktop—a software tool that allows users to access another device on a network with the local device serving as a desktop of the remote computer—or from a network computer, a diskless device made by some U.S. companies in the late 1990s that depends on other devices on a network to store software and data. Zhang did not respond to an e-mail request for comment. For years, many in China’s scientific community have criticized the selection process for ST prizes as too political. The process involves researchers submitting their own work to ministries, agencies, and provincial governments, which then nominate submissions for awards. Before being appointed president of Central South University in Changsha in 2011, Zhang had served for more than a decade as an official at the education ministry, which nominated his work for the award. An anonymous comment on ScienceNet.cn put it this way: Zhang’s “transparent computing is so transparent that it’s like the emperor’s new clothes.” China’s professional computer society, the China Computer Federation (CCF), seemed to disagree with the selection of Zhang’s work for the top science award. On 21 January, CCF posted an appeal on its website, calling on the government to stop meddling in science awards. The statement was replaced 2 days later with a notice saying that the appeal was not related to last year’s science awards and was removed “in order not to mislead the public.” Posted in Asia/Pacific , People Events Tweet Science | DOI: 10.1126/science.aaa7788 原文链接: http://news.sciencemag.org/asiapacific/2015/02/critics-pounce-china-s-top-science-prize
个人分类: 计算机应用技术|10677 次阅读|75 个评论
[转载]《Science》上两篇网络新论文
fangjinqin 2010-5-22 09:40
《Science》上两篇网络新论文 《Science》上网络新论文(1) 《Science》上网络新论文(2)
个人分类: 学术交流|2897 次阅读|1 个评论
《Science》最新一期刊出“复杂系统与复杂网络”专辑
热度 10 zhaoxing 2009-7-24 16:33
Science , 24 July 2009 (Volume 325, Issue 5939) Special Issue: Complex Systems and Networks Introduction to special issue Connections B. R. Jasny et al. http://www.sciencemag.org/cgi/content/full/325/5939/405 News Ourselves and Our Interactions: The Ultimate Physics Problem? Adrian Cho In the field of complex socioeconomic systems, physicists and others analyze people almost as if they were interchangeable electrons. Can that approach decipher society and what ails it? http://www.sciencemag.org/cgi/content/summary/325/5939/406 Econophysics: Still Controversial After All These Years Adrian Cho Econophysics is the biggest branch of complex-systems research, and physicists have flocked into finance. But many economists view econophysicists as dilettantes. http://www.sciencemag.org/cgi/content/summary/325/5939/408 Counterterrorism's New Tool: Metanetwork Analysis John Bohannon Researchers have created sophisticated new programs to probe beneath the surface of social interactions. How well do they work against terrorists? http://www.sciencemag.org/cgi/content/summary/325/5939/409 Investigating Networks: The Dark Side John Bohannon A few months ago, Lawrence Wilkerson, a former U.S. State Department official and Army colonel, painted a nightmare scenario of how social network science can be applied in a battle zone, outlining something he called the mosaic philosophy. http://www.sciencemag.org/cgi/content/summary/325/5939/410 Perspective Scale-Free Networks: A Decade and Beyond Albert-Lszl Barabsi http://www.sciencemag.org/cgi/content/abstract/325/5939/412 Revisiting the Foundations of Network Analysis Carter T. Butts http://www.sciencemag.org/cgi/content/abstract/325/5939/414 Disentangling the Web of Life Jordi Bascompte http://www.sciencemag.org/cgi/content/abstract/325/5939/416 A General Framework for Analyzing Sustainability of Social-Ecological Systems Elinor Ostrom http://www.sciencemag.org/cgi/content/abstract/325/5939/419 Economic Networks: The New Challenges F. Schweitzer et al. http://www.sciencemag.org/cgi/content/abstract/325/5939/422 Predicting the Behavior of Techno-Social Systems Alessandro Vespignani http://www.sciencemag.org/cgi/content/abstract/325/5939/425 Review Transcriptional Regulatory Circuits: Predicting Numbers from Alphabets H. D. Kim et al. http://www.sciencemag.org/cgi/content/abstract/325/5939/429
个人分类: 网络科学|11354 次阅读|10 个评论
Nature和Science哪个影响力更大?一个实证
zhaoxing 2009-4-3 15:01
《 Nature 》和《 Science 》哪个影响力更大? 半个世纪的 h 指数视角浅析 《 Nature 》和《 Science 》可能是现有最具影响力的综合类科技期刊。国人在上面发表论文,很多所在单位也会给予几十万甚至上百万的重奖,可谓名利双收。 但关于《 Nature 》和《 Science 》哪个更好一直存在很大争议。这里以两种期刊在 Web of Science 中 5 年等距抽样 h 指数(含义见注释 1 )数据,粗略探讨过去半个世纪以来,《 Nature 》和《 Science 》的影响力演进实况和相互差别。 统计时段选择 1955 年- 2005 年。未选择更早的数据,是因为 Web of Science 1955 年之前的数据只能按较长时段查询不能按具体年份检索。另外,据笔者所知,此两种期刊在世界范围的权威地位于 20 世纪下半叶才逐渐完全确立。 图 1 是两种期刊的 h 指数演变数据。 图 1 1955 年- 2005 年《 Nature 》和《 Science 》的 h 指数演变及比较 可见, 20 世纪下半叶,《 Nature 》和《 Science 》的 h 指数一直在上升,特别是 1975 年后,两种期刊的影响力扩大很快。两种期刊的 h 指数峰值都在 1995 年,当年两种期刊各有 280 余篇论文至今被引用了不少于 280 余次,论文影响力持续能力较强。新世纪里 h 指数的下降并不能证明两种期刊影响力有所下降,而是 h 指数增长需要时间积累所致。 半个世纪以来,除了 1965 年两种期刊 h 指数相等外,其余统计点上,《 Nature 》的 h 指数都大于《 Science 》,这种差别在 1980 年- 1990 年之间较为明显,但近年来差距似乎有所缩小。 h 指数主要关注产出论文集合的高被引论文及其被引强度 。应指出的是,任一单一指标的测度总有片面性,本博文数据仅供参考。 注释: 1. h 指数由美国物理学家 Hirsch 于 2005 年提出,以简单的计算同时衡量学者个人论文成果的数量和质量(影响力) 。 Braun 将其扩展到对期刊的 影响力测评 。 期刊 h 指数的定义为:某一时段内,期刊发表的总计 N 篇论文中,有 h 篇论文的被引次数至少为 h 次,且其余 N-h 篇论文的被引次数均小于或等于 h 。期刊 h 指数是目前除学者 h 指数之外,研究和应用最多的 h 指数扩展。 参考文献: 赵星 , 高小强 , 何培 . 科学基金 h 指数 : 基金论文成果数量与影响力的综合衡量 . 中国科学基金 ,2009,1: 15-19 Hirsch J E. An index to quantify an individuals scientific research output. PNAS,2005,102(46): 16569 16572 Ball P.Index aims for fair ranking of scientists.Nature,2005,436(7053): 900 Egghe L, Rousseau R.An informetric model for the Hirsch index. Scientometrics,2006,69(1): 121129 Braun T et al.A Hirsch-type index for journals.Scientometrics,2006,69(1),169-173.
个人分类: 学术期刊|33061 次阅读|9 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-1 15:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部