科学网

 找回密码
  注册

tag 标签: 研究模式

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

好的科研idea如何产生——解决问题篇
EditSprings 2019-5-24 11:49
如果一个问题很容易解决,那么很可能已经被人解决了。因此,确定一个问题的解决方案(就像发现问题本身一样,发现问题的研究模式可以参考: 好的科研idea如何产生——发现问题篇 )通常需要一个新的视角或思维方式。幸运的是,解决问题似乎也有几个常见的研究模式。可以使用以下方法来解决研究问题。 考虑相关问题。 试着用不同的方式重新考虑需要解决的问题。将问题换种术语表达或采用不同形式表现,你会发现该问题可能与某个已经形式化的一般问题相匹配。 类比。 类比的作用无比强大。我们在学习过程中经常使用类比,因为学习新概念的最好方式,就是把它和我们已经理解的概念联系起来。同样地,在应对难题时,将它与一个已解决的问题联系起来就会迎刃而解。当你将研究问题同自己所在学科外的领域进行类比时,往往会创造出最大的突破(这是其他人通常不会考虑到的概念突破,因为大部分人通常不会考虑到本学科领域外)。这些类比(如果运用得当)通常也能精确地指向某个解决方案,因为类似问题的解决方案有时也适用于你正在研究的问题。 把问题变成你能解决的。 简化那些不符合问题条件的假设,或者定义一些近似理想的模型。在某种意义上,这是发现研究问题时“找到关键点”的双重办法。 无论什么方式,开始着手研究。 纸上得来终觉浅,绝知此事要躬行,启动任何解决方案(不管看起来多么糟糕),都能让你开始研究。设计一个实验方案,按照既定的实验步骤执行。一开始实验方案可能不完美,试着执行它,看看绊脚石出现在哪里。这些障碍或许就是艰难的研究问题,问题的解决方案可能带来新的发现。 考虑大自然。 思考解决方案时,问问自己这样的问题:人类如何自然地解决这个问题?大自然如何解决这个问题?微型机器人的研究进展,是通过研究蜜蜂的行为实现的。我们通过观察闪电,然后计算听到雷声所需的时间来估计我们与闪电的距离,于是掌握了利用时间乘以音速来测算距离的方法。通过观察蝙蝠的声波传播原理,于是发明了雷达。考虑自然界如何解决问题,是一种运用类比的特殊方式。 从目标倒推。 用约吉 · 贝拉的话来说“如果你不知道要去哪里,你可能就到不了那里”。有时候在头脑中有一个期望的最终结果是有帮助的,通过将最终目标分解成更小的子问题,来找出所需要的东西。例如我们可以要求自己画出希望在最终论文中看到的图表——包括轴标签和趋势。根据图表、表格或结果,查看我们需要收集哪些数据?如果不能得到准确的数据,是否可以预先估计?是否需要开发(或应用)某些特殊的分析技术?需要具备哪些基本要素?这些要素要么是已经解决的问题(也是你要解决的问题),要么是需要用一些简化的假设来处理的问题。从最终目标倒推的方式通常可以提供一个有用的解决方案路线图。还可以让你分别解决较大问题中较小的部分(从最容易处理的部分开始)。有时候,找到一个好的子问题的解决方案本身就是一项重大的研究贡献。 考虑用语言或图片表达问题。 我们都有过这样的经历:当我们试图向朋友或同事表达一个问题时,却发现自己在描述完问题之前,就会说“算了,我已经解决了”。有时候,组织语言的思考过程可以帮助我们找到解决问题的方法,因为用语言表达问题可以帮助我们把问题具体化,并以一种不仅仅存在于我们头脑中的方式组织起来。类似地,画图可以帮助我们思考一个问题是如何构成的,以及各种子问题和组成部分之间是如何相互关联的。不仅如此,听众也可以从不同角度提供解决问题的方法。向一位来自完全不同领域的同事描述一个问题,可能会引发一个看似幼稚的问题,导致你打破自己的思维方式或抛弃当前的一系列操作假设——打破心理阻碍,引导你实现突破。这样看来,从各种不同的角度处理问题也是一个突破口。当应用某套理论或分析方法不起作用的时候,先把它放在一边,试试别的方法。 放松,让你的潜意识发挥作用。 最重要的是,让自己沉浸在问题中,但是保持放松。一般来说,当我们的大脑处于休息状态,无条理地思考时,创造性的洞察力就会出现。我们有时会为这种无组织的思考创造一个过程,我们称之为“头脑风暴”。但是,也许比头脑风暴更好的是“头脑休息”,你可以休息一下,散散步,跑跑步,打个盹,或者做点别的什么。通常,解决方案会在你最意想不到的时候出现。 母语润色 ¦ 专业翻译 ¦ 论文预审 ¦ 修改指导 ¦ 图表服务 ¦ 基金标书 ¦ 用户评价 ¦ 联系我们
3489 次阅读|0 个评论
谈谈植物学的崛起:科研其实就是穷人的游戏
ecoliugy 2019-5-23 14:12
雅典学院:古代学术是贵族的游戏 今年是2019年,恰逢五四运动爆发一百年。全国范围内,各大媒体大张旗鼓地谈论五四运动,纪念“五四精神”,教育青年一代要有爱国精神。 遗憾的是,大家在拼命强调爱国与进步的时候,忘了五四精神一共有八个字: “爱国、进步、民主、科学”。 特别是科学,理性和批判思考问题的精神,似乎被社会主流彻底淡忘了。 官方机构、公众和媒体的淡忘与忽视,恰好说明,一百年过去了,科学的精神没有得到很好的普及和广泛的接受。“科学”并没有成为思考问题的方式,只不过是一句句响亮的口号罢了。 前不久去美国参观学习,感慨我们很难建设出美国自然历史博物馆那样鲜活的展教体系。国内即便是最顶尖的学术和教育机构都是一层皮,核心压根没有学会。今天再次受到日本一讲毛虫的图鉴的刺激,再次引发了大家对科学与教育的讨论。 总结诸位青年科学家的看法,就是“科学都是那些贵族玩的游戏,我们尚且处于发展阶段,还不具备那样的经济实力。” 事实上,大家公认的种种“科研是贵族活动”的思想是不正确的。 现在的科研其实就是穷人的游戏。 古代贵族都是自己掏腰包,现代科研通过“项目”驱动,穷人科学家也可以“ 游山玩水 ”(野外科考),探讨哲学(做学问)了。 为什么这么说呢?这得从现代科学项目制的建立说起。2017年,nature有一篇书评,讲述了19世纪著名的博物学家小胡克,是如何在资金短缺的背景下,推动整个英国皇家学会改革的。 nature评论文章:胡克一手缔造了植物学 小胡克,全名为约瑟夫·胡克(Joseph Dalton Hooker,1817-1911),他父亲就是邱园的主任(又名大胡克),他因此受到影响,全世界跑,到处采集植物。其中最著名的是,他把喜马拉雅山区的杜鹃野生资源带回英国,强烈的刺激了英国人对杜鹃花的狂热,最终演变成整个欧洲对杜鹃的痴迷。众多的植物科考,奠定了胡克成为19世界最杰出的科学家之一。 胡克在锡金采集杜鹃花。他撰写了The Rhododendrons of Sikkim-Himalaya (1849)一书 在19世纪,小胡克虽然学术和名声上均取得较大的影响力,但他事实上并非贵族,科研资金还是个大问题。与达尔文等不同,小胡克一是家底薄,没有什么财产,自己也不是贵族;二是他所从事的植物学,在那时候还不成熟,被认为过于重视收集与描述,属边缘学科,不受重视。 由于植物标本收集之顾,小胡克与达尔文成了交心的好朋友。小胡克在阅读了达尔文的自然选择与物种起源的书信和手稿之后,很快成了进化论的支持者,并在收到华莱士的书信后策划了先在林奈学会上宣读达尔文的理论的办法,亲自将进化论介绍给学术界。 小胡克先后成为,英国科学学会会长, 皇家会长, 邱园第二任园长等,为了更好的发展植物学,改变植物学的地位,小胡克也借达尔文进化论的强大影响力,把植物园收集和分类的重要性推到一个新的高度。 Using evolution to put plants in their proper place within the system of classification was also a way of putting botany into a better place within science.(借力进化论,小胡克把植物系统分类在科学界的地位,提升到一个更高的位置。) Hooker's career bridged the old world of patronage and the new one of government-funded science. The latter opened careers to the relatively poor, but at the cost of bureaucratic interference and that “lengthening chain of correspondence”. (借力进化论,小胡克把植物系统分类在科学界的地位,提升到一个更高的位置。) 博物学家达尔文、地理学家 莱尔和植物学家胡克,三人是进化论最早期的坚定支持者 更为重要的是,小胡克作为学术皇家学会的领导,他结合自身没钱苦苦支撑的经历,改变了科学运作的方式。 小胡克在年轻的时候,曾写信给父亲,说要是自己成就不了一番事业,成为伟大的博物学家,那责任不在于我,而在于植物事业的资助实在太少。 利用自己独特的学术地位,小胡克把传统的科考资助方式,改为政府专项资金支持的模式,使得很多没钱的科研人员也能够从事科研工作。 这种政府资金支持的模式,很快在众多领域和学术机构中得到认可,整合到全世界各国的体制计划之中。我们现在的各种基金,项目、工程,就源自穷人科学家小胡克的改革。 换言之,当代科研制度就是为“穷人”设计的科研模式,早已经不是19世纪的贵族科研模式。 很多人,张嘴闭嘴讨论的没钱,需要贵族精神等等,或多或少都是没找到问题,为不好好干活而找出的借口而已。人心浮躁,制度有缺陷,或者科学改革不够彻底,教育出问题等等,我们需要在其它方面寻找病源。 Hooker's career bridged the old world of patronage and the new one of government-funded science. The latter opened careers to the relatively poor, but at the cost of bureaucratic interference and that “lengthening chain of correspondence”.(利用自己独特的地位,小胡克把传统的科考资助方式,改为政府专项资金支持的模式,使得很多没钱的科研人员也能够从事科研工作。) 1888年皇家学会会员合影:赫胥黎、胡克、高斯、达尔文、莱尔等众多牛人都在其间。你认识几人? 正如我们大多数人对当今中国学界“贵族精神缺乏”的反思和坚信不疑一 样,西方也曾怀疑胡克的这种做法。国家支持会不会弱化西方“贵族精神”? 对科学的追求,本身是对知识的追求,科研项目化会不会让人变为“对项目的追求,对资金的追求,而非对知识分享的追求”?有人嘲笑小胡克的这种“项目化的追求的新贵族精神”,确实西方学术同行也有追求项目化的趋势,但更多人对科学的追求,不正是一种新式的科学贵族精神吗?世事洞明皆学问,很多学问其实也不需要太多的资金,很多很多科研资金,其实也都打了水漂喂了白眼狼。 以植物学为例,我们从小胡克的身上可以隐约看出,穷人家出生之人或许才是最能在植物学领域坚持的一批人。你觉得呢? 参考资料:Endersby, J. (2017). Botany: he made plants a profession. Nature, 546(7659), 472-473. 图片来自维基百科、Kew、论文和 the Wellcome
597 次阅读|0 个评论
好的科研idea如何产生——发现问题篇
EditSprings 2019-5-21 15:41
研究能创造新思想、新方法和新发现。创造新思想的过程似乎令人畏惧,甚至有些神秘。在一些显然非结构化的环境中,神秘的研究过程将产生新的发现和知识。选择一个好的研究问题是进行科研的重要部分。培养对研究问题的品味和学习如何识别好的问题可能需要多年的经验(其实,获得经验和培养研究品味本身就是博士生涯的一部分)。 事实上,研究过程比看起来要更加公式化。应用特定的公式化方法对于识别和解决重要问题非常有效。下面,本文将针对我们在研究中经常遇到的挑战,提出一些研究模式。 如何发现具有研究价值的问题?当然,需要解决的问题主要是一些棘手的问题,但其中只有一部分对研究者来说是有价值的,剩下的问题最好留给其他人解决。培养研究品味可以帮助我们决定哪些问题值得解决,但首先要从哪里找到研究问题呢?下面是一些在实际应用中有用的研究模式。 开发秘密武器,寻找着力点 。成为某个领域的专家,或者挖掘其他人没有的知识或资源。掌握一些专业知识,你会变得更有吸引力并具有价值,人们会开始向你提出各种想法,希望与你合作。你所掌握的专业技能可以是多种形式,实际上能成为你的秘密武器。你可以开发出一个理论模型或分析方法,供他人在此基础上开展研究,那么你就有可能成为这些研究思想的中心。 比如《生活大爆炸》中, Sheldon 和 Amy 发现了宇宙的超不对称性理论。 一旦你拥有了这个秘密武器,你就可以用来解决别人无法解决的问题,或者提出别人可能想不到的解决方案。这时,你就可以应用你的专业知识来发现具有价值的研究问题。 重新审视那些条件或许已经改变的老问题。 老问题可能成为新问题的主要来源。以前对老问题的解决方案可能受到某些条件限制,例如仪器精密度、环境因素、成本、或理论还不成熟等等。然而,科学技术在不断进步。一个 5 年前难以阐述或难以解决的问题,可能会突然迎刃而解,因为旧的假设条件现在已经不成立,或者因为新技术的出现,之前难以解决的问题突然变得更容易处理。同样是《生活大爆炸》中, Sheldon和Amy 的诺贝尔奖有力竞争者,两个实验物理学家,他们的实验本来是注定要失败的,直到 Sheldon 和 Amy 提出了超不对称性理论,他们发现他们的实验居然 可以 证明这个理论,误打误撞实现了惊天逆转,成为诺奖的热门候选人。所以我们有必要定期重新审视多年来一直棘手且无法解决的问题或者曾经被认为是失败的作品,并考虑最近的技术发展是否使这些问题变得更容易处理。许多领域的研究都有未解决的问题(不仅仅是理论!),你应该继续留意那些基本技术的发展。 寻找痛点,逐个击破。 对于工业界(甚至其他研究人员)来说,重复出现的问题都是值得关注的。在科研中,如果同样的问题不断重复出现,并每次都以同样愚蠢、低效或次优的方式来解决的话,那么显然是需要改进方法的。工业领域经常面临类似的重要问题,但或许因为工作繁重,他们无法抽出时间反思是否应该采取一种全新的方法来解决一个老的、反复出现的问题。但幸运的是,研究人员有足够时间考虑:问题是否以正确的方式得到解决?或者是否存在“痛点”,并且能用一个全新的方法来消除? 树立远大理想,列出梦想清单。 许多研究方案的最终目的都是为了让每个人的生活变得更好。想想“伟大”的研究问题——治愈癌症,把人类送上月球等等。这些梦想看起来像科幻小说,但实际上都是可以实现的。每个梦想都包含许多子问题,其中一些需要创造新的知识。(如果不需要新的发现,问题早就轻而易举地解决了。)鉴别研究问题的一个好方法是为自己列出一份梦想清单,以及一份你想知道答案的问题清单。如果你既不知道答案,又不能发现问题,那么难题永远得不到解决。根据科研的定义,回答这些问题就是从事科研。 困扰你的可能是宏大的目标,也可能是简单的问题 。好的研究起点就在于确定自己希望解决哪些问题从而让世界变得更加美好。 将一般问题特殊化。 将一般性问题限制在不同的研究范围内,有时会产生一系列新的问题。 将特殊问题一般化。 某些领域内的问题一直受制于找到具体的解决方案,而没有推及到解决同类问题的普适方案。在阅读有关某个特定问题的相关论文时,弄清某篇论文是否提出某种一般性的方法,如果某篇论文仅仅提供了问题某个方面的具体解决方案,那么就还有进一步开展一般性研究的空间。 寻找关键点。 在寻找可以进行一般化研究的问题领域时,需要确定该问题领域的关键要素,即搜集到的各方面相关论文都是基于一些已经得到解决的基本问题,而这些基本问题可能是一个重大的研究问题,因为许多具体的解决方案都是依赖于现有的解决方案。 在下一篇文章中,我们将继续讨论解决问题的研究模式,敬请期待。 母语润色 ¦ 专业翻译 ¦ 论文预审 ¦ 修改指导 ¦ 图表服务 ¦ 基金标书 ¦ 用户评价 ¦ 联系我们
3134 次阅读|0 个评论
关于“国家重点实验室应该追求什么”的讨论
热度 1 iKnow 2018-9-25 00:37
2018年1月8日,科技部发布 2017年信息领域国家重点实验室评估结果 ,依托于中国科学院计算技术研究所的计算机体系结构国家重点实验室(以下简称“体系结构国重”或“国重”)在信息领域32个国家重点实验室名列第6位,被评为优秀类国家重点实验室。 体系结构国重于2012年正式成立,首次参加评估便获得优秀,尚无先例 。 这样的成绩和国重领导层(孙凝晖主任、李晓维常务副主任与冯晓兵副主任)倡导的发展理念密切相关,也与全体国重成员们共同营造的民主开放氛围密切相关。下文是笔者在2014年1月初国重内部邮件交流关于“国重的追求”讨论时的观点文章,当时引起了大家的共鸣。在此与大家分享(修改部分文字,并补充了2个图): 国重应该追求什么? 一、计算所的优势 2006年,有篇檄文相信很多人都看过《 从ACM会议看中国大陆计算机科学与国外的差距 》,彼时很多顶级会议大陆都是零! 过去8年大陆不断突破,计算所在这个过程起到先锋作用,很多计算机体系结构会议都是率先由计算所突破的 ,比如SC、SPAA、Sigmetrics、HPCA、ASPLOS等,而且计算所在大陆占较大的优势。可以说,计算所在这一轮转变中占得先机,为后来争取创新群体、973项目以及国重都起到一定的作用,也为计算所在国际上赢得了一定的声誉——张晓东教授经常说,如果国外做系统结构的人回国没有在计算所做过报告,那他的水平就可能有限。 那段时间计算所获得的优势得益于李国杰老师早在2005年就开始摒弃、批判SCI。那时李老师不仅在外面以院士身份以及CCF理事长宣传大家要重视计算机会议,同时还在所里鼓励并且奖励发表会议论文,我想很多人应该都还对前几年的计算所优秀论文奖有印象。 这几年,不管是学术界、还是工业界,国内的科研水平这几年进步非常神速。各大高校顶级会议论文不断涌现,而且一些企业也开始重视论文发表,比如百度也中了一篇ASPLOS,而且他们的技术是在真实系统中布署了。相比较而言,似乎计算所的论文发表速度变慢了。 面对国内同行的快速发展,我们可能都困惑过:“计算所的优势是什么”? “计算所的优势是什么”,我曾经把这个问题抛向了好多国外的教授。 李凯教授和UCSD的周源源教授都认为计算所的优势是——做真实的系统;而施巍松教授则认为,计算所的优势在于——“知道什么是好,什么不好!” 这些教授都是和计算所有打过较长时间的交道,他们的回答其实正是计算所的传统优势。 二、“做真实的系统” “做真实的系统”当然是计算所的最大传统优势,远到103、107、757、联想PC系统等,近到曙光系列、龙芯等,都是以系统的形式展现。做系统需要有足够的资源保障,过去有不少先进的项目最后因为经费不到位而草草收场。比如1990年代初,Stanford在John Hennessy带领下开展Intel资助的Flash项目,但最后因为Intel中断经费提供而不得不改为使用模拟器来验证。不过有挑战的系统,即使副产品也会开花结果,Flash项目对模拟器的高要求,最终孵化出了VMWare公司。 回到国重的话题,我觉得 国重还是应该秉承计算所的传统优势,以系统作为载体来开展科研工作 。而在现有的资源条件下,我们能做什么样的系统?我不知道具体的答案,但每个课题组可能都思考过。我们可以来看看世界上顶尖大学的一些例子: Univ. of Washington的Wavescalar项目 (~13人*3年): http://wavescalar.cs.washington.edu/prototype.shtml Stanford的Christos Kozyrakis教授 (一个项目3~5个人): http://csl.stanford.edu/~christos/research.html#prototype Stanford的Mark Horowitz教授 (最多有12个人参加完成一个原型芯片): http://vlsiweb.stanford.edu/chips.html Berkeley AMP Lab的Ion Stonica教授,Mesos,Spark等开源软件项目 (以一个高年级博士生为主,再加上2-3个低年级学生): http://www.cs.berkeley.edu/~istoica/ 从这些例子来看,做一个验证想法的原型系统或者开源软件其实并不需要太多的资源,需要更多的可能是时间成本,一般需要2~3年时间。比如Mesos被据了2年,spark开源后前3年只有6个人参与,论文也被据了近2年,但他们都坚持下来了,成为引领国际大数据处理的项目,产生巨大的影响力。 三、“知道什么是好,什么是不好!” 这个回答值得我们思考,这涉及到当下生存与长远发展问题。计算所在过去几年全国“唯SCI”形势之下独辟蹊径,及时采用与国际接轨的标准,才争取到今天国重这样的平台。大家期待未来能在这个平台上更上一个台阶,如果现在跨上这个平台后,却反而不得不向SCI低头,这多少有些无奈。 究竟“什么是好”? 其实是我们自己选择的,每个人的选择也许会不一样,这取决于我们设立的未来发展目标。如果我们只是在想国内发展,那么可以选择国内的评价标准;但 如果我们希望能走向国际,早日实现国际化,那么遵循国际同行认可的标准会更好。 也许也有观点认为国外也有不少教授热衷于发表大量的SCI文章,比如有朋友曾给我看过一位教授的简历:2012-2013年每年就有13~15篇IEEE Transactions,每年还有5~6篇Infocom。但这些我们是想追求的吗?如果全力以此为目标,我相信国重不少小组每年灌上10篇左右Trans也不是不可能。国重是否还需要通过这种方式来证明实力呢? 我们每个人心中都有一个价值标准,或者说是研究品味 。既然大家都在国重,如果我们都有相近的研究品味,也许会更好,那也就自然形成了国重文化。就像Stanford的教授学生以创业为荣;Princeton的教授一批受李凯老师影响也开始积极创业,还有一批则专注学术热衷于著书。这些都是文化,对团队的影响是潜移默化的、却又是深远的。 国重的研究品味应该是什么样,我觉得应该参考Berkeley、Stanford等顶尖大学的教授们。即使我们现在还做不到他们那么好,达不到那个水平,但要相信这个方向是正确的 。 图1. 不同的研究模式 四、发展模板 去年所里辩论决赛是“计算所发展有没有模板可依”。这个题目我也参与拟的,我自己的观点是任何事情都是有模板可依的。依模板是一种高效的方式,尤其选择了好的模板。华为2013年做到了400亿美元,任正非在其新年致词中认为管理是核心,而华为的管理正是以IBM为模板。这是依模板的一个很好的例子。 实验室发展应该也是有模板可依的 。每个实验室都是一步步发展成长起来的,这个过程必然是充满了曲折。我们可以用历史的眼光去看这些实验室的成长。比如南大的软件国重,虽然最近连续两次获得优,但应该看到他们也是从1986年成立以来经过了20年的奋斗才第一次获得优。相比较而言,我们的国重还是婴儿阶段,管理办法、人才培养方式等都还在探索阶段,也许可以把目标放长远一些,比如10年后达到国际一流。 最后,再向大家推荐看一下 Richard Karp讲述的Berkeley CS崛起的幸酸史 ( http://www.eecs.berkeley.edu/BEARS/CS_Anniversary/karp-talk.html ): 1960年代Berkeley有两个独立的计算机系,两拨人互相不服,折腾了十几年到后来合并到EECS,开始变成EE和CS分治,有两边轮流出EECS的系主任和副系主任,算是稳定下来。而 Berkeley CS在1970年左右还是二流的,那时Top 3是MIT、Stanford和CMU ,那时Berkeley和Cornell都有差距。经过1970年代的十年发展,Berkeley挤入了Top 4行列。且不谈理论方面的P/NP贡献,在系统领域,让Berkeley站起来的是因为2个项目,学术界的第一个大规模开源软件系统Berkeley Unix项目和第一个实现Ted Codd关系数据库的INGRES系统。紧接着到了1980年代,RISC、RAID等项目进一步巩固了第一梯队的地位,吸引越来越多优秀的人,从而进入良性循环。 为什么Berkeley在1970年代能崛起 ,我想很关键的一点,他们找到了一批非常出色、志同道合的年轻人,Butler Lampson,Velvel Kahan,Richard Karp,Chuck Thacker,Manuel Blum,...... 他们是冲着当时Berkeley的名气来的,进入计算机系后却发现问题重重,但他们相互鼓励、相互欣赏,一起开拓未来 。 图2. UC Berkeley在1970-1990年代的研究工作产生了8位图灵奖得主( PDF版 )
个人分类: 科研点滴|18017 次阅读|2 个评论
漫谈错误的技术预测
热度 9 iKnow 2015-4-3 09:32
【注:本文已发表在 2015年第3期《中国计算机学会通讯》 】 最近《 IEEE The Institute 》杂志列出了历史上五个著名的错误技术预测 ,很多读者们看过之后觉得不过瘾。在此笔者又追加了若干有名的错误预测以飨读者(如表 1 ): 表 1. 著名的错误技术预测 这些预测者都是各自领域的精英,为何他们会做出这些看起来有些荒唐的预测?先抛开这个问题,让我们把视线从技术转向股市,来看一下马化腾对腾讯股票的预测。 2010 年 6 月至 2011 年 10 月的一年多时间里,马化腾先后 7 次减持腾讯股票,损失 17.5 亿港元(见表 2 )。分析人士称,这是马化腾与一些投资机构对赌的结果。稍加推敲,我们可以猜测马化腾在与投资机构达成对赌协议时,他肯定没有预测到腾讯股票能达到 200 元,他心里的估价应该是低于 67.806 元。 表 2. 2010 年 6 月 -2011 年 10 月期间马化腾减持腾讯股票情况 一 个有趣的现象是,即使是比任何人都了解腾讯的马化腾,也依然无法预测自己公司的股价。然而今天,我们很多人却在热衷于预测,比如机器人的智慧将很快超越人类、人的知识可以通过互联网下载获得等等。在笔者一开始接触到这些预测时,感到非常惊叹。 后来笔者慢慢地开始觉察和体会到预测也存在“测不准原理”:未来越遥远越容易预测,目标越宏观越容易预测;当决定朝着目标前进时,就会发现相比于预测中美好的未来,现实其实很残酷——哪怕是未来几个月甚至几个星期都充满了不确定性,几乎一切都不可预测。这一点,也正是管理大师柯林斯在其《选择卓越》一书中的核心理念。 不可预测,或者说不确定性,普遍存在于我们的工作生活中,尤其是对于科研活动——我们可以设定一个研究预期目标,但却无法准确地预测几年后的研究成果,也很难预测未来成果的影响力。而好的研究其实就是一个选择的过程,研究中会不断出现没有预料到的情况,因此我们必须不断地分析、判断与选择,从而探索出一条可行的道路。 图 1. 两种不同的研究模式:目标驱动式( Objective Scheme )与培育式( Nurturing Scheme )。 面对研究过程的不可预测性与不确定性,不同的对待和处理方式会产生不同的心态和结果。图 1 是著名生物学家 Uri Alon 总结的两种不同类型研究模式 :一种是目标驱动式( Objective Scheme )研究。这种研究设定的目标非常明确,更像是一个技术路线既定的工程项目,研究过程被严格控制与管理。但是这种研究模式下出现预料之外的结果时,研究人员很容易气馁,于是会开始质疑既定目标,进而质疑制定目标的导师或者负责人的能力。另一种是培育式( Nurturing Scheme )研究。这种模式虽然也设定研究目标,但预先考虑到研究过程中的不确定性。因此,当出现一些预料之外的情况,研究人员会以一种沉着冷静的心态去应对,及时分析调整研究方向,即使与既定目标出现偏差也坦然接受,这样反而更有可能开辟出新的研究方向。 笔者越来越体会到好心态对于研究的重要性。只有坦然面对研究的不可预测性与不确定性,才能在研究的低谷、在最艰难的时候,依然保持斗志,坚持不放弃。笔者曾经与 Berkeley AMPLab 的成员交流过他们的研究模式,发现事实上他们很多研究工作在发表前都被拒过很多次。比如现在由创业公司 Mesosphere 进行产业化的 Mesos 曾经被拒了 2 年,最终发表在 NSDI 2011 ;在国际上引领大数据分析的 Spark 则在被拒了 1 年半后才最终发表在 NSDI 2012 ;而发表在 SOSP 2013 的 Sparraw 工作更是在致谢中感谢了 HotCloud 2012 、 OSDI 2012 、 NSDI 2013 和 SOSP 2013 的评审人。但是 AMPLab 实验室的成员有着非常好的心态,他们都有一种信念,相信自己的工作最终肯定能在顶级会议上发表。而这种信念,一方面来自导师的指导和灌输,另一方面也是得益于师兄师姐们“悲惨”经历所提供的参考。在这样的实验室氛围中,他们已经在潜意识中认识到了做一流研究过程中的不确定性——哪怕是在世界顶尖实验室,也无法保证研究工作一次投稿即被接收。 事实上,正如柯林斯的《选择卓越》书中分析,那些卓越的企业也都有好心态。他们接受未来不可预测的残酷现实,并在此基础上制定了一系列计划和行动,“先子弹,后炮弹”。更直白的表达其实就是“走一步,看一步,时刻做好调整的准备”! 本文开篇的那些错误的技术预测,因为做出预测人的身份与地位而被人为地放大了。事实上,我们必须看到,这些“错误的预言家”其实在绝大多数时候作出了比绝大多数人更正确的预测,才达到了被别人用放大镜观察的地位。从这个意义上来看,他们的总体预测准确度是令人敬畏的。 Five Famously WrongPredictions About Technology, IEEE The Institue, 2014. Uri Alon, How To Choose aGood Scientific Problem, Molecular Cell 35, September 25, 2009.
35088 次阅读|10 个评论
[转载]数据科学与信息服务产业应融合发展
shawn360 2012-9-11 09:08
我们生活在一个海量信息和海量数据的时代:互联网、计算技术、电子商务和各种其他新兴技术使我们获取数据、分析数据和利用数据的能力有了一个质的变化。这个变化正在不断深入、全面影响着我们的日常生活,由此也影响着社会、文化、国防和国民经济的发展。   信息服务产业已成为发达国家经济转型的主要支柱。以谷歌和脸谱为代表的信息服务企业,在短短几年时间里就进入全世界最大、最受瞩目企业的行列。它们的发展速度是在传统的工业模式下难以想象的。它们的成功也展示了信息服务产业巨大的发展空间。另外,数据和信息资源已成为继人力资源和物质资源以外的第三大资源。数据资源的开发和利用将是未来社会和经济发展的主要手段之一,也应该成为制定国家长远发展计划需要考虑的主要因素之一。    科学研究可归结为数据研究   由此,信息时代对社会、政府特别是教育和科学研究体制提出了什么样的新要求?信息服务产业的科学基础是什么?   传统工业,尤其是制造业的科学基础是自然科学。物理学提供了自然科学最基本的原理。在此之上,化学、生命科学、地球物理、天文学以及各种各样的工程科学为传统工业提供了科学指导。从大学、科研机构到企业、政府部门,都已经建立起了一整套从教学、科研、开发、生产到市场的机制。   信息服务产业的科学基础是数据科学。简单说来,它由两个部分组成,即用数据的方法来研究科学和用科学的方法来研究数据。   先谈第一点。科学研究有两个最基本的模式,姑且叫做开普勒模式和牛顿模式。开普勒关于行星运动的三大定律完全是从前人所观察到的数据中总结出来的。而牛顿则更进了一步,他寻求的是基本原理。他对行星运动规律的认识是建立在基本原理的基础之上的。牛顿不仅知其然,而且知其所以然。牛顿的认识无疑比开普勒要深刻得多。所以牛顿模式成了科学研究的首选模式。几百年来的科学研究都是沿着一条以寻求基本原理为目标,而从根本上认识世界、认识自然这样一条道路走过来的。   时至今日,科学家在对基本原理的寻求方面取得了长足进步。随着量子力学的建立,人们已经基本了解了在生命科学、化学、能源、环境等与日常生活息息相关的领域所需要的基本原理。现实的困难在于这些系统的复杂性——从基本原理出发去理解这些系统在目前和不太遥远的未来基本上都是一件不可能的事情。牛顿模式因此而面临着难以逾越的困难。而另一方面,由于人们获取数据和分析数据能力的提高,从数据中直接总结出客观规律的开普勒模式的优势就体现了出来。生物信息学的成功就是一个很好的例子。   再谈第二点。从传统的角度来看,分析数据属于统计学的范畴。但近年来,随着机器学习、数据挖掘、生物信息、图像处理、信号处理等方面的发展,数据分析已经深入到了计算机科学、社会学、电子工程、生命科学、天文、地理、气象等领域。而且,从数据分析的角度来看,这些不同学科中的不同问题有着相当程度的统一性。正是这种统一性,使得数据科学有存在和发展的必要。    现行教育方式抑制创新   这里特别值得一提的是数学的作用。从根本上来讲,自然科学的基本原理来自于物理;而数据科学的基本原理则来自于数学。数据分析的主要手段就是给数据建立起数学结构。这种数学结构可以是多方面的:拓扑的、几何的或代数的。最简单的结构是图的结构,这也可以看做是一种拓扑结构。传统的统计学中最常用的是分析方面的结构,如参数化模型。所以数据科学给数学也带来了许多根本性的问题:例如怎样把数据集(如网页)坐标化,怎样给数据集定义拓扑结构或曲率,怎样利用数据集中可能隐含的对称性,怎样设计高效的算法,怎样处理噪声等等。数据和数、方程以及图形一样,也将成为数学研究的基本元素之一。这不仅能给数学的各个领域提供新的问题,同时也会加深我们对数学中一些最基本概念的认识。   数据科学中最受瞩目的成就之一是小波理论。系统的小波理论出现之前,人们对在信号处理中引进局部基函数和对信号按尺度作分解都有过很多的尝试。但这些工作都是经验性的,缺乏系统性,小波理论从根本上解决了这一问题。它使这些尝试性的工作由经验变成了科学,这样的转变是本质性的。它所带来的变化也是有目共睹的。压缩感知理论也经历了一个类似的过程,它所产生的影响也将是巨大的。   另外需要强调的一点是,由自然科学的成就转换成工业产品往往要经过一个漫长的过程。而数据科学则不同,数据科学与应用、与产业有着更为密切的联系。从小波理论的出现到它在图像处理方面的应用仅仅经过了几年的时间。正因为如此,对数据科学的研究更应该努力地走在最前沿,因为落后一步就意味着彻底失去机会。   目前数据科学的发展存在着如下几个问题:一是缺乏一个统一的平台。数据科学被瓜分到计算机科学、统计、数学、生物等学科。它们之间还缺乏应有的联系。这使数据科学的发展受到制约。二是数学作为数据科学的基础,其作用还没有被充分认识到,更没有充分发挥出来。这在一定程度上限制了数据科学研究的深度。三是企业界与学术界之间的相互影响还不够完善。企业界搜集的数据经常不够规范,企业界和学术界之间协同创新的模式还有待完善。   具体到我国的实际情况,在很多方面更是令人担忧。我国现行的教育和科研体制几乎将学科分类推到了极致。这更加不利于数据科学这样一个新型的、跨学科的领域的发展。另一方面,从谷歌、脸谱等例子来看,信息服务产业中许多最有创造性的想法都来自于年轻人。而我们国家所通行的教育方式,如中学的应试式教育和大学的灌输式教育都极大抑制了年轻人的创造性。    统一规划数据科学和信息产业发展   认识到这些以后,我们自然要问:怎样应对数据科学和信息服务产业所提出的新的要求?   从大学的层面来看,应该充分认识到数据科学发展的巨大空间,将数据科学提高到一个和自然科学并列的高度。以数学、计算机科学、统计、生物信息、金融和经济学、社会学等学科为依托,建立起一个数据科学的教育和科研平台。同时要建立起一个完整的本科生和研究生培养计划。这个教学计划的基础课程应该包括线性代数、逼近论、离散数学、概率论和随机过程以及数理统计等数学课程;同时也应包括数据库、数据结构、机器学习、数据挖掘等计算机科学的课程。   这里应该特别强调算法的重要性:没有高效的算法,所有的理论模型都将被束之高阁。而在传统的框架下,算法被分割到了计算数学和计算机科学两个学科中。这两个学科对算法研究的风格和出发点各不相同,但它们所研究的许多问题在本质上是相同的。数据科学的发展更是要求把这两种不同风格、不同背景的算法研究紧密结合起来。   课程设置仅仅是教学计划的一部分,更富有挑战性的是怎样创造出一个能充分发挥学生主动性和积极性的教育环境,并能使教学计划和信息服务产业的前瞻性需求紧密结合起来。   从企业界的角度来看,要充分认识到创新的重要性。中国本身就是一个很大的市场。其很多方面,如政策、语言、经济等方面的特点给国内的企业在占据国内市场方面提供了很多优势。但应该认识到,仅仅依靠这样的自然保护是难以持久发展的。要保证中国的信息产业能走到世界的前列,就必须走创新的道路,必须开拓国际市场。企业界应该学会充分利用大学和其他研究机构等资源来提高自己的创新能力。   从政府的层面来看,要把发展数据科学和信息服务产业作为一项战略计划来抓。充分认识到这是关系到国计民生,关系到国家的经济、科学和文化发展的根本利益和长远利益的一件大事。从组织、资源、政策等多方面制定出一整套的相关计划。   从我国的具体情况来看,政府的指导作用尤其重要。首先,我们必须有意识地积累数据这种资源并使之成为可利用的资源。这就需要政府在数据搜集、存储,特别是在开放数据等方面提供一系列的指导政策。其次,数据科学和信息服务产业的发展需要学术界和企业界的密切配合。政府可以通过各种方式鼓励这种配合,尤其是在前瞻性的研究方面。最后,数据科学是一门跨学科的领域,而我国目前的科研和教育体系对跨学科领域的发展是极为不利的。我们不能等体制方面的问题都解决了再去发展数据科学,而应该通过政府的一些引导措施有效避免体制方面的问题所造成的困难。   总的来说,数据科学的研究还处在一个初级阶段,尽管一些西方国家占据着领先位置,但所形成的差距还不是太大。从另一方面来讲,有理由相信数据科学和相关的信息产业比较适合中国人的习惯性思维。关键是我们必须把握住这个历史时机,迅速建立起一整套适合数据科学及相关的信息产业发展的体制和环境。要做到这一点,政府、学术界和企业界之间的密切配合是必不可少的。 作者简介 :鄂维南,男,泰州靖江人,1963年9月出生。中国科学院院士。现任北京大学长江讲座教授,同时也是美国普林斯顿大学教授。1978年考入中国科技大学数学系,1985年获得中科院计算数学所硕士学位,并在著名应用数学家BjornEngquist教授指导下获得美国加州大学洛杉矶分校博士学位。鄂维南教授从事的研究领域极其广泛,分布在数学、力学和理论物理的诸多方向,并均有重要的发现和贡献。他的研究把数学模型、分析和计算美妙地结合起来,并能对现实世界的重要现象提供新的见解。他还曾获得过美国青年科学家和工程师总统奖以及第五届国际工业与应用数学家大会科拉兹奖。
2764 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-17 23:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部