科学网

 找回密码
  注册

tag 标签: 吴军

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

2017年书单(5)
zywsict 2017-2-28 08:56
1 《传奇邵逸夫》 何南 2 《杨绛:人生最曼妙的风景》 田梦 3 《李敖快意恩仇录》 李敖 4 《另类日本史》 姜建强 5 《浪潮之巅》 吴军
个人分类: 书单|2740 次阅读|0 个评论
推荐吴军的三本书:《数学之美》、《浪潮之巅》、《文明之光》
热度 7 ljrsch 2014-12-10 13:39
自己认为的好东西总想与大家分享。吴军的三本书就是这样的好东西。 一年前,我的研究生向我推荐《数学之美》,说是一本好书。当时大概翻了一下,没有仔细看便放下了。 2014年暑假,到研究室给学生开会,来得早了一会。桌子上放着一本《数学之美》,百无聊赖,顺手拿起。刚刚读了几页,被她通俗易懂的语言所吸引!这样的书实在难得: 不纠结于生涩难懂的术语和细节的术,抓住的是背后根本的“道”! 书中的很多内容之前也看过,但是其它书籍上几页篇幅都不明白的内容被吴军几句话就说得清清楚楚!真是举重若轻! 紧接着的几天里,一口气把《数学之美》读了三遍以上,并在书中作了很多注释和总结(下图,原图中最左边圆圈内的标注错误,阅读时注意)。这本书真是把我们所学过的以为没有用处的数学知识与实际问题结合起来,真正的理论与实践的结合。 《数学之美》的精彩内容包括Google搜索引擎 及PageRank算法、搜索广告与逻辑回归 、新闻分类与余弦定理 、图论与网络爬虫 、最大熵模型、隐马尔可夫链、贝叶斯网络等。 基于对《数学之美》的喜爱,到亚马逊查找吴军的书,买了《浪潮之巅》和《文明之光》。 《浪潮之巅》由《数学之美》的技术层面上升到公司层面,写的是有幸站在技术之巅的公司的故事,是很好的商业案例。本书 两大优点:来龙去脉清晰;分析透彻,体现了对“道”的重视。这些公司包括:IBM、Intel、Google、Apple、Nokia、Oracle、... 《文明之光》又上升到了人类文明的层面。窃以为这是吴军的利害之处,具有非常好的把控力和表达力。以前我们在历史课本上读到的都是以时间和名字为主的政治军事史。《文明之光》两大亮点:人类的科技、文化、文明史,视角的独特;生动有趣,以讲故事的方式把来龙去脉说得多彩而有趣。 另外,吴军在爱奇异网 上有“文明之光”书茶室,写书心得: http://www.iqiyi.com/w_19rsneoknx.html 。
26710 次阅读|8 个评论
清华出身的吴军是个奇才,最近的讲座系列值得看
热度 1 liwei999 2014-11-22 22:41
作为美国谷歌早期员工和后来中国谷歌的骨干,他早就名噪天下了 。腾讯请去做副总,给了很多资源为腾讯做搜索,不果,他现在说是因为腾讯的基因不适合做搜索。也有人说他聪明绝顶,有眼光和视野,文理兼通,人才难得,是极好的研究员、工程师和青年导师,但却不是领军产品开发的将军。 不管怎么说,他是退出了腾讯一身轻,名义上重返美国谷歌。如今好像主要是全世界转,然后著书立说(从当年的《数学之美》、《浪潮之巅》到现在的《文明之光》以及正在写的续集,都是很畅销的,不怪有众多青年粉丝,),到处演讲,兼做风险投资。上进青年的互联网导师的形象,活得洒脱的很。 文明之光书茶室第六集08Facebook故事二:互联网本质是通信工具 http://www.iqiyi.com/u/2211906983 不愿意读书的,看他的视频也基本上可以了解他的互联网全方位视野的介绍。特此推荐。 "我写的三本书《数学之美》、《浪潮之巅》和《文明之光》是一个工程师对世界的认识过程,先是从技术着手,然后看到商业的规律,最后讨论文化的问题。 "---吴军
个人分类: 立委推荐|4500 次阅读|1 个评论
#“人-书-博-文”系列(3)#吴军
josh 2012-7-2 17:27
人 吴军博士毕业于清华大学计算机系(本科)和电子工程系(硕士),并于1993-1996年在清华任讲师。他于1996年起在美国约翰霍普金斯大学攻读博士,并于2002年获得计算机科学博士学位。在清华和约翰霍普金斯大学期间,吴军博士致力于语音识别、自然语言处理,特别是统计语言模型的研究。他曾获得1995年的全国人机语音智能接口会议的最佳论文奖和2000年Eurospeech的最佳论文奖。 吴军博士于2002年加入Google公司,现任Google研究院资深研究员。到Google不久,他和三个同事们开创了网络搜索反作弊的研究领域,并因此获得工程奖。2003年,他和两个同事共同成立了中日韩文搜索部门。吴军博士是当前Google中日韩文搜索算法的主要设计者。在Google其间,他领导了许多研发项目,包括许多与中文相关的产品和自然语言处理的项目,并得到了公司首席执行官埃里克.施密特的高度评价。 吴军博士在国内外发表过数十篇论文并获得和申请了近十项美国和国际专利。他于2005年-2011年,担任约翰霍普金斯大学计算机系董事会董事。2011年至今,担任该校工学院董事会董事。 2010年,吴军博士开始他的新的探险。(加入腾讯) 我喜欢做什么 我是一个还不错的摄影爱好者,一个古典音乐迷,喜欢享受高质量的影视,比如Blu-ray的电影。平时偶尔会修理园子,甚至做点木匠活。每年旅游很多次,参观博物馆,见到了全世界三分之二最著名的油画的真迹。当然,还时不时地为Google China Blog写东西。以前读书很多,现在事情太多读得就少了。另外,我是很好的红酒鉴赏家。最喜欢的是波尔多的红酒和加州那帕谷(Napa Valley)的Cabernet Sauvignon. 我不喜欢做什么 由于生命有限,很多不重要的事只好不做了。    书 浪潮之巅 https://sites.google.com/site/junwu02/%E6%B5%AA%E6%BD%AE%E4%B9%8B%E5%B7%85 http://book.douban.com/subject/6709783/ 数学之美(推荐!) https://sites.google.com/site/junwu02/beautyofmathematics http://book.douban.com/subject/10750155/ 吴军博士,现任腾讯公司主管搜索、在线广告和云计算基础架构的副总裁,毕业于清华大学(本科、硕士)和美国约翰·霍普金斯大学(博士)。在清华大学和约翰·霍普金斯大学期间,吴军博士致力于语音识别、自然语言处理,特别是统计语言模型的研究。他曾获得1995年全国人机语音智能接口会议的最佳论文奖和2000年Eurospeech的最佳论文奖。   吴军博士于2002年加入Google公司。在Google,他和Amit Singhal(Google院士,世界著名搜索专家)、Matt Cutts(Google反作弊官方发言人)等三位同事一起开创了网络搜索反作弊的研究领域,并因此获得Google工程奖。2003年,他和Google全球架构的总工程师朱会灿博士等共同成立了中日韩文搜索部门。吴军博士是当前Google中日韩文搜索算法的主要设计者。在Google期间,他还领导了许多研发项目,包括许多与中文相关的产品和自然语言处理的项目,并得到了当时公司首席执行官埃里克·施密特和创始人谢尔盖·布林的高度评价。   吴军博士在国内外发表过数十篇论文,并获得和申请了十余项美国和国际专利。他撰写的《浪潮之巅》一书深受业界的好评。他于2007年起担任风险投资基金中国世纪基金的董事。2011年起,当选为约翰·霍普金斯大学工学院董事会董事,并在该校的国际事务委员会担任顾问。他是国家重大专项“新一代搜索引擎和浏览器”项目的总负责人,从2012年起任职工业与信息化部的专家和顾问。 博 博客 : https://sites.google.com/site/junwu02/%E4%B8%AD%E6%96%87%E7%89%88%E8%AF%B7%E6%8C%89%E8%BF%99%E9%87%8C http://www.cs.jhu.edu/~junwu/index.html 文 数学之美 系列十一 - Google 阿卡 47 的制造者阿米特.辛格博士 http://www.google.com.hk/ggblog/googlechinablog/2006/07/google-47_3471.html 枪迷或者看过尼古拉斯.凯奇(Nicolas Cage)主演的电影“战争之王”(Lord of War)的人也许还记得影片开头的一段话:(在所有轻武器中,)最有名的是阿卡 47( AK47)冲锋枪(也就是中国的五六式冲锋枪的原型),因为它从不卡壳、从不损坏、可在任何环境下使用、可靠性好、杀伤力大并且操作简单。 我认为,在计算机中一个好的算法,应该向阿卡 47 冲锋枪那样简单、有效、可靠性好而且容易读懂(或者说易操作),而不应该是故弄玄虚。Google 的杰出工程师阿米特.辛格博士 (Amit Singhal) 就是为 Google 设计阿卡 47 冲锋枪的人,在公司内部,Google 的排序算法便是以他的名字命名的。 从加入 Google 的第一天,我就开始了和辛格长期而愉快的合作,而他一直是我的一个良师益友。辛格、Matt Cutts(中国一些用户误认为他是联邦调查局特工,当然他不是)、马丁和我四个人当时一同研究和解决网络搜索中的作弊问题(Spam)。我们需要建一个分类器,我以前一直在学术界工作和学习,比较倾向找一个很漂亮的解决方案。我设计了一个很完美的分类器,大约要花三个月到半年时间来实现和训练,而辛格认为找个简单有效的办法就行了。我们于是尽可能简化问题,一、两个月就把作弊的数量减少了一半。当时我们和公司工程副总裁罗森打了个赌,如果我们能减少 40% 的作弊,他就送我们四个家庭去夏威夷度假,后来罗森真的履约了。这个分类器设计得非常小巧(只用很小的内存),而且非常快速(几台服务器就能处理全球搜索的分类),至今运行得很好。 后来我和辛格一起又完成了许多项目,包括对中、日、韩文排名算法的改进。每一次,辛格总是坚持找简单有效的解决方案。这种做法在 Google 这个人才济济的公司常常招人反对,因为很多资深的工程师怀疑这些简单方法的有效性。不少人试图用精确而复杂的办法对辛格的设计的各种“阿卡47” 进行改进,后来发现几乎所有时候,辛格的简单方法都接近最优化的解决方案,而且还快得多。另一条选择简单方案的原因是这样设计的系统很容易查错(debug)。 当然,辛格之所以总是能找到那些简单有效的方法,不是靠直觉,更不是撞大运,而是靠他丰富的研究经验。辛格早年从师于搜索大师萨尔顿(Salton)教授,毕业后就职于 ATT 实验室。在那里,他和两个同事半年就搭起了一个中等规模的搜索引擎,这个引擎索引的网页数量虽然无法和商用的引擎相比,但是准确性却非常好。在 ATT,他对搜索问题的各个细节进行了仔细的研究,他的那些简单而有效的解决方案,常常是深思熟虑去伪存真的结果。 辛格非常鼓励年轻人不怕失败,大胆尝试。一次一位刚毕业不久的工程师因为把带有错误的程序推出到 Google 的服务器上而惶惶不可终日。辛格安慰她讲,你知道,我在 Google 犯的最大一次错误是曾经将所有网页的相关性得分全部变成了零,于是所有搜索的结果全部是随机的了。这位工程师后来为 Google 开发了很多好的产品。 辛格在 ATT 时确立了他在学术界的地位,但是,他不是一个满足于做实验写论文的人,于是他离开了实验室来到了当时只有百、十人的 Google。在这里,他得以施展才智,重写了 Google 的排名算法,并且一直在负责改进它。辛格因为舍不得放下两个孩子,很少参加各种会议,但是他仍然被学术界公认为是当今最权威的网络搜索专家。2005年,辛格作为杰出校友被请回母校康乃尔大学计算机系在 40 年系庆上作报告,获得这一殊荣的还有大名鼎鼎的美国工程院院士,计算机独立磁盘冗余阵列(RAID)的发明人凯茨(Randy Katz) 教授。 数学之美 十四 谈谈数学模型的重要性 http://www.google.com.hk/ggblog/googlechinablog/2006/08/blog-post_2006.html [注:一直关注数学之美系列的读者可能已经发现,我们对任何问题总是在找相应的准确的数学模型。为了说明模型的重要性,今年七月份我在 Google 中国内部讲课时用了整整一堂课来讲这个问题,下面的内容是我讲座的摘要。] 在包括哥白尼、伽利略和牛顿在内的所有天文学家中,我最佩服的是地心说的提出者托勒密。虽然天文学起源于古埃及,并且在古巴比伦时,人们就观测到了五大行星(金、木、水、火、土)运行的轨迹,以及行星在近日点运动比远日点快。(下图是在地球上看到的金星的轨迹,看过达芬奇密码的读者知道金星大约每四年在天上画一个五角星。) 但是真正创立了天文学,并且计算出诸多天体运行轨迹的是两千年前古罗马时代的托勒密。虽然今天我们可能会嘲笑托勒密犯的简单的错误,但是真正了解托勒密贡献的人都会对他肃然起敬。托勒密发明了球坐标,定义了包括赤道和零度经线在内的经纬线,他提出了黄道,还发明了弧度制。 当然,他最大也是最有争议的发明是地心说。虽然我们知道地球是围绕太阳运动的,但是在当时,从人们的观测出发,很容易得到地球是宇宙中心的结论。从地球上看,行星的运动轨迹是不规则的,托勒密的伟大之处是用四十个小圆套大圆的方法,精确地计算出了所有行星运动的轨迹。(托勒密继承了毕达格拉斯的一些思想,他也认为圆是最完美的几何图形。)托勒密模型的精度之高,让以后所有的科学家惊叹不已。即使今天,我们在计算机的帮助下,也很难解出四十个套在一起的圆的方程。每每想到这里,我都由衷地佩服托勒密。一千五百年来,人们根据他的计算决定农时。但是,经过了一千五百年,托勒密对太阳运动的累积误差,还是差出了一星期。 地心说的示意图,我国天文学家张衡的浑天地动说其实就是地心说。 纠正地心说错误不是靠在托勒密四十个圆的模型上再多套上几个圆,而是进一步探索真理。哥白尼发现,如果以太阳为中心来描述星体的运行,只需要 8-10 个圆,就能计算出一个行星的运动轨迹,他提出了日心说。很遗憾的事,哥白尼正确的假设并没有得到比托勒密更好的结果,哥白尼的模型的误差比托勒密地要大不少。这是教会和当时人们认为哥白尼的学说是邪说的一个原因,所以日心说要想让人心服口服地接受,就得更准确地描述行星运动。 完成这一使命的是开普勒。开普勒在所有一流的天文学家中,资质较差,一生中犯了无数低级的错误。但是他有两条别人没有的东西,从他的老师第谷手中继承的大量的、在当时最精确的观测数据,以及运气。开普勒很幸运地发现了行星围绕太阳运转的轨道实际是椭圆形的,这样不需要用多个小圆套大圆,而只要用一个椭圆就能将星体运动规律描述清楚了。只是开普勒的知识和水平不足以解释为什么行星的轨道是椭圆形的。最后是伟大的科学家牛顿用万有引力解释了这个问题。 故事到这里似乎可以结束了。但是,许多年后,又有了个小的波澜。天文学家们发现,天王星的实际轨迹和用椭圆模型算出来的不太符合。当然,偷懒的办法是接着用小圆套大圆的方法修正,但是一些严肃的科学家在努力寻找真正的原因。英国的亚当斯和法国的维内尔(Verrier)独立地发现了吸引天王星偏离轨道的海王星。 讲座结束前,我和 Google 中国的工程师们一同总结了这么几个结论: 1. 一个正确的数学模型应当在形式上是简单的。(托勒密的模型显然太复杂。) 2. 一个正确的模型在它开始的时候可能还不如一个精雕细琢过的错误的模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去。(日心说开始并没有地心说准确。) 3. 大量准确的数据对研发很重要。 4. 正确的模型也可能受噪音干扰,而显得不准确;这时我们不应该用一种凑合的修正方法来弥补它,而是要找到噪音的根源,这也许能通往重大发现。 在网络搜索的研发中,我们在前面提到的单文本词频/逆文本频率指数(TF/IDF) 和网页排名(page rank)都相当于是网络搜索中的“椭圆模型”,它们都很简单易懂。
个人分类: “人-书-博-文”系列|3671 次阅读|0 个评论
也说说“爱国”——看似简单、但水很深的话题
liwei999 2010-9-24 21:12
也说说爱国看似简单、但水很深的话题。 (2544 bytes) Posted by: mirror Date: September 24, 2010 02:15AM 这是应吴老师《我也来谈谈爱国到底谁才是真正的愤青》的文章( )。这个话题实际上很沉重。认为不是问题的人大约是不知道这水的深浅。这些年来,或者说从民国以来,文科、社会学科里基本上就没有什么象样子的学问和人才。因此,各种名词儿都会说几句,但是那意味着什么?在中国如何适用?基本上就没有下文了。 这个文科的落后是个隐性的,不象理工那样明显。镜某读书时代的最大刺激之一就是被告知汉语研究的最好水平不在大陆、不在台湾而在欧洲、日本。不服啊,二十岁的青年也不可能服。好在可以看到些东西,所谓不怕不识货,就怕货比货。一比较就有了高低了。也就愤不起来了。 中日的关系比较特殊。应该说当初大清国派留学生也都是中举的秀才、是精英。无奈民族这个事情在日本那里不是个问题,而在中国这儿有个满汉的问题。包括孙中山本人,他对他的革命究竟是为了解决民族问题还是政权(体)问题也都十分模糊。后来再来了一个共产国际,国人对国家、民族等就更糊涂了。但是糊涂人也有个糊涂智慧,一个中华民族的说法,也看不出来单数复数,就都给对付过去了。 在传统的国人文化里,氏族、地域、血缘的认识都有,而民族、国家就有些讲不清楚了。欧洲就比中国在对此问题的认识上发达些。这也是他们这几百年流血换来的智慧。第一次世界大战时,各国的无产者并不是联合起来了,而是各自为了自己的那个国家而相互残杀,国际歌、各国共产党根本就没有作用。列宁也算是聪明人了,但也解释不了此现象。 世上有很多知道、但说不上来的事情。比如说右,如何说明呢?,某一天镜某的孩子来问如何解释这个右字,令镜某感动了一整天。一般人也许就是用拿筷子的手来解释。用这个说法,10%的左撇子的存在就要被忽视了。有的字典上是用方位来解释。镜某的解说是面对北极星,太阳升起的那边是右。这算是第二个级别了吧。有没有更高的境界?与孩子讨论了一会儿。发现用物理法则可以定义左右。 什么年龄里多愤青呢?自己吃饱了全家不挨饿的人里出愤青。广州出的本田车是日货么?主张抵制日货的人不妨来给分析一番。大约还有更难的事例:比如USB存条的基本专利是东芝的,造很可能是台湾、韩国造的。这是否是日货?对这类问题的理解并不比量子力学简单。 说到现在中小学的教科书都把鲁迅赶出去了的问题,这是最近常有的话题。在镜某看来,这样来看问题、提出问题本身,就是有愤青嫌疑了。重要的是要有几类不同的教材可以让人们选择才是最重要的。吃菜都讲究要多样,为什么教科书就是单(少)样的呢?当然多样作会高成本。但是不高成本能是好的教育么? 什么是爱国呢?李鸿章的理解与孙大炮的不同,蒋介石的理解与毛泽东与汪精卫的也不同。在量子力学的时代里,哪个人是正确的似乎已经不重要了。要紧的是理解有这样多的不同状态,为解决现实的问题服务。而古典理论则认为李鸿章是卖国的,汪精卫不但是卖国的,而且还是汉奸卖国的。 就是论事儿,就事儿论是,就事儿论事儿。 http://www.starlakeporch.net/bbs/read.php?1,66743,66743#msg-66743
个人分类: 镜子大全|1875 次阅读|1 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-18 06:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部