科学网

 找回密码
  注册

tag 标签: 系统研究

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

国庆感想:从计算机系统研究视角看国家发展与社会治理
iKnow 2020-10-1 21:49
【2019年国庆假期曾预告会写一篇感想《70周年国庆,也谈“自信”》。又一年国庆节快到了,看到知乎上有一个问题“ 中国为什么能够变得强大 ”,借着这个问题,把去年国庆节作业给交了。题目改为《从计算机系统研究视角看国家发展与社会治理》。】 对于知乎上的这个问题,有很多种的答案。我的答案是—— 中国能够变得强大是因为执政遵循科学精神。 科学精神,就是要按客观规律办事,要实事求是。国家发展、社会治理有其内在的客观规律,谁违背了都会翻车。1978年改革开放以来,中国逐渐变得强大,这期间出现一系列方法和措施,比如“黑猫白猫论”、“摸着石头过河”、经济特区、改革试点……这些其实正是遵循科学精神执政的产物,这是由复杂的社会系统的基本特征所决定的。中国变强大的过程,就是一个复杂系统演进优化的过程。 当然,现阶段中国还存在很多问题,还需要不断改进和完善,但只要是遵循科学精神,相信中国会越来越好。 下面将从计算机系统研究角度来对上述结论进行论证与分析,核心思想有两点: 社会本质上也是一个系统,即社会系统; 社会系统可抽象为计算机领域广泛研究的分布式系统。 进一步得到如下推论: 社会系统拥有系统的共性特征; 分布式系统的CAP基本定理适用于社会系统; 计算机系统研究方法论适用于社会系统。 这些内容其实是2019年8月份在我们中心内部的一个报告《 从计算机系统研究视角看国家发展与社会治理 》。后来在计算所、中科院、清华以及华为等地方小范围交流过,包括一些国际学者(有政治学的),得到很多积极反馈。有鼓励写成一篇文章发表,但一直没有着手启动,借着这个问题把PPT和解读贴出来,作为答案先跟大家分享。 作为一位从事计算机系统研究的科研人员,深刻地体会到改造一个计算机系统的难度——“牵一发而动全身”屡见不鲜。当 从计算机系统研究这个视角去看国家发展、社会治理,会发现很多本质上是相通的、一致的 。这种“相通一致”是因为背后存在着本质联系。这个报告希望尽可能把这种联系呈现出来(文章比较有点长,图片有点多)。 目录 一、复杂系统 ① 典型的复杂系统 ② 地球上最复杂的社会系统 二、复杂系统的几个关键特征 ① 不确定性 ② 多维度信息 ③ 多目标 三、系统研究的原则与方法 ① 原则:区分目标与手段 ② 原理:分布式系统中的CAP定理 ③ 决策:民主集中制 ④ 实施:试错法(Trial-and-Error) 四、关于自信 ① 美国的镀金年代与“扒粪运动” ② 德国制造的起源 一、复杂系统 我自己的研究方向是计算机系统,所以看到一些复杂系统时,便会产生一种特别的共鸣。下面介绍几个典型的系统。比如, 由几百万个零件组成的飞机便是典型的复杂系统。 这是 波音787的发动机 ,每次登机经过发动机时,都会忍不住多看它几眼。 打开航空发动机外壳,里面是各种复杂的部件与管道。每一个细节,管道的粗细、弯曲的角度、扇片涂层的厚度……都汇聚了成千上万人的智慧,是人类经历了数十载摸索的结晶。 最近几年我的研究重心转到开源芯片,对处理器芯片设计关注更多。 处理器芯片可以说是一个相当复杂的系统 ,将它们放大几百倍,看上去像是一座座城市。 操作系统也是典型的复杂系统 。最新的Linux操作系统已经超过2700万行代码。多年前微软的Windows Vista源代码就已经超过了5000万行,而Windows 10的完整源代码树甚至包含了400 万个文件、50 万个文件夹,整个大小超过 500GB。 大型企业本身也是一个复杂系统 。比如华为,18万员工构成不同的部门,内部有各种流程支撑整个企业的运行。如何管理好华为这样的企业,发挥出企业的效能,其实和管理优化计算机系统是一样的,而且要比管理一个拥有18万台服务器的超大型数据中心要难得多——毕竟服务器是冰冷的。 每一座城市都是一个非常复杂的社会系统 。比如,北京有2500万常住人口,215万家企业…… 最后,让我们看看这个蓝色星球上最复杂的社会系统——中国,14亿人口、2.5亿辆车、2000万个法人单位、100万个医疗机构、30万所学校、4万个乡镇、5000条航线……看看这些数字,我想没有人会否认“ 中国是地球上最复杂的社会系统 ”这一结论。 从1978年到2020年,中国这个复杂的社会系统在40多年间实现了翻天覆地的变化,这背后必然有一些先进的要素在起作用。 这些“先进要素”到底是什么? 虽然有很多从政治学、社会学、文化、信仰等不同角度的分析,但作为一位研究计算机系统的科研人员,还是有一些不同角度的观察和看法。下面章节将会从复杂系统的特征、研究方法角度来分析与解读“先行要素”。 二、复杂系统的几个关键特征 复杂系统至少存在三个关键特征: ① 不确定性、② 多维度信息、③ 多目标 ① 不确定性是复杂系统的关键特征之一,这会导致系统行为难以预测。 一位物理方向的朋友说,两个物理的相互作用可以精确建模,比如氢原子模型,通过薛定谔方程求解得到的结果和实际测量得到的结果甚至能精确到小数点后十多位。 但是三个物体相互作用的行为却完全不可预测了,这也就是著名的 “三体”问题 了。 ② 复杂系统包含了多维度信息,不同视角观察,获取的信息也是不同 。我们经常用“盲人摸象”去形容一些人看问题片面,但其实面对一个复杂系统,几乎所有人都是“盲人”,我们很难保证所获得的信息就是全面的。因此 信息缺失其实是一种常态。 我很喜欢TensorFlow的logo,有人看起来像T,有人说看起来像F,并且都能坚信是自己亲眼看到的。从观察者各自的视角来看,确实都是合理的,只是他们都缺失了一个维度而已。因此,这个logo很好的展示了信息缺失的例子。 下面几个数学曲线更生动,我 第一次看到这个动图就感受到了一种不可抗拒的说服力 ,这是一种“大道至简”的美。一个国家、一个社会的复杂度,显然要比这些曲线大几个数量级,所涉及的维度也多得多,但却有那么多人坚信自己看到的就是“一切的真相”。 下面这张新闻图片,相信很多人都看到过。媒体在面向大众传播时,选择不同的角度,则能传递出完全不同的信息。最近几年 网络热点事件娱乐反转的情况屡次发生,都是因为原本缺失的信息不断被揭露造成的 ,相信大家都深有体会,比如去年的成都七中食堂事件、今年的苟晶高考顶替事件。 信息缺失会导致错误的判断与决策,进而付出代价、造成损失 。当一个企业CEO因错误信息而决策错误,其代价是商业失败;当一个球队教练因错误信息而判断失误,其代价是输掉比赛。 我们知道,媒体都是带有预设立场的,一般都是向大众传播符合其立场的信息。我自己平时还是尽可能地会去 多阅读一些不同来源、不同立场的媒体,让自己获得多维度的信息,希望能了解更接近真相的事实 。然而,今年的新冠疫情期间,尤其是2-3月份,整个西方媒体上充斥了各种扭曲的、片面的甚至虚假的信息,引导西方民众憎恨中国,Twitter上仇恨中国的言论甚至增加了900%。 这种现像也让我感到一些担忧。3月中旬在Facebook/LinkedIn也发表了评论和思考—— 如果一个社会的绝大多数人获取错误信息,那么代价又是什么?又有谁来承担? 事实上,其实实力最强大的美国,也有可能信息缺失而造成误判。2020年5月份的《经济学人》有一篇文章《完美误算》(Immaculate misconceptions),就认为自2019年5月15日以来美国对华为不断升级的禁令,其实反映了另一面—— 美国一开始对华为的措施未能得到期望的摧毁性打击,美国“完美误判”了华为的实力 。 ③ 复杂系统存在多目标,而且这些目标往往存在不同的优先级。 自己从事计算机系统研究,和需要业界专家也有很多交流,一个深刻的体会是 保障系统的安全可靠稳定是最高优先级,然后在此基础上再去追求性能,进而追求效率,追求设计优美。 其实社会系统的发展目标也是如此, 首先要保障一个稳定的社会,其次让社会高效地运转起来。 1992年图灵奖得主Butler Lampson写过 一篇经典的文章《Hints for Computer System Design》,对计算机系统设计提出了很多实践经验 ,很多对其他系统设计也有借鉴意义。比如文章中提到“Safety first”——In allocating resources, strive to avoid disaster rather than to attain an optimum( 应避免系统崩溃,而不是追求资源配置最优化 )。 在Lampson的文章中提到了他的一个观察,计算机系统中很难让资源利用率达到2/3,再高整个系统就很容易崩溃。因此, 为了让系统安全、稳定、可靠的运行,浪费1/3的资源是值得的 。有一段时间网上有人抨击每年国家数千亿的维稳开销,其实从系统稳定性角度来看,这个成本是可接受的。 一个社会系统也存在多种不同优先级的目标,可以和社会个体的需求建立起联系。我觉得 马斯洛需求金字塔是个体需求很好的刻画 。当一个国家的大部分人处于马斯洛需求的底部,还在为生存考虑,那么国家发展目标就是 解决大众的温饱 ;当一个国家的部分人开始追求归属感、需要得到尊重,那么国家发展目标就是 实现小康 。 中国是这个星球上最复杂的社会系统, 14亿人口发展并不平衡,马斯洛需求金字塔的每个层次都可能有上亿人口。 中国还有6亿人月收入1000,他们属于马斯洛需求模型的底层,是中国政府重点扶持的群体。但要帮助底层就需要牺牲一部分中层和上层人的利益,通过高房价、高税收等手段获得财政收入,再转移支付。也许80后90后这一代很多人大概都属于被收割的那部分群体,小两口两家4个老人一辈子挣的钱最后就转变为一套房子的首付。 党和政府对中国社会发展的主要矛盾判断是很清醒的,党的 十九大通过的章程中明确指出 —— 我国社会的主要矛盾是人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾 。只要存在发展不平衡,就一定会出现牺牲部分个体来换取整体系统的稳定。 从历史来看,每个时代都有一批人在为整体系统稳定性而做出牺牲 。1920年代有年轻人在英勇就义时高喊“让我们的子孙后代,享受前人披荆斩棘的幸福!”1960年代有年轻人为国防事业隐姓埋名几十年。1990年代下岗工人为了国企改革而重头再来……某种程度上,即使有牺牲,我们这个时代的群体依然是不同历史时代下最幸福的一代人。从我个人来说,如果我的“牺牲”能让这个社会更美好,能让子孙后代过得更幸福,也觉得值得了。 三、系统研究的原则与方法 这部分将介绍四方面内容: 原则:区分目标与手段 原理:分布式系统中的CAP定理 决策:民主集中制 实施:试错法(Trial-and-Error) ① 原则:区分目标与手段 当我们面对一个系统时,需求区分目标与手段。在计算机系统领域,经常会出现为了试一下新方法、新工具而去改造一个系统,但最终却不能达到预期效果。相反, 从现有系统的问题出发,设定改进目标,有针对性地选择方法和工具进行优化,往往更有效 。 社会系统也是如此,在世界范围内为了形式上的民主而去改造一个国家的例子很多,但却忽视了改变国家的根本目标应该是提供人民生活水平。和计算机系统优化一样,应该以提供人民生活水平为目标,从现有系统的问题出发,有针对性地选择方法与工具。 举一个例子:2015年新加坡副总理尚达曼与BBC记者的对话。 视频: https://www. youtube.com/watch? v=brAUYIlpZxs ② 原理:分布式系统中的CAP定理 2000年加州大学伯克利分校的Eric Brewer教授在分布式系统国际学术会议PODC上提出了一个猜想——在一个分布式系统中, 一致性(Consistency)、可用性(Availability)和分区容忍性(Partition tolerance) 只能同时满足两个。 这就是著名的“CAP猜想。2002年,MIT的两位学者 Seth Gilbert和Nancy Lynch证明了CAP猜想是正确的,从而升格为 “CAP定理” 。后来,Eric Brewer教授因为在分布式系统领域的突出贡献而当选美国工程院院士。 如今,CAP定理已经成为分布式系统领域的一个基础性定理,揭示了分布式系统中的三个根本要素之间的平衡,指导了各类分布式系统的设计,包括谷歌、微软、阿里、腾讯等互联网企业的数据中心应用。2012年Brewer教授又写了一篇很经典的 CAP定理12年回顾 ,推荐感兴趣的朋友一读: 推荐文章: CAP理论十二年回顾:规则变了 我一直对CAP定理很感兴趣,也有一些研究。一个如此简洁的定理,却能揭示出分布式系统中如此深刻的原理,让我无比钦佩Eric Brewer教授深邃的洞察力。2016年4月下旬在台湾出差,和当地民众和出租车司机聊得比较多。那段时间整好又把Eric Brewer教授的那篇《CAP理论十二年回顾》读了一遍,忽然产生一个产品—— CAP定理似乎也是适用于政治领域的! 当时随手记录在了朋友圈中。 本质上, 社会系统也是一个分布式系统,每个部分利益政党代表一部分人的利益,那就是一个社会系统中的一个分区 。因此,CAP定理是确实适用。随后,我把CAP定理稍作修改,形成了所谓的政治领域的“CAP猜想”(具体如上图)。 我也将这个“CAP猜想”和多位学者交流过,包括政治学领域的国际知名学者、计算机系统领域的专家,大家都认为这是一个听起来很有道理的猜想。(但如何严谨地证明,暂时还没有好的思路,打算后面再找个长假期来整理一下) 政治领域的CAP猜想,能很好地解释当前各个国家的政治状态。几个例子: 在多党派且存在不同利益的情况下,要想先达成共识再行动,那几乎就等于无法付诸行动; 如果强制采取行动,那么就会导致争议甚至引起社会撕裂,就像现在美国特朗普总统一系列举措带来的社会撕裂效应; 中国的一党制,反而更容易达成一致从而付诸行动。 正如Brewer教授在《CAP理论十二年回顾》中提到, 分区是因为无通信或通信延迟过长而产生的 ,反而过来说,如果有高效的、低时延的通信,那么不会出现分区了,就像在一个数据中心内部就可以被认为不存在分区。延申到政治领域,可以理解为—— 如果存在有效而顺畅的沟通机制,那么就不会出现多个党派 。 可以举一个沟通消除分区的例子:美国的 CECC(Congressional-Executive Commission on China) 是一个专门针对中国的委员会 ,其成员有民主党和共和党共同组成 。 CECC就是一个两党在对华政策上的沟通平台 ,从而使得在诸多事务上如此分裂的两个党,却能在对华政策上基本保持一致。这说明了有效通畅的沟通机制是能消除分歧的,能实现快速达成一致并付诸行动。 在中国, 在建国之时就从制度上、组织结构上建立了多个有效通畅的沟通平台 。全国人大、国务院、中央军委都有各自的沟通和议事平台,可以看作是三条纵线。但因为中国共产党是唯一执政党,因此形成了一条横向的线,通过党将三条纵线都衔接起来。中央政治局则是这条横线上的沟通和议事平台,商议决策国家重大事务。 这几个有机融合、横纵交织的沟通平台,为快速达成一致并付诸行动提供了保障。 推荐资料: 全国人大历次常务委员会 国务院历次常务会议 中央政治局历次会议 ③ 决策:民主集中制 有效通畅的沟通平台并不是高效正确做事的充分条件,还需要有好的决策机制。 从计算机研究角度来看, 因特网发展历史上有一个关于IP地址位数决策的经典案例 。2011年,图灵奖得主Vint Cerf在一篇文章中回顾了这个故事:1973年,两拨人关于IP地址应该选多少位争论了近一年!有人建议32位,容易实现;有人建议128位,容量大;有人建议可变长,灵活性高。大家都无法达成一致,导致无法推进实验部署。 Vint Cerf意识到不能再让大家争论下去了,必须要有人拍板。作为项目经理, 他最终做出了决定——先采用32位IP地址做一下实验 。于是,因特网的建设终于能往前推进了,而这个实验一直延续到了今天。 IP地址位数的决策过程其实就是一个民主集中制,也是中国各级政府普遍采用的一种决策机制。 从这个故事来看,民主集中制是由其先进性的。它本质上是一种混合机制,如果运用得好,是可以将民主的优势和集中的优势都发挥出来的。当然,在中国民主集中制的优势还有很大空间可以去挖掘。 ④ 实施:试错法(Trial-and-Error) 在具体实施和执行层面,由于系统的复杂性和不确定性,不可能等想清楚了才行动,这一点在科研活动中尤其明显。因此我们会 采用“试错法(trial-and-error)”,通过不断实验寻求达到目标的途径。这是探索未知的一套行之有效的科学方法。 事实上,中国政府也广泛地采用“试错法“推进各项改革措施——在中华人民共和国中央人民政府网站( http://www.gov.cn )上,可以 搜索到48000余条在各部门、各地方开展的改革“试点”措施! 每一个试点单位在试点期结束后,需要提交试点措施报告。如果成功了,那么就可以在更大范围内推广;如果不成功,也会积累一些经验与教训。 试点,正是小平同志“摸着石头过河”的精髓所在,是一种具有科学精神的执政方法。 四、关于自信 过去40年,中国取得了长足的进步,但仍然存在很多问题。但一个复杂系统不能不存在问题,它一定是在迭代中不断优化、逐渐完善起来的。作为一位科研人员,当看到中国共产党、中国政府治理国家的方式和科研中所采用的方法有很多相通之处时,第一感觉是不可思议,同时也会产生强烈的好奇心想去了解更多中国的社会治理模式。随着对党和政府的历史使命、思想理论、组织模式、实践方法等方面越来越了解,我也确实越来越认同“四个自信”。 另一个角度来看,中国今天经历的问题,其他国家也都经历过。比如下面两个国家: 历史总是惊人地相似,今天我们国家的发展之路,几乎是100多年前美国的翻版。当我们对国家、对社会、对人生、对工作困惑迷茫时,找找历史这位导师。 “不是所有的改变都能被感知”。也许很多人感知不到国家是如何通过一系列小的变革推动一个行业的改变、推动国家的变化,但请相信它们每天都在发生。正是这样一个个许多人感知不到的小改变,我们每个人都参与其中的小改变,才让中国变得强大、变得更好。
0 个评论
博文短评两则——对社会管理领域的反思、研究和变革刻不容缓
pww1380 2011-8-7 17:31
博文短评两则—— 对社会管理领域的反思、研究和变革刻不容缓 杨文祥 1 .我们在社会管理上过度关注的是眼前的政绩,严重缺乏的是着眼于长期发展和全球战略的宏观思维。 根据历史的经验和长期的观察,不对当代中国社会的社会管理领域进行全面深入的历史反思、全面系统的科学研究和全面深刻的社会管理改革就无以进行社会管理创新,更不可能根本扭转目前这种在社会管理实践上——即事实上而不是仅仅在文字上——缺乏宏观思维及相应的长期发展战略和全球战略的被动状态。 显然, 在社会管理上没有宏观思维,在管理实践上没有长期发展战略和全球战略的国家是不可能成为真正的世界大国的。当然,更不可能成为具有现代文明的世界强国。 ——阅读杨学祥《 中国原油对外依存首超美国: 7 年前的警告被忽视 》 http://bbs.sciencenet.cn/home.php?mod=spaceuid=2277do=blogid=471595 2 .社会和官场中 报喜不报忧 这一恶劣风气源自于中国官场长期以来 急功近利好大喜功 的主流心理。这一 病态心理和官场歪风伴随左倾思潮 已经在中国官场狂吹了半个多世纪之久,给中国社会和中国人民带来了无穷的灾难。上世纪 50 年代末 60 年代初导致全国非正常死亡数千万人的天灾人祸和灾难深重的文革内乱是这些灾难的极端形式。由于我们对产生这些灾难的社会原因反思不力,导致产生这些灾难的社会病灶至今犹存。 最近 温州动车事故绝非孤立的和单一的个别事故,而是这一具有普遍性质的官场痼疾不时发作的典型病例。 因此,温州动车事故 再一次为我们敲响了警钟: 对社会管理领域的全面反思、系统研究和深刻变革已经刻不容缓。 ——阅读杨学祥《 温州动车事故暴露铁路管理漏洞:只听喜报不听警报 》 http://bbs.sciencenet.cn/home.php?mod=spaceuid=2277do=blogid=472081
个人分类: 栏杆拍遍(Facing the Distressing Landscape)|2604 次阅读|0 个评论
我的科研感悟2:系统研究适用于领域发展早期阶段
whitesun 2010-11-22 01:19
今日有幸看到张子柯和周涛两篇博文: 1. 社会标签网络建模:基于超图结构的网络增长模型 ; 2. 利用协同标签,解决冷启动问题 . 这促使我思考自己研究如此之累和难的一些原因。 事实上,我对标签相关研究也有所了解,也看过不少协同过滤方面的论文,也研究标签利用问题。目前主要是以开发系统的方式研究相关问题,实践中,涉及到标签的捕获、表示、组织以及利用等问题,可以说系统需要什么,就去了解什么、研究什么。这实际上就是所谓的系统研究。然而,人的精力总是有限的,如果把精力分散到解决一个大问题的各阶段或各部分,如果不是开创性的研究,那么研究结果往往不会令人满意。对于研究时间较长的推荐系统领域,这种研究方法其实不可取。而我却犯了这一大忌,把精力主要投在如何实现一个系统上,没精力投到一个问题上,在研究上主要表现为只是发了些想法级的论文。 对于个人而言,系统研究适用于领域发展早期阶段,并不适合于已经有较多人研究的领域或方向,否则很难将问题做深入。对于我来说,目前已经算是研究推荐系统这一方向,应该把握该领域的关键问题,而非研究如何做一个系统,就是要研究也的去一些大公司研究,否则自己弄个小小的原型系统,很难进行高水平研究。
个人分类: 有思有考|117 次阅读|0 个评论
作物遗传育种学上的应用基础研究最佳模式:大规模和系统
lry198010 2009-9-30 11:43
今天,听了一个来自Exelixis(http://www.exelixis.com/about_history.shtml)高级科学家的报告,报告主要介绍了他们基于反向遗传学进行基因功能发掘系统的组成和应用。他们以这一套系统为基础,以拟南芥为分析对象,通过插入构建增强子、knock out ,超高量表达系统,对拟南芥的2万5千个基因都构建的突变体。以这些突变体为材料,挖掘了大量基因的功能。他们工作的高效,让我印象深刻。我觉得,要想做应用基础研究,不能急于求成,要把相应的基础建立好,比如说,做了一把芯片,就要发行成百上千的有用基因。应用基础研究应该是一项系统的工作,需要把各种方法有机综合起来一起进行。根据Exelixis的报告,对于生物学的应用基础研究来说(作物)应该包括: (1)高效的材料构建、获取、筛选方法和策略,只有这样,我们才能进行长期系统高效进行研究。研究材料的搜集包括:自然变异材料的搜集,这对国际上的大种子公司很有用。而对于一些新进入的公司则以创造材料为主。一句话来说就是:有材料要进行系统基础研究,没有材料就是创造材料也要进行系统的基础研究。 (2)成熟的性状分析系统,这些系统包括气象色谱、液相色谱仪等。以后性状的考察和筛选方向肯定是往细的方向发展,像目前所关注的株高、产量等将有可能被基于代谢组学的组分含量等性状所代替而成为主流。这里,我暂称之为新一代的性状考察技术。 (3)要有成熟的数据分析系统。这些系统包括数据的高效录入、高效管理和分析展现,更重要的是要有强大的数据整合能力。能把DNA水平的,转录组水平的,代谢组水平的,蛋白质组水平的,田间试验数据的,不同年份株系的表型数据等整合起来一起进行分析。 从技术的角度来说,做作物的应用基础研究应该有这三大成熟的技术: (1)高效的转基因技术,这样就可以对发掘的基因进行功能的验证等研究,把新发现的基因导入作物里从而成为有用的新育种材料 (2)高效的组培技术,才能在更短的时间里培养出符合要求的材料,这些材料不管是从转基因来的,还是通过杂交或融合而来的。 (3)高效的标记筛选技术,最好有robot进行全自动的基因标记筛选工作。
个人分类: 未分类|4644 次阅读|2 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 11:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部