科学网 › 标签 › 众包

标签: 众包

相关帖子	版块	作者	回复/查看	最后发表

没有相关内容

相关日志

科技界12位跨界人物排行榜: 热度 7 zhangjiuqing 2016-8-8 19:22; 科技界 12 位跨界人物排行榜从美女海蒂到宅男牛顿，从中国的顾毓琇到世界各国的科学界名人，这篇文章为你简单介绍这些科技界的跨界明星，以及他们的故事和业绩。什么是跨界？不会说单口相声的演员不是好歌手，不会做衣服的厨子不是好司机。跨界是个全新的事物吗？当然不是，从人类开始劳动开始，跨界就存在了。打猎的男人不能只打猎，还得采摘野果，还得刀耕火种。在家的女人也不能只生儿育女，还得喂养牲畜，纺纱织布。随着社会的发展，专业分工出现了，很多人被限定在自己熟悉的领域里，边界似乎越来越清晰，跨界反而成了稀有的难事。这些年，随着互联网等新兴产业的崛起，跨界复苏了，成为了时髦流行的词汇，例如，跨界思维、跨界营销、跨界歌王，等等。从科学技术的发展历程来看，早期科学成就是业务爱好者跨界的结果；后来科学研究逐渐成为一种职业，科学家也越来越被局限在一个狭窄的学术领域中。现在，科学技术交叉融合，科学家的跨专业跨领域的合作越来越多。特别是互联网技术随时随地把人们连接起来，催生了一种新的科研模式：科研众包。科研众包平台（例如研发邦网站 www.yafaband.com ）为科研人员跨界提供了极好的机会：完成组织内人才无法胜任的工作是任务委托方的最终目标，而不管接受任务的人的专业背景、单位性质、年龄大小。跨界将原本就思维开放活跃的科研人员，在摆脱了限制之后，也能在自己的专业领域之外发挥新的作用。科研人员在科技研发领域内的跨界比较常见，有的科研人员跨界幅度更大，从科技界跨出界外或者从界外跨进了科技界。以下是我所知道的 12 位有名的跨界科学家：第 12 位：海蒂。海蒂·拉玛是一个好莱坞的女演员，自认是“比我聪明的没我美丽，比我美丽的没有聪明”。不过，因为“美貌盖过了演技”，演了很多角色从未获奖；她虽然和一位作曲家一道发明了“扩频通讯技术”并获专利，却未在当时得到应用和承认，令人嘘唏。第 11 位：玻尔。这个玻尔是哈那德，不是尼尔斯。哥哥尼尔斯是量子力学的奠基人，比弟弟哈那德在科学建树上更为有名。哈那德是剑桥大学的数学教授，主要研究周期函数，但他跨界作为丹麦国家足球队的一位队员，参加了 1908 年夏季奥运会并帮助球队获得亚军。第 10 位：顾毓琇。中国科学家在跨界方面毫不逊色，顾毓琇可作为这个排行榜的代表人物。顾毓琇身上的头衔包括科学家、诗人、戏剧家、音乐家、教育家等等。作为科学家，他在电机自动控制方面有过重要贡献；作为诗人，他创作过七千多首诗词；作为戏剧家，他创办了上海戏剧专科学校；作为音乐家，他担任音乐学院的院长；作为教育家，他在浙江大学、清华大学等多大学创办过电机系。第 9 位：李约瑟。李约瑟在中国比较著名，是因为那个“李约瑟之问 ” ：近代科学为什么没有在中国产生？李约瑟原本在剑桥大学从事化学胚胎研究，当选皇家学会会员；后受中国女留学生的影响，改行跨界研究中国科技史，历时四十多年撰写多卷本巨著《中国科学技术史》。第 8 位：薛定谔。薛定谔在科学上的最大贡献是在 1925 年与情人出轨幽会时，写出了量子力学的波动方程，并因此在 1933 年与狄拉克分享了诺贝尔物理学奖。他早年对印度哲学、性经验研究有着极大的兴趣；他让一只猫成了物理学家争论不休的话题；他从物理学跨界到生物学，撰写了《生命是什么》这本 20 世纪颇有影响力的科学著作；出版有自己的诗集。第 7 位：孟德尔。孟德尔从 32 岁开始在修道院上班，一直做到修道院的院长。他的最大成就是在业余时间取得的，通过长时间的种植实验，观察到食用豌豆的生长特性，发现了植物遗传的三个定律，在 43 岁时提交了论文。不过这些论文的科学价值，在他去世后 16 年后的 1900 年才得到承认。第 6 位：巴丁。巴丁和肖克利、布拉顿一起，因为在贝尔实验室里发明了晶体管，共享了 1956 年的诺贝尔物理学奖；他从企业研发实验室跨界到大学，从晶体领域跨界到超导领域，和库珀、施里弗一起，因为建立了揭示超导本质的微观理论，共享了 1972 年的诺贝尔物理学奖。第 5 位：霍夫曼。罗纳尔德 . 霍夫曼因为通过分子轨道对称守恒原理来解释化学反应的发生，在 1981 年与福井谦一分享诺贝尔化学奖。霍夫曼发表过多篇散文，出版过诗集，创作过剧本。与卡尔杰拉西（发明口服避孕药的科学家，也是跨界大师，写有小说《诺贝尔奖的囚徒》）合作的《氧：关于“追认诺贝尔奖”的二幕话剧》非常出名。霍夫曼担任过电视科普片《化学的世界》的主持人。中国汶川地震后，霍夫曼还与人合作发行了韦唯歌曲《爱的奉献》的英文版。第 4 位：鲍林。作为科学家，鲍林创建了化学键理论，是分子生物学的早期创建人，获得了诺贝尔化学奖；作为政治活动家，他坚决反对核试验，获得了诺贝尔和平奖；晚年他再一次变身为医学家，建立医学研究所，试图证明并大力宣传维生素 C 能治疗感冒。第 3 位：西蒙。西蒙能在心理学、管理学、计算机科学等领域自由驰骋，随意跨界，并都做出了突出贡献。 1958 年，他获得美国心理学会颁发的杰出贡献奖； 1975 年，获得计算机领域的最高奖—图灵奖； 1978 年，获得诺贝尔经济学奖； 1986 年获得美国管理科学特别奖。第 2 位：爱因斯坦。爱因斯坦从大学毕业后，在苏黎世担任初级专利审查员，负责对各种装置的实用性进行审查并作出鉴定。他不满足于工作，利用业务时间钻研科学，在 1905 年写出划时代的三篇论文：一篇分析液体中悬浮颗粒的布朗运动，成为分子存在的证据之一；一篇提出光电效应的光量子假设，并因此获得诺贝尔物理学奖；一篇给出了狭义相对论的最初表述，改变了牛顿的时空观。他和一位物理学家还研制发明过一款冰箱。他写信给罗斯福总统建议制造原子弹，使他成为政治人物。只要他愿意，他能当上以色列首任总统。第 1 位：牛顿。牛顿因为微积分的发明成为剑桥大学的数学教授；研究光学发现七色光；研究力学，提出运动三大定律；研究天文学，提出万有引力定律；研究炼金术，试图把贱金属炼成贵金属；担任过皇家造币厂厂长，起诉造假币者；担任过皇家学会会长，从事行政管理工作。各位读者读完以上的文字后，肯定也会有自己心目中的跨界科技人物排行榜（亚里士多德、达芬奇、富兰克林、费因曼、萨根、沈括、苏步青，等等），不妨以留言或者文章方式回复在这里（排位、姓名、简单描述）。回复方式举例：第 6 位：罗蒙诺索夫，俄罗斯科学家，精通化学、物理、金属学、采矿技术都能，跨界教育、语言学、历史和文学。本文首发于微信公众号“研发邦” 。; 个人分类: 生活点滴|4869 次阅读|9 个评论

智能手机营造的公民科学众包平台: 热度 10 lionbin 2016-4-9 10:30; 曾经，我们有个常识，电话是两个无法见面的人进行实时交流的工具，电脑则是可以安装应用程序来进行计算的工具。不久之后，电脑发展成实验室不可或缺的工具，电话则为了方便人的使用发展成一种移动设备。在学术会议上，一些讲座经常被电话打断，移动电话迅速成为学术界诟病很多的对象，甚至许多人认为移动电话给学术研究带来了负面影响。智能手机问世后，电话与电脑的角色开始出现相互替代的现象，人们似乎更喜欢用电脑来与他人进行交流，而移动电话的通话功能已经不是第一位了，也可以运行一些非常炫、非常酷的强大应用程序了。而且，随着智能手机应用程序越来越多，它已经演变成一个多功能工具，甚至许多是科学家和研究人员必备的应用程序。基于智能手机的移动计算平台，正在进入我们的实验室。那么，这究竟是一个非常糟糕的现象，还是正在演义一个新的童话故事呢？在我之前的一篇博文中，曾介绍了荷兰天文学家Frans Snik开展的iSPEX项目。十年前，Snik发明了一种简单的光学装置，可用于测量粉尘、烟尘和其他粒子或气溶胶的密度，以及大气中影响人类健康和气候的各种粒子。当时他发明这个装置是希望有朝一日能用于探测卫星上。2011年，Snik尝试制作了一个可在iPhone上测定这些粒子的装置——通过将入射光转换为包含各种极化信息的光谱并传递到相机中进行测量。他于是就想到，如果利用这种技术让成千上万的人同时进行测量会是什么效果呢？2013年，Snik及其莱顿大学的同事就开始馈赠或出售这个光学器件，并取名为iSPEX，结果引起了全国八千多名iPhone用户的关注。操作方法很简单，用户只需要在iPhone上安装一个附加的光学设备并对着天空拍摄就可以了。仅仅一天之内，大量众包光谱数据就从四面八方汇集到在线数据库中，可用于大气状况的分析，让整个荷兰这一天对大气颗粒物的测定分辨率达到了前所未有的水平。 Snik等之后还在地球物理学研究快报（Geophys. Res. Lett.）上发表了一篇论文报道此事。与几年前计划要发射的卫星相比，iSPEX项目的成本只占卫星计划的很小一部分。他们研究小组得到了欧盟更多的赞助，并在欧洲11个城市继续开展类似的探索。智能手机内置各种传感器，如摄像头、麦克风、加速度计和气压计，如果有一些好的应用程序配合，相信能在公众参与下获得高品质数据。许多研究人员试图寻求通过智能手机来进行科学研究的方法，希望招募更多的公民科学家们用智能手机来收集数据。在现代社会，借助于社交媒体招聘参与者并不复杂，但仍然是非常耗时的。Snik等在开展iSPEX项目前的启蒙计划宣传，覆盖了荷兰媒体，这吸引了数千公民发送参与请求。然后，他们与荷兰阿默斯福特的慈善肺脏基金会合作，基金会的摇旗呐喊也获得了同样数量的参与者，这些支持者都是关注气溶胶对健康影响的人们。即便如此， iSPEX的研究人员也还是花了一年半的时间进行众包宣传和普及工作，包括产品说明书、视频教程、张贴海报，通过在线出版物呼吁社交媒体支持，其中还要回答各种各样的问题。但他们的努力得到了回报，他们收到了超过6000份意见书。获取众包数据的技术，对大多数研究者来说也是比较棘手的。将智能手机转换为公民科学的数据采集工具，很可能需要一个相应的应用程序（APP），还可能涉及到设计和制造硬件配件或附加组件。如果一个研究者知道如何编写APP，或者能制造出一种廉价的硬件扩展，那是最好的。但一般的研究人员并非熟练的程序员，只能寻求其他方面的帮助，网上有很多帮助研究人员写应用程序的高手。Snik等就是找到荷兰DDQ公司来帮助制作这个针对公民科学的应用程序的，但这需要更多的资金。如果研究人员缺乏第三方支持的资金，那么只好自己学习编写APP了，其实也不是一件困难的事儿，因为现在网上能找到许多免费的在线教程和论坛。比如，世界上最流行的移动设备操作系统谷歌安卓，就是由一个开发社区提供支持的，可通过教程和指南来实现特定功能。第二个最流行的移动操作系统苹果的iOS，也有类似的社区称为苹果开发者论坛（Apple Developer Forums），微软有微软虚拟学院（Microsoft Virtual Academy）。还有Alison这样的网站提供免费培训，帮助新手开发应用程序的整个编写过程。无论研究目标是什么，最好先从基础做起，然后慢慢增加新的功能，最后实现自己想要做的事儿。为智能手机制作附加组件是另一个重要挑战，但这样的设备一般不能太复杂。2014年，澳大利亚国立大学Steve Lee等在智能手机摄像头上安装一个豌豆大小的镜头（成本不到1美分），就可以让放大系数达到160倍，这其实就是一个低倍显微镜了。无独有偶，SCiO是一个独立的近红外光谱仪，由以色列的一家初创企业所开发。该设备可对一些材料进行扫描并提供相关的分子信息，然后通过蓝牙无线技术连接到智能手机上。研究者还需要决定选择哪一种软件平台。Snik等选择了流行的苹果iOS，因为iPhone机型之间具有物理相似性，使得它更容易设计一个兼容的插件。安卓系统虽然有其优势，但在不同机型兼容性上问题比较多。研究人员还必须准备一个可以容纳海量数据的数据库。如果在全球范围内发布一个应用，可能很快获得了超越预期的数据，这时候可以考虑一些云平台。一旦收集到大量数据，对数据的可靠性判定成了一个新的挑战。加州大学欧文分校粒子物理学家 Daniel Whiteson等曾开发了一个应用程序CRAYFIS（从智能手机中发现宇宙射线），希望利用智能手机让用户观察和记录高能宇宙射线撞击地球大气层的颗粒物残留。如果在一公里半径内几百部智能手机同时检测到信号或光点，应用程序就将这个事件记录为宇宙射线簇射。如果在一定半径中有更多的光点，那么初级宇宙射线的能量就越大。不过，也有可能这些同步光点来自地方，包括探测器噪声或环境光。Whiteson等为了排除这些问题，就同时记录光点时间和地点的元数据。如果一部智能手机知道放置在某地进行记录，研究人员就能够确定环境光和噪声来源，使真正的宇宙射线信号变得更明显。全球超过15万人登记加入该研究。研究人员希望在正式发布APP之前，要对影响性能的问题进行更多的测试，以免之后将热心的参与者赶走。据说目前正在1000多部手机上进行测试。利用智能手机众包来收集数据，尽管存在这样或那样的问题，但对研究人员来说还是特别具有吸引力，因为许多有关数据收集的问题是可以克服的。比如，从家用电子产品中获得有关大地震的数据是非常具有吸引力的，也是容易做到的，其中的一个主要障碍，是建筑业主害怕研究人员据此发现有关建筑安全方面的问题。总之，想利用智能手机进行研究的科学家，首先需要评估某个设备是否能获得他们所需的测量值。然后，就需要确定采用哪种软件平台，并在被正式用于收集数据前尽可能消除错误或bugs，之后，还应确定如何过滤无效数据。另一方面，需要找到招募参与者的好方法。正如智能手机已经成为许多科学家的日常生活不可或缺的一部分，他们也可能被证明是一个好的实验工具。如果政府将想投资建设新型的基础设施进行数据收集，也许可以考虑智能手机平台，因为这样的基础设施其实已经建成，而且非常强大和灵活。虽然这个巨大的平台已经存在不少时日了，但真正思考如何用于科学研究才刚刚开始。参考文献 Technology: Smartphone science, Nature 531, 669–671 (31 March 2016) doi:10.1038/nj7596-669a The scientist and the smartphone, Nature Methods 7, 87 (2010) doi:10.1038/nmeth0210-87; 个人分类: 一起读顶刊|15145 次阅读|24 个评论

人类计算（续）：人类计算系统进化历程与挑战: 热度 2 lionbin 2016-1-24 10:32; 有关人类计算（Human computation）这个概念，我接触已经有一段时日了。上周末，终于有时间将自己的认识与有关知识进行整合，成为一篇博文“ 人类计算：人类认知与机器的互联 ”。在撰写这篇博文中，顺便检索了一些资料，现在整理这些资料，又是一次愉快的阅读之旅。 Science 周刊的网站，今年开始改版了，条目编排更加清晰，字体搭配更加和谐。总之，我喜欢！而就在元旦出版的新年第1期中，发表了一篇题为 “The power of crowds”（众人的力量）的文章，也是谈论与人类计算有关的话题。文章介绍了人类计算系统进化的基本历程，借助一些人类计算项目中著名的故事，探讨了如何联合人类和机器的力量解决世界的新难题，或者是历史上遗留的一些棘手问题。为了让我们能更深刻地理解这篇文章，还是先按照作者的行文顺序，介绍一下人类计算系统进化的三个历程（图1）：图1 人类计算系统的进化（Pietro Michelucci, and Janis L. Dickinson, 2016）（A）微任务化（microtasking）：众包（crowdsourcing ）一般将一个复杂的大任务分解成许多微任务（microtasks），称为微任务化，每个人都能参与完成一部分工作。这些微任务一般是机器所欠缺而人类所擅长的东西，比如借助了人类高超的视觉感知能力对图像进行分类。这样通过友好的用户界面将分解的微任务交付给一大群人来完成，然后将获得的数据聚合后进行下一步处理。例如，美国普林斯顿大学的神经科学实验室在开展一项名为Connectome的科学研究，其最终目的是解开人类大脑之谜。在项目执行过程中，就开发了一款名为EyeWire绘制大脑神经元网络的在线游戏，通过将神经细胞三维图像化的过程制成游戏，玩家需要通过从大型三维显微图像数据集中分离单个细胞来绘制结构和相应的神经元连接，并将其涂色，从而完成复杂脑神经图的三维图像，帮助研究人员探讨人的神经元细胞的连接关系，如何影响人的情绪、反应以及如何造成与神经相关的疾病等。这一过程对普通人而言是非常简单的，仅需具备一定的图像、空间识别能力，通过鼠标移动、点击等操作便能完成，但这个过程对目前世界上运算速度最快的超级计算机也是一件难事。所以，Eyewire的宣传语上说：解决大脑的奥秘，我们需要比超级计算机更为强劲的能力，那就是你。该游戏吸引了145个国家的165000多名公民科学家（玩家）的参与。这种让人们用游戏的方式参与到严肃的医学研究中，在人们在享受玩游戏乐趣的同时，还能为科学研究做贡献，真正成了有些科学大佬所说的“玩”科学。这个工作第一次提供了哺乳动物视网膜的神经元结构和组织如何产生检测运动的功能。视觉微任务化还被用来加快医疗分析，例如MalariaSpot项目，其中有22个休闲游戏玩家参与计数寄生虫，而他们工作的质量正如一个训练有素的病理学家那样准确。还有项目将居民贡献的照片拼接起来，决定在扑灭一场森林大火中从什么地方喷水更有效。显然，微任务化非常适合于一些问题，它们可以通过重复应用相同的简单过程来解决一个更大数据集的每一个部分，如上面列举的几个例子。但是，微任务化本身在处理一些棘手问题时也是有些力不从心的，比如有关气候变化、疾病、和地缘政治冲突等问题。因为这些问题是动态的，涉及到多重、交互的系统，需要丰富的全局知识体系，进行多步推理和创造性抽象才能获得一个新的减缓策略。相信未来的人类计算生态系统有巨大的潜力来帮助解决这些棘手问题，但目前正在不太棘手的环境中进行探索。（B）工作流程（workflow）：将复杂工作流程分配给众多参与者，每个人在各步的作用就是在前一个参与者的基础上使用和增加更多信息。直到最近，由于缺乏支持性基础设施，超越简单微任务的系统不得不从头开始创建。今天，工作流工具出现了加速发展，并改善了人类计算系统的可靠性。设计日益复杂的系统还需要增加对人机反馈环的理解。例如，系统可以设计为增强人的贡献。CrowdCrit就是这样的情况，可为用户的图形设计提供专业评价，就是利用了人的输入去指导计算机实现更高效的工作。它通过将领域知识构建到工作流程中，可让非专家参与者通过指导可提供类似专家的反馈。在CrowdCrit中，计算机增强了人类的能力，但反过来也是可能的：人类的输入可指导计算机变得更加有效，正如在交互式遗传算法中所看到的，其应用自然选择的过程开发出新的解决方案。这些算法变异、重组和修剪成各种候选解决方案，以确保各思想的每一个连续世代都比之前的有所改进。然而，在真实世界的应用中实现这种算法通常需要各种场景的知识和挣脱机器限制的认知能力。通过人类的努力做到电脑不能做的步骤，如生产、结合和评估想法。（C）解决问题的生态系统（problem-solving ecosystem）：在营造解决问题的生态系统中，研究人员正开始探索如何把许多人类的认知过程与基于机器的计算结合起来，建立复杂的可信模型，这样构建的相互依赖系统，成为解决世界上最具有挑战性问题的基础。这些系统的原型提供了在线工作空间，允许参与者参与开放性活动，在现实世界中他们可贡献、结合、修改、连接、评估、并在一个共同的分析框架内集成数据和概念，在某些情况下，定制或采取行动。例如，数学家合作的在线平台“博学项目”(Polymath Project)帮助证明了一个长达80年之久的数学定理，以及面向大众的精细化新闻制作系统（ePluribus Problem Solver）只是根据分发给普通公共参与者的少量照片就产生了一个真实的准确性和构建良好的新闻文章。在这两个案例中，不同的参与者合作产生了具有实时集体智慧的新洞见，及时地交流思想创造出新的知识。而不是先收集人类的输入，然后再处理。人们串联起来，各自独立的工作，从群体社区中获得新奇的观点，并允许多个可见的解决方案。在Polymath Project中，人类贡献者坚持建立一系列基本规则，而在ePluribus中，计算机程序及其用户界面加强了这个基本规则。文章中还说，这些生态系统承诺可以更有效地应对灾害以及长期棘手问题的挑战，如气候变化和地缘政治冲突等。人类计算需要与传统的计算机科学有所区分，并且能从基于对人类认知、动机、错误率和决策理论的集成理解的设计方法中受益。文章认为，在大多数人类的计算系统中，少量的参与者做大部分的工作。鉴于这种不寻常的工作分配，我们需要提高我们的认识，如何募集和保持最多的参与者，增强技能开发，让参与者对项目的总体贡献最大化。人类输入、信息共享和基于机器的协同处理工作对于效率最大化来说可能是更具挑战性的。机器会给出预测输出，这样错误总是可以追溯到错误代码或设计，但人类是难以根据他们的投入和工作质量进行预测的。伴随公民科学出现的众包是志愿服务的一种形式，但现在跨越了从工作（付费的微任务）到玩耍（游戏）的整个范围。随着越来越多的工作需要在众包环境中完成，我们需要考虑劳动力、失业率和经济意味着什么。一方面，众包为企业提供了随需应变的劳动力；然而，它目前处于劳动法的管辖范围之外。所以必须保护众包工作者（crowdworkers）没有受到剥削。一些人认为更快的计算机处理速度将最终建立起基于机器智慧和人类智慧之间的桥梁，人类计算为把人和机器各自优点进行结合中已经提供一个巨大的机会，达到短期内无法获得的能力。然而，涉及到透明度、知情同意和有意义选择的群体驱动指导是新出现的伦理和社会影响越来越普遍，并在线上参与中以不同形式出现。还有一些非法使用也可能产生一些副作用，如虚假的信息工程，其中人类计算系统是为了制造恐慌、窃取信息或操纵意志是一个重要问题，不能忽视。文章指出，以社群驱动的方式，能指引产生出透明的信息和有价值的结果，利用道德规范能让人类计算做到以人为本，服务人们的合理需求。参考文献： Pietro Michelucci, Janis L. Dickinson, The power of crowds. Science, 2016-01-01, Vol. 351, Issue 6268, pp. 32-33 人类计算——众人拾柴火焰高 http://sss.bnu.edu.cn/?research_show/tp/234/lid/272.html; 个人分类: 一起读顶刊|11207 次阅读|5 个评论

人类计算：人类认知与机器的互联: 热度 14 lionbin 2016-1-22 16:31; 中国有句古话：三个臭皮匠顶个诸葛亮，是指三个才能平庸的人，若能同心协力集思广益，也能提出比诸葛亮还高明的计策，比喻人多智慧大。还有一个词叫做“众人拾材火焰高”具有相同的意味。现在，互联网的发展已经将人群的智慧变成了一个有价值的、可随需应变的资源。众人的智慧变得如此强大，如果能将这些智慧通过互联网连接起来，它自身就变成了一个重要的资源。 2011年，面对全球性的大失业现象，麻省理工斯隆管理学院的两位教授Erik Brynjolfsson和Andrew McAfee合撰《与机器赛跑》（Race Against the Machine）一书，提出了一种新的观点，随着技术的高速发展，人类正与机器形成一种对抗，而在这个对抗过程中，人类肯定会输，因为与机器相比，人类需要吃饭、睡眠和休息，有情感需求，厌恶重复性劳动。因此提出，未来我们需要转换思路，别与机器赛跑，应该与机器合作，适应机器，帮助机器，体现人类对机器的价值，这样人类才可以更好地与机器协同进化，而不是被机器所淘汰。现在，如果我们将这种想法扩展开来，人的智慧不仅仅是自己互联，而且还可以与机器连接起来，建立一种合作关系取长补短，变成一个不可战胜的重要驱动力。这个重要的资源，美国卡内基梅隆大学（Carnegie Mellon University）的Luis von Ahn在其博士论文中引入了一个术语，叫人类计算（Human computation），指的是结合人类和计算机的优势来完成某个人类和计算都不能独立完成任务的分布式系统。同时，伴随着这个词的产生的，还诞生了一个大数据行业经常拿来说事儿的故事，就是我们现在网站登陆注册时所用到的“验证码”，其英文全称是Completely Automated Public Turing test to tell Computers and Human Apart（CAPTCHA，全自动区分计算机和人类的图灵测试）。最初的CAPTCHA图片是由机器生成的，控制程序也知道正确答案，其作用纯粹就是为了防止机器恶意自动注册和机器攻击，用于验证当前正在进行的操作是人类而不是机器。坦率地讲，许多身份验证机制的产生，是人类与技术之间的内耗，比如机场安检的逐步升级，纯粹善良大众为少数坏人买单，消耗了大量的人力和物力。CAPTCHA显然也是如此。聪明的人总是不满足现状的，既然CAPTCHA消耗了广大网民的时间资源，那么能否利用这些“浪费”的资源做一些有意义的事儿呢？后来出现的reCAPTCHA就是在这方面进行的挖掘，它除了能更好地区分人和机器外，还能“顺便”为文献数字化做贡献。具体如何实现的呢？现在新的文字材料一般都有电子版，但计算机出现之前的大量书籍、报刊等书面资料没有现存的电子化版本，要将其进行电子化显然很有意义，但任务异常繁重。随着OCR的发展，文字自动识别的水平越来越高，但有些文献由于年代久远，字迹开始变得模糊、褪色、污损等，OCR无法识别。但是，这些OCR无法识别的内容由人工辨认却相对比较简单。reCAPTCHA系统中，验证码由两个单词组成，一个是系统设定并知道答案的“control word”（对照词），另一个是来源于OCR无法识别的“unknow word”（未知词），前一个用于验证用户是否有能力识别这些文字，如果答案正确，就认为用户对“unknown word”部分的回答也是可信的。为了增强可信度，同一个的“unknown word”会被分配给多个用户，然后综合这些用户的回答来判定这个疑难字符是否被正确识别了。reCAPTCHA系统以免费服务形式的形式提供给各网站，加速了文献数字化的工作。这种形式，也有人称之为协同智能（collaborative intelligence）或众包（crowdsourcing）。各种服务现在正在虎视眈眈地看着这些人类认知的丰富资源供应，如维基百科、使命游戏（Games with a purpose）和亚马逊土耳其机器人（Amazon Mechanical Turk）。维基百科，尽管最初人们担心其准确性，但毫无疑问现在它已成为各种基本信息的关键资源。使命游戏中的ESP，专门针对在线玩家，他们在玩一个有趣的游戏过程中，可生成有用的数据（如图像标记）。众包市场的亚马逊土耳其机器人用于协调那些为获得报酬的工人来完成任务。多邻国（Duolingo）是一个免费语言学习网站和众包文字翻译平台。其设计理念是，当用户逐渐学习课程时，同时也在帮助翻译网站上的内容或文件。这个平台推出后很快成为全球最受欢迎的外语学习神器，是唯一一款曾被谷歌Play Store和苹果App Store都评为年度最佳的教育类应用。也就是说，在线学习过程，也可以变成一种工作，相反，工作也可以变成一种学习过程，有些人在线工作的时候可以帮助其他人学习新的技能，这可能对未来的工作和教育产生变革性的影响。基于这种思路，在放射医学领域如何从x射线照片中识别肿瘤是一个非常重要的工作，但现在这样的任务，依靠机器视觉算法还不可靠，然而人类对此擅长。一个放射医生新手刚开始也是观察易于分类的照片进行训练的，而后达到一定的熟练程度后就可以应对更困难的情形，这种进步过程，既帮助了机器，也帮助了他人。人类计算在科学研究上所体现的非凡成就，最引人注目的当属Fold it项目了。参与者被要求尽可能以最有效的方式折叠虚拟蛋白质。该目标是为了解决分子生物学一个最重要难题：蛋白质折叠是如何这般迅速和有效的？该项目开始后不久，就发现猴免疫缺陷病毒调节蛋白的三级结构，这个问题曾经困扰了该研究群体数十年，如果得到解决可能会找到应对艾滋病病毒的新方法。另外，宇宙动物园（Zooniverse）项目要求公民科学家确定月球上的环形山，帮助翻译旧船的行船日志，在天文图像中确定星系，并发现其他恒星周围的行星，都是利用众包来进行科学研究的重要案例。信息科学建立在这些早期的成功上，证明推进人类计算系统的潜力可以模拟和解决一些经济、环境和社会政治系统交叉的奇怪问题（那些挑战传统解决问题的方法）。从上我们看到，在过去几年里，由于众包市场和一些巧妙应用程序的出现，人类开始实现一些之前不可能完成的任务。通常情况下，这样的应用涉及到人类需要利用人类的智慧执行某些形式的计算，如图像分类、翻译、蛋白质折叠这些问题对目前最先进的人工智能算法来说也是一个几乎难于完成的挑战。今天，由于计算机科学家、众包先驱者和远见者的努力，创造了研究人类计算的路线图，使我们能从中得到各种答案。人类计算系统已经非常成功地解决一些复杂问题，从确定螺旋星系到组织赈灾。而且，只要人类认知可以在全球范围内有效地利用，他们的潜力仍将变得越来越强大。这些目标都是非常有价值的，但会产生一些重大问题。其中最重要是伦理、法律的本质以及人类计算的社会影响。如何设计这个工作才能允许有意义的和有尊严人类的参与？获得何种结果才能让最弱势人群从中受益？机器与人类之间产生特定结果的最优分工是什么？你能读懂这段文字吗？参考文献： Pietro Michelucci, Janis L. Dickinson, The power of crowds. Science, 2016-01-01, Vol. 351, Issue 6268, pp. 32-33 人类计算——众人拾柴火焰高 http://sss.bnu.edu.cn/?research_show/tp/234/lid/272.html Human Computation 杂志http://hcjournal.org/ojs/index.php?journal=jhc Managing Crowdsourced Human Computation. http://www.ipeirotis.com/wp-content/uploads/2012/01/36946.pdf The Emerging Science of Human Computation (http://www.technologyreview.com/view/538101/the-emerging-science-of-human-computation/); 个人分类: 一起读顶刊|11352 次阅读|29 个评论

[转载]众筹和众包: uestc2014xiaoyu 2015-9-5 11:01; 开篇先分享和转载这篇《众筹将血洗所有行业》！转载自： http://www.cedm.net.cn/news/html/cedmjjshzt/zc/201506/30-98524.html ———————————————————————————————————————————— 摘要　　——互联网革命下半场才开始，众筹将血洗所有行业!互联网革命分上半场和下半场。上半场是从线下到线上，阿里巴巴是其代表;下半场是从线上到线下，现在比较热衷于O2O、C2B。而众筹将是互联网从线上走向线下的最好方式之一。　　一、重新定义众筹　　——咖啡馆众筹之父杨勇: 我们的众筹最早是从咖啡馆起家的，做的第一个项目叫1898咖啡馆，第二个叫金融客咖啡馆。金融客咖啡馆火了之后，一下子点燃了大家的热情。这个咖啡馆从200个股东募集1亿资金做起来的。除此以外，我们大概在一两百个行业，凡是你能想到的行业，都在尝试用众筹的方式做点事情。　　——我们的操作模式，以我们现在国贸操作的CBD投资并购的咖啡馆项目为例，目前投资金融为1.2个亿，200人每人出资60万。对等的回报是：第一，你投资60万，我给你返60万的咖啡卡;第二，你是两百分之一的股东;第三，我们承诺5年不倒闭。　　——如何要保证CBD投资并购的咖啡馆项目五年不倒闭呢?算一下帐，一年最多亏500万，5年最多亏2500万，相对于1个亿的盘子，我们基本上能活下来。那么，这个项目最大的特色是什么呢?这个咖啡馆主要是针对项目交易。因为200个股东是上市公司、大企业、基金、投资公司的老板或高管，我们要求参与的股东每个月推荐一个项目，每年推荐大概12个项目。由于这些股东的品质，太差的项目不会拿出来，我们预估项目质量为75-85分上下(100分为最优质项目)，由于股东的多元化，有些你认为比较一般的项目，可能对别人来说是很好的。如果能成1单，所挣的钱就能达到成百上千万，相对于所出资的60万很值得。　　二、众筹原则：熟人众筹　　——我们的众筹基本上控制在200人以内。其次，我们强调熟人众筹，因而不会在互联网上去推广运作，陌生人投给我们钱我们是不会要的。再次，我们强调股份平均，平等感是我们众筹的一个基础。　　——我们把众筹分为两种：一种叫陌生人众筹，一种叫熟人众筹。目前，大家所了解的、政府监管的是网上的陌生人众筹，这些都学的是美国。在某一个陌生行业找一个精通的人牵头，但是并不太适合中国，因为: 　　——第一，这种模式前提是需要很多合格的投资者，美国有中国没有。　　——第二，这要求投资者需要有很好的职业道德。　　——第三，投资人投资动力不足，不缺钱、没有心理压力，跟他们打交道的都是一些固定的LP的时候，亏钱是很正常的，一个项目挣到钱不会给他们带来太大的利益，但是亏钱的时候会觉得有很大损失。　　——所以，我并不看好这种模式!最主要的原因还是中国尚没有很强烈的契约精神。而在美国，你的项目需要钱，只要在网上一放，就可能有人给你钱，很简单的。这得有很好的法制做支撑的，但中国人的契约精神是不可靠的，连上市公司都能作假，一个产品造假不是非常容易的事吗? 　　——陌生人不敢给你钱。即便陌生人敢给你钱，你也不敢要!所以，过去一两年网上项目的众筹资金都非常少，大多以几万为主，过十万都算大项目了，过百万就算超级大项目。而我们的项目都是三千万起，很大的原因就是，有一个很好的信用基础。我们是通过熟人圈子展开众筹。因为中国人虽没有很强契约精神，但中国人很在乎熟人圈口碑，利用这一点可以很好地解决众筹项目的信用问题。　　——什么叫熟人众筹呢?如果你有项目找我，那么我们要求出钱的20个人必须是你的朋友(五年以上的)，这样以来你就会非常谨慎，因为你不会轻易的要朋友的钱，除非项目非常有把握，就像中国古代建筑的榫卯结构不需要铆钉就会建的非常坚固。　　——所以我们做众筹的项目本身就是干两件事情：实惠、圈子。　　——第一，实惠。要尊重中国人投资的心态——不能亏钱。所以你投资60万，我们给你返60万的消费卡，让你觉得起码不亏钱了。因而，项目的基本上有实打实的合理回报。这个合理的回报并不就是他投资的原因，而是消除投资的障碍。　　——第二，圈子。以众筹方式做咖啡馆实际上是在塑造一种软性的环境。里面的投资人都是对等的，不管他多厉害的投资人。我们鼓励创新，讲承诺，形成一种契约性的小圈子。另外在创业创新方面，失败是很正常的事情，我们要宽容，如果有人失败了不要瞧不起他，反过来还要人安慰他。在这个小圈子里共同培育小团体般的感情，创造一种俱乐部般的环境。　　三、众筹的意义　　——过去一年多，我天天拜访各行各业的人物，找我的也都是行业大佬级的人物。因为在这么短的时间内见了这么多人，做的项目也有上千个，这些人、项目给了我各种角度的启发、思考。所以，在一年的时间，我对众筹的理解从很浅的层次达到很高的高度。我觉得众筹对以下几个方面的改变是巨大的：　　——过去十年我参与创建了大概三十几家协会，对传统协会的问题我体验极深。　　——第一，传统协会特穷，不管有多少亿万富翁参与都特穷，导致团队水平特别差，一般的协会全职员工就一到两个人，如果有五个以上的全职员工那是非常好的协会，十个以上就是超级大协会了。　　——第二，传统协会做长了就成了会长和秘书长两个人的协会了，所有的资源都集中到会长和秘书长两个人手上。会长和秘书长也非常郁闷，他们也不希望这样。因为体制决定，导致大家都没有积极性。　　——第三，实际上这些协会成员基本上不会去参加活动。但为什么大家还愿意参加协会呢?因为参与协会其实不一定有好处，但不参与协会麻烦却很大。大家花钱只是为了不给自己找麻烦。第四，所有的协会基本上刚成立的时候都非常热闹，但半年到一年之后基本上不太热闹了，很多协会就这么死掉了。　　——然而，我们用众筹的方式基本能把协会的问题给完美的解决掉。以金融客咖啡馆项目为例，如果你换个角度看，它其实就是一个协会组织，只不过这个协会组织的模式有所改变。我们募集了1亿的资金，而咖啡馆花不了这么多的钱，这里多出来的钱是为了防止咖啡馆死掉，而不是用于将咖啡馆装饰得多么豪华。钱多，团队会很信心，也会特别舍得花钱聘请有才干的人，用高薪聘请职员的结果就会导致各方面的服务都非常好。　　——我们众筹特别强调平等，去中心化。传统的协会组织基本上谁牵头谁就是会长、秘书长，一般不会换的，除了他自己离职走人。众筹方式强调平等，任何人走了之后其他人都能继续开展工作。这种去中心化不是没有中心，而是去领导去领袖，谁带来的贡献最多谁就是中心，而且这个中心是不停变化的，谁贡献大谁就是老大，这就使得组织始终活力充沛。　　——这种模式的出现得益于微信。如果两百多人没有一个很好的沟通方式的话，那么成本是非常高的。我们每建一个项目就建一个微信群，把股东加到群里，所有关于这个咖啡馆的好的坏的信息都会分享到群里，带来的资源高度分散化，不是在某个人手中，而是在大家手中。用这种方式做事效率也非常高，有什么想法往群里一发就会有好多人响应。众筹模式建立的组织特点是自组织，或叫有机组织。将这些人聚拢到一起，成长就会自主自发。　　四、激活社会资源　　——项目的所有权与经营权分离，所有权高度分散化，属于众筹的股东，经营权交给很专业的团队去做，这种方式会导致挖人非常容易。中国人骨子里都有创业的想法，不敢出来的原因，是活得太舒服了而且创业的风险性太大。而众筹基本上把他们所有的顾虑打消了，所以挖人非常容易。　　——未来，当公司所有的股份都平分的时候，现有的大公司都会面临挑战，如果它不改变，那么里面好多人都被挖出来。所以，未来众筹会把所有行业洗一遍，刚才讲的众筹改变社会组织，一个国家要非常健康，核心就是要有很多这种社会组织。在美国，有大量的线下组织，但是中国呢?几乎没有。中国是政府非常强势，而基层基本上一盘散沙。因为我过去做过很多协会，了解到中国虽有几十万家协会，但真正好的协会非常少。因为以往政府对这种协会组织管控太严。现在正慢慢放开。我们觉得，我们做咖啡馆时就是在改变、升级传统的社会组织，我们希望，未来通过我们众筹的模式给中国建几十万个这种新型的社会组织，改变中国的这种形态。　　——参与一个咖啡馆项目，就跟用业余时间读EMBA一样。大家为什么热衷读EMBA?其实就是希望社交的数据会更强一些。而我们这种方式都是自己挑的人，所以比EMBA选的人更严格。以至于有可能在未来，人们怎么评价你怎么评估你，就看你参与了多少个众筹的项目。你参与的众筹项目层次越高，你的地位可能就越高。而且实际上，大家可以看到，这种众筹模式都是利用大家闲置的资源，闲置的资金。这种方式把整个社会重新激活了。　　——通过这种C2B的方式，改变吃、住、行等生活各个方面，让人们花更少的钱享受更好的服务、生活得到更好的保障。　　五、改变创业形式　　——创业是非常难的，难在两点，第一是生存特别难，第二是做成非常难。众筹能使创业的成功率提高到近乎百分之百。我们是一些项目火起来之后才反思，去研究众筹，发现背后是有很多逻辑的：　　——第一，大钱与小钱。众筹对中小企业的融资是非常容易的，比如说传统方式你要5000万，就得找到一个能出5000万的投资人，即使找到也不一定能投你的项目。而众筹会使这事变得相对简单得多，比如5000万分100个人出，每人出50万。第一，能出50万的人很多，可选择目标很多;第二，因为出钱少跟出资者谈起来也容易。第三，投资回报率要求不会很高，投资者更看中事情本身，当创业出现困难时，投资者对创业者的经营干预小。所以，跟传统方式比较，众筹方式就改观了这种难度。我们每个咖啡馆都是1亿的融资，都是这种方式。　　——而且，这种模式抗风险能力非常强，现在我们买F1车队、买球队每个老板出500万，200个老板众筹10个亿。如果一个老板亏200万，200个老板亏4个亿是可以接受的。　　——第二，动车理论。众筹模式为什么要强调平等感呢?因为它会使组织发展得非常快，让每个人都有领导感、平等感，这样就会调动每个人的积极性。当200个人一起发力时，创业就非常简单。当遇到问题时，将困难往群里一发，可能有人一个电话就能搞定。当困难能较轻松克服的时候，你就会发现创业是非常有乐趣的事情。任何一个项目，如果有200人一起发力，它成长的速度会非常快。像传统的火车动力都在车头，牵引力再大，它的前进速度也是有限的，但现在的动车每节车厢都有动力，所以它的前进速度就变得极快。　　——第三，长板理论。什么叫众筹?说直白点的就是组合一切优质资源。我现在做众筹，涉足将近两百个行业，别的行业完全不懂，怎么办?我就找这个行业最牛的人，原因是通过众筹的方式，你能找到这个项目需要的各个细分领域最牛的人——只要最牛，就能谈定另外一个领域的更牛的人。通过这种方式，你能迅速组建非常强有力的团队，每个人只做自己擅长的事情——只做自己擅长的事情，能力会越来越强。　　——第四，三位一体。为什么众筹使得创业变成简单的事情呢?因为改变了团队的模式。传统的创业模式在资金等各方面开展起来都特别困难。而众筹把投资者、生产者、推广者三者的身份合为一体。　　——举个例子，我们现在金融街众筹一家珠宝体验店，3000万投资。大家都知道现在珠宝店不做品牌店是非常难的，而我们做起来非常简单。3000万分100个人，每人投资30万会成为珠宝店的股东，牵头人为广州市珠宝交易中心保证了货真，而且跟银行有合作，买了珠宝马上可以在银行做抵押贷款。这就做到了货真价格公道。而且，股东能两到三折买到珠宝，比如在外面你要花50万买到的珠宝在这儿你只要花10万就能买到，你就会觉得那30万已经挣回来了。另外，你的朋友能四五折买到珠宝。这样既能解决货真的问题价格又非常便宜，你的朋友就会非常感激你，而且，100个股东能发展两三千个中高端客户。　　——第五，200人把关——独特的风险识别模式。为什么众筹的模式不需要方案呢?因为每个人都会为自己的钱负责。当你为某个项目投50万的时候，你一定会非常仔细看待这个事情，我们强调众筹200多个股东有不同的经历和知识背景。如果他们都觉得这各项目不错，那这个项目应该就是很棒。自然，决策效率就非常高了。目前，是超过了200人来把关一个项目，未来有可能会达到一万来把关一个项目，从而最终改变中国人的创业创新环境。　　六、众筹的应用：没有众筹做不到的　　案例1.一带一路咖啡馆　　——大家都知道投资海外，初期很可能要交学费，有时候花几百万冤枉钱都非常正常。我们的操作方法是，比如在巴基斯坦，我们吸收200个股东，每个股东投资100万，众筹2个亿。　　——付出100万，所得回报是什么呢?咖啡馆将有四大功能：第一，收集当地发财的机会，每天发给你;第二，如果你觉得项目很好就可以去考察，咖啡馆负责在较为安全的情况下去考察;第三，考察完毕之后觉得项目特别好就想去投资，但是人生地不熟的，咖啡馆负责介绍当地的合作伙伴让你借船出海;第四，平时闲时就相当于一个驻京办的角色帮你处理各种事情，因为一个人在那边的费用也很高。　　——现在一路一带很火，我们可以沿着一带一路去铺100家咖啡馆。因为每个咖啡馆在两百个人左右，所以一百个咖啡馆也应该在一两万人，而每个人都是有几千万投资能力的，所以我们实际上做了数千亿的资金池。未来走出去，人都是抱团的，都是经过选择的，这会创造非常多的商业成果。　　案例2.互联网+咖啡馆　　——很多传统的老板对互联网+是没什么概念的，不知道从哪儿切入，所以我们也在中关村注册一个互联网+的咖啡馆。我们的咖啡馆众筹的方式非常简单，寻找一百个行业，每个行业选几个排在前几名的老板，使行业有一个很好的分布，另外找到一个群体，就是全在BAT等大公司做CTO产品经理的人。　　——对很多老板来说，最大问题是其对互联网+没什么概念，从而不知道如何将传统行业对接互联网。打造这样一个项目，就能让传统企业老板与这些CTO产品经理们创造沟通的机会，而后者也很希望接触一些传统企业的老板。　　案例3.创业大学　　——办一个大学是非常难的，但通过众筹的方式办大学是非常简单的。比如我们正在众筹一个中关村创业大学，操作方式是众筹两个亿(200股东，每人出资100万)的规模，股东都是中关村上市公司的老板，成为一个学校的荣誉校董对这些老板应该说是非常有吸引力的。这就解决了办大学融资难的问题，每个老板出一两百万，资金的问题相对就比较轻松能解决了。　　——新大学没有影响力，会遇到招生难的问题。我们会要求股东每人推荐一两个人，以老板们的眼光和资源招上来的学生质量也不会太差，这就解决了招生的问题。同时，老师的问题也能很好解决，因为这些股东本身都在业界有成绩，就是很好的老师，而且还可以通过股东的关系找一些纯学术圈的老师来授课。　　——另外，这两百个股东出了钱，还会到处宣传说，这家在中关村办的中国最好的创业大学。股东的影响力是巨大的。关键的是，真正办学的过程完全由专业的团队操作。所以，我们完全可以通过众筹的模式在很短的时间办一所很牛的学校。　　案例4.互助保险公司　　——现在，互助保险开始热起来，而这基本上是由我们带起来的——我们在众筹保险公司，预计两百个亿的资金。从去年开始，保监会下发了互助保险的指导条例，我们就觉得机会来了，就开始筹备。而保险在国外最早就是互助保险，而且许多国家最早做的也是互助保险公司的模式。现在做保险公司超过平安是非常难的，但是互助保险公司模式给了我们一个机会。　　——我们做互助保险项目，最早目标定在众筹21个亿——其中20个人，每人投资1亿，另外1000人每人10万。这个项目在推广的过程中特别顺。为什么这么顺呢?主要原因是大家对保险行业特别看好，传统保险已经走到尽头了，互助保险在国外又非常成熟，所以大家非常愿意参与，所以推得非常顺。现在我们把目标提高到201亿，200人每人投资1亿。这200亿什么概念呢，我们有个精算团队保守的算了一下，如果我们互助保险公司只要有三十万个股东就会比现在的泰康、新华等保险公司资金规模还大，各种现金流都会更好，如果我们有一百万个股东就不比平安差多少了，现在平安有1亿多的客户。　　——由此可见，通过众筹模式做互助保险公司是非常恐怖的，并且以上算法还是非常保守的。对一百万个股东用众筹的方式操作不会太难达到，所以互助保险是一个非常好的机会。　　的问题。同时，老师的问题也能很好解决，因为这些股东本身都在业界有成绩，就是很好的老师，而且还可以通过股东的关系找一些纯学术圈的老师来授课。　　——另外，这两百个股东出了钱，还会到处宣传说，这家在中关村办的中国最好的创业大学。股东的影响力是巨大的。关键的是，真正办学的过程完全由专业的团队操作。所以，我们完全可以通过众筹的模式在很短的时间办一所很牛的学校。　　案例4.“互助保险公司” 　　——现在，互助保险开始热起来，而这基本上是由我们带起来的——我们在众筹保险公司，预计两百个亿的资金。从去年开始，保监会下发了互助保险的指导条例，我们就觉得机会来了，就开始筹备。而保险在国外最早就是互助保险，而且许多国家最早做的也是互助保险公司的模式。现在做保险公司超过平安是非常难的，但是互助保险公司模式给了我们一个机会。 —————————————————————————————————————— 最早接触到“众筹”和“众包”应该是在今年的3月份，我的学生林奕欧（Leo）在我们小组的Seminar上做的一个精彩报告。那是我第一次接触这个两个概念！很受启发~ 谢谢Leo！昨天看到《众筹将血洗所有行业》，不禁想把好的东西传递出来。关于概念大家使用百度或者谷歌就能直接看到详细的介绍。这篇《众筹将血洗所有行业》是一个更加深刻的诠释。; 个人分类: 创新创业|16070 次阅读|0 个评论

从“合作”到“众包” ——“众包”是科研的未来吗？: 热度 2 Enago 2015-7-3 19:20; “ 群众外包 ”，简称“众包”（英语：crowdsourcing）是互联网带来的新的生产组织形式。它是《连线》（Wired）杂志记者Jeff Howe于2006年发明的一个专业术语，用来描述一种新的商业模式，即企业利用互联网来将工作分配出去、发现创意或解决技术问题。这个单词是由群众（crowd）跟外包（outsourcing）延伸出来的。直接的动机就是把一个大的问题分解成很多小问题，发动群众的力量来解决。一个熟悉的例子就是维基百科，它本身并不聘用主题专家、作家和编辑，主要内容是由网络上的志愿者共同合作编写而成的。 --- 阅读原文请点击链接造访【英论阁学术院】从“合作”到“众包” ¬——“众包”是科研的未来吗？- -- 近年来“众包”这一概念已逐渐应用到了科学研究上。它能让一大群某方面的专业人士或爱好者，在较短时间内交流、磨合他们的想法，从而有效地解决问题。它的优势是传统的小范围合作无法比拟的，是种更高形式的合作。或者对于某些需要各种技能组合的项目，即使是不具备特殊技能的普通人都可以做出贡献。《自然》报道了两则“众包”成功的例子，从数学难题的解决到蛋白质分子结构的确定。2009年1月，英国剑桥大学的数学家蒂莫西·高尔斯（Timothy Gowers）在自己的博客上发布了一条深奥的数学问题，鼓励读者提出想法来证明。在问题发布几小时后，高尔斯的博客就已经刮起了“头脑风暴”，截至3月底，他收到了将近1000条评论。经过整理，他发现答案就存在于评论中，而他得以宣布问题已经解决。在发表论文时，文章的署名是这一集体的笔名——D·H·J ·博学者。 “ 博学者项目 ”（Polymath）目前已逐渐成熟，有自己的专业网站（http://www.michaelnielsen.org/polymath1/index.php?title=Main_Page），人们可以就新问题发表观点，进行讨论。如果认为某个问题值得深入研究，就会广泛交流观点，共同寻找解决之道。另外一篇发表在PNAS的名为“RNA design rules from a massive open laboratory”的文章则由37000人参与，是另外一个“众包”项目的典型例子。 “众包”的一个困难是如何激起参与者的积极性，一个有效的方法是将问题用游戏的方式呈现出来。因为按照“愤怒的小鸟”开发者的估计，全球所有的玩家每天花在该游戏上的时间大约有 2 亿分钟。这些时间即使只有0.1%能够被有效使用，对科研项目的推进也是不可估量的。Casey O’Donnell，密歇根州立大学的的助理教授，申请到了一笔美国国家科学基金会（NSF）的经费，用来研究如何协同开发网络游戏，使之用来解决生物化学和分子物理学的一些难题。Casey O’Donnell希望通过玩家与专业人员的合作，一些科研领域的难题能够转化成为游戏中的关卡从而被热心的玩家们解决。但是对“众包”持怀疑态度的还是大有人在。批评者认为“众包”的模式跟做问卷调查没有什么差别，对科研的本质不会起到任何改变。而支持者则争辩说，“众包”现在还没有发展到能够调动普通人的积极性，并且让他们能有效参与到项目中。这需要加强学术的科普和让科学变得更容易理解，是一个需要长期发展的过程。不管怎么说，“众包”总是有它积极的一面。在这样的平台上，科研工作者可以继续在自己的小圈子里兢兢业业、埋头苦干；同时也能和全球的同行及时交流信息、探讨思想。虽然并不是每个问题都能得到解决，但这有助于科研活动突破闭塞，走向公众。 http://zh.wikipedia.org/wiki/%E4%BC%97%E5%8C%85 § 博客内容皆由英论阁资深学术专家团队撰写提供 § ------------------------------------------------------------------------------------------------------------------------------------ 您可能感兴趣的博文： 1. 科学也可以民众募资（crowd-funding）吗？ 2. 学术研究中的偏差 3. 开放获取之外的公共信息获取渠道 -------------------------------------------------------------------------------------------------------------------------------------; 8080 次阅读|3 个评论

科研众筹对中国科研活动的影响: 热度 16 zhangjiuqing 2015-4-10 14:10; 科研众筹对中国科研活动的影响本刊编辑部与科研众包比起来，科研众筹的兴起要晚一些。科研众筹（ Research Crowdfunding ）是一种基于互联网的资金筹集方式，研发者提出一个有潜力的科研项目，发布到科研众筹网站上，向那些看好这个项目的投资者募集一定的科研经费，然后开展研究。全球最早的众筹网站是 2008 年美国人建立的“开局者（ Kickstarter ）”平台，创业者把自己的创意和想法放到平台上，网友根据自己的判断和喜欢程度支持不同数量的资金，创业者按照资金额度回报投资者相应的产品和服务。在这里，依托于高新技术的产品研发是众多众筹项目（如艺术、设计、影视、游戏、出版）的一部分另一家著名的众筹网站“众立方（ Crowdcube ）”平台与“开局者”平台针对个人的众筹模式不同，主要为新成立的企业以出售股权的方式，直接从大众手里募集资金，摆脱了风险投资机构和银行等中间环节。高技术研发是众多筹资领域（影视、环保、教育、健康、制造）的一部分。第一个主要面向科学研究和实验的众筹网站是成立于 2012 年、由两个华裔美籍大学生创办的“实验网（ Experiment.com ）”。这家网站专门为缺少资金的科学研究项目筹集资金。与一般的众筹模式一样，研究者在网站平台上发布自己的研究项目和需要筹集的研究经费，当资金达到预期额度后，研究者就可以使用这些资金。在这个平台上筹资的有基因、海洋、化学等研究项目。该平台的一个成功案例是，来自杜克大学药学院的两位研究者为研究钙元素在肾病中所起的作用筹集到了目标额度为 6942 美元的资金。与开局者、众立方等筹资网站比起来，这个额度实在是太小了。不过好消息是，这个网站得到了风险投资，比尔盖茨也是这个网站的支持者。中国国内还没有出现直接面向科学研究的众筹网站，不过也有人在进行尝试为学术研究众筹。 2013 年浙江大学历史学系教授陈新在微博上发布了《海外人文学术名刊译丛众筹计划信息》，寻求社会资助用于支付翻译费用。严格意义上说，这种众筹的回报比较清晰，与这里讨论的科研众筹有些区别。与一般的众筹模式不同的是，科研众筹有着不同的回报方式。投资者从一般的众筹获资者那里得到的是实物或者资金，而从科研众筹那里得到的更多的是描述进展的实验日志、实验结果的早期分享、研究论文中的致谢，等等。比起实物和资金，这类回报对投资者的吸引力要小得多。科研众筹的先期投资者主要是其他的科研人员，是项目发起人的同事、亲朋好友。面向前沿创新的科研项目的风险较大，获得重大发现的时间较长，投资者投资后可能什么也得不到。所以，科研众筹的投资者不会太多，目前的研究者能发布的也只是一些目标较为明确的、风险小的研究项目。如何让这些为数不同的公众，能够加入到科研众筹平台，能够不计报酬、心甘情愿地投资一些风险大的科研项目，是科研众筹网站平台和研究者面临的最大难题。科研本身是一个需要资金的事业，这些资金大多来于企业、政府或者非营利组织。申请这些资金需要很高的门槛和繁杂的程序，而且获得资助也越来越困难。按照实验者网站的说法，“从 2010 年以来， 80% 的被调查者要花更多的时间去写申请书， 67% 的人要为研究经费缺乏而努力。”科研众筹将是对这些资助的一种有益补充。当更多的大众通过科研众筹平台能资助科研活动的时候，科研的门槛就会降低，更多的奇思妙想能得到研究，更多有创新想法的人就有机会从事相关的科研。大众投资者对于线上的科研众筹也有很多担心，因为他们没有能力来评价项目提出者是否有资格和能力从事这项研究，来具体评价项目的学术价值，更无力来监督自己的投资能否被合理地使用，毕竟运行了多年的传统科研资助模式，也未能完全消除科研不端行为。这些担心需要科研众筹平台建设者，通过一些有效机制和方法来解决。中国的众筹网站建设正在掀起高潮，也希望其中有人创建几个科研众筹网站，为那些对科研有浓厚兴趣、有满腔热情的中国投资散户找到出口。这也符合政府鼓励大众创新的要求。（张九庆执笔）注：此文为2015年第4期《中国科技论坛》卷首语的原稿，正式出版时文字会稍有变化。; 个人分类: 科技政策|17589 次阅读|19 个评论

科研众包对中国科研活动的影响: 热度 14 zhangjiuqing 2015-3-6 09:44; 科研众包对中国科研活动的影响本刊编辑部科研众包（ crowdsourcing ）是当代科研活动的一种新方式，它通过互联网聚集全球科研人员的智慧，协作进行科学研究，共同解决科研难题。科研众包的一个典型例子是，英国剑桥大学数学家蒂莫西高尔斯（ Timothy Gowers ）在 2009 年通过众包，成功证明了一个数学定理，发表文章时采用了集体署名“博学者”（ D · H · J Polymath ）。他后来启动了“博学者项目”，将更多新问题放在网上。 2014 年启动的“博学者 8 号”是关于孪生素数猜想的问题，由数学家陶哲轩主持协调，邀请更多的人参与改进华人数学家张益唐得到的突破性结论。科研众包通常在科研社交和众包网络平台中进行，这些平台起着类似于科技中介组织的作用。它们主要由科技和经济都比较发达的欧美国家的企业、科学家创办，规模较大的众包平台有“新励（ InnoCentive ）”、“嘎嘎叫（ Kaggle ）”、“你的喝彩（ YourEncore ）、”“科学交易（ Science Exchang ）”等，中国的科研外包平台是“易科学”。商业运行的外包平台的前期投入主要来自于风险投资，盈利模式是收取一定比例的服务佣金。经过多年稳健而缓慢的发展，目前的科研众包平台大致有以下几种运行模式：（ 1 ）由原来的大型科技型企业的交流平台逐渐发展而来。 InnoCentive 创办于 2001 年，最初是美国礼来制药公司的一个生物和化学领域研发供求平台。经过多轮的融资，领域扩大到数学、物理、化学、生命科学、计算机科学和工程技术等。科研人员作为难题的解决者在平台上注册，大公司作为难题的提出者在平台上发布难题。解决者提交的解决方案得到认可，就能得到数量不等的现金奖励。（ 2 ）以科研社交平台为基础搭建众包平台。 Kaggle 平台是全球最大的数据分析师的交流社区，同时也悬赏数据分析的任务。平台对数据分析师免费开放，而对悬赏任务者收取服务费。同时，平台还对一些超难的数据分析提供咨询匹配服务，将社区中排名靠前的分析师作为候选者推荐给悬赏方。（ 3 ）由退休的专业人士组成的众包平台。 YourEncore 组织的是从业年限长、技术职称高、有大量时间和旺盛精力、已经退休的技术专家、发明家、企业家和临床医生，他们服务的对象是那些渴望研发出创新消费品的大型企业。（ 4 ）科学实验外包社区。在 Science Exchange 的平台上，科研人员发布实验外包需求，当在线的科研机构报价后，选择最合适的合作者。该平台的优势是，美国排名前 100 名高校中的很多科研机构都在此提供服务。中国的易科学（ EasyScience ）与此类似，是一个科研仪器共享和科学实验的服务平台。（ 5 ）慈善基金会或政府众包平台。盖茨基金会的“探索大挑战（ Grand Challenges Explorations ）”项目从 2008 年开始，定期提出特定主题，鼓励来自全球各个地区、各个学科、不同年龄的个人或组织申请。美国航空航天局的“联赛实验室（ Tourmament Lab ）”和跨部门网站“ Challenge.gov ”，由政府提供资金支持，邀请专家学者为技术和工程项目提供解决方案。科研众包继续呈现良好的发展态势，它正在给原本我们熟悉的科研活动带来一系列潜在的冲击和变化：（ 1 ）它会扩大科研人员的队伍，使那些游离在科研机构之外的大量所谓“民间科学家”也能从事科研工作；（ 2 ）它会打破学科间的严格界限，使得跨学科的科技人员更容易聚合在一起，共同解决难题；（ 3 ）它会改变科研的组织模式，通过外部创新的引入和竞争，促使内部创新提高效率；（ 4 ）它会改变科研人员的工作方式，特别是那些能力强的、退休的科研人员能轻松找到一份兼职工作；（ 5 ）它会优化科技资源的配置和使用，特别是科研机构可以充分利用那些先进实验设备和检测仪器；（ 6 ）它会缩短科技成果转化的时间、增大技术成果交易机会，使得科技、商业、市场之间的联系更加便利快捷。科研外包的实质是让更多人（不管是为了财富、名声还是乐趣）参与科研活动，是依托互联网的微创新、万众创新。可以预测，会有更多的科研众包平台在中国出现，也会有更多的中国科研人员加入到国内外的众包平台中。科研众包究竟将如何深刻影响国家科技体制、政府科技管理如何应对和适应它带来的新问题，值得深入研究。（张九庆执笔）备注：本文为《中国科技论坛》2015年第3期卷首语，正式出版文字有个别改动。; 个人分类: 科技政策|13593 次阅读|14 个评论

海岸变化了吗？从iCoast看公民科学、众包与开放式政府数据: 热度 5 lionbin 2014-10-22 12:25; 1800年代中叶，居住在马萨诸塞州康科德的Henry David Thoreau，沉浸在他周围的世界中。他种植豆类，招待访客，修理好了他母亲在康科德的房子，备好丰盛的饭菜，写出了《瓦尔登湖》，有时又生活在森林里。1851年至1858年间，他对瓦尔登湖的动植物了进行丰富的观察和测量，特别对植物的初芽和春天的开花特别感兴趣，在这里总共记录了500多种植物。一个多世纪后，他的记录引起了生态学家们的注意，因为他的观察包含了许多有价值的信息，可用于判断这些物种是如何应对环境变化的，包括温度和降水的变化。 Thoreau因此也可能被认为是我们现在所说的公民科学的最早期实践者，但那个时候并没有公民科学（citizen science）这个词汇，直到1990年代，康奈尔鸟类学实验室的研究人员在召集各行业的人们参与科学研究过程才发明了citizen science这个词。其实，最早那些自发的科学研究其实都是公民科学，20世纪之后科学研究由职业科学家主导，那些独立的科学兴趣爱好者的工作倒显得有些格格不入了。不过我们也应该看到，在博物学、考古学、天文学等领域，这种科学研究形式仍然获得迅猛发展。如今，当公民科学这个词汇开始变得家喻户晓了，但往往又与另外一个因互联网而发展起来流行词汇“众包”（crowdsourcing）的界限开始模糊起来，稍不留神还可能将二者混淆。因此，在开始后面的讨论之前，我们先做一个区分。公民科学可定义为公众参与的科学研究，是科学家和公众之间的合作，其中包括非职业科学家、科学爱好者和志愿者，范围可涵盖科学问题探索、新技术发展、数据收集与分析等。公民科学为业余爱好者找到了贡献自身力量的途径，为科学研究准备了大量日常基础工作的人手，同时当今发达的网络技术又为公民科学的发展提供了进行连接和沟通的物质基础，因此已经有了飞跃性的发展。众包通常定义为大众参与进行的某种形式的任务或解决问题的努力。“众”可以指一小群人，但通常是指一大群人，多达数百人、数千人，甚至更多。现在有许多类型的公民科学项目，随公众参与的程度不同而有很大的变化，从提供帮助到合作，再到共同建立项目。一般来说，公民科学项目的参与者都是自愿的而且是无偿的；众包项目可以让公众参与有偿或无偿的任务，可以有也可以没有科学元素。图1 公民科学和众包项目的关键特征比较在利用公民科学和众包项目进行科学研究的案例中，美国生态系统观测网络（NEON）发起的爆芽（BudBurst）项目不得不提。这个项目吸引公众在整个植物生长季进行观测，包括生叶、开花和结实的时间。NEON公民科学寻求所有民众参与合作，通过教育工具和专业发展课程进行数据共享和数据分析，正式和非正式的教育者可以在他们的教育环境中使用这些数据和素材。成功的公民科学项目致力于建立各独立观测故事之间的联系，并根据项目数据集产生更大的故事。许多项目利用人们喜欢的活动，如观鸟、园艺、或大自然漫步，允许参与者分享他们的观察来体现对科学研究的贡献。爆芽项目幸运地适应了这种世界性的趋势。一些研究人员的工作表明，公民科学项目的设计和实现是正在增强实践者之间互相学习的典范。自从我开始接触这个概念并发生兴趣，着手准备进行这样的研究之时，总觉得在吸引大众的参与热情上困难重重。正在我百思不得其解时，我的一位合作者送给我一条链接，让我看看美国地质调查局（USGS）新近启动的一个众包公民科学项目“iCoast”，旨在验证海岸变化的证据。研究风暴导致的海岸灾害变化，可为USGS识别那些可能在飓风或其他极端风暴中经历极端和潜在危险侵蚀的美国海岸带提供数据和建模能力。为了评估海岸对极端风暴的脆弱性，USGS已经开发了一种风暴影响尺度（Storm-Impact Scale）来进行海岸变化概率（Coastal Change Probability）估计。飓风时因风暴潮和海浪影响会导致水位变化，这与沙滩和沙丘高度进行了比较，以确定这些类型海岸变化过程的概率： 1）当波浪爬高仅限于海滩时，就会发生海滩侵蚀（Beach Erosion）。 2）当沙丘的基部受到波浪和风暴潮的侵蚀时，就会发生沙丘侵蚀（Dune Erosion）。 3）受波浪和风暴潮的影响，当沙传输和沉积到向陆的海滩和沙丘时，就会发生冲刷（Overwash）。 4）当海滩和沙丘完全和持续地受到风暴潮影响且波浪不断爬高时，就会发生雍水现象（Inundation）。自1995年以来，USGS对大西洋和墨西哥湾海岸收集了24个飓风和其他极端风暴后超过140000幅的航拍照片。仅2012年的飓风桑迪，就在风暴之后的一周获得了超过9000 幅航拍照片。USGS在极端风暴后获得了高分辨率的倾斜航空摄影，并与风暴之前收集到的图像进行了比较。当然，这些在低空航拍的照片只捕获海岸的一些小区域。USGS希望对收集到的这些航拍图像进行地面验证，以提高USGS的海岸变化模型的预测能力。很显然，没有哪个人有能力来对每次风暴后所获得的所有照片进行分析，而目前的电脑技术也还不能从倾斜航空摄影中自动识别破坏和海岸地貌变化情况，这仍需要人类智慧才能完成。因此，USGS决定推出一个公民科学项目，要求公民的帮助来确定海岸的变化，同时有获得了有关沿海灾害的知识，并教育公众有关沿海社区在极端风暴下的脆弱性。今年6月，飓风季节再次来临，“iCoast—海岸变化了吗？”项目如期推出，要向人们展示极端风暴所导致的沿海变化。iCoast允许公民科学家通过比较风暴发生前后的航拍照片来识别海岸的变化。如前所述，分析航拍照片来确定暴风所造成的破坏，将有助于海岸科学家改进他们有关因极端风暴导致海岸侵蚀与破坏的预测模型。目前，这些数学模型是根据沙丘的高度而获得的，并能预测风暴时波浪的作用。如果有更多的人参与观察，将可让科学家很好地验证这些模型，并在风暴发生之前能更好地预测其破坏作用。显而易见，iCoast项目有科学、技术和社会效益。来自iCoast的众包数据将增强海岸侵蚀的预测模型，可为应急管理者、规划者，以及在其区域的海岸脆弱带的居民提供更好的信息。类似iCoast的公民科学项目，通过与公众分享USGS的航拍图像，是产生开放政府数据（Open Government Data，OGD）的重要举措。开放政府数据是提高社会参与度与透明度的一个重要途径。通过这一方式，政府数据得以主动公开，每一个人都能够在线获取信息，不受限制地对信息进行再使用和再处理，有利于在政府和公众之间架起一道桥梁。通过便捷地获取信息，公众能够对政府公共政策与社会发展机遇作出更加理性的决定与判断。因此，开放政府数据可以带动资源的高效利用与公共服务的有效提供。iCoast也可成为海洋科学教育工作者的重要工具，创建与沿海灾害有关的有趣互动课程。图2 如何使用iCoast 参考文献 Kayri Havens and Sandra Henderson, 2013. Citizen Science Takes Root. American Scientist, 101, 378-385. NEON notes: Citizen science or crowdsourcing? Yes! (http://www.neonnotes.org/2013/12/citizen-science-or-crowdsourcing-yes/) http://www.usgs.gov/blogs/features/usgs_top_story/usgs-icoast-did-the-coast-change/ 【注】本文部分内容被整理后发表在《北京科技报》2014年12月1日科技生活专栏。公民科学、众包与开放式政府数据.pdf; 个人分类: 一起读顶刊|6354 次阅读|9 个评论

《淮南王书》的众包思想？: 热度 3 王飞跃 2014-3-26 22:05; 窦海军“胡适的书房”（见下）中有“ 1932年蒋介石派秘书请接胡适共进晚餐。胡适没有与蒋单独谈话的机会，送给了蒋介石一本《淮南王书》便先行离去了。他送此书，是想向蒋介石传达：君主的知识有限，能力有限，必须靠全国的耳目为耳目，靠全国的手足为手足。这样便是“众智众力”的政治。相反，一个掌握大权的人如果太相信自己，太有为能干，那就是老百姓的灾难。 ” 哪位网友熟悉《淮南王书》， “ 必须靠全国的耳目为耳目，靠全国的手足为手足 “是如何表述的？可否认为是”人肉搜索“或众包的思想？多谢指教！胡适的书房2013-12-21 08:29 阅览： 1047 评论： 2 编辑：资讯编辑原创作者：窦海军来源：北京青年报胡适的这间书房大概不到20平方米图/北京青年报　　去台湾，意外收获是看了三个人的故居——胡适、林语堂、蒋介石。睹物、思人、品史，思绪连绵。　　走到胡适的书房，讲解馆员说胡适很少在这里待，读书写字大都在别处，原因是他觉得这个书房有点像监狱。原来，书房的窗外是个与窗子贴得很近的一道高高的花墙，虽然墙上布满孔洞，但还是有些封闭压抑的感觉。1958年，胡适应蒋介石之邀，从美国回台湾做中央研究院院长。蒋介石要拨钱给他盖住宅，但胡适坚持自己掏钱盖，并抢先寄上2500美元，还表示如果不够再通知他追加。令我有些奇怪的是，书房对于胡适这么重要，为什么他宁可不用，也不拆掉这花墙呢？　　胡适的生活虽简朴，但他对于精神、心理层面的舒适自在，还是蛮敏感的。他不喜欢待在这个书房里，这很可能与他自由主义的、开放的、西化的观念和生活习惯有些关系。至于宁可不用这书房也不拆掉外面的花墙，这大概正是胡适性格、习惯、理念的一个细微表现吧。　　胡适和鲁迅，都是中国现代史中自由主义独立知识分子的典型代表，然而二者的性格、文风却构成了温和宽容与犀利不宽恕的两极。胡适也反封建也批判传统文化，却时常要肯定传统文化中的一些东西；胡适也反独裁专制，却没有与专制主义者蒋介石及国民政府势不两立；胡适也努力保持自己独立自由知识分子的身份、处境，却与国民政府有着适度的合作；胡适也批评蒋介石，却与蒋是终生互敬的诤友；胡适也倡导自由恋爱，却与父母之命、媒妁之言的小脚夫人相伴终生……相比之下，鲁迅在这些方面却显得异常的不含糊，不妥协，甚至是决绝。如果把鲁迅比作峭拔险峻的山峰，便可把胡适比作广阔平静的大湖。胡适尚改良，对激烈的革命抱以审慎的态度。他的一生都在向蒋介石进谏，促其走上民主宪政的道路。今天看来，鲁迅的反封建反专制更加激烈、彻底，破坏力更大；胡适的前瞻性、建设力更强。医治中国封建专制这个脓疮顽疾，如果是鲁迅负责切除坏肉，胡适负责生出新肉，可能是绝好的搭配。可事实上，他们只是互敬的论敌。若让这两种人在现实中自觉地良好配合，往往是文人性格所不能及的，它该由伟大的政治家来实现。而老蒋及当时的国民政府，显然是没有这个境界的。　　早在1929年，回国不久的胡适就在《新月》上发文，严厉批评了中国社会缺乏人权、缺乏法治的状况。他还举例说，安徽大学一位学长（刘文典）因为顶撞蒋介石而被拘禁，家属只能四处奔走求情，却“不能到任何法院去控告蒋主席”，这就是人治。并说“宪法的大功用不但在于规定人民的权利，更重要的是规定政府的权限。立一个根本大法，使政府的各机关不得逾越他们的法定权限，使他们不得侵犯人民的权利……” 　　三篇文章发表后，国民党上海市党部以“诋毁本党主义，背叛国民政府，阴谋煽惑民众”为由，要求中央拿办胡适。胡适被迫辞去中国公学校长职务离开上海。在此期间，蒋介石却对胡适采取了“优容”的态度。　　1932年蒋介石派秘书请接胡适共进晚餐。胡适没有与蒋单独谈话的机会，送给了蒋介石一本《淮南王书》便先行离去了。他送此书，是想向蒋介石传达：君主的知识有限，能力有限，必须靠全国的耳目为耳目，靠全国的手足为手足。这样便是“众智众力”的政治。相反，一个掌握大权的人如果太相信自己，太有为能干，那就是老百姓的灾难。　　后来蒋多次请胡出山从政，还曾推荐胡竞选总统，都被胡谢绝。胡不想失去自由独立知识分子的身份和处境。而这一点，正是知识分子群体的灵魂。　　不激烈，不嚣张，不轻易破坏，优雅容忍，又不委曲求全，这便是胡适风格。这便是胡适不喜欢这个书房却不拆除花墙，同时又不肯委屈自己沦于这个书房的深层因由吧。; 个人分类: 书海拾贝|8145 次阅读|4 个评论

[转载]众包（crowdsource）概念: genesquared 2012-10-5 11:51; 众包（ crowdsource ）概念和威客模式| SocialBeta（解读社会化商业的 ... www.socialbeta.cn/.../众包 crowdsour ce）概念和威... - 网页快照分享 2008年4月26日 – 美国《连线》杂志志的记者Jeff Howe推出的概念，中文翻译成“众包”，按照了outsource的模式，显然“众包”没有英文 Crowdsource 这个词来的形象; 1 次阅读|0 个评论

[转载]机器学习新动向：从人机交互中学习: timy 2012-9-16 20:57; 转载于： http://blog.sina.com.cn/s/blog_7ad48fee01016d25.html 在《机器学习正在改变我们的工作与生活》一文中，分析了为什么机器学习会成为计算机系统智能化的最有力手段。在《统计学习方法》一书中，介绍了机器学习的最常用、最基本的方法。本文综观机器学习研究的一个新动向：从人机交互中获取数据，学习构建模型。首先讨论机器学习到底需要多少训练数据；然后介绍通过人机交互获取训练数据的方法，包括日志数据挖掘、众包、人机协同计算；最后通过实例介绍如何使用从人机交互中获得的数据进行机器学习。 1. 机器学习到底需要多少数据？统计机器学习中的一个重要环节就是生成训练数据。我们必然产生一个疑问，到底准备多少训练数据才能让机器学习到一个足够精确的模型？统计机器学习理论中称之为样本复杂度（sample complexity）问题。这是一个难解的问题，虽然有许多研究，但只有部分结论。下面介绍奥卡姆剃刀定理，它能给出二类分类学习中的样本复杂度的一个结果。其结论是二类分类学习的样本复杂度，即需要的样本数目，与学习的精度、学习的确信度、以及模型的复杂度有关。学习精度越高，学习确信度越高，学习模型越复杂，所需要的样本也就越多。样本复杂度满足以下不等式从这个不等式可以推断，即使学习一个简单的二类分类模型，所需的最小样本数也是相当大的。当然这个定理考虑的是最坏情况，实际需要的最小样本数会更小一些。经验上，要精确地学习一个模型，至少需要模型参数个数的数百倍的样本。所以，机器学习需要的训练样本量是非常大的。通常训练数据的生成依靠专业人员标注。比如在人脸检测中，往往雇用大量专业人员对图片中出现的人脸进行标注。需要标注在不同光线、不同背景下，图片中不同年龄、种族、性别的人物的脸部，以便能够覆盖各种情况下的人脸检测。如何收集大量的高质量的数据成为机器学习的一个巨大挑战。最近的一个新趋势是通过人机交互，包括日志数据挖掘、众包、人机协同计算，获取大量高质量训练数据。 2. 日志数据挖掘、众包、人机协同计算在计算机应用系统中记录用户的使用行为，将其用于系统性能提高是日志数据挖掘的基本想法。日志数据挖掘也可以用于机器学习的训练数据生成。比如，互联网搜索引擎会记录用户查询的点击数据，包括用户提交的查询，系统返回的URL，以及用户点击的其中的URL。点击数据反映了上亿的用户对搜索结果的反馈，对提高搜索引擎的相关排序是非常有用的。如果系统本身是基于机器学习的话，那么这些廉价的点击数据就可以用于机器学习的训练。用户在提供数据的过程中不需花费多余的代价，只需要自然地使用应用系统即可。不过，用户行为数据往往含有一定噪音，怎样去除噪音，提高训练数据的质量是需要考虑的问题。众包（crowdsourcing）是另一种方式，Amazon Mechanical Turk是其代表。将数据标注作为任务，在网上市场上进行任务交易，实现数据的标注。数据收集者将标注任务的展示在市场上；市场中有大量注册会员，称为工人，工人根据自己的能力、兴趣选择任务，进行数据标注，得到一定报酬（一般金额较低），有些工人将其作为获得收入的办法，也有一些工人将其作为娱乐、学习、消磨时间的途径。标注工作对人来说通常是简单的，比如人脸检测，但是对机器来说往往是非常困难的。这样就可以通过大量人工标注数据很快地构建一个智能系统。互联网将人们联系在一起，使众包成为可能。还有一种方式是通过一些特别设计的游戏来获取数据。比如，ESP游戏中，给两个玩者同时展示一个图片，让他们各自独立地对图片进行标注；如果两人标注的标记一致，就都得分，如果不一致，就都不得分。两个玩者都有很强的动机将标注做得准确，而他们给出的标记必然是基于常识的，这就为图片的自动标注提供了高质量的训练数据。Google的图片搜索就采用了这样的方法进行图片标注。还一个例子是ReCAPTCHA。用户在登录网站时通常需要输入验证码，很多网站采用了ReCAPTCHA系统产生验证码。验证码分两段；一段有正确答案，用于鉴别登录是来自真人还是机器人，另一段没有正确答案，用于OCR训练数据的收集；但用户不知道哪一段是真正用于验证的。用户的输入变成训练数据，用于OCR学习，特别是困难问题的学习。ReCAPTCHA的数据用于图书的数字化，大量用户在网上对这项工程做出了贡献。 ESP游戏和ReCAPTCHA都是杰出的青年科学家Luis von Ahn提出的。von Ahn将这些方法进一步升华，提出了人机协同计算（Human Computation）概念。可以认为世界上两种计算机，一种是电子计算机，另一种就是人本身的“计算机”。两种计算机各有所长，可以互相取长补短，协同合作，完成任务。这就是人机协同计算的主要想法。总之，有三种方式帮助收集数据，日志数据挖掘、众包、人机协同计算。日志数据挖掘中，用户无意识地提供了数据。众包和人机协同计算中，用户有意识地提供了数据，一个是得到经济上的报酬，另一个是得到其他的满足。 3. 有效利用人机交互数据只要我们能够很好地设计数据获取的方法，以及机器学习的方法，并且将两者很好地结合起来，就能极大地提高机器学习的性能。这里举一个例子，是我以前在微软亚洲研究院与同事们做的一个工作，我们称之为匹配学习（learning to match）。图片标注数据学习到的图片与标记的相似度假设有两个空间涵盖两种异质数据，例如，图片与标记，查询语句与网页。如果我们能够得到部分异质数据的匹配关系，就可以利用匹配学习的方法学到所有异质数据的匹配关系，也就是异质数据的相似度。而这个学习任务中的训练数据可以从人机协同计算、日志数据挖掘中获取。事实上，只要能获得足够多的数据，就能学习到很好的匹配模型。在互联网搜索中学到的查询与网页匹配的模型比经典的BM25、语言模型等有更好的性能。基于大规模数据的图片标注学习使计算机对图片的 “语义理解”变为可能。以上两图给出匹配学习用于图片标注时的示例。 4. 机遇与挑战事实证明从人机交互中获取数据是提高机器学习的有效手段。日志数据挖掘、众包、人机协同计算的方式孕育着巨大的可能性、同时也带来众多的挑战。设计数据收集方法时，我们需要考虑，如何调动大众，如何处理大数据，如何保证数据的质量，如何用于具体应用；设计学习方法时，我们需要考虑，如何实施大规模机器学习，如何提高学习的准确性。人机交互中学习还有许多有趣的问题正在等待我们的解决。 5. 致谢本文的撰写在与杨强教授等的讨论中得到了启发，介绍的工作是与武威博士、徐君博士等的合作成果。受刘江主编邀请在全国软件开发者大会上作了相同内容的大会报告。在此对他们表示衷心感谢。参考文献 1.李航，《机器学习正在改变我们的工作与生活》，新浪博客，2011。 2.李航，《统计学习方法》，清华大学出版社，2012。 3. David McAllester, Occam's Razor Theorem, Lecture Notes. 4.Edith Law and Luis von Ahn, Human Computation, Morgan Claypool Publisher, 2011. 5.Wei Wu, Hang Li, and Jun Xu, Learning Query and Document Similarities from Click-through Bipartite Graph with Metadata, Microsoft Research Technical Report, MSR-TR-2011-126, 2011.; 个人分类: 机器学习|3970 次阅读|0 个评论

《失控》笔记第 01 章人造与天生（The Made and Born）: zjie 2011-3-6 16:52; 《失控》 Out of Control 副标题: 全人类的最终命运和结局 English: The New Biology of Machines, Social Systems, and the Economic World 豆瓣介绍： http://book.douban.com/subject/5375620/ 原作名: Out of Control: 作者: 凯文·凯利译者: 东西文库出版社: 新星出版社出版年: 2010-12 作者简介：凯文·凯利（Kevin Kelly，1952～，人们经常亲昵地称他为 KK），《连线》（Wired）杂志创始主编。在创办《连线》之前，是《全球概览》杂志（The Whole Earth Catalog，乔布斯最喜欢的杂志）的编辑和出版人。1984年，KK发起了第一届黑客大会（Hackers Conference）。他的文章还出现在《纽约时报》、《经济学人》、《时代》、《科学》等重量级媒体和杂志上。凯文·凯利被看作是“网络文化”（Cyberculture）的发言人和观察者，也有人称之为“游侠”（maverick）。1999年的电影《黑客帝国》（Matrix）在某种程度上是对凯文·凯利对网络文化的观察和预言的一种隐喻。《失控》也是该片导演要求主要演员必读的三本书之一。读书笔记：序这是“众包”的方式，自底向上完成的翻译，是“峰群思维”的体现。这批“峰群”的整体意识希望向中国大陆引入这本书，推介这本书！ “这本书如今在美国的销量要比它当初发行时的销量还要好。” “坏消息是，在过了二十年后，我们对于如何使大规模复杂事物运作起来的理解仍然少有进展。我很遗憾的告知大家，不论是人工生命还是机器人技术，抑或是生态学或仿真学领域中，并没有出现新的重大思想。” – From KK 《失控》中文版序 ( 本系列读书笔记最早发布于本人的独立博客 http://www.zhengjie.org ）第 01 章人造与天生（The Made and Born） 1.1 新生物文明 – 本书主题 “自然王国和人造王国正在融合；机器正在生物化；生物正在工程化。”1.1 – P3 “The realm of the born—all that is nature—and the realm of the made—all that is humanly constructed—are becoming one. Machines are becoming biological and the biological is becoming engineered.” KK 想深刻探讨的，就是“人造”（The Made）和“天生”（The Born）会融合吗？能互相借鉴吗？乃至于本书的主题： “人造与天生的联姻”1.1-P3 （1.1 节，第3页） “The Marriage of the born and the made.” KK认为，生命的这种“失控”态的“自然之道”是“人造”的必然未来，而生命本身也将融入人类的“技术”！未来的他们会互相联姻，达到一个新生物文明（neo-biological civilization）。 “Our future is technological; but it will not be a world of gray steel. Rather our technological future is headed toward a neo-biological civilization.” 1.2 生物逻辑的胜利 – 本书思路与结构 KK 认为长久以来，人类制造技术是 “钟表工作逻辑”－Clockwork logic ，是“机械的逻辑”- the logic of machine，或是“技术逻辑”- the logic of Technos 提出“复杂系统”complex system 一词。复杂系统的实例：细胞 Cell，草原 Meadow，经济 Economy，大脑 Brain “除了‘生物逻辑’Bio-logic之外，没有任何一种逻辑能够让我们组装出一台能够思想的设备，甚至不可能组装出一套可运行的大型系统。”1.2-P4 “We now see that no logic except bio-logic can assemble a thinking device, or even a workable system of any magnitude.” “生物逻辑” Bio-logic / the logic of Bios 或 “生命法则”the laws of life 的特质有： - 自治 autonomous ； - 自组织 Self-organization ； - 自我维持 self-sustaining； - 自我完善 self-improving； - 自我复制 self-replication； - 自我管理 self-governance； - 有限自我修复 limited self-repair; - 适度进化 mild evolution; - 局部学习 partial learning …… KK 认为： “生物逻辑正在被引入机器，同时技术逻辑也正在被引入生命”1.2-P5 “Yet at the same time that the logic of Bios is being imported into machines, the logic of Technos is being imported into life.” “某一天，所有结构复杂的东西都被看作是机器，而所有能够自维持的机器都被看作是有生命的。”1.2-P5 “all complicated things can be perceived as machines, and all self-sustaining machines can be perceived as alive.” 当以上两者都具备“生命属性”Lifelikeness 时，KK将这些不管是人造的还是天生的（或有机的），统统叫做 “活系统”vivisystem。由此，KK作为一个科学记者，对这个大统一的仿生学前沿（unified bionic frontier），在后续章节中报道了来自生物界的“活系统”，如：第02章：社会性昆虫 social insects（蜂群和蚂蚁群的集体智慧、活系统定义、网络无处不在）第04章：复原生物学 restoration biology （如何把草原恢复成原样）第05章：地球生态圈与共同进化 Coevolution （盖亚假说、“囚徒困境”游戏）第06章：自然界的流变（生死循环、稳定性与多样性、负熵、超有机体）另外大部分章节报道了“人造活系统”（artificial vivisystems）的前沿研究及思想：第03章：机器人原型机 robot prototypes （机器人科技的前沿）第07章：控制的涌现 Emergence of Control （反馈、控制到自指、失控）第08章：复制珊瑚礁 coral reef replicas，组装生态系统 ecosystem assembly，到生物圈2号Biosphere 2 project 第09章：失控生物学 Out-of-control biology 第10章：工业生态学 Industrial Ecology 第11章：网络经济学 Network Economics 第12章：电子货币 E-Money （加密永胜 encryption always wins、传真机效应、免费模式、收益递增率（拥有者获得）、隐秘经济underground economies）第13章：虚拟现实世界 Virtual reality worlds （模拟类游戏，联网角色扮演游戏、军事战争仿真）第14、15、17章：人工生命、人工进化、人工学习、遗传算法第16章：控制的未来（合成动画角色 synthetic animated character）第18、19章：进化、进化的进化、学习与进化、后达尔文主义、存在突变、发育和遗传的深入、复杂性原理、人工合成进化第20、21章：生命的数学、秩序之秘、《GEB》自指和怪圈、网络动力学、自催化、混沌的边缘、《复杂》、进化的趋势与目的第22章：预测 Prediction （混沌中的秩序、短期预测、战争预测、智能推荐、生长曲线、存在-预测-适应-未来的关系、全球模型的局限、会学习和预测的系统才能生存）第23章：讲述了 KK 脑中的“进一步疑惑” 第24章：提出“无中生有、生生不息”的九条“神律”（the laws of god），他认为这些法则是所有自我维持和自我完善系统共同遵循的基本原则。“they are the fundamentals shared by all self-sustaining, self-improving systems.” 从上述章节看到，《失控》一书中，与互联网有直接关联的是第 2、11、12、13、16章，个人认为第 14、17-22 章是本书的精华所在，在这里真正进入了“高潮”！ 1.2 节的结尾，KK 提出“自然还是一个“文化基因库”（meme bank），是一个创意工厂….蕴含着后现代隐喻（postmodern metaphors）。对新生物文明来说，摧毁一片草原，毁掉的不仅仅是一个生物的基因库，还混掉了一座蕴藏着各种启示、洞见和新生物文明（neo-biological civilization）模型的宝藏。”1.2-P6 从这个角度，KK 赋予了 “环境保护”新的意义！！ 1.3 学会向我们的创造物低头通过下面的的例子，KK 形象的描述了未来。 “奶牛和胡萝卜是跟蒸汽机和火药一样的人类发明。只不过，奶牛和胡萝卜更能代表人类在未来所要发明的东西-生长出来而不是制造出来的产物。”1.2-P5 因此，这是一个悖论：当我们未来将生命法则 – “神律”赋予机器时，我就必然丧失了对他的控制，因为“自己是生长出来的”，它的“长”又是“失控”的！所以我们“将不再完全拥有自己最得意的创造物”。对 KK 来说，一个“失控”的未来人造世界，是最美妙的结局！（待续。。。）; 个人分类: 《失控》笔记|4483 次阅读|0 个评论

一个新词Crowdsourcing（110212）: 热度 1 ymin 2011-2-12 11:38; 一个新词Crowdsourcing（110212）闵应骅 IT行业新词层出不穷。最近在CACM新闻上看到Crowdsourcing这个词。不懂，查了查wikipedia。原来这个词是2006年在一本网上杂志发表的文章里提出来的,把crowd和sourcing连起来。并不太早，不过本人孤陋寡闻而已。也许技术上的新想法要经过一段时间才能被公众认可。百度把它翻成“众包”。众包指的是一个公司或机构把过去由员工执行的工作任务，以自由自愿的形式外包给非特定的（而且通常是大型的）大众网络的做法。众包的任务通常是由个人来承担，但如果涉及到需要多人协作完成的任务，也有可能以依靠开源的个体生产的形式出现。对消费电子产品的技术进步，专业和业余人员都可以有所作为。公司可以利用公众的聪明才智。它既不同于外包，也不同于开源。今天的因特网提供这种可能，使得任何人都是潜在的信息提供者。例如，通过wiki，人们可以积累知识；人们可以跟踪群发事件和灾难；通过文本消息和电子邮件，为某一个任务创建临时组织。总之，在网上集体完成一个任务。 Google地图不但任何人都可以看，可以用，而且可以参与修改和补充。wiki类型的软件可以收集任何观察、评论和其他有关的数据。最成功的商业众包平台是亚马逊的Mechanical Turk。它对有需求的可扩展的工作组提供商业和开放的机会。雇人和受雇，以及经费交换都通过亚马逊的网站进行。许多组织也在使用众包。军方正在探索用众包获取智能信息，政府机关用它收集道路维修、城市规划等各种信息，救济机构用它更好地了解救助需求和可用资源。众包已经在世界许多国家的重大事件中发挥了作用。美国国防部研发办公室（DARPA）去年12月搞了一个所谓DARPA Network Challenge：如果谁能最早在美国本土10个固定地点空中发现10个8英尺高的大红气象气球，奖4万美金。结果有4000个小组参与此事。这属于众包，小组内要合作，互相间要保密，牵涉到因特网、社会网络、实时通信、广域合作和其他众包技术。这是有军事意义的活动。MIT的一个小组获胜。他们用了9小时。众包可以非常有效地群策群力地对付突发事件，这是它的优点。但是，也有问题。不可信的信息、不准确的信息是不可避免的，但是，你得相信，大部分信息是可信的、准确的。众包的过程管理是一个问题。然而，基于依靠群众的思想，众包将对产品开放、问题求解、市场决策引向不同的思维模式。互联网是一把双刃剑。国内为减轻它带来的危害付出了许多财力和人力。我觉得，应该积极地多从正面引导，提供更多有利于人群的方法和途径来用好因特网。也许，众包是一种办法。; 个人分类: 网络|4731 次阅读|1 个评论

众包，一个不成熟的类威客概念: liufeng 2010-12-14 12:11; 2005年威客witkey理论在中国诞生，一年之后，2006年连线杂志记者美国人Jeff Howe推出众包（Crowdsourcing)概念。迄今为止众包没有意识到互联网的知识价值化问题，没有对它诞生的根源进行探讨。还处在概念模糊和泛化应用的阶段。威客witkey理论指出，威客产生于互联网的互动问答功能,只有承认互联网的知识智慧具有经济价值，才能推动互联网用户回答问题，完成任务。不可否认，由于美国在互联网概念传播上的优势，即使我们关于互联网的某些研究可能比美国人更早，走的更远，也无法在世界范围内取得优势。从威客与众包的对抗上可以看出中国的原创理论在传播上的弱势和困境。这种弱势和困境背后的因素包括：语言屏障，国家影响力，大众心理等。我们无法扭转这种劣势，只能在内心里告诉自己，在科学研究方面， 1。我们可以赶在美国前面，比他们发觉更早，比他们走的更远。 2。美国的某些理论和概念提出时不具备科学严谨性，不通过同行评议，具有炒作成分。特别是互联网和IT领域。还是分析一下威客和众包之间的区别和相同点，具体如下。 1，美国的众包( Crowdsourcing) 概念 1。第一次提出时间： 2006年6月《连线》杂志记者Jeff Howe首次推出众包概念。 2。核心思想：Jeff Howe在维基百科上为众包下了一个定义：众包指的是一个公司或机构把过去由员工执行的工作任务，以自由自愿的形式外包给非特定的（而且通常是大型的）大众网络的做法。众包的任务通常是由个人来承担，但如果涉及到需要多人协作完成的任务，也有可能以依靠开源的个体生产的形式出现。 3。理论体系形成时间：2009年3月出版《众包Crowdsourcing》 5。媒体报道：从2006年6月起，包括《连线》，纽约时报，英国经济学人等多家西方媒体对众包Crowdsourcing进行报道，Jeff Howe为众包开通的主题博客上与读者展开了激烈的讨论。 6。商业应用：到2009年，众包Crowdsourcing依然没有提出明确的商业模型。 2。中国的威客（witkey)理论 1。第一次提出时间： 2005年7月中国科学院研究生院，2005年12月新浪科技 2。核心思想：人的知识，智慧，经验，技能通过互联网转换成实际收益的互联网新模式。主要应用包括解决科学，技术，工作，生活，学习等领域的问题。人类的知识和智慧将会因为互联网而被无限放大和传播，并创造出令人惊讶的社会财富。 3。理论体系形成时间：2006年3月中国科学院研究生院研究生毕业论文威客的商业模式分析，2007年12月国际国际知识与系统科学学会英文期刊ISKSS上发表学术论文威客模式在中国，详细阐述了威客理论的起源，规律和发展。论文地址： http://www.witkey.com/theoryview.php?id=16 4。媒体报道： 2005年11月 21世纪经济报道第一次报道了威客概念，在此后的四年里，中央电视台，人民日报，中国青年报，英国经济学人，德国明星周刊，俄罗斯国际文传电讯，韩国民族日报等数百家媒体对威客概念进行了报道，2007年5月威客进入高考试题，2007年9月进入教育部颁布的新汉语词汇。 5。商业应用：包括k68.cn，猪八戒网，任务中国，淘智网，witkey.com等数百家网站通过商业实践已经形成成熟的商业模式。 3。美国的众包概念依然很不成熟从中国提出的威客理论看，美国的众包概念依然很不成熟。第一，美国的众包概念不了解自己的起源，威客理论指出，这个领域起源于BBS的互动问答功能。第二，美国的众包概念没有认识到互联网的知识智慧的经济价值化问题，威客理论指出，只有承认人们的知识和智慧的价值性，才能鼓励他们积极地参与到问题的解决中去。第三，美国的众包概念没有成熟的商业模型，甚至把维基百科也当作众包。威客理论提出，用悬赏模式应对低端任务，用招标模式应对中高端任务，为每个威客开辟个人空间进行能力展示和智力作品买卖，对每个任务发布者和威客进行信用评级，开发自己的支付宝进行支付保护; 个人分类: 威客理论|4305 次阅读|0 个评论

更多...

帐号		自动登录	找回密码
密码			注册

关闭 安全验证

标签: 众包

相关帖子

相关日志

关闭安全验证