科学网

 找回密码
  注册

tag 标签: 维基百科

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

[转载]TF-IDF
baiyunrui 2011-8-15 18:05
维基百科,自由的百科全书 TF-IDF (term frequency–inverse document frequency)是一种用于 资讯检索 与 文本挖掘 的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个 语料库 中的其中一份 文件 的重要程度。字词的重要性随着它在文件中出现的次数成 正比 增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被 搜索引擎 应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,互联网上的搜寻引擎还会使用基于连结分析的评级方法,以确定文件在搜寻结果中出现的顺序。 目录 1 原理 2 例子 3 在向量空间模型里的应用 4 参考资料 5 外部链接 原理 在一份给定的文件里, 词频 (term frequency,TF)指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被正规化,以防止它偏向长的文件。(同一个词语在长文件里可能会比短文件有更高的词频,而不管该词语重要与否。)对于在某一特定文件里的词语 t i 来说,它的重要性可表示为: 以上式子中 n i , j 是该词在文件 d j 中的出现次数,而分母则是在文件 d j 中所有字词的出现次数之和。 逆向文件频率 (inverse document frequency,IDF)是一个词语普遍重要性的度量。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取 对数 得到: 其中 |D|:语料库中的文件总数 :包含词语 t i 的文件数目(即 的文件数目)如果该词语不在语料库中,就会导致被除数为零,因此一般情况下使用 然后 某一特定文件内的高词语频率,以及该词语在整个文件集合中的低文件频率,可以产生出高权重的TF-IDF。因此,TF-IDF倾向于过滤掉常见的词语,保留重要的词语。 例子 有很多不同的 数学公式 可以用来 计算 TF-IDF。这边的例子以上述的数学公式来计算。词频 (TF) 是一词语出现的次数除以该文件的总词语数。假如一篇文件的总词语数是100个,而词语“母牛”出现了3次,那么“母牛”一词在该文件中的词频就是3/100=0.03。一个计算文件频率 (DF) 的方法是测定有多少份文件出现过“母牛”一词,然后除以文件集里包含的文件总数。所以,如果“母牛”一词在1,000份文件出现过,而文件总数是10,000,000份的话,其逆向文件频率就是 ln(10,000,000 / 1,000)=4。最后的TF-IDF的分数为0.03 * 4=0.12。 在向量空间模型里的应用 TF-IDF权重计算方法经常会和 余弦相似度 (cosine similarity)一同使用于 向量空间模型 中,用以判断两份文件之间的 相似性 。 参考资料 Salton, G. and McGill, M. J. 1983 Introduction to modern information retrieval . McGraw-Hill, ISBN 0-07-054484-0 . Salton, G., Fox, E. A. and Wu, H. 1983 Extended Boolean information retrieval. Commun. ACM 26, 1022–1036. Salton, G. and Buckley, C. 1988 Term-weighting approaches in automatic text retrieval. Information Processing Management 24(5): 513–523. 外部链接 Term Weighting Approaches in Automatic Text Retrieval Robust Hyperlinking :An application of tf–idf for stable document addressability.
个人分类: 信息检索|2486 次阅读|0 个评论
[转载]散度
hotdogqsl 2011-8-6 09:35
散度 维基百科,自由的百科全书 跳转到: 导航 , 搜索 微积分学 函数 · 导数 · 微分 · 积分 显示▼ 隐藏▲ 基础概念 函数 · 数列 · 级数 · 初等函数 · 极限 · 无穷小量 · 收敛数列 · 收敛性 · 夹挤定理 · 连续 · 一致连续 · 间断点 显示▼ 隐藏▲ 一元 微分 导数 · 高阶导数 · 介值定理 · 中值定理 ( 罗尔定理 · 拉格朗日中值定理 · 柯西中值定理 ) · 泰勒公式 · 求导法则 ( 乘法定则 · 除法定则 · 倒数定则 · 链式法则 ) · 洛必达法则 · 导数列表 · 导数的函数应用 ( 单调性 · 极值 · 驻点 · 拐点 · 凹凸性 · 曲率 ) 显示▼ 隐藏▲ 一元积分 不定积分 · 定积分 · 积分的定义 ( 黎曼积分 · 达布积分 · 勒贝格积分 ) · 积分表 · 求积分的技巧 ( 换元积分法 · 分部积分法 · 三角换元法 · 降次积分法 · 部分分式积分法 ) · 牛顿-莱布尼茨公式 · 广义积分 · 主值 · 柯西主值 · Β函数 · Γ函数 · 数值积分 · 牛顿-寇次公式 · 近似积分法 ( 矩形法 · 梯形法 · 辛普森积分法 ) 显示▼ 隐藏▲ 多元微积分 多元函数 · 偏导数 · 隐函数 · 全微分 · 方向导数 · 梯度 · 泰勒公式 · 拉格朗日乘数 · 多元函数积分 · 多重积分 · 广义多重积分 · 路径积分 · 曲面积分 · 格林公式 · 高斯公式 · 斯托克斯公式 · 散度 · 旋度 显示▼ 隐藏▲ 微分方程 常微分方程 · 分离变数法 · 积分因子 · 欧拉方法 · 柯西-欧拉方程 · 伯努利微分方程 · 克莱罗方程 · 全微分方程 · 线性微分方程 · 差分 方程 · 拉普拉斯变换法 · 偏微分方程 · 拉普拉斯方程 显示▼ 隐藏▲ 数学家 牛顿 · 莱布尼兹 · 柯西 · 黎曼 · 拉格朗日 · 拉普拉斯 · 欧拉 设某向量场由 , 给出,其中P、Q、R具有一阶连续 偏导数 ,Σ是场内的一片 有向曲面 , n 是Σ在点(x,y,z)处的单位 法向量 ,则 叫做 向量场 A 通过曲面Σ向着指定侧的 通量 (或流量),而 叫做向量场 A 的 散度 ,记作 或 ,即 性质 以下的性质都可以从常见的求导法则推出。最重要的是, 散度 是一个 线性算子 ,也就是说: 其中 F 和 G 是向量场, a 和 b 是实数。 设φ是标量函数, F 是向量场,则它们的乘积的 散度 为: 或 设有两个向量场 F 和 G ,则它们的 向量积 的 散度 为: 或 其中 是 旋度 。
3000 次阅读|0 个评论
Google祝贺孟德尔诞辰189周年
热度 4 gaojianguo 2011-7-20 12:04
Google祝贺孟德尔诞辰189周年
今天的Google Logo十分漂亮,原来是提醒大家孟德尔( Gregor Johann Mendel )诞辰189周年。 十分奇怪的是,我在 维基百科 怎么就看不了图片呢?之前以为是没有在维基百科注册的原因,结果发现注册之后也看不了, 有谁知道原因吗? 没有维基百科和 谷歌 ,这科研是没法进行下去了。。。 相关阅读: 饶毅老师的博文: 孟德尔和达尔文
个人分类: 生活点滴1|5334 次阅读|16 个评论
4种 服务入口(主页) 对比
tengyi1960 2011-7-8 10:57
对比1 中科院国家科学数字图书馆 维基百科,自由的百科全书 http://zh.wikipedia.org/wiki/%E4%B8%AD%E7%A7%91%E9%99%A2%E5%9B%BD%E5%AE%B6%E7%A7%91%E5%AD%A6%E6%95%B0%E5%AD%97%E5%9B%BE%E4%B9%A6%E9%A6%86 对比2 中国科学院国家科学图书馆_百度百科 http://baike.baidu.com/view/752623.htm 对比3 中国科学院国家科学图书馆 http://www.las.ac.cn/ 对比4 中国科学院图书馆(中国科学院国家科学图书馆) http://www.las.cas.cn/
个人分类: 一家之言|1956 次阅读|0 个评论
入其境方知其味
热度 1 dtiger009 2011-5-20 19:51
我一直觉得自己是个思维很有发散性,却偶尔发散过度,想法太多的丫头,以至于最后能获得答案求得解决的问题往往少之又少,写文章也常深感想表达一个意思往往一堆词蹦出来,只有不知道择哪个好,却也从不为没词犯愁。不知道这是否也是一般女孩的通病。 在初入我的研究领域的时候,曾经历一年的黑暗期,被无止境的英文文献压迫的近乎崩溃,满目是新词,从没觉得自己英语水平那么失败,自己的口语从来都是被老师表扬的对象!不过涉及专业,什么都要重新开始,从二叠三叠纪之交到前寒武,我一次跨越了多少漫长的地质年代,从岩石矿物到藻类,隔行如隔山,一个单词一个单词老老实实查,每个单词背后都是一串的GOOGLE和维基百科!恶补那些最最basic的东西,研一的一年除了学习、兼职、野外就是抱着这些无趣的大部头啃,无聊之余就看看老友记,在笑声中忘却脑力肉搏的疲惫。在一年的翻滚之后,有一天我忽然发现自己能够基本脱离词典,一目十行势如破竹的读英文了,而且常常有种想用英语表达的冲动,嘿嘿量变到质变,难道真的已经升华了么?一点点体会自己的成长,成长的快乐开始让我领悟到许多过来人的劝解,入行要十年磨一剑,入行之初的焦躁急迫恨不能一日速成的心态早已被平静的审视自己静静的守望自己成长的淡然和自信所取代;文献的精读和细品,看到多了也慢慢认识了本领域的名人和新星,也敢大言不惭的说某位大牛做得如何了;胸有诗书气自华,也似乎觉得自己的性情悄然的蜕变的多了几分成熟。不过我深知一切都才刚刚起步,未来的路还依旧漫长。但重要的是我在自己的变化中发现了自己的潜能,看到自己现在选择的路似乎还是比较合适的,也就是重新建立了自己以前崩溃的自信心。学海无涯,不过开始看得到边际了。 文献是一个方面,还有薄片观察的技能也在潜移默化中提高。自己从小在城市长大,多静少动,动手能力观察能力都比较差,打心里面也更看重理论总结而忽略实验观察,觉得后者是小儿科。从本科到现在,自己经历一段较完整的科研流程的磨砺,深刻理解实验观察实在是科研最基础的步骤,积累第一手的数据材料,也很为第谷不平,观察能力也是一种超人之才,而且又坚经受了岁月的洗礼,更见其功力深厚,最后给伽利略一锅端了,唉可惜,不过总是为科学做了贡献,谁出名不一样呢?智者也是历史的必然。我开始看薄片简直要掉眼泪,一看几个小时什么都没有,一点点摸索,请教,补习矿物学的有关知识,学到啥就记下啥,一块片子反复把玩,琢磨,有时一看就是几个小时。学习之初走过的弯路、做过的傻事现在都不可想象,第一天折腾半天看不到东西竟然是自己把片子放反了。这么笨拙的错误估计能让人笑掉大牙! 研究的过程也是一个不断了解自己、反省自己的过程。每天早上给自己一个今日安排,每晚想想今天做了什么,为什么有的没有做出来。在很多琐屑的流程中我深感科学的严谨和缜密,其实把研究肢解开来都是小事,但是纵使一样的材料最后为何有人能出成绩,有人做的一塌糊涂,做事的条理性、严密性等等其实早已冥冥中预言了你的成败,谁说科研没有门槛,我看科研不仅有门槛,而且相当高,它明显更垂青做事认真、谋划细致、善于思考的人,不具备这些品质的人就是拼死做大抵也做不出什么吧。人常说性格决定命运,科研何尝不如此! 最近这半个月看这批片子,每日看的,心中念的,概莫能外,做梦似乎都是它们,喃喃中想着文章的构思,图版的布局,一直深感自己的笨拙和无知,呵呵如果人又笨又不付出时间,何谈产出? 今天中午去参加所里的红歌会文艺排练,是表演唱《绣红旗》,专门为我们请来了它所的朱老师指导,我开始以为专业人士来了肯定要纠正我们的动作啥的。结果人家一来,首先不谈应该怎么跳,而是花了十多分钟为我们介绍本歌曲的背景,反复强调要我们体会和领悟绣者在临死前遥想革命胜利即将到来的复杂心情,带着我们入境!她一直都说,只要体会了感情,自然就能跳得好!我当时灵光乍现,一时间浮想联翩,朱老师教授的跳舞的秘诀,其实不在跳舞本身,而在舞者心境的领悟,我一下子想起小时候读过陆放翁给其子的诗:汝果欲学诗,功夫在诗外。 王国维在《人间词话》说: “ 古今之成大事业、大学问者,必经过三种之境界: ‘ 昨夜西风凋碧树。独上高楼,望尽天涯路 ’ 。此第一境也。 ‘ 衣带渐宽终不悔,为伊消得人憔悴。 ’ 此第二境也。 ‘ 众里寻他千百度,蓦然回首,那人却在,灯火阑珊处 ’ 。此第三境也。 ” 这第一境还是谋划阶段,突出一个想字,订立目标,树立理想;第二境则是苦苦求索阶段,突出一个苦字,路漫漫其修远兮吾将上下而求索。第三境则是极致境界,是回顾阶段,突出一个通字,学得古今中外之智慧大成,融会贯通,思维的碰撞,怎能不产生绚烂的火花? 文艺相通,科学不也一样么,科研的秘诀或许也就在投入的程度,即一个专字吧!做学问、成大事业者,要达到第三境界,必须有专注的精神,反复追寻、研究,下足功夫,自然会豁然贯通,有所发现,有所发明,就能够从必然王国进入自由王国。 前天看一位销售大牛的传记,所谓专业就是不断的重复,果真如此!入其境自知其味。 偶们这些还处于初级阶段的还要慢慢奋斗,直到达到柳暗花明又一村的美境! 读书、修身、齐心,与诸多学子共勉!
2022 次阅读|1 个评论
[转载]據說:方滨兴,维基百科词条今天已更新
热度 2 jiangjinsong 2011-5-20 11:11
方滨兴,维基百科词条今天已更新 轉自: http://club.autohome.com.cn/bbs/thread-c-704-10533130-1.html 方滨兴 维基百科,自由的百科全书 跳转到: 导航 , 搜索 当前 传记条目 需要补充更多 来源 。 (2011年5月19日) 请协助补充来自 可靠来源 的引用以 。 关于在世人物,无法查证的内容 将被立即移除 ,特别是当其可能造成在世人物的声誉受损时。 方滨兴 中国 网络防火墙 专家, 中国工程院院士 , 北京邮电大学 校长 出生 1960年7月 国籍 中华人民共和国 政党 中国*** 经历 1978年至1981年,哈尔滨工业大学计算机系,学士学位 1982年至1984年,清华大学计算机系,硕士学位 1986年至1989年,哈尔滨工业大学计算机系,博士学位 1990年至1993年,国防科学技术大学计算机科学与技术博士后流动站,在职学习 方滨兴 (1960年7月-), 中国工程院院士 , 中国*** 党员, 1960年 7月 出生于 黑龙江省 哈尔滨市 ,祖籍为 江西省 万年县 。 1978年 至 1981年 在 哈尔滨工业大学 取得 学士 学位, 1982年 至 1984年 在 清华大学 取得硕士学位, 1986年 至 1989年 在哈尔滨工业大学取得博士学位, 1990年 至 1993年 于国防科学技术大学计算机科学与技术博士后流动站在职学习。 1984年 至 1999年 在 哈尔滨工业大学 任教, 2001年 获得 国务院特殊津贴 , 2005年 被选为 中国工程院院士 。 2006年 至今任国家计算机网络与信息安全管理中心名誉主任。 2007年 12月 至今任 北京邮电大学 校长 , 他是中国网络 防火长城 (GFW)关键部分的首要设计师 ,因此被网民称为“中国防火墙之父” 。 个人介绍 方滨兴的官方在线简历也显示,他主持建设了“国家网络安全监控平台”等多个相关系统,并“在公共互联网上的网络安全事件的处置等方面发挥了重大的作用” 。 2010年 谷歌退出中国事件 中,方滨兴多次出面为“ 中华人民共和国网络审查 ”等制度辩护。在2010年3月23日中国中央电视台CCTV4的今日关注节目 中,方滨兴声称谷歌本身建立了 寒蝉效应组织 并通过其对搜索结果进行内容审查。但有网友指出,方滨兴对于寒蝉效应组织的描述与事实相反。 2010年 12月22日 ,方滨兴在 新浪微博 注册帐号,并取得 新浪 的实名认证。但开通后即遭大量网友戏谑或质问政府对信息的封堵,表达对中共当局筑下 防火长城 的不满。新浪方面则删除大量网友的评论,随后方滨兴关闭微博。 值得注意的是,方滨兴使用的是 Google 的 Android 手机微博客户端。 2011年2月,方滨兴在接受《 环球时报 》英文版采访时称在自己的家用电脑上有6个 VPN 用以测试 防火长城 。对于微博上网民对自己的攻击,方滨兴认为是自己“为国家作出的牺牲”。 被问到防火长城是如何运作的时候,他表示那是“国家机密”。文章发表后引起强烈反响,《环球时报》随后在官方网站上撤下了该篇采访,不过文章仍然能从其他转载媒体的网站中找到。 同年5月,《环球时报》英文版问到方滨兴关于5月6日起中国大陆互联网经常出现国际出口故障不能上境外网站的时候,他说:“一些 ISP 必须为自己的用户支付国际流量费用,因此这些公司有动机去阻碍用户访问国外网站。” 2011年5月19日下午 ,其在 武汉大学 讲演时遭抗议者 扔鞋 并被击中,其中一只鞋砸中方的胸部,抗议者另外所扔的另一只鞋及投掷鸡蛋则并未击中。
个人分类: 精彩轉帖|4162 次阅读|3 个评论
科学、科学主义与打科学主意的人
热度 6 陈安博士 2011-4-14 17:10
   先从维基百科上扒拉下来关于科学主义的说法:    科学主义 是这样的一种思想: 即, 自然科学 是最权威的世界观, 也是人类最重要的知识, 其高于所有一切其他类的对生活的诠释。科学主义这个词首先被社会科学家,如 弗里德里希·哈耶克 ,和科学哲学家, 如 卡尔·波普尔 等使用,用来描述许多科学家所共有的态度和信念, 这一信念让自然科学的研究和其所采用的方法终于上升到意识形态的水平。对科学主义的经典论述, 正如物理学家 卢瑟福 所言:“除集邮,皆物理。”("There is physics, and there is stamp-collecting.")   科学主义一词有时在两个方面亦被用作略带 贬义 的解释: 表示不恰当的使用 科学 或在不适当的地方运用科学主张,例如,当讨论主题的范围明显超越 科学 范畴,或者没有足够的经验证据来证明一项科学结论的情形。在这种使用情况下,讽刺的是科学主义呼吁科学权威化的论证。 指“自然科学的方法,或者自然科学所认证的范畴分类和事物,是任何哲学和任何研究的唯一恰当的元素的信念”,并且这一过程伴随着“心理体验方面的经验失效”在这种用法下,(至少在更极端的定义下)强调科学主义在 实证主义 中扮演重要位置。   看来,科学主义的含义里天生就有点不那么褒义,贬义性的一面更明显一些。这一点和社会主义、共产主义等有些不同。   加上很多自然科学背景的学者喜欢说“你这样是不科学的”、“你的论断没有科学依据”之类的话,来指责对方,但是也许没有跟上更详细的解释(自然科学家也许觉得解释你们也听不懂,那还不如直接给出结论得了)。   而现实中其实存在一些科学无法涉足的领域,比如人的心灵、情绪、信仰等,现在科学的方法还无法穷尽这些现象,至少现在不能,未来能不能还无法知道。   这样,因为存在对话渠道的天然鸿沟,自然科学家和人文学者之间就一直没有很好地进行沟通和交流,话语体系也存在着一定的差异。   每当自然科学家们宣称科学的时候,有时候宣称科学可以解释很多乃至所有自然现象的时候,人文学科学者就会觉得这太过强调科学了吧,于是,定义这批挥舞“科学”大旗的人为科学主义者。   按照我个人的理解,其实,一个东西上升为意识形态上的玩意儿时,就已经不够“科学”和“理性”了,对于解释自然和社会现象的学科,都是如此。但是,似乎学者们又不愿意于拘泥于就事论事的形而上学做法,总想更一般化一些,学科间如果能够实现融合一些则更好,如果能用一个统一的说法集成所有学科的共同点,则更佳。   而当指责一些学者的时候,将他们归类于过于强调某个意识形态的人群,变攻击一个人和一个说法为一类人一类说法,那就更过瘾了。   我一直认为,根本不会有人去声称自己愿意抗科学主义大旗,这个和坚持共产主义信仰好像是两个极端,坚持科学主义的内涵里就包括用科学解释一切的意思,那就是坚持片面,眼中只有科学而没有其他,而事实上,世界又是纷繁复杂的,科学不可能涵盖一切。   但是,如果说你不是科学主义者,但是却有着科学精神,这话就很爱听。科学主义和科学精神差异又在哪里呢?为什么大家都愿意抖擞精神,而不情愿皈依主义呢?也许,精神是个虚幻虚拟的东西,主义则必须完成皈依的过程,而皈依本身就有点很不科学的意思了,但是保持一种精神,似乎显得很高档。   最后的结果就成了这样:这个世界充满了打科学主意的人,都愿意满身充满科学精神,但是又不愿意以科学为信仰,为判断世界的标准和准则。
个人分类: 事论|3985 次阅读|11 个评论
方舟子与阿西莫夫
热度 36 hongfei 2011-4-7 01:52
方舟子与阿西莫夫 2011.04.07 科普作家对我的影响是很大的。从中学开始,对我影响最大的科普作家依次是阿西莫夫,马丁 加德纳,和卡尔 萨根。当然,盖莫夫以及其他人的科普著作我也非常喜欢。 维基百科Isaac Asimov信息链接: http://en.wikipedia.org/wiki/Isaac_Asimov 维基百科Martin Gardner信息链接: http://en.wikipedia.org/wiki/Martin_gardner 维基百科Carl Sagan信息链接: http://en.wikipedia.org/wiki/Carl_Sagan 阿西莫夫和我一样,是哥伦比亚大学化学系毕业的博士,所以我在哥大念博士的时候还专门去把他的博士论文找出来看过一下,顺便也看过当年哥大化学系的那些中国博士的博士论文,比如戴安邦、侯德榜、唐敖庆、徐光宪等等。 阿西莫夫在自传中说,他在哥伦比亚化学系念博士的时候一开始成绩不好,差点被退学,他自己到系主任那里力争才获得了一个on probation的待遇,在下一学期把成绩提高之后才获准继续攻读博士学位。阿西莫夫后来虽然也在波士顿做到了副教授,但终于发觉自己的长处是在写科普作品和科幻小说,于是一发不可收拾,成为20世纪,或者人类有史以来最了不起的科普作家和科幻小说作家。 方舟子一定也是非常喜欢阿西莫夫的。十几年前我以为他如果努力追求,或许可以成为中国的阿西莫夫。可惜从他写的那些科普作品来看,他肯定与阿西莫夫完全不在一个级别上面。其具体表现在于,阿西莫夫写的东西,即使让世界上最聪明的头脑看,也会觉得是值得推崇的好东西;而方舟子写的那些东西,显然不是给世界上的聪明人,或者想要成为聪明人的人看的。 由于自己资历比方舟子学弟长,见过的世面、读过的书和做过的研究也比方舟子学弟多,我自己看待方舟子学弟的角度自然一直和他的那些崇拜者以及反对者的角度很不一样。我从来没有因为方舟子学弟的任何成就而高看他,也不会因为他的任何过失而小看他。我依然认为他需要在支持、关心和批评下继续成长,就像我自己仍然在学士上继续追求进步一样。 我不会像舟子学弟那样崇拜鲁迅,也不赞成痛打落水狗,并且希望人们能够fair play。所以,除非舟子学弟自己愿意以阿西莫夫,马丁 加德纳或者卡尔 萨根的标准来要求自己,我并不会因为他达不到这些人的水平而苛求他。 最近各大媒体以及科学网纷纷讨伐舟子学弟,其实一会儿就会过去。凭良心说,像方舟子学弟这样的人,尽管他的绍兴师爷的形象着实惹很多人的反对和厌恶,还是应该算是好人和正人君子。方舟子所反对过的事情和人并不完全正确,他写的文章也涉及这样那样的缺陷。可是凭良心说,我还真没他那样大的勇气去把自己完全变成一个公众人物,去整日和社会上那些自己认为糟糕和愚蠢的人周旋。 顺便说一句,方舟子在涉及自己的母校问题上从来没有讳言去批评,清华大学好像近年来只有一个也叫方舟的女生能这样做。 从这个角度上讲,我还是比较赞赏方舟子学弟,并且以身为他的校友而略感自豪。
个人分类: 一家之言|24107 次阅读|94 个评论
[转载]【呃】国际标准化组织:数学升级至2.0版本
eulen 2011-4-1 18:49
今天,国际标准化组织(ISO)公布了一项新的决议,数学体系将进行一次全面的更新。果壳网死理性派第一时间为你报道。国际标准化组织(ISO)宣布,由于数学体系若干内在缺陷给人民生产生活带来不便,数学体系将升级至 2.0 版本。新版本的数学体系修复了大量 bug,并新增了不少特性。 此次更新包括: [新增]新增定理:黎曼假设为真。 [新增]新增定理:哥德巴赫猜想为真。 [新增]新增定理:NP 不等于 P。 [新增]新增证明方法:维基法。如果维基百科认为一个命题为真,则这个命题为真。 [新增]新增证明方法:课后练习法。证明过程可以用“留给读者作为练习”替代。 [新增]支持尺规作图三等分角。 [新增]支持洛必达法则在非 0/0 和 ∞/∞ 型式子中的应用。 [新增]优化了分形图形。现在分形图形更加平滑,可以进行快速渲染。 [新增]优化了无穷级数。你可以在任何条件下使用等式 1 + 2 + 3 + 4 + … = -1/12。 [新增]增加了费马所读书籍页面边缘的空白面积。 [修正]修正了巴拿赫-塔斯基复制漏洞。 [修正]修正了停机问题不可判定的问题。 [修正]修正了莫比乌斯环只有一面的问题。 [修正]修正了函数偶尔会处处连续但处处不可导的问题。 [修正]修正了罗素悖论,现在一个集合可以既包含自身又不包含自身。 [修正]修正了哥德尔不完备定理,现在所有的命题都可以被证明或者推翻。 [修正]将圆周率值调整为 3,与《圣经》列王记中的描述“他又铸一个铜海,样式是圆的,高五肘,径十肘,围三十肘”保持一致。 [修正]由于“负数”一词用字不和谐,现统一改为“非正非零数”。 [取消]取消了反证法。 [取消]取消了四色定理。 [取消]取消了对虚数 i 的支持。 [取消]因审查未通过,“夹逼定理”暂停使用。 此次更新自 2011 年 4 月 1 日起生效,请下发文件立即执行。果壳网死理性派将带领数学爱好者们一道,学习领会新版数学体系的精神,无障碍地由数学 1.0 过渡到数学 2.0 版本! 原文地址: http://www.guokr.com/article/18477/
1841 次阅读|0 个评论
下载维基百科wikipedia!
热度 4 zwresearch 2011-3-31 15:32
下载维基百科wikipedia!
论文外审啦,积德祈福啦~ Wikipedia (http://en.wikipedia.org/wiki/Main_Page)也就是维基百科是当前最有名的百科类网站,分门别类的以词条的方式详细介绍某个概念的历史、定义、发展和背景,大略来讲可以把它理解成为一本大词典。对于科研工作者而言,很多时候突然看到一个新的term,但是不明其意,或者理解它的含义,但不知道它属于哪个研究研究领域,和其他概念间有什么联系,这时wikipedia可以给你最好的介绍,并帮你在较短的时间内搭建起有关某个新领域学科的知识框架。当然有教材时,读书会学得更快,但很多新的研究方向早期都没有教材,更何况wikipedia包含的领域条目是如此之多之广。由于wikipedia多是由专家讨论编写,较普通搜索的介绍更具有权威性和可信性。最令人赞叹的是,wikipedia是免费的,向世界所有人无偿提供人类共同的知识宝库。 为什么要下载wikipedia?在线看不是挺好的么,而且下载的,没有图片(图片下载需要若干T),读起来乏味不少。可能下载有这些原因:对于知识的热爱、数据备份狂热症、对“局域网”无法访问wikipedia的担心(若干年前wikipedia就无法访问)、远离网络珍爱生命(上网总瞎转,浪费时间)但又舍不得网络的宝贵资源(如wikipedia)。好,言归正传,下面是使用方法: 1. 依据http://en.wikipedia.org/wiki/Wikipedia:Database_download找到最新版wikipedia的下载地址, 页面上说最新的完整版是2010年5月30日完成的一版,后面有更新的,据说未必完整(可似乎这个页面说明是很久以前的)。我们通过一个目录列表http://dumps.wikimedia.org/enwiki/看到所有英文的wiki数据库备份,以日期作为版本标识。本文选择http://dumps.wikimedia.org/enwiki/20101011/里面的,因为只需要下载一个文件且较新,比这个新的版本都需下多个文件。 2. 我们仅需要下载包含Articles, templates, image descriptions, and primary meta-pages的一个链接pages-articles.xml.bz2(实际下载文件enwiki-20101011-pages-articles.xml.bz2,6.2 GB),其他和wikipedia的更新历史、讨论有关的,我们这里都不需要,下载页面上给出的MD5校验值为7a4805475bba1599933b3acd5150bd4d。 3.同样的,中文的wikipedia的列表为http://dumps.wikimedia.org/zhwiki/,我们下载最新的http://dumps.wikimedia.org/zhwiki/20110322/页面里的链接pages-articles.xml.bz2(实际下载文件zhwiki-20110322-pages-articles.xml.bz2文件,497.8 MB),MD5值7c5f92b3465a3eb1ae9a769d0b39f5cb。 英文wikipedia阅读器:BzReader 4.下载阅读器bzReader(http://code.google.com/p/bzreader/页面左边BzReader.v1.0.13.msi),下载的wikipedia文件说白了就是一个巨型xml文件,bzReader读取该文件并建立其中的条目索引,以后每次查询term,就可以直接看到。需要注意的是,bzReader的运行需要.net framework的支持(http://www.microsoft.com/downloads/zh-cn/details.aspx?FamilyID=0a391abd-25c1-4fc0-919f-b21f31,必须先安装.net framework 4(或低版本),然后再安装bzReader 1.0.13。 5.启动bzReader,选择菜单中的File--Open,选中enwiki-20101011-pages-articles.xml.bz2,然后bzReader就开始建立索引,这个过程非常漫长,可能长达几个小时,所以这件事最好晚上让计算机自己忙活。 6.查询时,先启动bzReader,然后选择菜单中的File--Open,选中enwiki-20101011-pages-articles.xml.bz2,这时就没有建立过程,可以直接使用了,在Search左边的框中输入词条,按回车键可以看到左边下边有个词条列表,单击选择个条目就可以阅览了。bzReader可以显示数学公式,但似乎表格无法正常显示,不知道谁有解决方法。另外,遗憾的是,对于中文等亚洲字体,bzReader似乎无法正常处理生成索引,因此中文wikipedia无法使用bzReader对付。 中文wikipedia阅读器:WikiTaxi 7.下载WikiTaxi(http://www.wikitaxi.org/delphi/doku.php/products/wikitaxi/index),绿色软件,解压之后即可使用。 8.同bzReader的原理不一样,这个不是建立索引,而是重新编排生成一个新的.taxi文件,该文件可以脱离原始的.bz2文件使用。打开软件中的WikiTaxi_Importer.exe 引入刚下载好的中文维基zhwiki-20110322-pages-articles.xml.bz2,把它转化为.taxi文件,导出的文件名自己起。 转换很快,对于500多M的源文件,大概10分钟就搞顶了,然后出现了一个900多M的.taxi文件。 9.启动WikiTaxi.exe,选择Options--Open *.taxi database,选中刚生成的taxi文件就可以了。在上方Go左边输入需要查询的term,回车看看怎么样:)。 两者的比较 wikiTaxi的页面显示要比bzReader好很多,看起来更像源页面,但是其最大的致命点在于不支持数学公式显示,只能显示出一堆latex数学公式符号,而且由于不是生成索引文件,.taxi要比源文件还要大,对于英文的6.2G文件,俺就没有实验了,如果能解决数学公式问题,那以后就可以直接使用wikiTaxi了,毕竟显示好,并且绿色软件可以直接放到U盘里拿着到处走。 附记: 1. 在线wikipedia使用法之一:google: wiki term 或 wiki 词条 2.博士生应该学会使用英文的wikipedia,前些时日好像募捐1M$,创始人反复征求,过了一阵就搞定了,可见很多人对wikipedia的信赖。 3. 哪为大哥提供个好用的MD5检验工具,我下的没校检,但也成功建立索引了。 愿更多的人越来越用好wikipedia!
个人分类: 科研人生|18634 次阅读|2 个评论
竟然还有“绅士科学家”?
热度 4 viclee 2011-2-21 23:56
竟然还有“绅士科学家”? 哈哈,学文科的,到科学网,还是有点胆怯和心虚,个个都是牛人,令我高山仰止!我不敢说话,但心向往之。 文科和理科,就象男人与女人。 学文的去学理,很艰难,但是学理的去学文,很容易。 男人追女人,很艰难,但是女人追男人,似乎很容易。 隔行如隔山,这山看着那山高。 今天看WIKI百科,看到一个新词:“绅士科学家”,很好奇。就是花自己的钱搞研究的科学家,可能就是所谓的“民间科学家”吧?历史上就有啊,这样的话,我可以理直气壮的称自己“经典绅士科学家”了,哈哈哈哈! 摘一下这个词条: 绅士科学家 维基百科,自由的百科全书 绅士科学家 ( gentleman scientist )是指财务上独立的,以从事 科学研究 为个人爱好的 科学家 。 这一术语源自后文艺复兴时期的欧洲,在20世纪,随着政府和私人对科学研究的资助的增长,就不常使用了。 历史 在大量 政府 资助出现之前,直到 维多利亚时代 ,自费的科学家非常普遍,特别是在 英格兰 。许多早期的 伦敦 皇家学会 的会员都是绅士科学家。在20世纪,随着对科学资助的其他形式的增加,绅士科学家的比例才大大的减少。 好处和坏处 自筹资金的坏处是资金的数量相当有限,但是同样具有好处,即避免一些麻烦事,例如教学的义务,管理的责任,和向资助机构发送资助申请。另外,自筹资金允许科学家在研究方向上有更大的自由,因为资助机构资助的方向可能与科学家的研究方向不一致。绕过了同行评审。 而且发明的 知识产权 归发明者而非雇主所有。 当代的绅士科学家 在当代,可以称为绅士科学家包括 史蒂芬·沃尔夫勒姆 ,他通过销售 Mathematica 软件的收入资助他自己的独立研究, 克莱格·凡特 , 朱利安·巴伯 ( Julian Barbour ), 奥布里·德·格里 ( Aubrey de Grey ), 巴林顿·摩尔 ( Barrington Moore ), 苏珊·布莱克莫尔 ( Susan Blackmore ) 和 詹姆斯·洛夫洛克 谈及 彼得·米切尔 , 彼得·李奇说“我想他可能会发现筹款颇为困难,因为他的想法是非常激进了。” 米切尔于1978年获得诺贝尔化学奖。化学家 卢伊斯·弗德里科·莱洛伊尔 为其领导的研究所提供资金,他的生物化学研究所位于阿根廷的布宜诺斯艾利斯。他于1970年获得诺贝尔化学奖。 知名的绅士科学家 查尔斯·达尔文 罗伯特·波义耳 安托万-洛朗·德·拉瓦锡 戈兹沃西·格尼 ( Goldsworthy Gurney ) 乔治·坤斯 ( George Frederick Kunz ) 本杰明·富兰克林 亨利·卡文迪什 黎顿郝斯 参见 小科学 和 大科学 参考文献 ^ J.C. Segen (1992). Dictionary of modern medicine. p.246. ISBN 1850703213 ^ DOI:10.1126/science.279.5348.178 ^ http://www.moreintelligentlife.com/story/solo-science ^ http://www.moreintelligentlife.com/story/solo-science . ^ DOI:10.1126/science.279.5348.178 Martello, Robert, The Life and Times of Sir Goldsworthy Gurney: Gentleman Scientist and Inventor, 1793–1875 (review) , Victorian Studies , Volume 42, Number 4, Summer 1999/2000, pp. 688–690. Indiana University Press . Porter, Dale H., The Life and Times of Sir Goldsworthy Gurney, Gentleman Scientist and Inventor, 1793–1875 . 1988. Lehigh University Press , ISBN 0-934223-50-5 . Jon Cohen, Science , Vol. 279. no. 5348, pp. 178 - 181, DOI: 10.1126/science.279.5348.178, Scientists Who Fund Themselves Jonathan Keats, Craig Venter is the future Salon.com Dec. 2007. 参考 http://en.wikipedia.org/wiki/Gentleman_scientist http://en.wikipedia.org/wiki/Gentleman_scientist http://zh.wikipedia.org/wiki/%E7%BB%85%E5%A3%AB%E7%A7%91%E5%AD%A6%E5%AE%B6
个人分类: 短论评述|5800 次阅读|6 个评论
[观点]维基百科(Wikipedia)的意义
热度 5 htrmt 2011-2-21 00:01
本文是看到刘洋的博文“ 博文引用wiki百科算是cheap吗? ”后所做的一个调查。 “Wiki”没什么,它指的是一种人们可在其上通过“所见即所得”编辑器合作编辑网页的网站。可是“Wikipedia”(即维基百科)则非同寻常。“Wikipedia”是一种允许全世界连入互联网的人们合作编辑的在线百科全书;人们称:“百科全书是记录人类知识最全面、最系统的大型综合工具书。” ;也有称:“百科全书是对人类过去积累的全部知识或某一类知识的书面摘要。”。 上述两种说法中: “工具书”的定位意味着:人们利用它可以快速获取所查询条目(特别是查询者不熟悉、不确定的领域、知识)的相关知识; “摘要”的定位意味着:百科全书中叙述的内容可能不够详致,但基本正确。 所以在某方面不熟悉、不确信或者研究不够深入时,从百科全书中寻求快速支持未尝不是一种次优的选择。(潜台词:如果已经有比百科全书更好、更可信的知识来源,自然不会再求助于百科全书)。另外,由于Wiki软件的协作性,任何人对某一条目的最佳理解、定义或相关知识都可以在第一时间反映到条目中(通过追加、修订、删除等操作,并同时保留所有操作历史以便回滚),并随即接受所有关心该条目的人的审议。这个特点正是Wikipedia出生不到5年,即已赶上大英百科全书的最重要原因 。 这同时也使得维基百科拥有发展成最佳参考资料的潜在力量 。 到目前为止(2011.0220.2308),维基百科无论在内容的丰富程度、可用性、易用性、可信性方面,已经较2005年引起广泛关注 时有了更大的提高。 Nature 在2005年12月的一份调查 的结果中有这样一句话:“Jimmy Wales' Wikipedia comes close to Britannica in terms of the accuracy of its science entries, a Nature investigation finds. ” 更多关于“维基百科的可靠性”的知识请参考 。对“维基百科的可靠性”有争议的人,可以访问 ,或者直接参与 的编辑。 a news story comparing the accuracy of science articles taken from the website of Encyclopedia Britannica and Wikipedia , http://www.nature.com/nature/journal/v438/n7070/full/438900a.html Nature's responses to Encyclopaedia Britannica, March 2006. http://www.nature.com/nature/britannica/index.html Wikipedia, Britannica: A Toss-Up, http://www.wired.com/culture/lifestyle/news/2005/12/69844 Study: Wikipedia as accurate as Britannica, http://news.cnet.com/Study-Wikipedia-as-accurate-as-Britannica/2100-1038_3-5997332.html Reliability of Wikipedia, http://en.wikipedia.org/wiki/Reliability_of_Wikipedia Talk:Reliability_of_Wikipedia, http://en.wikipedia.org/wiki/Talk:Reliability_of_Wikipedia
个人分类: 杂类|5982 次阅读|8 个评论
[转载]坚持多做10件事有望活过85岁
shawnshen 2011-2-20 11:06
生活细节和寿命长短有密切关系,美国“维基百科网”最新载文指出,做到以下10步,就有望活过85岁。   第1步:避免致癌物。至少做到两点:一是戒烟,二是涂抹防晒霜。每天太阳直晒别超过15分钟,外出务必涂抹防晒霜,以防止皮肤癌发生。   第2步:改变饮食模式。良好的饮食模式包括:多喝水;避免暴饮暴食、毒品或药物、酒精、咖啡因等;限制热量摄入,饭吃七分饱;多吃富含欧米伽3脂肪酸的深海鱼。   第3步:蹲姿排便。蹲姿是最自然的排便姿势,比坐姿更易在腹部施力,因而会减少肠癌和痔疮的发病几率。   第4步:摄入抗氧化剂。摄入方式任选其一:每天5杯绿茶;每天1块黑巧克力;每天1杯红葡萄酒,吃红葡萄也有相同作用;确保每日5种果蔬。   第5步:减少压力。掌握8种减压秘诀:拥有亲朋好友或终生伴侣;感觉压力大时做深呼吸;尽可能地消除恐惧感;保持“我至少还有半杯水”的乐观态度;积极努力工作,参与志愿者及公益活动;笑口常开增寿7年;大笑拥抱增寿7年;生活有目标。   第6步:居安思危。其一,防止意外事故发生。过马路前一定要左顾右盼;进入建筑工地务必戴安全帽。其二,避免有潜在伤亡危险的任何活动。其三,参加年度体检,有病及早治疗。   第7步:常规锻炼。建议每天运动30分钟,最简单的运动是散步,每天步行3公里,死亡危险减一半。   第8步:活到老,学到老。良好的教育与长寿之间关系密切。要长寿,除了经常锻炼、健康饮食和不吸烟之外,还应该不断地看书,学习新知识。   第9步:制定睡眠时间表。上床与起床时间雷打不动,与保持一定的睡眠时间同样重要。固定的睡眠习惯有助身体张弛有度,自我修复。   第10步:常用脑。常动脑筋有助于做出更好的选择,有益长寿。经常用脑也有助于防止老年痴呆症的发生。
个人分类: 生活百事通|898 次阅读|0 个评论
关于《“人工增雪”是福是祸?》的几点疑问
热度 6 gxhfly 2011-2-18 21:05
1、 郭学良表示,人工增雨增雪是一个微物理过程,而不是产生新物质的化学变化,人工影响天气作业中经常使用的干冰、液氮、碘化银等催化剂并不会造成环境污染。 干冰、液氮可能不会造成环境污染,但是碘化银也不会吗?这话似乎太绝对了。摘录维基百科中的一段话,请大家评判吧。 来源: http://en.wikipedia.org/wiki/Silver_iodide#Rainmaking Under the guidelines of the United States Environmental Protection Agency Clean Water Act , silver iodide is considered a hazardous substance, a priority pollutant, and a toxic pollutant. Chronic ingestion of iodides may produce “iodism”, which may be manifested by skin rash, running nose, headache, irritation of the mucous membranes, weakness, anemia, loss of weight and general depression. Chronic inhalation, ingestion or skin contact with silver compounds may cause argyria characterized by blue-gray discoloration of the eyes, skin and mucous membranes. 2、 “我们每一个烟条里大概含碘化银11克。今年初雪我们燃烧了1200多个碘化银烟条,大概是13公斤碘化银,它的作业面积在北京9个区县,保守地说是1万平方公里,那么每平方公里只有1.3克,非常微量,它不会对环境造成什么污染。”张蔷说。 这样看起来确实好像量不大。但是仔细一想,问题就来了。大家知道,增雪(雨)过程是定点作业,如何能够确定使用的碘化银是平均分布到这样大的一个面积上的?有没有可能,碘化银只降落在作业点附近,而使得局部物质含量远大于 1.3克/每平方公里? 3、从2003年开始,北京一般夏季会在密云水库、官厅水库区域进行较频繁的蓄水型人工增雨作业,而且每半年对水库水体进行检测。数据显示,夏季水库里银离子的含量远远低于冬季检出的含量。张蔷说:“到目前为止,北京进行人工影响天气使用的碘化银对环境、水体没有造成任何影响。” 呵呵,密云水库、官厅水库区域是频繁人工增雨的地区,这里的银密度和别的地方一点差别也没有吗? 最为神奇的是: 数据显示,夏季水库里银离子的含量远远低于冬季检出的含量。 这就怪了,进行较频繁的蓄水型人工增雨作业的夏季其水库里银离子的含量却远远低于冬季检出的含量。我想问一下,检测者是否知道碘化银是不溶于水的?另外,冬天多出来的银离子是哪来的? 4、 张蔷说,碘化银的采购成本并不高,前几年大概是1000多元一吨,就算是有些市场波动,一吨碘化银还是能做大量的烟条。当然碘化银采购之后要制作成催化剂,还有其他一些工艺,可能会相应地增加一些成本,但整体来看,使用碘化银增雪不会花很多钱。至于干冰等其他催化剂,价格也不会太高。 碘化银1000多元一吨 ?这是那一年的事儿啊?现在还能买吗,能的话我先买几吨。 我查了一下,目前的市场价应该是200万人民币一吨左右。 如果还想了解人工降雪的相关信息,请参考: http://www.scientificamerican.com/article.cfm?id=cloud-seeding-china-snow 这篇文章是由新华社的中国网事栏目首发,其后又经科技日报和多家媒体转发。但是发稿前,似乎缺乏了一些严谨。对于其中的一些明显的问题,并没有注意到。我写这篇博文的目的只是希望像新华社、科技日报这样的媒体,应当认真细致地审查其发表的每一篇稿件。因为你们代表的是权威,你们所说的是许多老百姓会信以为真的。
1220 次阅读|6 个评论
人脑中存在维基百科的实验设计-人脑中的互联网之二
liufeng 2010-10-5 18:06
前言:本文内容将作为学术论文互联网与神经学的交叉对比研究的一部分正式发表,论文重点探讨了人脑中类搜索引擎,类维基百科,类ip地址,类路由系统等方面的功能问题。 作者 刘锋 维基百科是一个自由、免费、内容开放的互联网百科全书协作计划,参与者来自世界各地。这个站点使用Wiki,任何人都可以编辑维基百科中的任何文章及条目。从技术的角度看维基百科起源于1983年诞生的电子公告牌功能,传统上在BBS中,只有文章的发布者或管理员能够修改文章内容,维基百科对这一功能进行了创新,它允许每一个访问者(或者必须是维基百科的注册用户)可以对一个词条的内容进行修改,无论这个词条的内容是谁创建和发布的。 维基百科应用的工作原理和工作流程是这样的,用户A创建词条abc,并撰写abc的解释和说明文字,形成版本1。用户B看到词条abc和它的说明文字,认为解释不完整或者有错误,于是用户B在用户A文字的基础上进行修改,形成版本2。,不断有用户进行修改,abc的版本号不断增加。在修改的过程中,如果一个用户发现最新的版本整体质量不如前面的版本,则他可以将前面的版本置为最新版本。虽然有国界,信仰,情绪,知识范围的不同,会产生修改意见的争执。但总体上看,维基百科的工作流程还是会使各词条的说明质量不断提高。 根据维基百科的工作原理,我们可以在神经心理学层面设计如下实验。参与实验者A和志愿者B最初共同处于一个实验房间内,要求参与实验者A观察志愿者B衣服的颜色,然后志愿者B离开房间,实验者A纪录B的衣服颜色,B更换不同颜色服装进入实验室,重复上述过程5次,在五次试验结束后,收回A填写的纪录表,更换同样内容的新表,请A回忆B从第一次到最后一次穿着颜色并按顺序重新纪录(表3)。 表3 人脑中类维基百科应用试验记录表 次数 志愿者B衣服的颜色 备注 第一次 第二次 第三次 第四次 第五次 如果参与者A能够完成上述过程并正确纪录B不断更新的颜色,则说明A根据一个物体的变化,不断更新该物体属性的说明和纪录,并保留原有属性的纪录,而这恰恰是维基百科的运行原理。通过对大量人员的测试,如果95%(色盲导致的错误除外)的试验者能够完成实验,则说明人脑大脑存在类维基百科的应用是成立的。 互联网进化论更多内容请看 http://www.intevl.com
个人分类: 观点评述|3962 次阅读|0 个评论
[转载]维基百科创始人:报纸书籍的寿命还很长
XUPEIYANG 2010-9-5 16:17
http://www.sina.com.cn 2010年09月05日16:14 新浪科技