科学网

 找回密码
  注册

tag 标签: 知识系统

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

知识的构成
shehuiguanli 2015-5-6 21:09
作者:据我所知,这应该是世界一次提出“ 知识的构成 ”,非常科学。 根据解决问题思维规律(一般思维方法),将问题分为两类:基本问题和非基本问题。 基本问题由问题、解决问题给定的条件、问题的解决方法三部分构成。 非基本问题也是由问题、解决问题给定的条件、问题的解决方法三部分构成。 值得指出的是:非基本问题在给定的条件下是非基本问题,而在某一条件下(当然与给定条件不同)它一定是基本问题,否则问题无法解决。 基本问题和非基本问题的区别在于:基本问题无需转化为其它问题,在给定条件下可以直接解决。非基本问题在给定条件下不能直接解决,需要转化为其它问题,通过其它问题的解决,从而解决原问题。 因此,知识一般由基本问题或基本问题转化的问题构成。 基本问题或非基本问题转化的问题都是基本问题,基本问题构成的知识包含三个部分:问题、解决问题需要的条件(不一定是给定的条件)、问题的解决方法,它是一个系统,称为“小知识系统”。 原问题的基本问题和转化的问题组成的知识是由多个基本问题的知识共同组成,它也是一个知识系统,由于转化的问题一般有很多个,这些“知识系统”构成一个“知识系统套”,这样原“知识系统”包含多个“小知识系统”,这样原“知识系统”可以认为是一个“大知识系统”。 显然“小知识系统”是知识的主要组成部分。
366 次阅读|0 个评论
《语义三巨人》
热度 3 liwei999 2014-8-10 13:33
《科研笔记:自然语言处理领域中的语义路线及其代表人物》 如所周知,统计型自然语言处理(Statistical NLP)作为主流盛行了20多年,此前盛行的是以语法分析为基础的规则系统。即便如此,为了模拟人的语言理解过程以及力求语言处理的更高质量,追求以知识系统为支持的语义路线的尝试,从来没有停止过。本篇笔记拟对此做一个简要回顾和比较,并记录自己的心得和不同意见。 就NLP的机器翻译应用而言,在相当长的时期内,统计型机器翻译由于其数据多开发快,善于在浅层模拟人工翻译(特别是成语和习惯用法的翻译)会一直是主流。即便是机器翻译的规则系统,也还是语法为主的路子比语义和知识为主的路子更加切实可行。这不排除在未来,当统计机器翻译和语法为基础的规则机器翻译的改进余地越来越小的时候,人们会重新探索知识路线以求突破。 坚持语义和知识为基础的语言处理路线,是一条繁难艰辛的道路。我感觉,语义是个大泥坑,我等凡夫俗子一旦陷进去大多出不来,而能够驾驭它的人均非等闲人物。 Dr. Douglas Lenat Prof. Charles J. Fillmore Prof. Dong Zhen Dong 语义三巨人 在计算语义界,有三位长期坚持超领域语义的顶天立地的大学者(如果要算第四位,也许应该包括英国的人工智能大师Wilks教授,他早年做过基于语义模板的纯语义机器翻译实验。再往前追溯,人工智能领域早期也有不少先驱者,不过都是在极为狭窄的领域尝试一些玩具知识系统)。这 三位学者前辈 是,坚持常识推理的 cyc 的 Lenat 教授,格语法( Case Grammar )和框网( FrameNet )的开创者 Fillmore 教授和《 知网(HowNet) 》的发明人中国机器翻译前辈董振东教授。他们对自己思想和信念的坚持、执着、反潮流和勇于实践,令人景仰。 这些智者的成果都有某种超时代的特征,其意义需要时间去消化或重新认识。可以预见,将来某个时候,当机器翻译和自然语言理解的应用项目穷尽了浅层可用的低枝果实之后,知识系统将会被进一步发掘、利用和欣赏。但目前多数项目还没有到山穷水尽的时候,急功近利是绝大多数项目和产品的固有特征,而且多数主事者也往往缺乏远见。绝大多数语言处理业者遇到语义和知识都是绕着走。 三位语义巨人中探索知识最深入和纯粹的是 Lenat 教授,他带领团队手工开发的 cyc 知识系统,试图从常识的形式化入手,利用常识推理帮助解决语言理解等人工智能 核心 问题。可惜这套庞大的系统太过复杂和逻辑,在实际应用上有点像大炮打蚊子,使不上劲。 Fillmore 教授是享誉世界的语义学家,他的格语法理论影响了一代自然语言学者,包括中国和日本自然语言处理领域的领军人物董振东教授和长尾真教授。事实上,董教授语义思想的核心概念“逻辑语义”就来源于 Fillmore 的深层格 (Deep Case)。然而,Fillmore 本人的语义发展与董教授的创新发展走上了语义颗粒度不同的两条道路,前者的成果为 FrameNet,后者的结晶是《知网(HowNet)》。 可以从构建NLP应用系统的角度来看 FrameNet 和 HowNet 的不同语义层次,即,从分析器(parser)和应用(applications,包括机器翻译,信息抽取等)的分工合作的关系来看。 语言的分析无论多深入,都不是应用,只是(理论上)缩短了到达应用的距离。就以机器翻译的应用为例,翻译转换可以发生在浅层(极端的例子是所谓词对词翻译系统)、在关键成分不到四个(主谓宾补)和附加成分不到一打(主要的定状语子类)的句法层、在《知网》的90个逻辑语义的层面或者在 FrameNet 的成百上千的 frames 的层面。多数统计型机器翻译都是在浅层进行,通过海量双语训练集,记忆住千千万万大大小小的翻译单位(个体转换规则)。这条路子可行是因为机器擅长记忆。手工编制的翻译系统就很难在浅层进行,因为浅层转换的千变万化超出了人工编制和调控的可能。但是,翻译系统应该深入分析到哪一步实施转换比较合适,是大可讨论的。 我个人觉得,FrameNet 过细(成千上万的 Frames 组成一个 hierarchy,即便只取上层的常用的 Frames, 也有几百个),不仅很难达到,而且实用上没有太多的好处。FrameNet 的提出,是格语法框架的自然延伸、扩展和细化,语义理论上有其位置和意义。但是在实用上,FrameNet 的地位很尴尬,他既不像句法层 argument structure 那样简洁和好把握,也不可能达到语用层的信息抽取模板(IE Template)那样可以直接支持应用(因为信息抽取是依赖领域的,而 FrameNet 原则上是不依赖领域的,或者最多是在语言学与领域之间起某种中介桥梁的作用)。这样一来,从实用角度,与其分析到 FrameNet (这个太繁难了) 再行翻译转换或信息抽取,不如直接从 argument structure 进行(这个靠谱多了,very tractable),虽然理论上前者的转换或抽取应该更加简单直接一些,但是由于 FrameNet 分析工作难度太大,终归得不偿失。换句话说,FrameNet 从使用角度看,语义做得过了(over-done),用起来不方便,没有多少实际利益。 退一步回到句法为基础的 argument structure 如何呢? Argument structure 立足于句法结构,主要论元最多不超过三个(up to 3 arguments):逻辑主语,逻辑宾语,逻辑补语,加上谓词 governor,构成一个四元组,非常简洁,与各语言的词典句型信息 subcat 相呼应,易于掌握和实现。再加上10来个带有逻辑语义分类的状语(时间、地点、条件、让步、结果等)和定语(颜色,材料,来源等)。这样的中间表达作为语言分析(parsing)的目标,作为应用的基础,已经可以应对绝大多数应用场合。Argument structure 中的逻辑宾语和逻辑主语有其独特的概括能力,对于利用句法关系的语义限制排歧多义词和做知识挖掘具有特别的价值。 HowNet 不满足于此,它的体系是对句法为主的 argument structure 进一步细化,譬如逻辑宾语细化到 “patient”、“content”、“target”、“PatientProduct”、“ContentProduct”和“possession” 等子类。最终达到具有90多个逻辑语义角色的相对纯粹的语义表达。HowNet 就是这样一个概念知识体系,逻辑语义是连接这些概念的主要工具。 从主谓宾定状补这样简练的句法关系,深入到逻辑语义的角色,再进一步把逻辑语义细化,常常的表现就是信息表达的浓缩和冗余。HowNet 这样精细的逻辑语义,不仅反映了一个依存概念到主导概念的逻辑结构关系,而且反映了主导概念的子类信息(hence 冗余了)。例如,对于宾语的细化 “patient”、“content”、“target”、“PatientProduct”、“ContentProduct”,“possession” 等,显然是蕴涵了主导概念(谓词)的子类信息,而这些子类信息本来是已经附着在谓词上的。譬如作为 possession 的宾语,其谓词只能是 have、possess、own 这个小子类。信息表达的冗余意味着即便没有深入到细化的逻辑语义,系统并没有本质上的损伤,因为如果需要的话,细化信息依然可以通过句法关系节点的限制条件即时得到查询。 对于逻辑主语逻辑宾语等进一步细化的必要和利弊,我个人觉得是可以讨论的。首先是任何细化都是有开发和处理的代价的。更重要的是,其必要性究竟如何?从追求纯粹语义和逻辑、追求纯净的独立于具体自然语言的元语言表达的角度,我们总可以找到证据,证明细化是必要的。但是,在应用现场,我们也可能发现,对于绝大多数应用,细化并无必要。就拿机器翻译来说,同一语系之间的结构转换在逻辑主语宾语的 argument structure 的对应上有明显的一致性。即便是不同语系,这种对应也是主流,而不对应的可以作为例外,由词驱动(word-driven)的个性转换来应对。以上讨论,有很多例证,写得匆忙,暂时不例举了。 【相关】 【立委科普:机器翻译】 Notes on Bulding and Using Lexical Semantic Knowledge Bases 围脖:一个人对抗一个世界,理性主义大师Lenat 教授 .. 《泥沙龙笔记:再谈 cyc》 2015-12-22 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|13386 次阅读|3 个评论
论科学、方法和技术的层次
benlion 2013-6-24 16:10
科学发展的复杂程度,不但,在于科学的共同体文化和社会环境,而且,也在于学科、技术和方法的联动相互关系,比如,任何一个学科都具有上游学科的应用和应用于下游,任何一项技术也是如此。 严谨的说法每个学科、技术是交叉,而每个交叉学科都是单一,系统生物学也不例外,在建立之初,显然是综合或交叉学科,学科规范成型之后,就相当于一般学科了,同生物物理学、化学生物学的发展一个道理。 理论和数学、网络生物学,计算和组学、合成生物学,其实,也就是数学、逻辑方法与实验、技术方法的 2 个方面;然而,学科或技术之间,存在一个层次或递进关系。 例如,系统理论和数学生物学到网络生物学,计算机方法数学建模到生物信息学和计算生物学,差异表达谱的组学生物技术到细胞分子网络的结构模型,计算机软件模拟到细胞的基因回路辅助设计,等。 科学发展规律: 之一、原创科学未必能做到最大,比如,国际系统生物学的几大研究中心,主要是机构的社会影响,而不是概念、词汇、方法或技术的原创贡献,论文引用率,同理。 之二、发展依赖技术链环的集成,比如,系统生物学的组学的表达谱分析与计算生物学模型方法,系统生物工程的计算机辅助设计、微电子学原理与转基因生物技术等。 系统科学、计算机工程和认知科学、人工智能发展,机器人技术从神经元网络深入到细胞分子网络的遗传学和基因组程序重编,人工生物系统的研究与发展,最终就可能实现机器与人的非常接近。 因而,阿西莫夫的“机器人三原则”,其中,第 1 条,当机器人与人类接近时,如何让机器人鉴别“人类与机器”的不同?这 1 条指令,也可能会带来判断的困惑或失误。 参见 - http://blog.sciencenet.cn/blog-973055-702268.html 。 - (海内外印象记) -
个人分类: 发现|3258 次阅读|0 个评论
对逻辑原子主义与知识系统结构的理解(1)
ymdushandong 2011-3-22 16:16
逻辑原子主义是一种近似于技术的哲学,是类似于数学归纳法的思维工具在概念上的应用。哲学家们一次一次地把世界的本源从意识到物质之间来回颠倒,逻辑原子主义者把世界都归结为关系,发生关系的两端一端是外部存在,一段是人的意识,把人类的认识行为作为世界的发生中心,调和了感觉和外在存在。我们使用语言来表达世界的时候,语言符号结构与世界结构之间的类似性是这种表达能够成功的基础。但是我们不能混淆了世界本身和语言符号表达的世界之间的界限。通过逻辑的梳理,语言符号能够更加有效的进行这种表达。认识的目的是寻找概念的最小单元,由这一套最小的概念集合来表达世界。这个概念的提炼过程是由人类社会中少数先锋分子首先完成,然后作为文化成果注入到我们其他成员的知识结构中的。 我们通过某几种指标建立起一个空间坐标系,将事物放置在这种坐标系内到其各自的位置上,用这种方式实现对世界大概面貌的认识。这是我们知识系统的一般结构。建造一个知识系统在某种意义上说就是搭建这样的一套空间坐标系,各个分量最好是正交的,可以实现简约的表达出各个事物之间的关系。建造坐标系最重要的事情是找到正交的几个分量,这个工作是极其困难的。对于一项具体的应用,未必需要坐标系之间完全正交。坐标系的各个分量的构造过程是通过最小概念单元的提炼过程一致的。
个人分类: 纯粹哲学|4111 次阅读|0 个评论
逻辑原子主义、知识系统与尺度问题
热度 1 ymdushandong 2011-3-1 15:26
由于思维结构的内在特征,我们在认识世界的过程中,总有一种需要将眼前具象的事件抽象为较为共性的形象来表述,以供交流和存储。这种做的另一个功利的后果是有利于知识积累和对后续的工作施加影响。因为实际世界与知识系统之间的对应关系总是多对一的关系,所以知识系统是在某种尺度上的对现实的概括。这种尺度概括上的偏差赋予了知识内在的创造性。 具体在工作中,如果我们善于将各个工作中较为共性的问题抽取,一次性的加以解决,就会产生时间成本的节约从而实现经济增长。这种能力我们与生俱来。在我看来,哲学和艺术是提供了某种类似的共性问题的解决倾向,通过直觉来把握世界的本领。 这种映射过程,我们假设为照相的过程。远处的世界辽阔丰富,映射到方寸的照片上。这种映射的过程有综合概括,这种综合概括永远不可能丰富到和真实场景一样,也不能做到精炼到一个点上。综合概括的简练程度我们最好能够使用某种指标来标识。因为只有确立了这个指标,话题的交流才能有意义。 我们有很多种知识,有的知识是需要我们在实践中产生,有的只需要内省便可以得到。 逻辑原子主义被有些人称作“多元论”的代表。起始这个“元”是不被强调是什么的,我们强调的是一种认识的路线和知识大厦的结构问题。首先“元”来自大量的实践过程中提炼出来的基本的单位,这个过程是归纳概括的过程。然后通过逻辑,可以进行演绎。一个庞大的学科都要有这两个东西:一个被称作基本概念,一个被称作规则。当我们称作学科的时候,尤其是教科书上得来的那种某种学科的知识,往往忽略了基本概念的归纳过程,而作为先验存在的做简单的继承,大量的时间用来做演绎的训练。 我们看到不仅仅在科学界,这套哲学是正确的,而且在文学作品中,我们也可以看到这种痕迹。文学作品中的文学形象被大众接受的,往往是那写可以作为“元”的形象,后来又可以作为指导我们认识新的社会现象或者人物的工具被人们反复的使用(比如大家使用葛朗台来描述吝啬鬼,用林黛玉来表达对一个多愁善感的性格的人物的认识等等)。正式通过这种逻辑原子,将文学作品和大众生活联系在一起。 好的作品一定是写出了那个时代的最典型的人物和事件,这种描写来自于对当时时代的大量的人物和事件的归纳概括。作家的天份在这个过程起到了关键作用的。 好的科学体系也是如此,它们往往是使用最简练的一套基本概念集合,使用一套最基本的演绎规则,将最大范围的现象描述的栩栩如生。这符合思维经济的原则。即使聪明人的大脑能够存储的信息也是有限的,必须将无限世界归纳为有限个概念+提套演绎规则,否则我们永远无法达到对世界的认知。 今天早上半睡半醒中想到了许多问题,由此现象引发了思考:如果最终的世界需要多元来解释,那么意味着世界无法继续向上归纳,诸元之间相互独立,无法关联。所以在系统没有接受到新的指令的空闲期,应该自动的对原始素材进行整理,为了避免漏掉一种“元”,或者是,为了在接受指令的时候行动更为有效率。就像大脑在睡眠中的梦。
个人分类: 纯粹哲学|4039 次阅读|0 个评论
企业知识管理
郭崇慧 2009-2-12 14:57
在知识成为主要竞争资本的今天,企业要维持竞争优势就需要依靠比竞争者更快地创造、传播和使用新知识。随着现代信息技术和先进制造技术的不断发展、人才的频繁流动、竞争的日益加剧,实施以知识资源为管理对象的知识管理对于形成企业的核心竞争力至关重要。 企业知识管理是近年来引起人们广泛关注新兴学科领域,人们对此开展了广泛的研究。企业知识理论认为决定企业能力和竞争优势的是企业拥有的知识和与知识密切相关的认知学习能力 。知识管理有助于企业从现有数据中挖掘有用的知识,增强企业的商务智能,有助于提高企业的认知学习能力和创新能力 。从研究视角看,关于知识管理的研究大体可分为侧重于计算机信息技术与人工智能技术手段的研究与侧重于从组织与人的行为因素角度开展的研究 。从研究的对象看,也大致包含了两种类型部分研究把知识看作相对稳定的实体,知识的管理从而侧重于考虑知识实体(内容)的管理、维护与应用;另一类研究更多地强调知识的动态特性,因而知识管理更多涉及与知识相关的过程(知识的创造、共享、传播与应用等过程)的管理。人们关于知识管理的研究由此大致可进行如下分类(表 1 ): 表 1 知识管理研究的一个简单分类 研究对象 研究视角 研究对象 着重于知识实体(内容) 着重于知识相关过程 研 究 视 角 从组织与人的行为因素角度 知识资本管理,基于知识的组织理论、知识审计等 学习型组织、第五代管理、知识创造企业等 信息技术 / 人工智能角度 信息检索、搜索引擎、数据挖掘技术等 群体支持系统、工作流系统等 基于上述划分,目前知识管理的相关研究主要从知识内容管理、知识过程管理以及对知识管理的信息技术支持即知识管理系统这三个方面进行展开和深入发展。 参考文献: 余光胜,企业知识理论导向下的知识管理研究新进展,研究与发展管理, 2005 , 17(3): 70-76 . 储节旺等,知识管理概论,清华大学出版社;北京交通大学出版社, 2005 . 江文年,杨建梅,企业知识管理方法论研究,科学出版社, 2006 . 王众托,知识系统工程,科学出版社, 2004 .
个人分类: 科研笔记|5094 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-12 04:11

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部