科学网

 找回密码
  注册

tag 标签: 知识获取

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

创新之魂:缔造知识大生产的超级双脑智慧能力(邀请函)
geneculture 2017-3-9 05:03
一锤定音:如果说“科学技术是生产力”,那么,“经济创新”就是催化剂和加速度。--邹晓辉Geneculture 例证1,以伽里略、笛卡尔和牛顿等科学巨匠为代表的欧洲科学技术,和以瓦特、法拉第和拉瓦锡等为代表的欧洲产业促进(如、英国的工业革命,从蒸汽机到电动机,由物理学到化学,不仅科学与技术、学者与匠人之间发生了融通融合,而且,科技与经济、进而与社会,也发生了融通融合,其中,人的智力活动发挥了关键作用),就是典型。 例2,如果说化学元素周期表和生物基因序列表揭示的是自然科学的序位逻辑法则,那么,基本的数字表和字母表以及汉字棋盘所揭示的就不仅限于自然而推进到了人工、心智、人文乃至社会的序位逻辑法则。顿然间,我们发现,不仅仅是中英文这样的狭义双语,进而,还涉及数学和语文那样的广义双语,甚至还再进一步涉及到字、式、图、表、音、像、立、活“八大形式体系”的广义文本基因序列所遵循的序位逻辑法则(这是一个根本的大前提,作为发现者和发明人的邹晓辉暂时称之为本真信息存在公理即第一信息的基本定律)。可以说,广义文本的物、意、文“三类现象信息”,遵循的理、义、法“三类本真信息”,才是现象世界存在的本源。如何认识它们?易经和老子的道法自然以及德化社会乃至孔子的人文关怀(如“仁”蕴含的“二人关系”--远比胡塞尓、海德格尔、哈贝马斯和拉康等学者阐述的“主体间性”早许多)都仅限于某种粗放的非形式化的哲学理性反思,没有推进到可数理形式化的精细程度,因而,很难进一步推进到受局限的可预言的经验科学验证的领域。双字棋盘及其蕴含的超级双脑协作机理,不仅开启了知识大生产实际应用的广阔领地,而且,还开启了前所未有的具有超级双脑智慧能力的超傻交互方式(真正可做到“大智若愚”)。其作用、价值和意义,是可检验的(只要人们静下心来认真地尝试一下如何才能获取专家知识而不产生误解这样的实际问题的求解过程)。--邹晓辉(中美塞尔研究中心 主任 研究员)
个人分类: 双语信息处理|173 次阅读|0 个评论
双字棋做专家知识获取及形式化表达和有针对性地重用​
geneculture 2017-2-12 09:20
基于融智学理论和文化基因系统工程实践的双字棋盘,实质上做的是人机交互协同操作的专家知识获取及其形式化表达进而有针对性地重用的工作,其结果表现是这样的,即:专家知识获取之后并自动实现其形式化表达(即:专家知识表达),这一步非常关键,因为,这就已经实现了自然语言理解(这不仅使人工智能的核心关键难题得以化解,而且,还让人类智力的认知分歧难题得以化解,从而,可避免人机交互与人际交流过程中许许多多的矛盾或冲突),再进一步,可通过协同网络有针对性地组合变换而实现专家知识的重复调用(即:重用)--这就是向大众远程传授各种各样的专家知识和经验技能最为便捷也最为重要且效率最高的方式。当然,之前和之后,乃至其进程中,还有一个诀窍,那就是基于融智学理论和广义文本基因系统工程的七遍通与之配套应用,方可充分体现出人际协作乃至人机协同的综合智慧能力。
个人分类: 融智学前期探索|486 次阅读|0 个评论
RSS学术应用之一:期刊订阅
paperopen 2012-4-12 16:49
RSS学术应用之一:期刊订阅
在印刷版时代,大多学者通过杂志订阅来获取最新知识。 在互联网时代,简捷聚合 (RSS) 正在成为学者们积累性知识获取的一种有效方式。 通过 RSS ,可以订阅自己关注的期刊的最新文章,但有最新文章时,会自动提醒。   RSS订阅和Email Alert的比较,可参见罗昭峰老师的相关博文。 最新一期文章订阅 最新一期文章订阅,国外大多数期刊网站都提供这样的服务,国外期刊有时会标记为“ Current Issue ”。国内部分期刊网站也提供了最新期文章订阅。 大多期刊网站会有醒目的 RSS 标志。 这是 Nature 网站的 RSS 订阅入口标志:    点击,即可看到 NPG 提供的所有 RSS 列表。部分截图如下:    一些期刊网站的订阅,需要注册或者权限。目前发现的需要注册和权限的期刊网站为 ScienceDirect ,其他大型数据库,如 Springer 、 IEEE 、 AIP 、 Wiley ,可直接订阅。国内的万方、知网也都可直接订阅。 RSS 订阅到的内容,大多会包括标题、摘要、作者、发布日期等,也会提供全文下载的链接,但也可能仅仅包括标题,有的则会包括年卷期页码等信息。 能显示那些内容,和 RSS 源内容和使用的 RSS 阅读器有关。目前大多数 RSS 阅读器都支持 RSS 、 Atom 、 RDF 协议,都能解释出所有内容,因此显示出来的内容主要取决于 RSS 源内容。  AOP AOP ,就是预出版,也有人称为优先出版,就是还没有正式出版但已经录用的文章。 目前国外很多期刊都实施了 AOP ,国内一些期刊也在实施 AOP 。 从上面 NPG 提供的 RSS 中不难发现, British Journal of Cancer 有 2 个 RSS ,一个是 -Issue , 另外一个是 AOP 。 期刊其他 RSS ,特别是 Recent PressHighlight    这是 PNAS 提供的 RSS 列表 其中包括了最新一期、上一期、期刊回溯、阅读人数最多的文章、引用次数最多的文章、最新关注热点。 特别要说明的是, Recent PressHighlights, 是该期刊目前关注的热点,对应的研究可能更容易发表。 分类订阅 有的期刊网站还提供分类订阅,如 PNAS 。 这是 PNAS 的分类。 PNAS Feeds by Classification Biological Sciences Agricultural Sciences Anthropology Applied Biological Sciences Biochemistry Biophysics and Computational Biology Cell Biology Developmental Biology Ecology Environmental Sciences Evolution Genetics Immunology Medical Sciences Microbiology Neuroscience Pharmacology Physiology Plant Biology Population Biology Psychological and Cognitive Sciences Sustainability Science Systems Biology Physical Sciences Applied Mathematics Applied Physical Sciences Astronomy Chemistry Computer Sciences Engineering Environmental Sciences Geology Geophysics Mathematics Physics Statistics Sustainability Science Social Sciences Anthropology Economic Sciences Environmental Sciences Political Sciences Psychological and Cognitive Sciences Social Sciences Sustainability Science 如何找到 RSS    1 )到相关网站找相关的图标。常见的 RSS 图标有   2)在搜索引擎中进行搜索,如我想查找 Nature 的 RSS ,输入 Nature RSS即可。    3 )到相关 RSS 源目录网站   这是一个国外的RSS源目录。如果要查找国外RSS源,不妨试试。    http://www.thefreedictionary.com/_/rss-directory.htm 。但其中的学术期刊不多。 Google Reader中的RSS检索很全面。   本人正在建设一个网站 Directory of scientific RSS( 科学 RSS 目录,域名为 http://www.DSRSS.com ,域名已经注册,但还没有发布,可临时访问: http://www.notefirst.com/product/default.aspx?id=0pxrss 下的“产品介绍”下的“ RSS 在线列表” ) , 目前已经收录 2 万多个科技相关的 RSS 源。    DSRSS 只收录科技人员关注的 RSS 源,除了按学科分类外,还把 RSS 源分为:学术 RSS ( Scholar RSS ,主要为期刊、会议)标准等)、知名学者博客( Scientist Blog RSS ),新产品通告( Product Release RSS ,一些知名公司的最新产品通告),科研机构资讯( Organization News RSS ,如基金委项目公告、科技部、清华图书馆等新闻),和 时政生活类 (Other RSS) 。   欢迎补充RSS源目录网站。    关于 RSS 阅读器 最常用的 RSS Reader 是 Google 的 Google Reader ,之前本人之前一直使用该阅读器。 Google Reader 为在线阅读器,而且提供 RSS 源的检索,还可以把其中有价值的条目进行收藏和分享。遗憾的, Google 离开中国后, Google Reader 的访问很不稳定,时常无法登录。我在使用 Google Reader 的时候, Reader 的主页上经常会推荐一些敏感的内容,如某个政治局常委在北大当学生会主席的历史、某民运人士的偷渡经历等,因此 Google Reader 访问不正常也是意料之中的。 此外还有 FeedDemon, SharpReader 等软件, FeedDemon 也曾使用过,此外还有国内的抓虾、鲜果等。 目前本人在使用自己开发的 NoteFirst 科学 RSS 阅读器。 NoteFirst 既是一个 RSS 阅读器,还是参考文献管理软件,可以把订阅的资讯直接转化为文献,作为参考文献直接引用。另外 NoteFIrst 还可以看到的网页保存为知识卡片,进行永久保存,或者分享。 NoteFirst 为免费的软件,下载地址为: http://www.notefirst.com .   下个同类博文将介绍自己如何使用RSS及时知道自己发表文章被他人引用情况的体验。
个人分类: 随笔|15370 次阅读|0 个评论
知识管理与科研协作系统NoteFirst 3.0 开发历程
热度 2 paperopen 2012-4-9 16:43
知识管理与科研协作系统NoteFirst 3.0 开发历程
  三年多了,2012年4月2日,NoteFirst 3.0终于发布了。   NoteFirst在某种意义上讲,是为我本人自己开发的一个工具,希望也能为关注知识管理、团队协作的科研人员提供一个工具。NoteFirst的研发过程,有苦也有乐,苦乐自知,写篇博文记录一下心路历程,同时向支持、关注NoteFirst的朋友表示感谢。 第一阶段:参考文献管理软件   “二进宫”读博士时,阅读了一些文献;学位论文时,为参考文献标引的事务性劳动感到不爽,插入、删除一篇参考文献时,后面的引文序号、参考文献列表的引文序号都要进行调整,很花费时间,而且这些工作纯粹是事务性劳动。于是开始寻找相关的软件,知道了国外的EndNote、RefManager,知道了国内的NoteExpress,最后自己购买了一款国内开发的软件,完成了博士论文。   参考文献管理软件的主要功能就是管理收集的参考文献,核心功能是在论文写作时根据不用期刊的要求自动形成规范的参考文献。参考文献的管理功能比较简单,文献的分类、标签、检索、全文关联,笔记。   自己之所以开发NoteFirst,是基于以下原因:   1)实现“开放存取”的一个工具。自己多年来一致关注“开放存取”,也先后主持或承担了国家、陕西省的一些关于开放存取的研究项目,一致也在探索开放存取的可持续发展模式。有一天突然闪现出一个念头:参考文献管理软件的主要用途是写论文,而论文是目前学术资源的主要组成,而且大多数期刊都支持“绿色开放存取”(允许作者在个人网站或者所在机构网站仓储作者的论文、或者论文的PrePrint版本)。如果能给大家提供一个工具,为用户提供参考文献管理功能,而用户一般会在管理软件中收藏自己发表的论文,这样大家通过这个工具可以开放存取自己发表的文章了。因此NoteFirst最主要的动机是作为“开放存取”的一种工具。   2)双语参考文献的支持。国内一些SCI、EI收录期刊的参考文献采用双语参考文献,这样的参考文献格式,即便是国内的参考文献管理软件也不能支持。   3)错误提醒。本人算是参考文献管理软件的实际用户,我有一个思维:用参考文献管理软件形成的参考文献,如果没有报错,就应该是正确的。但实际上不是这样,目前的参考文献管理软件,对于一些明显的缺项也没有进行提醒。我把我的论文提交给导师时,导师指出了参考文献中存在的缺项,弄得自己很没面子。   4)网络版软件。国内参考文献截止目前还停留在单机版阶段(我是在2008年开始开发NoteFirst的,已经将近4年过去了),在办公室计算机上收集的文献,到了家里,或者笔记本上,需要重新录入,或者人工导入。在互联网时代,通过网络实现同一用户不用终端上文献的自动同步,应该不是太困难的事情。   2010年4月NoteFIrst 1.0推出,实现了这些功能。2010年7月份,Ver1.2发布时我在博客中发布了邀请朋友测试的博文。 第二阶段:团队协作的雏形   本人之前一致在大学做教师,也带研究生,主持一些科研项目。作为项目或者团队负责人,有着这样的经历:   1)指导过的的研究生,大多都收集了一些不错的文献,做了不少读书笔记,在毕业设计阶段也做了不少实验,不少设计还是很有创新和使用价值的。但这些知识资源随着学生的毕业,都流失了。即便这些学生没有离开,但由于这些资源都散存在每个成员的个人计算机上,也没有成为团队的知识财富。   2)每个导师都要为新生指定阅读文献,不同方向的学生需要指定不同的文献;可否更方便的方式进行传承?学生发现的一些有价值文献怎样能补充到只带阅读文献中?   2011年1月份,发布的NoteFirst 1.5实现了这样的功能。   在NoteFirst 1.5中,用户可以建立共享文件夹,共享文件夹的成员,可以在共享文件夹分享文献,实现初步的文团队资源资源分享功能。 第三阶段:迈向知识管理   随着互联网的发展,在互联网上出现了很多有价值的知识,一些专家纷纷开设博客、微博,出现了很多网络杂志,传统期刊开始了网络化进程。总之在互联网出现了很多有价值的资讯,而这些资讯的时效比传统的杂志等媒体更加具有优势。当我们读到某些有价值的资讯时,希望能方便的收藏。   浏览器自带的“收藏”功能太过简单,还只能保存在某个终端上,换一个终端,你的收藏就没有了。还有您收藏的仅仅是网址,如果这个网页由于种种原因失效了,你将无法访问。   之前本人一直使用一款网页保存的软件“网博士”,这个软件可以把看到的网页一键保存和收藏。近日来受到热切关注的“美味书签”的功能就是在此功能上,加入了社区概念,更符合目前的流行趋势。   本来我想集成“网博士”的功能,也和网博士的主创人员进行了交流。虽然最后由于时限和开发语言等问题,没有合作成功,在此还要对“网博士”表示感谢。感谢你给大家提供了这样的一个工具。   2011年 9月份,NoteFirst2.0发布,支持了知识卡片,从单纯的文献管理开始迈向知识管理。   NoteFIrst 2.0中的“知识卡片”主要功能如下:   1) 一键把正在打开的网页保存为知识卡片(网页格式);   2) 把网页中的选中部分保存为知识卡片(网页格式);   3) 屏幕截图功能,可把屏幕上任何有价值内容保存为知识卡片(图片格式);   4) 支持知识卡片的分类、标签、检索;   5) 可把知识卡片打包成电子书(CHM格式和专用格式);   6) 知识卡片不同终端上的自动同步。 第四阶段:知识获取和团队协作   作为一个科研人员,希望能及时获取到相关专业的最新动态。之前是通过报刊订阅来获取相关知识的,但现在专业期刊的订阅价格,我个人已经无法承受,另外数字出版已经提供了更便捷的订阅方式。   目前RSS获取知识的高效方法。RSS可以订阅自己关注期刊最新文章、专家最新观点、企业最新产品、项目基金最新申报动态。目前已经有很多RSS阅读器产品,如国外的Google Reader, FeedDemon,SharpReader,国内的“抓虾”、“鲜果”等,在Outlook、Foxmail上也都提供了RSS订阅功能。但这些RSS产品为通用的RSS产品,科研人员希望能实现把订阅到的信息直接纳入到文献管理中,以便论文写作时直接作为参考文献进行引用。。 另外,作为我本人还有“主题订阅”的需求,就是订阅某个主题的最新文献。   此外,团队协作中,不仅仅是资源分享,还包括任务管理、实验记录管理等。   导师为会新生安排文献阅读和实验任务,但任务完成情况,目前还没有有效的质量评估方法。可否考虑通过对成员分享文献、笔记(可分为精读笔记、泛读笔记)、完成的试验记录的统计,加上成员彼此之间的关注、评论,实现了任务的统计和只能评估?。   2012年4月发布的NoteFirst3.0,打通了知识获取、知识管理、知识应用、团队协作之间的关节,是NoteFirst的一个里程碑版本。NoteFirst 之于科研人员个人,是知识管理系统;之于团队和机构,则是团队科研协作系统。其功能列表如下:   NoteFirst 3.0 主要新功能包括:   1)期刊订阅  订阅关注期刊的最新文章,还可以订阅科研相关资讯,如基金委动态、相关企业的最新产品信息。当关注期刊、网站、专家有最新文章、信息、博文发布时,会自动接收,提高了效率,方便了使用。(该需求是中国科大罗老师的建议)  下面是我个人订阅的部分信息的列表。   NoteFirst可以把订阅的信息直接转换为题录,可以在论文写作时直接作为参考文献来使用。NoteFirst可自动补充期刊名称、年卷期页码等作为论文引用时的核心元数据。   NoteFirst提供了科学RSS列表,收录了国内外的期刊、政府科研相关的动态、知名学者博客微博、研发型企业最新产品通报等科技相关的RSS源。   2)主题订阅   可以订阅SCI、EI、PubMed 、IEEE等数据库中某个主题的最新科研成果,可以订阅某个专家的最新成果,可以订阅个人成果被知名数据库(如SCI、EI、Pubmed)收录的情况,可以订阅个人成果被别人引用的情况。(该需求是中国农大的胡教授的建议。)   目前数据库支持SCI、EI、IEEE、Pubmed、万方、知网。 后续支持的数据库包括:ScienceDirect、Springer、Wiley、CA、AIP等。   3)团队任务管理(农大胡教授的建议)   4)成员间交流 成员可以查看所参与群组的最新动态,包括资源的分享、成员的加入、微博信息等,对分享的资源进行评价、添加笔记;微博提供了便捷的交流工具,成员之间还可以通过内部短信进行交流。   5)机构知识库建设 把团队的个人成果、试验记录、重组数据进行再组织,开辟机构成果展示"橱窗",提高团队和机构的学术影响力。文献、试验记录、读书笔记等都是团队智慧劳动的见证,资源的日积月累不知不觉中就构建起了机构的知识库,也记录了团队科研活动的历史。   以此作为NoteFirst3.0发布的纪念。   感谢朋友们多年来对NoteFirst的支持。   欢迎朋友们进行试用,提出建议。   NoteFIrst3.1 将支持新浪微博的订阅,希望也能支持科学网微博的订阅(还没有研究科学网微博是否提供了RSS订阅)。   NoteFIrst的官方网站:http://www.notefirst.com
个人分类: 随笔|9968 次阅读|5 个评论
测试的尴尬(111024)
热度 4 ymin 2011-10-24 10:33
测试的尴尬(111024) 闵应骅 在“地沟油和食用油分不开吗?(111014)”这个问题提出来以后,彭宁川先生在“用科学的眼光辩证地看待地沟油问题”中给了很专业的回答。使我联想起在硬件和软件的测试中都碰到了这种尴尬的局面。在硬件测试中,几十年来都是面向故障的。也就是说,先有一个故障模型,定义了一些故障。然后去测试被测电路中有没有这些故障。测试的好坏就用能测试多少这样的故障为标准。可是,现在,集成电路远远地比过去规模大,门数多,技术复杂,原来定义的故障模型根本不够用,不能反映集成电路主要的设计和制造缺陷。定义多少故障模型都是不够的,甚至可以说,人们还有许多人们所不知道的故障。软件的情况完全类似。你根本不知道软件可能有一些什么样的故障,当然你也无法模型化。现在的软件测试还有许多是面向故障的,就是说我只检查被测软件中是否有我所关心的故障。可这跟被测软件的质量,几乎根本挂不起钩来。 软件测试中测试者发现两种情况:一种是发现故障特别多;一种是没有发现任何故障。第一种情况说明:不知道还有多少故障没有发现呢?也许这根本是一个不能用的软件;第二种情况并不说明被测软件没问题,而是说明测试过程有问题,不全面。这就构成一个测试的悖论:我们倒是希望测试出许多问题,还是希望测不出问题?所以,测试界把测试看作一个知识获取的过程,即所谓五级无知论。Phillip G. Armour说:软件不是一个产品,而是存储知识的一个媒介。生产一个软件很容易,生产一个可以工作的软件就很难。所以,我们是要从软件中获取知识。 所谓“无知”,原文叫"Ignorance"。就是说,你用一组输入去测试一个软件,如果你能判断这个结果对不对,那就是知识。如果你根本不知道这结果对不对,那也是一种知识。孔子曰:“知之為知之,不知為不知,是知也。”有五级的无知(Order of Ignorance): 0级无知(0OI):你知道你的问题及其答案。譬如说问题1+1=?,答案2。 1级无知(1OI):你知道什么是你不知道的,你有自己的的问题。譬如说,你知道想要解一个方程,但是你不知道它的解;你知道:测试是要找不知道的故障。 2级无知(2OI):你不知道:什么是你不知道的。譬如说,你不知道:你要找一个你所不知道的故障。 3级无知(3OI):你根本没有办法,或者说没有一个过程去解决补充你的相关知识。你没有方法和过程去发现问题。发现问题比找到答案更难。 4级无知(4OI):对这五级无知,全无所知。 把测试看作一个获取知识的过程,你就会集中精力去探索,去获取,而不是去追求这个过程的终结。
个人分类: 计算机|3830 次阅读|12 个评论
科学知识关联与知识利用
xupeiyang 2010-7-12 11:01
采用先进的数据挖掘与知识发现技术,将海量文献信息中的知识单元提取,并将各种知识载体和内容建立关联,实现信息与知识资源的高度整合,大大提高了知识的利用效率。 http://www.sciencedirect.com/science?_ob=HomePageURL_method=userHomePage_btn=Y_acct=C000059499_version=1_urlVersion=0_userid=9230734md5=2bfd78a34eebd45647c076dbe61376c0 这个科学信息平台就实现了这样的功能。 这个信息平台的相关介绍请见: http://www.sciencenet.cn/blog/user_content.aspx?id=339449 知识标签包括: all affiliation 机构 author 作者 biogroup 生物群 compound 化合物 disease 病症 gene and proteins 基因和蛋白质 organism 生物体 primer tissue 组织 详细信息请见: http://sciencedirect.nextbio.com/e/search/ft/breast%20cancer?type=diseaseid=142027it=Tumor%20Self-Seeding%20by%20Circulating%20Cancer%20CellsdpId=1logId=199ade140a7b48b1afb43513e391ea5btcid=0d1b5cdcda0848a2b41c1612b461bd37log=truelogTagType=diseaselogTagId=142027logTagName=breast%20cancer 知识概念与定义: breastcancers 乳腺癌 A primary or metastatic malignant neoplasm involving the breast. The vast majority of cases are carcinomas arising from the breast parenchyma or the nipple. Malignant breast neoplasms occur more frequently in females than in males. -- 2003 知识标签(知识点、知识单元、词汇): apoptosis BMI1 bone BRCA1 breast breastcancers breasttumors C11orf30 cancerstemcell carcinomas CCND1 celllines CYLD epithelialcells ErbB2 ESR1 FRK GATA3 human humanmammarystemcells IMPDH1 INPP4B KDM1 luciferase lung mammarygland metastasis mir-31a mouse MTDH MYC NFKB1 phosphorylation PTEN retinoicacid stemcells TGFB1 TNF TNS3 YBX1 Sizes of these terms reflect their relevance to your search. 从这些词的形态大小就可以看出与你检索的信息的相关程度。 知识关联包括: ScienceDirect Top matches for ScienceDirect articles related to breast cancers View all ScienceDirect results PubMed 医学数据库 Top matches for Pubmed articles related to breast cancers View all PubMed results Clinical Trials 临床试验 Top matches for clinical trials related to breast cancers View all clinical trials results News 新闻与事件 Top matches for news related to breast cancers View all news results Genomics Data 基因组学数据
个人分类: 知识发现|3882 次阅读|0 个评论
从IPO分析未来的搜索引擎
huabolin 2008-10-24 12:27
从IPO分析未来的搜索引擎 化柏林 ( 中国科学技术信息研究所,北京 100038) (发表于《情报学报》2006年增刊) 摘 要 本文主要从搜索引擎的爬行范围、对网页内容的分析处理以及用户查询接口三个方面分析了搜索引擎的最新进展,并根据技术发展的规律以及人机交互的需求对搜索引擎的信息采集、信息分析、信息提供三大处理过程和支撑资源的建设等方面的发展作了相应的分析与从预测。 图1. 搜索引擎发展趋势图 一 . 信源Input 二代搜索引擎的URL是直接从html文件中析取出来的,是字符级匹配的过程。 三代搜索引擎能够爬行以数据记录为内容的网页。 四代搜索引擎在爬行过程中还多了一个自动注册机。 五代搜索引擎能够对私有数据进行搜索,当然异构数据的查询也早就实现了。****************************************************** 二. 分析处理Process 二代搜索引擎主要利用分词技术,词根词干分析技术,词语同现及频率分布。 三代搜索引擎不再停留在词的层面,深入到句法层面,对句子的结构、句子成分及词汇短语在句子中的功能进行分析;对于图形图像涉及到颜色、纹理、形状的分析;对于音频涉及基音、音强、音色,对于视频涉及到帧结构、镜头运动方式与切换方式等 。 四代搜索引擎将深入语义层面,深入理解句子的意思,理解图像的含义、音频视频的内容,这时对于不同媒体格式的数据可以达到统一。 五代搜索引擎将穿越语义,在充分理解各种语义的基础上,能够分析文献的写作手法、修辞方式,能够推敲语言的妙用。 三 . 信宿Output 二代搜索引擎输入的是文本,输出的是文本、图像、音频、视频。 三代搜索引擎可以实现出入口同媒体,通过输入自然语言的句子来进行文本的搜索,而对于图形,可以输入示例图形,也可以草图查询。 四代搜索引擎可以实现输入与输出是不同的媒体,如果没有相应的媒体数据,可以由系统生成。 五代搜索引擎不仅可以生成相应的音频和视频,还能够准确地配以空间属性,以地理属性的可以进行全球定位。 ******************************** 从IPO分析未来的搜索引擎
个人分类: 信息检索|4832 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 20:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部