科学网

 找回密码
  注册

tag 标签: 清华同方

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

中国的期刊数据库出版商何时能够走向世界?
waterlilyqd 2015-6-26 19:48
这只是一个问题。用我这两天的经历来说说话: 想请CNKI将网站上Journal of Mountain Science 页面上的我要投稿加上我刊的投稿链接,昨天上午,我在CNKI网站的在线建议里面写出了详细的建议并加上了网页的链接,然后填上我的电话和邮箱。昨天下午,我收到了CNKI的邮件,告诉了我要联系的人员的电话号码,于是今天下午按照信中提供的电话打过去询问和说明,对方告诉我这件事得打XXX电话,我依照告知的电话打过去,这个人说这件事要找某某某部门,又告诉我一个电话,就这样我前后打了4个电话,费了不少口舌进行情况描述,并提出我的要求和建议,总共花了两天大约2小时的时间,可是最后的答复却是:由于国家有严格的管理规定,CNKI的网站一律不能加外部链接。我告诉她,我们期刊在Springer的网页上关于投稿的地方也能加期刊的投稿链接,为什么你们不能?说这是规定。我说我要向Spinger反映问题,一般只要向一个专门负责我们期刊的人反映就肯定能得到反馈意见,你们却让我来来回回打了无数的电话,花了很多的时间,结果得到的是这样的答复! 写了这么多,我想说,要让中国的文献数据库走向世界,路还很长!中国期刊的国际化要靠中国的数据库出版商走向世界,路还很漫长!这么多中国期刊要借船出海,这是为什么? ------- 申明一下,在我心目中,CNKI在中国的几大期刊数据库商中如果不是做得最好的,也算做得好的! 我只希望它们能够越做越好!
个人分类: 社会杂谈|3218 次阅读|0 个评论
抄袭检测系统将给中国学术界带来的变化
热度 1 huabolin 2009-8-3 08:47
中国科学技术信息研究所 化柏林 学术抄袭是个敏感的话题,加强管理、强调自律等措施发挥着重要作用。然而,利用技术手段解决学术抄袭也是一个重要举措。清华同方(中国知网)研发的学术不端检测系统、武汉大学沈阳副教授研发的ROST反剽窃系统、笔者研发的文章自写度测评系统ANES-SM等,运用不同的技术手段来解决学术抄袭检测的问题。从自动化角度解决学术不端的问题主要包括两个方面:抄袭检测和一稿多发检测。从技术实现的角度来讲,是一回事,就是相似文献内容的匹配判定。 1 抄袭检测系统将给中国学术界带来的变化 1) 编辑部的审稿工作会得到某种程度的减轻 编辑部利用抄袭检测系统对作者来稿首先进行自写度初查,看看文章有多少成分是自己写的,有多少成分是他人的。如果引用或抄袭他人的成分太多,这样的稿件将不会进入下一轮审稿。而且如果作者有较严重的抄袭的话,那么编辑部可以把此人加入黑名单,以后此作者再投的稿子,就需要慎重考虑甚至不考虑了。 2) 期刊稿源数量将会大幅下降 最近很多编辑部采取缩短出版周期(双月刊变月刊、月刊变半月刊)、增加页码等方式应对来源稿件的增加。笔者对数个研究专题的论文进行集中阅读,在对每个专题看到20篇(左右)论文的时候就看不下去了,因为论文之间的重叠度太高了。基于这种检测系统,有问题的论文会被检测出来,而对于作者来讲,由于这种系统的出现,有问题的论文在投稿时也会很小心,所以稿源数量会在一定程度上有所下降。 3) 一稿多发的现象会得到缓解 目前,一稿多发的现象也屡见不鲜。把标题改一下,内容稍作调整,分别投向会议与期刊,或者不同学科的期刊。一稿多投的稿件其论文标题一般会有两个关键词,通过把两个关键词位置关系置换达到改头换面的目的,例如《自然语言理解的全信息方法论》与《全信息自然语言理解方法论》。一稿多发由于时间同步,所以尚不好从源头上解决,属于后控操作,所以一稿多发的作者进入黑名单也能起到警示与惩罚的作用。 4) 科研诚信评价将会启用自动化手段 一稿多发、学术抄袭检测的自动化,使科研诚信评价制度化。项目评审、职称晋升、博导院士遴选将会采用一票否决制,只要出现较严重的一稿多发或学术抄袭等学术不端行为,那么将会失去以上评选与晋升的机会。科技部、教育部、国家自然科学基金委、新闻出版总署等部门将会联合启动学术抄袭检测大行动。对于这种原则性的问题,学术界本身会更加强调学术规范的自律行为,相关管理机构会加强这方面的监管与处罚。原则性的错误不需要同情也不能同情。 5) 出书周期将会变长 现在有的人几个月就能出本书,更有甚者几周就能出本书。这样的行为称之为编书,而不是写书或著书。编书的自写程度不超过1/3,除少数章节外,大部分内容来自他人成果。编书的参考文献数量在10篇左右,一般不超过百篇,而且以书为多,论文特别是外文参考文献较少。书中不作参考文献的实际标注,却有成页成页的内容来自他人成果。抄袭检测系统的应用,使出版社今后对此类书的出版会很小心。 2 抄袭检测系统的应用将带来的一些副产品 1) 文献综述将由系统完成 按学术抄袭检测系统的原理,检测出相同的句段,而不同的句段按照一定顺序组合在一起,即可形成综述报告。从理论上来讲,如果运用句子匹配分析技术,把相关主题的文章综合到一起,进行句子级的滤重与重组,就可以实现综述型文章的自动完成,即文献自动综述。 2) 参考文献的标注将实现自动化 已有一些参考文献的管理软件,如EndNote、NoteExpress等,可以很好地管理并标注参考文献。但是标注在文章的哪个地方,这些软件实现不了,还需要人工标注。 3) 科学计量将会引入引用量等指标 现在的引文分析主要反映引用次数。引用某篇文章的一个术语、一个数据和引用一篇文章的几句话甚至文章的中心论点是不一样的,因此不仅要考虑参考文献与引用文献数量,还要考虑引用内容的量,即不仅要关注引用的多和少,还要考虑引用的大与小,引用粒度的不同决定着参考文献的价值不同。应用抄袭检测系统的原理,可能会使科学性引入引用量的指标。 对于抄袭的认定,不同的研究人员有不同的算法,但基本思路是一致的。抄袭的技术判断主要是段落匹配或句子匹配甚至词语匹配。抄袭检测系统的主要障碍在于没有一家数据库商能提供论文、图书、报纸、专利、网页等十大文献源数据,跨语言匹配也是抄袭检测系统的一个技术难点。 抄袭检测系统会带来上述变化,如果有一天该系统有全文数据库支持和跨语言匹配,抄袭检测系统所带来的变化或许真的很大。 但必须指出这种检测只是形式上的检测,对软性抄袭还无能为力。所谓软性抄袭,是指抄袭人家的观点和论证方式,但用自己的语言写出来,当成自己的创新。这种形式的抄袭,现在的反抄袭软件还判断不出来。 (责任编辑 王芷) (原文发表于《科技导报》2009年第12期)
个人分类: 文本分析|8800 次阅读|6 个评论
从检索技术的实现看三大全文数据库的发展
huabolin 2008-10-24 12:31
(发表于《图书情报工作》2007年第10期) 【摘要】 通过三个有针对性的检索对清华同方、万方数据、重庆维普三大全文数据库的检索技术实现的特点进行分析,从其目前提供的功能和招聘信息分析他们在竞争中所处的位置。指出全文数据库的三大核心竞争力是:历史数据的回溯、当前的数据质量、未来的增值服务。进而对未来的增值服务进行分析与预测,包括计量分析自动生成系统、句子级文献自动审稿系统、参考文献自动标注系统、观点型搜索,这些系统的实现将使得文献服务真正走向知识服务。 **************************************************************************** 论点一:检索词长了,检索结果未必少 标题精确检索图书馆比图书的结果多 网络信息计量学的检索结果也比网络信息计量的检索结果多 元数据的检索结果比数据的结果少 **************************************************************************** 论点二:核心竞争力 期刊全文数据库的竞争主要体现在三个方面: 历史数据的回溯; 当前的数据质量; 未来的增值服务,即数据的深加工程度。 ***************************************************************************** 论点三: 增值服务是核心竞争力的核心 增值服务除了提供更好的检索服务外(如中英文摘要语料对齐后的双语检索),还包括(但不仅限于)以下的应用: (1)提供文献计量自动分析的查询,如清华同方已推出的中国学术期刊文献评价统计分析系统。 (2)提供学术调研报告的自动生成,在文献计量自动分析的基础上,对国内外某领域进展情况进行评述。学术调研评价可以指导论文的选题和前期调研,特别有利于论文选题、项目评审等工作。 (3)可以从句子级提供文献自动审稿辅助功能,以及参考文献自动标注功能。 (4)提供更小粒度的检索,支持句子检索、真正的图片检索(首先是流程图、系统结构图、数据表等的检索,以后会支持图像检索,从颜色、纹理、形状等各个要素进行分析),大量使用信息抽取技术,提供列表式搜索。 (5)支持学术问答,支持观点型搜索、流派型搜索,能够提供学者谱系图,利用学位论文的致谢提供导师自动评价系统。 (6)提供知识点与知识点之间的链接,实现真正的知识服务。正如由过去买本整刊进行阅读到现在只看某篇文章,将来可能实现只看某篇文章的某一部分。 **************************************************************************** 从检索技术的实现看三大全文数据库的发展
个人分类: 信息检索|4532 次阅读|1 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 17:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部