科学网

 找回密码
  注册

tag 标签: DBLP

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

[转载]JAS被DBLP收录
王飞跃 2020-9-3 23:19
JAS被DBLP收录 什么是DBLP? DBLP是计算机领域内对研究的成果以作者为核心的一个计算机类英文文献的集成数据库系统, 所收录的期刊和会议论文质量较高,文献更新速度很快,反映国外学术研究的前沿方向。 JAS自2017年起被DBLP收录: https://dblp.uni-trier.de/db/journals/ieeejas/ JAS简介 IEEE/CAA Journal of Automatica Sinica由中国自动化学会、中国科学院自动化研究所主办,报道自动控制、人工智能、机器人等领域热点和前沿方向的研究成果。JAS被SCI, EI, Scopus, Inspec等国际重要数据库收录,是ESI刊源期刊,是自动化与控制系统领域唯一的中国主办Q1区SCI期刊,也是谷歌学术计量自动化与控制理论学科TOP20出版物中全球最年轻且唯一中国主办的期刊。 IEEE/CAA Journal of Automatica Sinica 2019年首个SCI影响因子5.129,在自动化与控制领域全球63种SCI期刊中排名第11(前17%),位列Q1区;最新CiteScore为8.3,位于所属各领域Q1区前列。 JAS为中国科技期刊卓越行动计划世界一流重点建设期刊,自首次参评以来连年荣获“中国最具国际影响力学术期刊”称号。 期刊主页: http://www.ieee-jas.org/ 投稿系统: https://mc03.manuscriptcentral.com/ieee-jas
个人分类: 论文交流|2463 次阅读|0 个评论
JAS被DBLP收录
IEEEJAS 2020-8-17 10:08
什么是DBLP? DBLP是计算机领域内对研究的成果以作者为核心的一个计算机类英文文献的集成数据库系统, 所收录的期刊和会议论文质量较高,文献更新速度很快,反映国外学术研究的前沿方向。 JAS自2017年起被DBLP收录: https://dblp.uni-trier.de/db/journals/ieeejas/ JAS简介 IEEE/CAA Journal of Automatica Sinica由中国自动化学会、中国科学院自动化研究所主办,报道自动控制、人工智能、机器人等领域热点和前沿方向的研究成果。JAS被SCI, EI, Scopus, Inspec等国际重要数据库收录,是ESI刊源期刊,是自动化与控制系统领域唯一的中国主办Q1区SCI期刊,也是谷歌学术计量自动化与控制理论学科TOP20出版物中全球最年轻且唯一中国主办的期刊。 IEEE/CAA Journal of Automatica Sinica 2019年首个SCI影响因子5.129,在自动化与控制领域全球63种SCI期刊中排名第11(前17%),位列Q1区;最新CiteScore为8.3,位于所属各领域Q1区前列。 JAS为中国科技期刊卓越行动计划世界一流重点建设期刊,自首次参评以来连年荣获“中国最具国际影响力学术期刊”称号。 期刊主页: http://www.ieee-jas.org/ 投稿系统: https://mc03.manuscriptcentral.com/ieee-jas
1613 次阅读|0 个评论
[转载]DBLP数据解析
yngcan 2013-7-18 17:10
摘自: http://blog.csdn.net/kite1988/article/details/5186628 学习中~~ 因为参考论文使用的实验数据是dblp,所以我的论文也打算使用dblp的数据。在网上没有找到解析dblp.xml,然后存入数据库的例子。所以只能自己动手,丰衣足食。dblp官方网站提供了一个简单的使用sax解析的例子( http://dblp.uni-trier.de/db/about/simpleparser/ ),在例子的启发下,我写出了自己的xml解析版本。 一、dblp的xml文件格式 dblp总共有35中element,分别为 series sub (inproceedings:title) wwwdblpbooktitle sup (inproceedings:title)publisherjournalauthorchapter titlecrossrefisbnincollectionyear notepagesmastersthesisnumberurl i (inrpoceedings:title)citeeditoreeschoolarticle tt (inrpoceedings:title)addresscdrombookmonth volumeproceedingsinproceedingsphdthesis 在解析时,要特别注意sub、sup、i、tt,它们的父节点为title。如果在解析时,没有特别处理他们,title的值可能会出问题。我采取了一种很投机取巧的方法:手动将dblp.xml中的上述元素,替换成了空格,就省去了解析时的麻烦了。 二、数据库建表字段建议 建表时属性的类型和长度可以参考一下 `id` int(8) NOT NULL auto_increment COMMENT 'The internal key in the database', `key` varchar(150) NOT NULL default '' COMMENT 'The key in the xml file', `mdate` date NOT NULL COMMENT 'The last modification date of the entry', `title` longtext NOT NULL COMMENT 'Title of the publication', //`source` varchar(150) default NULL COMMENT 'Name to the publication source, i.e. Conference, Journal, etc.; for collections, the booktitle is stored here', //`source_id` varchar(50) default NULL COMMENT 'Reference to the publication source (first part of the dblp_key)', //`type` varchar(20) NOT NULL default '' COMMENT 'Type of publication, i.e. article, proceedings, etc.', 'booktitle' varchar(150) default NULL COMMENT 'Name of incollection' `pages` varchar(100) default NULL COMMENT 'Pages in the source, i.e. for example the journal', `year` int(4) unsigned NOT NULL default '0' COMMENT 'The year of the publication', 'address' varchar(100) default NULL COMMENT 'Address of conference (in proceedings)', 'journal' varchar(150) default NULL COMMENT 'Name of journal where article is published' `volume` varchar(50) default NULL COMMENT 'Volume of the source where the publication was published', `number` varchar(20) default NULL COMMENT 'Number of the source where the publication was published', `month` varchar(30) default NULL COMMENT 'Month(s) when the publication was published', `url` varchar(150) default NULL COMMENT 'DBLP-internal URL (starting with db/...) where a web-page for that publication can be found on DBLP', `ee` varchar(200) default NULL COMMENT 'external URL to the electronic edition of the publication', 'cdrom' varchar(200) default NULL COMMENT 'external Path to the PDF version of the electronic edition of the publication', `publisher` varchar(250) default NULL COMMENT 'Name of the publisher of the publication; school for theses; affiliation for homepages', 'note' varchar(100) default NULL COMMENT 'Note of the inproceeding', `crossref` varchar(50) default NULL COMMENT 'dblpkey crossreference to one other publication (book, proceeding, in the dblp_collections table), in which this publication was published', `isbn` varchar(25) default NULL COMMENT 'ISBN number of the collection', `series` varchar(100) default NULL COMMENT 'Reference to the publication series (books and proceedings only)', 'school' varchar(100) default NULL COMMENT 'School of the author', 'chapter' varchar(10) default NULL COMMENT 'Chapter in incollection' 三、dblp.xml数据陷阱 1、key不是唯一的。 比如,inproceedings的key的格式为:conf/会议名/作者+时间。由于作者名是简写(应该是姓),所以就存在key相同的情况。因为有名字类似的人,在同一会议、同一年发表文章。 我本来打算在数据接库中直接使用key作为主键,最后只好放弃,增加了自动递增的字段作为主键。 2、cite cite label="PBR".../cite 让人不知所云,我至今没有解析出来它代表的意思。 cite.../cite 更加高深,不知道放在这里有什么意思。 我在解析时,把这种数据都舍弃了。 另外,同一个inproceedings里还存在完全相同的cite /cite。又一次无语了,我只好为数据库的论文引用表也增添自动递增字段作为主键。 四、eclipse解析配置 dblp.xml很大,目前找到最小的也有130M(2002-10),最新的有676M左右。dblp官方的例子程序建议,使用xerces 进行解析。jdk1.6据说有bug,不能解析大的xml。jdk1.5需要进行参数配置:java -mx900M -DentityExpansionLimit=2500000。不过我曾经在jdk1.6下,配合参数配置,成功地解析过676M的xml文件。 后来开发环境转到了eclipse下,eclipse自带xerces ,但也需要进行java的参数配置。否则将会报出entity数目超出6,400的错误(好像是6400)。配置方法如下: 1、选择main所在的类,右键选择"run As"-"Open Run Dialog" 2、在右上方的选项卡选择"Arguments", 在下方的框"VM arguments”输入"-mx900M -DentityExpansionLimit=2500000"。 五、写入数据库 一开始我担心数据集太大,写入数据库的速度很慢。在网上查了一些加速的方法如批处理。后来发现写入数据库的速度还算快。 PreparedStatement stmt = conn .prepareStatement("insert into temp_inproc(title,year,conference,id) values(?,?,?,?)"); stmt.setString(1, paper.getTitle()); stmt.setInt(2, paper.getYear()); stmt.setString(3, paper.getConference()); stmt.setString(4, paper.getKey()); stmt.execute(); stmt.close(); 没有进行优化,读完一个类似inproceedings标签后,把信息拼装成好,就存入数据库一次。采取的是默认的自动提交的方式。把所有的System.out.println注释掉后,速度还是可以忍受的。总共写了82万多条共50.7M的数据,用了191.334s。
个人分类: 知识发现|5358 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 04:44

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部