科学网

 找回密码
  注册

tag 标签: 知识挖掘

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

读《专利知识挖掘关键技术研究》有感
热度 4 yngcan 2013-8-11 22:27
读《专利知识挖掘关键技术研究》有感 最近在亚马逊上发现一本新书,是北京工业大学翟东升老师的《专利知识挖掘关键技术》,这本书我从购得到读完近花费了一天的时间,但期间可以说是废寝忘食的。写的非常不错,原因有如下几点: 1. 该研究非常有理论和现实价值。该书完整的概括了“专利信息构建 —— 专利信息整合 —— 专利信息分析 —— 专利信息应用 ” 的全过程。而且并不是一个理论上的构建过程,而是从实践层面,一步步告诉我们如何实现这些步骤。 2. 从专利信息构建上说,该书介绍了如何利用网页信息抓取技术对专利数据进行获取及其过程。尤其是其中的 2.3.3.4 “文档解析抽取与专利基本数据映射 ” 的内容,很值得仔细研究。 3. 从专利信息整合过程研究上说,利用 SQL SERVER 的 SSIS 服务实现了专利数据的整合与清洗过程,无论是逻辑框架的设计还是异质数据结构之间的关联都体现了极高的专业性。 4. 专利信息分析部分,是非常棒的一部分,尤其是对不同数据的处理、清洗流程尤其值得学习、借鉴,同时,该书利用 SSAS 实现了专利统计分析功能的做法,以及利用 CLEMENTINE 实现文本挖掘的做法,都有很多经验值得学习和借鉴。 5. 专利信息应用。该书类似于一本面向专利知识挖掘关键技术的实用指南,书中没有很多高深的理论,但有着将理论转为为实践的具体操作步骤,而这些实用指南恰恰是目前国内进行专利分析研究最欠缺的。 在读这本书的过程中也发现存在一些可以发展的地方: 1. 该书中主要是以专利信息抓取的方式来构建专利信息仓库的,但实际上,目前, USPTO 早已经将自己的专利数据完全公开了,为何作者不考虑直接以原始的 USPTO 数据作为专利信息源? 2. 另外一个问题是在专利信息整合上,文中对于 USPTO 以及 DII 数据进行一定的整合,但在专利分析实践过程中,信息整合往往要面临更为复杂的状况。 USPTO 只代表了全球少数的专利(假设约 10% 吧), DII 虽有 40 多个国家的专利,但 DII 数据的信息只包含为数不多的几个著录项,如果真正做技术竞争情报的挖掘是不够的,需要在更大的范围上整合国别专利信息资源。因此,是不是至少应该将 JPO,EPO 的数据考虑进来。但整合不同国别数据库的过程是非常复杂的,是很需要进一步研究的。 3. 在专利信息分析部分,该书通过 SQL SERVER 的分析和报表模块实现了大多数的专利统计分析功能,然而对于网络分析方面的一些指标则尚未考虑进来。例如合作、共引、耦合等。 其实,本人只所以要写这么一段文字,是因为十分认同作者的工作,对该书作者的一种致敬。完成这么一本著作是一个非常不易的过程,其中的辛苦也许只有作者本人知晓,但书中的宝贵经验也会激励我们这些在专利信息分析上的后来人。
个人分类: 专利|6368 次阅读|3 个评论
巴西第二届社交网络分析和知识挖掘年会(BraSNAM)简介
热度 2 Liweigang 2013-4-11 08:27
巴西第二届社交网络分析和知识挖掘年会( BraSNAM - II Brazilian Workshop onSocial Network Analysis and Mining ) 将于7月24-25日在著名海滨城市、马赛奥首府阿拉果亚斯举行。这将是巴西全国计算机年会(CSBC)的系列专业会议之一。BraSNAM会议主席分别是里约热内卢联邦大学的 Joi nice Oliveira 博士和米纳斯联邦大学的 Fabrício Benevenuto 博士。 会议的征文期限为 4月15日,若有兴趣通过本次活动与巴西同行交流,请访问以下会议网站: https://sites.google.com/site/brasnam2013/ 。英文征稿内容如下: It is a pleasure to announce thesecond Brazilian Workshop on Social Network Analysis and Mining (BraSNAM) . Theworkshop will be held together with the 33ndCongresso da Sociedade Brasileira de Computação (CSBC) which is theofficial event of the Brazilian Computing Society. The goal of the meeting isto provide a valuable opportunity for multidisciplinary groups to meet andengage in discussions on social network analysis. The conference will beheld in Maceió, AL ( Alagoas - northeast Brazil), on July 24-25, 2013. The study on social networks has its origins in social,educational and business communities. Academic interest in this fieldhas been growing since the mid 20th century. Therecent increase in the number of Web users stimulates the interaction among people, data dissemination and exchange ofinformation , and also increasessignificantly the available data , provided by people, their interaction,logs and web servers . With big data sets theanalysis can be more accurate and brings also the opportunity to evaluateand develop new techniques for social network analysis and data identificationand mining. This has raised the interest of a wide range of fields - suchas academia, politics, security, business, marketing, science - on socialnetwork analysis. The II Brazilian Workshop on Social NetworkAnalysis and Mining (BraSNAM 2013) will bring together researchers andprofessionals interested on social network analysis and related fields, and willpromote collaborations as well as exchanges of ideas and experiences. 若科学网博主有意投稿,需要相应协助,可以发评论或短信给本博,以便进一步介绍论文格式和投稿系统等具体事项。 来美丽的阿拉果亚斯海滩度蜜月--市旅游局宣传图片
个人分类: 社交网络|4211 次阅读|3 个评论
[转载]KDD2012
rbwxy197301 2012-9-18 17:36
ACM SIGKDD 国际会议(简称 KDD )是由 ACM 的数据挖掘及知识发现专委会主办的数据挖掘研究领域的顶级年会。第 18 届 KDD 年会(即 KDD ’ 12 )已于 2012 年 8 月 16 日在北京国家会议中心完美地落下帷幕。这是 KDD 首次在亚太地区举办,对 KDD 以及中国的数据挖掘都具有重大的里程碑意义。海内外数据挖掘领域的华人学者在 KDD ’ 12 的组织工作中扮演了重要角色,他(她)们出色的组织工作不仅保证了 KDD ’ 12 的顺利召开,而且在 KDD 历史上首次引入了诸多创新性的新元素,诸如暑期学校( KDD summer school )、亚太专题( Asia Pacific Track )、 30 秒的论文视频宣传计划( 30-second video advertisement program )、开幕式和特邀报告的在线直播( online webcast )、个性化的会议报告日程安排( personalized schedule and reminders for talks )、论文展板的统一制作( The uniform posters program )、以及闭幕式期间的幸运抽奖( Lucky draw )等。同时,大会所接收到的研究论文投稿数( 755 篇)和参会人数( 1232 人)都创造了 KDD 历史上的最新记录。 为了向国内的数据挖掘从业者及数据挖掘爱好者全面、及时地介绍这一盛会的情况,我们有幸邀请到了担任大会组织工作的部分华人学者,请他(她)们从多角度细致地介绍 KDD ’ 12 的情况。这些学者包括大会主席、香港科大的杨强教授,大会副主席、 CityGrid Media 的沈抖博士,大会程序委员会共同主席、加拿大西蒙弗雷泽大学 (SFU) 的裴健教授,企业及政府应用分会程序委员会共同主席、美国罗格斯大学( Rutgers University )的熊辉教授,研讨会( Workshops )共同主席、南京大学的周志华教授,亚太主题分会的共同主席、香港大学的張偉犖教授和美国加州大学洛杉矶分校( UCLA )的王伟教授, KDD 暑期学习班共同主席、清华大学的孙茂松教授、中国人民大学的杜小勇教授和微软亚洲研究院的李航博士以及具体组织者刘知远博士,专题讨论会( panel )共同主席、加拿大西安大略大学的凌晓峰教授,以及 KDD CUP 的共同主席、腾讯公司的孙国政博士和岳亚丁博士。这些会议的组织者分别介绍了大会的概况、研究专题( Research Track )、企业及政府应用专题( I/G Track )、研讨会( Workshops )、亚太专题( A/P Track )、暑期学习班( Summer School )、专题讨论会( Panel )、 KDDCUP 竞赛的情况。此外,清华大学计算机系的博士研究生沈玮还总结了大会的特邀报告情况( Keynote Presentations )。 KDD ’ 12 概况篇:大会总结 作者:杨强(大会主席,华为诺亚方舟实验室,香港科技大学),沈抖(大会副主席, CityGrid Media ) 第十八届 ACM SIGKDD 数据挖掘及知识发现国际会议(即 KDD 2012 )已于 2012 年 8 月 12--16 日在北京成功举办。 KDD 是数据挖掘及知识发现领域的顶级年会,为该领域研究成果的展示和实践经验的交流提供了一个理想的场所。如今,我们已经进入了大数据的时代,从学术研究到工业应用,从科学发现到医疗卫生服务,来自不同领域的研究者们共享和交流数据挖掘的创新理念和先进方案的需求与日俱增。今年的 KDD 大会创造了多个纪录,这也是这个领域蓬勃发展的生动写照。 全文 回到顶部 KDD ’ 12 经典篇:研究专题( Research Track ) 作者: Deepak Agarwal ( LinkedIn ),裴健( 加拿大西蒙弗雷泽大学) KDD 2012 共收到学术论文投稿 755 篇,通过严格的审稿程序,录用 133 篇,录用率为 17.6% 。程序委员会由 50 名资深委员和超过 350 名普通委员组成。最后, 13 篇论文被修改后录用。评奖委员会评选出了一篇最佳论文和两篇最佳学生论文。 Rakthanmanon 等的论文“ Searching and Mining Trillions of Time Series Subsequences under Dynamic Time Warping ”获得了最佳论文奖。 KDD ’ 12 经典篇:企业及政府应用专题( I/G Track ) 作者:熊辉(美国罗格斯 - 新泽西州立大学) ACM SIGKDD2012 年的企业及政府应用的主题延续了 2010 和 2011 年的实施方向,通过明确地集中在对于企业界和政府机构是价值源泉的应用 KDD 工作的三个方面深入研究:( 1 )已部署的应用程序,( 2 )知识发现,( 3 )新兴的应用。这些方面都建立在 KDD 的研究结果。这类的研究结果应用到具体的现实世界中的问题和新颖实用的应用程序, 并发现新奇有趣的实用知识,并将研究成果实现推广应用。 全文 回到顶部 KDD ’ 12 经典篇:研讨会( Workshops ) 作者:周志华(南京大学) KDD 2012 大会共收到 29 份 Workshop 申请, Workshop 总主席南京大学周志华教授和美国南加州大学 Sofus A. Macskassy 博士邀请了 23 位国际同行专家组成 Workshop 程序委员会,最终有 8 个 Workshop 被接受为“全天” Workshop , 11 个 Workshop 被接受为“半天” Workshop ;再加上按照惯例举行的 KDD 杯竞赛( KDD Cup ) Workshop ,一共有 20 个 Workshop 在大会上举行。所有 Workshop 的论文集都由 ACM 统一出版,在 ACM 数字图书馆中可以查阅。 全文 回到顶部 KDD ’ 12 经典篇:特邀主题报告 (Keynotes) 作者:沈玮(清华大学计算机系) 今年的 KDD 大会特别邀请了 4 位主题报告发言人,他们分别是:百度公司创始人、董事长兼首席执行官李彦宏,美国伊利诺伊大学香槟分校计算机系韩家炜教授,美国加州大学伯克利分校计算机系、统计系迈克尔•乔丹( Michael I. Jordan )教授和美国宾夕法尼亚大学计算机和信息科学系迈克尔•卡恩斯( Michael Kearns )教授。我有幸参加了今年的 KDD 大会,并聆听了这些精彩的特邀主题报告。本文将详细介绍这 4 个精彩的特邀主题报告。 全文 回到顶部 KDD ’ 12 特色篇:亚太专题 (A/P Track) 作者:張偉犖(香港大学),王伟(美国 UCLA ) 在过去的十年中,亚太地区的大学和研究所在知识发现方面取得了显著的进步,并做出了突出的贡献。借此次 KDD 2012 在中国北京举行的机会,本届会议推出一个新的项目——亚太专题。其目的是推动亚太地区知识发现研究,提升知识发现研究的关注度和发展势头。这个项目意在邀请来自亚太地区大学和企业研究机构的专家针对知识发现研究成果和应用项目进行学术演讲。经过程序委员会成员 Tu-Bao Ho 、王建勇、 Hiroshi Motoda 和周志华的推荐,我们很荣幸地邀请到 12 位成绩卓越的科研工作者分别在亚太专题的三个研讨会上做学术报告。 全文 回到顶部 KDD ’ 12 特色篇:暑期学校( Summer School ) 作者:刘知远(清华大学),孙茂松(清华大学),杜小勇(中国人民大学),李航(华为诺亚方舟实验室) 2012 年 8 月 10 日、 11 日,计算机科学领域国际顶级学术会议“第 18 届知识发现与数据挖掘 ACM 学术会议( KDD-2012 )”在清华大学罗姆电子工程馆报告厅举办了暑期学校。这是 ACM SIGKDD 首次举办暑期学校。清华大学计算机系孙茂松教授、人大信息学院杜小勇教授和华为诺亚方舟实验室首席科学家李航博士共同担任暑期学校共同主席。本次暑期学校以大数据挖掘( Mining the Big Data )为主题,力邀数据挖掘领域国际著名学者担任授课老师,包括伊利诺伊大学香槟分校韩家炜教授、卡内基梅隆大学 Christos Faloutsos 教授、伊利诺伊大学芝加哥分校刘兵教授、谷歌高级研究科学家 Ravi Kumar 、斯坦福大学 Jure Leskovec 和微软亚洲研究院高级研究员王海勋博士,每人授课 2 小时,内容覆盖社会网络分析、社会媒体内容分析、图挖掘、分布式处理等大数据挖掘热点研究课题。 全文 回到顶部 KDD ’ 12 大数据篇:专题讨论会( Panel ) 作者:凌晓峰(加拿大西安大略大学) 这次专题讨论会的主题是“大数据挖掘”,邀请了若干来自工业界和学术界的著名专家:美国加州大学 Berkeley 分校的 Michael I. Jordan 教授,美国 CMU 的 Christos Faloutsos 教授,微软公司的 Zijian Zheng 博士,北京大学的高文教授,美国 UIUC 的韩家炜教授,美国 ChoozOn 公司的 Usama Fayyad 博士。 全文 回到顶部 KDD ’ 12 大数据篇: KDD CUP 竞赛 作者:孙国政(腾讯公司),岳亚丁(腾讯公司) 本届 KDD Cup 中,发布的两个竞赛题(腾讯微博用户推荐、搜索广告点击率预测)来自于实际场景,公布的数据量前所未有的大,因此激发了研究人员的高度热情,两个题目分别吸引到来自全球的 658 只队伍( 865 人)、 171 只队伍( 280 人)的积极参与。 KDD Cup 2012 的竞赛题目一:预测腾讯微博用户可能收听哪个用户(或信息源);题目二:给定搜索检索词和用户信息,预测搜索广告点击率。 全文 回到顶部 本文转自: http://www.ccf.org.cn/sites/ccf/dsj.jsp#1 注:点击上面链接可以下载原文
个人分类: 文章转载|4744 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 02:21

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部