YucongDuan的个人博客分享 http://blog.sciencenet.cn/u/YucongDuan

博文

基于DIKW的发明专利智能申请与答复系统的设计与实现(指导的2021年5月硕士毕业论文)

已有 2498 次阅读 2022-12-26 16:30 |系统分类:论文交流

Design and implementation of DIKW-based invention patent application automatic completion and intelligent auxiliary reply


学校代码:  10589                        学号:          

 

号:                               密级:          

 

 

 

 

 

 

 

   目:基于DIKW的发明专利智能申请与答复系统的设计与实现                       

   者:              湛楼高 (Lougao Zhan)                

指导教师:           段玉聪(Yucong Duan)   教授             

   业:                             

   间:           二一年五月            

 

 


Design and implementation of DIKW-based invention patent application automatic completion and intelligent auxiliary reply system

 

 

A Thesis

Submitted in Partial Fulfillment of the Requirements

 For the Master Degree in Software Engineering

 

 

By

Zhan Lou-gao

 

 

 

 

Supervisor: Yucong Duan

Major: Software Engineering

Submitted time: May, 2021


海南大学学位论文原创性声明和使用授权说明

 

原创性声明

本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律结果由本人承担。

 

论文作者签名:                            日期:           

 

 

学位论文版权使用授权说明

本人完全了解海南大学关于收集、保存、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。学校可以为存在馆际合作关系兄弟高校用户提供文献传递服务和交换服务。本人授权海南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。

保密论文在解密后遵守此规定。

 

论文作者签名:                           导师签名:           

日期:                            日期:           

 

…………………………………………………………………………………………

 

    本人已经认真阅读“CALIS高校学位论文全文数据库发布章程,同意将本人的学位论文提交“CALIS高校学位论文全文数据库中全文发布,并可按章程中规定享受相关权益。同意论文提交后滞后:半年;一年;二年;其他;()年发布

    

论文作者签名:                          导师签名:           

日期:                           日期:           

 

 


摘要

发明专利作为知识产权的核心组成部分,在国际经济竞争中发挥着不可替代的作用。面对经济和社会对创新的快速增长的巨大需求,传统的发明专利申请、审核、答复、授权等环节的从人才到管理的持续快速质量改进和效率提升都面对更艰巨的挑战。本文从信息技术角度,借助所在课题组丰富的发明专利申请和答复的数据和经验积累,研究依托数据、信息、知识与智慧(DIKW)架构的发明专利智能申请与答复系统,为海南加快培育现代产业体系,实现跨域式发展提供信息化保障。

首先依托数据图谱、信息图谱、知识图谱和智慧图谱(DIKW图谱)构建申请人和审查员两方的用户画像,依据各个用户画像搭建内容数据库,根据用户内容数据库设计多维度体系化交互机制。其次基于DIKW图谱架构的交互机制设计与实现发明专利智能申请与答复系统,依托和结合开发生命期软件工程全过程建模管理,面向发明专利申请到授权全过程处理,针对生命期内的发明专利,结合专利法、专利实施细则等相关专利法规,对申请人或代理人撰写的发明专利申请文档进行修正,使其符合相应的规则,并利用竞争及合作的智能填充算法实现专利的自动化申请。在答复过程中,根据答复意见并结合用户画像内容数据库,对内容进行重构,提供具有针对性的修改意见及方案,实现发明专利的智能辅助答复。之后,提出正负双向索引算法得到更加精确的搜索结果以配合专利申请和答复,其中搜索结果的形式除了匹配查询关键字的链接,还能够基于专利技术内容的实体关系搜索答案。最后,本文还结合TRIZ理论中的冲突矩阵工具,通过DIKW图谱对技术方案进行分析,依据40项发明创造原理,得出可供申请专利或有应用前景的技术发明点,并以数据图谱可视化展示

综上所述,本文对DIKW图谱技术和发明专利申请及答复的结合进行了深入的研究,涉及了DIKW图谱的数据层、信息层和知识层实体的处理、多模态融合的语义处理以及TRIZ理论等内容。依据DIKW图谱技术提出了一种可应用于专利智能申请与答复系统,基于我们的经验性判断及仿真实验表明本文将DIKW图谱技术应用于发明专利的研究是有效的。其研究内容具有理论意义和应用价值,可将本文的研究技术推广应用到海南各个专利申请和处理的单位,产生加速专利申请过程,提升质量和通过率,为海南自贸港创新发展助力。

 

关键字发明专利DIKWTRIZ多模态语义处理知识图谱元模型


Abstract

As a core component of intellectual property rights, invention patents play an irreplaceable role in international economic competition. Facing the huge economic and social demand for rapid growth in innovation, the traditional invention patent application, review, reply, authorization, and other links from talent to management and continuous rapid quality improvement and efficiency improvement are all facing more arduous challenges. From the perspective of information technology, this article uses the rich data and experience accumulation of invention patent applications and responses of the research group to study the invention patent intelligent application and reply system based on data, information, knowledge, and wisdom (DIKW) architecture, and accelerate the cultivation of modernization in Hainan. This system can provide an informatization guarantee for accelerating Hainan's cultivation of a modern industrial system and realizing cross-domain development.

First of all, this paper relies on data graph, infographic, knowledge graph, and wisdom graph (DIKW Graph) to build the user portraits of both the applicant and the examiner, build a content database according to each user portrait, and design a multi-dimensional systemic interaction mechanism according to the user content database. Secondly, in view of the invention patent in the lifetime, this paper designs the invention patent intelligent application and reply system based on the interactive mechanism of DIKW graph architecture. The system is oriented towards the whole process of the patent application to authorization, relying on and combining the whole process modeling management of software engineering in the life of development, combining patent law, patent implementation rules, and other relevant patent regulations, amending the patent application documents of inventions written by the applicant or agent, making it conform to the corresponding rules, and using the intelligent filling algorithm of competition and cooperation to realize the automatic application of patents. In the process of reply, the patent intelligent application and reply system reconstructs the content according to the reply opinion and combined with the user portrait content database, and provides the targeted modification opinions and schemes to realize the intelligent auxiliary reply of the invention patent. Later, this paper proposes the positive and negative two-way indexing algorithm to get more accurate search results with patent answers, in which the form of search results can not only match the query keyword links but also based on the entity-relationship of patented technical content to search for answers. Finally, this paper analyzes the technical scheme by DIKW graph, combined with the conflict matrix tool in TRIZ theory, and obtains the technical invention points that can be patented or have the application prospect according to 40 invention principles, and displays the experimental results visually with the data graph.

In summary, this article has conducted an in-depth study on the combination of DIKW graph technology and invention patent applications and responses, involving the processing of data layer, information layer, and knowledge layer entities of DIKW graph, semantic processing of multi-modal fusion, and TRIZ theory. Based on DIKW graph technology, this paper proposed a system that can be applied to patent intelligent applications and reply. Based on our empirical judgment and simulation experiments, it is shown that the application of DIKW graph technology to the research of invention patents is effective, and the research content has theoretical significance and application value. The research technology of this article can be promoted and applied to all patent application and processing units in Hainan, accelerate the patent application process, improve the quality and pass rate, and help the innovation and development of the Hainan Free Trade Port.

 

Keywords: invention patent; DIKW; TRIZ; multi-modal semantic processing; knowledge graph; meta model


目录

摘要

Abstract

目录

1 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 结合人工智能的发明创造活动视域分析

1.2.2 智能化发明专利管理与检索

1.2.3 结合人工智能的发明专利申请与答复

1.3 本文主要研究内容、关键技术及目标

1.3.1 研究内容

1.3.2 研究的挑战与问题

1.3.3 研究目标

1.4 论文组织结构

1.5 本章小结

2 相关技术研究综述

2.1 DIKW概念综述

2.1.1 DIKW hierarchy

2.1.2 数据及其元模型

2.1.3 信息及其元模型

2.1.4 知识及其元模型

2.1.5 智慧及其元模型

2.2 DIKW元模型及其图谱架构

2.3 知识表示学习

2.4 多模态语义搜索

2.5 TRIZ理论

2.6 本章小结

3 发明专利自动化申请

3.1 专利申请流程

3.2 构建发明专利申请文档数据图谱

3.2.1 申请书数据图谱构建

3.2.2 补正书数据图谱构建

3.2.3 意见陈述书数据图谱构建

3.2.4 实质审查请求书数据图谱构建

3.3 意图驱动的竞争及合作的智能填充算法

3.4 本章小结

4 发明专利的智能辅助答复与审查

4.1 基于DIKW图谱的多模态语义建模

4.2 基于DIKW图谱的内容传输及优化

4.2.1 基于DIKW图谱的交互区域划分及传输优化

4.2.2 基于DIKW图谱的内容重构

4.2.3 多模态内容语义价值计算

4.3 基于DIKW图谱的专利内容检索

4.3.1 基于DIKW图谱的搜索载体优化

4.3.2 基于DIKW图谱的正负双向搜索策略

4.4 本章小结

5 系统的设计与实现

5.1 系统目的

5.2 需求分析

5.2.1 功能性需求

5.2.2 非功能性需求

5.2.3 用例分析

5.3 总体结构及功能设计

5.3.1 系统总体结构设计

5.3.2 系统总体功能设计

5.4 系统的详细设计

5.4.1 专利文件提交及下载功能的实现

5.4.2 专利修改及答复功能的实现

5.4.3 专利检索功能的实现

5.4.4 专利技术发明点预测功能的实现

5.5 系统测试

5.5.1功能测试

5.5.2 性能测试

5.6 本章小结

6 总结与展望

6.1 总结

6.2 展望

参考文献

/表目录

攻读硕士学位期间取得的学术成果

致谢



1 绪论

1.1 研究背景及意义

国际背景及意义:发明专利作为知识产权的核心组成部分,在国际经济竞争中发挥着不可替代的作用。专利战略已经成为企业经营战略与防御国外企业专利战攻击的核心增强自主知识产权成为重要的国家战略措施。然而,我国绝大部分企业在知识产权保护方面重视程度较低,大多数原创技术得不到保护。在企业专利战上,经常被国外企业攻击,长期处于被动挨打的局面(付启明, 2010姜军, 2015。例如芯片等高端技术一直处于国外垄断的地步,在20204月份的国外新冠肺炎疫情爆发期间,美国通过对中国企业进行限制,尤其表现在对华为的“断芯”升级。因而如何应对国外技术垄断是我国面临的一大难题。

国内背景及意义:国家知识产权局2021127日公布的《知识产权统计简报》国家知识产权局战略规划司, 2021公布了以下数据:20201-11月,我国发明专利申请140.4万件,2020年一整年,我国授权的发明专利数量为53万件。从中我们可以看到相对于庞大的发明专利申请量,授权比例仅仅只有三成。中国是“专利大国”而不是“专利强国”的现状阻碍国民经济登上新的台阶耿宁悦, 2019刘垠, 2019近年来,国家在技术创新尤其是高端技术创新上不断加大投入,带来的是专利数量的飞速增长,而不是专利质量的提高。以高校为代表的的单位不断鼓励科研技术人员申请专利,以提高其影响力。但这也滋生了许多的无效专利,白白浪费了国家的巨大投入。由于我国对知识产权保护的鼓励,极大地减少了专利申请的成本。导致了我国高校的专利申请量占总申请量的比重远远大于美国的这一比重,而企业的申请量比重则远远低于美国。这带来了我国专利成果转化效率极低的痛点。有文章还指出,我国的科技成果转化率仅仅只有10%。这也意味着我国投入的绝大部分资金换来的成果都打了水漂。因此提高我国发明专利尤其是高价值专利的质量是一项艰巨而又必须完成的任务。

虽然我国在人工智能的技术应用已经有相当多的研究,计算机视觉、自然语言处理等领域然而在知识产权领域尤其是发明专利领域(高新技术领域)则甚少,这也是与我国的投资力度和国民素质相关的。本项目期望能通过研究,提高国民参与度,尤其是在发明专利的申请和授权上。人工智能等新兴技术在相关行业和人民社会生活中深度融合应用,将其推广到知识产权相关服务中去,例如发明专利生命期的申请自动化、智能辅助答复,可能是一项极具意义的工作。

海南省背景及意义:2015年开始,海南省党委和政府部门对于深化体制改革做了全新的规划。在培育现代产业体系方面,立足于现代服务业和金融业创新。在互联网产业上,取得了突出的成果,其中基于创新技术的相关营收已经实现了超过两位数的增长。以发明专利为代表的新技术载体成为孵化高新技术产业的活力源泉,成为经济新增长点的必备要素。在科技创新基础方面,立足于科研人员的原始创新能力。自2017年以来,海南围绕海洋科技和农业科技发展、科技服务精准脱贫和民生改善,深入实施专利倍增计划,建设知识产权强省。同时海南也已加大知识产权保护力度,海南省各级有关部门积极组织知识产权培训,通过与各专利代理机构进行合作,委派专利审查员、专利代理人进校园、下基层,宣传知识产权,加深学生、教师、科研技术人员等广大社会人士的知识产权意识。在打击知识产权侵权方面,海南省知识产权局与国家知识产权局开展一系列合作,通过制定知识产权侵权惩戒办法,提高侵权人赔偿上限,保护知识产权产业。引入知识产权侵权和假冒举报奖励制度,提升公众参与知识产权保护积极性。

在当前海南创建自贸港的大背景下,海南针对创新引领发展大力推“专利倍增计划”,已经取得显著成效2019年上半年全省专利申请总量和授权量分别41652071,同比增长分别超过55%25%,每万人发明专利拥有量3.1件,达到历史新高。面对巨大的经济和社会对创新的快速增长的迫切需求,传统的发明专利申请、审核、答复、授权等环节的从人才到管理的持续快速质量改进和效率提升都面对更加艰巨的挑战。

本文研究思路:随着人工智能技术的飞速发展,尤其是自阿尔法围棋击败人类冠军李世石以来,人工智能威胁论越来越成为广大社会人士所讨论的焦点。但是从技术角度上看,人工智能想要取代人类甚至是威胁人类的时刻还远远没有到来。正如美国军方所认为,人工智能虽然还达不到取代人类的地步,但是却可以辅助人类。例如在感知和认知层面上,人工智能首先对海量数据进行收集和计算,然后由人来进行最后一步的决策,最终实现人机协作。

本文借鉴他们的思路从多模态融合的语义处理出发,将混合形态的语义表达载体映射到数据、信息、知识和智慧模型(DIKW模型),并给出了DIKW架构的元模型及可执行形式化定义。基于DIKW形式化模型将知识图谱扩展为数据图谱、信息图谱和知识图谱。将自然语言混合形态的表达映射到类型化元素及类型化元素表达的子图,依据此映射方法给出了处理分布式资源效率提升的改进手段,并依此理论架构设计与实现一种基于DIKW的发明专利智能申请与答复系统,从信息技术角度,借助所在课题组丰富的发明专利申请和答复的数据和经验积累,研究依托DIKW架构的发明专利全生命期的智能申请与答复系统,为海南加快培育现代产业体系,实现跨域式发展提供信息化保障。

1.2 国内外研究现状

1.2.1 结合人工智能的发明创造活动视域分析

发明专利作为科技创新和产业升级的产物,必然会随着技术的发展而发展。以发明专利为核心的知识产权已然受到人工智能技术的高速发展的冲击。在这种背景下,以创新为原始驱动力的产业随着人工智能的发展需要不断升级,以满足人们的需求(孔祥俊, 2019

根据智能程度,人工智能可以分为增强智能与替代智能。其中,增强智能指的是研究人员利用人工智能强大的数据分析整理能力,辅助人类进行一系列创造活动,实现人机协作。而替代智能则是人工智能自行参与社会性活动和发明创造中去,不需要人类的任何参与和辅助。替代人工智能具有人的思维能力和人的推理判断能力,是强人工智能时代的特点之一。然而以目前的技术发展水平来看,人工智能还远未达到替代智能的程度。因此在这个弱人工智能时代,我们应该将增强智能作为主要视域,让人工智能在数据分析方面辅助人类进行发明创造活动。以实现有效缩短分析时长,促进分析成果转化和分析结论共享的效果(李想, 2020

1.2.2 智能化发明专利管理与检索

在发明专利的管理以及检索方面,人工智能也同样发挥着重要作用。TrappeyTrappey et al., 2006等人提出了一种基于ANN技术的发明专利申请文档分类和检索系统该系统能帮助公司更有效地管理专利文档。在与创新管理重叠的领域,Trappey等人Trappey et al., 2012帮助公司评估知识产权以及用于创新产品开发和发现最新技术趋势的专利文件的质量。通过反向传播神经网络并结合专利交易信息,可以根据专利质量对专利进行分类,准确度为85%。此外,TrappeyTrappey et al., 2013提出了一种专利知识管理方法,该方法使用基于本体的人工神经网络算法自动对发明专利文档进行分类和搜索,从而刺激新产品开发创新以实现有效的协作管理Chiang et al., 2011。为了了解当前的技术变化以更好地预测技术变化的基础,TrappeyTrappey et al., 2017开发一种发明专利分析方法,以探索生物增材制造领域的专利组合和专利发展,以用于决策支持和战略规划。在Nutter et al., 2002中,作者设计了一种发明专利评估方法和系统,该系统通过分析专利的可观察性、可缩放性、现有技术的可能性、未来的商业用途、调查困难、索赔强度、替代品的可用性和目前的商业用途,综合考虑专利的价值以分配许可度等级,从而允许公司以具有成本效益的方式确定获得大量专利或其他知识产权的许可的可能性的系统和方法。Wu等人Wu et al., 2016的工作表明了对专利质量的关注。他开发了一种自动专利质量分析和鉴定系统,该系统基于自组织图,内核主成分分析和支持向量机的组合。为了更好地将先验知识纳入渐进式创新中,LuLu et al., 2009等人使用混合最小-最大模块化(M3)和支持向量机分类器来提高日本专利的学习性能。此外,Hido等(Hido et al., 2012)通过结合机器学习和文本挖掘方法来评估专利申请的质量,该方法可计算可专利性得分。可专利性评分给出专利申请被专利局批准的可能性。Lee人(Lee et al., 2016使用多个专利指标来检查技术在其生命周期中的进展。作者采用了隐马尔可夫模型来估计技术处于生命周期的某个阶段的可能性并确定模式。KimLeeKim et al., 2017基于专利引用分析,依赖结构矩阵和神经网络分析,提出了一种多技术融合的预测方法该方法可以规划未来技术组合的技术开发。预测专利申请的数量也是了解技术领域发展的重要因素。ZhangZhang et al., 2009提出一种支持向量机的方法,以克服主要存在于专利中的稀疏性问题。JunJun., 2016基于支持向量聚类和Silhouette度量,使用降维和K-means聚类构建了一种组合聚类方法,通过专利分析实现技术预测。此外,Tenorio-GonzálezMoralesTenorio-González et al., 2018描述了一个名为概念自动发现的系统,该系统将归纳逻辑编程技术与谓词发明相结合,并将强化学习与内在动机相结合,以发现新概念。

此外,VrochidisVrochidis et al., 2012提出了一种在专利检索任务期间自动提取描述专利图像内容的概念信息以支持搜索者的方法。同样,RiedlRiedl et al., 2016提出了许多用于专利数字图形识别的算法。AristodemouAristodemou et al., 2018Aristodemou et al., 2017为有关发明专利分析方法(例如人工智能方法,机器学习)使用的持续讨论做出了贡献和深度学习方法,以分析发明专利数据。NLP设计计算机和人类(自然)语言之间的相互作用,特别是对大型自然语言语料库的处理。它使用计算语言机制来表示在任何文档中找到的文本。NLP已用于带有书目耦合和文本挖掘的混合结构中,以在专利检索和分析平台中发现模式Liu et al., 2011YoonLimYoon et al., 2013通过分析主观行动客体结构,搭建专利知识图谱该图谱可以有效的预测专利竞争方向Park等人Park et al., 2013a)也利用主观行动客体结构,从专利文献中提取基于主观行动客体的智能专利分析,并对专利技术文档中的语言相似性进行可视化展示(Park et al., 2013bChoi等人Choi et al., 2012利用NLP开发技术,提取SAO结构,进行专利相似性检测。Park等人Park et al., 2013a通过使用SAO结构来表示技术组件之间存在的关系,计算语义相似性来检测侵权。此外,GerkenMoehrleGerken et al., 2012利用NLP通过句法分析来构建语义SAO结构,以识别专利中的新颖性。一些学者利用属性分析法,即利用语法分析从专利文献中提取属性和功能,建立专利网络Dewulf et al., 2013Yoon et al., 2012LeeLee et al., 2013提出使用语义分析和依赖关系来检测侵权。WangCheungWang et al., 2011从专利文献中提取关键概念,以发现和使用从USTPO数据库收集的专利文献摘要,并通过Naives-Bayes算法对专利文献进行分类。而且,针对多个领域的本体开发可以用作集成平台,以通过填充本体类来开发知识库Taduri et al., 2011 TaduriTaduri et al., 2012对此进行了扩展,以提出一个基于知识的框架来促进专利文献的检索。

1.2.3 结合人工智能的发明专利申请与答复

人工智能采用的陡峭上升正在创造与2000左右的通信和互联网繁荣并行的专利文件。基于专利洞察力,在Cowan et al., 2018中,作者建议创建一个IP战略框架,为AI采纳者和市场领导者考虑。这对于学术界和企业界来说是至关重要的,他们希望在这个日益增长的全球市场中发展和领先,以及政府资助计划,以支持国家研究计划。

在发明专利体系中,专利法等相关专利法规在广泛传播发明和思想给社会带来的好处与通过在有限时间内为发明人提供专有权而进行创新的动机之间取得了平衡Cubert et al., 2018。在专利法中,专利的创造性、新颖性和实用性是最具有代表性的。而创造性的判断则是人工智能参与专利申请时讨论最多的。其次,在自然语言处理领域,人工智能依据其强大的数据整理、分析能力已经具备了单独创作的可能,这意味着传统的著作权法将会受到猛烈地冲击(寇枫阳, 2019其次,人工智能技术参与发明创造不仅会造成依靠自学习算法的专利技术的大量出现,而且也会使拥有新兴人工智能技术的企业申请大量技术方案,通过破坏新颖性的方式形成行业垄断李想, 2020最后,龙文懋和季善豪龙文懋等, 2019“创造性”的本质和特征包括四个方面:一是人脑是创造的基础,二是创造是有意图的活动,三是只有依靠人的逻辑思维和直觉思维共同参与工作才是创造的本质,四是创造的特征在于打破常规。而人工智能的创造性则不具备其本质和特征,人工智能的创造性一般局限于四个方面:一是“深度神经网络”赋予AI自主学习能力,二是AI仅能实现逻辑思维能力,三是AI“创造意图”来源于人类。

发明专利是具有创造性的,那么运用人工智能辅助其申请和答复是否会影响其创造性呢?

随着人工智能技术的高速发展,人工智能已经可以非常有效的辅助科研人员进行发明创造。人工智能依靠其自身强大的算力能够对海量的数据进行分析整理,发现新的技术方案、物质成分、改进措施、合成方法等(吴坤, 2020),这些人机协作所产生的发明创造可以大幅提高专利的新颖性。早在2016年,美国科学家就在晶体合成领域使用人工智能完成多达四千次的试验训练,最终依靠深度学习技术成功的发现了新的有机模板化产品的生产制置方法。从上面的例子来看,人工智能技术在自学习领域已经完全具备了实际操作的能力,完全能够对数据进行收集整理并自主的发现新的改进方案。从某种角度上来说,人工智能正在成为,甚至已经成为了发明创造的“创造者”(吴坤, 20202010年以来,美国专利商标局就已经开始考虑将人工智能发现的发明创造授予专利权,并且还应该对其实用性进行考量,不能因为没有人的参与而将其排除在外。同时对因人工智能参与的发明创造也由原来的驳回决定,通过考虑发明创造的技术方案本身,重新授予专利权。例如“一种收集有用信息的方法”就由原驳回决定改为重新授予专利权。在深度学习、自然语言处理、知识图谱等领域,人工智能充分发挥自身优势,通过分析、预测数以亿计的数据可以发现新的技术方案,推动技术发展,为人类谋福祉。因此,专利审查也应该同美国专利商标局所希望的那样,应当首先关注专利法规定的“三性”要求,即使这个专利不是自然人所发现的,也应当授予专利权(吴坤, 2020

1.3 本文主要研究内容、关键技术及目标

1.3.1 研究内容

在我国的专利战略实施策略以及海南创建自贸港的背景下。本文针对传统专利申请、审核、答复、授权等环节的效率低下以及高校专利质量普遍较低的问题,研究一种基于DIKW的发明专利智能申请与答复系统。旨在优化发明专利管理过程以及提高我国发明专利尤其是高价值发明专利的质量。论文的主要研究内容如下:

一是,依托DIKW图谱构建申请人或代理人和审查员两方的用户画像,依据各个用户画像搭建内容数据库,根据用户内容数据库设计多方交流的可定义隐私模糊度的多维度体系化交互机制

二是,基于DIKW图谱架构的交互机制设计与实现发明专利智能申请与答复系统,依托和结合开发生命期软件工程全过程建模管理,面向发明专利办理全过程,针对生命期内的发明专利,结合专利法等相关法律法规,对申请人或代理人撰写的技术文档进行修改,使其符合相应的规则,并利用竞争及合作的智能填充机制实现专利的自动化申请;

三是,在答复过程中,从DIKW概念架构角度进行相关内容资源建模与转换映射。依据多方交流的交互机制从数据、信息、知识和智慧的角度对内容进行重构,以达到不同领域人员相互理解的目的。根据答复意见并结合用户画像内容数据库,提供具有针对性的修改意见及方案,实现发明专利的智能辅助答复

四是,在专利检索过程中,重构内容能够满足更加精确的信息搜索需求,提出的正负双向索引算法使搜索结果的形式除了匹配查询关键字的链接,还能够基于专利技术内容的实体关系搜索答案

五是,结合TRIZ理论中的冲突矩阵工具,通过DIKW图谱对技术方案进行分析,依据40项发明创造原理,得出可供申请专利或有应用前景的技术发明点,并以数据图谱可视化的形式展示;

六是,面向分布式处理效率,进行价值导向的修正重构等处理设计。在双方相互答复的交互过程中考虑系统的负载均衡,实现资源处理效率的最优。通过设计数据、信息和知识的存储、处理、转换等环节。实现对发明专利的实时分析和评估,从而对申请人或代理人的意图进行实时理解。

1.3.2 研究的挑战与问题

本论文基于DIKW图谱架构,结合知识表示学习、自然语言处理、多模态语义搜索、TRIZ理论等技术,开展对发明专利智能申请与答复的研究。本论文所研究的挑战与问题如下:

一是,研究DIKW元模型体系,以支撑发明专利智能申请与答复技术落实;

二是,依据DIKW元模型体系,研究关系定义语义一切的形式化方法,并分别描述数据、信息和知识资源;

三是,依据形式化描述解决基于DIKW专利技术内容处理原型系统中的技术方案和技术路线;

四是,在知识产权的检索中,分析各类人群对异构知识的理解差异,并构建用户DIKW画像,存于DIKW图谱中;

五是,针对申请人和审查人之间对专利技术内容的理解差异,依据用户DIKW画像,在不更改申请人原有意图以及更改内容符合相关法规的前提下对相关专利技术文档中的内容进行重构;

六是,重构内容能够满足更加精确的信息搜索需求,通过正负双向索引算法使搜索结果的形式除了匹配查询关键字的链接,还能够基于专利技术内容的实体关系搜索答案

七是,DIKW图谱化技术与TRIZ理论有机结合并形成以数据图谱可视化展示的专利技术方案预测;

八是,在存储受限、计算受限情形下充分利用并行计算分布式计算,提高专利内容资源的存储、计算、转换、传输一体化的时空效率。

1.3.3 研究目标

依托和结合开发生命期软件工程全过程建模管理,面向知识产权办理全过程处理,针对生命期内的发明专利,从内容传输上考量发明专利的申请和答复,考虑因人员性格差异、领域知识等各个因素导致的内容理解差异,从数据、信息和知识三个层面上对内容进行建模。论文通过研究数据、信息和知识的存储、处理、转换等环节。实现对发明专利的实时分析和评估,从而对申请人的意图进行实时理解。针对不确定的情形下专利内容资源建模需求,依托数据图谱、信息图谱和知识图谱中存储的相关内容进行研究。具体的有如下子目标:

一是,对各种文献的检索,分析各类人群对各类知识的理解差异,并存于DIKW图谱中。研究从DIKW概念框架角度进行相关内容资源建模与转换映射。通过引入DIKW图谱架构,对内容资源进行存储、处理、传输建模和分析;

二是,针对申请人和审查人之间对专利技术内容的理解差异构建用户DIKW画像,并对内容资源进行重构,达到提高双方沟通效率的目的;

三是,对发明专利技术文档进行修改时,采用有利原则,依据不同的规则,结合目的驱动和价值驱动进行竞争性填充;

四是,结合TRIZ理论中的冲突矩阵工具,通过DIKW图谱对技术方案进行分析,依据40项发明创造原理,得出可供申请专利或有应用前景的技术发明点,并以数据图谱可视化的形式展示

五是,研究在边缘计算环境下,通过充分利用分布式计算和并行计算的专利内容优化处理机制,对存储受限、计算受限、带宽昂贵等问题下的资源进行存储、处理、计算、传输一体化的时空效率优化。

1.4 论文组织结构

本论文的组织结构如下:

第一章是绪论,主要介绍了本的国际、国内和省内的背景意义,并分析了发明专利检索、申请、答复、授权和管理等方面的研究现状,梳理了本文的主要研究内容、挑战与问题以及研究目标;

第二章是主要介绍本论文涉及到的相关技术的基础知识,并对其进行整理及归纳,包括DIKW层次结构、知识图谱及DIKW图谱架构、知识表示学习、多模态语义处理和TRIZ基本理论;

第三章是基于DIKW的发明专利自动申请系统的设计,其中详细介绍了发明专利申请流程、发明专利申请文件数据图谱构建、发明专利自动申请规则等三个部分的内容。

第四章是基于DIKW发明专利智能辅助答复与审查系统的设计,其中详细介绍了发明专利内容语义建模、发明专利内容传输及优化、发明专利内容索引等三个部分的内容。

第五章是基于DIKW的发明专利智能申请与答复系统的实现与测试,主要进行了系统的需求分析、概要设计、详细设计和系统测试,其中详细设计部分着重介绍了专利文件提交及下载功能、内容语义重构功能、专利检索功能和专利技术发明点预测功能的实现

第六章总结与展望,首先对本文的内容和本文所做的贡献进行了总结,之后,对下一步的工作进行了展望。

1.5 本章小结

本章首先介绍了基于DIKW的发明专利智能申请与答复系统设计与实现的国际、国内和省内的研究背景和研究意义,其次阐述了人工智能下发明专利申请、答复、授权、管理与检索的研究现状,并总结分析了国内外研究人员对发明专利内容研究的特点和不足,最后本章对本文的研究内容、挑战与问题、研究目标等做了进一步介绍。


2 相关技术研究综述

2.1 DIKW概念综述

2.1.1 DIKW hierarchy

本文从数据、信息、知识和智慧等发明专利内容资源的角度出发,通过构建用户DIKW画像和内容数据库,设计与实现一种新形势下的发明专利智能申请与答复系统。那么本系统的理论基石-DIKW hierarchy又是什么呢?

DIKW hierarchy是关于数据、信息、知识和智慧的体系,它解释了四种元素之间的关系。其也在信息科学和知识管理领域中一直被讨论。DIKW层次结构如图1所示。它是最基本的,最广泛认可的和最理所当然的模型之一。

1 DIKW层次结构

Fig. 1 DIKW hierarchy

DIKW层次结构在知识管理Ackoff et al., 1989Zeleny et al., 1987和信息科学Cleveland et al., 1982领域有着悠久的历史,甚至于在设计领域Cooley., 1987、艺术领域Eliot., 1934)都有所涉及。值得一提的是许多作者都认为DIKW起源于1934Eliot Eliot., 1934的诗《岩石》。

此结构成了用于分析许多类型的应用程序中的知识的基本框架。自80年代以来,已经提出了DIKW层次结构的许多扩展和完善,并且对该层次结构的元素和结构进行了持续的讨论,包括DIKW基本的四个组件以及一些其他研究者额外添加的组件,如理解Ackoff et al., 1989,存在Faucher et al., 2008,启蒙Faucher et al., 2008,情报Liew., 2013Jennex., 2009等。除了金字塔和层次结构外,DIKW还被以链Zeleny., 2005Lievesley., 2006,框架Silberman., 2007,图Duan et al., 2017a,连续体Choo et al., 2013等形式所展现。DIKW是有助于理解分析以及概念作品的重要性和局限性的层次结构,是信息科学和知识管理的中心模型之一,基于DIKW的应用也涉及各个方面,例如分布式信息检索Dussin et al., 2008aDussin et al., 2008b)、上下文感知Oyama et al., 2008)、Web服务Schumaker., 2011)、风险管控Aven., 2013)、智慧服务Chen et al., 2016Lobov., 2018Ardolino et al., 2018)、认知工程Mishra., 2018),甚至是采矿行业Pretorius et al., 2019)、神学教育Robertson., 2009等。那么,在发明专利智能申请答复中,数据、信息、知识、智慧又分别是什么呢?

2.1.2 数据及其元模型

数据是DIKW层次结构的最低层级,它是最基础的也是最重要的,而且数据还是通向智慧的源头。数据有着元数据和数据元之分。元数据在元模型中被定义为关于数据的数据。元数据对于用户而言,提供发现数据、访问数据、转换数据等作用(吴轩, 2018例如Duan等人Duan et al., 2017a所定义的图的元数据由数据图谱中的概念组成。数据元则是描述属性的数据单元。在知识图谱中数据元与实体关系模型有着紧密联系段玉聪, 2018c。在计算机系统中数据是编码的不变性Zins., 2007BucklandBuckland., 1991指出数据是通过观察获得的数字或其他信息的基本单个项,但就其本身而言,没有上下文,他们就没有信息。文献Zins., 2007也指出数据是由科学家和其他人收集的关于世界的原始观测数据,只有最低限度的上下文解释。WangWang., 2015定义了数据是现实世界中所有可描述或不可描述对象的抽象表示本文结合本体论和概念模型,从事物本身的存在特性出发,建议将数据定义为世界可观察属性的象征性表示。我们认为数据作为世界中存在事物的基本单元,能够通过观察数字或者其他信息获得,作为数据本身,仅有存在与否,没有其他任何意义。数据有着多种表达形式,例如数组、队列等Duan et al., 2017a)。数据在5W+H中能够回答Who/When/Where指导下的问题Shao et al., 2017b数据元模型如图2所示。

2 据元模型

Fig. 2 Meta model of data

2.1.3 信息及其元模型

信息有着多态和多义的特点。例如当信息作为一种解释时,它可以与很多种不同的解释关联起来,所采用的的抽象级别不同则解释也不相同Floridi., 2008。在信息元模型中,元信息被定义为关于信息的信息可以被用来实现有条件的请求。Shannon的工作Shannon., 1948导致许多人从物理学的角度来对信息进行定义。但是,这种方法并没有深入人心,因为人们普遍喜欢思考信息的社会和心理意义Bates., 2005信息表依赖于数据的存在而标记的关联的多于一个的数据段玉聪, 2018c。信息与意义或人类意图有关,在计算系统中信息是数据库网络等的内容Zins., 2007BucklandBuckland., 1991指出信息是指通过数据和组合数据的上下文传达的信息,并可能适合进行分析和解释。文献Zins., 2007也指出信息是数据的集合,用来对世界进行连贯的观察。WangWang., 2015定义了信息是人类大脑感知到的抽象物体的一般形式,由符号、数学、通信、计算和认知系统表示。本文从本体论的角度解释信息,基于实体关系模型,信息被定义为有着上下文含义的数据。信息在5W+H中能够回答What指导下的问题Shao et al., 2017b信息元模型如图3所示。

3 信息元模型

Fig. 3 Meta model of information

2.1.4 知识及其元模型

知识在日常生活中经常被人们所使用。关于知识的定义的讨论一直都是哲学家和社会科学家所感兴趣的话题。为了了解知识,哲学产生了一个重要的分支-知识论。在知识元模型中,知识有着知识元和元知识的区分。元知识是关于描述和使用一般知识的知识,而知识元是指不可再分割的具备完备知识表达的知识单位。从本体论的角度看,元知识是可被清晰表述和有效转移的最小可控单位,即显性知识的最小可控单位。知识的重要性使得研究者们从各个方面获取知识,例如数据挖掘、文本挖掘和Web挖掘Jifa., 2013HeyHey., 2004认为知识是与信息或数据完全不同的“实体”,是由知识者现有的观念和经验“塑造”的,它不同于数据和信息一样可以在现实世界中直接观察得到Duan et al., 2017a根据GambleGamble et al., 2001的描述,知识是关于经验,价值,背景信息,专家见解和扎实直觉的处理信息,这些知识可以导致出新的信息和做法。知识还分为显性知识和隐性知识Cleveland., 1982Cooley., 1987Eliot., 1934。能够被记录下来的知识被称为显性知识Yusof et al., 2018,有着能捕获、获取、创建和转让等特点Polanyi., 1962而不能被记录的经验教训,经验和培训技能的知识称为隐性知识Yusof et al., 2018,有着难以编码和交流的特点Polanyi., 1962。区分显性知识和隐性知识在评估知识管理的范围至关重要Broadbent., 1998。进一步的,Duan等人Duan et al., 2019根据显式和隐式划分提出了对目标资源隐私保护的解决方案。本文从认知论的角度出发,将知识定义为抽象信息和转换信息的有效结合。将信息进行认知处理和验证得到的结构化和组织化的信息就是知识。不管是显式知识还是隐式知识都可以通过学习获得,仅仅是难易程度的区别。当我们传递知识时,首先需要将知识编码为信息,以事物存在的形式、内容等传递给对方,然后在将信息解码为知识Duan et al., 2017a。知识在5W+H中能够回答How指导下的问题Shao et al., 2017b知识元模型如图4所示。

4 知识元模型

Fig. 4 Meta model of knowledge

2.1.5 智慧及其元模型

智慧是最高的抽象层次,是我们辨别对与错,善与恶的过程Duan et al., 2017aYusof et al., 2018Cooper., 2014,它具有远见卓识和超越视野的能力Baskarada et al., 2013Awad et al., 2004。尽管在过去的几个世纪中人们对智慧概念进行了深入的哲学研究,并且尽管智慧在当代商业世界中有着重要作用,但很少对智慧进行实证研究。众所周知的是虽然DIKW模型包含了智慧这一层级,但是大多数学者在对DIKW的讨论中很少提及智慧。智慧的定义比知识的定义更加抽象,即使他们都是从主观逻辑上进行定义的。例如当知识被定义为人们的经验是,智慧则被定义为人们能根据经验而做出决定的能力。尽管DIKW金字塔在数据,信息,知识和智慧之间提供了层次结构的关系,但是很少有关于如何将数据、信息和知识实际上转换为智慧的讨论Intezari et al., 2016。例如WogninWognin et al., 2012认为DIKW层次结构无法解释知识转化为智慧的过程。甚至于,有学者认为,智慧不能被存储,也不能从一个人转移到另一个,它不应存在于DIKW模型中Hoppe et al., 2011,缺少智慧这一层时也不会影响知识服务于人类Jifa et al., 2014。然而,随着许多智慧城市的出现,关于智慧的讨论以及如何生成并使用智慧势在必行。JashaparaJashapara., 2004指出智慧是在任何给定情况下都能够采取批判性或实际行动的能力。JessupValacichJessup et al., 2003)认为智慧是知识的集合,通过积累实现从量变到质变的转化最终形成经验和能力。能帮助我们如何将概念从一个领域应用于另一个领域。在DIKW模型中,通过知识和道德判断抽象出原理和价值能够促使知识向智慧的转化Zhang., 2016WogninWognin et al., 2012提出在知识层和智慧层之间添加复杂的思维过程以促进知识向智慧的转换。本文采用叔本华的直觉Schopenhauer., 2012,取智慧作为推理和意志之间的平衡,以优化人类的长期目标智慧在5W+H中能够回答Why指导下的问题Shao et al., 2017b智慧元模型如图5所示。

5 智慧元模型

Fig. 5 Meta model of wisdom

2.2 DIKW元模型及其图谱架构

本文将混合形态的语义表达载体映射到DIKW模型,并给出了DIKW架构的元模型及可执行形式化定义,如图6所示。基于DIKW形式化模型将知识图谱扩展为数据图谱、信息图谱和知识图谱。那么知识图谱与DIKW图谱架构的概念定义是什么,它们又有着怎么样的关系呢?

6 DIKW元模型

Fig. 6 Meta model of DIKW

知识图谱是指将存在事物以节点的形式进行表达,然后把存在相互关系的存在事物以线的形式链接起来,而形成的图形。由于知识图谱对于知识服务的重要支撑作用,知识图谱被作为新一代人工智能的基础设施。从语义网的角度知识图谱是数据知识化的过程。从人工智能的角度,知识图谱的发展历程是知识数据化的过程。2017年,ShaoShao et al., 2017c首次从数据、信息、知识的角度描述了知识图谱架构,并从数据图谱(Data Graph)、信息图谱(Information Graph)、知识图谱(Knowledge Graph)、智慧图谱(Wisdom Graph)等四个基本形式细分了知识图谱。细分后形成了知识图谱的四层架构(DIKW架构)Duan et al., 2017a)。DIKW图谱的每一层分别对应数据(Data)-信息(Information)-知识(Knowledge)-智慧(Wisdom)的知识金字塔(DIKW)结构的每一层Rowley., 2007。并且规定了数据、信息、知识等类型化资源之间以及数据图谱、信息图谱、知识图谱等图谱资源之间的类型转换Duan et al., 2017b。知识图谱提供了网络化的知识组织方案。然而,递进式的数据、信息、知识等三个层次的结构需要更加细化的知识图谱架构方法来更好的解决。一套用于解决对数据、信息、知识的组织问题的更加细化的知识图谱架构方案迫在眉睫。7为知识图谱扩展为DIKW图谱的架构。

7 DIKW图谱架构

Fig. 7 DIKW graph architecture

在第29SEKE国际会议上,ShaoShao et al., 2017b通过构建数据图谱、信息图谱、知识图谱和智慧图谱的三层图谱架构,然后通过这个架构回答(Who)/何时(When),什么(What),如何(How),为什么(Why)主导的问题。随后,Shao等又将细分的知识图谱基本形式应用到资源安全领域,提出了一种基于DIKW图谱的资源安全保护方法Shao et al., 2017a

数据图谱Data Graph是各种数据结构如栈、队列等。其可以记录对象的频度属性,如时间频度、空间频度和结构频度等,然后通过计算它们的综合频度以服务信息图谱和知识图谱的信息清洗和语义计算Song et al., 2018

信息图谱Information Graph用于存储专利内容资源间的各种交互关系,如产品组件之间的组合、产品设计的步骤等并通过有向图的形式可视化展示Song et al., 2018

知识图谱Knowledge Graph是用于记录规则的有向图,能够被用来进行各种语义计算Song et al., 2018

2.3 知识表示学习

对于本系统而言,需要将多模态的混合语义进行处理,首先需要将它映射到DIKW模型中,然后以DIKW图谱的形式表示。在表示过程中,需要将自然语言语义转化为计算机可理解的形式,此时需要运用到知识表示学习技术。

而在知识表示学习技术中,结构表示(Bordes et al., 2011(Structured Embedding,SE)可能是最实用的几个方法之一。在实体关系模型中,SE将其转换为一系列的三元组(头部实体,关系,尾部实体)。然后将头部实体和尾部实体映射到一个向量空间中,如果头部实体向量和尾部实体向量之间的距离越小,则说明这个关系存在的概率越大。在2013年,Bordes等人又提出了TransE模型Bordes et al., 2013如图8所示。他在SE模型的基础上,添加了关系映射,能够建立知识库中庞大的语义关系。与SE模型相比,虽然增加了关系映射,但却降低了参数设置,同时该模型在大规模稀疏知识图谱上性能尤其惊人。

8 TransE模型

Fig. 8 TransE model

由于TransE模型具有着简单而又有效的优势,TransE之后,许多科研人员在它的基础上持续前行,并提出了TransHWang et al., 2014TransRLin et al., 2015Trasn DJi et al., 2015TranSparseJi et al., 2016TransGXiao et al., 2016KG2EHe et al., 2015等多种模型,从不同角度尝试解决复杂关系建模问题。

2.4 多模态语义搜索

基于DIKW发明专利智能申请与答复系统还将涉及到语义搜索问题,并且因为申请人和审查人的领域知识、自身性格等因素的差异,将导致混合形态的语义搜索受到极大的挑战。因而对于语义搜索的相关技术有必要在此进行陈述。

虽然早在1980年,国际上就已经对语义搜索进行了讨论,但是限于当时技术发展水平的局限,语义搜索研究一直没有取得突出的成果。近年来,随着人们对自然语言处理的研究愈发成熟,语义处理终于得到了迅速发展。然而对于多模态语义搜索问题,却一直都是搜索引擎中拉低搜索精度的一大痛点,而多模态语义搜索引擎的效率又取决于大量标记数据。Fader等人Fader et al., 2014使用共指分解技术提取的知识库,从未标记的问题语料库和多个知识库中提取了数百万条规则,以寻找问题分析和查询重构的解决方案。Wang等人Wang et al., 2013)将概率计算引入到语义处理问题中,通过注释的方式使不同语言知识库之间关联起来,该方法促进了不同语言之间的知识共享。建立区域合作医疗数据中心以实现医院信息之间的整合。Shao等人Shao et al., 2017d)通过DIKW图谱自动提取和调整资源,该体系结构通过对数据图进行频率集中的概要分析以及对信息图和知识图的抽象优化搜索,从而递归地支持经验知识的集成以及对资源元素的高效自动语义分析段玉聪, 2018aSenSen., 2012将主题模型作为相似度计算的基础,并从维基百科获得了实体目录。大量的基于特征向量的监督学习方法,半监督学习方法Carlson et al., 2010应运而生。Baoko等人Baoko et al., 2007提出了一种用于开放域的信息提取框架,并发布了一个基于自我监督学习的开放信息提取原型系统。借助5WWho,When,Where,WhatHow)问题Chatti et al., 2012的分类,可以很容易地获得用户学习需求描述,5W是在信息收集或解决问题中被认为是基本答案的问题。

2.5 TRIZ理论

TRIZ理论在发明创造领域具有非常突出的特点和强大的理论指导意义。本系统结合TRIZ理论中的冲突矩阵工具,通过DIKW图谱对技术方案进行分析,依据40项发明创造原理,得出可供申请专利或有应用前景的技术发明点,并以数据图谱可视化的形式展示。

TRIZTan et al., 2014理论也叫基于专利知识的系统化方法学(Kim et al., 2000阿奇舒勒在对专利进行分析时,利用不同的方法从多维层面对其进行归纳,并得出了大量的可行性规律,最终进行一套发明问题解决理论。此后,随着TRIZ理论的不断扩充和完善,增加了大量研究人员发现的方法和工具,如图9所示(沈佳锋, 2020

9 TRIZ理论体系结构

Fig. 9 TRIZ theoretical system structure

其中本文主要运用的是TRIZ理论中的矛盾冲突矩阵工具,依据40项发明创造原理和48个通用工程参数(旧版为39个通用工程参数),如表1和表2所示。

1 40项发明创造原理(部分)

Table 1 Principles of 40 inventions and creations (partial)

序号

名称

序号

名称

1

分割原理

21

急速作用原理

2

抽取原理

22

变害为益原理

...

...

...

...

19

周期性动作原理

39

惰性介质原理

20

有效持续性作用原理

40

复合材料原理

2 48个通用工程参数(部分)

Table 2 48 general engineering parameters (partial)

序号

名称

序号

名称

1

运动物体的质量

25

物质的无效损耗

2

静止物体的重量

26

时间的无效损耗

...

...

...

...

23

照度

47

检测的复杂性

24

运行效率

48

测量精度

 

目前,TRIZ理论在国内多应用于专利研究,并取得了一些应用成果。如杨鑫超等(杨鑫超等, 2020提出TRIZ在高价值专利培育中的应用,许崇春许崇春, 2012TRIZ的基础上融合集成了专利技术路线图、专利地图,并将其应用到技术创新的新路径中;王克奇等人王克奇等, 2011TRIZ理论中的冲突矩阵工具,开发了一种专利检索系统,该系统能有效帮助专利检索技术人员获得对专利创新有启发的参考方案。在专利检索方向,李更等人李更等, 2013利用TRIZ理论,来规避专利侵权问题,从而提高科研人员的创新效率。在知识产权预警方向,祁明等人祁明等, 2012从政府视角、企业视角和国际视角三个视角出发提出一个知识产权综合预警框架;江屏、李鹏等人江屏, 2015李鹏等, 2013基于TRIZ理论对产品进行专利规避创新设计。在专利分类方向,TRIZ理论被用于用于协同过滤(胡学钢等, 2018、专利竞争(燕慧泉等, 2018、和专利信息组织(李睿等, 2017。胡正银(胡正银等, 2017、彭茂祥彭茂祥, 2016和鲁麒鲁麒, 2014等人基于大数据技术、数据挖掘技术,结合TRIZ理论在从深层次对专利技术进行挖掘。基于上述研究,本文结合TRIZ理论中的冲突矩阵工具,结合DIKW图谱技术,对发明专利的技术方案进行分析,得出可供申请专利或有应用前景的技术发明点,并以数据图谱的方式可视化展示。

2.6 本章小结

本章是相关技术研究综述,首先介绍了DIKW层次结构的相关概念,同时较为详细了介绍了DIKW层级结构中的数据、信息、知识和智慧定义。然后介绍了知识图谱以及DIKW图谱架构的基本理论。接着本章还介绍了关于知识表示学习的理论知识,其中详细阐述了TransE的技术方法。最后本章介绍了多模态语义搜索和TRIZ基础理论。


3 发明专利自动化申请

3.1 专利申请流程

要实现对专利申请文件的自动化提交,首先要熟悉专利的具体申请流程。如图10所示

10 专利申请及审查流程

Fig. 10 Patent application and examination process

下面对专利审批程序做一简要介绍,并介绍本文将主要服务于哪一个流程。

步骤一:受理阶段

该步骤只要提交相关资料即可。对于本文所设计的系统而言,则还需要明确提交的相关资料类型。在该步骤中,本系统主要服务于申请人,申请人将专利申请文件上传至本系统,通过竞争及合作的意图驱动的智能填表算法对专利申请文档进行填充(详见本章第三节),完成自动化申请的过程

步骤二:初步审查阶段

当专利提交至系统后,国家专利局将会下发缴费通知书。申请人需要按照相关程序进行缴纳,然后专利将进入初审阶段。在初审期间,申请人若需要对专利申请文档进行修改,也可以主动提交补正,完善专利。

对于申请人而言,初审阶段能够帮助申请人学习如何撰写一个正确的专利。

而对于审查员而言,初审阶段需要对专利进行主题审查,审查申请人所撰写的专利是否完整、是否违反了国家法律等。

在这一步骤中,本系统将服务于审查员。通过DIKW图谱架构对申请文件进行判断,识别或预测明显不符合专利书写规范的专利内容,并生成带有标记的申请文件或可供参考的审查通知书。

步骤三:发明专利申请公布阶段

发明专利在初审合格后,将会进入公布阶段。专利局可以根据申请人相关请求对专利进行提前公开。

在该步骤中,国家知识产权局根据初审结果,进行自动审查并生成各个通知书,如发明专利申请公布通知书等。因该步骤没有人的参与,所以本系统在该步骤中不发挥作用。

步骤四:发明专利申请实质审查阶段

发明专利在公开后,如果申请人已经提出了实质审查请求并缴费,则将进入实审阶段。申请人既可以在专利申请刚开始就提出请求,也可以在公开后提出。对于满足条件的专利还可以进行优先审查,加快专利审查进度。

在实质审查过程中,审查员将会和申请人相互沟通,对专利是否符合授权条件进行陈述。

在该步骤中,本系统服务于审查员和申请人两者,系统依据专利法、专利实施细则等专利法规,通过知识表示、语义识别等技术,对申请文件的进行自动审查,并生成带有标记的申请文件或可供参考的审查通知书。

步骤五:授权阶段

非发明专利在初审合格后,将进入授权阶段。而发明专利则是在实质审查合格后进入授权阶段。

在该步骤中,本系统服务于审查员,本系统通过DIKW图谱对授权文本进行复核和备案

以上即为专利申请的主要流程。本系统通过DIKW图谱化等新兴技术,对专利申请文件进行自动提交,减少了因个人操作错误导致的提交不成功次数;对专利申请文件进行机器智能审查,能有效减少申请人和审查员沟通次数,减少审查员对专利进行审查的无效时间,减少专利申请到授权之间的时间损耗,并在一定程度上提高专利的质量。

3.2 构建发明专利申请文档数据图谱

3.2.1 申请书数据图谱构建

在申请一项新的发明专利时,一般都仅需要提交说明书、权利要求书、说明书摘要、说明书附图、发明专利请求书。

如图11所示,为申请书数据图谱

11 申请书数据图谱

Fig. 11 Application data graph

3.2.2 补正书数据图谱构建

在专利申请流程中的初审阶段,申请人可以主动提交补正书对专利进行修改以完善专利。其次,审查员也将会对专利是否存在明显缺陷进行审查,若存在申请人需要针对补正通知书内容进行答复,并提交补正书和修改后的申请书。

补正书内容包括:专利申请信息、补正理由、补正内容和附件清单等。如图12所示,为补正书图数据图谱

12 补正书数据图谱

Fig. 12 Supplementary book data graph

3.2.3 意见陈述书数据图谱构建

在专利申请流程中的实质审查阶段,审查员会对专利文件是否符合授权条件进行审查。在没有达到授权条件时,审查员会下发通知书。申请人可以根据通知书进行意见陈述或对专利文件进行修改,直至该专利授权或被驳回。

意见陈述书内容包括:专利申请信息、陈述事项等。如图13所示,为意见陈述书图数据图谱

13 意见陈述书数据图谱

Fig. 13 Opinion statement data graph

3.2.4 实质审查请求书数据图谱构建

在专利申请流程中,当发明专利公布后,申请人需要办理专利的实质审查手续,使专利进入实质审查阶段。在这一流程中,申请人需提交实质审查请求书。对于一些需要加速审查的专利,如计算机类的专利,还可以申请优先审查,使专利更快的得到审查。

实质审查请求书内容包括:专利申请信息、附件清单、备注等。如图14所示,为实质审查请求书图数据库内容。

14 实质审查请求书数据图谱

Fig. 14 Substantive examination request data graph

3.3 意图驱动的竞争及合作的智能填充算法

在国内外研究中,对于智能填表方面的研究有很多。曹东(曹东, 2012设计开发了面向人事管理的智能填表系统,并实现了利用基于最大熵的隐马尔可夫模型自动填充表格的方法。姜涛等姜涛等, 2012通过规则分析并结合智能化信息获取技术设计了一种基于excel模板的在线填表系统王亚非(王亚非, 2014结合人际交互技术,设计了离线表格建模工具和在线填表提示系统,两者都能有效实现智能填表。此外,WangWang et al., 2017设计了一个用于在不同的web应用程序自动填充web表单的智能框架。王玉秋王玉秋, 2018设计了一个基于VSWebBrowser控件的自动填表程序。虽然在智能填表领域研究众多,但现有设计几乎都是从数据迁移过程出发的,本系统在专利申请自动化中,充分考虑申请人的意图,通过判断表项的重要程度和填充难易程度,减少专利申请文件提交过程的无效时间损耗。

在意图识别领域,唐静笑等唐静笑等, 2014针对用户在使用搜索引擎时的查询意图设计了一种意图识别的方法。该方法能够对无明显意图的行为进行识别。杨春妮等杨春妮等, 2018)结合句法特征和CNN进行结合,提出了一种多意图识别模型。王海旺等王海旺等, 2019提出一种基于直觉模糊集合的新型意图识别方法FirdausFirdaus et al., 2019提出了一个用于意图检测和槽填充的多任务分层方法,该方法使用CNNRNN捕获上下文信息,利用CRF进行建模,最后得出的模型可以联合执行针对不同域的数据集的意图检测和槽填充任务。

本系统参考以上研究与应用,构建基于图数据库的意图模型,然后通过信息抽取技术对表项进行匹配,得到它的重要程度和填充难易程度,15是专利申请书数据图谱可视化效果,圆圈的大小代表该项的重要程度,线段的长短代表该项的填充难易程度。具体步骤如图16所示:

15 专利申请书数据图谱可视化效果图

Fig. 15 Visualization effect diagram of patent application data graph

16 意图驱动的竞争及合作的智能填充流程图

Fig. 16 Flowchart of smart filling of intention-driven competition and cooperation

步骤一:意图提示

申请人将需要填写的表格导入系统,系统内部对表格进行分析,得出该表格可能存在的意图以及系统认为的重要表项,并在当前填表界面给用户以提示。其中当前表格可能存在的意图系统以文本框的形式展示给用户,重要选项的提示则使用填写框标红的形式展示。

意图提示算法流程为:首先系统对表格的类型和内部格式分析并提取存储表格的表项,第二步系统提取表格的基本信息以供第三步做表格的意图分析,在意图分析完成并确认意图之后系统对表格内的表项分成重要项和非重要项两类,最后将重要表项和当前表格的意图在当前填表界面展示给用户。

意图提示算法流程图如图17所示:

17 图提示算法流程图

Fig. 17 Intent prompt algorithm flowchart

步骤二:自动填写

当用户点击自动填写按钮时,系统弹出是否自动填写历史信息,如申请人相关信息、联系人相关信息等。若用户选择是,系统将历史信息入对应填写框,并完成部分可以从其他表项推出内容的冗余项的填写。反之,系统只进行冗余项的自动填写。如图18所示:

在表格填写中,可能会出现一些需要重复填写同一类信息的表项,如:表格中同时需要填写发明人信息、联系人信息,而联系人往往是发明人中的一个。此时填表人填写完发明人信息后,只要将联系人的姓名填写进去,系统即可为用户填写联系人信息中的其他的冗余表项。

算法描述如图19所示:首先遍历表格的表项,查看其是否存在冗余项,若存在则根据规则推出该冗余项的填充内容,并将其更新至存储当前表格的填充内容的字典中,供接下来的表格提交功能来完成表格文件的填写。

 

18 选项填充流程图

Fig. 18 Flowchart of option filling

步骤三:用户填写

系统将表格展示在界面上并提供文本填写框供用户填写。

步骤四:表格提交

用户完成当前表格填写后,点击提交按钮系统将自动检查填写的内容是否符合规则若存在不符合规则的错误填写,系统弹出窗口提示用户存在错误填写。若不存在错误填写,系统检测表格中与用户内容相关的表项是否与现存的内容不同,若存在不同,系统弹出窗口询问用户是否更新内容库内的个人信息,若用户选择“是”,系统则更新数据库中存储的个人资料并完成当前表格文件的填写。反之,系统只进行填写当前表格文件的操作。处理流程如图20所示:

 

19 冗余信息填充算法流程图

Fig. 19 Redundant information filling algorithm flowchart

20 表格提交流程图

Fig. 20 Form submission flow chart

3.4 本章小结

本章主要介绍了基于DIKW的发明专利自动申请系统的设计。第一小节首先介绍了专利申请的详细流程,并给出了本系统主要服务于哪一个流程。在第二小节中,以DIKW图谱的形式描述了发明专利申请文档的关联关系。第三小节为意图驱动的竞争及合作的智能填充算法,以流程图介绍为主,详细的描述了该算法的具体步骤,通过该算法并配合信息抽取技术将专利申请文档内容填充至本系统。


4 发明专利的智能辅助答复与审查

4.1 基于DIKW图谱的多模态语义建模

发明专利的智能辅助答复与审查对于自然语言语义理解有很大的要求,只有将自然语言语义尤其是涉及多模态的内容语义建模,才能使机器理解冗余繁杂的语义。而知识图谱在以可解释的方式处理自然语言表达内容方面有着巨大的潜力。然而现有知识图谱技术对语义关系融合表达的内容方面面临挑战,并在处理知识图谱多模态混合内容的处理效率上还有待提升。本文将混合形态的语义表达载体映射到DIKW模型,并通过DIKW架构的元模型及可执行形式化定义,将自然语言混合形态的表达映射到类型化元素及类型化元素表达的子图,并给出处理分布式资源效率提升的改进手段,此内容详见第二章第二节知识图谱及DIKW图谱架构。

基于DIKW图谱的多模态语义建模,主要用于从效率提升和战略投资实践中获得最大的效益提升和战略投资实践的价值,图21是基于DIKW图谱的多模态语义建模结构图。

21 基于DIKW图谱的多模态语义结构图

Fig. 21 Multi-modal semantic structure diagram based on DIKW graph

DIKW图谱中,离散事物一般记录在数据图谱上,通常表示为时间、空间和结构三个频度。在发明专利申请文件中,数据图谱可以记录各个步骤的操作顺序,产品内各组件的间距、尺寸大小和组合方式等。信息图谱记录每个实体的交互关系,在信息图谱上可以通过计算交互频度推理出新节点,并重新计入数据图谱中。例如当某一产品的n-1个配件的尺寸大小已知时,可以对最后一个配件的尺寸大小进行推理判断,若符合则记录成新的节点;在知识图谱上对类之间的关系运用关系抽取规则进一步抽象,并对技术方案表达的完整性进行补充,提升沟通的效率。图22为对数据图谱、信息图谱和知识图谱的关联关系示意图。图中各符号箭头的含义如表3所示。基于DIKW图谱的多模态语义建模的主要流程如图23所示:

3 符号说明

Table 3 Symbol description

符号

定义

符号

定义

 

类型化隐性数据资源

 

类型化隐性知识资源

 

类型化显性数据资源

 

类型化显示知识资源

 

类型化隐性信息资源

 

类型化资源间的关系

 

类型化显性信息资源

 

资源映射

 

资源间的关系

 

类型化资源转换

 

22 数据图谱、信息图谱和知识图谱的关联关系示意图

Fig. 22 Schematic diagram of the relationship between data graph, information graph, and knowledge graph

23 基于DIKW图谱的多模态语义建模流程图

Fig. 23 Flow chart of multi-modal semantic modeling based on DIKW graph

步骤一:获取申请人对发明专利的权利要求的需求描述,其由一个或多个申请人进行描述,多源的需求存在冗余性和不一致性,如果代理人以研究的方式收集申请人对专利权利要求的需求,则当申请人较多,或权利要求需求较多时,申请人对权利要求需求的描述将会非常混乱;

步骤二:通过信息抽取技术提取申请人对权利要求的需求描述关键字,并将关键字以时间、空间和结构频度的形式记录在数据图谱上。其中时间频度Tem_f为关键字出现的时间刻度,空间频度Spa_f为关键字的坐标刻度,结构频度Str_f为关键字在实体关系模型中的关系数;

步骤三:标记时间频度为1权利要求关键字目标对象,并根据公式(4-1)计算数据的总频度frequency

              frequency()=Str_f()*Tem_f()*Spa_f()            公式(4-1

步骤四:根据公式(4-2)和(4-3)计算权利要求关键字的支持度和置信度并根据所得结果,对数据图谱上的离散数据进行清洗,以删除边缘数据和冗余数据。其中FrequencyDG表示数据图谱上所有节点的频度总和,rirj是指两个不同的节点

                                 公式(4-2

                               公式(4-3

步骤五:对记录在数据图谱上关键字对象进行语义分析,将名词作为实体,动词作为关系,形成信息图谱。

步骤:根据公式(4-4计算信息图谱上节点间交互频度,节点间交互的频度表示节点之间交互的次数,E1E2是指计算过程中任意的两个计算节点,P表示节点之间所有完整的交互路径。

                公式(4-4

步骤:根据公式(4-5计算信息图谱上所有非离散节点的综合频度TotalfrequencyFrequencyIG表示实体在信息图谱上的交互频度,αβ是数据图谱频度和信息图谱频度所占权重。

                    公式(4-5

步骤:根据公式(4-6计算信息图谱中各节点的内聚性。将具有最大的实体内聚性cohesion的不同连通实体以属性和操作的形式集成,在信息图谱上以新节点的形式表达,增强权利要求的内聚性并提高抽象度其中DegreeEI表示外部交互,DegreeII表示内部交互

                                       公式(4-6

步骤根据信息图谱所产生的新节点和新关系,更新数据图谱上记录的频度。

步骤十:根据信息图谱上的语义关系,辅助知识图谱推理新的关系,并根据公式(4-7计算正确度Cr

                             公式(4-7

步骤十对知识图谱进行优化处理,删掉冗余节点和环。

4.2 基于DIKW图谱的内容传输及优化

4.2.1 基于DIKW图谱的交互区域划分及传输优化

专利的准确性和传输速度是衡量图谱优劣的重要标准,为了消除相关人员对专利内容的理解偏差,本文提出的基于DIKW的图谱依托于传统的专利申请方案,引入了一系列的优化对策,例如对专利内容进行归类、整合以增强内容的可参阅性,在保证专业性的基础上增加个性化、交互性强的语义,减少理解误区等。

通过构建DIKW内容库实现传递的专利申请方案内容的重构解决申请人、代理人等技术人员和审查员之间对专利内容理解存在差异的问题,且重构的专利内容在保留了原内容的关键语义的基础上实现个性化的表述同时系统还对传递的专利内容进行整合优化,提高内容传递的准确性和传递效率。图24为内容传输路径方案示意图,图25为不同传输路径下内容重构方案示意图,其中SRD分别表示在申请方、中间方和接收方进行内容重构。

在申请人等技术人员和代理人之间可能存在,某一方的内容库中不存在某一概念,或在双方的内容库中,同一概念可能对应不同的理解。为了实现双方对同一概念理解的一致性,本文通过对传递的概念进行重构,使双方实现差异化理解其中重构可在三方中的任意一方进行。

24 内容传输路径方案示意图

Fig. 24 Schematic diagram of content transmission path scheme

25 不同传输路径下内容重构方案示意图

Fig. 25 Schematic diagram of content reconstruction schemes under different transmission paths

本文所构建的申请人和审查员双方的内容库包括私有库和公有库。其中私有库记录用户隐私信息,公有库为用户所上传的特征。其中公有库的数据来源为私有库中的特征,可以根据用户意愿自行选择上传。

基于DIKW图谱的交互区域划分及传输优化具体流程如图26所示。

26 基于DIKW图谱的交互区域划分及传输优化

Fig. 26 Interaction zone division and transmission optimization based on DIKW graph

步骤一:申请人S发送专利内容,并在边缘设备上进行语义分析,获取专利内容子图和子图关键字。

步骤二:基于申请方、中间方和接收方三方的内容库,对专利内容子图和子图关键字进行分析,确定所属类型块,并依此确定传递方案和重构方案。具体如表4所示:

4 交互区域划分说明表

Table 4 Description of the division of interaction areas

序号

类型块

传递的可能方案

重构说明

筛选

说明

1

CS

S→D

①S重构


传递内容涉及S的内容库的私有部分,必须先由S重构;

②D重构

——

③S重构+D重构


④None重构

——

S→M→D

①S重构


②M重构

——

③D重构

——

④S重构+M重构


⑤S重构+D重构


⑥M重构+D重构

——

⑦S重构+M重构+D重构


⑧None重构

——

2

CSD

S→D

①S重构


传递双方默契度最高;

②D重构


③S重构+D重构


④None重构


S→M→D

①S重构


传递内容涉及SD的内容库的私有部分;

经第三方转述前,必须先由S重构;

②M重构

——

③D重构


④S重构+M重构


⑤S重构+D重构


⑥M重构+D重构

——

⑦S重构+M重构+D重构


⑧None重构


3

CSM

S→D

①S重构


总的重构计算量最大;

②D重构

——

③S重构+D重构


④None重构

——

S→M→D

①S重构


②M重构


③D重构

——

④S重构+M重构


⑤S重构+D重构


⑥M重构+D重构


⑦S重构+M重构+D重构


⑧None重构

——

4

CSMD

S→D

①S重构


内容库有私有部分,但公共部分一致;

传递内容属于公共部分;

②D重构


③S重构+D重构


④None重构


S→M→D

①S重构


②M重构


③D重构


④S重构+M重构


⑤S重构+D重构


⑥M重构+D重构


⑦S重构+M重构+D重构


⑧None重构


5

CB1

S→D

CSMD


内容库没有私有部分;

传递效率最高;

S→M→D

6

CB2

S→D

CS


内容库全部是私有部分;

隐私保护等级最高;

S→M→D

其中,子图所属类型块如图所27示。包括三方内容库完全重合、相互独立以及交叉重合的情形。其中情形B1不需要重构即可完全理解,传输效率最高;情形B2没有重合的公共库,传输效率最低。

27 递内容子图所属类型块的六种情况示意图

Fig. 27 Schematic diagram of the six cases of transferring content sub-pictures to the type block

步骤三:通过存储、转换、计算一体化实现重构方案的筛选。筛选依据存储成本、计算成本、转换成本三个角度进行判断。

步骤四:通过子图迁移的形式实现专利内容重构。

4.2.2 基于DIKW图谱的内容重构

本节就传输内容重构问题提出了解决对策,基于DIKW图谱的内容重构算法流程图如下,发送方接收方发送数据,接收方提取关键信息后将该信息封装成包,并确认是否能被接收方的DIKW图集库校验则直接转发,否则获取接收方DIKW图谱内容库和第三方DIKW图谱内容库等详细信息并采取重建算法,对无法识别的内容进行重构将重建内容转发至接收方如图28所示。

28 基于DIKW图谱的内容重构算法流程图

Fig. 28 Flow chart of a content reconstruction algorithm based on DIKW graph

在重构流程中,最重要的一个部分就是基于接收方DIKW图谱和第三方DIKW图谱来实现对内容的重构,本系统采用基于实体相识度的方法来对内容进行重构,其基本思想是基于Word2Vec模型的,以之前在实体关系抽取中建立的词向量模型来匹配与重构内容最为相近的实体。其算法的基本流程是:

步骤一:根据接收方需要重构的实体,基于第三方DIKW图谱和接收方DIKW图谱,找出第三方DIKW图谱中实体(初始为1)节点集合

步骤二:根据节点集合,在接收方DIKW图谱中匹配节点集合,其中,如果,则,返回步骤一;否则进入步骤三。

步骤三:将步骤二得到的集合中的每个元素与实体传入一个之前训练好的Embedding层,得到两个词向量,计算其余弦相似度。如公式(4-8所示

                                   公式(4-8

步骤四:将计算好的余弦相似度结果输入到sigmoid函数中,转化为概率,选取概率值大于设定阈值的实体,将替换为其路径上关系加上,即为重构内容。

4.2.3 多模态内容语义价值计算

为保证图谱迁移后的一致性,需要对多模态的内容语义进行价值计算。本文仿造区块链技术,提出一种针对节点和节点网络的内容语义价值计算算法,以处理多模态的内容语义。图29为面向冗错的仿区块链节点和节点网络的内容语义价值计算框架图。

29 向冗错的仿区块链节点和节点网络的内容语义价值计算框架图

Fig. 29 A framework diagram of content semantic value calculation for error-oriented imitation blockchain nodes and node networks

本文在DIKW三层图谱架构上分别进行语义价值计算。

1)数据图谱上的语义价值计算

在数据图谱中,不考虑多维度多模态情形下的数据节点的价值计算公式如4-9所示,其中Amount_DY为具象节点(存在事物)的数量,Amount_D所有节点的数量。当结果大于51%时,认为该数据图谱中数据是可信的。

                                     公式(4-9

由于不同任务指标下,数据的统计单位也不同,因此在考虑多维度情形下的价值计算公式如4-10所示,其中V_dim()为单一维度下的价值函数。不同维度下节点的价值分布示意图如图30所示。

          公式(4-10

由于不同数据可能有着不同的分布区间,因此在多模态的维度下,数据节点的价值计算公式如4-11所示,其中θk表示为权重。

                         公式(4-11

30为数据在聚类情况下,不同维度的价值分布示意图。

30 不同维度下节点的价值分布示意图

Fig. 30 Schematic diagram of the value distribution of nodes in different dimensions

2)信息图谱的语义价值计算

在信息图谱上,由于存在节点之间的语义关系,必然会带来重复节点和差错节点和无用节点。因此在信息图谱上对节点的价值进行计算时,数据图谱上的频度计算公式将不再适用。本文将信息图谱上统计的节点分类为正向节点、负向节点和中性节点。其中正向节点表示有正向语义趋势的节点,负向节点表示有逆向语义趋势的节点,中性节点表示既没有正向语义趋势也没有逆向语义趋势的无用节点。在语义价值计算中,需要将中性节点进行删除,避免语义价值信息被掩盖。因此节点语义价值的计算公式(4-12所示,其中Amount_I为所有的节点数量,Amount_IYes为正向节点数量,Amount_IIrr为中性节点数量。

          公式(4-12

与数据图谱语义价值计算的类似,在考虑多维度情形下的价值计算公式如4-13所示。在多模态的维度下,数据节点的价值计算公式如4-14所示。

       公式(4-13

                           公式(4-14

3)知识图谱的语义价值计算

知识图谱记录规则和存在特性,没有原始事物节点。因此本文将知识图谱的节点统计与二维布运算相结合,对节点进行归纳化处理。表5为知识图谱上语义价值计算的实现方法。其中Value_KRi为知识图谱单个节点的价值

5 语义价值计算实现方法

Table 5 Implementation method of semantic value calculation

二维布尔运算

内容的语义价值

并运算

Min{Value_KRa, Value_KRb}

差运算

保持原价值

交运算

Max{Value_KRa, Value_KRb}

例如,假定所有权利要求书最多只有十项权利要求,归纳为知识图谱中的节点,建立权利要求书中的权利要求项最多只有十项的规则;如果有一个统计的节点是十一项的事实,那就直接打破原有的规则,对权利要求书的知识只能保留除最多只有十项之外的部分,即图31中的C1部分。

31 知识图谱层面的语义价值计算与图形学中的二维布尔运算的对照示意图

Fig. 31 The comparison diagram of semantic value calculation at the knowledge graph level and two-dimensional Boolean operations in graphics

4DIKW图谱上的语义价值计算

根据数据图谱上的语义价值计算结果、信息图谱上的语义价值计算结果和知识图谱上的语义价值计算结果对DIKW图谱的语义价值进行综合计算。总的语义价值ValueR_DIK计算公式如4-15所示。

ValueR_DIK = α*ValueR_D + β*ValueR_I *μDI+ γ*ValueR_K*μDKIK    公式(4-15

其中,α,β,γ是均衡系数;μDI 是基于数据图谱的计算对基于信息图谱的计算的影响系数μDKμIK以此类推

本文还给出多个图谱存在相互关联情况下的语义价值计算,即一个节点网络中存在多个中心点、多个关键词的情况。本文将节点网络中的中心节点分类为合作节点和竞争节点,并假设语义价值的计算与中心节点的出入度相关。如图32所示,CP1CP2为竞争节点。

通过计算节点网络的中心节点的出入度,判断中心节点对其他节点的影响因子,并将影响因子作为其他节点的价值。计算公式(4-16所示

                               公式(4-16

节点网络的价值Value_DNR计算公式(4-17所示:

              公式(4-17

其中,m节点网络中的节点总数n正向节点数

32 存在两个中心节点的节点网络示意图

Fig. 32 Schematic diagram of a node network with two central nodes

 

4.3 基于DIKW图谱的专利内容检索

在发明专利申请及答复过程中,对专利进行检索是一项必须要进行的工作。例如当专利申请优先审查时,需要对现有技术进行检索;当专利处于答复过程中,审查员对专利是否具有创造性进行审查时,也需要对现有技术进行检索。因此专利检索在专利申请到授权整个周期内都是及其重要的。本文提出一种正负双向索引算法以得到更加精确的搜索结果,配合专利申请和答复。其中搜索结果的形式除了匹配查询关键字的链接,还能够基于专利技术内容的实体关系搜索答案。

4.3.1 基于DIKW图谱的搜索载体优化

传统的搜索引擎技术根据用户的查询要求快速检索和排序网页资源。但是网络资源是及其庞大的,传统的搜索引擎无法独自完成对海量资源的筛选工作,仍然需要人的参与排查这注定难以满足用户全面掌控资源的需求。

本文提供一种基于DIKW图谱的正负双向搜索策略。在搜索之前,首先计算资源在DIKW图谱各层上的搜索代价,然后通过比较排序,选择代价最低的图谱进行遍历,最终实现搜索载体的优化。本文假定知道用户的搜索目标属于哪种资源类型,表6和表7分别是资源类型的渐进形式和资源分层搜索效率。

6 资源类型的渐进形式

Table 6 Progressive form of resource types


数据(DataDIK)

信息(InformationDIK)

知识(KnowledgeDIK)

语义负载

没有指定利益相关者机器

指定利益相关者机器

对已知信息进行抽象

形式

元素的概念集合

数据的相关映射和相关关系组合

对信息的进一步分类与抽象

用法

统计与传输

交互

推理与预测

子图

数据图谱(DataGraphDIK)

信息图谱

(InformationGraphDIK)

知识图谱

(KnowledgeGraphDIK)

子图表达形式

数组、链表、栈、队列、树、图等

关系数据库

语义网络

7 资源分层搜索效率

Table 7 Resource hierarchical search efficiency


DataGraphDIK

InformationGraphDIK

KnowledgeGraphDIK

DataDIK

O(scale)

O(scale)

|Resource|/SearchCost

InformationDIK

人工抽象

O(scale)

|Resource|/SearchCost

KnowledgeDIK

人工抽象

人工抽象

|Resource|/SearchCost

根据搜索效率确定在三层图谱上搜索的优先顺序,使用户花费最少代价而能获得相对有效和准确的资源。其具体流程如图33所示:

33 搜索载体优化流程图

Fig. 33 Search vector optimization flowchart

步骤一:根据用户搜索的需求确定搜索目标集合,包括资源类型和资源总量(|Initial_res|);

步骤二:根据公式(4-18公式(4-19计算在DIKW图谱各层上的搜索资源代价SearchCost):

公式(4-18

                                 公式(4-19

其中scale表示图谱的规模,即点数和边的个数,ReasoningCost表示知识推理代价,λ表示图谱上存在答案的概率,αβ表示直接搜索代价和推理代价占搜索代价的权重,NcostEcost分别表示推理出新节点和新关系的代价

步骤三:根据公式(4-20计算DIKW各层图谱上搜索目标资源的效率SearchEfficiency):

                             公式(4-20

其中|Resource|表示在该层图谱上搜索到的资源量;

步骤四:根据搜索代价和搜索效率综合排序,确定要优先遍历的资源处理架构。

4.3.2 基于DIKW图谱的正负双向搜索策略

在发明专利的智能辅助答复与审查过程中,不可或缺的是对现有发明技术的检索需求,如何找到申请人或审查员想要的现有技术在审查和答复过程中是非常重要的,因此本节主要介绍了基于DIKW图谱的正负双向搜索策略以配合答复和审查。然而网络资源往往是不确定的,无法保证的且非常复杂。本文针对具有正向和负向趋势的问题提供渐进式搜索方法,通过多次渐进式搜索来提高资源的可信度。同时,引入DIKW图谱作为资源处理架构,以组织网络上的资源,并通过语义分析来分析搜索者检索信息的趋势。根据搜索时间和每次搜索的项数来计算资源的熵,以表示具有正负趋势的资源的可靠性。在渐进式搜索过程中,将消除具有歧义倾向和虚假信息的资源,并提高搜索结果的质量,同时避免针对无限和复杂问题的死循环。

根据用户搜索到的实际问题的描述,获取满足用户信息需求的相关资源,这些资源可以分别分为具有正向和负向倾向的资源。例如当申请人搜索申请发明专利时,摘要附图是必需的吗?正趋势是必需而负趋势则是非必须。34显示了对具有正负趋势资源的渐进搜索结果。

34 具有正负趋势资源的渐进搜索结果

Fig. 34 Progressive search results with positive and negative trend resources

本文通过对用户的需求进行建模,并分别对具有正向和负向的搜索资源的权重进行计算。根据公式(4-21)和(公式4-22)分别计算具有正趋势的资源权重WeightP和负趋势的资源权重WeightN

                                     公式(4-21

                                    公式(4-22

其中ResourceP代表正资源量,ResourceN代表负资源量。 ResourceT代表所有资源的总量。

根据得到的正负双向资源所在权重分配用户投入,确定正向和反向搜索分别要花费的时间和金钱,进而确定正负双向搜索分别要递进搜索的次数,如公式(4-23公式(4-24所示。

                                     公式(4-23

               公式(4-24

其中T(P/N)表示正向与反向搜索分别要花费的时间,M(P/N)表示正向与反向搜索分别要花费的金钱,Weight(P/N)表示正负双向资源所占权重,P/N表示正或反。

本文假设用户的预期等待时间T是已知的。则渐进搜索的每个过程的项目和对每个项目的搜索时间是固定的。根据公式(4-25计算渐进式搜索的时间。

          公式(4-25

其中S_times表示由用户投资决定的渐进式搜索时间,S_items表示每次搜索的项目数量,Pert_item表示每个项目的搜索时间。

对于用户提出的问题,执行动态平衡的双向搜索服务策略,并遍历资源处理体系结构以搜索相关资源。根据获得的资源,找到资源中与关键字相关的因素。根据公式(4-26计算资源的信息熵,范围为01越大,置信度越低;越小,置信度越高。并根据公式(4-27计算拥有相同趋势的所有资源的总熵,用Entropy表示。根据公式(4-28计算资源的时效性Timeliness。使用公式(4-29来基于通过渐进式搜索过程获得的资源的熵来计算资源的置信度。

              公式(4-26

其中表示根据逐步搜索中的某个因素在时间TK中获得的资源的熵,pi表示每种类型答案的概率,Entropy表示根据一定的相关因子进行渐进式搜索时,不同条件下资源的加权平均熵。

               公式(4-27

                 公式(4-28

   公式(4-29

根据获得的资源的计算出的置信度,判断双向资源置信度的正负比是否大于阈值T或小于1 / T。 如果满足阈值条件,则以高置信度将搜索结果返回给用户。 否则,继续分配用户的投资,以继续进行渐进式搜索。图35显示了使用正负双向策略将搜索构建为服务的流程图。

35 使用正负双向策略将搜索构建为服务的流程图

Fig. 35 The flowchart of constructing search as a service using positive and negative bidirectional strategies

4.4 本章小结

本章主要介绍了发明专利的智能辅助答复与审查,从多模态内容语义建模出发到内容传输及优化再到内容搜索,完整的描述了发明专利的智能辅助答复和审查的各模块设计。其中第二节为本章的重点,详细介绍了发明专利的智能辅助答复与审查的核心,内容传输和内容重构设计方案。


5 系统的设计与实现

本文在第三章所构建的自动化申请模块和第四章所构建的智能辅助答复模块后,选取部分特征,实现了一个基于DIKW的发明专利智能申请与答复系统。其中,对于本系统所需要的输入部分,即发明专利申请文件,并未使用真实数据来源,而是采用数据模拟输入,即仿造发明专利申请个文件的格式和部分内容进行模拟以代替真实数据输入。本章着重描述该系统的设计与各模块的配置。

5.1 系统目的

本章对系统的基本框架和主要功能进行详细介绍,本文第三章所提出的基于DIKW的发明专利申请自动完成算法和流程及第四章所提出的基于DIKW的发明专利智能辅助答复算法和流程均部分应用在本系统,系统的负载均衡和存储计算一体化等非主要模块也部分应用其中。

该系统的主要功能是针对传统专利申请、审核、答复、授权等环节的效率低下以及高校专利质量普遍较低的问题,设计一种基于DIKW的发明专利智能申请与答复系统。旨在优化知识产权管理过程以及提高我国发明专利尤其是高价值发明专利的质量,为海南加快培育现代产业体系,实现跨域式发展提供信息化保障。本系统实现了对申请人和代理人双方的DIKW图谱画像,可以根据双方数据库设计可供多方交流的交互机制;系统实现了对发明专利申请书中内容的重构算法,可以根据专利法、专利实施细则等相关专利法规和审查员的答复意见,对发明专利申请文档进行修正,使其符合申请和答复标准;系统实现了基于DIKW的专利文件检索系统,可以根据专利内容匹配DIKW图谱,以满足更加精确的信息搜索需求;系统还实现了对可供申请专利的技术方案的预测,结合TRIZ理论中的冲突矩阵工具,通过DIKW图谱对技术方案进行分析,依据40项发明创造原理,得出可供申请专利或有应用前景的技术发明点,并以数据图谱可视化的形式展示。系统面向分布式处理,在双方相互答复的交互过程中考虑系统的负载均衡,实现资源处理效率的最优。

5.2 需求分析

本系统的主要功能是可以对发明专利申请文件进行自动填充和对发明专利申请文件进行内容修订重构以辅助答复,其附加功能包括专利检索和可供申请专利的技术发明点的预测与分析,以便申请人更好更快的对原有技术或产品进行发明再创造。

5.2.1 功能性需求

基于DIKW的发明专利智能申请与答复系统的功能需求如表8所示。

8 能需求描述

Table 8 Description of functional requirements

位置

功能名称

功能描述

注册/登录

注册/登录

申请人和审查员的注册和登录

主页

功能导航

展示首页功能、申请人接入、审查员接入的导航


首页功能

常规搜索、精确搜索的专利检索及下载功能


申请人接入

用户为申请人时,进入申请人操作界面


审查员接入

用户为审查员时,进入审查员操作界面

申请人接入

专利申请

以单个文档或压缩包的形式上传,并匹配到相应的专利申请文档中


通知书下载

下载图片形式的专利通知书


专利修改

选择任一专利申请文档进行提交,并输出带有修改标记的专利申请文档


专利答复

上传专利答复意见,匹配最近一次提交的专利文档,并输出带有修改标记的专利文档


发明点预测

以数据图谱形式预测产品发明创造方向

审查员接入

专利及答复下载

下载并保存待审查的专利文档和意见陈述书


专利审查

提交从本系统下载好的专利文档、意见陈述书和答复意见模板,并输出已格式匹配的答复意见


通知书提交

提交已答复的通知书

5.2.2 非功能性需求

本系统不仅满足了功能性需求,还满足了非功能性需求。系统的操作方式由非功能性需求决定,而系统的工作方式则由非功能性需求决定。本系统的非功能性需求详细描述如下:

1)安全性。系统的数据不易被攻击,不易被盗取。用户可以在任何环境下安全的运行本系统,而无需担心自身隐私信息被泄露。

2)可靠性。系统的数据在被破坏、盗取时易恢复。用户可以放心的将数据上传至本系统而无需担心数据在被破坏是无法正常运行、显示和操作。例如系统中存于数据图谱中的数据被破坏时,可以根据通过显示信息图谱和知识图谱中的信息知识,或者通过信息图谱和知识图谱推理出数据图谱中的数据,以达到系统可靠性的目的。

3)可维护性。系统易于维护。系统在遭受bug困扰、黑客攻击等时,易于被技术人员维护。

4)可用性。系统故障率小。

5)可伸缩性。系统易于升级和改版。本系统在知识产权方向都有较好利用率,具有多方向扩展的优点。

6)性能。系统响应时间短。用户在上传、提交、修改、下载文件时,所需时间短(10s内)。系统在负载高时,其峰值时间短且易于调整。

5.2.3 用例分析

36为本系统功能的用例分析图。

36 户用例图

Fig. 36 User use case diagram

用户可以在首页进行登录、注册、专利检索等操作,当用户为申请人或代理人时,可以接入申请人界面;当用户为审查员时,可以接入审查员界面。

用户与首页功能的交互操作:用户在注册登录系统时,进入本系统首页。在首页功能被激活后,用户可以选择进入申请人界面,也可以进入审查员界面。在首页,用户可以直接使用专利检索功能。专利检索功能可选择常规搜索和精确搜索,其中常规搜索为模糊搜索,通过匹配关键字和DIKW图谱匹配内容库进行搜索;精确搜索通过用户输入专利申请号、公开号、申请人、专利名称其中一个或多个信息进行精确搜索,用户输入信息越多,其等待时间和搜索精度越高。

用户与申请人界面的交互操作:当用户为申请人或代理人时,可以进入申请人接入界面。在申请人接入界面中,用户可以选择专利申请、专利通知书下载、专利修改、专利答复、发明点预测等五个按钮进行操作。1)专利申请,点击专利申请,选择说明书按钮进行专利申请文档的上传,文档格式包括PDFdocdocx等,其中按钮“其他”还可选择rarzip等格式。上传成功后进入目标文档编辑界面,左侧为文档目录,右侧为可编辑文档内容,用户可进行在线编辑等操作。用户在确认无误后,可点击确认按钮。在所有申请文档全部确认完毕后,可以点击提交按钮,进行专利申请。2)专利通知书下载,用户点击此按钮,以小窗口的形式展示可供下载的专利通知书。在此功能中,只有用户已经提交过的专利和添加的专利才能下载通知书。3)专利修改,用户点击此按钮,选择下拉选项中的说明书、权利要求书、说明书摘要等进行提交,上传成功后,转入新页面展示带有标记的文档,并提供此文档的下载按钮。4)专利答复,用户点击此按钮,提交本系统下载的专利通知书,并由系统根据专利名称自动匹配上一次提交的专利申请文档,系统响应过后,转入新页面,并展示带有标记的文档,并提供此文档的下载按钮。5)发明点预测,点击发明点预测按钮,用户将进入新页面,系统将在新页面展示一系列可供用户填写的表格。表格选项包括产品名称、产品组件1、产品组件2...、产品组件n、对比产品1、对比产品2...、对比产品n等,用户填写完毕后点击提交按钮,系统将以数据图谱可视化展示该产品的历史数据和本次预测结果。在此功能中,用户提供的信息越多越准确,则系统响应时间越短,结果更可信。

用户与审查员界面的交互操作:当用户为审查员时,可以进入审查员接入界面。在审查员接入界面中,用户可以选择专利及答复下载、专利审查、通知书提交等三个按钮进行操作。1)专利及答复下载,点击专利及答复下载,系统将弹出小窗口,用户可以点击下载按钮,下载需要进行审查的专利和答复意见陈述书;若没有需要进行审查的专利,用户可以点击我的待审查专利按钮,用户将进入新页面,新页面将展示用户个人待审查专利列表和已审查专利列表,其中未答复专利的专利名称以红色标记,用户可以点击专利名称进行阅读和下载该专利的专利申请文档。2)专利审查,点击专利审查按钮,并选择下拉菜单中的初步审查或实质审查,然后系统将弹出小窗口,用户选择文件以提交从本系统下载好的专利文档、意见陈述书和答复意见模板提交成功后,系统将返回已格式匹配的答复意见。其中初步审查主要为形式审查,以格式是否正确、内容是否完整等为主实质审查主要对专利的“三性”进行审查。3)通知书提交,点击通知书提交按钮,系统将弹出小窗口,用户输入专利名称并提交该专利的通知书,提交成功后,系统将返回提交成功提示。

5.3 总体结构及功能设计

5.3.1 系统总体结构设计

37 系统总体结构图

Fig. 37 Overall structure of the system

37为本系统的总体结构图。系统总体上分为三层,分别是需求采集层、处理层和传输层。

需求采集层:需求采集层包括申请人、代理人和审查员需求的采集。其中申请人和代理人包括专利申请及下载需求、专利检索需求、专利修改及答复通知书需求、专利发明点预测需求;审查员包括专利检索需求、专利审查和答复陈述意见需求、专利提交及下载需求。

处理层:处理层为本系统的核心部分,包括竞争及合作智能填充模块、多模态内容语义建模、传输及计算一体化模块、正负双向搜索模块、个性化展示模块。其中竞争及合作智能填充模块主要服务于专利申请及提交需求、多模态内容语义建模、传输及计算一体化模块主要服务于专利修改及答复需求和专利发明点预测需求、正负双向搜索模块主要服务于专利检索需求、个性化展示模块主要服务于申请人代理人和审查员沟通时的用户画像构建和本系统的界面展示。

传输层:传输层为申请人和审查员双方进行交互时作用的层级,其中包括边缘计算、云计算和雾计算。双方在沟通时,根据传输数据的大小、传输的速率等参数进行DIKW图谱转化,以负载平衡。

5.3.2 系统总体功能设计

38 系统总体功能设计图

Fig. 38 System overall function design diagram

38为本系统的总体功能设计图,系统包括注册、登录、专利检索、申请人接入和审查员接入等五大功能。其中申请人接入包括专利申请功能、专利通知书下载功能、专利修改功能、专利答复功能和专利发明点预测功能等五个功能,审查员接入包括专利及答复下载功能、专利审查功能、通知书提交功能等三个功能,其中专利审查功能包括初步审查功能和实质审查功能等两个功能。

5.4 系统的详细设计

5.4.1 专利文件提交及下载功能的实现

用户登录本系统后,点击申请人接入,进入到申请人接入界面。用户可以选择专利申请、专利通知书下载、专利修改、专利答复、发明点预测等五个按钮进行操作。如图39所示为本系统申请人接入界面。

 

39 申请人接入界面

Fig. 39 Applicant access interface

点击专利申请,选择下拉选项中的说明书、权利要求书、说明书摘要、其他等按钮进行专利申请文档的上传。上传成功后进入目标文档编辑界面,左侧为文档目录,右侧为可编辑文档内容,用户可进行在线编辑等操作。用户在确认无误后,可点击确认按钮。如图40所示为目标文档编辑界面。

 

40 标文档编辑界面

Fig. 40 Target document editing interface

点击专利通知书下载按钮,以小窗口的形式展示可供下载的专利通知书。如图5-6所示为专利通知书下载界面。

 

41 专利通知书下载界面

Fig. 41 Download interface of patent notice

5.4.2 专利修改及答复功能的实现

本系统采用Neo4j作为DIKW图谱存储的图数据库Li et al., 2019。根据关系型数据库的结构和Neo4j提供的接口,设计了一个基于Binlog的导入架构模型来搭建DIKW图谱,如图42所示。

42 DIKW图谱搭建框架图

Fig. 42 DIKW graph Construction Framework

其中BinlogMySQL数据库中记录所有表结构的更新(例如创建、更新表)以及表数据的修改(插入、更新、删除)的二进制日志。它不会记录查询和展示这类对数据本身并没有修改的行为。基于此机制,使用Canal Server中间件来对Binlog进行监控,当MySQL数据库发生变化时,由Canal Server将数据发送给Canal ClientCanal Client中会有一个Kafka Producer,它是一个消息生产者,能够把消息传输到Kafka消息队列中,由Kafka Consumer消费者从消息队列中取出数据,最后调用一个Neo4j提供的一个接口把数据写到Neo4j中。

由于存储实体关系三元组需要用到数据库,所以需要对数据库的表结构进行设计,根据对需要存储的数据的特点进行分析,可以得到以下关系:

A:一个文本信息可以被划分为多个词组,所以文本信息与词组之间时一对多的关系。

B:一个词组在不同的语境情况下可能存在实体关系两种形态,所以词组和实体关系是一对多的关系。

根据这些关系设计数据库表结构的逻辑结构如图43所示。

43 数据库表的逻辑结构

Fig. 43 The logical structure of the database table

在完成表的逻辑结构的设计之后,根据该结构,可以具体的设计每个表的具体结构,包括每个字段的类型,参数大小,约束条件。设计结果如表9、表10、表11所示。

9 “文本”表的属性设计表

Table 9 Attribute design table of "Text" table

字段名

数据类型

参数大小

是否允许为空

约束条件

文本ID

Integer

-

N

主键

文本

Char

200

N

-

获取时间

Date

-

Y

-

10 “分词词性”表的属性设计表

Table 10 Attribute design table of "Part of Speech" table

字段名

数据类型

参数大小

是否允许为空

约束条件

分词ID

Integer

-

N

主键

文本ID

Integer

-

N

外键

词组

Char

50

N

-

词性

Char

10

N

属于词性表

实体

Integer

-

N

取值为01

关系

Integer

-

N

取值为01

11 “实体关系”表的属性设计表

Table 11 Attribute design table of "Entity Relationship" table

字段名

数据类型

参数大小

是否允许为空

约束条件

实体关系ID

Integer

-

N

主键

实体ID

Integer

-

N

外键

关系ID

Integer

-

N

外键

根据设计好的属性表和逻辑模型,可以得到其物理模型。在ERwin中定义好之前设计的各字段的类型,参数大小和约束条件,通过ERwin的正向工程生成SQL语句代码,将代码复制到MySQL中执行,生成数据库及数据库中的表。

基于以上设计,实现专利修改及答复功能。

用户点击专利修改按钮,选择下拉选项中的说明书、权利要求书、说明书摘要等进行提交,上传成功后,转入新页面展示带有标记的文档,并提供此文档的下载按钮。如图44所示,为专利修改展示界面。

 

44 专利修改展示界面

Fig. 44 Patent modification display interface

5.4.3 专利检索功能的实现

用户登录本系统后,进入系统首页,可选择专利检索功能。如图45所示,为系统的首页功能界面。

 

45 系统首页功能界面

Fig. 45 System home page function interface

在首页功能被激活后,用户可以直接使用专利检索功能。专利检索功能可选择常规搜索和精确搜索,其中常规搜索为模糊搜索,通过匹配关键字和DIKW图谱匹配内容库进行搜索;精确搜索通过用户输入专利申请号、公开号、申请人、专利名称其中一个或多个信息进行精确搜索,用户输入信息越多,其等待时间和搜索精度越高。如图46所示为本系统的精确搜索界面。

 

46 精确搜索界面

Fig. 46 Precise search interface

5.4.4 专利技术发明点预测功能的实现

本系统结合TRIZ理论体系,依据DIKW图谱化技术对发明专利的技术发明点进行预测,得到具有专利前景的技术发明点。其DIKW图谱技术和TRIZ理论体系关联图如图47所示。

47 DIKW图谱技术和TRIZ理论体系关联图

Fig. 47 The correlation diagram between DIKW graph technology and TRIZ theoretical system

基于以上关联设计,实现专利技术发明点预测功能。

用户点击发明点预测按钮,用户将进入新页面,系统将在新页面展示一系列可供用户填写的表格。表格选项包括产品名称、产品组件1、产品组件2...、产品组件n、对比产品1、对比产品2...、对比产品n等,如图48所示,为专利技术发明点预测设置界面。用户填写完毕后点击提交按钮,系统将以数据图谱可视化展示该产品的历史数据和本次预测结果。在此功能中,用户提供的信息越多越准确,则系统响应时间越短,结果更可信。如图49所示,为专利技术发明点预测展示界面(以多功能雨伞为例)。

 

48 专利技术发明点预测设置界面

Fig. 48 Patented technology invention point forecast setting interface

 

49 专利技术发明点预测结果界面(以多功能雨伞为例)

Fig. 49 The prediction display interface of patented technology invention points (take a multifunctional umbrella as an example)

5.5 系统测试

5.5.1功能测试

12 系统的功能测试表

Table 12 System function test table

功能模块

功能点

说明

前置条件

动作

预期结果

实际结果

1

登录注册

登录

用户使用正确的用户名和密码进行登录

-

输入正确密码

用户登录成功,并跳转到系统首页

成功

用户使用错误的用户名或密码登陆

-

输入错误密码或空密码

户登录失败,并弹出“用户名/密码输入错误”提示窗

成功

注册

用户使用身份证号码等基本信息进行注册

-

输入身份证号码等基本信息

用户注册成功,并跳转到系统首页

成功

2

专利文件的下载及提交

专利文件的下载

下载专利文件

-

单击下载按钮

下载成功,并弹出“下载成功”提示窗口

成功

专利文件的提交

提交专利文件

已选择好需要提交的专利文件

单击提交按钮

提交成功,并弹出“提交成功”提示窗口

成功

3

专利修改及答复

专利法第二十六条第四款

专利文件不符合该法规时得到的修改文档

已选择好需要提交的专利文件

单击答复或修改按钮

答复成功,并输出带有修改标记的修改文档

成功

专利法第二十二条第三款

专利文件不符合该法规时得到的修改文档

已选择好需要提交的专利文件

单击答复或修改按钮

答复成功,并输出带有修改标记的修改文档

成功

专利法第九条第一款

专利文件不符合该法规时得到的修改文档

已选择好需要提交的专利文件

单击答复或修改按钮

答复成功,并输出带有修改标记的修改文档

成功

4

专利检索

常规搜索

用户输入模糊信息进行搜索

已输入模糊信息,如“多功能雨伞”

单击常规搜索按钮

符合前置条件的专利列表

成功

精确搜索

用户输入精确信息进行搜索

已输入精确信息,如申请号等

单击精确搜索按钮

符合前置条件的专利

成功

5

专利技术发明点预测

发明点预测

用户对某一产品或方法进行专利点预测

已输入产品组成特征等信息

单击发明点预测按钮

展示产品特征占比的数据图谱

成功

12基于DIKW的发明专利智能申请与答复系统的功能测试表。其中,实际结果一列中所记录的“成功”表示与预期结果一致,“失败”表示与预期结果不一致。对本系统的主要功能进行了详细的功能测试。主要包括系统的登录注册、专利文件的下载及提交、内容语义重构、专利检索和专利技术发明点预测五个功能模块的测试。其中内容语义重构还基于专利法第二十六条第四款、专利法第二十二条第三款和专利法第九条第一款进行了进一步测试。结果发现,系统在测试中符合预期。

5.5.2 性能测试

13 系统的非功能测试表

Table 13 Non-functional test table of the system

测试场景

说明

预期结果

测试结果

登录

点击登录按钮至跳转到首页的过程

响应时间在1s以内

符合预期

专利的下载及提交

点击专利下载/提交至下载/提交成功的过程

响应时间在1s以内

符合预期

专利修改及答复

点击专利修改/答复至输出修改文档的过程

响应时间在10s以内

符合预期

专利检索

点击常规或精确搜索至输出符合条件的专利的过程

响应时间在1s以内

符合预期

专利技术发明点预测

点击发明点预测至输出数据图的过程

响应时间在1s以内

符合预期

13基于DIKW的发明专利智能申请与答复系统的非功能测试表。其中,测试结果一列中所记录的“符合预期”表示响应时间在预期结果范围内,“不符合预期”表示响应时间不在预期结果范围内。本次测试为模拟测试,所输入的专利文件均已特定大小的文件进行上传,其传输速率均为给定数值。在此次测试中,设定专利文件大小为10KB,传输速率为1KB/S,其预期的响应时间计算后为10S。上表为基于DIKW的发明专利智能申请与答复系统的非功能测试表。对本系统各个场景的响应时间进行了测试。主要包括系统的登录、专利文件的下载及提交、专利修改及答复、专利检索和专利技术发明点预测等五个场景的非功能性测试。结果发现,系统在测试中符合预期。

5.6 本章小结

本章首先阐述了基于DIKW的发明专利智能申请与答复系统的目的与需求,然后根据需求介绍了本系统的总体结构和功能,接着详细设计了本系统各个功能的实现,包括专利文件提交及下载功能、专利修改及答复功能、专利检索功能和专利技术发明点预测功能等,最后基于设计的各个模块对本系统的功能进行了测试。


6 总结与展望

6.1 总结

发明专利作为知识产权的核心组成部分,在国际经济竞争中发挥着不可替代的作用。专利战略已经成为企业经营战略与防御国外企业专利战攻击的核心增强自主知识产权成为重要的国家战略措施。然而,我国绝大部分企业在知识产权保护方面并不重视,许多原创技术得不到保护。目前海南围绕海洋科技和农业科技发展、科技服务精准脱贫和民生改善,深入实施专利倍增计划,建设知识产权强省。

在当前海南创建自贸港的大背景下,本文针对传统的发明专利申请、审核、答复、授权等环节的从人才到管理的持续快速质量改进和效率提升困难痛点上,设计与实现一种基于DIKW的发明专利智能申请与答复系统,从信息技术角度,借助所在课题组丰富的发明专利申请和答复的数据和经验积累,研究依托DIKW架构的发明专利内容生命智能申请与答复系统,为海南加快培育现代产业体系,实现跨域式发展提供信息化保障。主要研究工作归纳如下:

第一:基于DIKW图谱架构的交互机制设计与实现发明专利申请自动完成与智能辅助答复系统,依托和结合开发生命期软件工程全过程建模管理,面向发明专利申请到授权全过程处理,针对生命期内的发明专利,结合专利法、专利实施细则等相关专利法规,对申请人或代理人撰写的发明专利申请文档进行修正,使其符合相应的规则,并利用竞争及合作的智能填充机制实现专利的自动化申请。在答复过程中,根据答复意见并结合用户画像内容数据库,提供具有针对性的修改意见及方案,实现发明专利的智能辅助答复。

第二:在申请与答复过程中,从DIKW概念架构角度进行相关内容资源建模与转换映射。依据多方交流的交互机制从DIKW的角度对内容进行重构,以达到不同领域人员相互理解的目的。并在一定条件下,重构内容能够满足更加精确的信息搜索需求,提出的正负双向索引算法使搜索结果的形式除了匹配查询关键字的链接,还能够基于专利技术内容的实体关系搜索答案。

第三:结合TRIZ理论中的冲突矩阵工具,通过DIKW图谱对技术方案进行分析,依据40项发明创造原理,得出可供申请专利或有应用前景的技术发明点,并以数据图谱可视化的形式展示。

6.2 展望

人工智能革命将极大地改变人,机器与社会之间的关系。随着人工智能技术自身融入我们的世界,现有的法律理论和结构变得越来越过时。从历史上看,知识产权法在广泛传播发明和思想给社会带来的好处与通过在有限时间内为发明人提供专有权而进行创新的动机之间取得了平衡。当“个人”的定义扩展到包括自动机器时,我们将需要重新检查社会的功利性需求和个人权利之间的平衡。在美国,专利所有权最初归属于历史上一直被认为是人类的发明人。但是,人工智能可能很快就能构思出发明并将其付诸实践,而无需人类参与。我们将如何处理记入AI的发明人所有权,以及销售和许可发明?鉴于此,下一步我拟AI治理方向切入,继续探索AI与技术发明创新结合实践中去。

此外,本文通过设计与实现基于DIKW的发明专利智能申请与答复系统,基本达到预期的目标,但是仍然存在着不足之处:

第一:系统当前的数据集还很小,多是仿真数据;下一步要面对实际情况采集更多数据

:目前系统的功能模块还并不完善,界面也较为简单,需要进一步扩充完善,并对界面进行修饰美观,才有可能具备现实使用意义。

 

 


参考文献

[1]  曹东. 面向人事管理的智能填表系统的研究与设计[D]. 华南理工大学, 2012.

[2]  段玉聪, 邵礼旭, 曹步清, 孙小兵, .投入驱动的存储与计算一体化的事务处理效率优化方法[J]. 计算机工程与科学, 2018a, 40(08): 1383-1389.

[3]  段玉聪, 邵礼旭, 崔立真, . 基于知识图谱的云端个性化测试推荐[J]. 小型微型计算机系统, 2018b, 39(12): 2743-2747.

[4]  段玉聪, 张欣悦, 周长兵, . 面向隐式类型化资源的安全防护[J]. 计算机科学与探索, 2018c, 13(12): 2061-2072.

[5]  付启明. 经济全球化背景下中国企业专利战略研究[D]. 苏州大学, 2010.

[6]  耿宁悦. 从公众参与的视角谈专利质量的提高——我国公众专利评审机制的探究[J]. 法制博览, 2019(26): 99-100.

[7]  国家知识产权局战略规划司. 知识产权统计简报[D]. 2019.

[8]  胡佳尧. 人工智能生成发明的专利法保护研究[D]. 广西大学, 2019.

[9]  胡学钢, 杨恒宇, 林耀进, . 基于协同过滤的专利TRIZ分类方法[J]. 情报学报, 2018( 5) : 512518

[10]  胡正银, 刘春江, 隗玲, . 面向TRIZ的领域专利技术挖掘系统设计与实践[J]. 图书情报工作, 2017(1): 117-124.

[11]  江屏, 张瑞红, 孙建广, . 基于TRIZ的专利规避设计方法与应用[J]. 计算机集成制造系统, 2015(4): 914-923.

[12]  姜军. 企业专利战略与核心竞争力的关联研究[D]. 武汉理工大学, 2005.

[13]  姜涛, 邱宁. 基于Excel模板的在线填表系统的设计[J]. 科技致富向导, 2012(02): 10+34.

[14]  孔祥俊. 人工智能知识产权保护的若干问题[C]. 《上海法学研究》集刊(2019年第13卷 总第13卷)——上海市法学会互联网司法研究小组论文集. 上海市法学会, 2019: 36-39.

[15]  寇枫阳. 人工智能生成内容的作品化、路径及其归属[J].中南财经政法大学研究生学报, 2019(05): 102-110.

[16]  李更, 范文, 赵今明. TRIZ创新流程与专利检索系统的结合探索[J]. 情报杂志, 2013(2): 79-81.

[17]  李鹏, 安纪平. 浅谈TRIZ理论在专利回避设计中的应用[J]. 中国发明与专利, 2013(2): 29-32.

[18]  李睿, 萨日娜, 黄学军. 基于TRIZ的专利信息组织———以新能源汽车充电技术为例[J]. 情报学报, 2017(2): 111-122.

[19]  李想. 人工智能参与发明的授权问题探究[J]. 科技进步与对策, 2020, 37(15): 144-151.

[20]  刘垠. 拉动中国创新指数持续上扬 要让专利论文更快“变现”[N]. 科技日报, 2019-11-05(004).

[21]  龙文懋, 季善豪. 作品创造性本质以及人工智能生成物的创造性问题研究[J]. 电子知识产权, 2019(05): 4-15.

[22]  鲁麒, 任工昌, 李平平, . 基于TRIZ理论的中文专利文本挖掘模型的构建[J]. 情报科学, 2014(10): 28-32.

[23]  彭茂祥, 李浩. 基于大数据及TRIZ理论的专利技术智能化开发运营模式研究[J]. 图书情报知识, 2016(6): 80-87.

[24]  祁明, 秦雷. 基于TRIZ的多视角下知识产权预警体系[J]. 科技管理研究. 2012(5): 186-189.

[25]  沈佳锋. 基于TRIZ的专利群规避方法应用研究与系统开发[D].浙江理工大学,2020.

[26]  唐静笑, 吕学强, 柳成洋, . 用户查询意图的层次化识别方法[J]. 现代图书情报技术, 2014(01): 36-42.

[27]  王海旺, 史红权, 李晓丹. 基于直觉模糊集和贝叶斯推理的意图识别方法[J]. 舰船电子工程, 2019, 39(06): 42-45.

[28]  王克奇, 于江涛. 李海英.TRIZ理论在专利检索系统中的应用研究[J]. 情报科学, 2011(2): 231-234.

[29]  王圣利. 人工智能发明的可专利性及其权利归属研究[D]. 华中师范大学, 2019.

[30]  王亚非.普适计算环境下智能填表提示系统的设计与实现[D]. 北京大学, 2014.

[31]  王玉秋.基于VS“WebBrowser控件自动填表实例应用的探讨[J]. 电脑知识与技 , 2018, 14(6): 255-226.

[32]  吴坤. 审慎赋予人工智能自主发明创造专利权[J]. 人民论坛, 2020(Z2): 62-63.

[33]  吴轩. 基于元数据模型的地质资料编目与互联互查平台设计与实现[D]. 中国地质大学 (北京), 2018.

[34]  许崇春. 基于技术路线图、专利地图和TRIZ集成的产业集群创新技术路径研究[J]. 科技进步与对策, 2012(14): 46-49.

[35]  燕慧泉, 吕鹏辉, 张仁琼, . 诺奖高效蓝光二极管创新性的TRIZ分析及其专利竞争与进化特征[J]. 科技管理研究, 2018(10): 165-175.

[36]  杨春妮, 冯朝胜. 结合句法特征和卷积神经网络的多意图识别模型[J]. 计算机应用, 2018, 38(07): 1839-1845+1852.

[37]  杨鑫超, 张玉, 杨伟超. TRIZ在高价值专利培育工作中的创新应用研究[J]. 情报杂志, 2020, 39(07): 54-58, 86.

[38]  Ackoff R L. From data to wisdom[J]. Journal of applied systems analysis, 1989, 16(1): 3-9.

[39]  Ardolino M, Rapaccini M, Saccani N, et al. The role of digital technologies for the service transformation of industrial companies[J]. International Journal of Production Research, 2018, 56(6): 2116-2132.

[40]  Aristodemou L, Tietze F. A literature review on the state-of-the-art on intellectual property analytics[J]. 2017.

[41]  Aristodemou L, Tietze F. The state-of-the-art on Intellectual Property Analytics (IPA): A literature review on artificial intelligence, machine learning and deep learning methods for analysing intellectual property (IP) data[J]. World Patent Information, 2018, 55: 37-51.

[42]  Aven T. A conceptual framework for linking risk and the elements of the data–information–knowledge–wisdom (DIKW) hierarchy[J]. Reliability Engineering & System Safety, 2013, 111: 30-36.

[43]  Awad M, Ghaziri H. Knowledge Management[M], Upper Saddle River, NJ, Pearson Education International, 2004.

[44]  Baskarada S, Koronios A. Data, information, knowledge, wisdom (DIKW): a semiotic theoretical and empirical exploration of the hierarchy and its quality dimension[J]. Australasian Journal of Information Systems, 2013, 18(1).

[45]  Bates M. Information and knowledge: An evolutionary framework for information science[J]. Information Research: an international electronic journal, 2005, 10(4): n4.

[46]  Bordes A, Usunier N, Garcia-Duran A, et al. Translating embeddings for modeling multi-relational data[C]//Neural Information Processing Systems (NIPS). 2013: 1-9.

[47]  Bordes A, Weston J, Collobert R, et al. Learning structured embeddings of knowledge bases[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2011, 25(1).

[48]  Broadbent M. The phenomenon of knowledge management: what does it mean to the information profession?[J]. Information outlook, 1998, 2(5): 23-37.

[49]  Buckland M. Information as thing[J]. Journal of the American Society for information science, 1991, 42(5): 351-360.

[50]  Cafarella M, Banko M, Etzioni O. Open information extraction from the Web: U.S. Patent 7,877,343[P]. 2011-1-25.

[51]  Carlson A, Betteridge J, Wang R, et al. Coupled semi-supervised learning for information extraction[C]//Proceedings of the third ACM international conference on Web search and data mining. 2010: 101-110.

[52]  Chatti M, Dyckhoff A, Schroeder U, et al. A reference model for learning analytics[J]. International Journal of Technology Enhanced Learning, 2012, 4(5-6): 318-331.

[53]  Chen J, Ma J, Zhong N, et al. WaaS—Wisdom as a service[M]//Wisdom Web of Things. Springer, Cham, 2016: 27-46.

[54]  Chiang T, Wu S, Trappey C, et al. An Intelligent System for Automated Binary Knowledge Document Classification and Content Analysis[J]. J. UCS, 2011, 17(14): 1991-2008.

[55]  Choi S, Park H, Kang D, et al. An SAO-based text mining approach to building a technology tree for technology planning[J]. Expert Systems with Applications, 2012, 39(13): 11443-11455.

[56]  Choo C, Detlor B, Turnbull D. Web work: Information seeking and knowledge work on the World Wide Web[M]. Springer Science & Business Media, 2013.

[57]  Cleveland H. Information as a resource[J]. Futurist, 1982, 16(6): 34-39.

[58]  Cooley M. Architect or bee? The human price of technology (Second)[J]. 1987.

[59]  Cooper P. Data, information, knowledge and wisdom[J]. Anaesthesia & Intensive Care Medicine, 2014, 15(1): 44-45.

[60]  Cowan P, Hinton J. Intellectual property and artificial intelligence: what does the future hold?[J]. Intellectual Asset Management Magazine, 2018, 88: 24-29.

[61]  Cubert J, Bone R. The law of intellectual property created by artificial intelligence [M]//Research Handbook on the Law of Artificial Intelligence. Edward Elgar Publishing, 2018.

[62]  Dewulf K. Sustainable product innovation: the importance of the front-end stage in the innovation process[J]. Advances in industrial design engineering, 2013: 139-166.

[63]  Duan Y, Lu Z, Zhou Z, et al. Data privacy protection for edge computing of smart city in a DIKW architecture[J]. Engineering Applications of Artificial Intelligence, 2019, 81: 323-335.

[64]  Duan Y, Shao L, Hu G, et al. Specifying architecture of knowledge graph with data graph, information graph, knowledge graph and wisdom graph[C]//2017 IEEE 15th International Conference on Software Engineering Research, Management and Applications (SERA). IEEE, 2017a: 327-332.

[65]  Duan Y, Shao L, Sun X, et al. An investment defined transaction processing towards temporal and spatial optimization with collaborative storage and computation adaptation[C]//International Conference on Intelligent Data Engineering and Automated Learning. Springer, Cham, 2017b: 452-460.

[66]  Dussin M, Ferro N. Direct: applying the dikw hierarchy to large-scale evaluation campaigns[C]//Proceedings of the 8th ACM/IEEE-CS joint conference on Digital libraries. 2008a: 424-424.

[67]  Dussin M, Ferro N. The role of the dikw hierarchy in the design of a digital library system for the scientific data of large-scale evaluation campaigns[C]//Proceedings of the 8th ACM/IEEE-CS joint conference on Digital libraries. 2008b: 450-450.

[68]  Eliot T. The rock[M]. Faber & Faber Limited, 1934.

[69]  Fader A, Zettlemoyer L, Etzioni O. Open question answering over curated and extracted knowledge bases[C]//Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. 2014: 1156-1165.

[70]  Faucher J, Everett M, Lawson R. Reconstituting knowledge management[J]. Journal of knowledge management, 2008.

[71]  Firdaus M, Kumar A, Ekbal A, et al. A multi-task hierarchical approach for intent detection and slot filling[J]. Knowledge-Based Systems, 2019, 183: 104846.

[72]  Gamble P, Blackwell J. Knowledge management: A state of the art guide[J]. 2001.

[73]  Gerken J, Moehrle M. A new instrument for technology monitoring: novelty in patents measured by semantic patent analysis[J]. Scientometrics, 2012, 91(3): 645-670.

[74]  He S, Liu K, Ji G, et al. Learning to represent knowledge graphs with gaussian embedding[C]//Proceedings of the 24th ACM international on conference on information and knowledge management. 2015: 623-632.

[75]  Hey J. The data, information, knowledge, wisdom chain: the metaphorical link[J]. Intergovernmental Oceanographic Commission, 2004, 26: 1-18.

[76]  Hido S, Suzuki S, Nishiyama R, et al. Modeling patent quality: A system for large-scale patentability analysis using text mining[J]. Information and Media Technologies, 2012, 7(3): 1180-1191.

[77]  Hoppe A, Seising R, Nürnberger A, et al. Wisdom-the blurry top of human cognition in the DIKW-model?[C]//Proceedings of the 7th conference of the European Society for Fuzzy Logic and Technology. Atlantis Press, 2011: 584-591.

[78]  Intezari A, Pauleen D, Taskin N. The DIKW hierarchy and management decision-making [C]//2016 49th Hawaii International Conference on System Sciences (HICSS). IEEE, 2016: 4193-4201.

[79]  Jashapara A. Knowledge management: An integrated approach[M]. Pearson Education, 2004.

[80]  Jennex M. Re-visiting the knowledge pyramid[C]//2009 42nd Hawaii International Conference on System Sciences. IEEE, 2009: 1-7.

[81]  Jessup L, Valacich J S, Wade M. Information systems today[J]. Upper Saddle River, NJ: Prentice Hall, 2003.

[82]  Ji G, He S, Xu L, et al. Knowledge graph embedding via dynamic mapping matrix[C]//Proceedings of the 53rd annual meeting of the association for computational linguistics and the 7th international joint conference on natural language processing (volume 1: Long papers). 2015: 687-696.

[83]  Ji G, Liu K, He S, et al. Knowledge graph completion with adaptive sparse transfer matrix[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2016, 30(1).

[84]  Jifa G, Zhang L. Data, DIKW, Big data and Data science[J]. Procedia Computer Science, 2014, 31: 814-821.

[85]  Jifa G. Data, Information, Knowledge, wisdom and meta-synthesis of wisdom-comment on wisdom global and wisdom cities[J]. Procedia Computer Science, 2013, 17: 713-719.

[86]  Jun S. Time series clustering model based on complexity for apple technology forecasting[J]. Int. J. Appl. Eng. Res., 2016, 11(20): 10343-10347.

[87]  Kim J, Lee S. Forecasting and identifying multi-technology convergence based on patent data: the case of IT and BT industries in 2020[J]. Scientometrics, 2017, 111(1): 47-65.

[88]  Kim Y, Cochran D. Reviewing TRIZ from the perspective of axiomatic design[J]. Journal of Engineering Design, 2000, 11(1): 79-94.

[89]  Lee C, Kim J, Kwon O, et al. Stochastic technology life cycle analysis using multiple patent indicators[J]. Technological Forecasting and Social Change, 2016, 106: 53-64.

[90]  Lee C, Song B, Park Y. How to assess patent infringement risks: a semantic patent claim analysis using dependency relationships[J]. Technology analysis & strategic management, 2013, 25(1): 23-38.

[91]  Li W, Peng R, Wang Y, et al. Knowledge graph based natural language generation with adapted pointer-generator networks[J]. Neurocomputing, 2020, 382: 174-187.

[92]  Lievesley D. Data information knowledge chain[J]. Health Informatics Now. Swindon: The British Computer Society , 2006, 1(1): 14.

[93]  Liew A. DIKIW: Data, information, knowledge, intelligence, wisdom and their interrelationships[J]. Business Management Dynamics, 2013, 2(10): 49.

[94]  Lin Y, Liu Z, Sun M, et al. Learning entity and relation embeddings for knowledge graph completion[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2015, 29(1).

[95]  Liu S H, Liao H, Pi S, et al. Development of a Patent Retrieval and Analysis Platform–A hybrid approach[J]. Expert systems with applications, 2011, 38(6): 7864-7868.

[96]  Lobov A. Smart manufacturing systems: climbing the DIKW pyramid[C]//IECON 2018-44th Annual Conference of the IEEE Industrial Electronics Society. IEEE, 2018: 4730-4735.

[97]  Lu B, Wang X, Utiyama M. Incorporating prior knowledge into learning by dividing training data[J]. Frontiers of Computer Science in China, 2009, 3(1): 109-122.

[98]  Mishra K. A dikw architecture for cognitive engineering[J]. Procedia computer science, 2018, 123: 285-289.

[99]  Nutter A, Adams J, Patton J, et al. Intellectual property evaluation method and system: U.S. Patent Application 10/145,374[P]. 2002-11-28.

[100] Oyama K, Jaygarl H, Xia J, et al. Requirements analysis using feedback from context awareness systems[C]//2008 32nd Annual IEEE International Computer Software and Applications Conference. IEEE, 2008: 625-630.

[101] Park H, Ree J, Kim K. Identification of promising patents for technology transfers using TRIZ evolution trends[J]. Expert Systems with Applications, 2013a, 40(2): 736-743.

[102] Park H, Kim K, Choi S, et al. A patent intelligence system for strategic technology planning[J]. Expert Systems with Applications, 2013b, 40(7): 2373-2390.

[103] Polanyi M. Personal knowledge: Towards a post-critical philosophy[M]. University of Chicago Press, 2015.

[104] Pretorius J, Mathews M, Maré P, et al. Implementing a DIKW model on a deep mine cooling system[J]. International Journal of Mining Science and Technology, 2019, 29(2): 319-326.

[105] Riedl C, Zanibbi R, Hearst M, et al. Detecting figures and part labels in patents: competition-based development of graphics recognition algorithms[J]. International Journal on Document Analysis and Recognition (IJDAR), 2016, 19(2): 155-172.

[106] Robertson T. The DIKW Hierarchy and Adventist Theological Education[J]. Second Annual Gloria Patri Conference on Religion Science and the Humanities, 2009.

[107] Rowley J. The wisdom hierarchy: representations of the DIKW hierarchy[J]. Journal of information science, 2007, 33(2): 163-180.

[108] Schopenhauer A. The world as will and representation[M]. Courier Corporation, 2012.

[109] Schumaker R. From data to wisdom: the progression of computational learning in text mining[J]. Communications of the IIMA, 2011, 11(1): 4.

[110] Sen P. Collective context-aware topic models for entity disambiguation[C]//Proceedings of the 21st international conference on World Wide Web. 2012: 729-738.

[111] Shannon C. A mathematical theory of communication[J]. The Bell system technical journal, 1948, 27(3): 379-423.

[112] Shao L, Duan Y, Cui L, et al. A pay as you use resource security provision approach based on data graph, information graph and knowledge graph[C]//International Conference on Intelligent Data Engineering and Automated Learning. Springer, Cham, 2017a: 444-451.

[113] Shao L, Duan Y, Sun X, et al. Answering Who/When, What, How, Why through Constructing Data Graph, Information Graph, Knowledge Graph and Wisdom Graph[C]//SEKE. 2017b: 1-6.

[114] Shao L, Duan Y, Sun X, et al. Bidirectional value driven design between economical planning and technical implementation based on data graph, information graph and knowledge graph[C]//2017 IEEE 15th International Conference on Software Engineering Research, Management and Applications (SERA). IEEE, 2017c: 339-344.

[115] Shao L, Duan Y, Zhou Z, et al. Learning Planning and Recommendation Based on an Adaptive Architecture on Data Graph, Information Graph and Knowledge Graph[C]//International Conference on Collaborative Computing: Networking, Applications and Worksharing. Springer, Cham, 2017d: 323-332.

[116] Silberman M. The handbook of experiential learning[M]. John Wiley & Sons, 2007.

[117] Song Z, Duan Y, Wan S, et al. Processing optimization of typed resources with synchronized storage and computation adaptation in fog computing[J]. Wireless Communications and Mobile Computing, 2018, 2018.

[118] Taduri S, Lau G, Law K, et al. A patent system ontology for facilitating retrieval of patent related information[C]//Proceedings of the 6th International Conference on Theory and Practice of Electronic Governance. 2012: 146-157.

[119] Taduri S, Lau G, Law K, et al. Developing an ontology for the US patent system [C]//Proceedings of the 12th Annual International Digital Government Research Conference: Digital Government Innovation in Challenging Times. 2011: 157-166.

[120] Tan R, Zhang H. Interactive training model of TRIZ for mechanical engineers in China[J]. Chinese Journal of Mechanical Engineering, 2014, 27(2): 240-248.

[121] Tenorio-González A, Morales E. Automatic discovery of concepts and actions[J]. Expert Systems with Applications, 2018, 92: 192-205.

[122] Floridi L. The Blackwell guide to the philosophy of computing and information[M]. John Wiley & Sons, 2008.

[123] Trappey A, Hsu F, Trappey C, et al. Development of a patent document classification and search platform using a back-propagation network[J]. Expert Systems with Applications, 2006, 31(4): 755-765.

[124] Trappey A, Trappey C, Chiang T, et al. Ontology-based neural network for patent knowledge management in design collaboration[J]. International Journal of Production Research, 2013, 51(7): 1992-2005.

[125] Trappey A, Trappey C, Chung C. IP portfolios and evolution of biomedical additive manufacturing applications[J]. Scientometrics, 2017, 111(1): 139-157.

[126] Trappey A, Trappey C, Wu C, et al. A patent quality analysis for innovative technology and product development[J]. Advanced Engineering Informatics, 2012, 26(1): 26-34.

[127] Vrochidis S, Moumtzidou A, Kompatsiaris I. Concept-based patent image retrieval[J]. World Patent Information, 2012, 34(4): 292-303.

[128] Wang S, Zou Y, Keivanloo I, et al. An intelligent framework for auto-filling web forms from different web applications[J]. International Journal of Business Process Integration and Management, 2017, 8(1): 16-30.

[129] Wang W, Cheung C. A Semantic-based Intellectual Property Management System (SIPMS) for supporting patent analysis[J]. Engineering Applications of Artificial Intelligence, 2011, 24(8): 1510-1520.

[130] Wang Y. Formal cognitive models of data, information, knowledge, and intelligence[J]. WSEAS Transactions on Computers, 2015, 14(3): 770-781.

[131] Wang Z, Li J, Tang J. Boosting cross-lingual knowledge linking via concept annotation[C]//Twenty-Third International Joint Conference on Artificial Intelligence. 2013.

[132] Wang Z, Zhang J, Feng J, et al. Knowledge graph embedding by translating on hyperplanes[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2014, 28(1).

[133] Wognin R, Henri F, Marino O. Data, information, knowledge, wisdom: A revised model for agents-based knowledge management systems[M]//The Next Generation of Distance Education. Springer, Boston, MA, 2012: 181-189.

[134] Wu J, Chang P, Tsao C, et al. A patent quality analysis and classification system using self-organizing maps with support vector machine[J]. Applied soft computing, 2016, 41: 305-316.

[135] Xiao H, Huang M, Hao Y, et al. TransG: A generative mixture model for knowledge graph embedding[J]. arXiv preprint arXiv:1509.05488, 2015.

[136] Yoon J, Lim S. Potential trade distortion effects of state trading enterprises under the tariff-rate quota scheme[J]. Economics: The Open-Access, Open-Assessment E-Journal, 2013, 7(2013-31): 1-19.

[137] Yoon J, Kim K. TrendPerceptor: A property–function based technology intelligence system for identifying technology trends from patents[J]. Expert Systems with Applications, 2012, 39(3): 2927-2938.

[138] Yusof W, Zakaria O, Zainol Z, et al. DIKW application on knowledge based framework with situational awareness[J]. International Journal of Academic Research in Business and Social Sciences, 2018, 8(6): 1110-1120.

[139] Zeleny M. Human systems management: Integrating knowledge, management and systems[M]. World Scientific, 2005.

[140] Zeleny M. Management support systems: towards integrated knowledge management[J]. Human systems management, 1987, 7(1): 59-70.

[141] Zhang A. Discovering the Knowledge Monopoly of Law Librarianship Under the DIKW Pyramid[J]. Law Libr. J., 2016, 108: 599.

[142] Zhang L, Zhang X, Wang X, et al. Application research of robust LS-SVM regression model in forecasting patent application counts[J]. Journal of Beijing Institute of Technology, 2009, 4.

[143] Zins C. Conceptual approaches for defining data, information, and knowledge[J]. Journal of the American society for information science and technology, 2007, 58(4): 479-493.


/表目录

图目录

1  DIKW层次结构

2  据元模型

3  信息元模型

4  知识元模型

5  智慧元模型

6  DIKW元模型

7  DIKW图谱架构

8  TransE模型

9  TRIZ理论体系结构

10  专利申请及审查流程

11  申请书数据图谱

12  补正书数据图谱

13  意见陈述书数据图谱

14  实质审查请求书数据图谱

15  专利申请书数据图谱可视化效果图

16  意图驱动的竞争及合作的智能填充流程图

17  图提示算法流程图

18  选项填充流程图

19  冗余信息填充算法流程图

20  表格提交流程图

21  基于DIKW图谱的多模态语义结构图

22  数据图谱、信息图谱和知识图谱的关联关系示意图

23  基于DIKW图谱的多模态语义建模流程图

24  内容传输路径方案示意图

25  不同传输路径下内容重构方案示意图

26  基于DIKW图谱的交互区域划分及传输优化

27  递内容子图所属类型块的六种情况示意图

28  基于DIKW图谱的内容重构算法流程图

29  向冗错的仿区块链节点和节点网络的内容语义价值计算框架图

30  不同维度下节点的价值分布示意图

31  知识图谱层面的语义价值计算与图形学中的二维布尔运算的对照示意图

32  存在两个中心节点的节点网络示意图

33  搜索载体优化流程图

34  具有正负趋势资源的渐进搜索结果

35  使用正负双向策略将搜索构建为服务的流程图

36  户用例图

37  系统总体结构图

38  系统总体功能设计图

39  申请人接入界面

40  标文档编辑界面

41  专利通知书下载界面

42  DIKW图谱搭建框架图

43  数据库表的逻辑结构

44  专利修改展示界面

45  系统首页功能界面

46  精确搜索界面

47  DIKW图谱技术和TRIZ理论体系关联图

48  专利技术发明点预测设置界面

49  专利技术发明点预测结果界面(以多功能雨伞为例)

 


表目录

1  40项发明创造原理(部分)

2  48个通用工程参数(部分)

3  符号说明

4  交互区域划分说明表

5  语义价值计算实现方法

6  资源类型的渐进形式

7  资源分层搜索效率

8  能需求描述

9  文本表的属性设计表

10  分词词性表的属性设计表

11  实体关系表的属性设计表

12  系统的功能测试表

13  系统的非功能测试表

 


攻读硕士学位期间取得的学术成果

科研项目

1. 赛尔网络下一代互联网技术创新项目:面向智慧校园Ipv6的安全态势感知与自动报警系统,项目编号:NGII20180607

 

发表论文:

1. Formalizing DIKW Architecture for Modeling Security and Privacy as Typed Resources

2. Inter-Edge and Cloud conversion accelerated user-generated content for virtual brand community

3. A Distributed Privacy Preservation Approach for Big Data in Public Health Emergencies Using Smart Contract and SGX

 

授权发明专利

1. 价值驱动的类型化数据及其图表示的资源隐藏方法(授权号:ZL 2018 1 1169042. 2

2. 面向群体的空间展示组合优化方法(授权号:ZL 2018 1 1538696. 8

3. 融合公平度、体验感和价格的用户满意度建模与展示空间调整方法(授权号:ZL 2018 1 1538692. X

4. 可定义隐私模糊度的多维度体系化交互方法(授权号:ZL 2019 1 1124039. 3

5. 多维度价值导向的针对意图的面向对象数值计算方法(授权号:ZL 2019 1 1251907. 4

6. 基于数据图谱、信息图谱、知识图谱的交互区域划分及传输优化处理方法(授权号:ZL  2019 1 0742770. 6

7. 意图驱动的适应竞争及合作意向的内容填充系统(授权号:ZL 2019 1 0956787. 1

8. 场景、事件、人物与意图匹配的智能提醒方法(授权号:ZL 2019 1 1277319. 8

9. 基于数据图谱、信息图谱和知识图谱的内容传输建模及处理优化方法(授权号:ZL  2019 1 0736935. 9

10. 价值驱动的面向目的融合的优化系统(授权号:ZL 2020 1 0029053. 1

11. 价值驱动的多因素维度空间多介尺度融合的动态推荐系统(授权号:ZL 2020 1 0032685. 3

 

软件著作权

1. 多目标多维度融合的目的驱动的智能填表系统(登记号:2020SR1235008

2. 多维度多模态多尺度综合态势感知与报警系统(登记号:2020SR1252000

3. 多维度多模态形态行为可视化的口语学习与矫正系统(登记号:2020SR1255693

4. 多维多模态可扩展账户口令系统(登记号:2020SR1237936

5. 多维多模态内容驱动的颜色和形状融合的情感通讯系统(登记号:2020SR1237934

6. 多维多模态虚拟账户定制系统(登记号:2020SR1236438

7. 情感导向的多维度个性化区域推荐系统(登记号:2020SR1237912

 

大赛获奖:

1. 2018年度 首届中国AI+创新创业大赛三等奖最佳创新奖

2. 2019年度 中国高校计算机大赛-人工智能创意赛海南赛区三等奖

3. 2020年度 中国创新方法大赛海南省赛区一等奖

4. 2020年度 中国创新方法大赛决赛优胜奖

 

科研获奖:

1. 2020年度 吴文俊人工智能技术发明奖三等奖

21年5月




https://m.sciencenet.cn/blog-3429562-1369249.html

上一篇:基于DIKWP的校园安全态势感知与自动报警系统设计与实现(指导的2020年5月硕士毕业论文)
下一篇:面向DIKW的跨模态内容建模研究和处理实践(指导的2022年5月硕士毕业论文旧版)

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-1 23:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部