信息学基础研究分享 http://blog.sciencenet.cn/u/geneculture 语言理解&知识表达

博文

2006-4-8字本位与中文信息处理zou.docx

已有 1541 次阅读 2018-4-5 14:37 |个人分类:语言学基础研究|系统分类:论文交流|关键词:学者| 2006-4-8, 字本位与中文信息处理, zou

 

字本位与中文信息处理

——解析“字与字组的关系”探索“汉语形式化”新路

(典型实例:由“一字精解”到“字字精解”)

邹晓辉

949309225@qq.com

清华科技园(珠海)融智文化基因工程研究所(筹)

【摘要】本文是笔者探索汉语及中文形式化信息处理新方法的总结。英语和基于英语的形式化方法及其好处学界周知,转换生成语法及其后续的各派理论的发展早已为计算机科学和计算语言学普遍接受或了解。模仿它们的汉语词本位、短语本位和句本位理论[w1] 违背了汉语的特点。因为“汉语中没有词”(赵元任)。“这种跟着西方人思路转的研究是无法实现赶超国际水平的目标的”(徐通锵)。英语形式化方法突破不了中文信息处理的技术瓶颈。如:词的“切分”与“标注”就面临“消歧”难题(俞士汶、孙茂松、黄河燕等)。本项研究课题“摆脱了流行思路的束缚,以字本位理论为基础研究中文信息处理的问题,探索形式化新路。这抓住了汉语特点的关键”(徐通锵),因为“字是中国人心目中的中心主题”(赵元任)。

【关键词】基础语言学,字本位,计算语言学,形式化,计算机辅助,中文信息处理

【专家评语】

这是一个前沿性的课题。现在语言信息处理的思路大多受国外语言理论的影响,而如何根据汉语的特点,运用信息科学的技术,进行中文信息处理,赶超国际水平,是我们急需探索和解决的一个重大课题。”(本文的)“方向正确,思路清楚,立论有据,是有原创性的新著,其形式化的研究成果也具有广泛的使用价值”。(语言学专家:徐通锵)

《字本位与中文信息处理的基础——解析“字与字组的关系”探索“汉语形式化”新路》是作者经过长期深入研究和在计算机上通过实践检验的重大科研成果。这个成果的理论意义和实用价值在于:根据汉语的实际特点,运用信息科学先进技术从事中文信息处理,赶超国际水平。”(计算语言学专家:鲁川)

“它较好地实现了与国际学术研究的接轨,因而处于国内同类课题研究的先进水平;作者倡导的融智学新范式和协同智能概念体系,不仅对于我国语言科学和信息科学及其相关学科的研究具有重要的学术探索价值,而且对于建立面向多文种语言信息处理的计算语言数据库和开发拥有自主知识产权的信息产品具有广泛的实际应用价值。”(机器翻译专家:易绵竹)

“语言的形成是一个十分复杂的过程,语言所表达的语义的解析更是一个复杂的问题。本书作者通过对中文语言文字的长期研究,积累了丰富的知识,提出了许多有见地的观点。本文提出了以字为中心,从字出发分析中文语义的一种新的方法。这些思想对于中文信息的自动化处理都提供了一种新的途径。”(计算机科学专家:奚建清)

“(本文)内容新颖,有较高学术水平,。消解歧义是自然语言处理的关键,本(文)提出的理论和方法,可以对于这个问题的解决提供新的思路。”(自然语言处理专家:冯志伟)

协同智能计算语言数据库的设计方案中的13张表很有新意。如果对于汉语的这13张表一旦建立了起来,那么汉语分析中的各个层次上的歧义就会比较容易地解决。这是一件有创建性的工作。”(清华大学智能技术与系统国家重点实验室专家:苑春法)


 [w1]实际上主要是基于这几种语言学理论的形式化方法就很难顾忌中文的特点就是基于字与字组的形式化方法,它们是两大类形式化


2006-4-8字本位与中文信息处理zou.docx (修订了邮箱并在首页加了一点标注及批注)




2006-4-8字本位与中文信息处理zou.docx




https://m.sciencenet.cn/blog-94143-1107553.html

上一篇:汉语理论探索百余年进程:文通称字为词-句-短语-字-言
下一篇:给中国语文现代化协同创新机身插上信息化和智能化的翅膀

0

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-23 11:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部