章成志 分享 http://blog.sciencenet.cn/u/timy 宠辱不惊闲看庭前花开花落,去留无意漫观天外云展云舒

博文

2010-NSFC重点项目指南—— 与NLP相关的部分

已有 4179 次阅读 2009-12-17 13:06 |个人分类:科学评论|系统分类:观点评述|关键词:学者| 自然语言处理, 多语言信息处理, 机器翻译

资料来自小木虫:http://emuch.net/bbs/viewthread.php?tid=1735264&fpage=1

2010-NSFC重点项目指南中,和自然语言处理相关的有1个优先资助重点领域、2个科学处资助重点领域(可能和NLP有关系),列出如下:

:2009年度信息科学部发布50个重点项目领域和一个重点项目群,共收到重点项目申请154项,共有46个重点项目获得资助,资助经费共9 400万元,平均资助强度204万元/项。
2010年度信息科学部发布47个申请资助领域,其中科学部优先资助重点领域4个;拟资助48~55个重点项目,平均资助强度约250万元/项。)


科学部优先资助重点领域


1.多民族文档分析识别、机器翻译及应用研究(F010205,拟资助重点项目2~3项)
研究我国民族文字印刷及手写文档识别及机器翻译的理论和方法,探索基于语义本体的多语知识的获取、表达等理论方法及关键技术,旨在提高民族文字信息化处理水平与应用能力。研究内容可涉及蒙古文、藏文、维吾尔文等文字的识别、文档图像分析、机器翻译。


科学处资助重点领域

19.网络信息融合与知识服务的模型和方法(F0205)
30.基于云计算的海量数据挖掘(F0305)

博主注1:  上次在南京开第五届全国机器翻译研讨会时,最后有个讨论环节,当时有专家传达了一个信息是:国家对语言信息处理方面的投入已经很多了,可能今后不会再强化资助。但实际情况是,无论是理论还是技术,目前仍需要继续强化资助。看来,NLP专家们的努力没有白费。课题指南中(多民族文档分析识别、机器翻译及应用研究),研究课题更加贴近语言信息处理的“中文”化特色,包括蒙古文、藏文、维吾尔文等文字的识别、文档图像分析、机器翻译。语义本体方面,由于EU主导的Global WordNet已经涉及到50余种语言,但没有藏文、维吾尔等语言,而现在国家如果立项做蒙古文、藏文、维吾尔文在内的“中文”的语言学本体的话,显然对这些语言的信息化处理起到极大的推动作用。

博主注2:  拟重点资助的两个可能和NLP有关的项目(网络信息融合与知识服务的模型和方法、基于云计算的海量数据挖掘),这是因为网络环境下,大规模的多语言的文本资源的获取、加工、挖掘、服务等,是一个难以回避的问题,除非研究的是一个理论或者计算模型。当然,这要看研究者从哪个角度进行研究,比如研究Web挖掘或文本挖掘的,一般会考虑将NLP技术作为基础之一。



https://m.sciencenet.cn/blog-36782-279283.html

上一篇:做快餐也要做的专业
下一篇:Ontology【ZZ】

3 赵星 刘耀 李斌

发表评论 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2023-2-4 06:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部