“数字人文”的产生、发展与前沿 原文发表在2009年教育部人文社会科学研究方法创新论坛论文集上,引用方式如下: 王晓光 . “数字人文”的产生、发展与前沿 . 方法创新与哲学社会科学发展,武汉:武汉大学出版社, 2010.11. 王晓光 * 摘 要: 信息技术在科学领域的广泛应用深刻改变了现代科学研究的面貌。数字人文正是在这样的背景下由计算机科学与传统人文科学交叉形成的边缘研究领域。通过文献调查与分析,本文对数字人文的概念、内容、发展历史、研究现状和前沿方向进行了综合介绍,并在此基础上对我国学者开展数字人文研究和创新人文社会科学研究方法提出了建议。 关键词:人文科学 数字人文 研究范式 研究方法 近年来,随着信息技术在社会科学研究领域的深入应用,科研模式与学术手段正在发生变革,教学方法和知识表现方式也得到不断创新和扩展。在e-science蓬勃发展的同时,一个新型的文理交叉研究领域——数字人文(Digital Humanities)逐渐产生,并得到了西方人文学界和计算机学界的越来越多的关注。 目前,欧美发达国家的很多大学内已经建立了跨学科的数字人文研究中心,国际上的数字人文研究联盟也已经出现,各种数字人文主题会议在全球频繁召开。相比之下,中国的人文社会学界对数字技术的应用十分不足,研究方法和教学手段也都较为陈旧。面对人文社会科学研究方法创新的需要,将国外数字人文研究的内容、方向和前沿集中介绍给国内的人文社会学者以加快我国人文学科研究范式的升级和转型已经显得十分必要。 1. 数字人文的概念与研究内容 1.1 数字人文的学科概念 数字人文,也称人文计算(Humanities Computing或Computing in the Humanities),它是一个将现代计算机和网络技术深入应用于传统的人文研究与教学的新型跨学科研究领域,它的产生与发展得益于数字技术的进步及其在科学领域的普及应用。上世纪60年代以来,在计算机媒介支撑下,人文知识的获取、分析、集成和展示都在发生重大变化。目前,已有海量的图书、报纸、期刊、照片、绘本、乐曲、视频等人文资料被数字化,并在Web上被提供给大众获取和使用。面对这种日益强化的数字化情景,人文学者急需相应的工具和平台对这些数字化人文资料进行组织、标引、检索和利用,以保证人文研究的持续性、一致性和高效性。数字人文研究的正是在这些数字媒介被应用于人文社科领域的过程,以及它们给人文科学和人文知识带来的变化和影响。 作为一个典型的文理交叉领域,数字人文研究项目和研究团队常常既包括传统人文领域(哲学、历史学、文学、语言学、艺术学、人类学等)的研究者,还包括精通计算机技术和多媒体技术的专家学者。在这两类人员的协作下,诸如数字仓储、文本挖掘、多媒体出版、数字图书馆、信息可视化、虚拟现实、地理信息系统等多种信息技术开始在人文领域得到深入应用。随着数字原生(born-digital)人文数据的增加,现代人文学科正在快速地向可计算化方向发展,在此过程诸如网络民族志、网络文化、虚拟社会等主题也在成为新的人文研究课题,进而不断改写数字人文自身的定义。 人文计算领域的先驱,意大利著名人文学者Roberto Busa认为人文计算化的最重要结果并不是加速传统人文研究的速度,而是给传统的人文研究提供新的研究方法和研究范式 。这一解释表明数字人文的产生在本质上属于一种方法论和研究范式上的创新,其目标是将现代信息技术融入于传统的人文研究与教学过程中,从而在根本上改变人文知识的获取、标注、比较、取样、阐释与表现方式 。 1.2 数字人文的研究内容 为了明确数字人文研究的路线和研究内容,国际文学与语言学计算联合会(Association for Literary and Linguistic Computing)主席Antonio Zampolli教授曾于2001年4月召集多个学科的研究者开展了一次综合性的人文计算研讨会,随后发布了Pisa报告。在此报告中,David Robey教授绘制并发表了一副有关“人文计算”的全景知识地图,如图1所示。 来源:http://www.allc.org/ 图1 人文计算的全景知识地图 数字人文领域的知名学者、伦敦国王学院的Willard McCarty教授及其同事Harold Short对该图进行了深入阐释,他们认为图中央区域指的是数字人文研究的方法论共同基础,它们是数字人文的核心,包括各种可计算的基础数据对象,如自由文本、格式化数据、图像、声音等。针对这些数据而进行的计算活动包括文本分析、数据库设计、数字绘图、音乐检索等。 数字人文的方法论基础并不稳定,它们随着信息技术的发展而不断变化和扩展,这其中最关键的技术是现代通讯技术、超媒体和数字图书馆等基础性研究平台。图中上部分的方块代表的是各种科学共同体,如文学与语言学研究共同体、历史研究共同体、哲学研究共同体等。双向箭头代表不同的科学共同体与不同的数据类型和计算方法之间的对应关系,这种对应关系也并非固定的,它们随着研究条件和信息技术的发展而不断变化。图中下半部分的云朵表示不同的学科及其子学科使用的具体方法 。 这幅知识地图不仅解构了数字人文研究的学科定位和学科框架,还指明了数字人文研究的核心在于通过将研究对象数字化来支撑、保障和创新人文科学研究的内容、方法和模式,其未来发展方向是在数字环境下系统化探索新的人文研究方法论基础,以保障人文研究的可持续化。 2 .数字人文的发展沿革 Digital Humanities 作为一个学科名称和专业术语,是从 Humanities Computing 发展而来的。早期的人文计算发端于文学和语言学领域。从 Roberto Busa 对语言计算的初步探索算起,人文计算的发展已有近 50 年的历史。文学与语言学计算协会( The Association of Literary and Linguistic Computing )和《文学与语言学计算》( Literary and Linguistic Computing )期刊分别于 1973 年和 1986 年建立和首次发行。此后,人文计算研究的队伍日益壮大,研究对象的形式也从电子文本逐渐扩展到多媒体。 20 世纪 90 年代初期,人文计算作为一个独立的交叉学科逐渐成形。 1999 年, McCarty 讨论了人文计算作为一个独立的学科与其它学科的关系 ,以及如何在制度和学术层面来为人文计算活动提供切实的保障和支撑。 90 年代后期,人文学者开始越来越频繁和深入地使用各种新型的数字技术处理人文资料,并进行人文知识生产,如创作电子文本、扫描古籍图书和绘本、使用虚拟技术复原古建筑模型和历史上的都市、开发和建设各种在线的声视频数据库等。人文知识的可计算性快速从文学和语言学领域向历史、音乐、艺术学等多个领域扩展。在这一进程中,数字原生数据越来越多,如数字地图、计算机图像、在线网页、虚拟人物等,它们的产生极大地丰富了人文研究的对象,同时也对人文计算的定义产生了深刻影响。 互联网的快速普及也给人文研究带来重大变革。互联网不仅改变了人类社会的生存环境,也促使人文研究的基础从印刷文本向超文本全面转型,各种用于人文知识共享的学科门户纷纷建立,由此导致人文知识的创作、传播和共享都呈现出网络化趋势。在此过程中,很多人文学者开始使用含义更为丰富的“数字人文”这个学术术语代替范围较为狭窄的“人文计算”,以突现其学科范围的扩展和研究活动的数字化烙印 。 目前,无论是从研究项目的主题、学术机构的名称,还是已发表论文的题目来看,数字人文研究的学术共同体已经相当清晰 , 。各种数字人文研究学会和专门的研究中心遍布全球,很多数字人文研究项目和研究成果也已经获得政府和学界的资助与关注。人文计算领域影响力最大的文学与语言学计算协会、人文领域计算机应用联合会( The Association for Computers in the Humanities )和数字人文学会( The Society for Digital Humanities / Société pour l'étude des médias interactifs )还联合组成了国际上最大的数字人文联盟组织——国际数字人文组织联盟( The Alliance of Digital Humanities Organizations )。目前,该联盟拥有四本同行评审期刊,向全球传播数字人文研究的理念、方法和成果。这四本期刊分别是牛津大学出版的《 Literary and Linguistic Computing 》期刊、加拿大麦克马斯特大学出版的《 Text Technology 》电子期刊、在线预出版物《 Computers in the Humanities Working Papers 》以及该联盟自身的专业电子刊物《 Digital Humanities Quarterly 》。该联盟每年召开一次数字人文年度大会,最近一次会议在美国马里兰大学召开,来自全球各国的近 300 名数字人文研究者集中展示了各自的研究成果和研究进展。 3 国际数字人文研究现状 3.1 整体情况 目前,全球范围内的数字人文研究中心不下20家,主要集中在欧美日等发达国家,其中较为知名的研究中心包括:伦敦国王学院的人文计算研究中心、美国斯坦福大学的计算机辅助人文研究中心和斯坦福人文实验室、麻省理工学院的Hyper studio、南加利福尼亚大学的数字人文研究中心、马里兰大学的人文技术研究机构、伊利诺伊大学的科学与学术情报研究中心、日本立命馆大学的京都数字文艺研究中心等。数字人文研究项目也已经在文学、历史学、艺术等多个领域得到展开,知名的项目包括:JSTOR Data For Research、Google Book Search、 Perseus Project、Crowds、The MONK project、Zotero、Text Analysis Portal for Research、ANDS、中国哲学书电子化计划等等。由于数字人文项目不仅涉及传统的人文领域,还涉及数字图书馆和数字博物馆建设,所以这些项目不仅受到像美国国家人文基金会(NEH)、日本科学技术振兴机构(JST)、德国研究基金会(DFG)、英国信息系统联合委员会(JISC)、加拿大人文社会科学联合会、澳大利亚联邦政府创新、产业、科学与研究部(DIISR)等国家级的科研基金会和科研管理机构的资助,还受到了包括梅隆基金会(Mellon Foundation)、麦克阿瑟基金会(MacArthur Foundation)、国际图书馆联合会(IFLA)、图书与信息资源委员会、美国博物馆和图书馆学会等众多公共基金会和专门的图书馆联盟和文化遗产保护机构的资助。 3.2 美国的情况 美国的数字人文研究较为领先,研究团队众多,研究项目也十分丰富。美国国家人文基金会( NEH )认为数字技术在改变人文学科方面有着巨大的潜力,同时也会改变人文学科的知识、教学以及规划和设计。 2006 年该基金会专门设置了数字人文办公室用于推动数字人文实践项目的发展。 2007 年 2 月,该基金会资助布鲁克林大学考古研究中心,探寻使用数字激光扫描和三维定量制作古美索不达米亚楔形文字板的数字模板的可行性。这些数字模板可以让学者们连接零碎的文字碎片,以此推断这些碎片是否出于同一篇文章,从而使大量地复制楔形文字成为可能,这将更有助于学术研究和展览。 2008 年资助佛罗里达州的一所大学,利用多媒体和地球空间信息技术,以数字化方式重建重现 1964-1965 年的纽约世界博览会,使游客们在真实的博览会场景中获取档案文件、图片和电影镜头。目前,该基金会正在资助德克萨斯州的农业机械大学,利用高动态图像技术,促进建筑遗迹的档案整理工作。此外还有一个旨在推动 16 世纪文艺复兴时期音乐的研究和学术交流的开放源码数据库和合作数字论坛。 2009 年初,美国国家人文基金会将数字人文办公室升级成了一个永久性机构,展示了基金会对数字人文的重视。 3.3 欧洲的情况 欧洲的数字人文研究起步较早。欧洲科学基金会人文常务委员会(ESF/SCH)对数字人文也给与了高度关注,并联合IEEE举办了多次e-humanities会议。欧盟数字图书馆也于2008年11月在布鲁塞尔正式启动,该图书馆门户网站包括各种书籍、音乐、绘画、照片和电影等各种信息和数字资料,该图书馆的启动为欧洲的数字人文研究提供了极大的便利。欧盟资助的专门的数字人文项目包括公共语言与技术基础平台项目(CLARIN)和DARIAN项目。在欧盟众多国家中,英国的数字人文研究走在了前列。英国信息系统联合委员会(JISC)已经资助了多个数字人文项目,例如人文万维网项目(World Wide Web of Humanities),其目标就是利用开源软件采集互联网档案为英国的数字人文研究建立一个框架和数据集合;TextVRE项目则是为数字人文研究中文本分析提供全生命周期的服务,以帮助人文学者处理和分析研究数据。在大学方面,英国的伦敦国王学院和曼彻斯特大学的数字人文研究在全球处于领先地位。此外,法国、德国、意大利、西班牙等国的人文学者也都已经开始了数字人文研究与实践。 3.4 日本的情况 日本政府近年来致力于尖端科学研究,借助于COE和21GCOE两个项目,日本政府在多家大学择优支持建立了多个全球领先的科研机构,这其中就包括日本立命馆大学的京都数字文艺研究中心。该中心致力于京都文艺的数字人文研究,借助于GIS、视频扑捉、虚拟现实、3D建模、网络数据库和Web2.0等多种技术创新日本和京都的历史与文艺研究、教育和传播方法与途径。该中心每年接受的资助经费超过2亿日元。中心与日本任天堂游戏公司的游戏研发中心合作紧密,研究成果直接推动了日本文化在电子游戏中的展示,由此极大地促进了日本传统文化和文艺的延续、发展和全球化传播。在2009年3月,该中心召开了一次数字人文国际研讨会,与全球多国的数字人文学者开展了学术交流和对话。目前,该中心正在成为全球数字人文研究的重镇。 3.5 港台的情况 由于港台人文学者与西方人文学界的合作较为紧密,交流较为频繁,所以港台的数字人文研究发展步伐也较快。在GIS技术与历史学交叉研究方面, 台湾中央研究院开发了中国历史文化地图系统 (CCTS) 和台湾历史文化地图系统 (THCTS) ,这两套系统已经在台湾历史学界产生广泛影响。近两年来,台湾人文学界对数字人文的研究热情逐渐高涨。 2007年6月,台湾中正大学人文研究中心协同台湾中央研究院人文中心GIS专题组和中正大学历史学系举办了地理资讯系统与人文研究研讨会。2009年1月,国立政治大学文学院身体与文明研究中心、历史学系和地政学系联合召开了2009人文地理资讯系统研讨会。此外,国立台湾大学数位典藏研究发展中心,也将于2009年12月召开数位典藏与数位人文国际研讨会。此次研讨会的中心议题包括:艺术、文学、音乐、历史方面的计算机应用研究、数字典藏和数字语料库建设、人文领域的电子数据获取与分析、文本挖掘、可视化与图形化的应用、存档与图书馆领域的IT应用、数字档案的文化影响、GIS等。这些主题基本上涵盖了当前数字人文研究的所有前沿领域。 香港的数字人文研究刚刚开始起步。2009年3月,香港中文大学太空与地理信息科学研究所联合北京大学历史地理研究中心、台湾大学地理环境资源学系联合召开了“空间综合人文学与社会科学论坛”,研讨了地理信息、地理信息系统、空间分析方法、空间模拟方法在历史学、经济学、政治学、考古学、人类学、社会学、人口学、犯罪学、城市学、语言学、景观学、旅游学、宗教文化、文化遗产、新闻学等人文社会科学领域的应用问题。2009年5月,香港城市大学中文、翻译与语言系召开了首届亚洲数字人文小型研讨会,主题为“全球科技与地方知识”。这两个会议彰显出香港的人文学者正在紧跟数字人文的发展。 3.6 大陆的情况 与西方的人文研究相比,大陆的人文学者对计算机技术的应用研究并不算落后。目前,大陆的人文计算研究主要集中在GIS与历史学交叉领域,如复旦大学历史地理研究中心与美国哈佛大学东亚系、哈佛燕京学社、澳大利亚格林菲斯大学亚洲空间数据中心、数字化文化地图集行动计划( ECAI) 等机构从2001年开始合作,共同建立了一套中国人口地理信息系统。此外,武汉大学的历史学院与武汉大学国家遥感工程重点实验室开展了密切合作,南京师范大学在华夏家谱GIS平台构建方面进行了尝试,而中国社会科学院与北京超图软件股份有限公司也于2009年3月联合开发成功了《中国社会科学综合地理信息服务平台系统》。 在古代文学研究方面,北京大学中文系开发了全唐诗电子检索系统,该系统能智能化的分析古代诗词的韵律信息。开始于2004的中国国家数字图书馆工程也已经建设了包括馆藏甲骨实物与拓片数字化资源库、敦煌遗珍数字化资源库、民国图书数字化资源库、馆藏年画数字化资源库等多个数字人文资料数据库,这些数据库的建设为我国数字人文研究与教学奠定了良好的基础,但目前大陆的人文学者对数字人文学科的发展关注不够,由此导致众多人文与计算机跨科研究仍处于一个自为状态,缺乏数字人文理论的有效支撑和指导,由此限制了人文计算的可持续发展,更不利于传统人文的突破创新和研究范式的革命性升级。 4 数字人文的实践前沿 数字人文是一个正在快速发展中的文理交叉学科,其研究内容和研究边界随着数字技术的发展和深入而不断被改写。从目前国际数字人文研究趋势来看,以下六个方面是数字人文实践前沿。 4.1 历史学方面的基于GIS 的历史地理可视化。 在历史学研究方面,越来越多的学者开始借助GIS技术进行历史知识和历史事件的静态和动态的可视化展示研究。哈佛大学的地理分析研究中心与中国合作者共同完成了中国历史地理信息系统。美国加州大学圣达巴巴拉分校的空间综合社会科学研究中心(CSISS)和英国伦敦大学学院(UCL)的高级空间分析中心(CASA)都集聚了GIS、地理学、经济学、物理学、计算机科学等多学科的专家,集中研究社会经济系统在时空演变中的客观规律以及相应的政策与规划手段。北京的“虚拟故宫”和日本立命馆大学 矢野桂司教授开发的 “虚拟京都”也都吸引了大众的眼球。最近美国德克萨斯州立大学的芦咏梅还利用GIS技术研究了毒品犯罪在城市建成区的空间分布。总的来看,目前GIS技术在历史领域的应用可以总结为三个方面:展示历史地图资料的数字化、空间历史数据的管理和可视化和基于空间分析方法探知历史过程 。 4.2 文学方面的文本挖掘与TEI 标准 随着数字出版浪潮的兴起,越来越多的文学出版物被制作成电子文本,这为文本挖掘提供了便利。在1981年首届国际《红楼梦》研讨会上,美国威斯康大学的陈炳藻发表了《从词汇上的统计论红楼梦作者的问题》一文,他首次借助计算机进行了《红楼梦》研究,轰动了国际红学界。陈炳藻从字、词出现频率入手,通过计算机进行统计、处理、分析,对《红楼梦》后40回系高鹗所作这一流行看法提出异议,认为一百二十回均系曹雪芹所作。这一研究体现出字词统计分析已经成为一种特殊文学研究方法,特别是在作者鉴别和文学风格和文学流派分析上已经显示出其强大威力。 为了提高电子文本的规范化和标准化程度,计算机与人文联合会(Association for Computers and the Humanities),计算语言学联合会(the Association for Computational Linguistics)与文学与语言学计算联合会于1987年成立了文本编码组(Text Encoding Initiative,TEI),并随后发布了多个文本编码标准。这些标准主要面向于人文社会科学研究,其目的是便于机器编码和识别,提高数字文本的传播、分析和教学效率。目前,TEI主要由英国牛津大学、美国布朗大学、美国维吉尼亚大学等机构资助,其标准已经得到数字人文学者广泛支持。这些标准的实施为人文社科领域的文本挖掘提供了极大的便利。 4.3 语言学方面的基于大型语料库的语料库语言学 计算语言学是通过建立形式化的数学模型来分析和处理自然语言,并在计算机上用程序来实现分析和处理的过程,从而达到以机器来模拟人的部分乃至全部语言能力的目的的一门学科。1990年8月,在赫尔辛基召开的第13届国际计算语言学大会上,大会组织者首次提出了处理大规模真实文本的战略目标,并在会前组织了“大型语料库在建造自然语言系统中的作用”、“词典知识的获取与表示”和“电子词典”等专题讲座,预告了语言信息处理的一个新的历史阶段即将到来。近年来,计算语言学者在语料库的建立和开发中逐渐创造了一些独特的方法,提出了一些初步的原则,并且对这些方法和原则在理论上进行了探讨和总结,逐渐形成了“语料库语言学”(corpus linguistics),这是语言学和计算机科学交叉形成的一门边缘学科,它主要研究机器可读自然语言文本的采集、存储、检索、统计、自动切分、词性标注、语义标注,并研究具有上述功能的语料库在词典编纂、语言教学、语言定量分析、词汇研究、词语搭配研究、语法研究、多语言跨文化研究、法律语言研究、作品风格分析等领域中的应用。 我国的计算语言学和语料库语言学发展较为迅速,目前已有的计算语言学和语料库语言学专门研究机构包括北京大学计算语言学研究所、台湾中央研究院语言学研究所、中国教育部语言文字信息管理司牵头成立的“国家语言资源监测与研究中心”等,这些研究机构都已经建立了面向各个领域的大型语言语料库,从根本上改变了传统语言学研究的范式。 4.4 舞蹈方面的视频扑捉、运动分析与虚拟现实再现 利用计算机视频扑捉和运动分析技术进行人体运动轨迹的建模是一个十分前沿的研究方向。该技术可以构建人体运动模型,进而为制作虚拟人物提供数据基础。目前该技术已经被广泛应用与电影制作以及虚拟场景和虚拟人物制作。由此技术构建的虚拟人物可以达到与真实人物几乎一模一样的运动姿态,这为传统舞蹈在虚拟现实场景中的再现提供了便利。日本立命馆大学影像学部的研究员已经利用该技术在Second Life(网络3D游戏)中建立了一个虚拟的剧场表演日本传统舞蹈,这种舞蹈可以称为“数字舞蹈”,它在游戏开发和网络文化传播方面拥有巨大的发展空间。 目前,我国的人文社会学界还没有利用该技术展开相关的学术研究。国内该项技术的专门研究机构也较少,较为知名的虚拟现实实验室包括中国科学院计算技术研究所虚拟现实技术实验室、武汉大学虚拟现实实验室、北京航空航天大学虚拟现实技术与系统国家重点实验室等,这些实验室主要从事虚拟场景和虚拟建筑方面的研究,较少从事人体运动和虚拟人物研究,所以在这一方面我国基本上还处于空白阶段。 4.5 考古学方面的图像分析、色彩还原和数字重建 计算机技术在考古学方面的应用已经不再陌生,除了利用数码扫描仪对古籍和文物进行2维或3维扫描之外,考古学者还利用计算机进行了3维虚拟遗址绘图、文物虚拟复原、色彩还原、古代语言分析等工作。例如,在甲骨文研究方面,利用甲骨文信息管理系统,研究者可以将甲骨文词汇类聚,研究者可以根据断代、祭祀、军事、战争、职官、尤其是地名,调阅有关资料,这给甲骨文学术研究带来很大的方便,是学者 繁琐的资料查阅工作中解放出来 ,极大地提高了研究的效率。 计算机技术除了在研究方面拥有巨大作用外,在考古教学和宣传方面也大有用处。虚拟的遗址场景可以给学生或普通大众带来身临其境的感觉,进而提高了考古学的吸引力。总的来看,计算机技术已经并且正在深刻改变着考古学的传统面貌。 4.6 数字图书馆和网络数据库 为了提高人文社科领域的知识共享水平,越来越多的图书馆、博物馆、文化机构以及大学科研机构开始进行人文资料的数字化和网络化,大量的人文主题网站、专题数据库被建立和向大众公开。它们不仅丰富了数字图书馆的内容,也加快了人文学者间的知识共享以及人文知识的大众化普及。支撑数字人文研究是数字图书馆建设重要的目标之一。在这种应用驱动下,人文知识的网络数据库正在健康有序发展。 5. 总结与建议 随着e-science的深化,计算机技术对人文社会科学研究的影响越来越大。人文社会学者与计算机学者的跨界合作研究已经成为一种流行趋势。从欧美发达国家的数字人文发展历史来看,数字人文学科的建设必须关注三个方面:①建设和开发一批人文数据库和基础性应用软件;②发展一般性的研究方法来理解和分析新的数据集合;③开展新的学术研究,创新人文社会科学的研究方法和研究范式。 随着我国各种科学研究保障平台的完善,数字人文学科的发展条件已经具备。为了加快我国人文社会科学研究方法创新,学术界和教育科研管理部门还需创新教学培养和科研管理机制,从以下四个方面着手推动数字人文研究、教学与实践的发展。 (1)设立专门的数字人文跨学科研究中心。鼓励各高校跨院系成立以传统人文学科为核心的数字人文研究中心,实现文理学科之间的优势互补和资源交叉,同时创新人员管理机制,便于跨学科研究和资源分配。 (2)加大对数字人文研究项目的资助力度,重点研发和建设一批数字人文研究基础软件,以改善我国数字人文研究的基础条件平台,方便个人和团队开展数字人文研究和知识共享。 (3)通过联合培训、短期培训班和暑期学校(Summer School)提高人文社会学者的信息素养和计算机应用水平。修订人文类学科的学生培养方案,增加计算机通识教育,使学生了解更多的信息技术,知晓如何进行数字文化资产的生产、存档、管理、交付和长期保存。 (4)鼓励我国的人文学者积极参加国际上的数字人文专题会议和组织联盟,争取与国外的人文学者共同开展数字人文项目,共同推进我国人文研究的进步。 * 原文发表在2009年教育部人文社会科学研究方法创新论坛论文集上 Busa, Roberto. ‘The Annals of Humanities Computing: The Index Thomisticus’, in Computers and the Humanities, 1980, 14: 83-90. Schreibman Susan, Siemens Ray, and Unsworth John eds. A Companion To Digital Humanities, Blackwell Publishing, 2004. http://www.allc.org/content/pubs/map.html McCarty, Willard. Humanities computing as interdiscipline. Is Humanities Computing an Academic Discipline? Paper delivered at IATH, University of Virginia. 5 November 1999. Wang Xiaoguang, Mitsuyuki Inaba. Co-word Analysis of Research Topics in Digital Humanities. In Proceedings of the International Conference of Digital Humanities 2009 (PP: 148-150), USA: 2009.6 Warwick, Claire. No Such Thing as Humanities Computing? An analytical history of digital resource creation and computing in the humanities. Paper presented at ALLC/ACH 2004, Gothenburg. 2004 Schreibman, S., R. Siemens, and J. Unsworth, eds. A Companion to Digital Humanities: Blackwell Publishing, 2004. 李凡. GIS在历史、文化地理学研究中的应用及展望. 地理与地理信息科学, 2008, 24(1). http://www.lingviko.net/feng/clcl.pdf
在第二届中美计算机科学峰会(博主注: 2008年7月底)上,伊立诺伊大学阿贝纳香槟分校的马克斯厄尔(Marc Snir) 教授作了题为Computer Information Science Engineering - What's All This? 的主题报告,引发了大家对于当前计算机与信息科学学科的发展道路的研讨。马克斯尼尔教授站在学科的工程一科学职业布局角度,给出了计算机与信息科学及工程学科的分布(如图1所示) ,并特别强调随着信息学与其他学科的交叉形成了许多新的信息学领域X-Informatics。(博主注: 转载于 徐晓飞: 美国大学计算机与信息科学的跨学科发展,中国计算机学会通讯,2009年第2期,下载地址: http://www.ccf.org.cn/web/resource/cccf/200902/0902-4.pdf ) 博主注:以下 转载 国立情報学研究所(NII)的关于交叉学科X-informatics的文字和图片。(地址: http://agora.ex.nii.ac.jp/~kitamoto/research/X-informatics/index.html.en ) 1. Summary These days, we often heard about X-informatics, or the name of the research fields with the suffix informatics, among which the most notable one is bioinformatics. These fields share the same traits: they all aim at acquiring new viewpoints and models by applying informatics-based approaches to existing fields such as biology. They also share the same methodology: the generation of huge amount of data with the help of advanced sensor and observation technologies, and the fast search and knowledge discovery from large-scale databases. 2. X-informatics These days, we often heard about X-informatics, or the name of the research fields with the suffix informatics, among which the most notable one is bioinformatics. These fields share the same traits: they all aim at acquiring new viewpoints and models by applying informatics-based approaches to existing fields such as biology. They also share the same methodology: the generation of huge amount of data with the help of advanced sensor and observation technologies, and the fast search and knowledge discovery from large-scale databases. In order for this approach to work effectively, we need to have as much data as possible, because the justification of this approach relies on the collection of fact that really occurred in the world. If we have more data, then we can draw more reliable conclusion. However, it does not mean that we simply should have more data; moreover, we need to have a data-collecting strategy for collecting many data with high quality, Another important research issue is the construction of database for managing huge amount of collected data. Bioinformatics may be the most advanced research area in terms of using huge-scale databases as the infrastructure of research. The public databases are collecting sequenced genome data from all over the world, and other researchers access to these databases to download interested data and use them for their own purposes. This kind of research style based on data will be more and more popular in other scientific disciplines. However, the utilization of computers in scientific disciplines is itself not at all new. Changes unique to recent movement can be described as From computational-X to X-informatics, or in other words, from simulation technology to database technology. We can compare those two approaches schematically as follow. X-informatics : Research on What is this? Computational-X : Research on How this will be? Then we can imagine the combination of approaches based on the research on What is this?, namely X-informatics (database technology), and develop the research on How this will be?, namely computational-X (simulation technology). This combination, in short, leads to a new scientific approach with the effective combination of observational facts and theoretical predictions. Moreover, if those large amount of data can be shared among many experts using Grid, for example, we many be able to establish a new scientific approach with the effective usage of networks. 3. Related Pages Meteoinformatics 4. References ( Complete List ) Asanobu KITAMOTO , Knowledge Discovery from Very Large Scientific Databases: Digital Typhoon Project as a Case Study, Monthly Seminar , National Institute of Informatics, 2002-09 Asanobu KITAMOTO , Mining and Searching for the Large-scale Collection of Typhoon Image Sequences, Proceedings of the 65th National Convention, IPSJ (Information Processing Society of Japan) Special Track, Vol. 5, pp. 255-258, 2003-03 (in Japanese) 5. Related Links National Center for Biotechnology Information A huge database of biological information. http://www.ncbi.nlm.nih.gov/ Sloan Digital Sky Survey The astoronomical survey project by the comprehensive observations of celestial objects.