IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

一种基于深度学习的青铜器铭文识别方法

已有 823 次阅读 2024-1-26 16:43 |系统分类:博客资讯

引用本文

 

李文英, 曹斌, 曹春水, 黄永祯. 一种基于深度学习的青铜器铭文识别方法. 自动化学报, 2018, 44(11): 2023-2030. doi: 10.16383/j.aas.2018.c180152

LI Wen-Ying, CAO Bin, CAO Chun-Shui, HUANG Yong-Zhen. A Deep Learning Based Method for Bronze Inscription Recognition. ACTA AUTOMATICA SINICA, 2018, 44(11): 2023-2030. doi: 10.16383/j.aas.2018.c180152

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2018.c180152

 

关键词

 

模式识别,青铜器铭文,文字识别,深度学习,深度卷积神经网络 

 

摘要

 

考古出土的青铜器铭文是非常宝贵的文字材料,准确、快速地了解其释义和字形演变源流对考古学、历史学和语言学研究均有重要意义.青铜器铭文的辨识需要综合文字的形、音、义进行研究,其中第一步也是最重要的一步就是分析文字的形体特征.本文提出一种基于两阶段特征映射的神经网络模型来提取每个文字的形体特征,最后对比目前已知的文字研究成果,如《古文字类编》、《说文解字》,得出识别的结果.通过定性和定量的实验分析,我们发现本文提出的方法可达到较高的识别精度.特别地,在前10个预测类别中(Top-10)准确率达到了94.2%,大幅缩小了考古研究者的搜索推测空间,提高了青铜铭文识别的效率和准确性.

 

文章导读

 

青铜器是商周时代社会祭祀和战争的主要工具, 通过对青铜器的造型、工艺、纹饰、铭文等的研究, 可以深入了解古代社会的政治经济文化.其中, 铸有铭文的青铜器, 因其遗留了古文字材料, 更是古文字学、语言学、考古学及古代史研究的重要研究对象.目前保存的青铜器中, 铸有铭文的有上万件[1], 其中西周至春秋时期, 可供研究的古文字材料主要都是青铜器铭文, 可见青铜器铭文无论从其本身的古文字学意义, 还是其所著述的内容而言, 都具有极大的研究价值.释读古文字, 一般先识其形, 通其音, 然后识其义[2].古文字形体笔画复杂, 变化繁多, 且古文字是不统一的, 各地方各时代都有不同的写法, 想要释读古文字, 须得熟知古文字最初的形状, 如象形字、形声字、假借字, 以及指事、会意、转注等构字方法[3], 还须参证甲骨文、战国文字, 熟读《说文解字》等这种古文字字典, 难度很大, 有学者甚至将其归之为"绝学以内".简而言之, 释读青铜器铭文要求研究者具有广博的知识基础和训练, 是一项极具挑战的任务.

 

随着计算机技术特别是图像识别技术的高速发展, 以图像识别技术为基础, 结合古文字特别是甲骨文的研究基础, 进行古文字识别已成为可能.本文提出一种新的青铜器铭文识别研究方法, 应用图像识别技术来识别青铜器铭文, 以期望能更准确、更广泛地识别出青铜器铭文, 或得出铭文的最大相似度文字, 为进一步释读文字提供基础.其主要方法是:采集青铜器铭文文字图像, 同时也采集《古文字类编》[4]中甲骨文、金文以及《说文解字》中相同文字的图像, 提取出每个古文单字, 然后采用深度卷积神经网络(Convolutional neural network, CNN)提取图像特征来识别青铜器铭文, 得出识别的结果或者推荐结果.

 

本文的主要贡献有以下几个方面: 1)首次提出了一种基于CNN的青铜器铭文识别模型, 采用两阶段距离约束对应, 相应地设计了两阶段特征映射的神经网络模型来提取每个文字的形体特征, 最后对比目前已知的文字研究成果, 取得了令人满意的效果, 大幅缩小了考古研究者的搜索推测空间, 有效提高了考古过程青铜铭文识别的效率和准确性; 2)构建了首个数字化的青铜器铭文数据库, 包含77个古文字共2 102张图片.该数据库对采用深度学习模型进行青铜铭文识别的技术路线提供了一个很好的试验田, 也为将来采集更大规模数据库奠定了基础.

 

本文的组织架构如下:首先, 在第1节简单介绍了图像识别在古文字识别方面的研究现状; 然后, 在第2节分叙古文字库的搭建和铭文识别模型的设计; 并在第3节用定量和定性的实验分析了利用古文字偏旁分析法优化铭文识别的模型效果; 最后, 总结该方法可改进之处以及应用前景.

 1  ""字的各种演化变体(包括甲骨文、青铜器铭文、篆书等)

 2  单人旁的不同形态

 3  ""字的不同形态

 

本文提出了一种基于图像识别技术进行青铜铭文识别的方法, 是人工智能与青铜铭文考古的一次有意义的交叉学科研究.受古文字偏旁分析法所启发, 我们设计了基于两阶段特征映射的深度学习模型.该方法利用大量字例样本, 有效吸收消化古文字研究, 特别是甲骨文及青铜器铭文的研究成果, 准确、快速地识别未知古文字, 有效地提高古文字研究者的研究效率, 很好地辅助新发掘古文字的推断释读与解义.

 

我们认为, 基于深度学习的图像识别技术在古文字识别中具有重要应用价值.实验证明, 它能够有效地识别未知古文字, 并给出准确率很高的推测识别结果, 能够极大地提升古文字识别的准确性和识别效率.有效扩大古文字图片数据库, 进一步优化模型, 并结合考古学及古文字学的已有研究成果, 可以积极地应用于新出土的考古青铜器铭文识别, 推动现场考古研究的发展, 也可以帮助普通大众去识别了解陈列在博物馆的青铜器铭文释义, 甚至判别识别有争议的古文字或疑难字词, 帮助识别未知的古文字.在将来的工作中, 我们会考虑扩大数据库或者从深度学习小样本学习的角度来探索青铜铭文识别.

 

作者简介

 

李文英

华中科技大学控制科学与工程系硕士研究生.中国人民大学历史学院考古文博系硕士研究生.主要研究方向为基于模式识别方法的古文字识别, 基于计算机视觉的考古学研究.E-mail:freemin77@126.com

 

曹春水

中国科学技术大学自动化系与中国科学院自动化研究所模式识别国家重点实验室联合培养的博士研究生.主要研究方向是深度学习与计算机视觉.E-mail:ccs@mail.ustc.edu.cn

 

黄永祯  

中国科学院自动化所模式识别国家重点实验室副研究员.主要研究方向为模式识别, 计算机视觉.E-mail:yzhuang@nlpr.ia.ac.cn

 

曹斌  

中国人民大学历史学院考古文博系副教授.主要研究方向为商周考古、青铜器与金文研究.本文通信作者.E-mail:caobin@ruc.edu.cn



https://m.sciencenet.cn/blog-3291369-1419461.html

上一篇:图像拼接篡改的自动色温距离分类检验方法
下一篇:基于生成对抗网络的漫画草稿图简化

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-17 19:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部