河北大学学报(自然科学版) ›› 2021, Vol. 41 ›› Issue (5): 623-632.DOI: 10.3969/j.issn.1000-1565.2021.05.019

  • 收稿日期:2021-05-07 出版日期:2021-09-25 发布日期:2021-09-28
  • 作者简介:田学东(1963—),男,天津人,河北大学教授,博士生导师,主要从事信息检索、模式识别方向研究.
  • 基金资助:

Ancient Chinese character image retrieval based on space and channel attention fusion network

TIAN Xuedong1,2, YANG Qiong1,2, YANG Fang1,2   

  1. 1. School of Cyber Security and Computer, Hebei University, Baoding 071002, China; 2.Institute of Intelligent Image and Document Information Processing, Hebei University, Baoding 071002, China
  • Received:2021-05-07 Online:2021-09-25 Published:2021-09-28

摘要: 古籍汉字图像检索是古籍汉字研究的有效工具.然而,古籍汉字字形复杂、书写风格多变的特点导致传统文字图像检索技术在应用于古籍汉字图像时效果欠佳.针对现有方法在古籍汉字图像特征提取时存在的字形结构细节信息和低层视觉特征提取问题,设计了一种融合空间注意力和通道注意力网络高低层特征的古籍汉字图像检索模型.首先,融合空间注意力的低维特征和通道注意力的高维特征,捕捉古籍汉字空间结构间的依赖关系,提取更丰富的古籍汉字语义特征信息;其次,构建inception残差结构模块,丰富古籍汉字图像特征的感受野,使网络模型更易优化,保留足够的古籍汉字细节信息;最后,运用加权交叉熵损失函数,解决数据集中存在的正负样本不平衡问题,增强检索模型的鲁棒性.在上下、左右、包围和独体结构古籍汉字图像数据集上检索实验的MAP(mean average precision)值分别为77.89%、79.89%、78.21%、80.75%,表明了方法的有效性.

关键词: 古籍汉字, 图像检索, 空间注意力, 通道注意力, 加权交叉熵

Key words: ancient Chinese character, image retrieval, spatial attention, channel attention, weighted cross entropy
