重庆理工大学学报(自然科学) ›› 2024, Vol. 38 ›› Issue (12): 155-164.

• 智能技术 • 上一篇    下一篇

注意力机制和多尺度特征融合的细粒度图像分类

李云红,郭 越,谢蓉蓉,张蕾涛,苏雪平,李丽敏,陈锦妮   

  1. 1.西安工程大学 电子信息学院,西安 710048; 2.山西大学 生命科学学院,太原 030031
  • 出版日期:2025-01-23 发布日期:2025-01-23
  • 作者简介:李云红,女,博士,教授,主要从事人工智能、图像处理、信号与信息处理技术研究,Email:hitliyunhong@163.com。

  • Online:2025-01-23 Published:2025-01-23

摘要: 针对细粒度图像分类易受背景干扰、关键区域定位不准确以及模型参数量大的问题,提出了一种注意力机制和多尺度特征融合的分类网络(networksofcombineattentionmechanismsandmultiscalefeatures,AMNet)。首先,以 YOLOv7网络为基础,使用 GhostBottleNeck模块重新搭建轻量级主干网络,并使用 GhostConv替换颈部网络中的Conv,实现模型的轻量化。其次,引入无参的 SimAM注意力机制,通过考虑空间和通道维度的相关性推断特征图的三维注意力权重,表征局部显著特征,抑制无用特征,提高目标区域信息的有效性。最后,构建可特征选择的金字塔池化模块(fastspatialpyramidpoolingwithfeatureselectionandconvolutions,SPPFC),帮助网络模型更好地捕捉和处理目标的多尺度特征,提高模型的感知能力。通过实验可知,AMNet在 StanfordDogs数据集上的准确率、精确率、召回率和 F1分数分别达到 88.9%、83.6%、85.7%和 84.6%,模型参数量为 26.53MB,每秒帧率达到 89.3帧,在 StanfordCars数据集上的准确率、精确率和召回率分别达到 95.2%、93.7%和 94.9%。实验结果表明,AMNet可以在轻量化网络的同时提高细粒度图像的分类精度,相比于其他网络模型性能有较大提升。

关键词: 人工智能;细粒度分类;特征提取;注意力机制;多尺度特征融合

中图分类号: 

  • TP391.41