重庆理工大学学报(自然科学) ›› 2024, Vol. 38 ›› Issue (12): 155-164.
李云红,郭 越,谢蓉蓉,张蕾涛,苏雪平,李丽敏,陈锦妮
摘要: 针对细粒度图像分类易受背景干扰、关键区域定位不准确以及模型参数量大的问题,提出了一种注意力机制和多尺度特征融合的分类网络(networksofcombineattentionmechanismsandmultiscalefeatures,AMNet)。首先,以 YOLOv7网络为基础,使用 GhostBottleNeck模块重新搭建轻量级主干网络,并使用 GhostConv替换颈部网络中的Conv,实现模型的轻量化。其次,引入无参的 SimAM注意力机制,通过考虑空间和通道维度的相关性推断特征图的三维注意力权重,表征局部显著特征,抑制无用特征,提高目标区域信息的有效性。最后,构建可特征选择的金字塔池化模块(fastspatialpyramidpoolingwithfeatureselectionandconvolutions,SPPFC),帮助网络模型更好地捕捉和处理目标的多尺度特征,提高模型的感知能力。通过实验可知,AMNet在 StanfordDogs数据集上的准确率、精确率、召回率和 F1分数分别达到 88.9%、83.6%、85.7%和 84.6%,模型参数量为 26.53MB,每秒帧率达到 89.3帧,在 StanfordCars数据集上的准确率、精确率和召回率分别达到 95.2%、93.7%和 94.9%。实验结果表明,AMNet可以在轻量化网络的同时提高细粒度图像的分类精度,相比于其他网络模型性能有较大提升。
中图分类号: