注意力机制和多尺度特征融合的细粒度图像分类

重庆理工大学学报（自然科学） ›› 2024, Vol. 38 ›› Issue (12): 155-164.

注意力机制和多尺度特征融合的细粒度图像分类

李云红，郭越，谢蓉蓉，张蕾涛，苏雪平，李丽敏，陈锦妮

１．西安工程大学电子信息学院，西安７１００４８；２．山西大学生命科学学院，太原０３００３１

出版日期:2025-01-23 发布日期:2025-01-23
作者简介:李云红，女，博士，教授，主要从事人工智能、图像处理、信号与信息处理技术研究，Ｅｍａｉｌ：ｈｉｔｌｉｙｕｎｈｏｎｇ＠１６３．ｃｏｍ。

Online:2025-01-23 Published:2025-01-23

摘要/Abstract

摘要： 针对细粒度图像分类易受背景干扰、关键区域定位不准确以及模型参数量大的问题，提出了一种注意力机制和多尺度特征融合的分类网络（ｎｅｔｗｏｒｋｓｏｆｃｏｍｂｉｎｅａｔｔｅｎｔｉｏｎｍｅｃｈａｎｉｓｍｓａｎｄｍｕｌｔｉｓｃａｌｅｆｅａｔｕｒｅｓ，ＡＭＮｅｔ）。首先，以ＹＯＬＯｖ７网络为基础，使用ＧｈｏｓｔＢｏｔｔｌｅＮｅｃｋ模块重新搭建轻量级主干网络，并使用ＧｈｏｓｔＣｏｎｖ替换颈部网络中的Ｃｏｎｖ，实现模型的轻量化。其次，引入无参的ＳｉｍＡＭ注意力机制，通过考虑空间和通道维度的相关性推断特征图的三维注意力权重，表征局部显著特征，抑制无用特征，提高目标区域信息的有效性。最后，构建可特征选择的金字塔池化模块（ｆａｓｔｓｐａｔｉａｌｐｙｒａｍｉｄｐｏｏｌｉｎｇｗｉｔｈｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎａｎｄｃｏｎｖｏｌｕｔｉｏｎｓ，ＳＰＰＦＣ），帮助网络模型更好地捕捉和处理目标的多尺度特征，提高模型的感知能力。通过实验可知，ＡＭＮｅｔ在ＳｔａｎｆｏｒｄＤｏｇｓ数据集上的准确率、精确率、召回率和Ｆ１分数分别达到８８．９％、８３．６％、８５．７％和８４．６％，模型参数量为２６．５３ＭＢ，每秒帧率达到８９．３帧，在ＳｔａｎｆｏｒｄＣａｒｓ数据集上的准确率、精确率和召回率分别达到９５．２％、９３．７％和９４．９％。实验结果表明，ＡＭＮｅｔ可以在轻量化网络的同时提高细粒度图像的分类精度，相比于其他网络模型性能有较大提升。

中图分类号:

ＴＰ３９１．４１

李云红，郭越，谢蓉蓉，张蕾涛，苏雪平，李丽敏，陈锦妮. 注意力机制和多尺度特征融合的细粒度图像分类[J]. 重庆理工大学学报（自然科学）, 2024, 38(12): 155-164.

[1]	宋铁成，黄宇. 结合图像-文本提示与跨模态适配器的零样本多标签图像分类[J]. 重庆理工大学学报（自然科学）, 2024, 38(12): 182-188.
[2]	申彩英, 朱思瑶, 黄兴驰. 双目视觉的智能汽车目标检测算法研究[J]. 重庆理工大学学报（自然科学）, 2023, 37(11): 11-19.
[3]	申彩英, 朱思瑶, 黄兴驰. 一种相机和激光雷达数据融合的目标检测算法[J]. 重庆理工大学学报（自然科学）, 2023, 37(10): 81-88.
[4]	兰建平, 郭文韬, 杨亚会. ＦＳＡＣ赛车融合感知算法研究[J]. 重庆理工大学学报（自然科学）, 2023, 37(10): 107-116.
[5]	温雪岩, 李祯, 谷训开. 融合图卷积网络的花样滑冰动作识别方法[J]. 重庆理工大学学报（自然科学）, 2023, 37(10): 156-165.
[6]	杨武, 刘依然, 冯欣. 一种加权最大化激活的无数据通用对抗攻击[J]. 重庆理工大学学报（自然科学）, 2023, 37(10): 220-228.
[7]	段瑞雪, 刘鑫, 张仰森. 融合依存关系的对话关系抽取[J]. 重庆理工大学学报（自然科学）, 2023, 37(7): 217-226.
[8]	兰建平, 郭文韬, 汤文靖, 佘依函. ＦＳＡＣ赛道地图构建算法研究[J]. 重庆理工大学学报（自然科学）, 2023, 37(6): 332-339.
[9]	刘舒伟, 王旭鹏, 刘峰峰. ２．５Ｄ编织复合材料齿轮性能仿真分析[J]. 重庆理工大学学报（自然科学）, 2023, 37(1): 337-344.
[10]	刘朔，谷玉海，饶文军，王菊远. 基于优化ＹＯＬＯｖ３算法的违章车辆检测方法[J]. 重庆理工大学学报（自然科学）, 2021, 35(4): 135-141.
[11]	饶文军, 谷玉海, 朱腾腾, 黄艳庭. 基于深度学习的车牌智能识别方法[J]. 重庆理工大学学报（自然科学）, 2021, 35(3): 119-127.
[12]	闫河１, ２, 李焕１, 罗成１. 基于深度学习的罐式炼炉送料口视觉检测与跟踪方法[J]. 重庆理工大学学报（自然科学）, 2021, 35(3): 139-144.
[13]	张莲, 杨森淋, 禹红良, 左兴喜, 刘晓丽. 改进非局部核模糊C均值聚类的红外图像分割[J]. 重庆理工大学学报（自然科学）, 2020, 34(11): 130-137.
[14]	姚鹏威, 杨炯, 张爱梅, 黄晓. 表格图像转换成Ｗｏｒｄ表格的研究[J]. 重庆理工大学学报（自然科学）, 2019, 33(11): 100-105,190.
[15]	. 基于亮度与色度信息的深度学习图像风格迁移算法研究[J]. 重庆理工大学学报（自然科学）, 2019, 33(7): 145-151,159.

注意力机制和多尺度特征融合的细粒度图像分类

PDF (PC)

赞

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

Metrics

本文评价

推荐阅读 0