重庆理工大学学报(自然科学) ›› 2024, Vol. 38 ›› Issue (10): 13-20.

• 车辆工程 • 上一篇    

面向 3D目标检测的多模态生成式图像数据增强的研究

张光钱,周广利,黄 飞,刘文兵,向阳开   

  1. 1.重庆交通大学 机电与车辆工程学院,重庆 400074;2.中国路桥工程有限责任公司,北京 100010
  • 发布日期:2024-11-08
  • 作者简介:张光钱,男,硕士研究生,主要从事智能网联汽车感知方向的研究,Email:gqzhang77@163.com。

  • Published:2024-11-08

摘要: 针对传统生成式图像数据增强算法丢失 3D属性信息,无法应用于自动驾驶领域 3D目标检测任务的问题,提出了一种基于稳定扩散模型的多模态图像生成算法,并基于该算法设计了一种面向 3D目标检测的数据增强方法。算法通过增加多模态输入进一步约束图像的生成过程。算法设计了一种多模态特征在线生成模块,在线提取场景描述、语义分布和深度特征等信息;同时针对多模态特征融合网络设计了一种增强型门控自注意力模块,精准地捕捉潜在特征空间中的深度信息,从而保留图像的 3D属性信息,实现对图像纹理、颜色以及光照等 2D特征的针对性修改。基于算法出色的深度保持特性,将新图像与 3D伪标签结合,构成新的图像样本,实现对图像样本的数据增强。在 nuScenes公开数据集上 3D检测结果表明,算法针对公交车、卡车等体积较大类别的 3D属性保留效果较好,AP值分别提高了 17.2%和 14.1%,同时 mAP提高了 6.8%,NDS提高了 3.4%。

关键词: 数据增强;稳定扩撒;图像生成;目标检测;特征融合

中图分类号: 

  • TP391