重庆理工大学学报(自然科学) ›› 2024, Vol. 38 ›› Issue (6): 186-193.

• 信息计算机 • 上一篇    

一种自监督掩码图像建模的遮挡目标检测方法

冯 欣,胡成杭   

  1. 重庆理工大学计算机科学与工程学院,重庆400054
  • 发布日期:2024-07-29
  • 作者简介:冯欣,女,博士,副教授,主要从事数字图像处理、深度学习研究,E-mail:xfeng@cqut.edu.cn。

  • Published:2024-07-29

摘要: 为提升目标检测网络在更多遮挡场景下的适应性和检测效果,提出了一种自监督掩码图像建模方法,该方法将训练分为 2 个阶段:预训练阶段和微调阶段。在预训练阶段,采用局部掩码和重建的代理任务对无标签图像进行训练。在微调阶段,针对被遮挡目标尺度变化和不同大小目标的检测问题,提出了基于视觉Transformer(vision transformer,ViT)的金字塔结构。通过在CrowdHuman和CityPersons数据集上进行对比分析,自监督掩码图像建模方l法在检测被遮挡目标方面优于其他方法。

关键词: 目标检测;自监督;局部掩码图像建模;视觉 Transformer

中图分类号: 

  • TP391.4