重庆理工大学学报(自然科学) ›› 2023, Vol. 37 ›› Issue (10): 136-145.

• “扩展现实(XR)理论与技术及应用”专栏 • 上一篇    下一篇

一种改进 HRNetV2和聚合注意力的场景解析方法

张 岩,孙英伟   

  1. (1.青岛科技大学 图书馆,山东 青岛 266000; 2.青岛科技大学 机电工程学院,山东 青岛 266000)
  • 出版日期:2023-11-20 发布日期:2023-11-20
  • 作者简介:张岩,男,博士,副教授,主要从事人工智能、信息系统及智慧图书馆研究,Email:zy@qust.edu.cn。

Scene parsing based on improved HRNetV2 and convergent attention perception

  • Online:2023-11-20 Published:2023-11-20

摘要: 智能化环境和服务的重要基础在于能够对环境进行视觉建模,使其具有视觉识别 和理解能力。为此,提出一种用于智能服务机器人的场景解析深度网络模型 ShuffleHRNet以 实现自主移动和服务。设计一种 Shuffle模块并引入 HRNetV2网络,实现不同通道之间的信息 交互,降低模型参数量并提高计算效率;提出一种聚合注意力感知模块,使网络关注每个通道中 不同的有效特征信息、抑制不相关特征;在 SmartLib数据集上对 ShuffleHRNet和主流分割方法 进行了对比和消融实验。实验结果表明,ShuffleHRNet能够对内部环境实现场景解析和准确分 割。相比其他方法,ShuffleHRNet具有更高的分割效率和更低的参数量,可部署于机器人以实 现室内场景自主移动进而提供多元化服务。

关键词: 智慧图书馆, 场景解析, 聚合注意力感知, 计算机视觉, 人工智能

中图分类号: 

  • TP391.4