重庆理工大学学报(自然科学) ›› 2024, Vol. 38 ›› Issue (10): 139-146.

• 信息·计算机 • 上一篇    

基于多尺度多层次多任务网络的长视频微表情分析

刘 鑫,李 蓉,封宗寰,连大山,郭一娜   

  1. 太原科技大学 电子信息工程学院,太原 030024
  • 发布日期:2024-11-08
  • 作者简介:刘鑫,女,博士,副教授,主要从事计算机视觉、微表情分析研究,Email:liuxin@tyust.edu.cn。

  • Published:2024-11-08

摘要: 与宏表情不同,微表情具有持续时间短、动作幅度小、覆盖面积小的典型特点,长视频中微表情与宏表情交织在一起,使得微表情的检测和识别困难,并且严重依赖于专家经验。针对以上问题,开发了一种多任务模型用于长视频微表情分析,该模型采用级联的网络结构,分别完成检测子任务与识别子任务。针对微表情仅发生于面部局部区域且因个体差异特征分布不同导致关键帧定位不准或漏检,在检测子网络中采用 DualCBAMInception模块,增强模型空间感受野,对全局与局部区域提取多尺度光流特征增强模型的鲁棒性;针对长视频中表情类别分布不均衡且微表情发生时面部动作细微导致长视频微表情分类识别准确率低,提出模型在识别子网络中采用深度可分离DenseNet模块,在控制模型的运算量和计算成本的前提下,通过多层次提取光流信息的浅层与深层语义特征提高模型的表情识别准确性。所提出的方法在 CAS(ME)2长视频以及 CASMEⅡ、SMIC短视频数据集上进行实验,结果表明,所提方法能够对长视频进行微表情检测并识别表情类别,性能优于当前诸多方法。

关键词: 微表情分析;光流;多任务模型;多尺度特征;多层次特征

中图分类号: 

  • TP391.4