收录:
摘要:
本发明提供了一种基于运动注意力的视频目标分割方法,该方法将通道注意力模块输出的通道特征图和运动注意力模块输出的位置特征图进行相加,获得当前帧的分割结果。其中,通道注意力模块的输入为当前帧特征图Ft和第一帧提供的目标物体的外观特征图F0,通道注意力模块通过计算输入特征图Ft和F0通道之间的关联,输出的通道特征图反映了当前帧中外观最接近目标物体的物体;运动注意力模块的输入为当前帧特征图Ft和前一帧运动注意力网络中的记忆模块预测的目标物体的位置信息Ht‑1,运动注意力模块通过计算输入特征图Ft和Ht‑1位置之间的关联,输出的位置特征图反映了当前帧中目标物体的大致位置。本发明结合外观和位置两个因素,实现了对视频目标更精确的分割。
关键词:
通讯作者信息:
电子邮件地址: