• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

段立娟 (段立娟.) | 孙启超 (孙启超.) | 乔元华 (乔元华.) | 陈军成 (陈军成.) | 崔国勤 (崔国勤.)

收录:

EI Scopus CSCD

摘要:

近年来,全卷积神经网络有效提升了语义分割任务的准确率.然而,由于室内环境的复杂性,室内场景语义分割仍然是一个具有挑战性的问题.随着深度传感器的出现,人们开始考虑利用深度信息提升语义分割效果.以往的研究大多简单地使用等权值的拼接或求和操作来融合RGB特征和深度特征,未能充分利用RGB特征与深度特征之间的互补信息.本文提出一种基于注意力感知和语义感知的网络模型ASNet(Attention-aware and Semantic-aware Network).通过引入注意力感知多模态融合模块和语义感知多模态融合模块,有效地融合多层次的RGB特征和深度特征.其中,在注意力感知多模态融合模块中,本文设计了一种跨模态注意力机制,RGB特征和深度特征利用互补信息相互指导和优化,从而提取富含空间位置信息的特征表示.另外,语义感知多模态融合模块通过整合语义相关的RGB特征通道和深度特征通道,建模多模态特征之间的语义依赖关系,提取更精确的语义特征表示.本文将这两个多模态融合模块整合到一个带有跳跃连接的双分支编码-解码网络模型中.同时,网络在训练时采用深层监督策略,在多个解码层上进行监督学习.在公开数据集上的实验结果表明,本文算法优于现有的RGB-D图像语义分割算法,在平均精度和平均交并比上分别比近期算法提高了1.9%和1.2%.

关键词:

多模态融合 注意力模型 卷积神经网络 深度学习 RGB-D语义分割

作者机构:

  • [ 1 ] [段立娟]北京工业大学
  • [ 2 ] [孙启超]北京工业大学信息学部 北京 100124;可信计算北京市重点实验室 北京 100124;浙江省北大信息技术高等研究院 杭州 311200
  • [ 3 ] [乔元华]北京中星微电子有限公司

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

计算机学报

ISSN: 0254-4164

年份: 2021

期: 2

卷: 44

页码: 275-291

被引次数:

WoS核心集被引频次:

SCOPUS被引频次: 5

ESI高被引论文在榜: 0 展开所有

万方被引频次: -1

中文被引频次:

近30日浏览量: 2

在线人数/总访问数:244/5030013
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司