• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

于建均 (于建均.) | 刘耕源 (刘耕源.) | 于乃功 (于乃功.) | 龚道雄 (龚道雄.) | 冯新悦 (冯新悦.)

摘要:

针对用于位姿估计的RGB-D特征提取网络规模过于庞大的问题,提出一种轻量化改进XYZNet的RGB-D特征提取网络.首先设计一种轻量级子网络BaseNet以替换XYZNet中的ResNet18,使得网络规模显著下降的同时获得更强大的性能;然后基于深度可分离卷积设计一种多尺度卷积注意力子模块Rep-MSCA(re-parameterized multi-scale convolutional attention),加强BaseNet提取不同尺度上下文信息的能力,并约束模型的参数量;最后,为了以较小的参数代价提升XYZNet中PointNet的几何特征提取能力,设计一种残差多层感知器模块Rep-ResP(re-parameterized residual multi-layer perceptron).改进后的网 络浮点计算量与参数量分别 降低了60.8%和64.8%,推理速度加快了 21.2%,在主流数据集LineMOD与YCB-Video上分别取得了 0.5%与0.6%的精度提升.改进后的网络更适宜在硬件资源紧张的场景下部署.

关键词:

RGB-D 位姿估计 轻量级 特征提取 图像处理

作者机构:

  • [ 1 ] [于建均]北京工业大学
  • [ 2 ] [于乃功]北京工业大学
  • [ 3 ] [刘耕源]北京工业大学
  • [ 4 ] [冯新悦]北京工业大学
  • [ 5 ] [龚道雄]北京工业大学

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

计算机应用研究

ISSN: 1001-3695

年份: 2024

期: 2

卷: 41

页码: 616-622

被引次数:

WoS核心集被引频次:

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次: -1

中文被引频次:

近30日浏览量: 0

归属院系:

在线人数/总访问数:388/4948098
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司