• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

刘涛 (刘涛.) | 于建均 (于建均.) | 阮晓钢 (阮晓钢.) (学者:阮晓钢)

收录:

CQVIP

摘要:

模仿学习是机器人仿生机制研究的主要内容之一,即通过观察、理解、学习、模仿示教行为实现机器人的仿生特性;基于高斯过程分别表达采集离散示教信号所构成的示教轨迹和含有未知参数策略的模仿轨迹,构建模仿学习方法框架,将概率模型匹配引入到模仿学习中,以KL散度为代价函数比较两种轨迹的概率分布,运用梯度下降法寻求使KL散度最小的最优模仿控制策略,将策略应用于模仿机器人以完成与示教相同的模仿任务;以关节型机器人的机械臂摆动行为模仿为学习任务进行仿真,结果表明基于概率轨迹匹配的模仿学习方法能够实现机械臂摆动行为模仿,学习过程较传统方法简易且学习效果较好.

关键词:

轨迹匹配 概率模型 高斯过程 控制策略 模仿学习

作者机构:

  • [ 1 ] [刘涛]北京工业大学
  • [ 2 ] [于建均]北京工业大学
  • [ 3 ] [阮晓钢]北京工业大学

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

计算机测量与控制

ISSN: 1671-4598

年份: 2015

期: 11

卷: 23

页码: 3713-3716,3720

被引次数:

WoS核心集被引频次: 0

SCOPUS被引频次:

ESI高被引论文在榜: 0 展开所有

万方被引频次: 3

中文被引频次:

近30日浏览量: 1

归属院系:

在线人数/总访问数:1319/3858274
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司