基于概率轨迹匹配的机器人模仿学习方法 - Details

Author：

刘涛 (刘涛.) | 于建均 (于建均.) | 阮晓钢 (阮晓钢.) (Scholars：阮晓钢)

Indexed by：

CQVIP

Abstract：

模仿学习是机器人仿生机制研究的主要内容之一,即通过观察、理解、学习、模仿示教行为实现机器人的仿生特性;基于高斯过程分别表达采集离散示教信号所构成的示教轨迹和含有未知参数策略的模仿轨迹,构建模仿学习方法框架,将概率模型匹配引入到模仿学习中,以KL散度为代价函数比较两种轨迹的概率分布,运用梯度下降法寻求使KL散度最小的最优模仿控制策略,将策略应用于模仿机器人以完成与示教相同的模仿任务;以关节型机器人的机械臂摆动行为模仿为学习任务进行仿真,结果表明基于概率轨迹匹配的模仿学习方法能够实现机械臂摆动行为模仿,学习过程较传统方法简易且学习效果较好.

Keyword：

轨迹匹配概率模型高斯过程控制策略模仿学习

Author Community：

[ 1 ] [刘涛]北京工业大学
[ 2 ] [于建均]北京工业大学
[ 3 ] [阮晓钢]北京工业大学

Reprint Author's Address：

Email：

Show more details

Related Keywords：

Source ：

计算机测量与控制

ISSN： 1671-4598

Year： 2015

Issue： 11

Volume： 23

Page： 3713-3716,3720

Cited Count：

WoS CC Cited Count： 0

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count： 3

Chinese Cited Count：

30 Days PV： 2

Affiliated Colleges：

信息学部

Get Fulltext

DOI Library Discovery Baidu Scholar Search WF

Type
Departments

All Years Choose Year From to