利用先验知识的Q-Learning路径规划算法研究 - Details

Author：

段建民 (段建民.) (Scholars：段建民) | 陈强龙 (陈强龙.)

Indexed by：

CQVIP PKU CSCD

Abstract：

强化学习中基于马尔可夫决策过程的标准Q-Learning算法可以取得较优路径,但是方法存在收敛速度慢及规划效率低等问题,无法直接应用于真实环境.针对此问题,提出一种基于势能场知识的Q-Learning移动机器人路径规划算法.通过引入环境的势能值作为搜索启发信息对Q值进行初始化,从而在学习初期便能引导移动机器人快速收敛,改变了传统强化学习过程的盲目性,适用于真实环境中直接学习.仿真实验表明,与现有的算法相比,所提算法不仅提高了收敛速度,而且还缩短了学习时间,使得移动机器人能够迅速找到一条较优的无碰撞路径.

Keyword：

先验知识移动机器人强化学习 Q-Learning 路径规划

Author Community：

[ 1 ] [段建民]北京工业大学
[ 2 ] [陈强龙]北京工业大学

Reprint Author's Address：

Email：

Show more details

Related Keywords：

一种结合深度强化学习和内在动机的移动机器人自主导航方法
2023，
一种深度自动编码器与Q学习算法相结合的移动机器人路径规划方法
2015，
一种深度自动编码器与Q学习算法相结合的移动机器人路径规划方法
2015，
基于改进人工势场法的移动机器人局部路径规划的研究
2013，第25届中国控制与决策会议

Source ：

电光与控制

ISSN： 1671-637X

Year： 2019

Issue： 9

Volume： 26

Page： 29-33

Cited Count：

WoS CC Cited Count： 0

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count： 1

Chinese Cited Count：

30 Days PV： 1

Affiliated Colleges：

城市建设学部

Get Fulltext

DOI Library Discovery Baidu Scholar Search WF

Type
Departments

All Years Choose Year From to