收录:
摘要:
强化学习中基于马尔可夫决策过程的标准Q-Learning算法可以取得较优路径,但是方法存在收敛速度慢及规划效率低等问题,无法直接应用于真实环境.针对此问题,提出一种基于势能场知识的Q-Learning移动机器人路径规划算法.通过引入环境的势能值作为搜索启发信息对Q值进行初始化,从而在学习初期便能引导移动机器人快速收敛,改变了传统强化学习过程的盲目性,适用于真实环境中直接学习.仿真实验表明,与现有的算法相比,所提算法不仅提高了收敛速度,而且还缩短了学习时间,使得移动机器人能够迅速找到一条较优的无碰撞路径.
关键词:
通讯作者信息:
电子邮件地址: