收录:
摘要:
本发明公开了一种结合深度强化学习和内在动机的移动机器人自主导航方法,利用视觉传感器从环境中获取信息,使用D3QN算法来进行最优动作的选择,并且针对导航环境中存在的奖励稀疏的问题,引入了基于好奇心的内在动机模块,利用预测状态特征向量和实际状态特性向量之间的差异作为好奇心,使得机器人能够在奖励稀疏的情况下仍保持较高的探索效率。基于Pygame仿真平台搭建实验环境,进行单目标点导航和多目标点导航两组实验,实验结果证明,该模型能够更加有效的完成导航任务,适用于多种导航场景。本发明使用深度强化学习的方法解决了传统的机器人路径规划方法存在着的基于网格的地图表示方法在精度与内存需求之间的矛盾,实现移动机器人无碰撞自主导航。
关键词:
通讯作者信息:
电子邮件地址: