收录:
摘要:
一种深度自动编码器与Q学习算法相结合的移动机器人路径规划方法,该方法包括深度自动编码器部分,BP神经网络部分,强化学习部分。深度自动编码器部分主要采用深度自动编码器处理机器人所处环境的图像,获得图像数据的特征,为后续实现对环境的认知打下基础。BP神经网络部分主要实现奖励值与图像特征数据的拟合,实现深度自动编码器与强化学习的结合。Q学习算法通过与环境交互学习,在行动-评价的环境中获得知识,改进行动方案以适应环境达到预想目的。机器人通过与环境的交互实现自主学习,最终找到从起始点到达终点的可行路径。本发明提高了系统处理图像的能力,通过深度自动编码器与BP神经网络结合可实现对环境的认知。
关键词:
通讯作者信息:
电子邮件地址: