• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

阮晓钢 (阮晓钢.) | 刘鹏飞 (刘鹏飞.) | 朱晓庆 (朱晓庆.)

Indexed by:

EI Scopus

Abstract:

Q-learning作为一种无模型的值迭代强化学习算法,被广泛应用于移动机器人在非结构环境下的导航任务中.针对Q learning在移动机器人导航中环境探索和利用存在矛盾关系导致收敛速度慢的问题,该文在Q-learning算法的基础上,受啮齿类动物可以利用嗅觉线索来进行空间定向和导航的启发,提出一种基于气味奖励引导的Q-learning环境认知策略.该算法通过改善Q-learning中的动作选择策略来减少对环境的无用探索,在动作选择策略中融入了环境气味奖励的引导,并提出了嗅觉因子来平衡动作选择策略中Q-learning和气味奖励引导的权重关系.为了验证算法的有效性,在Tolman老鼠实验所用的迷宫环境中进行了仿真实验,动态仿真结果表明,相比Q-learning算法,基于气味奖励引导的Q-learning算法在环境认知过程中,可减少对环境的无用探索,并增强对环境的认知学习能力,且提高算法的收敛速度.

Keyword:

Q-learning 嗅觉因子 机器人导航 环境认知

Author Community:

  • [ 1 ] [阮晓钢]北京工业大学信息学部,北京100124;计算智能与智能系统北京市重点实验室,北京100124
  • [ 2 ] [刘鹏飞]北京工业大学信息学部,北京100124;计算智能与智能系统北京市重点实验室,北京100124
  • [ 3 ] [朱晓庆]北京工业大学信息学部,北京100124;计算智能与智能系统北京市重点实验室,北京100124

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

清华大学学报(自然科学版)

ISSN: 1000-0054

Year: 2021

Issue: 3

Volume: 61

Page: 254-260

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count: 3

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 2

Online/Total:1334/5219582
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.