基于气味奖励引导的Q-learning环境认知方法 - Details

Author：

阮晓钢 (阮晓钢.) (Scholars：阮晓钢) | 刘鹏飞 (刘鹏飞.) | 朱晓庆 (朱晓庆.)

Indexed by：

CSCD

Abstract：

Q-learning作为一种无模型的值迭代强化学习算法,被广泛应用于移动机器人在非结构环境下的导航任务中。针对Q-learning在移动机器人导航中环境探索和利用存在矛盾关系导致收敛速度慢的问题,该文在Q-learning算法的基础上,受啮齿类动物可以利用嗅觉线索来进行空间定向和导航的启发,提出一种基于气味奖励引导的Q-learning环境认知策略。该算法通过改善Q-learning中的动作选择策略来减少对环境的无用探索,在动作选择策略中融入了环境气味奖励的引导,并提出了嗅觉因子来平衡动作选择策略中Q-learning和气味奖励引导的权重关系。为了验证算法的有效性,在Tolman老鼠实验所用的...

Keyword：

嗅觉因子机器人导航环境认知 Q-learning

Author Community：

[ 1 ] 北京工业大学信息学部
[ 2 ] 计算智能与智能系统北京市重点实验室

Reprint Author's Address：

Email：

Show more details

Related Keywords：

基于气味奖励引导的Q-learning环境认知方法
2021，阮晓钢
基于气味奖励引导的Q-learning环境认知方法
2021，清华大学学报（自然科学版）
大鼠脑海马结构认知机理及其在机器人导航中的应用
2017，北京工业大学学报
大鼠脑海马结构认知机理及其在机器人导航中的应用
2017，北京工业大学学报

Source ：

清华大学学报(自然科学版)

Year： 2021

Issue： 03

Volume： 61

Page： 254-260

Cited Count：

WoS CC Cited Count： 0

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 2

Affiliated Colleges：

信息学部

信息学部人工智能与自动化学院

Get Fulltext

Library Discovery Baidu Scholar Search CNKI CNKI

Type
Departments

All Years Choose Year From to