基于改进DQN算法的复杂海战场路径规划方法 - Details

Author：

郁洲 (郁洲.) | 毕敬 (毕敬.) | 苑海涛 (苑海涛.)

Abstract：

为了有效地解决海战场环境下多舰艇的追踪目标问题,以多智能体(舰艇)为研究对象,提出一种基于改进的Deep　Q-Network(DQN)算法的路径规划方法.DQN算法结合多智能体的强化学习环境特性,在传统DQN算法的基础上,添加一个结构相同、参数不同的网络,分别对Q实际值和估计值进行更新来实现价值函数的收敛.此外,该方法使用经验回放和目标网络双参数更新机制,有效地解决了神经网络训练误差大、泛化能力差和训练不稳定等问题.实验结果表明,与传统的算法相比,提出的方法能够更快地适应复杂多变的多类型海战场环境,避障能力提高两倍多,并且在环境中能够获得更高的训练奖励.

Keyword：

深度Q网络路径规划目标追踪多智能体强化学习

Author Community：

[ 1 ] [苑海涛]北京航空航天大学
[ 2 ] [郁洲]北京工业大学
[ 3 ] [毕敬]北京工业大学

Reprint Author's Address：

Email：

Show more details

Related Keywords：

基于DQN的海战场舰船路径规划及仿真
2021，系统仿真学报
基于深度强化学习的路径规划方法及系统
2021，
基于ASPL模型的多智能体强化学习在RoboCup中的应用
2005，2005中国机器人大赛
多智能体强化学习在机器人足球比赛中的应用
2005，2005年中国智能自动化会议

Source ：

智能科学与技术学报

Year： 2022

Issue： 3

Volume： 4

Page： 418-425

Cited Count：

WoS CC Cited Count：

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count： -1

Chinese Cited Count：

30 Days PV： 0

Affiliated Colleges：

学院待认领

Get Fulltext

Library Discovery Baidu Scholar Search WF WF WF WF WF WF WF WF WF

Type
Departments

All Years Choose Year From to