• 综合
  • 标题
  • 关键词
  • 摘要
  • 学者
  • 期刊-刊名
  • 期刊-ISSN
  • 会议名称
搜索

作者:

黄晓冬 (黄晓冬.) | 苑海涛 (苑海涛.) | 毕敬 (毕敬.) | 刘涛 (刘涛.)

收录:

Scopus CSCD

摘要:

为实现海战场环境下多智能体路径规划及目标追踪,以智能体(潜艇或者舰艇)为研究对象,提出一种基于强化学习的深度Q网络算法.通过设计两个结构相同但参数不同的神经网络,分别对其Q实际值和估计值的更新来实现价值函数的收敛.运用ε-贪婪算法设计动作选择机制和基于应用环境设计奖励函数,显著提高LER算法的更新速度和泛化能力等.仿真结果表明,与现有的路径规划算法和多智能体路径规划算法相比,每个智能体能够在陌生环境中有效躲避障碍物,并且通过一定步数的学习实现更加高效的智能规划路线及追踪目标.

关键词:

深度Q网络 强化学习 路径规划 目标追踪 智能体

作者机构:

  • [ 1 ] [黄晓冬]海军航空大学,山东烟台264001
  • [ 2 ] [苑海涛]北京航空航天大学
  • [ 3 ] [毕敬]北京工业大学
  • [ 4 ] [刘涛]北京交通大学

通讯作者信息:

电子邮件地址:

查看成果更多字段

相关关键词:

来源 :

系统仿真学报

ISSN: 1004-731X

年份: 2021

期: 10

卷: 33

页码: 2440-2448

被引次数:

WoS核心集被引频次: 0

SCOPUS被引频次: 7

ESI高被引论文在榜: 0 展开所有

万方被引频次: -1

中文被引频次:

近30日浏览量: 1

在线人数/总访问数:2347/4253427
地址:北京工业大学图书馆(北京市朝阳区平乐园100号 邮编:100124) 联系我们:010-67392185
版权所有:北京工业大学图书馆 站点建设与维护:北京爱琴海乐之技术有限公司