• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

陶隽源 (陶隽源.) | 孙金玮 (孙金玮.) | 李德胜 (李德胜.) (Scholars:李德胜)

Indexed by:

CQVIP PKU CSCD

Abstract:

提出了一种基于最小线性平均的强化学习算法,用于解决连续空间下强化学习函数估计的非收敛性问题.该算法基于梯度下降法,根据压缩映射原理,通过采用线性平均法作为值函数估计的性能衡量标准,把值函数估计的迭代过程转化为一个收敛于不动点的过程.该算法利用强化学>--j算法的标准问题一Mountain Car问题进行了验证,仿真结果验证了算法是有效的和可行的,并且可以快速收敛到稳定值.

Keyword:

线性平均 梯度下降法 自动控制技术 强化学习 函数估计

Author Community:

  • [ 1 ] [陶隽源]哈尔滨工业大学
  • [ 2 ] [孙金玮]哈尔滨工业大学
  • [ 3 ] [李德胜]北京工业大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

吉林大学学报(工学版)

ISSN: 1671-5497

Year: 2008

Issue: 6

Volume: 38

Page: 1407-1411

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: 3

Chinese Cited Count:

30 Days PV: 1

Online/Total:587/5433262
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.