高级检索
检索提示:高级检索多个条件检索时是按照顺序运算的:如 A或B与C 即:(A或B)与C
[期刊论文]
基于线性平均的强化学习函数估计算法
作者:
收录:
摘要:
提出了一种基于最小线性平均的强化学习算法,用于解决连续空间下强化学习函数估计的非收敛性问题.该算法基于梯度下降法,根据压缩映射原理,通过采用线性平均法作为值函数估计的性能衡量标准,把值函数估计的迭代过程转化为一个收敛于不动点的过程.该算法利用强化学>--j算法的标准问题一Mountain Car问题进行了验证,仿真结果验证了算法是有效的和可行的,并且可以快速收敛到稳定值.
关键词:
作者机构:
通讯作者信息:
电子邮件地址:
相关关键词:
相关文章:
2008,低压电器
2021,于彤彤
2021,智库时代
2007,数理统计与管理
来源 :
吉林大学学报(工学版)
ISSN: 1671-5497
年份: 2008
期: 6
卷: 38
页码: 1407-1411
被引次数:
WoS核心集被引频次: 0
SCOPUS被引频次:
ESI高被引论文在榜: 0 展开所有
万方被引频次: 3
中文被引频次:
近30日浏览量: 0
归属院系:
材料与制造学部 本学院/部未明确归属的数据
全文获取
外部链接: