Model-Free Optimal Tracking Design With Evolving Control Strategies via Q-Learning - Details

Author：

Wang, Ding (Wang, Ding.) (Scholars：王鼎) | Huang, Haiming (Huang, Haiming.) | Zhao, Mingming (Zhao, Mingming.)

Indexed by：

EI Scopus SCIE

Abstract：

This　brief　leverages　a　value-iteration-based　Q-learning　(VIQL)　scheme　to　tackle　optimal　tracking　problems　for　nonlinear　nonaffine　systems.　The　optimal　policy　is　learned　from　measured　data　instead　of　a　precise　mathematical　model.　Furthermore,　a　novel　criterion　is　proposed　to　determine　the　stability　of　the　iterative　policy　based　on　measured　data.　The　evolving　control　algorithm　is　developed　to　verify　the　proposed　criterion　by　employing　these　stable　policies　for　system　control.　The　advantage　of　the　early　elimination　of　tracking　errors　is　provided　by　this　approach　since　various　stable　policies　can　be　employed　before　obtaining　the　optimal　strategy.　Finally,　the　effectiveness　of　the　developed　algorithm　is　demonstrated　by　a　simulation　experiment.

Keyword：

intelligent control optimal tracking control system Adaptive dynamic programming value-iteration-based Q-learning stability criterion

Author Community：

[ 1 ] [Wang, Ding]Beijing Univ Technol, Fac Informat Technol, Beijing Key Lab Computat Intelligence & Intelligen, Beijing Lab Smart Environm Protect, Beijing 100124, Peoples R China
[ 2 ] [Huang, Haiming]Beijing Univ Technol, Fac Informat Technol, Beijing Key Lab Computat Intelligence & Intelligen, Beijing Lab Smart Environm Protect, Beijing 100124, Peoples R China
[ 3 ] [Zhao, Mingming]Beijing Univ Technol, Fac Informat Technol, Beijing Key Lab Computat Intelligence & Intelligen, Beijing Lab Smart Environm Protect, Beijing 100124, Peoples R China
[ 4 ] [Wang, Ding]Beijing Univ Technol, Beijing Inst Artificial Intelligence, Beijing 100124, Peoples R China
[ 5 ] [Huang, Haiming]Beijing Univ Technol, Beijing Inst Artificial Intelligence, Beijing 100124, Peoples R China
[ 6 ] [Zhao, Mingming]Beijing Univ Technol, Beijing Inst Artificial Intelligence, Beijing 100124, Peoples R China

Reprint Author's Address：

[Wang, Ding]Beijing Univ Technol, Fac Informat Technol, Beijing Key Lab Computat Intelligence & Intelligen, Beijing Lab Smart Environm Protect, Beijing 100124, Peoples R China;;[Wang, Ding]Beijing Univ Technol, Beijing Inst Artificial Intelligence, Beijing 100124, Peoples R China;;

Email：

dingwang@bjut.edu.cn |
huanghaiming@emails.bjut.edu.cn |
zhaomm@emails.bjut.edu.cn

Show more details

Related Keywords：

A Neural Policy Learning Method for Robust Stabilization of Uncertain Nonlinear Systems
2020，Chinese Automation Congress (CAC)
Recent Progress in Reinforcement Learning and Adaptive Dynamic Programming for Advanced Control Applications
2024，IEEE-CAA JOURNAL OF AUTOMATICA SINICA
A new Q-function structure for model-free adaptive optimal tracking control with asymmetric constrained inputs
2024，INTERNATIONAL JOURNAL OF ADAPTIVE CONTROL AND SIGNAL PROCESSING
The control of wastewater treatment process based on fuzzy neural network
2006，6th World Congress on Intelligent Control and Automation

Source ：

IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS II-EXPRESS BRIEFS

ISSN： 1549-7747

Year： 2024

Issue： 7

Volume： 71

Page： 3373-3377

4 . 4 0 0

JCR@2022

Cited Count：

WoS CC Cited Count： 5

SCOPUS Cited Count： 7

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count：

Chinese Cited Count：

30 Days PV： 1

Affiliated Colleges：

Get Fulltext

DOI Library Discovery Baidu Scholar Search Web of Science

Type
Departments

All Years Choose Year From to