收录:
摘要:
一种融合资格迹的污水处理强化学习控制方法属于污水处理领域。污水处理过程具有非线性、多干扰、大时滞等特性,这类复杂系统的控制器设计比较困难。在污水处理过程中,溶解氧与硝态氮浓度的控制设计直接影响系统的除氮效果,所以使溶解氧与硝态氮浓度跟踪上期望轨迹是污水处理过程的一个主要控制目标。本发明针对污水处理系统的最优跟踪控制问题,提出一种结合强化学习中资格迹思想的在线执行依赖启发式动态规划算法,通过引入资格迹参数以考虑未来的多步信息,从而提升算法的学习效率。在实验中,将该强化学习方法应用于污水处理过程中溶解氧与硝态氮浓度的跟踪控制,验证所提方法的有效性。
关键词:
通讯作者信息:
电子邮件地址: