一级a一级a爱片免费免会员2月|日本成人高清视频A片|国产国产国产国产国产国产国产亚洲|欧美黄片一级aaaaaa|三级片AAA网AAA|国产综合日韩无码xx|中文字幕免费无码|黄色网上看看国外超碰|人人操人人在线观看|无码123区第二区AV天堂

<button id="uqesa"></button>

<table id="uqesa"><dl id="uqesa"></dl></table>

<small id="uqesa"><rt id="uqesa"></rt></small>

<dfn id="uqesa"><em id="uqesa"></em></dfn>

<u id="ntzyq"></u>

<abbr id="ntzyq"><table id="ntzyq"></table></abbr><address id="ntzyq"><samp id="ntzyq"></samp></address><address id="ntzyq"><samp id="ntzyq"></samp></address>

首頁 > 期刊 > 信息與控制 > 基于異步優(yōu)勢執(zhí)行器評價器學習的自適應PID控制設計【正文】

基于異步優(yōu)勢執(zhí)行器評價器學習的自適應PID控制設計

信息與控制雜志

摘要：針對已有自適應PID控制器收斂速度慢和計算效率低的不足,基于異步優(yōu)勢行動者評論家(Asynchronous Advantage Actor-Critic,A3C)算法設計了一種新的自適應PID控制器.該控制器利用A3C結(jié)構(gòu)的多線程異步學習特性,并行訓練多個行動者評論家(Actor-Critic,AC)結(jié)構(gòu)的智能體,每個智能體采用多層前饋神經(jīng)網(wǎng)絡逼近策略函數(shù)和值函數(shù)實現(xiàn)在連續(xù)動作空間中搜索最優(yōu)的參數(shù)整定策略,以達到最佳的控制效果.算法在提高計算效率的同時降低了學習樣本的相關性.在仿真實驗中通過與已有的多種自適應PID控制器性能的對比分析說明,該方法具有收斂速度快、自適應能力強的特點.

關鍵詞：

深度強化學習
異步優(yōu)勢執(zhí)行器評價器
自適應pid控制

作者：

孫歧峰; 任輝; 段友祥

單位：

中國石油大學(華東)計算機與通信工程學院; 山東青島266580

刊名：

信息與控制

注：因版權(quán)方要求，不能公開全文，如需全文，請咨詢雜志社

投稿咨詢免費咨詢雜志訂閱

熱門期刊

教育研究與評論·小學教育教學小學時代·教育研究中醫(yī)康復汽車維護與修理視覺傳播研究中小學電教廣義虛擬經(jīng)濟研究澳中學術法律和政治科學語文世界亞洲研究湖北民族大學學報·哲學社會科學版

信息與控制期刊

期刊名稱：信息與控制

信息與控制雜志緊跟學術前沿，緊貼讀者，國內(nèi)刊號為：21-1138/TP。堅持指導性與實用性相結(jié)合的原則，創(chuàng)辦于1972年，雜志在全國同類期刊中發(fā)行數(shù)量名列前茅。

雜志信息雜志咨詢

服務介紹

<address id="bvstm"><samp id="bvstm"><thead id="bvstm"></thead></samp></address>