• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      永磁同步直線電機(jī)DDPG自適應(yīng)控制

      2020-05-29 11:15:56張振宇張東波
      微電機(jī) 2020年4期
      關(guān)鍵詞:適應(yīng)控制數(shù)學(xué)模型代理

      張振宇,張 昱,陳 麗 ,張東波

      (1.沈陽(yáng)工業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,沈陽(yáng) 110870;2.廣東省智能制造研究所 廣東省現(xiàn)代控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,廣州 510070)

      0 引 言

      永磁同步直線電機(jī)(Permanent Magnet Synchronous Linear Motor,PMSLM)有著推力大、速度大、行程大和精度高等優(yōu)點(diǎn),因此廣泛應(yīng)用于現(xiàn)代工業(yè)中[1]。直線電機(jī)伺服系統(tǒng)相比傳統(tǒng)的伺服電機(jī)精簡(jiǎn)了機(jī)械結(jié)構(gòu),取消了傳動(dòng)環(huán)節(jié),具有優(yōu)越的加減速度特性和高剛度、高可靠性,運(yùn)行噪聲小,維護(hù)簡(jiǎn)單等優(yōu)點(diǎn)。目前,直線電機(jī)技術(shù)已經(jīng)比較成熟,并越來(lái)越多地用在高速、高精密機(jī)械加工中[2]。由于實(shí)際直線電機(jī)伺服系統(tǒng)的非線性及不確定性,當(dāng)模型的不確定性超過(guò)傳統(tǒng)線性最優(yōu)魯棒控制所允許的范圍時(shí),控制系統(tǒng)就變得不穩(wěn)定[3],所以傳統(tǒng)PID控制在直線電機(jī)高加速運(yùn)行有干擾情況下不能達(dá)到理想的控制效果。

      針對(duì)以上現(xiàn)狀,為了在高速高精度應(yīng)用場(chǎng)合實(shí)現(xiàn)對(duì)非線性、強(qiáng)耦合、負(fù)載擾動(dòng)大的永磁同步直線電機(jī)的快速精準(zhǔn)控制,本文提出深度確定性策略梯度(Deep Deterministic Policy Gradient , DDPG)算法自適應(yīng)控制策略,其被控對(duì)象可以是非線性系統(tǒng),DDPG自適應(yīng)控制系統(tǒng)基于強(qiáng)化學(xué)習(xí),具有很強(qiáng)的自學(xué)習(xí)、自整定能力,能根據(jù)負(fù)載擾動(dòng)進(jìn)行更新控制策略,有效提高系統(tǒng)抗干擾能力,減小速度信號(hào)跟蹤誤差。并通過(guò)在Matlab/Simulink仿真平臺(tái)仿真分析和傳統(tǒng)PID控制性能進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證DDPG自適應(yīng)控制器的動(dòng)態(tài)性能。

      1 永磁同步直線電機(jī)模型建立

      為了分析直線電機(jī)的特性,并在Simulink上進(jìn)行仿真,首先要對(duì)直線電機(jī)進(jìn)行數(shù)學(xué)建模。直線電機(jī)的數(shù)學(xué)模型是個(gè)強(qiáng)耦合、多變量、非線性系統(tǒng),直接分析它的微分方程難度很大,通常釆用的方法是坐標(biāo)變化方法[4]。將三相正弦交流電通入交流電機(jī)定子的三相繞組A、B、C中,會(huì)產(chǎn)生旋轉(zhuǎn)磁勢(shì),它在空間是呈正弦分布的。為了分析和設(shè)計(jì)的方便,直線電機(jī)數(shù)學(xué)模型通常需要用到Clark變換、Park變換和Park逆變換。

      將三相靜止坐標(biāo)等效為兩相靜止坐標(biāo)(3S/2S),ABC→αβ0,稱(chēng)為Clark變換。

      (1)

      考慮零軸分量,兩相αβ坐標(biāo)系到兩相dq坐標(biāo)系的變換矩陣形式為:

      (2)

      通過(guò)矢量旋轉(zhuǎn)變換,將兩相靜止的αβ坐標(biāo)系變換到兩相旋轉(zhuǎn)的dq坐標(biāo)系,稱(chēng)為Park變換。經(jīng)過(guò)變換后,PMSLM的d、q軸數(shù)學(xué)模型模塊如下:

      電流平衡模塊:

      根據(jù)矢量控制的基本原理,可以推出直線電機(jī)在d、q軸數(shù)學(xué)模型下的電壓方程式為

      (3)

      式中,Rs為初級(jí)繞組等效電阻,ud為直線電機(jī)d軸電壓,id為d軸電流,ψd為d軸磁鏈;uq為q軸電壓,iq為q軸電流,ψq為q軸的磁鏈;為永磁體極距,v為直線電機(jī)的同步運(yùn)動(dòng)速度。

      磁鏈方程為

      (4)

      式中,Ld為d軸電感,Lq為q軸電感,ψf為永磁體勵(lì)磁的基波磁鏈。

      電磁推力方程為

      Fe=K[ψfiq+(Ld-Lq)idiq]

      (5)

      (6)

      式中,F(xiàn)e為電磁推力系數(shù)。

      機(jī)械運(yùn)動(dòng)方程:

      (7)

      式中,M為直線電機(jī)初級(jí)的質(zhì)量,F(xiàn)1為負(fù)載干擾阻力,B為黏性阻力系數(shù)。

      因?yàn)橹本€電機(jī)的次級(jí)為永磁體,由式(6)知,當(dāng)初始狀態(tài)保持iq與d軸垂直,不僅可以對(duì)直線電機(jī)數(shù)學(xué)模型進(jìn)行參數(shù)解耦,而且還可以得到最大推力。所以采用id=0的矢量控制策略,則永磁同步直線電機(jī)的數(shù)學(xué)模型可簡(jiǎn)化為

      (8)

      所以直線電機(jī)傳遞函數(shù)結(jié)構(gòu)圖如圖1所示。

      圖1 直線電機(jī)傳遞函數(shù)結(jié)構(gòu)圖

      根據(jù)上述直線電機(jī)數(shù)學(xué)建模在Simulink上搭建好直線電機(jī)模型,由于直線電機(jī)采用脈寬調(diào)制的三相電流供電,并采取電流跟蹤控制的,所以需要在直線電機(jī)模型前再連接SVPWM模塊,而DDPG自適應(yīng)控制器是根據(jù)控制電流跟蹤,來(lái)實(shí)現(xiàn)直線電機(jī)模型控制的。

      2 DDPG自適應(yīng)控制策略

      DDPG是深度強(qiáng)化學(xué)習(xí)的一種算法,是一種數(shù)據(jù)驅(qū)動(dòng)的控制方法,可以根據(jù)系統(tǒng)的輸入輸出數(shù)據(jù),學(xué)習(xí)系統(tǒng)的數(shù)學(xué)模型,并根據(jù)給定的獎(jiǎng)勵(lì)實(shí)現(xiàn)系統(tǒng)的最優(yōu)控制。2013年,Deep mind公司提出了深度Q網(wǎng)絡(luò)(Deep Q-Network, DQN)。通過(guò)將DQN應(yīng)用到視頻游戲,強(qiáng)化代理僅通過(guò)從圖像中獲取信息多次訓(xùn)練,就可以就能熟練的闖關(guān)游戲[5]。Lillicrap 等人于2015年提出了一種深度確定性策略梯度(DDPG)算法作為重放緩沖器來(lái)構(gòu)建目標(biāo)網(wǎng)絡(luò),以解決連續(xù)運(yùn)動(dòng)空間神經(jīng)網(wǎng)絡(luò)收斂和慢速算法更新的問(wèn)題[6],并在Nature上發(fā)表的關(guān)于深度強(qiáng)化學(xué)習(xí)的論文[7]。

      DDPG算法是一種無(wú)模型、在線、離線策略的強(qiáng)化學(xué)習(xí)方法,僅利用受控系統(tǒng)的輸入輸出數(shù)據(jù)直接進(jìn)行控制器的設(shè)計(jì)和分析,使用批量次的數(shù)據(jù)對(duì)仿真代理進(jìn)行訓(xùn)練,最終培訓(xùn)出合適的強(qiáng)化代理,在強(qiáng)化代理根據(jù)環(huán)境改變而更新策略,來(lái)更新評(píng)判Q值。DDPG采取經(jīng)驗(yàn)回放機(jī)制,通過(guò)連續(xù)對(duì)目標(biāo)網(wǎng)絡(luò)參數(shù)與當(dāng)前網(wǎng)絡(luò)的參數(shù)加權(quán)平均進(jìn)行訓(xùn)練,以避免振蕩[8]。

      深度強(qiáng)化學(xué)習(xí)具有良好的知識(shí)轉(zhuǎn)移能力,這對(duì)于伺服系統(tǒng)跟蹤具有不同幅度或頻率的信號(hào)是必要的。DDPG是一種數(shù)據(jù)驅(qū)動(dòng)的控制方法,可以根據(jù)系統(tǒng)的輸入輸出數(shù)據(jù)學(xué)習(xí)系統(tǒng)的數(shù)學(xué)模型,并根據(jù)給定的獎(jiǎng)勵(lì)實(shí)現(xiàn)系統(tǒng)的最優(yōu)控制。通過(guò)DDPG的自學(xué)習(xí)智能結(jié)構(gòu),提高直流電機(jī)伺服系統(tǒng)精度[9]。

      DDPG自適應(yīng)控制器基本框架如圖2所示。

      圖2 DDPG自適應(yīng)控制器基本框架圖

      圖中虛線上部分是基于強(qiáng)化學(xué)習(xí)的自適應(yīng)參數(shù)調(diào)節(jié)器,由強(qiáng)化學(xué)習(xí)代理組成,虛線下部分由被控對(duì)象組成作為代理環(huán)境交互對(duì)象。其中誤差e(t)=u(t)-y(t),u(t)是初始輸入值,y(t)是反饋值。

      考慮到系統(tǒng)誤差和反饋值數(shù)值范圍對(duì)系統(tǒng)控制性能的影響, 獎(jiǎng)勵(lì)函數(shù)定義為

      rt=α1r1(t)+α2r2(t)

      (9)

      其中,α1,α2分別為限定誤差值范圍和反饋數(shù)值范圍的獎(jiǎng)勵(lì)系數(shù),r1(t),r2(t)分別為誤差值范圍和反饋數(shù)值范圍,定義為

      (10)

      (11)

      其中,σ為允許的誤差帶,y′(t)為反饋數(shù)值上限。

      在Simulink上搭建的基于DDPG自適應(yīng)控制器的直線電機(jī)速度環(huán)控制框圖如圖3所示。

      圖3 DDPG自適應(yīng)直線電機(jī)速度環(huán)Simulink控制框圖

      V0為初始給定速度模塊;C_npmlsm為直線電機(jī)電流環(huán)集成模塊;Signal Processing為直線電機(jī)對(duì)強(qiáng)化代理的信號(hào)處理模塊,以直線電機(jī)的速度誤差e和反饋速度Velocity信號(hào)作為輸入,再將速度誤差e、誤差積分及反饋速度Velocity作為觀察狀態(tài)st輸入到強(qiáng)化代理的觀察狀態(tài)Observation端口,反饋速度Velocity的速度范圍作為強(qiáng)化代理的截至范圍輸入到強(qiáng)化代理的Isdone端口,根據(jù)對(duì)誤差e的限定范圍及反饋速度截至范圍設(shè)定的獎(jiǎng)勵(lì)輸入到強(qiáng)化代理的Reward端口;RL Agent為DDPG強(qiáng)化代理模塊,將動(dòng)作值作為直線電機(jī)電流環(huán)的輸入電流值輸入到C_npmlsm模塊中。

      DDPG自適應(yīng)控制器在Simulink上搭建大部分需要采用M文件下編寫(xiě)S函數(shù)來(lái)調(diào)用神經(jīng)網(wǎng)絡(luò)模塊組建強(qiáng)化學(xué)習(xí)代理。

      3 實(shí)驗(yàn)結(jié)果與分析

      基于DDPG自適應(yīng)控制器的直線電機(jī)速度環(huán)控制系統(tǒng)在Simulink上搭建好以后,將主要相關(guān)參數(shù)輸入。本論文仿真參數(shù)設(shè)置為Rs=3.3 Ω,Ld=Lq=0.001 H,M=1 kg,B=1.2 N·s/m,ψf=0.23336Wb,=0.048 m,連續(xù)推力F1=130 N。給定速度設(shè)置為2 m/s,獎(jiǎng)勵(lì)函數(shù)設(shè)置為rt=5×(e<0.01)-1×(e>0.01)-100((y′(t)>4)‖(y′(t)<0))。在強(qiáng)化代理經(jīng)過(guò)多回合自學(xué)習(xí),自整定后,當(dāng)訓(xùn)練的指標(biāo)達(dá)到設(shè)定的指標(biāo)時(shí),仿真模型停止訓(xùn)練,并生成最優(yōu)強(qiáng)化代理,保存到指定的文件夾下。

      仿真速度初始給定2 m/s,在無(wú)干擾條件下,傳統(tǒng)PID控制和DDPG自適應(yīng)控制的速度對(duì)比仿真結(jié)果如圖4所示,從圖中的對(duì)比波形圖可看出,DDPG自適應(yīng)控制不僅超調(diào)量小,而且具有更快的響應(yīng)速度。

      圖4 無(wú)干擾速度對(duì)比仿真波形圖

      為了檢驗(yàn)系統(tǒng)的抗干擾能力,仿真速度初始給定2 m/s,在t=0.1 s時(shí),施加50 N的負(fù)載擾動(dòng),傳統(tǒng)PID控制和DDPG自適應(yīng)控制的速度對(duì)比仿真結(jié)果如圖5所示,從仿真圖中速度波形可看出,DDPG自適應(yīng)控制相比PID控制,不僅減小了超調(diào)量,提高了系統(tǒng)的響應(yīng)速度,而且在被控系統(tǒng)突加擾動(dòng)的情況下,擾動(dòng)小,能使系統(tǒng)快速恢復(fù)穩(wěn)定,具有較強(qiáng)的抗干擾能力。

      圖5 施加干擾速度對(duì)比仿真波形圖

      為了檢驗(yàn)系統(tǒng)的跟隨性能,仿真速度輸入為方波信號(hào),初始速度為1 m/s,在t=0.08 s時(shí),變?yōu)? m/s,在t=0.16 s時(shí),變?yōu)? m/s,在t=0.24 s時(shí),變?yōu)? m/s,在t=0.32 s時(shí),變?yōu)? m/s。傳統(tǒng)PID控制和DDPG自適應(yīng)控制的速度對(duì)比仿真結(jié)果如圖6所示,從仿真圖中速度波形可看出,DDPG自適應(yīng)控制相比PID控制,具有更優(yōu)良的跟隨性能。

      圖6 跟隨速度對(duì)比仿真波形圖

      4 結(jié) 語(yǔ)

      本文針對(duì)直線電機(jī)的模型的非線性、強(qiáng)耦合、負(fù)載擾動(dòng)大等特點(diǎn),提出了一種基于DDPG自適應(yīng)控制新型控制方法,應(yīng)用于PMLSM的速度控制環(huán)中。DDPG自適應(yīng)控制器強(qiáng)化代理是在Actor-Critic網(wǎng)絡(luò)基礎(chǔ)上建立的,Actor網(wǎng)絡(luò)實(shí)現(xiàn)了策略的最佳近似,Critic網(wǎng)絡(luò)實(shí)現(xiàn)了價(jià)值函數(shù)的最優(yōu)逼近,采用參數(shù)隨機(jī)OU噪聲動(dòng)態(tài)調(diào)整等策略,提高了神經(jīng)網(wǎng)絡(luò)的收斂速度,同時(shí)提高了控制系統(tǒng)的精度。

      本文利用Matlab/Simulink軟件包中現(xiàn)有的工具和庫(kù),對(duì)PID控制器和DDPG自適應(yīng)控制器的性能進(jìn)行了比較研究,并通過(guò)不斷在Simulink上仿真訓(xùn)練,優(yōu)化DDPG自適應(yīng)控制器。模擬仿真后,實(shí)驗(yàn)結(jié)果表明:DDPG自適應(yīng)控制器可以實(shí)現(xiàn)對(duì)非線性系統(tǒng)的穩(wěn)定跟蹤控制, 并且與傳統(tǒng)的PID控制相比, 基于DDPG自適應(yīng)控制器控制器具有響應(yīng)速度快, 自適應(yīng)能力強(qiáng), 抗干擾能力強(qiáng),跟隨效果好等優(yōu)點(diǎn)。

      猜你喜歡
      適應(yīng)控制數(shù)學(xué)模型代理
      AHP法短跑數(shù)學(xué)模型分析
      活用數(shù)學(xué)模型,理解排列組合
      代理圣誕老人
      采用自適應(yīng)控制的STATCOM-SEIG系統(tǒng)Matlab仿真
      代理手金寶 生意特別好
      對(duì)一個(gè)數(shù)學(xué)模型的思考
      復(fù)仇代理烏龜君
      考慮執(zhí)行器飽和的改進(jìn)無(wú)模型自適應(yīng)控制
      基于 L1自適應(yīng)控制的無(wú)人機(jī)橫側(cè)向控制
      Rucklidge混沌系統(tǒng)的自適應(yīng)控制
      无锡市| 贵溪市| 图木舒克市| 铜陵市| 望江县| 石家庄市| 桦川县| 壤塘县| 本溪| 山阳县| 明光市| 神池县| 平果县| 云南省| 固安县| 贡山| 南川市| 越西县| 乐陵市| 全州县| 康乐县| 茌平县| 吴忠市| 浮梁县| 永胜县| 榆林市| 金山区| 肃宁县| 开原市| 时尚| 福贡县| 康定县| 塔河县| 淄博市| 龙海市| 正定县| 迁安市| 潜江市| 抚顺县| 弥渡县| 镇江市|