• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于PSO的近似動(dòng)態(tài)規(guī)劃及其在電機(jī)控制中的應(yīng)用

      2017-08-07 03:45:37杜慧東朱明澤
      黑龍江電力 2017年3期
      關(guān)鍵詞:隱層權(quán)值粒子

      杜慧東, 邱 婷, 朱明澤

      (1.西華大學(xué) 電氣與電子信息學(xué)院, 成都 610039; 2.哈爾濱電氣國(guó)際工程有限責(zé)任公司,哈爾濱 150028)

      基于PSO的近似動(dòng)態(tài)規(guī)劃及其在電機(jī)控制中的應(yīng)用

      杜慧東1, 邱 婷1, 朱明澤2

      (1.西華大學(xué) 電氣與電子信息學(xué)院, 成都 610039; 2.哈爾濱電氣國(guó)際工程有限責(zé)任公司,哈爾濱 150028)

      提出一種采用粒子群優(yōu)化思想的改進(jìn)近似動(dòng)態(tài)規(guī)劃算法,并用以控制永磁同步電機(jī)。近似動(dòng)態(tài)規(guī)劃是一種基于強(qiáng)化學(xué)習(xí)原理的在線(xiàn)學(xué)習(xí)算法,并以PID神經(jīng)網(wǎng)絡(luò)為工具求解Bellman問(wèn)題。傳統(tǒng)算法的權(quán)值更新采用反向傳播算法,要求有精確的一階導(dǎo)數(shù),如果梯度不精確就會(huì)使得算法對(duì)網(wǎng)絡(luò)初始值選取十分敏感,穩(wěn)定性與收斂速度就會(huì)受到影響。針對(duì)這一問(wèn)題,采用改進(jìn)的粒子群優(yōu)化算法不需要任何梯度信息,能保證算法快速穩(wěn)定地收斂。設(shè)計(jì)一種用粒子群優(yōu)化算法與神經(jīng)網(wǎng)絡(luò)近似動(dòng)態(tài)規(guī)劃相結(jié)合的在線(xiàn)學(xué)習(xí)PID控制器用于永磁同步電機(jī)矢量控制系統(tǒng)中,仿真結(jié)果表明,該算法設(shè)計(jì)的控制器提高了控制系統(tǒng)的響應(yīng)速度與精度,具有更強(qiáng)的適應(yīng)性和魯棒性。

      近似動(dòng)態(tài)規(guī)劃;粒子群算法;PID神經(jīng)網(wǎng)絡(luò);永磁同步電機(jī)

      由Bellman提出的動(dòng)態(tài)規(guī)劃算法在工程控制中有著重要的意義,而近似動(dòng)態(tài)規(guī)劃(approximate dynamic programming,ADP)[1-2]的研究一直受到重視,研究者提出了許多改進(jìn)以及在眾多領(lǐng)域中的運(yùn)用[3-6]。J W Park將啟發(fā)式動(dòng)態(tài)規(guī)劃與多層感知器神經(jīng)網(wǎng)絡(luò)和徑向基神經(jīng)網(wǎng)絡(luò)相結(jié)合來(lái)控制同步發(fā)電機(jī)[7]。Jennie Si等[8]提出直接啟發(fā)式動(dòng)態(tài)規(guī)劃算法(direct heuristic dynamic programming, DHDP)并將其應(yīng)用于倒立擺系統(tǒng),DHDP不要求建模的優(yōu)點(diǎn)使得它被廣泛運(yùn)用。文獻(xiàn)[9]在DHDP的基礎(chǔ)上提出了根據(jù)設(shè)計(jì)好的PID控制器來(lái)選取初值的改進(jìn)方法,并將其使用在SVC控制中,達(dá)到了很好的效果。

      DHDP的訓(xùn)練過(guò)程中采用BP神經(jīng)網(wǎng)絡(luò)的權(quán)值更新算法,但梯度下降法收斂速度慢,且對(duì)初值選取十分敏感,使得算法易陷入局部收斂,限制了算法的發(fā)展。然而PSO收斂速度快,引入變異因子后不易陷入局部最優(yōu)[10],因此本文對(duì)DHDP算法進(jìn)行改進(jìn),即將改進(jìn)的PSO替換梯度下降法來(lái)更新評(píng)價(jià)網(wǎng)絡(luò)和動(dòng)作網(wǎng)絡(luò)兩個(gè)神經(jīng)網(wǎng)絡(luò)的權(quán)值,這能夠保證HDHP的在線(xiàn)學(xué)習(xí)方式能夠更快地收斂,達(dá)到最優(yōu)控制效果。

      1 相關(guān)的基本原理

      1.1 DHDP基本原理

      離散非線(xiàn)性系統(tǒng):

      x(t+1)=f[x(t),u(t)]

      (1)

      式中:x(t)為系統(tǒng)狀態(tài)變量;u(t)為系統(tǒng)控制變量。

      系統(tǒng)指標(biāo)函數(shù),或叫代價(jià)函數(shù):

      (2)

      式中:r為效用函數(shù),代表系統(tǒng)的獎(jiǎng)懲;α(0<α<1)為折扣因子,代表r在不同時(shí)期對(duì)指標(biāo)函數(shù)的影響。為了解決式(1)、(2)組成的優(yōu)化問(wèn)題,需要找到合適的決策序列u(t),使指標(biāo)函數(shù)J最小化。根據(jù)Bellman最優(yōu)理論,即J*是t時(shí)刻與t+1時(shí)刻的最小代價(jià)和,相應(yīng)的t時(shí)刻u(k)也達(dá)到最優(yōu):

      DHDP使用評(píng)價(jià)網(wǎng)絡(luò),動(dòng)作網(wǎng)絡(luò)與模型網(wǎng)絡(luò)的結(jié)構(gòu),原理圖如圖1所示。

      圖1 DHDP原理圖Fig.1 DHDP schematic diagram

      圖1中評(píng)價(jià)網(wǎng)絡(luò)的作用是根據(jù)狀態(tài)變量計(jì)算指標(biāo)函數(shù)并根據(jù)誤差函數(shù)對(duì)其進(jìn)行訓(xùn)練。評(píng)價(jià)網(wǎng)絡(luò)的誤差函數(shù)為

      (3)

      為了保證指標(biāo)函數(shù)向目標(biāo)收斂,評(píng)價(jià)網(wǎng)絡(luò)采用反向傳播思想,通過(guò)計(jì)算誤差對(duì)權(quán)值的一階偏導(dǎo),對(duì)網(wǎng)絡(luò)權(quán)值進(jìn)行更新:

      wc(t+1)=wc(t)+Δwc(k)

      式中:wc(t)為評(píng)價(jià)網(wǎng)絡(luò)權(quán)值;λc(λc>0)為評(píng)價(jià)網(wǎng)絡(luò)的學(xué)習(xí)率,隨t線(xiàn)性衰減。

      動(dòng)作網(wǎng)絡(luò)旨在間接地反向傳播指標(biāo)函數(shù)J和目標(biāo)值之間的誤差。指標(biāo)函數(shù)目標(biāo)值為Uc(t),將Uc(t)設(shè)為0代表指標(biāo)函數(shù)訓(xùn)練的目標(biāo)值為0。將狀態(tài)變量作為動(dòng)作網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)輸出的控制信號(hào)作為模型網(wǎng)絡(luò)的輸入,這樣動(dòng)作網(wǎng)絡(luò)就可以在線(xiàn)性或非線(xiàn)性模型中投入使用。動(dòng)作網(wǎng)的誤差函數(shù)為

      (4)

      權(quán)值更新算法與評(píng)價(jià)網(wǎng)絡(luò)類(lèi)似:

      wa(t+1)=wa(t)+Δwa(k)

      式中:wa(t)為動(dòng)作網(wǎng)絡(luò)權(quán)值;λa(λa>0)為動(dòng)作網(wǎng)絡(luò)的學(xué)習(xí)率,隨t線(xiàn)性衰減。

      1.2 PID神經(jīng)網(wǎng)絡(luò)

      評(píng)價(jià)網(wǎng)絡(luò)與動(dòng)作網(wǎng)絡(luò)均采用PID神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。PID神經(jīng)網(wǎng)絡(luò)是一種融合了PID簡(jiǎn)單實(shí)用的控制規(guī)律與神經(jīng)網(wǎng)絡(luò)的“萬(wàn)能”逼近能力的神經(jīng)網(wǎng)絡(luò),PID神經(jīng)網(wǎng)絡(luò)基本形式結(jié)構(gòu)如圖2所示。

      圖2 PID神經(jīng)網(wǎng)絡(luò)Fig.2 PID neural network

      1.3 改進(jìn)的PSO算法

      粒子群算法(Particle Swarm Optimization)是一種智能優(yōu)化算法,源于鳥(niǎo)類(lèi)捕食行為,算法初始化M維N個(gè)隨機(jī)粒子,在不斷迭代更新粒子個(gè)體極值(pbest)與種群極值(gbest)的過(guò)程中最終找到最優(yōu)解。

      PSO算法粒子更新:

      (5)

      式中:w為慣性權(quán)重;β為速度因子;i(i=1,2,…,N)代表第i個(gè)粒子;m(m=1,2,…,M)代表第m維;Xim(t)、Vim(t)分別表示第m維中的第i個(gè)粒子在第t次迭代中的位置和速度;c1、c2為非負(fù)的學(xué)習(xí)因子;r1、r2為[0,1]之間的隨機(jī)數(shù)。達(dá)到最大迭代次數(shù)或預(yù)設(shè)的最小閾值則終止。

      為了避免PSO容易陷入局部最優(yōu),在基本算法基礎(chǔ)上引入變異因子,即在Xi接連無(wú)變化或變化很小時(shí),保留該最優(yōu)位置,隨機(jī)初始化一部分粒子[11]。此外采用線(xiàn)性遞減的方法適當(dāng)調(diào)節(jié)慣性權(quán)值,有利于平衡算法搜索能力。

      2 改進(jìn)的DHDP在線(xiàn)學(xué)習(xí)算法

      評(píng)價(jià)網(wǎng)絡(luò)與訓(xùn)練網(wǎng)絡(luò)分別建立PIDNN,兩個(gè)網(wǎng)絡(luò)分別實(shí)現(xiàn)對(duì)算法的訓(xùn)練,實(shí)現(xiàn)控制功能。但是網(wǎng)絡(luò)的權(quán)值更新都根據(jù)常規(guī)的反向傳播算法,算法因此受到局限,本文采用改進(jìn)的PSO替代,形成PSO-DHDP算法。

      2.1 評(píng)價(jià)網(wǎng)絡(luò)訓(xùn)練

      網(wǎng)絡(luò)訓(xùn)練算法如下:

      (6)

      式中:wcij(1)代表第j個(gè)輸入與第i個(gè)隱層之間的權(quán)值;qi(t)為輸入層到第i個(gè)隱層的中間變量;pi(t)為第i個(gè)隱層輸入;pci(t)為第i個(gè)隱層輸出;wci(2)為第i個(gè)隱層到輸出層間的權(quán)值,Nc為隱層層數(shù);xj為評(píng)價(jià)網(wǎng)絡(luò)輸入;輸入有n+1個(gè),包括n個(gè)模型狀態(tài)變量和動(dòng)作網(wǎng)絡(luò)輸出u(t)。

      2.2 動(dòng)作網(wǎng)絡(luò)訓(xùn)練

      動(dòng)作網(wǎng)絡(luò)訓(xùn)練如下:

      (7)

      式中:waij(1)代表第j個(gè)輸入與第i個(gè)隱層之間的權(quán)值;hi(t)為輸入層到第i個(gè)隱層的中間變量;gi(t)為第i個(gè)隱層輸入;gai(t)為第i個(gè)隱層輸出;wai(2)為第i個(gè)隱層到輸出層間的權(quán)值;v(t)為輸出層的中間變量;Na為隱層層數(shù);xj為動(dòng)作網(wǎng)絡(luò)輸入,輸入包括n個(gè)模型狀態(tài)變量,相比評(píng)價(jià)網(wǎng)絡(luò)少一個(gè)u(t)。

      2.3 改進(jìn)DHDP算法流程

      將PSO-DHDP與PID神經(jīng)網(wǎng)絡(luò)有機(jī)結(jié)合,構(gòu)建一種在線(xiàn)學(xué)習(xí)的PID控制器。評(píng)價(jià)網(wǎng)絡(luò)輸入神經(jīng)元個(gè)數(shù)為i,隱含層有j個(gè)神經(jīng)元,根據(jù)被控系統(tǒng)設(shè)置PID控制模式,神經(jīng)元均采用tansig函數(shù),單輸出。動(dòng)作網(wǎng)絡(luò)輸入層不需要u(t),神經(jīng)元為i-1個(gè),其余同評(píng)價(jià)網(wǎng)絡(luò)。兩個(gè)網(wǎng)絡(luò)權(quán)值更新算法均采用改進(jìn)的PSO算法。

      控制器采用的算法流程如下:

      流程圖如圖3所示。

      圖3 PSO-DHDP算法流程圖Fig.3 PSO-DHDP algorithm flow chart

      Setp1 初始化網(wǎng)絡(luò)權(quán)值wa1、wa2、wc1、wc2等相關(guān)參數(shù)。初始化評(píng)價(jià)網(wǎng)絡(luò)和動(dòng)作網(wǎng)絡(luò)的PSO參數(shù),最大迭代次數(shù)為Kmax,種群數(shù)量為N,種群維數(shù)為2*i*j。

      Setp2 根據(jù)式(6)、(7)計(jì)算u輸出給模型網(wǎng)絡(luò),同時(shí)反饋模型狀態(tài)變量,形成閉環(huán)控制。

      Setp3 評(píng)價(jià)網(wǎng)絡(luò)的誤差函數(shù)如式(3)所示,則評(píng)價(jià)網(wǎng)絡(luò)的PSO適應(yīng)度函數(shù)為

      Fc=1/Ec

      (8)

      結(jié)合式(3)、(8)計(jì)算計(jì)算評(píng)價(jià)網(wǎng)粒子的適應(yīng)度,初始化c_pbest、c_gbest。

      Setp4 已知?jiǎng)幼骶W(wǎng)絡(luò)的誤差函數(shù)如式(4)所示,則評(píng)價(jià)網(wǎng)絡(luò)的PSO適應(yīng)度函數(shù)為

      Fa=1/Ea

      (9)

      由式(4)、(9)計(jì)算計(jì)算動(dòng)作網(wǎng)粒子的適應(yīng)度,同時(shí)得到a_pbest、a_gbest。

      Setp5 首先根據(jù)式(5)分別更新評(píng)價(jià)網(wǎng)與動(dòng)作網(wǎng)粒子的位置與速度,將新的粒子代入網(wǎng)絡(luò)中并收集輸出的相關(guān)數(shù)據(jù),然后運(yùn)算得到相應(yīng)的適應(yīng)度值,并更新c_pbest、c_gbest、a_pbest、a_gbest,迭代次數(shù)k+1。

      Setp6 判斷是否達(dá)到終止條件,如果當(dāng)前迭代次數(shù)k≥kmax,則將c_gbest、a_gbest輸出分別代替評(píng)價(jià)網(wǎng)絡(luò)和動(dòng)作網(wǎng)絡(luò)的權(quán)值系數(shù);如果k

      Setp7 用更新了的評(píng)價(jià)網(wǎng)絡(luò)、動(dòng)作網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)對(duì)系統(tǒng)的控制,得到新的模型反饋?zhàn)兞?。重?fù)步驟Step2~Step7不斷訓(xùn)練網(wǎng)絡(luò)參數(shù),獲得最優(yōu)控制效果。

      3 PMSM矢量控制

      為了測(cè)試PSO-DHDP的可行性與優(yōu)劣,將上述算法加入到PMSM的矢量控制系統(tǒng)中,用以實(shí)現(xiàn)

      電機(jī)的快速啟動(dòng)與穩(wěn)定運(yùn)行。

      矢量控制系統(tǒng)采用電流、速度的雙閉環(huán)控制,電流傳感器、轉(zhuǎn)速傳感器采集電機(jī)運(yùn)行參數(shù)得到反饋信號(hào)。速度環(huán)實(shí)現(xiàn)電機(jī)反饋轉(zhuǎn)速ω自動(dòng)跟蹤參考轉(zhuǎn)速ω*,輸出iq*作為iq的參考電流。令id參考電流為0,實(shí)現(xiàn)磁場(chǎng)定向控制,參考電流與電機(jī)反饋電流比較得到控制信號(hào)。經(jīng)SVPWM控制逆變器產(chǎn)生脈沖控制電機(jī)轉(zhuǎn)動(dòng),在仿真系統(tǒng)中速度控制器是以PSO-DHDP為支持的控制器。系統(tǒng)框圖如圖4所示,粒子群參數(shù)設(shè)定如表1所示。

      表1 粒子群參數(shù)設(shè)定Table 1 PSO parameter setting

      圖4 PMSM矢量控制系統(tǒng)框圖Fig.4 PMSM vector control system block diagram

      由于電機(jī)控制不需要微分調(diào)節(jié),故而全部為1-2-1的PIDNN模型。三相電機(jī)參數(shù)設(shè)定:轉(zhuǎn)速n=2 000 r/min;轉(zhuǎn)動(dòng)慣量J=0.0008 kg·m2;定子相電感Ls=8.5 mH;極對(duì)數(shù)p=4;R=2.875 Ω;永磁體磁鏈ψf=0.175 WB;直流電壓Vdc=450 V;SVPWM采樣頻率Ts=0.0025 s,在0.1 s電機(jī)加入負(fù)載轉(zhuǎn)矩TN=5 N·m。

      分別利用傳統(tǒng)DHDP與PSO-DHDP構(gòu)成的速度控制器與電流控制器,實(shí)現(xiàn)對(duì)PMSM的控制。電機(jī)轉(zhuǎn)速、轉(zhuǎn)矩波形圖如圖5、圖6所示。兩項(xiàng)實(shí)驗(yàn)的結(jié)果如表2所示。

      在電機(jī)變載試驗(yàn)中,加入負(fù)載后的運(yùn)行狀態(tài)出現(xiàn)明顯變動(dòng)。PSO-DHDP在加入負(fù)載擾動(dòng)后需要0.028 s恢復(fù)系統(tǒng)穩(wěn)定,傳統(tǒng)DHDP算法需要0.046 s。

      圖5 電機(jī)轉(zhuǎn)速Fig.5 Motor speed

      圖6 電機(jī)轉(zhuǎn)矩Fig.6 Motor torque表2 實(shí)驗(yàn)結(jié)果 Table 2 Experiment results

      算法啟動(dòng)時(shí)間/s啟動(dòng)轉(zhuǎn)速波峰值/(r·m-1)加入負(fù)載后轉(zhuǎn)速波谷/(r·m-1)波動(dòng)時(shí)間/s啟動(dòng)轉(zhuǎn)矩波峰值/(N·m)加負(fù)載轉(zhuǎn)矩波峰/(N·m)PSO-DHDP0.048203317590.02818.17.3傳統(tǒng)DHDP0.059225617500.04627.68.6

      電機(jī)轉(zhuǎn)速出現(xiàn)短暫波動(dòng),轉(zhuǎn)速經(jīng)過(guò)一個(gè)波谷恢復(fù)轉(zhuǎn)速,PSO-DHDP控制電機(jī)受到干擾后轉(zhuǎn)速下降了12.05%,傳統(tǒng)DHDP則下降了12.5%;在轉(zhuǎn)矩增加過(guò)程中,PSO-DHDP的超調(diào)量為46%,傳統(tǒng)DHDP達(dá)到了72%??梢?jiàn)PSO-DHDP比傳統(tǒng)DHDP有更快的收斂速度、更好的動(dòng)態(tài)穩(wěn)定性和更強(qiáng)的抗干擾能力。

      4 結(jié) 語(yǔ)

      PSO-DHDP方法采用改進(jìn)的PSO算法代替?zhèn)鹘y(tǒng)DHDP算法中的梯度下降法,結(jié)合了PSO的快速收斂、不依賴(lài)梯度運(yùn)算與DHDP的在線(xiàn)學(xué)習(xí)能力的優(yōu)勢(shì),改進(jìn)后的權(quán)值更新方法使算法對(duì)權(quán)值的敏感度大為下降,保證了算法在無(wú)先驗(yàn)經(jīng)驗(yàn)的條件下也可以快速收斂。用PSO-DHDP和傳統(tǒng)DHDP分別設(shè)計(jì)PID控制器運(yùn)用在PMSM控制系統(tǒng)中,較于傳統(tǒng)DHDP,PSO-DHDP具有快速的收斂速度以及穩(wěn)定的控制效果,在工程中有巨大的實(shí)用潛力。

      [1] 段艷杰, 呂宜生, 張杰,等. 深度學(xué)習(xí)在控制領(lǐng)域的研究現(xiàn)狀與展望[J]. 自動(dòng)化學(xué)報(bào),2016,42(5):643-654. DUAN Yanjie, LU Yisheng, ZHANG Jie, et al. Deep learning for control: the sate of the art and prospects[J]. Acta Automation Sinica, 2016, 42(5): 643-654.

      [2] 張化光, 張欣, 羅艷紅,等. 自適應(yīng)動(dòng)態(tài)規(guī)劃綜述[J]. 自動(dòng)化學(xué)報(bào), 2013,39(4)303-311. ZHANG Huaguang, ZHANG Xin, LUO Yanhong, et al. An overview of research on adaptive dynamic programming[J]. Acta Automation Sinica, 2013, 39(4): 303-311.

      [3] WHITE D A, SOFGE D A. Handbook of Intelligent Control: Neural Fuzzy and Adaptive Approaches[M]. New York: Van Nostrand Reinhold, 1992.

      [4] SI J, BARTO A G, POWELL W B, et al. Handbook of learning and approximate dynamic programming: Scalingup to the real world[M]. New York: IEEE Press and John Wiley & Sons, 2004:1-17.

      [5] WANG F Y, ZHANG H G, LIU D R.Adaptive dynamic programming: an introduction[J]. IEEE Computational Intelligence Magazine, 2009, 4(2): 39-47.

      [6] LIU Wenxin, VENAYAGAMOORTHY G K, WUNCH D C. A heuristic dynamic programming based power system stabilizer for a turbogenerator in a single machine power system[J]. IEEE Transactions on Industry Applications, 2005,41(5):1377-1385.

      [7] PARK J W, HARLEY R G, VENAYAGAMOORTHY G K.Adaptive-critic-based optimal neurocontrol for synchronous generators in a power system using MLP/RBF neural networks[J].IEEE Transactions on Industry Applications, 2003, 39(5): 1529-1540.

      [8] SI J, WANG Y T. On-line learning control by association and reinforcement[J]. IEEE Transactions On Neural Networks, 2001, 12(2): 264-276.

      [9] 孫健, 劉鋒, SI J,等. 一種改進(jìn)的近似動(dòng)態(tài)規(guī)劃方法及其在SVC的應(yīng)用[J]. 電機(jī)與控制學(xué)報(bào),2011,15(5):95-102. SUN Jian, LIU Feng, SI J, et al. An improved approximate dynamic programming and its application in SVC control, 2011, 15(5): 95-102.

      [10] 馮冬青, 邢廣成, 費(fèi)敏銳,等. 基于改進(jìn)PSO算法的多變量PID型神經(jīng)網(wǎng)絡(luò)控制[J]. 系統(tǒng)仿真學(xué)報(bào),2011(2):363-366. FENG Dongqing, XING Guangcheng, FEI Minrui, et al. Improved PSO-based multivariable PID-like neural network control[J]. Journal of System Simulation, 2011 (2): 363-366.

      [11] 胡海波, 黃友銳. 基于混合PSO神經(jīng)網(wǎng)絡(luò)的自整定分?jǐn)?shù)階PID控制器[J]. 微電子學(xué)與計(jì)算機(jī),2010,27(5):157-161. HU Haibo, HUANG Yourui. Self-tuning fractional order PID based on hybrid PSO neural networks[J]. Microelectronics & Computer, 2010, 27(5): 157-161.

      (編輯 陳銀娥)

      Approximate dynamic programming based on PSO and its application in motor control

      DU Huidong1, QIU Ting1,ZHU Mingze2

      (1.School of Electric Engineering and Electronic Information, Xihua University, Chengdu 610039, China;2.Harbin Electric International Company Limited,Harbin 150028,China)

      An improved approximate dynamic programming algorithm based on particle swarm optimization (PSO) is proposed in order to control permanent magnet synchronous motor. Approximate dynamic programming is an online learning algorithm based on reinforcement learning theory, which can solve the Bellman problem by using the PID neural network as a tool. In traditional algorithm, back-propagation algorithm is introduced into the weight updating, which requires accurate first order derivative. If the gradients are not exact, algorithm will be very sensitive to make the choice of the network initial value, thus stability and convergence speed will be affected. As to the problem, the improved particle swarm optimization (PSO) algorithm is adopted which does not requires any gradient information and can guarantee the fast and stable convergence of the algorithm. Design of an online learning PID controller with particle swarm optimization algorithm and neural network approximate dynamic programming combined is used in the vector control system of permanent magnet synchronous motor (PMSM). The simulation results show that controller designed by algorithm improves response speed and accuracy of the control system, with better adaptability and robustness.

      approximate dynamic programming; particle swarm optimization; PID neural network; permanent magnet synchronous motor

      2017-02-16。

      教育部“春暉計(jì)劃”資助項(xiàng)目(Z2012029),四川省信號(hào)與信息處理重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金資助項(xiàng)目(szjj2012-015),西華大學(xué)研究生創(chuàng)新基金資助項(xiàng)目(ycjj2015098)。

      杜慧東(1991—),男,碩士研究生,研究方向?yàn)橹悄芸刂?、電機(jī)控制。

      TM301.2

      A

      2095-6843(2017)03-0235-05

      猜你喜歡
      隱層權(quán)值粒子
      一種融合時(shí)間權(quán)值和用戶(hù)行為序列的電影推薦模型
      CONTENTS
      基于RDPSO結(jié)構(gòu)優(yōu)化的三隱層BP神經(jīng)網(wǎng)絡(luò)水質(zhì)預(yù)測(cè)模型及應(yīng)用
      人民珠江(2019年4期)2019-04-20 02:32:00
      基于粒子群優(yōu)化的橋式起重機(jī)模糊PID控制
      基于粒子群優(yōu)化極點(diǎn)配置的空燃比輸出反饋控制
      基于權(quán)值動(dòng)量的RBM加速學(xué)習(xí)算法研究
      基于近似結(jié)構(gòu)風(fēng)險(xiǎn)的ELM隱層節(jié)點(diǎn)數(shù)優(yōu)化
      最優(yōu)隱層BP神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷
      基于Matlab的α粒子的散射實(shí)驗(yàn)?zāi)M
      物理與工程(2014年4期)2014-02-27 11:23:08
      基于兩粒子糾纏態(tài)隱形傳送四粒子GHZ態(tài)
      南昌市| 合山市| 长岛县| 千阳县| 湖南省| 确山县| 济宁市| 诏安县| 五大连池市| 新源县| 阿勒泰市| 丹寨县| 益阳市| 蕲春县| 太和县| 亚东县| 平遥县| 绥宁县| 治多县| 霍城县| 敖汉旗| 榆中县| 齐河县| 鄂尔多斯市| 宁乡县| 长丰县| 安徽省| 永安市| 凤冈县| 会同县| 华池县| 历史| 达孜县| 郴州市| 苏尼特右旗| 潞城市| 息烽县| 长汀县| 琼结县| 额尔古纳市| 古交市|