張政煊 ,楊翊卓 ,代 偉?,周 平 ,楊春雨
(1.中國礦業(yè)大學(xué)信息與控制工程學(xué)院,江蘇徐州 221008;2.北京科技大學(xué)自動(dòng)化學(xué)院,北京 100083;3.東北大學(xué)流程工業(yè)綜合自動(dòng)化國家重點(diǎn)實(shí)驗(yàn)室,遼寧沈陽 110819)
非線性系統(tǒng)的控制是控制理論與應(yīng)用中的重要研究課題,在實(shí)際應(yīng)用中非線性系統(tǒng)普遍存在,如煤炭洗選過程[1]、無人機(jī)姿態(tài)控制[2]、工業(yè)機(jī)器人操縱系統(tǒng)[3]等.尤其針對(duì)復(fù)雜工業(yè)過程,如冶金、選礦等,其大多是一個(gè)氣、液、固多相共存的連續(xù)化復(fù)雜物質(zhì)轉(zhuǎn)化過程,不確定干擾眾多,工況動(dòng)態(tài)變化,難以根據(jù)其機(jī)理結(jié)構(gòu)建立精確的數(shù)學(xué)模型[4].隨著自動(dòng)控制領(lǐng)域的專家和學(xué)者的不斷研究,在模仿生物適應(yīng)能力的基礎(chǔ)上建立了自適應(yīng)控制方法[5].自適應(yīng)控制方法針對(duì)具有不確定性的被控對(duì)象,根據(jù)系統(tǒng)的變化自動(dòng)調(diào)節(jié)控制器的參數(shù)[6].對(duì)具有復(fù)雜動(dòng)態(tài)特性的非線性系統(tǒng)而言,建立精確且便于控制器設(shè)計(jì)的模型是其自適應(yīng)控制的基礎(chǔ)和亟待解決的關(guān)鍵問題.
近年來,控制領(lǐng)域的學(xué)者深入研究了復(fù)雜工況下的非線性系統(tǒng)的系統(tǒng)辨識(shí)及控制問題[7–9].隨著神經(jīng)網(wǎng)絡(luò)可以任意精度逼近非線性函數(shù)的特性不斷被推廣,神經(jīng)網(wǎng)絡(luò)被認(rèn)為是辨識(shí)非線性系統(tǒng)模型參數(shù)和優(yōu)化控制的新途徑.譚永紅[10]提出利用Specialised learning算法在BP(back propagation)神經(jīng)網(wǎng)絡(luò)框架下對(duì)被控對(duì)象進(jìn)行在線辨識(shí)和控制,實(shí)現(xiàn)自適應(yīng)控制.上述方法利用神經(jīng)網(wǎng)絡(luò)辨識(shí)非線性系統(tǒng)時(shí),其網(wǎng)絡(luò)結(jié)構(gòu)難以確定,參數(shù)迭代過程復(fù)雜,不利于在線辨識(shí)和控制器設(shè)計(jì).
Chen和Narendra[11]首先提出了將一類離散時(shí)間非線性動(dòng)態(tài)系統(tǒng)表示成線性模型與高階非線性項(xiàng)(未建模動(dòng)態(tài))的組合模型.在此基礎(chǔ)上,文獻(xiàn)[12]采用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)逼近輸入–輸出非線性模型,并利用李雅普諾夫分析方法證明了閉環(huán)系統(tǒng)中所有信號(hào)都是半全局一致最終有界.文獻(xiàn)[13]研究了一種由改進(jìn)的投影算法與基于BP神經(jīng)網(wǎng)絡(luò)的未建模動(dòng)態(tài)估計(jì)算法構(gòu)造非線性系統(tǒng)的交替辨識(shí)方案.文獻(xiàn)[14]提出在交替辨識(shí)的估計(jì)模型基礎(chǔ)上開發(fā)非線性自適應(yīng)控制器,嚴(yán)格進(jìn)行了穩(wěn)定性及收斂性的分析,并放寬了系統(tǒng)零動(dòng)態(tài)漸近穩(wěn)定的條件,使得交替辨識(shí)非線性系統(tǒng)的方案在自適應(yīng)控制中得到了推廣.文獻(xiàn)[15]在未建模動(dòng)態(tài)的增長率不超過其數(shù)據(jù)向量所在的緊集的輸入向量的假設(shè)下,將非線性系統(tǒng)表示為線性部分和未建模動(dòng)力學(xué)的組合,利用ANFIS(adaptive-networkbased fuzzy inference system)對(duì)未建模的動(dòng)力學(xué)進(jìn)行了估計(jì).在實(shí)際應(yīng)用時(shí),考慮到控制器采用其他控制策略如滑??刂破鲿r(shí),其抖振會(huì)擴(kuò)大控制系統(tǒng)的未建模動(dòng)態(tài)產(chǎn)生的影響,從而惡化系統(tǒng)的控制性能[16],一般直接使用離散時(shí)間的PI控制器設(shè)計(jì)虛擬未建模動(dòng)態(tài)補(bǔ)償?shù)淖赃m應(yīng)控制系統(tǒng).文獻(xiàn)[17]利用前一時(shí)刻虛擬未建模動(dòng)態(tài)可測的特點(diǎn),采用虛擬未建模動(dòng)態(tài)補(bǔ)償?shù)囊徊阶顑?yōu)PI控制策略設(shè)計(jì)供水溫度控制器,通過理論分析和半實(shí)物仿真實(shí)驗(yàn)結(jié)果表明方法的有效性.文獻(xiàn)[18]提出了一種改進(jìn)的非線性系統(tǒng)交替辨識(shí)的智能建模方法,采用帶遺忘因子的遞推最小二乘法辨識(shí)低階模型的未知參數(shù),然后利用隨機(jī)配置網(wǎng)絡(luò)進(jìn)行估計(jì)高階非線性部分.上述方法交替辨識(shí)非線性系統(tǒng)的組合模型,并設(shè)計(jì)帶未建模動(dòng)態(tài)補(bǔ)償?shù)姆蔷€性自適應(yīng)控制方法.然而,交替辨識(shí)的模型參數(shù)[19]將產(chǎn)生計(jì)算損耗,且難以確保整體系統(tǒng)的殘差收斂,進(jìn)而影響自適應(yīng)控制系統(tǒng)的性能.
本文針對(duì)基于交替辨識(shí)算法的自適應(yīng)控制方法研究存在的非線性系統(tǒng)辨識(shí)精度低的問題,提出一種基于整體辨識(shí)策略的非線性自適應(yīng)控制方法.首先,利用低階線性模型與未建模動(dòng)態(tài)項(xiàng)組成的模型類量化非線性系統(tǒng),建立隨機(jī)向量函數(shù)(random vector function link,RVFL)網(wǎng)絡(luò)模型與量化后的非線性系統(tǒng)數(shù)學(xué)模型之間的等價(jià)關(guān)系,并融入權(quán)值偏差懲罰項(xiàng),設(shè)計(jì)網(wǎng)絡(luò)模型參數(shù)在線更新算法;其次,根據(jù)控制輸出的一步預(yù)報(bào)的最小方差指標(biāo)計(jì)算線性控制器參數(shù),并利用未建模動(dòng)態(tài)項(xiàng)的補(bǔ)償?shù)窒]環(huán)系統(tǒng)中復(fù)雜動(dòng)態(tài)的影響;最后,在數(shù)值仿真研究和工業(yè)應(yīng)用仿真研究中與基于交替辨識(shí)算法的自適應(yīng)控制方法對(duì)比,驗(yàn)證所提的非線性自適應(yīng)控制方法跟蹤控制和穩(wěn)定控制能力的優(yōu)越性.
本文的被控對(duì)象為一類單輸入單輸出(single input single output,SISO)離散的非線性系統(tǒng),即
其中:u(k)和y(k)分別是系統(tǒng)的輸入和輸出;f(·)∈R是未知的非線性函數(shù);nA和nB為系統(tǒng)的階次;原點(diǎn)是平衡點(diǎn).由非線性系統(tǒng)的特性分析可知,y(k+1)與過去時(shí)刻的輸入、輸出數(shù)據(jù)存在某種映射關(guān)系,令
其中p=nA+nB+1.則式(1)中的非線性系統(tǒng)可由包含非線性系統(tǒng)當(dāng)前及歷史時(shí)刻的輸入、輸出p維向量X(k)表示,即
針對(duì)上述這一類非線性被控對(duì)象,控制目標(biāo)是要求被控輸出跟蹤參考輸入,參考輸入往往在工作點(diǎn)附近.因此可將系統(tǒng)作簡化處理,在工作點(diǎn)附近將被控對(duì)象線性化可以得到線性模型.簡化后得到的工作點(diǎn)附近的線性模型使得系統(tǒng)部分動(dòng)態(tài)特性的丟失,往往達(dá)不到理想的要求,有時(shí)甚至還產(chǎn)生振蕩和發(fā)散.因此,可在工作點(diǎn)附近,將非線性系統(tǒng)表示為低階線性模型和未建模動(dòng)態(tài)的組合形式,且低階線性模型用時(shí)延算子z-1的多項(xiàng)式A(z-1),B(z-1)表示,即
其中:ai(i=1,···,nA)和bj(j=1,···,nB)為非線性系統(tǒng)在工作點(diǎn)處的一階Taylor系數(shù);v([X(k)])是虛擬未建模動(dòng)態(tài)項(xiàng),v([X(k)])有界,即|v([X(k)])|≤M.
進(jìn)一步變換可得
隨機(jī)向量函數(shù)鏈接(RVFL)網(wǎng)絡(luò)由Pao和Takefuji[21]于1992年首次提出,其主要特點(diǎn)是: 1)輸入層權(quán)值和隱含層偏置在特定范圍內(nèi)隨機(jī)選取,與基于梯度的學(xué)習(xí)算法不同,不需要事先預(yù)設(shè)定過多參數(shù)和耗費(fèi)大量的時(shí)間使算法收斂;2)輸入數(shù)據(jù)做非線性變換后的增強(qiáng)層與輸入層共同連接至輸出層,使得增強(qiáng)節(jié)點(diǎn)的計(jì)算分擔(dān)更小,所需節(jié)點(diǎn)數(shù)更少.RVFL網(wǎng)絡(luò)憑借離線建模速度快、泛化能力強(qiáng)的優(yōu)點(diǎn)使其在非線性系統(tǒng)回歸建模和控制問題中得到廣泛應(yīng)用[22].
給定N組離線數(shù)據(jù)集Z={x(k),y(k+1)},x(k)∈Rm,y(k+1)∈Rn,k=1,2,···,N.xi,yi分別為n維輸入向量和m維輸出向量,則具有L個(gè)隱含層節(jié)點(diǎn),且激活函數(shù)為Sigmoid函數(shù)的RVFL網(wǎng)絡(luò)訓(xùn)練所得的預(yù)報(bào)模型可以表示為
其中:ωj和bj為增強(qiáng)節(jié)點(diǎn)的輸入權(quán)值和偏置;w1,i為直接鏈接的輸出權(quán)值;w2,j為增強(qiáng)鏈接的輸出權(quán)值;hj為激活函數(shù),表示增強(qiáng)特征的非線性映射.
RVFL網(wǎng)絡(luò)是在固定范圍內(nèi)隨機(jī)分配隱藏層的權(quán)值與偏差后保持不變,在線學(xué)習(xí)中唯一不確定的參數(shù)就是最小二乘法求解的輸出權(quán)值.為避免完全隨機(jī)分配的輸入權(quán)值與隱藏層的偏差值導(dǎo)致模型的性能和穩(wěn)定性出現(xiàn)波動(dòng),本文將改進(jìn)了輸出權(quán)值學(xué)習(xí)的目標(biāo)函數(shù),提高了RVFL網(wǎng)絡(luò)辨識(shí)非線性系統(tǒng)參數(shù)的準(zhǔn)確性.
針對(duì)交替辨識(shí)算法存在辨識(shí)誤差限增長的問題,本文利用一種帶有輸出權(quán)值偏差約束的RVFL網(wǎng)絡(luò),提出一種具有數(shù)值穩(wěn)定性的非線性系統(tǒng)辨識(shí)方案.設(shè)計(jì)思想是: 利用低階線性模型的輸出辨識(shí)RVFL網(wǎng)絡(luò)的直鏈輸出權(quán)值,即線性模型參數(shù);根據(jù)網(wǎng)絡(luò)的輸出殘差e′構(gòu)建RVFL網(wǎng)絡(luò)的增強(qiáng)鏈接.避免了交替辨識(shí)導(dǎo)致的誤差限上升的風(fēng)險(xiǎn),與交替辨識(shí)的方案對(duì)比如圖1所示.
圖1 交替辨識(shí)算法與基于隨機(jī)向量函數(shù)鏈接(RVFL)網(wǎng)絡(luò)辨識(shí)算法的對(duì)比Fig.1 Comparison between alternating identification algorithm and network identification algorithm based on random vector function linking(RVFL)network
對(duì)階次如式(1)所示的非線性系統(tǒng),將以[y(k)···y(k-nA+1)u(k)···u(k-nB)]作為RVFL網(wǎng)絡(luò)輸入,故將式(8)進(jìn)一步改寫為
基于RVFL網(wǎng)絡(luò)的整體辨識(shí)策略通過網(wǎng)絡(luò)輸出殘差逼近非線性系統(tǒng),確保辨識(shí)結(jié)果收斂于非線性系統(tǒng)輸出的實(shí)際值.
非線性自適應(yīng)控制的控制性能依賴于模型的精度.當(dāng)系統(tǒng)輸入發(fā)生變化時(shí),實(shí)際非線性模型的參數(shù)也會(huì)發(fā)生變化.考慮到工業(yè)過程普遍存在的慢時(shí)變特性[23],故本文在RVFL網(wǎng)絡(luò)模型參數(shù)在線學(xué)習(xí)中引入輸出權(quán)值的偏差約束,以下給出RVFL網(wǎng)絡(luò)輸出權(quán)值的在線學(xué)習(xí)過程.
RVFL網(wǎng)絡(luò)輸出權(quán)值學(xué)習(xí)的目標(biāo)函數(shù)[21]為
可視作非線性系統(tǒng)實(shí)際值與估計(jì)值之間的誤差辨識(shí)準(zhǔn)則.
在線學(xué)習(xí)中引入輸出偏差懲罰項(xiàng)和正則化項(xiàng)后的目標(biāo)函數(shù)[23]為
考慮到在實(shí)際非線性系統(tǒng)中,低階線性模型與未建模動(dòng)態(tài)項(xiàng)具有不同的特性,對(duì)RVFL直鏈與增強(qiáng)鏈接的輸出權(quán)值偏差懲罰項(xiàng)的系數(shù)矩陣分開設(shè)計(jì),定義如下:
式(12)對(duì)Wk求導(dǎo)得
注1由于RVFL網(wǎng)絡(luò)具有萬能逼近性[24],因此,只要選擇合適的增強(qiáng)節(jié)點(diǎn)數(shù),則對(duì)任意的正數(shù)ε>0,必存在一個(gè)理想的網(wǎng)絡(luò)模型使得估計(jì)誤差可以任意小,使估計(jì)誤差e′(k)滿足|e′(k)|=|y(k)-(k)|<ε.
本文采用一種帶虛擬未建模動(dòng)態(tài)補(bǔ)償?shù)目刂葡到y(tǒng)框架[24],根據(jù)線性模型參數(shù)設(shè)計(jì)線性控制器,同時(shí),通過虛擬未建模動(dòng)態(tài)項(xiàng)設(shè)計(jì)補(bǔ)償器,消除虛擬未建模動(dòng)態(tài)對(duì)閉環(huán)系統(tǒng)的影響.控制系統(tǒng)的結(jié)構(gòu)如圖2所示.
圖2 基于RVFL模型的未建模動(dòng)態(tài)補(bǔ)償自適應(yīng)控制結(jié)構(gòu)圖Fig.2 Structure diagram of adaptive control method for virtual unmodeled dynamic compensation
線性控制器采用PI控制器[25],進(jìn)行移項(xiàng)及合并同類項(xiàng)得
其中:kP,kI為PI 控制器的比例、積分系數(shù);K(z-1)和H(z-1)是z-1的多項(xiàng)式;e(k)為跟蹤誤差;e(k)=ysp(k)-y(k),ysp(k)為理想輸出.
將式(15)改寫為
其中:G(z-1)為z-1的時(shí)延算子G(z-1)=g0+g1z-1,g0=kP+kI,g1=kP.
本文的自適應(yīng)控制方法的基礎(chǔ)是非線性系統(tǒng)的辨識(shí).通過式(14)獲得RVFL 網(wǎng)絡(luò)的權(quán)值向量Wk,結(jié)合一步超前最優(yōu)控制策略求解最優(yōu)控制律[14].
將PI控制器的控制輸入式(16)代入RVFL網(wǎng)絡(luò)辨識(shí)所得的非線性系統(tǒng)式(11),并由(k)=W2THv可得到閉環(huán)方程為
為消除非線性動(dòng)態(tài)項(xiàng)的影響,可令H(z-1)-B(z-1)K(z-1)=0,即可得到K(z-1)為
為求解G(z-1)引入一步超前最優(yōu)控制策略,將下一時(shí)刻的輸出y(k+1)與理想輸出y?(k+1)的誤差滿足方差最小情況時(shí)的輸入看作是最優(yōu)的控制輸入,具體步驟如下:
步驟1設(shè)計(jì)未建模動(dòng)態(tài)項(xiàng)補(bǔ)償.引入Diophantine方程
對(duì)式(16)等式兩邊同乘以F(z-1),則有
其中P(z-1),H(z-1)均為關(guān)于z-1的加權(quán)多項(xiàng)式.
步驟2設(shè)計(jì)控制性能指標(biāo).定義廣義輸出誤差為
定義性能指標(biāo)為被控對(duì)象輸出的理想誤差eg×(k+1)的方差,即
步驟3求解最優(yōu)控制律u(k).顯然使得誤差eg×(k+1)的方差最小時(shí),使式(23)極小的最優(yōu)控制.F(z-1)已知的條件下,G(z-1)由Diophantine 方程(19)唯一確定.將式(20)代入式(23),并令J=0,得到非線性系統(tǒng)的最優(yōu)控制律為
由式(16)和式(24)可得,F(z-1)可通過如下對(duì)應(yīng)關(guān)系求解:
根據(jù)Jury判據(jù),需離線選擇P(z-1)和Q(z-1)使得下式成立:
選定P(z-1)=1,通過式(20)(26)計(jì)算可得G(z-1),可得PI控制器參數(shù)如下:
為了消除未建模動(dòng)態(tài)v(k)對(duì)閉環(huán)系統(tǒng)的影響,通過選定的Q(z-1),由式(18)(21)(25)以及式(27)可知選擇(z-1)應(yīng)滿足
因此,PI控制器式(15)中的K(z-1)可表示為
以下將給出本文所述的自適應(yīng)控制方法的穩(wěn)定性分析.
引理1根據(jù)RVFL網(wǎng)絡(luò)模型參數(shù)描述的非線性系統(tǒng)(11),系統(tǒng)的輸入輸出動(dòng)態(tài)特性方程如下,式中省去了多項(xiàng)式z-1,即
采用類似于文獻(xiàn)[25]的方法可證明引理1.
定理1假定系統(tǒng)(4)滿足如下假設(shè)條件:
1) 系統(tǒng)的未建模動(dòng)態(tài)項(xiàng)v(X(k))有界;
2)b0>bmin>0,B(1)0;
3) 選擇合適的Q(z-1)使其滿足
則有
a) 閉環(huán)系統(tǒng)有界輸入和有界輸出(bounded input bounded output,BIBO)穩(wěn)定,即
b) 當(dāng)k→∞時(shí),系統(tǒng)的跟蹤誤差有界.即
其中:ysp(k)為系統(tǒng)的期望輸出;ξ=2εδM,ε為任意小的正數(shù),δ為大于0的常數(shù).
由文獻(xiàn)[23]得證定理1條件3)的a)項(xiàng)成立.
定理1條件3)的b)項(xiàng)證明如下.
證當(dāng)k→∞時(shí),有
本文的非線性自適應(yīng)控制方法的步驟如下:
步驟1初始化RVFL網(wǎng)絡(luò).設(shè)置RVFL網(wǎng)絡(luò)的最大節(jié)點(diǎn)數(shù)和網(wǎng)絡(luò)初始?xì)埐钪?計(jì)算直鏈的輸出權(quán)值;
步驟2構(gòu)建RVFL網(wǎng)絡(luò)離線模型.不斷地加入增強(qiáng)節(jié)點(diǎn)逼近非線性系統(tǒng)的輸出,若輸出誤差小于設(shè)定的殘差值,記錄下離線訓(xùn)練所得的網(wǎng)絡(luò)輸出權(quán)重,作為在線學(xué)習(xí)過程的初始權(quán)重,并執(zhí)行下一步;
步驟3初始化線性控制器與未建模動(dòng)態(tài)補(bǔ)償器.根據(jù)網(wǎng)絡(luò)的初始權(quán)重、離線選擇的Q(z-1)并計(jì)算F(z-1),由式(21)(24)和式(29)–(30)計(jì)算線性控制器kP和kI的初始值,根據(jù)式(32)計(jì)算未建模動(dòng)態(tài)補(bǔ)償器增益K(z-1)初始值;
步驟4在線采集被控制系統(tǒng)的輸入輸出數(shù)據(jù).構(gòu)建k時(shí)刻的網(wǎng)絡(luò)輸入,根據(jù)式(14)在線學(xué)習(xí)k+1時(shí)刻的網(wǎng)絡(luò)輸出權(quán)值Wk;
步驟5根據(jù)k+1時(shí)刻的直鏈與增強(qiáng)鏈接的輸出權(quán)值,按照步驟3的過程調(diào)整k+1時(shí)刻的線性控制器參數(shù)和建模動(dòng)態(tài)補(bǔ)償器增益;
步驟6若模型精度不能達(dá)到性能要求,則調(diào)整殘差容忍度的設(shè)定值,并返回步驟2,否則返回步驟4.
根據(jù)上述方法步驟進(jìn)行仿真研究,并選取合適的輸出權(quán)值懲罰系數(shù)C和輸出權(quán)值偏差懲罰項(xiàng)系數(shù)k1和k2以及時(shí)延算子多項(xiàng)式P(z-1)和Q(z-1).
為驗(yàn)證本文提出的控制方法的有效性,考慮如下的離散時(shí)間非線性系統(tǒng):
顯然,系統(tǒng)的階次nA=2,nB=1.系統(tǒng)的參數(shù)多項(xiàng)式為
非線性系統(tǒng)數(shù)值模型的未建模動(dòng)態(tài)項(xiàng)為0.02 sin(0.5y(t)u(t)+2y(t-1)u(t-1))全局有界,滿足定理1的條件1).
控制目標(biāo)是: 使得系統(tǒng)輸出y(t)分別跟蹤參考軌跡w(t)=2(0≤t≤100,200 基于整體辨識(shí)策略的非線性自適應(yīng)控制方法中包含若干重要的參數(shù),令離線數(shù)據(jù)的維數(shù)N=5000組,設(shè)置網(wǎng)絡(luò)的最大節(jié)點(diǎn)數(shù)Lmax=1000,網(wǎng)絡(luò)的殘差為4.5×e-3.離線選擇時(shí)延算子多項(xiàng)式P(z-1)=1,Q(z-1)=0.2. 在仿真中,采用設(shè)定值跟蹤均方根誤差(root mean square error,RMSE)作為控制的性能指標(biāo),記作AC(adaptive control)–RSME,采用非線性系統(tǒng)模型估計(jì)值與實(shí)際值均方根誤差驗(yàn)證辨識(shí)算法的性能指標(biāo)記作MI(model identification)–RSME,表達(dá)式如下: 可以看出,所提基于RVFL網(wǎng)絡(luò)整體辨識(shí)策略的非線性自適應(yīng)控制方法,能夠?qū)﹄x散時(shí)間的非線性系統(tǒng)進(jìn)行有效的控制.將基于投影算法和隨機(jī)配置網(wǎng)絡(luò)(stochastic configuration networks,SCNs)交替辨識(shí)的模型[18]應(yīng)用于非線性自適應(yīng)控制方法中與本文方法進(jìn)行對(duì)比,仿真結(jié)果如圖3–5和表1所示.相比較,所提方法的設(shè)定值跟蹤性能更好,并且具有更好的動(dòng)態(tài)跟蹤和穩(wěn)態(tài)性能.這是由于所提方法的辨識(shí)模型通過整體的非線性系統(tǒng)輸出殘差e′與設(shè)定的殘差容忍度不斷迭代計(jì)算,使得離線模型小于設(shè)定精度逼近數(shù)值模型(39).基于投影算法和SCNs的非線性自適應(yīng)控制方法需要更長的時(shí)間達(dá)到滿意的跟蹤控制效果,且在設(shè)定值發(fā)生變化后的一段時(shí)間內(nèi)仍會(huì)有較大幅度的跟蹤誤差,是由交替辨識(shí)的算法不能夠保證對(duì)非線性系統(tǒng)模型的逼近性能導(dǎo)致的. 圖3 基于不同模型自適應(yīng)控制方法的輸出Fig.3 Output of adaptive control methods based on different models 圖4 基于不同模型自適應(yīng)控制方法的輸出誤差Fig.4 Output error of adaptive control methods based on different models 圖5 模型辨識(shí)誤差對(duì)比Fig.5 Comparison of model identification errors 重介質(zhì)選煤控制系統(tǒng)在實(shí)際生產(chǎn)過程中,主要是通過調(diào)整重介質(zhì)懸浮液密度控制分選效果,而灰分含量是評(píng)價(jià)煉焦精煤產(chǎn)品質(zhì)量的重要的運(yùn)行指標(biāo).利用式(4)的非線性模型描述重介質(zhì)選煤灰分含量控制回路的動(dòng)態(tài)過程,辨識(shí)此回路過程的線性模型參數(shù)和估計(jì)未建模動(dòng)態(tài)項(xiàng),并設(shè)計(jì)線性控制器和補(bǔ)償器. 如圖6所示,重介質(zhì)選煤過程[26]主要涉及混料、重介質(zhì)旋流器分選以及重介質(zhì)回收,主要過程為:首先,將原煤與重介質(zhì)懸浮液充分混合;其次,在重介質(zhì)旋流器中分離混合礦漿;最后,回收稀釋的重介質(zhì)液.主要涉及的參數(shù)包括重介質(zhì)懸浮液介質(zhì)流量Qm,合格介質(zhì)桶中加入水的密度ρw,回收礦漿中重介質(zhì)的密度,向合格介質(zhì)桶中加入高濃介質(zhì)的密度ρmm,磁選機(jī)出口處重介質(zhì)的密度ρrm,合格介質(zhì)桶中重介質(zhì)懸浮液的體積Vcor,加水閥門系數(shù)Cw,參考實(shí)際重介質(zhì)選煤過程采用文獻(xiàn)[24]的數(shù)據(jù)設(shè)計(jì)上述過程參數(shù)并搭建模型采集輸入輸出數(shù)據(jù),具體如表2所示. 表2 重介質(zhì)選煤過程工藝參數(shù)Table 2 Dense medium coal separation process parameters 圖6 重介質(zhì)選煤過程工藝流程圖Fig.6 Dense medium coal separation process flow chart 令網(wǎng)絡(luò)輸入數(shù)據(jù)向量的維數(shù)N=6000,設(shè)置網(wǎng)絡(luò)的最大節(jié)點(diǎn)數(shù)Lmax=1000,網(wǎng)絡(luò)的殘差容忍度為8.3×e-2.得到離線辨識(shí)的低階線性模型參數(shù)如下: 將初始的控制信號(hào)重介質(zhì)懸浮液的密度u(0)=1530 kg/m3;運(yùn)行指標(biāo)精煤灰分含量的初始值設(shè)為y(0)=14%.根據(jù)煉焦煤產(chǎn)品按照灰分指標(biāo)的不同分級(jí),驗(yàn)證本文方法在不同設(shè)定值工況下的跟蹤控制性能,初始時(shí)刻精煤規(guī)格為3級(jí),其他用煉焦精煤(14%);20 min時(shí),調(diào)整為10級(jí)冶煉用煉焦精煤(10%);40 min時(shí)調(diào)整為6級(jí)冶煉用煉焦精煤(8%).給煤量為8 kg/s,同時(shí)設(shè)定[-1,1]的隨機(jī)動(dòng)態(tài)變化量,在此工況下對(duì)灰分含量進(jìn)行跟蹤控制. 設(shè)定值跟蹤控制仿真的研究中基于不同模型的控制方法效果如圖7–9所示.基于各模型的控制方法的性能指標(biāo)如表3所示.本文方法中通過試湊法選擇輸出權(quán)值懲罰系數(shù)C=85,偏差懲罰項(xiàng)系數(shù)k1=104,k2=10-2. 表3 基于不同模型的灰分含量跟蹤控制性能對(duì)比Table 3 Comparison of ash content control perfor-mance 圖7 重介質(zhì)選煤灰分含量跟蹤控制輸出Fig.7 Tracking control output of ash content in dense medium coal separation 圖8 重介質(zhì)選煤灰分含量跟蹤控制輸出誤差Fig.8 Output error of ash content tracking control in dense medium coal separation 圖9 重介質(zhì)選煤灰分含量控制回路的模型估計(jì)誤差Fig.9 Comparison of model identification errors 對(duì)比3種控制方法,其中基于交替辨識(shí)模型的自適應(yīng)控制方法引入了未建模動(dòng)態(tài)項(xiàng)的補(bǔ)償,性能指標(biāo)AC–RSME和MI–RSME優(yōu)于基于線性模型的自適應(yīng)控制方法.但交替辨識(shí)所得的模型無法保證收斂于實(shí)際的模型輸出.而本文基于RVFL網(wǎng)絡(luò)的非線性自適應(yīng)控制方法,利用RVFL網(wǎng)絡(luò)根據(jù)整體辨識(shí)策略迭代計(jì)算網(wǎng)絡(luò)的增強(qiáng)節(jié)點(diǎn)參數(shù),能夠保證灰分含量控制系統(tǒng)的輸出誤差上界為ξ=2εδM.最后,得出對(duì)灰分含量設(shè)定值跟蹤控制滿意的輸出. 本文提出了一種基于整體辨識(shí)策略的非線性自適應(yīng)控制方法.主要貢獻(xiàn)是: 1)針對(duì)低階線性模型與未建模動(dòng)態(tài)項(xiàng)的非線性系統(tǒng)組合模型,提出利用RVFL網(wǎng)絡(luò)的直鏈與增強(qiáng)結(jié)構(gòu)特性進(jìn)行整體辨識(shí);2)針對(duì)具有慢時(shí)變特征的非線性系統(tǒng),提出一種輸出權(quán)值偏差約束的在線學(xué)習(xí)方法;3)根據(jù)RVFL網(wǎng)絡(luò)在線辨識(shí)的模型參數(shù),設(shè)計(jì)未建模動(dòng)態(tài)項(xiàng)補(bǔ)償?shù)姆蔷€性自適應(yīng)控制方法.所提方法在數(shù)值仿真和工業(yè)應(yīng)用仿真研究中驗(yàn)證了有效性和優(yōu)越性. 針對(duì)實(shí)際應(yīng)用中面臨的潛在問題,需要進(jìn)一步開展下列研究:1)實(shí)際應(yīng)用中難以測量大滯后以及非高斯變量的統(tǒng)計(jì)特性,應(yīng)考慮基于輸出變量概率密度函數(shù)設(shè)計(jì)控制律;2)該方法依賴于模型的辨識(shí)精度,應(yīng)結(jié)合實(shí)際生產(chǎn)過程建立具有魯棒性的RVFL網(wǎng)絡(luò)模型,克服離群點(diǎn)干擾.此外,未來在理論上考慮從放松未建模動(dòng)態(tài)有界條件的方面開展工作.6 工業(yè)應(yīng)用仿真研究
7 結(jié)論與展望