馬永娟 尹燕莉 馬什鵬
(重慶交通大學(xué)機(jī)電與車輛工程學(xué)院)
近年來,有越來越多的學(xué)者應(yīng)用模型預(yù)測(cè)控制(Model Predictive Control,MPC)來解決混合動(dòng)力汽車能量管理優(yōu)化問題[1-11]。它的主要原理是可以通過提前預(yù)測(cè)獲取未來有限時(shí)間內(nèi)的車輛運(yùn)行信息,然后實(shí)施轉(zhuǎn)矩的優(yōu)化分配??刹捎弥笖?shù)預(yù)測(cè)[12]、馬爾科夫鏈[13]等方法預(yù)測(cè)未來時(shí)間內(nèi)的車輛運(yùn)行狀態(tài),然后優(yōu)化算法[14-17]對(duì)預(yù)測(cè)信息進(jìn)行求解。本文以超輕度混合動(dòng)力汽車為研究對(duì)象,提出基于動(dòng)態(tài)規(guī)劃(DP)求解的隨機(jī)模型預(yù)測(cè)控制能量管理策略。
本文對(duì)一款具有并聯(lián)結(jié)構(gòu)的超輕度混合動(dòng)力汽車展開研究。其主要部件除了發(fā)動(dòng)機(jī)、電動(dòng)機(jī)及電池外,增加了一個(gè)回流式無級(jí)自動(dòng)變速傳動(dòng)系統(tǒng)實(shí)現(xiàn)動(dòng)力源之間的傳遞。該車具有純發(fā)動(dòng)機(jī)驅(qū)動(dòng)、純電機(jī)驅(qū)動(dòng)、行車充電及制動(dòng)能量回收4個(gè)工作模式。結(jié)構(gòu)簡(jiǎn)圖如圖1所示。
圖1 超輕度混合動(dòng)力汽車結(jié)構(gòu)簡(jiǎn)圖
汽車在行駛的過程中,需要克服滾動(dòng)阻力、空氣阻力以及加速阻力(本文不考慮坡度阻力)。車輛在任意工況下的整車縱向動(dòng)力學(xué)模型如式(1):
式中:Tq——車輛需求轉(zhuǎn)矩,N·m;
m——整車質(zhì)量,kg;
g——重力加速度,m/s2;
f、Cd、δ——車輛的輪胎滾動(dòng)阻力系數(shù)、空氣阻力
系數(shù)、旋轉(zhuǎn)質(zhì)量換算系數(shù);
A——迎風(fēng)面積,m2;
d v/d t——車輛加速度,m/s2;
r——車輪半徑,m。
2.1.1 模型預(yù)測(cè)控制原理
模型預(yù)測(cè)控制(MPC)是一種先進(jìn)的控制方法,在工業(yè)控制中得到廣泛應(yīng)用。它主要以不同預(yù)測(cè)模型為基礎(chǔ),預(yù)測(cè)系統(tǒng)未來輸出,采用滾動(dòng)優(yōu)化原則,在有限時(shí)域內(nèi)反復(fù)在線優(yōu)化得到最優(yōu)的控制量。模型預(yù)測(cè)控制的框架結(jié)構(gòu)如圖2所示,可以分為3個(gè)部分:預(yù)測(cè)模型、滾動(dòng)優(yōu)化及反饋校正。其基本思想可以概括為:在每一個(gè)采樣時(shí)刻,利用預(yù)測(cè)模型結(jié)合當(dāng)前測(cè)量信息,采用優(yōu)化算法在線滾動(dòng)求解一個(gè)有限時(shí)域的優(yōu)化問題,并將所得優(yōu)化解的第1個(gè)元素作用于被控系統(tǒng),將實(shí)際輸出值反饋給預(yù)測(cè)模型修正預(yù)測(cè)值,并刷新優(yōu)化問題重新求解[18]。,然后在下一采樣時(shí)刻重復(fù)此過程直到有限時(shí)域結(jié)束。
圖2 模型預(yù)測(cè)控制總體框架圖
2.1.2 動(dòng)態(tài)規(guī)劃原理
動(dòng)態(tài)規(guī)劃作為一種全局優(yōu)化算法,本質(zhì)是求解多階段的決策問題。假設(shè)將待求解的問題看作是一個(gè)整體,把整體劃分為有限個(gè)相互關(guān)聯(lián)又具有獨(dú)立性的個(gè)體,通過直接求解各個(gè)個(gè)體之間的決策問題,會(huì)得到多個(gè)決策序列,能夠使整體的效果達(dá)到最優(yōu)的決策序列就是動(dòng)態(tài)規(guī)劃算法所求出的問題的解。
動(dòng)態(tài)規(guī)劃的求解過程可概括為:逆向計(jì)算、正向?qū)?yōu)。逆向計(jì)算就是通過將待求問題分解為n個(gè)階段,從最后1個(gè)階段n開始,依次向前直至第1個(gè)階段,迭代計(jì)算每個(gè)階段每一狀態(tài)下的最優(yōu)目標(biāo)函數(shù)值,從而得到與之相對(duì)應(yīng)的最優(yōu)控制變量。正向?qū)?yōu)就是基于逆向計(jì)算的結(jié)果,給定1個(gè)初始值,通過狀態(tài)轉(zhuǎn)移方程插值得到第1階段至最后1個(gè)階段的最優(yōu)控制變量序列。動(dòng)態(tài)規(guī)劃原理如圖3所示。
圖3 動(dòng)態(tài)規(guī)劃原理圖
利用模型預(yù)測(cè)控制對(duì)混合動(dòng)力汽車進(jìn)行能量管理,就是對(duì)未來一段時(shí)間內(nèi)的電機(jī)轉(zhuǎn)矩和發(fā)動(dòng)機(jī)轉(zhuǎn)矩進(jìn)行最優(yōu)分配。首先基于馬爾可夫模型預(yù)測(cè)出有限時(shí)域內(nèi)的加速度信息,然后采用DP算法進(jìn)行優(yōu)化求解,獲得轉(zhuǎn)矩分配序列。利用反饋機(jī)制實(shí)現(xiàn)閉環(huán)控制,獲得最優(yōu)的分配結(jié)果。
2.2.1 基于馬爾可夫模型的加速度預(yù)測(cè)
預(yù)測(cè)模型相當(dāng)于整個(gè)MPC能量管理策略框架中的“基石”,通過預(yù)測(cè)模型提前獲知混合動(dòng)力汽車未來一段時(shí)間內(nèi)的運(yùn)行狀態(tài),如車速、加速度及需求功率等信息,便可以根據(jù)當(dāng)前時(shí)刻車輛的運(yùn)行狀態(tài)在預(yù)測(cè)時(shí)域內(nèi)運(yùn)用優(yōu)化算法控制車輛性能達(dá)到該時(shí)域內(nèi)的最優(yōu)狀態(tài),從而獲得更高的燃油經(jīng)濟(jì)性。
在車輛運(yùn)行時(shí),加速度的變化具有隨機(jī)性,能夠準(zhǔn)確描述汽車的實(shí)際行駛過程,且未來某一時(shí)刻的加速度只取決于當(dāng)前時(shí)刻的加速度,與歷史加速度信息無關(guān),具有馬爾可夫性質(zhì),因此,可建立馬爾可夫加速度預(yù)測(cè)模型對(duì)加速度進(jìn)行預(yù)測(cè)。
構(gòu)建馬爾可夫加速度預(yù)測(cè)模型的關(guān)鍵是計(jì)算加速度的轉(zhuǎn)移概率矩陣,轉(zhuǎn)移概率矩陣的每一個(gè)元素代表汽車加速度從當(dāng)前狀態(tài)轉(zhuǎn)移到下一狀態(tài)的概率,如式(2)。選取概率最大的值作為加速度的實(shí)際值,從而確定下一時(shí)刻的加速度變化。
式中:a(k)、a(k+1)——當(dāng)前時(shí)刻和下一時(shí)刻的加速度;
Pi,j——加速度由當(dāng)前狀態(tài)i轉(zhuǎn)移到下一狀態(tài)j的概率。
可根據(jù)式(3)來計(jì)算轉(zhuǎn)移概率矩陣。
式中:Si——加速度由當(dāng)前狀態(tài)i轉(zhuǎn)移的總次數(shù);
Si,j——在預(yù)測(cè)時(shí)域p內(nèi),加速度由當(dāng)前時(shí)刻狀態(tài)i轉(zhuǎn)移到下一狀態(tài)j的次數(shù)。
選取ECE_EUDC、UDDS2種工況來提取加速度信息。將加速度(-1.5~1.5 m/s2)按一定間隔離散,采樣步長(zhǎng)取1 s,預(yù)測(cè)時(shí)域?yàn)閜。根據(jù)以上所建立的馬爾可夫加速度預(yù)測(cè)模型,對(duì)加速度進(jìn)行預(yù)測(cè)。
圖4表示車速為40 km/h時(shí)加速度的轉(zhuǎn)移概率。由圖中可以看出,加速度的轉(zhuǎn)移概率基本呈對(duì)角線分布,分布較集中。這是因?yàn)樵? s的時(shí)間范圍內(nèi),實(shí)際駕駛時(shí)通常不會(huì)改變行駛狀態(tài),所以加速度涵蓋的變化信息較少,相差不大,使得下一時(shí)刻加速度與當(dāng)前時(shí)刻加速度分布在相近區(qū)間。
圖4 v=35 km/h時(shí)加速度的轉(zhuǎn)移概率
2.2.2 基于DP求解的滾動(dòng)優(yōu)化過程
根據(jù)馬爾可夫模型預(yù)測(cè)獲得的加速度信息,通過式(1)求解獲得預(yù)測(cè)時(shí)域內(nèi)的需求轉(zhuǎn)矩。將燃油消耗作為優(yōu)化目標(biāo),選取電機(jī)轉(zhuǎn)矩Tm為控制變量,電池SOC為狀態(tài)變量,采用DP求解有限時(shí)域內(nèi)最優(yōu)的轉(zhuǎn)矩分配。
1)目標(biāo)函數(shù)和約束條件
通過等效因子將電池能量變化等效為燃油消耗,構(gòu)建以整車等效燃油消耗量最小以為目標(biāo)的回報(bào)函數(shù),如式(4)所示:
式中:mfuel(k)——當(dāng)前k時(shí)刻發(fā)動(dòng)機(jī)燃油消耗量,g;
mele(k)——當(dāng)前k時(shí)刻電池等效燃油能量,g。
在優(yōu)化過程中,每一階段的決策之后,會(huì)引起狀態(tài)的轉(zhuǎn)移,狀態(tài)轉(zhuǎn)移方程如式(5):
式中:SOC(k)、SOC(k+1)——表示當(dāng)前k時(shí)刻和下一時(shí)刻的荷電狀態(tài);
Esoc——當(dāng)前狀態(tài)下的電動(dòng)勢(shì);
Rsoc——表示當(dāng)前狀態(tài)下的內(nèi)阻;
Qbat——電池容量;
Pbat(k)——當(dāng)前k時(shí)刻的電池功率。
同時(shí),為防止轉(zhuǎn)矩、轉(zhuǎn)速等因素對(duì)優(yōu)化結(jié)果造成干擾,因此,在預(yù)測(cè)時(shí)域k~k+p對(duì)相關(guān)變量做如下約束:
式中:ne(k)——k時(shí)刻的發(fā)動(dòng)機(jī)轉(zhuǎn)速,r/min;
ne_max(k)、ne_min(k)為k時(shí)刻發(fā)動(dòng)機(jī)轉(zhuǎn)速的最大、最小值,r/min;
Tm(k)——k時(shí)刻的電動(dòng)機(jī)轉(zhuǎn)矩,N·m;
Tm_max(k)、Tm_min(k)——k時(shí)刻電機(jī)轉(zhuǎn)矩的最大、最小值,N·m;
Te(k)——k時(shí)刻的發(fā)動(dòng)機(jī)轉(zhuǎn)矩,N·m;
Te_max(k)、Te_min(k)——k時(shí)刻發(fā)動(dòng)機(jī)的最大、最小值,N·m。
2)DP優(yōu)化求解過程
動(dòng)態(tài)規(guī)劃(DP)作為一種全局最優(yōu)算法,在模型預(yù)測(cè)控制當(dāng)中,對(duì)預(yù)測(cè)時(shí)域內(nèi)的預(yù)測(cè)信息進(jìn)行滾動(dòng)優(yōu)化求解,可提高計(jì)算效率,具體優(yōu)化步驟如下:
(1)根據(jù)馬爾可夫模型預(yù)測(cè)獲取的加速度信息,結(jié)合式(1)求出預(yù)測(cè)時(shí)域內(nèi)的需求轉(zhuǎn)矩[Tm(k)~Tm(k+p)];
(2)在預(yù)測(cè)時(shí)域k~k+p內(nèi),可將優(yōu)化問題劃分成p+1個(gè)子階段[k,k+1,…,k+p],并將狀態(tài)變量SOC在約束范圍內(nèi)進(jìn)行離散化處理;
(3)根據(jù)上文的目標(biāo)函數(shù)和約束條件,首先從最后一個(gè)階段k+p逆行求解,求出該階段到上一階段k+p-1的最小油耗值,并記錄獲得最低油耗時(shí)的控制變量Tm,依次逆向計(jì)算直到第k階段,則整個(gè)逆向求解過程結(jié)束;
(4)從初始階段開始正向?qū)?yōu),根據(jù)k階段的狀態(tài)變量SOC(k),插值找到SOC(k)所對(duì)應(yīng)的最小燃油消耗量fuel(k)和電動(dòng)機(jī)轉(zhuǎn)矩Tm(k),根據(jù)狀態(tài)轉(zhuǎn)移方程(式5)獲得下一時(shí)刻的狀態(tài)量SOC(k+1),重復(fù)(3),直到k+p時(shí)結(jié)束,就能獲得k~k+p內(nèi)的最優(yōu)電機(jī)轉(zhuǎn)矩分配序列[Tm(k),Tm(k+1/k),…,Tm(k+p/k)]。
2.2.3 實(shí)施反饋校正
通過DP求解獲得最優(yōu)電機(jī)轉(zhuǎn)矩分配序列之后,只將最優(yōu)序列的第1個(gè)控制量Tm(k)施加給車輛。在下一個(gè)時(shí)刻,首先檢測(cè)車輛的實(shí)際車速和加速度值,并將其反饋給預(yù)測(cè)模型,重新預(yù)測(cè)系統(tǒng)輸出并實(shí)施優(yōu)化求解,重復(fù)執(zhí)行上述過程直到預(yù)測(cè)時(shí)域結(jié)束,即可獲得預(yù)測(cè)時(shí)域內(nèi)的最優(yōu)轉(zhuǎn)矩分配。整個(gè)控制過程的流程圖如圖5所示。
圖5 基于DP的隨機(jī)模型預(yù)測(cè)控制流程圖
為驗(yàn)證所提控制策略的性能,利用Matlab/Simulink仿真平臺(tái),基于ECE_EUDC、UDDS標(biāo)準(zhǔn)循環(huán)工況進(jìn)行整車仿真分析。選取預(yù)測(cè)時(shí)域?yàn)? s,采樣時(shí)間間隔為1 s;將電池SOC限定0.3~0.8之間,以0.1為間隔進(jìn)行離散,SOC初始值設(shè)為0.6;將預(yù)測(cè)時(shí)域內(nèi)的需求轉(zhuǎn)矩以5 N·m的間隔進(jìn)行離散。仿真結(jié)果如圖6所示。圖6a為仿真工況數(shù)據(jù)圖,圖6b為發(fā)動(dòng)機(jī)轉(zhuǎn)矩隨仿真工況的車速變化軌跡,可以看出,在汽車加速情況下,所需要的車輪處轉(zhuǎn)矩較大,發(fā)動(dòng)機(jī)多呈工作狀態(tài),輸出較大轉(zhuǎn)矩。圖6c、6d為電機(jī)轉(zhuǎn)矩及電池SOC變化軌跡,可看出,當(dāng)電動(dòng)機(jī)轉(zhuǎn)矩為正時(shí),電機(jī)作為電動(dòng)機(jī),使用電能,使電池SOC下降;當(dāng)電動(dòng)機(jī)轉(zhuǎn)矩為負(fù)時(shí),電機(jī)作為發(fā)電機(jī),進(jìn)行發(fā)電,使電池SOC上升。綜合觀察圖6,當(dāng)車速較低、頻繁啟動(dòng)時(shí)多用電動(dòng)機(jī)驅(qū)動(dòng),當(dāng)車輛速度較高時(shí),多用發(fā)動(dòng)機(jī),同時(shí)給電池充電。這與我們平時(shí)熟知的混合動(dòng)力汽車?yán)硐朕D(zhuǎn)矩分配結(jié)果相同,說明所提出的控制策略具有一定的可行性。
圖6 仿真結(jié)果圖
本文將MPC控制理論與DP算法有效結(jié)合,實(shí)現(xiàn)了超輕度混合動(dòng)力汽車良好的轉(zhuǎn)矩分配控制?;贓CE_EUDC、UDDS標(biāo)準(zhǔn)循環(huán)工況為樣本數(shù)據(jù)構(gòu)建馬爾科夫模型對(duì)加速度進(jìn)行預(yù)測(cè),對(duì)預(yù)測(cè)時(shí)域內(nèi)的信息采用DP算法進(jìn)行滾動(dòng)優(yōu)化求解,然后實(shí)施反饋控制獲得最優(yōu)轉(zhuǎn)矩分配。將所提控制策略基于Matlab/Simulink平臺(tái)進(jìn)行仿真分析,仿真結(jié)果表明,發(fā)動(dòng)機(jī)和電動(dòng)機(jī)基本工作在最優(yōu)轉(zhuǎn)矩區(qū)域內(nèi),證明該策略能取得良好的控制效果以及實(shí)現(xiàn)超輕度混合動(dòng)力汽車最優(yōu)的能量管理。