謝奕展,程夕明
(北京理工大學(xué)機(jī)械與車輛學(xué)院,電動(dòng)車輛國(guó)家工程試驗(yàn)室,北京100081)
鋰離子電池高能量密度和低成本技術(shù)的快速發(fā)展促進(jìn)了電動(dòng)汽車的市場(chǎng)化步伐,而電池管理系統(tǒng)的基本功能之一,是對(duì)電池的諸多狀態(tài)進(jìn)行準(zhǔn)確的估計(jì),包括電池的荷電狀態(tài)SOC、健康狀態(tài)SOH和剩余使用壽命RUL[1-2]。
目前,蓄電池的SOC估計(jì)、SOH估計(jì)和RUL預(yù)測(cè)的方法主要有基于模型的方法和數(shù)據(jù)驅(qū)動(dòng)方法兩類?;谀P偷腟OC估計(jì)方法有安時(shí)積分法[3]、開路電壓法[4]和等效電路模型法[5]等。累積誤差、長(zhǎng)時(shí)間靜置和等效電路模型參數(shù)非線性時(shí)變等問題使基于模型的電池狀態(tài)估計(jì)方法的應(yīng)用受到限制?;谀P偷腟OH估算方法有實(shí)驗(yàn)測(cè)量法[6-7]、差分法[8]、等效電路模型[9]和電化學(xué)模型[10]等。其中,實(shí)驗(yàn)測(cè)量法直接對(duì)電池容量、內(nèi)阻和阻抗譜進(jìn)行測(cè)量,這些參數(shù)測(cè)量的車載條件穩(wěn)定性差,缺乏可比性。差分法建立蓄電池的容量電壓微分曲線峰值與SOH的函數(shù)關(guān)系,要求測(cè)量數(shù)據(jù)的電流倍率小,易受噪聲污染。等效電路模型法通過參數(shù)辨識(shí)方法建立模型參數(shù)與SOH的映射關(guān)系,其普適性尚待研究?;谀P偷腞UL預(yù)測(cè)有衰減模型法[11]、等效電路模型法[12]等。其中,衰減模型法通過尋找溫度、充放電倍率、充放電深度等因素與電池的SOH之間的函數(shù)關(guān)系,建立電池的容量衰減曲線與循環(huán)工況參數(shù)的數(shù)學(xué)表達(dá)式,該方法需要大量的蓄電池老化實(shí)驗(yàn),對(duì)于在特定條件應(yīng)用的蓄電池具有一定的可行性?;陔娐纺P偷姆椒▌t是通過分析已估算的電池SOH的變化趨勢(shì),預(yù)測(cè)電池RUL。以上兩種方法依賴電池SOH估計(jì)的可靠性。
鋰離子電池是一種高度非線性時(shí)變的電化學(xué)系統(tǒng),其內(nèi)部狀態(tài)受到SOC、溫度、倍率、外力和時(shí)間等外部因素的耦合影響,且一個(gè)封閉環(huán)境的運(yùn)行狀態(tài)不易通過外部?jī)x器觀測(cè)。盡管基于模型的方法具有較為明確的物理意義,但是對(duì)高度非線性時(shí)變、強(qiáng)耦合和時(shí)間跨度大的鋰離子電池建模將十分復(fù)雜而耗時(shí)、專業(yè)性強(qiáng),而且模型的可靠性需要電池行為持續(xù)性數(shù)據(jù)的支持。
電池狀態(tài)估計(jì)的機(jī)器學(xué)習(xí)方法是指采用機(jī)器學(xué)習(xí)算法估計(jì)電池狀態(tài)的數(shù)據(jù)驅(qū)動(dòng)方法。它具有由于其強(qiáng)大的非線性映射能力,如單層神經(jīng)網(wǎng)絡(luò)和徑向基神經(jīng)網(wǎng)絡(luò)均能以任意精度逼近任意函數(shù)[13-14]。本文中將鋰離子電池視為一種黑箱系統(tǒng),運(yùn)用如RVM、GP、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)算法,自適應(yīng)建立蓄電池的電流、電壓、溫度等可測(cè)量數(shù)據(jù)與其狀態(tài)SOC、SOH、RUL之間的函數(shù)關(guān)系[15-18],無需對(duì)蓄電池復(fù)雜機(jī)理的理解,將主要工作聚焦于對(duì)象的數(shù)據(jù)處理,擴(kuò)大了從業(yè)人員的專業(yè)范圍,備受業(yè)界關(guān)注。
機(jī)器學(xué)習(xí)方法旨在建立系統(tǒng)的輸入與輸出的映射關(guān)系。將用于鋰離子電池狀態(tài)預(yù)測(cè)與估計(jì)的系統(tǒng)描述為由離散的狀態(tài)方程和觀測(cè)方程組成的表達(dá)式,記為
式中:xk為系統(tǒng)中間狀態(tài)量;zk為系統(tǒng)觀測(cè)量;uk為系統(tǒng)輸入量;wk、vk分別為過程噪聲和觀測(cè)噪聲。
機(jī)器學(xué)習(xí)算法旨在習(xí)得系統(tǒng)狀態(tài)函數(shù)f和觀測(cè)函數(shù)h,而噪聲wk和vk既可作為已知量,也可作為未知量。系統(tǒng)輸入uk通常為蓄電池的溫度、電流或電壓,zk則通常表示蓄電池的狀態(tài)如SOC、SOH和RUL等。對(duì)式(1)和式(2)簡(jiǎn)化或擴(kuò)充,便可建立各種機(jī)器學(xué)習(xí)算法的函數(shù)表達(dá)式。
用于鋰離子電池SOC估計(jì)的算法旨在建立溫度、電流、電壓與SOC的映射關(guān)系,既可以是遞歸算法也可以是非遞歸算法。記k時(shí)刻的電流、電壓、溫度、SOC分 別 為Ik、Uk、Tk、SOCk。記D={(u1,z1),(u2,z2),…,(uk,zk),…,(uN,zN)}為 整 個(gè) 數(shù) 據(jù)集,那么系統(tǒng)的輸入uk=[Ik,Uk,Tk],系統(tǒng)的輸出zk=SOCk。
遞歸算法旨在尋找輸入序列{uk}與輸出序列{zk}的映射關(guān)系,而非遞歸算法則是求得點(diǎn)uk與點(diǎn)zk的一一映射關(guān)系。無論是SVR[19]、BPNN[20]、ELM[21]、MLP[22]和CNN[23]等非遞歸算法,還是Elman NN[24]、NARXNN[25-26]、LSTM?RNN[27]等遞歸算法,都能準(zhǔn)確估計(jì)電池SOC。它們著重研究數(shù)據(jù)集劃分[20,23,27-30]、超參數(shù)優(yōu)化[21,24-26,31]、模型訓(xùn)練加速[32]、求解器性能比較[22]、濾波器融合[33-35]和學(xué)習(xí)算法融合[36-37]等。
其中,濾波器融合算法將基于模型的濾波器與機(jī)器學(xué)習(xí)算法融合,提高SOC估計(jì)精度,例如基于1階RC等效電路模型的EKF和BPNN融合算法。由于BPNN有效補(bǔ)償了EKF在動(dòng)態(tài)工況的SOC估計(jì)誤差,使相應(yīng)的RMSE從3.43%減小到0.83%[33]。
融合多種學(xué)習(xí)算法也能夠提高數(shù)據(jù)驅(qū)動(dòng)方法的電池SOC估計(jì)性能。例如,文獻(xiàn)[37]中將增量學(xué)習(xí)應(yīng)用于RVM,前一個(gè)RVM的相關(guān)向量與后一個(gè)訓(xùn)練樣本訓(xùn)練新的RVM,如此重復(fù)進(jìn)行,每次僅保存相關(guān)向量,而摒棄了其它數(shù)據(jù),減少了存儲(chǔ)空間,其預(yù)測(cè)效果與總數(shù)據(jù)集訓(xùn)練的RVM相比,SOC預(yù)測(cè)精度相近。
蓄電池SOH估計(jì)與SOC估計(jì)的不同之處在于SOH是一個(gè)長(zhǎng)期狀態(tài),在幾個(gè)循環(huán)周期內(nèi),可以假定其保持不變,這意味著估計(jì)SOH的數(shù)據(jù)驅(qū)動(dòng)算法的數(shù)據(jù)比SOC更多而復(fù)雜。通常情況下,鋰離子電池采用穩(wěn)定的恒流-恒壓兩段式充電,不同SOH的蓄電池充電電壓變化曲線能夠呈現(xiàn)出明顯的差異性[38],因此SOH估計(jì)算法的輸入量常由蓄電池的充電數(shù)據(jù)生成。
蓄電池SOC估計(jì)采用點(diǎn)對(duì)點(diǎn)的數(shù)據(jù)計(jì)算,而SOH估計(jì)則為曲線或者面對(duì)點(diǎn)的數(shù)據(jù)計(jì)算。SOH的輸入量提取通常有兩種處理方法,第1種將充電數(shù)據(jù)整體作為模型的輸入,第2種方法以提取充電曲線的特征數(shù)據(jù)作為模型的輸入。因此,蓄電池SOH與SOC估計(jì)方法的主要不同之處體現(xiàn)在數(shù)據(jù)驅(qū)動(dòng)算法的輸入處理方法在數(shù)據(jù)時(shí)間、數(shù)據(jù)量和數(shù)據(jù)行為存在明顯的差異。
非 遞 歸 算 法SVR[39]、RVM[40]、BPNN[41-42]、ELM[43]、MLP[44-45]、CNN[46]、ANFIS[47]和 遞 歸 算 法LSTM-RNN[48]都已應(yīng)用于電池SOH的估計(jì),并側(cè)重于健康因子選擇[39-40,49]、網(wǎng)絡(luò)訓(xùn)練加速[42,45-46,48]和算法融合[50-52]等方面研究。其中,平均放電電壓、平均放電溫度、充電平均電壓、充電平均電流、充電平均溫度和等效電路模型參數(shù)等都可作為電池SOH估計(jì)模型的健康因子。對(duì)于算法訓(xùn)練,自編碼器常用來降低數(shù)據(jù)維度,減少算法訓(xùn)練時(shí)間[42,50]。
多個(gè)機(jī)器學(xué)習(xí)算法融合用來增強(qiáng)電池SOH估計(jì)性能。例如,文獻(xiàn)[51]中以多組容量衰減電池的特定區(qū)間電量變化為健康因子,輸入RF算法,輸出相應(yīng)的SOH,其中模型融合了500個(gè)決策樹。相比GP,RF算法的SOH估計(jì)RMSE和運(yùn)行時(shí)間分別減小了約15%和90%。文獻(xiàn)[52]中利用一個(gè)大型數(shù)據(jù)集訓(xùn)練CNN估計(jì)SOH,生成模型參數(shù)。然后,在另一個(gè)小型數(shù)據(jù)集上繼續(xù)訓(xùn)練舊模型參數(shù),結(jié)果表明重新訓(xùn)練的CNN比原CNN的SOH估計(jì)RMSE減小0.6%。
基于SOH估計(jì),電池的RUL預(yù)測(cè)是由歷史容量衰減規(guī)律性預(yù)測(cè)電池將來容量的變化。當(dāng)預(yù)測(cè)的容量到達(dá)EOL時(shí),對(duì)應(yīng)的循環(huán)次數(shù)減去當(dāng)前已循環(huán)的次數(shù)即為RUL,因此RUL預(yù)測(cè)和SOH預(yù)測(cè)可被劃分為蓄電池狀態(tài)估計(jì)的同一類問題。RUL預(yù)測(cè)方法通常有兩類:第1類是以前半段容量衰減數(shù)據(jù)作為估計(jì)算法的訓(xùn)練集;第2類是以SOH估計(jì)方法估計(jì)前半段循環(huán)容量,然后根據(jù)估計(jì)的前半段循環(huán)容量數(shù)據(jù)作為訓(xùn)練集,用第1類方法同時(shí)預(yù)測(cè)SOH和RUL。
遞 歸 算 法LSTM?RNN[53]、GRU?RNN[54]、NARXNN[55]和 非 遞 歸 算 法SVR[56]、LSSVM[57]、RVM[58]、GP[59]、RBFNN[60]、MLP[61]、CNN[62]等都已應(yīng)用于構(gòu)建電池容量衰減模型,預(yù)測(cè)電池RUL,側(cè)重于數(shù)據(jù)集劃分[56]、數(shù)據(jù)增強(qiáng)[57]、超參數(shù)優(yōu)化[58-60]、輸入變量選擇[55,59,62]、模型融合[60-61]和集成學(xué)習(xí)[63-64]。
將濾波器與機(jī)器學(xué)習(xí)融合可增強(qiáng)電池RUL預(yù)測(cè)的可靠性。例如,文獻(xiàn)[60]中以雙指數(shù)模型作為UKF的觀測(cè)方程預(yù)測(cè)RUL,然后以RBFNN補(bǔ)償U(kuò)KF的預(yù)測(cè)誤差,與僅采用UKF算法相比,融合算法的電池RUL預(yù)測(cè)結(jié)果少了4個(gè)循環(huán)。集成學(xué)習(xí)也能改善電池RUL預(yù)測(cè)的性能。例如,bagging方法比boosting方法有更高的RUL估計(jì)精度,且對(duì)數(shù)據(jù)的離群點(diǎn)不敏感[63]。
基于機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)方法實(shí)施過程包括數(shù)據(jù)準(zhǔn)備、模型選擇與評(píng)價(jià)、超參數(shù)確定、數(shù)據(jù)預(yù)處理和模型訓(xùn)練等5個(gè)環(huán)節(jié),這些環(huán)節(jié)都影響到電池狀態(tài)估計(jì)模型的性能。
機(jī)器學(xué)習(xí)算法的狀態(tài)估計(jì)效果依賴于訓(xùn)練數(shù)據(jù),訓(xùn)練數(shù)據(jù)與實(shí)車電池工況越相似,則數(shù)據(jù)驅(qū)動(dòng)算法輸出的結(jié)果越可靠。因此,電池實(shí)驗(yàn)應(yīng)能夠反映車輛行駛工況的環(huán)境溫度和電流的隨機(jī)復(fù)雜性,然而諸如世界輕型車行駛工況(WLTC)[65]和新歐洲循環(huán)工況(NEDC)[66]等典型行車工況僅反映了車速-時(shí)間關(guān)系。依據(jù)工況車速,利用車輛動(dòng)力學(xué)關(guān)系計(jì)算行車功率,由模型電壓可計(jì)算實(shí)驗(yàn)電池的充放電倍率[67]。
電池容量衰減測(cè)試是SOC估計(jì)、SOH估計(jì)和RUL預(yù)測(cè)可靠性驗(yàn)證的前提條件,然而相應(yīng)電池充放電循環(huán)上百千次,實(shí)驗(yàn)時(shí)間長(zhǎng),比如電池容量衰減實(shí)驗(yàn)持續(xù)了56周[68]。因此,許多文獻(xiàn)利用已有的電池?cái)?shù)據(jù)集驗(yàn)證其算法性能,比如NASA PCoE Battery Dataset[69]、NASA Randomized Battery Usage Dataset[70]、CALCE Battery Datasets[71]、Stanford Cycle Life Prediction Dataset[72]、Standford Fast-Charging Optimization Dataset[73]、Oxford Battery Degradation Dataset[74]和Panasonic 18650PF Li-ion Battery Dataset[75]等。
為了解決數(shù)據(jù)驅(qū)動(dòng)算法的大量數(shù)據(jù)需求而成本過高問題,文獻(xiàn)[76]中利用一種生成對(duì)抗式神經(jīng)網(wǎng)絡(luò)GAN?CLS創(chuàng)建數(shù)據(jù),并用于訓(xùn)練LSTM?RNN估計(jì)SOC,相應(yīng)的估計(jì)均方誤差小于0.002 5,且比實(shí)驗(yàn)采集數(shù)據(jù)的方法快50倍。
模型的選擇應(yīng)綜合考慮擬合精度、成本和魯棒性。模型的擬合精度,要求電池狀態(tài)估計(jì)與預(yù)測(cè)的誤差小和置信區(qū)間小。模型實(shí)施成本可分為訓(xùn)練成本和測(cè)試成本,前者指模型利用訓(xùn)練集得到滿意結(jié)果而耗費(fèi)的成本,如訓(xùn)練時(shí)間和訓(xùn)練設(shè)備等;測(cè)試成本指模型訓(xùn)練的實(shí)際應(yīng)用成本,例如計(jì)算速度、內(nèi)存大小、程序移植所需成本等。算法的魯棒性指模型能夠在數(shù)據(jù)存在噪聲或異常值等情況下仍能夠取得較高的精度,或者對(duì)訓(xùn)練數(shù)據(jù)外的數(shù)據(jù)仍能保持較高的精度[77]。
2.2.1 評(píng)價(jià)指標(biāo)
模型評(píng)價(jià)指標(biāo)常由均方誤差、均方根誤差、絕對(duì)誤差、平均絕對(duì)誤差和平均絕對(duì)百分比誤差等表示,這些指標(biāo)越小,模型的性能越好。然而,它們應(yīng)結(jié)合真實(shí)值的取值范圍進(jìn)行評(píng)價(jià)。假設(shè)yˉ落在某個(gè)區(qū)間的概率為p,則該區(qū)間稱為p置信區(qū)間,如常用的95%置信區(qū)間表示yˉ落在該區(qū)間的概率為95%。yˉ落在包含y的置信區(qū)間越小,模型性能越好[29]。而決定系數(shù)(R squared,R2)[78]是衡量模型擬合程度的無量綱指標(biāo),取值范圍為-∞~1,越接近于1,表明模型的擬合效果越好。記y為真實(shí)值,yˉ、y?i分別為平均值和估計(jì)值,n為樣本數(shù),相應(yīng)表達(dá)式為
2.2.2 精度
一般而言,數(shù)據(jù)驅(qū)動(dòng)算法在理論上都能夠映射任意函數(shù),但是算法實(shí)現(xiàn)的前提是系統(tǒng)輸入與輸出確實(shí)存在函數(shù)關(guān)系,能夠找到相應(yīng)的具體實(shí)現(xiàn)。函數(shù)關(guān)系的存在與否關(guān)鍵在于數(shù)據(jù)輸入特征的選擇,例如不同數(shù)據(jù)特征使模型估計(jì)電池SOH的效果不同。算法實(shí)現(xiàn)則取決于數(shù)據(jù)和模型求解方法,例如RUL估計(jì)的訓(xùn)練數(shù)據(jù)包含的循環(huán)數(shù)越多,預(yù)測(cè)精度越高[78]。算法除了提供點(diǎn)估計(jì)外,還應(yīng)提供置信區(qū)間估計(jì)。目前,僅有少數(shù)算法如RVM和GP等能提供置信區(qū)間估計(jì)。為此,可通過蒙特卡羅算法為模型結(jié)果添加區(qū)間估計(jì)[79]。
機(jī)器學(xué)習(xí)模型的精度會(huì)有所區(qū)別,例如LSTM?RNN、GRU RNN、Elman NN等遞歸算法的估計(jì)和預(yù)測(cè)精度略高于RVM、SVR、GP、BPNN等非遞歸算法;LSTM?RNN、GRU?RNN、CNN等深度學(xué)習(xí)網(wǎng)絡(luò)具有比傳統(tǒng)機(jī)器學(xué)習(xí)算法更高的估計(jì)精度。
2.2.3 實(shí)施成本
傳統(tǒng)機(jī)器學(xué)習(xí)方法由于其固有缺陷,如需要矩陣求逆、支持向量隨著數(shù)據(jù)增長(zhǎng)而增長(zhǎng),導(dǎo)致訓(xùn)練和測(cè)試成本大幅升高,存在大規(guī)模數(shù)據(jù)的適應(yīng)性問題。深度學(xué)習(xí)算法如LSTM?RNN、GRU?RNN、CNN等的訓(xùn)練過程需要顯卡進(jìn)行輔助計(jì)算[23,52],訓(xùn)練時(shí)間長(zhǎng),導(dǎo)致訓(xùn)練成本上升。
實(shí)際算法必須嵌入硬件運(yùn)行,因此必須考慮算法的運(yùn)行時(shí)間和內(nèi)存占用等因素對(duì)系統(tǒng)成本的影響?;贜ASA和Oxford兩個(gè)數(shù)據(jù)集,文獻(xiàn)[80]中比較了不同算法估計(jì)SOH的訓(xùn)練時(shí)間和內(nèi)存需求,結(jié)果表明:GRU?RNN的訓(xùn)練時(shí)間分別是GP和SVR的70~130倍和4~5倍,而CNN的訓(xùn)練時(shí)間則是GP的6~10倍。對(duì)于算法的測(cè)試時(shí)間,SVR<GP<GRU?RNN<CNN。文獻(xiàn)[46]中使用CNN和RVM兩個(gè)算法估計(jì)SOH,結(jié)果表明CNN的訓(xùn)練時(shí)間是RVM的7.6倍,但RVM的測(cè)試時(shí)間是CNN的9.8倍,而且RVM的內(nèi)存需求是CNN的139.1倍。對(duì)于SOC估計(jì)的算法運(yùn)行成本,文獻(xiàn)[51]中的研究結(jié)果表明RF的測(cè)試時(shí)間是GP的10倍以上,文獻(xiàn)[25]的研究結(jié)果表明PSO優(yōu)化中NARXNN的訓(xùn)練時(shí)間和測(cè)試時(shí)間僅為BPNN的20%左右,文獻(xiàn)[23]的研究結(jié)果表明GRU?RNN、LSTM?RNN和CNN算法的運(yùn)算時(shí)間相當(dāng),約為1.4 s。然而,LSTM?RNN和GRU?RNN的每秒浮點(diǎn)運(yùn)算次數(shù)為CNN的1.75倍,說明前兩者需占用更多內(nèi)存才能運(yùn)行。
2.2.4 魯棒性
魯棒性表示算法對(duì)電池運(yùn)行數(shù)據(jù)的噪聲、異常值、測(cè)試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)的分布不盡相同等情況的適應(yīng)能力。電池狀態(tài)估計(jì)算法的魯棒性包括疊加噪聲的測(cè)試數(shù)據(jù)的算法性能評(píng)估[81]和同批次電池的實(shí)驗(yàn)數(shù)據(jù)檢驗(yàn)[61]兩種。
遞歸機(jī)器學(xué)習(xí)算法的魯棒性要求更高,原因在于遞歸算法的一部分輸入來自于上一步的輸出,可能導(dǎo)致算法誤差的累積效應(yīng),致使算法喪失魯棒性。然而,不同算法的誤差累積效應(yīng)嚴(yán)重程度不同,例如文獻(xiàn)[26]中比較了LSTM?RNN和NARXNN的SOC估計(jì)性能,使用試錯(cuò)法確定兩者的最優(yōu)參數(shù),兩者均表現(xiàn)出估計(jì)值累積誤差,但NARXNN比LSTM?RNN更嚴(yán)重。解決遞歸算法的誤差累積問題的途徑之一是應(yīng)用傳統(tǒng)濾波器進(jìn)行算法定時(shí)校正,例如構(gòu)建卡爾曼濾波器和機(jī)器學(xué)習(xí)的融合算法,以安時(shí)積分法和GRU?RNN分別作為SOC估算結(jié)果的狀態(tài)方程和觀測(cè)方程,結(jié)果顯示該方法能夠校正GRU?RNN的累積誤差[35]。
影響機(jī)器學(xué)習(xí)算法性能的關(guān)鍵因素之一是超參數(shù)。與徑向基核函數(shù)和多項(xiàng)式核函數(shù)相比,一種混合核函數(shù)的LSSVM估計(jì)SOH的RMSE值小0.1%~0.2%[82]。但算法的最優(yōu)超參數(shù)值卻與訓(xùn)練數(shù)據(jù)密切相關(guān)。例如,使用回溯搜索優(yōu)化算法(backtracking search optimization algorithm,BSA)估計(jì)SOC的RBFNN和ELM的隱藏層節(jié)點(diǎn)數(shù),不同溫度和工況的數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)各不相同,最大相差1.5~2倍[20]。
超參數(shù)可采用試錯(cuò)法、經(jīng)驗(yàn)法或優(yōu)化算法等來確定。例如,由試錯(cuò)法確定CNN卷積層層數(shù)[46]和NARXNN的輸入延時(shí)階數(shù)和反饋延時(shí)階數(shù)[26],由經(jīng)驗(yàn)法確定BPNN的隱層節(jié)點(diǎn)數(shù)[83]。
超參數(shù)的優(yōu)化算法種類多,例如PSO算法用來優(yōu)化RVM核函數(shù)加權(quán)系數(shù)和內(nèi)部參數(shù)[40],量子粒子群算法(quantum?behaved particle swarm optimization algorithm,QPSO)算法用來優(yōu)化多核RVM核函數(shù)加權(quán)系數(shù)[58],ACO優(yōu)化Elman NN隱層節(jié)點(diǎn)數(shù)[24]、BSA優(yōu)化BPNN隱層節(jié)點(diǎn)數(shù)[20]、k折交叉驗(yàn)證法用于優(yōu)化最小二乘支持向量機(jī)的超參數(shù)[28],貝葉斯優(yōu)化算法用于SVR超參數(shù)尋優(yōu)[84],梯度下降法確定高斯過程超參數(shù)最優(yōu)值[85]。不同的優(yōu)化算法得到的超參數(shù)對(duì)算法的效果不同,例如由GA優(yōu)化的SVR比交叉驗(yàn)證法網(wǎng)格尋優(yōu)的SOC預(yù)測(cè)精度提高了0.3%~0.9%[84]。注意,超參數(shù)優(yōu)化會(huì)增加算法的復(fù)雜度和計(jì)算負(fù)擔(dān)。
常規(guī)數(shù)據(jù)預(yù)處理方法包括數(shù)據(jù)缺失與重復(fù)處理、濾波、重采樣、特征選擇、特征縮放和數(shù)據(jù)集劃分等。濾波主要是為了濾除數(shù)據(jù)噪聲,數(shù)據(jù)的重采樣是為了選擇有效數(shù)據(jù)[80,86]。特征縮放是指采用歸一化、標(biāo)準(zhǔn)化和中心化等方法處理數(shù)據(jù),用于消除不同特征數(shù)值范圍的差異[87-88]。此外,為了防止算法過擬合,數(shù)據(jù)往往疊加高斯噪聲,增加樣本數(shù)據(jù)的隨機(jī)性[80,57]。
2.4.1 RUL預(yù)測(cè)數(shù)據(jù)預(yù)處理
RUL是通過預(yù)測(cè)電池容量,再依據(jù)電池容量衰減曲線而獲得的。就趨勢(shì)而言,鋰離子電池容量隨著充放電循環(huán)次數(shù)的增多而不斷衰減,然而容量再生現(xiàn)象[78]使容量衰減曲線的變化趨勢(shì)難以預(yù)測(cè),應(yīng)采用特殊方法處理容量衰減曲線,比如高低頻成分的小波分解[78]、經(jīng)驗(yàn)?zāi)B(tài)分解[89]和集合經(jīng)驗(yàn)?zāi)B(tài)分解[58]等方法。
2.4.2 SOH估計(jì)數(shù)據(jù)預(yù)處理
在樣本數(shù)據(jù)的特征選擇階段,SOC估計(jì)算法選擇某一時(shí)刻的電流、電壓和溫度等數(shù)據(jù),而SOH估計(jì)則選擇與容量衰減相關(guān)的特征數(shù)據(jù)(健康因子)。由于電池容量變化的長(zhǎng)久性,SOH估計(jì)所能夠選擇的健康因子相對(duì)較多。在單次或相鄰幾次充放電循環(huán)內(nèi),可認(rèn)為SOH不變,因此可從短時(shí)充放電循環(huán)數(shù)據(jù)提取特征,建立健康因子與SOH的函數(shù)關(guān)系。
電池放電工況電流、溫度和工作時(shí)間的不確定性導(dǎo)致健康因子提取困難,因此SOH估計(jì)的健康因子以充電工況數(shù)據(jù)提取為主,例如充電時(shí)某一確定電壓區(qū)間變化時(shí)長(zhǎng)、充電時(shí)某一確定電流區(qū)間變化時(shí)長(zhǎng)[40]、充電曲線恒流充電時(shí)間與恒壓充電時(shí)間之比[90]等。為了解決健康因子提取對(duì)完整充電循環(huán)的依賴性,可從短脈沖電流的電壓響應(yīng)曲線提取健康因子[68,91],或采用極限學(xué)習(xí)機(jī)補(bǔ)缺不完整的充電曲線數(shù)據(jù)[82]。
健康因子也有優(yōu)化和篩選方法,比如主成分分析法[92-94]、泊松相關(guān)系數(shù)法[95]、灰色關(guān)聯(lián)分析法[96]、和spearman相關(guān)系數(shù)法[59]等。此外,CNN能自提取健康因子[46]。
2.4.3 數(shù)據(jù)集劃分
數(shù)據(jù)集一般劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于評(píng)估模型,防止模型過擬合,保證模型的泛化能力。測(cè)試集則用于評(píng)估模型性能。訓(xùn)練集、驗(yàn)證集和測(cè)試集可按照一定比例隨機(jī)劃分?jǐn)?shù)據(jù)集數(shù)據(jù)。
在SOC估計(jì)問題中,測(cè)試集和訓(xùn)練集可采用兩組截然不同的工況驗(yàn)證模型的泛化性[27]。在SOH估計(jì)問題中,為了驗(yàn)證模型的外延估計(jì)能力,訓(xùn)練集可選前段充放電循環(huán)的數(shù)據(jù),測(cè)試集則選后半段充放電的數(shù)據(jù)[97]。對(duì)于RUL預(yù)測(cè),可采用容量衰減曲線的前段、中段和后段分別作為訓(xùn)練集、驗(yàn)證集和測(cè)試集,驗(yàn)證集具有矯正模型預(yù)測(cè)趨勢(shì)的能力[56]。
相比于傳統(tǒng)機(jī)器學(xué)習(xí)方法如SVR、LSSVM、GP、RVM、RF、Adaboost和GBT等,神經(jīng)網(wǎng)絡(luò)訓(xùn)練復(fù)雜而差異性大。模型訓(xùn)練的目的在于以較低的成本獲取一個(gè)擬合程度適中的模型,即既不過擬合,也不欠擬合,成本較低,收斂速度較快,內(nèi)存占用較小。欠擬合表示該模型在訓(xùn)練集上擬合精度低、誤差大,過擬合則表示該模型在訓(xùn)練集以外的數(shù)據(jù)擬合精度低、誤差大。一方面神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線性映射能力,很容易出現(xiàn)過擬合現(xiàn)象[98];另一方面神經(jīng)網(wǎng)絡(luò)并不是凸優(yōu)化問題,導(dǎo)致其求解過程中可能陷入局部極小值點(diǎn)[99]而出現(xiàn)欠擬合。因此選擇合適的訓(xùn)練算法對(duì)于模型的性能十分重要。
神經(jīng)網(wǎng)絡(luò)算法一般采用梯度下降算法對(duì)網(wǎng)絡(luò)進(jìn)行求解,恰當(dāng)?shù)那蠼馑惴ㄓ兄诩涌焓諗克俣群腿〉幂^好的訓(xùn)練結(jié)果。根據(jù)數(shù)據(jù)量將梯度下降法分為隨機(jī)梯度下降法、小批量梯度下降法和批量梯度下降法。為了加快收斂速度和減小陷入局部極小值的概率,一些新的算法如帶動(dòng)量的梯度下降法、Adagrad、Adadelta、RMSprop和Nadam也被用于神經(jīng)網(wǎng)絡(luò)的算法求解[100]。文獻(xiàn)[22]中比較了至少6種算法分析MLP和LSTM?RNN估計(jì)SOC的誤差影響,結(jié)果顯示MLP應(yīng)用Adadelta和Nadam算法求解的效果最好,而LSTM RNN則應(yīng)用RMSProp和AdaGrad算法求解的效果最好。
防止算法過擬合有L1正則化[101]、L2正則化[102]、早停[103]、Dropout[104]和k-折交叉驗(yàn)證[105]等方法,相應(yīng)效果存在差異。文獻(xiàn)[79]中比較了避免算法過擬合的電池RUL預(yù)測(cè)結(jié)果,結(jié)果表明Dropout、L1正則化和L2正則化算法預(yù)測(cè)RUL可分別少了16、77和153個(gè)循環(huán)數(shù),而沒有采取防止過擬合方法的算法則無法預(yù)測(cè)RUL。
針對(duì)鋰離子電池BMS的SOC估計(jì)、SOH估計(jì)和RUL預(yù)測(cè)問題,歸納了機(jī)器學(xué)習(xí)算法的問題求解方法和研究進(jìn)展,闡述電池狀態(tài)估計(jì)機(jī)器學(xué)習(xí)方法實(shí)施過程的關(guān)鍵問題,包括數(shù)據(jù)準(zhǔn)備、模型選擇、算法評(píng)價(jià)、超參數(shù)確定、數(shù)據(jù)預(yù)處理和模型訓(xùn)練。其中,提出了評(píng)價(jià)相關(guān)機(jī)器學(xué)習(xí)算法的精度、成本和魯棒性3大指標(biāo)。算法的實(shí)施成本差異大,如LSTM?RNN、GRU?RNN和CNN等雖能取得較高的估計(jì)精度,但訓(xùn)練時(shí)間長(zhǎng),成本高。然而,現(xiàn)有研究關(guān)注于算法精度,缺少對(duì)算法的實(shí)施成本和魯棒性的評(píng)估。
盡管電池狀態(tài)估計(jì)方法趨向多機(jī)器學(xué)習(xí)算法融合,但超參數(shù)確定仍然是機(jī)器學(xué)習(xí)算法的一個(gè)難點(diǎn)。現(xiàn)有確定方法的通用性差,原因在于:超參數(shù)缺少明確的物理意義,最優(yōu)超參數(shù)依賴于樣本數(shù)據(jù),導(dǎo)致花費(fèi)大量成本訓(xùn)練好的模型僅能應(yīng)用于特定場(chǎng)景,而新的場(chǎng)景下必須使用新的數(shù)據(jù)重新訓(xùn)練模型。隨著電池的老化,估計(jì)模型出現(xiàn)不適應(yīng)性,但如果丟棄原有的模型和數(shù)據(jù),將導(dǎo)致訓(xùn)練成本的升高和面臨著數(shù)據(jù)不足的風(fēng)險(xiǎn)。
因此,鑒于機(jī)器學(xué)習(xí)已進(jìn)入了流程化的研究階段,應(yīng)構(gòu)建自主的、具普適性的、多區(qū)域、跨季節(jié)、多模式和長(zhǎng)時(shí)間的車用電池工況數(shù)據(jù)庫(kù),更好地促進(jìn)電池狀態(tài)估計(jì)的機(jī)器學(xué)習(xí)算法研究,包括評(píng)估不同算法的成本和魯棒性,增強(qiáng)機(jī)器學(xué)習(xí)算法的實(shí)用性、根據(jù)數(shù)據(jù)特性確定機(jī)器學(xué)習(xí)算法的超參數(shù)的方法和增強(qiáng)機(jī)器學(xué)習(xí)算法的通用性的途徑。