李 元,張文博,陳曉琳,李 含,張冠軍
1.西安交通大學(xué)電力設(shè)備電氣絕緣國家重點實驗室,陜西 西安 710049 2.海南電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,海南 ???570125 3.海南省電網(wǎng)理化分析重點實驗室,海南 海口 570125
大型油浸式電力變壓器是輸變電系統(tǒng)的關(guān)鍵設(shè)備,其健康狀態(tài)直接關(guān)系到電網(wǎng)的本質(zhì)安全[1-2]。油紙復(fù)合絕緣是變壓器的主要絕緣形式,運行中長期承受電、熱、機械、環(huán)境等多重應(yīng)力作用,導(dǎo)致絕緣逐漸老化甚至失效[3-4]。絕緣油劣化后可方便地通過濾油、祛氣甚至換油實現(xiàn)狀態(tài)更新,而絕緣紙的老化進程卻不可逆轉(zhuǎn),而且老化后難以更換,因此絕緣紙的老化狀態(tài)基本上決定了變壓器的剩余壽命。聚合度是指纖維素分子鏈上葡萄糖單體的數(shù)量,是表征絕緣紙老化狀態(tài)最直接、可靠的特征參量[5]。傳統(tǒng)的聚合度檢測是將紙樣研磨溶解后測量溶液粘度獲得聚合度,稱為粘度檢測法。該方法準確度較高但檢測耗時長,還需要取得紙樣,對變壓器的主絕緣具有破壞性。在電網(wǎng)主設(shè)備智能運檢的背景下,提出一種檢測快速、無損便捷的絕緣紙聚合度評估方法具有重要意義。
近紅外光譜分析技術(shù)可以對物質(zhì)中的化學(xué)組分進行快速測定,已在多個行業(yè)有效應(yīng)用,有望成為替代絕緣紙聚合度粘度法檢測的新方法。光譜定量分析方法是該技術(shù)的核心,近年來已開展了不少研究。李廣茂等[6]利用偏最小二乘法(partial least squares regression, PLS)建立了絕緣油甲醇含量與拉曼光譜之間的定量分析模型,實現(xiàn)變壓器油中甲醇含量檢測;王書濤[7]利用支持向量回歸機方法(support vector regression, SVR)解析柴油的近紅外光譜數(shù)據(jù),準確預(yù)測了柴油密度、粘度與凝點;蔣有列等[8]通過將PLS、反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network, BPNN)方法應(yīng)用于近紅外光譜分析,建立了絕緣油老化狀態(tài)的定量分析模型,結(jié)果表明BPNN模型的預(yù)測精度較高。
上述方法中,PLS是一種線性建模方法,在油、絕緣紙及水分共存時,多種物質(zhì)的光譜混疊,增加了系統(tǒng)非線性,導(dǎo)致PLS難以應(yīng)對混合體系的定量分析。SVR本質(zhì)上是一種二分類方法,在用于絕緣紙聚合度回歸分析(多分類)時效果較差。BPNN則容易陷入局部最優(yōu),當(dāng)數(shù)據(jù)庫中樣本數(shù)量較少時,建立的神經(jīng)網(wǎng)絡(luò)模型很容易出現(xiàn)過擬合問題。
在對比PLS,SVR以及BPNN定量分析模型的基礎(chǔ)上,提出一種高斯過程回歸(Gaussian process regression, GPR)的絕緣紙聚合度預(yù)測方法, 建立不同老化狀態(tài)紙樣的近紅外光譜與其聚合度之間的準確關(guān)聯(lián)。通過模型精度分析與參數(shù)敏感性校驗,從不同核函數(shù)GPR模型中確定了最優(yōu)模型;進一步地,將建立得到的GPR模型與通用的PLS,SVR與BPNN模型進行預(yù)測性能對比。研究結(jié)果為絕緣紙老化狀態(tài)的近紅外光譜檢測技術(shù)提供理論基礎(chǔ)與模型參考。
通過加速熱老化實驗制備獲得絕緣紙樣本。加速熱老化實驗平臺由真空干燥箱、干燥氮氣以及老化皿等組成。在分別對絕緣紙與絕緣油進行干燥、除氣處理后,通過真空浸漬獲得油紙絕緣樣品。在130 ℃條件下進行油紙絕緣樣品的加速熱老化實驗,定期取樣獲得478份不同老化程度的絕緣紙樣本。
對制備得到的紙樣采集漫反射近紅外光譜,如圖1所示。入射光在紙樣和積分球表面發(fā)生多次漫反射,反射光通過測光窗、光纖傳遞至光譜儀進行分光,與參比白板的標準光譜比對后得到紙樣的近紅外光譜。光譜采集系統(tǒng)由Sol 2.2A便攜式近紅外光譜儀(美國B&W Tek公司)以及BWSpecTM光譜采集軟件構(gòu)成。其中,光譜儀檢測單元為256單元銦鎵砷陣列,通過半導(dǎo)體制冷;探頭積分球與參比白板材質(zhì)為聚四氟乙烯(PTFE)??紤]到光譜儀自身暗噪聲會影響光譜質(zhì)量,在光譜采集前需要記錄暗電流水平,設(shè)置光譜積分時間為600 μs,掃描次數(shù)為32次。
圖1 絕緣紙樣近紅外光譜采集
采集得到的典型絕緣紙樣本的近紅外光譜如圖2所示,可以發(fā)現(xiàn)樣本光譜在1 220,1 340,1 540以及1 703 nm處具有明顯的特征峰。其中位于1 220 nm的C—H二級倍頻、1 703 nm的C—H一級倍頻歸屬于纖維素[4],當(dāng)纖維素鏈受熱斷裂時,上述特征峰會發(fā)生明顯變化,這是利用近紅外光譜數(shù)據(jù)分析絕緣紙老化狀態(tài)的理論基礎(chǔ)。但是,位于1 340 nm處的C—H弱合頻、1 540 nm處的O-H一級倍頻可同時歸屬于纖維素、絕緣油與水分子,組分信息混疊,導(dǎo)致光譜特征峰與絕緣紙老化程度的關(guān)系并非肉眼可辨;同時,樣品中混入的無關(guān)組分會影響預(yù)測結(jié)果,因此需要借助光譜定量分析方法建立絕緣紙近紅外光譜與老化程度之間的準確關(guān)聯(lián)。
圖2 典型絕緣紙樣本近紅外光譜
對制備得到的不同老化程度絕緣紙樣進行聚合度檢測,檢測方法為粘度滴定法[9]。對每個樣本進行兩次聚合度檢測,取其平均值作為最終檢測結(jié)果。聚合度檢測值作為標準值,用于模型訓(xùn)練與性能評估。
1.4.1 高斯過程回歸
本質(zhì)上,GPR算法是在給定樣本光譜數(shù)據(jù)分布的前提下得到對應(yīng)樣本聚合度值分布,所得分布函數(shù)的數(shù)學(xué)期望即為GPR模型的聚合度預(yù)測結(jié)果。GPR中假定絕緣紙聚合度y是由高斯分布函數(shù)f(x)以及噪聲ε組成[10],同時有式(1)成立
y=f(x)+ε
(1)
式(1)中,高斯分布函數(shù)f(x)由其期望m(x)以及方差k(x,x′)決定,即
f(x)~GP(m(x),k(x,x′))
(2)
式(2)中,k(x,x′)的具體形式為核函數(shù)。
高斯過程同樣假設(shè)噪聲ε符合高斯分布,即
(3)
由于任何有限的高斯序列可以組成一個獨立的高斯過程[11],因此y的分布同樣符合高斯過程,且該分布函數(shù)可通過f(x)以及ε求解得到
(4)
式(4)中,δ(x,x′)為克羅內(nèi)克函數(shù)[12],當(dāng)且僅當(dāng)x=x′時δ(x,x′)=1,否則δ(x,x′)=0。
當(dāng)輸入待預(yù)測紙樣的近紅外光譜數(shù)據(jù)x*時,基于式(4)可以計算得到訓(xùn)練集絕緣紙樣本聚合度與待測絕緣紙樣本聚合度的聯(lián)合分布,如式(5)所示
(5)
式(5)中,K為方差矩陣,通過式(6)求解
(6)
利用式(5)得到的聯(lián)合分布可得邊緣密度分布函數(shù)y*,即待測絕緣紙樣本聚合度的分布函數(shù)
(7)
求解得到的待測絕緣紙樣本聚合度分布函數(shù)的數(shù)學(xué)期望即樣本聚合度的預(yù)測結(jié)果。
1.4.2 模型建立過程
利用K-S(Kennard Stone)方法[13]將樣本的光譜數(shù)據(jù)按8∶2分為訓(xùn)練集與驗證集,其中訓(xùn)練集樣本386個、驗證集92個。在模型訓(xùn)練前利用SG(Savitzky-Golay)平滑方法[14]對光譜數(shù)據(jù)進行預(yù)處理,降低光譜數(shù)據(jù)的噪聲水平,提高數(shù)據(jù)質(zhì)量。
需要指出,式(2)中核函數(shù)k(x,x′)的類型對模型的預(yù)測能力有顯著影響。建立了基于不同核函數(shù)的GPR模型,選用的核函數(shù)包括平方指數(shù)核(squared exponential, SE)、指數(shù)核(exponential, Exp)、有理二次核(rational quadratic, RQ)、Matern32與Matern52核。通過模型預(yù)測精度分析和參數(shù)敏感性檢驗,確定最優(yōu)核函數(shù)與GPR聚合度預(yù)測模型。將得到的GPR模型與通用PLS,SVR以及BPNN模型進行聚合度預(yù)測性能橫向比較。GPR建模與性能比較流程如圖3所示。
圖3 GPR建模與不同模型性能比較流程
依據(jù)圖3建立的基于不同核函數(shù)的GPR模型進行預(yù)測性能對比,結(jié)果如圖4所示,圖中縱軸表示樣本均方根誤差(root mean square error, RMSE)。其中Exp核模型對訓(xùn)練集數(shù)據(jù)的RMSE遠高于驗證集,出現(xiàn)嚴重的過擬合現(xiàn)象,因此先將該核函數(shù)剔除。而其余核函數(shù)GPR模型的預(yù)測準確度差異尚不顯著,需要通過參數(shù)敏感性檢驗進一步篩選最優(yōu)核函數(shù)。
通過多次試驗發(fā)現(xiàn),提高式(4)中噪聲分布函數(shù)方差的下限σn_low會顯著降低模型預(yù)測準確度。參數(shù)敏感性校驗是通過改變σn_low來檢查模型RMSE的相對變化率Δ,計算方法如式(8)所示。Δ越小表示模型對該參數(shù)的敏感性越低,即在不同參數(shù)條件下模型的性能可以保持穩(wěn)定。圖4所示結(jié)果是在σn_low=60的情況下得到的,現(xiàn)給定參數(shù)擾動δ。根據(jù)Δ表現(xiàn)判定各核函數(shù)GPR模型的穩(wěn)定性,檢驗結(jié)果如圖5所示。由圖可知,δ=30或60時,四種核函數(shù)模型的RMSE均有不同程度的增加,其中SE內(nèi)核模型的Δ最小,SE內(nèi)核回歸模型相較于其他模型具有更高穩(wěn)定性,因此將SE核函數(shù)作為GPR模型的最優(yōu)核函數(shù)。
圖4 不同核函數(shù)GPR模型性能比較
圖5 模型參數(shù)敏感性檢驗結(jié)果
(8)
式(8)中,δ為參數(shù)擾動。
將建立的最優(yōu)GPR模型與通用PLS,SVR和BPNN三種聚合度預(yù)測模型的性能比較如圖6所示。較為明顯地,BPNN模型[圖6(c)]與GPR模型[圖6(d)]的預(yù)測效果較好,而PLS模型[圖6(a)]與SVR模型[圖6(b)]預(yù)測效果則稍差。
圖6 不同定量分析模型聚合度預(yù)測結(jié)果
利用RMSE與相關(guān)系數(shù)r定量表征四種模型的預(yù)測效果,結(jié)果如表1所示。其中SVR模型性能最差,該模型對校正集樣本以及驗證集樣本的預(yù)測RMSE分別為110.6與105.5。GPR模型的效果最優(yōu),對校正集以及驗證集樣本的預(yù)測結(jié)果均具有最小的RMSE(65.5與70.6)。四種模型的RMSE與r曲線如圖7所示,其中RMSEc與RMSEv分別表示校正集與驗證集的均方根誤差,rc與rv表示校正集與驗證集的相關(guān)系數(shù),圖中表明四種模型對絕緣紙聚合度的預(yù)測準確度排序為:GPR>BPNN>PLS>SVR。
表1 不同絕緣紙聚合度預(yù)測模型性能比較
圖7 四種定量分析模型聚合度預(yù)測結(jié)果
通過加速熱老化實驗制備獲得不同老化程度的絕緣紙樣品,建立了絕緣紙的近紅外光譜數(shù)據(jù)庫,提出了絕緣紙聚合度的GPR預(yù)測模型。主要研究結(jié)論如下:
(1)考慮到核函數(shù)的類型對GPR模型的預(yù)測準確度影響較大,建立了基于多種核函數(shù)的GPR模型,對模型進行參數(shù)敏感性檢驗,研究結(jié)果發(fā)現(xiàn)SE核GPR模型不但能克服過擬合問題,而且模型的參數(shù)敏感性低,穩(wěn)定性最好,由此篩選出基于SE核的最優(yōu)GPR聚合度預(yù)測模型。
(2)與近紅外光譜領(lǐng)域常用預(yù)測模型橫向比較顯示,研究提出的GPR聚合度預(yù)測模型準確度最高,其預(yù)測誤差分別低于PLS,SVR與BPNN模型誤差54.1%,58.8%和12.9%。研究結(jié)果證實了利用GPR方法準確預(yù)測絕緣紙聚合度的可行性。
(3)基于高斯過程回歸的絕緣紙聚合度近紅外光譜評估模型檢測精度較高,相比于傳統(tǒng)檢測方法(粘度法)檢測方便快捷,具有更加廣泛的應(yīng)用場景,能夠更好的服務(wù)于變壓器絕緣老化診斷與運行評價。