(上海海洋大學(xué) 信息學(xué)院,上海 201306)
多相流辨識(shí)廣泛應(yīng)用于石油、動(dòng)力、能源等各種領(lǐng)域中。在自然界及工業(yè)檢測(cè)過(guò)程中,因?yàn)槎嘞嗔髁鲃?dòng)特征復(fù)雜、隨機(jī)性較大,現(xiàn)今的數(shù)學(xué)模型都很難對(duì)其進(jìn)行完整描述,而測(cè)量的精確度也不高[1]。隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,電容層析成像技術(shù)(Electrical Capacitance Tomography,ECT)在多相流流動(dòng)的在線檢測(cè)方面發(fā)展迅速[2]。該技術(shù)具有測(cè)量速度快、非侵入、成本低、適用范圍廣等特點(diǎn)[3]。但是迄今為止,多相流的在線檢測(cè)成像技術(shù)只有少數(shù)已商品化,且多適用于兩相流。而ECT技術(shù)應(yīng)用于在線測(cè)量與控制的過(guò)程中,經(jīng)常因?yàn)楸粶y(cè)管道中的相數(shù)未知而無(wú)法實(shí)現(xiàn)相數(shù)自適應(yīng)的分類(lèi)算法,導(dǎo)致無(wú)法處理多種不同物質(zhì)混雜的多相流問(wèn)題的情況。
目前針對(duì)以上問(wèn)題,有研究者提出用遺傳算法作為學(xué)習(xí)算法的RBF神經(jīng)網(wǎng)絡(luò)可以用于ECT圖像重建[4-6],也有研究者提出用基于支持向量機(jī)(Support Vector Machine,SVM)的ECT圖像重建算法來(lái)解決此類(lèi)問(wèn)題[7],將ECT的圖像重建問(wèn)題歸結(jié)為非線性軟間隔問(wèn)題,利用SVM四層網(wǎng)絡(luò)的泛化性解決多相流問(wèn)題。但這些方法都沒(méi)有從多相流相數(shù)自適應(yīng)的角度來(lái)解決圖像重建問(wèn)題。
本文主要利用SVM與決策樹(shù)相結(jié)合的SVM決策樹(shù)方法在分類(lèi)速度和分類(lèi)精度上的優(yōu)勢(shì),對(duì)電容層析成像圖像重建進(jìn)行研究,結(jié)果顯示,該算法能適應(yīng)多相流相數(shù)變化,即面對(duì)多相流,該算法有較高的圖像重建速度和精度。
在多分類(lèi)問(wèn)題中,會(huì)存在具有相同特征的樣本聚集在一個(gè)集合中的情況,而這些集合便是“類(lèi)簇”,針對(duì)多相流進(jìn)行相數(shù)預(yù)測(cè)時(shí),不同相數(shù)的樣本會(huì)對(duì)應(yīng)不同的類(lèi)簇[8-9]。本文提出的預(yù)測(cè)模型就是圍繞類(lèi)簇開(kāi)展的,SVM決策樹(shù)(Decision Tree SVM,DTSVM)[10-13]的原理是:在對(duì)不同相數(shù)的樣本進(jìn)行分類(lèi)時(shí),把所有樣本歸為兩類(lèi),通過(guò)決策函數(shù)進(jìn)行計(jì)算,歸類(lèi)計(jì)算所得的值,根據(jù)值的正負(fù)形成兩個(gè)子類(lèi),繼續(xù)循環(huán),直到把所有類(lèi)別都?xì)w類(lèi)到其所對(duì)應(yīng)的類(lèi)簇,而SVM決策樹(shù)是通過(guò)支持向量機(jī)進(jìn)行決策分類(lèi)。圖1是針對(duì)樣本數(shù)為4時(shí),所采用的幾種不同SVM決策樹(shù)層次構(gòu)型。圖1(a)是當(dāng)對(duì)樣本無(wú)先驗(yàn)知識(shí)時(shí)采用的構(gòu)型;圖1(b)是當(dāng)對(duì)樣本有充分先驗(yàn)知識(shí)時(shí)采用的構(gòu)型,其思路是首先構(gòu)造一棵最優(yōu)的SVM決策樹(shù),然后再在子類(lèi)的基礎(chǔ)上繼續(xù)分類(lèi);圖1(c)是當(dāng)對(duì)樣本有部分先驗(yàn)知識(shí)時(shí)采用的構(gòu)型。因?yàn)楸疚膶?duì)樣本無(wú)先驗(yàn)知識(shí),所以在對(duì)相數(shù)進(jìn)行判斷時(shí),選擇層次構(gòu)型1(圖1(a))對(duì)相數(shù)進(jìn)行分類(lèi)。
圖1 4類(lèi)問(wèn)題對(duì)應(yīng)的SVM決策樹(shù)層次構(gòu)型
對(duì)于N類(lèi)樣本的分類(lèi)問(wèn)題,一對(duì)一的支持向量機(jī)多分類(lèi)方法在訓(xùn)練時(shí)分別需要構(gòu)建N(N-1)/2個(gè)支持向量機(jī)分類(lèi)器,而一對(duì)多的支持向量機(jī)多分類(lèi)方法在訓(xùn)練時(shí)分別需要構(gòu)建N個(gè)支持向量機(jī)分類(lèi)器,而本文所采用的方法只需構(gòu)建N-1個(gè)支持向量機(jī)分類(lèi)器。因此可以看出本文采用的分類(lèi)器在分類(lèi)效率上明顯優(yōu)于后兩種。
利用SVM決策樹(shù)實(shí)現(xiàn)自適應(yīng)相數(shù)預(yù)測(cè)的具體實(shí)驗(yàn)步驟如下:
① 訓(xùn)練集的選取。把A1~A2M-1種不同介質(zhì)形成的分布所對(duì)應(yīng)的電容值提取出來(lái),作為實(shí)驗(yàn)的訓(xùn)練集Train。
② 單相樣本的預(yù)測(cè)。建立SVM分類(lèi)器,分離單相樣本類(lèi)和其他相數(shù)的樣本類(lèi),找出所有具有單相的樣本,單獨(dú)對(duì)單相的樣本進(jìn)行預(yù)測(cè)。
③M相樣本的預(yù)測(cè)。建立SVM分類(lèi)器,分離M相的樣本類(lèi)和其他相數(shù)樣本類(lèi),找出所有具有M相的樣本,單獨(dú)對(duì)M相的樣本進(jìn)行預(yù)測(cè)。
④K相樣本的預(yù)測(cè)。建立SVM分類(lèi)器,分離K相的樣本和其他相數(shù)的樣本類(lèi),找出所有具有K相的樣本,單獨(dú)對(duì)K相樣本進(jìn)行預(yù)測(cè);重復(fù)此步驟。
圖2為三相流對(duì)應(yīng)的基于SVM決策樹(shù)的自適應(yīng)相數(shù)預(yù)測(cè)模型,其中A1~A3是單相流,A4~A6是兩相流,A7是三相流。從圖中可看出,SVM1實(shí)現(xiàn)A1~A3與A4~A7的分類(lèi),SVM2實(shí)現(xiàn)A1與A2、A3分類(lèi),SVM4實(shí)現(xiàn)A2與A3分類(lèi),SVM3實(shí)現(xiàn)A7與A4~A6分類(lèi),SVM5實(shí)現(xiàn)A4與A5、A6分類(lèi),SVM6實(shí)現(xiàn)A5與A6分類(lèi),此模型實(shí)現(xiàn)了每種相數(shù)的自適應(yīng)。
圖2 三相流對(duì)應(yīng)的基于SVM決策樹(shù)的自適應(yīng)相數(shù)預(yù)測(cè)模型
將氣/油兩種物質(zhì)作為研究對(duì)象,對(duì)應(yīng)的介電常數(shù)分別為εg=1和εo=2.2。將管道內(nèi)其他介質(zhì)的介電常數(shù)設(shè)為εi,而管道內(nèi)樣本的相數(shù)會(huì)出現(xiàn)以下情況:?jiǎn)蜗嗔?,單一介質(zhì)為εg、εo、εi;兩相流,任意兩種介質(zhì)的組合εg和εo、εg和εi、εi和εo;三相流,3種介質(zhì)的組合εg、εo和εi。
實(shí)驗(yàn)中,對(duì)8極板ECT系統(tǒng)進(jìn)行實(shí)驗(yàn)仿真,進(jìn)行數(shù)據(jù)采集。設(shè)管道壁的介電常數(shù)為2.5,對(duì)管道使用有限元剖分法,將其截面剖分為192個(gè)單元,并對(duì)極板電容進(jìn)行計(jì)算。
圖3 管道相數(shù)分類(lèi)模型中SVM決策樹(shù)層次構(gòu)型
本實(shí)驗(yàn)采用8極板ECT系統(tǒng),極板間有28個(gè)獨(dú)立測(cè)量的電容值,將這28組電容值作為特征數(shù)據(jù),從中提取1356組數(shù)據(jù)作為測(cè)試樣本,提取5612組數(shù)據(jù)作為訓(xùn)練樣本,使用圖3中的層次構(gòu)型分類(lèi)管道中存在的樣本。如圖4、圖5所示,樣本的介電常數(shù)εi∈[2.3,5.3],實(shí)驗(yàn)驗(yàn)證了SVM決策樹(shù)多分類(lèi)方法進(jìn)行相數(shù)分類(lèi)預(yù)測(cè)的可行性,其次與普遍使用的One-Versus-Rest(OVR)分類(lèi)算法分析比較,在此區(qū)間中 SVM決策樹(shù)多分類(lèi)預(yù)測(cè)精度更加理想。
圖4 測(cè)試集整體精度
圖5 不同類(lèi)別測(cè)試集精度
由圖4可知,在區(qū)間εi∈[2.3,5.3]范圍內(nèi),對(duì)測(cè)試集整體精度的預(yù)測(cè)絕大部分超過(guò)97%。由圖5可知,在εi>2.4的區(qū)間上,對(duì)每一種類(lèi)別的測(cè)試集的預(yù)測(cè)精度也都超過(guò)95%。由實(shí)驗(yàn)可知,SVM決策樹(shù)算法分類(lèi)精度更高,而且性能穩(wěn)定,在分類(lèi)效果和泛化能力上也更具有優(yōu)勢(shì)。
為了檢驗(yàn)SVM決策樹(shù)相數(shù)分類(lèi)預(yù)測(cè)模型在各種物質(zhì)并存的情況下依然可以適用,如表1所示,選取氣、油、水(εg=1,εo=2.2和εw=80)作為實(shí)驗(yàn)對(duì)象進(jìn)行分類(lèi)預(yù)測(cè),SVM決策樹(shù)分類(lèi)算法的測(cè)試集整體分類(lèi)精度在97.42%左右,且基于SVM決策樹(shù)算法在不同相的分類(lèi)精度比較中都高于OVR算法。如表1所示,運(yùn)行時(shí)間單位為s,SVM決策樹(shù)算法的分類(lèi)速度也快于OVR算法。從表中可知,SVM決策樹(shù)算法不僅在分類(lèi)精度上更優(yōu),而且在分類(lèi)速度上相較于OVR算法也有顯著的提升。
表1 管道中相數(shù)分類(lèi)精度結(jié)果
以上實(shí)驗(yàn)是通過(guò)分類(lèi)不同的相數(shù)來(lái)分類(lèi)管內(nèi)的不同狀態(tài)。本文在以上實(shí)驗(yàn)成果之上,繼續(xù)分析了基于SVM決策樹(shù)的自適應(yīng)相數(shù)預(yù)測(cè)模型,對(duì)優(yōu)化管內(nèi)相數(shù)的自適應(yīng)能力做了進(jìn)一步的探討。如果管道中存在三相,那么最多會(huì)出現(xiàn)A1~A7這7種可能。
單相流:A1:εg=1,A2:εo=2.2,A3:εw=80;
兩相流:A4:εg=1,εo=2.2,A5:εg=1,εw=80,A6:εo=2.2,εw=80;
三相流:A7:εg=1,εo=2.2,εw=80。
表2為管道中自適應(yīng)相數(shù)模型的分類(lèi)精度結(jié)果。
表2 管道中自適應(yīng)相數(shù)模型的分類(lèi)精度結(jié)果
根據(jù)表2可知,當(dāng)出現(xiàn)7種介質(zhì)共存的情況時(shí),基于SVM決策樹(shù)的自適應(yīng)相數(shù)預(yù)測(cè)模型可以實(shí)現(xiàn)各相數(shù)之間的分類(lèi),SVM決策樹(shù)算法的泛化能力優(yōu)異,可以更好地解決相數(shù)自適應(yīng)問(wèn)題。
本文建立基于SVM決策樹(shù)的自適應(yīng)相數(shù)ECT圖像重建算法的體系結(jié)構(gòu),更為直觀地分析SVM決策樹(shù)的自適應(yīng)相數(shù)ECT圖像重建算法,并對(duì)其進(jìn)行性能優(yōu)化,如圖6所示。把經(jīng)過(guò)相數(shù)自適應(yīng)的各類(lèi)樣本分別進(jìn)行歸一化和圖像重建。
圖6 基于SVM決策樹(shù)自適應(yīng)相數(shù)ECT圖像重建算法的體系結(jié)構(gòu)
實(shí)驗(yàn)步驟如下。
(1) 訓(xùn)練集和測(cè)試集采集:選取訓(xùn)練集Train和測(cè)試集Test。
(2) 預(yù)處理數(shù)據(jù)。
在相數(shù)已經(jīng)得到確認(rèn)的情況下,分別使用并聯(lián)歸一化模型對(duì)樣本進(jìn)行歸一化處理,得到自適應(yīng)相數(shù)的電容歸一化模型,獲得了數(shù)據(jù)預(yù)處理后的訓(xùn)練集Train′和測(cè)試集Test′。
(3) 數(shù)據(jù)成像。
多相流圖像的重建是多分類(lèi)問(wèn)題,把不同介質(zhì)的灰度作為樣本的標(biāo)簽,進(jìn)行訓(xùn)練建模。設(shè)數(shù)據(jù)預(yù)處理后的訓(xùn)練集為T(mén)rain′,選適當(dāng)?shù)暮撕瘮?shù)和適當(dāng)?shù)膮?shù)C,構(gòu)造并求解最優(yōu)化問(wèn)題。
(1)
(2)
0≤αi≤Ci=1,…,N
(3)
得最優(yōu)解為
構(gòu)造決策函數(shù)為
圖7是分別利用兩種多相流自適應(yīng)算法下典型流型的重建得到的圖像,第一欄圖像為仿真實(shí)驗(yàn)的原始圖像,第二欄圖像為使用OVR算法進(jìn)行圖像重建所得圖像,第三欄為使用SVM決策樹(shù)自適應(yīng)算法后圖像重建所得圖像。從重建圖像可以看出:基于SVM決策樹(shù)自適應(yīng)相數(shù)的重建圖像效果優(yōu)于OVR算法,具有較高的準(zhǔn)確度,整體的重建精度得到了提升。
圖7 兩種多相流自適應(yīng)方法的重建圖像
電容層析成像系統(tǒng)已經(jīng)廣泛應(yīng)用于多相流檢測(cè)領(lǐng)域中,本文通過(guò)改進(jìn)SVM實(shí)現(xiàn)自適應(yīng)相數(shù)ECT圖像重建算法,基于SVM決策樹(shù)的相數(shù)自適應(yīng)模型可以很好地應(yīng)對(duì)實(shí)際應(yīng)用中存在的需求。為了驗(yàn)證算法的性能,通過(guò)基于SVM決策樹(shù)的自適應(yīng)相數(shù)預(yù)測(cè)模型進(jìn)行實(shí)驗(yàn)。該預(yù)測(cè)模型可以以較高的精度來(lái)區(qū)分管內(nèi)包含的介電常數(shù)差異不大的介質(zhì),且重建圖像的精度較高。該算法是解決相數(shù)不確定的多相流問(wèn)題的一個(gè)有效途徑。