潘用科, 賀紫平, 夏克文, 牛文佳
(河北工業(yè)大學(xué) 電子信息工程學(xué)院,天津 300401)
在傳統(tǒng)的石油鉆探及測(cè)井識(shí)別中,油層識(shí)別扮演著重要的角色。由于傳統(tǒng)的油層識(shí)別技術(shù)已經(jīng)無(wú)法滿(mǎn)足現(xiàn)代化石油工業(yè)的需求,因此,研究者們將現(xiàn)代的數(shù)據(jù)挖掘方法如二階錐優(yōu)化的多核相關(guān)向量機(jī)(multiple-kernel relevance vector machine on second order cone programming, SOCP-MKRVM)[1]、多核相關(guān)向量機(jī)(multi-core support vector machine, MKRVM)[2]、隨機(jī)森林(random forest, RF)[3]等方法用在石油測(cè)井識(shí)別中,并且獲得了不錯(cuò)的測(cè)井識(shí)別效果。但在石油測(cè)井中,有標(biāo)簽的數(shù)據(jù)往往很難獲得,而大量的無(wú)標(biāo)簽的數(shù)據(jù)卻沒(méi)有被利用。半監(jiān)督算法因能夠同時(shí)利用未標(biāo)記和有標(biāo)記樣本來(lái)進(jìn)行訓(xùn)練和改善分類(lèi)器的性能,所以本文將半監(jiān)督支持向量機(jī)(semi-supervised support vector machine,S3VM)思想引入到油層識(shí)別中,以提高油層預(yù)測(cè)精度及減少樣本獲取代價(jià)。
半監(jiān)督學(xué)習(xí)(semi-supervised learning, SSL)[4]早在20世紀(jì)70年代首次將無(wú)標(biāo)簽的樣本用于自訓(xùn)練(self-training, SL)方法,但由于該方法的學(xué)習(xí)性能完全依靠?jī)?nèi)部的SL方法,會(huì)導(dǎo)致模型的性能下降。因此,學(xué)者們提出了直推式學(xué)習(xí),該方法是基于SL方法的改進(jìn)來(lái)預(yù)測(cè)訓(xùn)練集和測(cè)試集中的無(wú)標(biāo)簽樣本的類(lèi)標(biāo)簽。再后來(lái),協(xié)同訓(xùn)練(co-training)[5]和直推式支持向量機(jī)(transductive support vector machine,TSVM)[6-7]等方法被陸續(xù)提出。協(xié)同訓(xùn)練算法核心思想是利用充分冗余的視圖訓(xùn)練出兩個(gè)具有差異性的學(xué)習(xí)機(jī),以提高無(wú)標(biāo)簽樣本的預(yù)測(cè)標(biāo)簽置信度[8]。由于傳統(tǒng)協(xié)同訓(xùn)練存在初始分類(lèi)器精度不高的問(wèn)題,弱分類(lèi)器很容易受到另一個(gè)弱分類(lèi)器錯(cuò)誤預(yù)測(cè)的無(wú)標(biāo)記樣本及其對(duì)應(yīng)的錯(cuò)誤標(biāo)簽的影響,因此協(xié)同訓(xùn)練算法的性能通常是不穩(wěn)定的,容易導(dǎo)致錯(cuò)誤的累積[9]。為此,本文提出了一種改進(jìn)的基于量子行為粒子群優(yōu)化[10]的協(xié)同訓(xùn)練S3VM油層識(shí)別算法。該算法首先采用協(xié)同訓(xùn)練的策略,并同時(shí)采用了文獻(xiàn)[11]的方法以避免傳統(tǒng)協(xié)同訓(xùn)練的訓(xùn)練過(guò)程中的錯(cuò)誤累積。通過(guò)建立兩個(gè)獨(dú)立的初始分類(lèi)器,然后兩個(gè)分類(lèi)器互相交換高置信度的無(wú)標(biāo)簽樣本來(lái)達(dá)到提高本身性能的目的。其次采用量子行為粒子群算法優(yōu)化S3VM,提高初始無(wú)標(biāo)簽樣本的分類(lèi)精度。又考慮到錯(cuò)分類(lèi)的無(wú)標(biāo)簽樣本進(jìn)入循環(huán)從而導(dǎo)致模型總體性能下降的問(wèn)題,使用了一種改進(jìn)的近鄰數(shù)據(jù)剪輯方法來(lái)預(yù)測(cè)無(wú)標(biāo)簽樣本偽標(biāo)簽的置信度。最后,將該改進(jìn)的算法模型應(yīng)用于實(shí)際測(cè)井?dāng)?shù)據(jù)挖掘的油層識(shí)別,并驗(yàn)證其在石油實(shí)際應(yīng)用中的有效性。
i=l+1,l+2,…,m,
ξi≥0,i=1,2,…,m。
(1)
式中:ω為對(duì)無(wú)標(biāo)簽樣本進(jìn)行分類(lèi)時(shí)的最優(yōu)超平面;b為超平面偏移量;C和C*分別為有標(biāo)簽樣本與無(wú)標(biāo)簽樣本的影響因子;ξ和ξ*分別為有標(biāo)簽樣本與無(wú)標(biāo)簽樣本的懲罰因子。
粒子群算法[12]是模仿鳥(niǎo)群捕食行為的智能優(yōu)化算法。量子行為粒子群優(yōu)化算法針對(duì)粒子群算法易陷入局部最小值的問(wèn)題[13],引入了量子的概念,提升了粒子的隨機(jī)性,從而提升了粒子群算法的全局搜索能力。量子行為粒子群優(yōu)化算法的原理如下。
假設(shè)有m個(gè)粒子組成的種群在N維的求解空間中,第i個(gè)粒子t時(shí)刻的位置為X(t)(i)=[X(t)(i,1),X(t)(i,2),…,X(t)(i,d)],第i個(gè)粒子的歷史最好位置為G(t)(i)=[G(t)(i,1),G(t)(i,2),…,G(t)(i,d)],種群的全局最優(yōu)位置為G(t)(g)。
粒子更新位置的公式為
(2)
式中:α為收縮膨脹系數(shù)控制算法的收斂速度;u和k為[0,1]隨機(jī)數(shù);Mbest為歷史個(gè)體平均最優(yōu)位置;G(i)為局部吸引器用以保證算法的收斂性。
(3)
G(i)=φG(t)(i)+(1-φ)G(t)(g)。
(4)
量子行為粒子群優(yōu)化算法的應(yīng)用范圍廣泛,其中應(yīng)用比較多、效果比較好的在于支持向量機(jī)中的核函數(shù)和懲罰系數(shù)的參數(shù)尋優(yōu)[14-15]。所以本文引入量子行為粒子群算法對(duì)S3VM的核參數(shù)和懲罰參數(shù)進(jìn)行尋優(yōu)。
協(xié)同訓(xùn)練算法需要滿(mǎn)足以下2個(gè)條件:
(1)必須有足夠的數(shù)據(jù)集在所有屬性集中分別訓(xùn)練出強(qiáng)分類(lèi)器;
(2)如果數(shù)據(jù)集中的標(biāo)簽樣本是已知的,那么其中樣本中的屬性集合需要各自獨(dú)立。
以上條件意味著樣本集必須擁有冗余且充分的視圖。若上述條件都滿(mǎn)足時(shí),協(xié)同訓(xùn)練算法如下所示。
給定有標(biāo)記數(shù)據(jù)集X與無(wú)標(biāo)記數(shù)據(jù)集U,數(shù)據(jù)集X1、X2為有標(biāo)記數(shù)據(jù)集X的兩個(gè)獨(dú)立的屬性視圖。利用數(shù)據(jù)集X1和X2分別訓(xùn)練出兩個(gè)不同的分類(lèi)器,然后讓每個(gè)分類(lèi)器分別將無(wú)標(biāo)記數(shù)據(jù)集U置信度最高的樣本賦予偽標(biāo)記,同時(shí)提供給另一個(gè)分類(lèi)器最新增加的有標(biāo)記樣本用于訓(xùn)練更新,如此循環(huán)往復(fù)直至達(dá)到預(yù)先設(shè)定的迭代次數(shù)或者分類(lèi)器不再變化。無(wú)標(biāo)簽樣本未標(biāo)記的置信度的計(jì)算式如下所示:
(5)
式中:f(xi)為當(dāng)前分類(lèi)器;f′(xi)為加入標(biāo)記過(guò)的無(wú)標(biāo)記樣本訓(xùn)練得到的分類(lèi)器;yi為標(biāo)簽。
協(xié)同訓(xùn)練主要依賴(lài)于多視圖的“相容互補(bǔ)性”。若數(shù)據(jù)包含2個(gè)充分、冗余視圖,可在每個(gè)視圖下,利用有標(biāo)簽樣本訓(xùn)練得到一個(gè)分類(lèi)器[16];然后使用各個(gè)分類(lèi)器分別對(duì)無(wú)標(biāo)簽樣本標(biāo)記進(jìn)行預(yù)測(cè),從而得到無(wú)標(biāo)簽樣本的標(biāo)記;最后在每個(gè)分類(lèi)器中依據(jù)置信度估計(jì)方法,將預(yù)測(cè)標(biāo)記置信度最高的無(wú)標(biāo)記樣本及其標(biāo)簽放置到另一個(gè)分類(lèi)器中。循環(huán)此過(guò)程,直到達(dá)到最大循環(huán)次數(shù)或分類(lèi)器都不再變化。
為了提高協(xié)同訓(xùn)練初始分類(lèi)器對(duì)樣本標(biāo)注的準(zhǔn)確率及訓(xùn)練速度,采用量子行為粒子群優(yōu)化算法[10]來(lái)優(yōu)化半監(jiān)督支持向量機(jī),獲得一個(gè)強(qiáng)S3VM分類(lèi)器作為初始分類(lèi)器?;赒PSO-S3VM構(gòu)建兩個(gè)初始分類(lèi)器,并引入半監(jiān)督學(xué)習(xí)的思想。通過(guò)QPSO算法對(duì)S3VM的懲罰系數(shù)C1和核參數(shù)γ這兩個(gè)參數(shù)進(jìn)行快速尋優(yōu),減少迭代訓(xùn)練的時(shí)間,提高樣本標(biāo)注的準(zhǔn)確率,其次由于半監(jiān)督學(xué)習(xí)思想的引進(jìn),減少了算法模型對(duì)有標(biāo)簽樣本的依賴(lài)程度,在實(shí)際應(yīng)用中大大降低了提取樣本信息的成本代價(jià)。
在協(xié)同訓(xùn)練中,由于初始已標(biāo)記數(shù)據(jù)集規(guī)模很小,以及初始分類(lèi)器分類(lèi)能力不強(qiáng),在協(xié)同訓(xùn)練過(guò)程中噪聲樣本不斷地引入,會(huì)導(dǎo)致模型分類(lèi)能力低下。因此,數(shù)據(jù)剪輯(data editing)技術(shù)[11]被應(yīng)用到協(xié)同訓(xùn)練中,切邊權(quán)重統(tǒng)計(jì)(cut edge weight statistic)方法就是其中的一種。
通過(guò)一組有標(biāo)記樣本L構(gòu)造一個(gè)無(wú)定向的近鄰圖GL,探索近鄰圖GL上的結(jié)構(gòu)信息判斷樣本點(diǎn)xp的標(biāo)簽yp是否正確。在此基礎(chǔ)上,每個(gè)樣本xp及其標(biāo)簽yp的置信度可由切邊權(quán)重統(tǒng)計(jì)估計(jì)為
Jp=∑xp∈CpwpqIpq。
(6)
式中:Cp為在近鄰圖GL與xp相關(guān)的所有的樣本總集;wpq∈[0,1]為近鄰圖中的權(quán)重,wpq=(1+d(xp,xq))-1,d(xp,xq)可由歐式距離求得;每個(gè)Ipq對(duì)應(yīng)一個(gè)獨(dú)立同分布的伯努利隨機(jī)變量,當(dāng)yq與yp的標(biāo)簽不同時(shí),Ipq為1,通常,pr(Ipq=1)=1-pr(y=yp)。
(7)
(8)
(9)
可定義樣本(xp,yp)置信度為
隨著科學(xué)技術(shù)和信息技術(shù)的快速發(fā)展,“高效”不僅成為企業(yè)樹(shù)立良好形象的代言詞,更是滲透到人類(lèi)生活的點(diǎn)點(diǎn)滴滴中。高技術(shù)產(chǎn)業(yè)在不斷發(fā)展的過(guò)程中所展現(xiàn)出的創(chuàng)新技術(shù),既為國(guó)家經(jīng)濟(jì)的發(fā)展提供了持續(xù)的生命力,也為其他產(chǎn)業(yè)間的緊密聯(lián)系提供了多形式、更快捷的途徑。提高高技術(shù)產(chǎn)業(yè)自身的創(chuàng)新效率既是外部形式的推動(dòng),也是內(nèi)部環(huán)境發(fā)展的需要。從發(fā)展戰(zhàn)略角度上看,它對(duì)于降低創(chuàng)新主體發(fā)展成本、提高產(chǎn)業(yè)績(jī)效具有積極的作用,是創(chuàng)新主體增強(qiáng)競(jìng)爭(zhēng)力的有效途徑。
(10)
本文對(duì)于任何的標(biāo)簽樣本(x,y)都可以采用基于近鄰數(shù)據(jù)剪輯技術(shù)CFZ(xp,yp)來(lái)估計(jì)樣本標(biāo)簽置信度。
2.4.1 算法描述
給出有標(biāo)簽樣本集L={(x1,y1),(x2,y2),…,(xN,yN)},且屬性集為X,yi∈{+1,-1},i=1,2,…,N。屬性集X由兩個(gè)獨(dú)立同分布的屬性集X1、X2表示,在屬性集X1、X2上將有標(biāo)記樣本集L劃分為L(zhǎng)1,L2,然后利用基于X1、X2的屬性集的有標(biāo)簽樣本集L1和L2分別構(gòu)造出兩個(gè)存在差異性的QPSO-S3VM分類(lèi)模型,用于對(duì)無(wú)標(biāo)簽樣本數(shù)據(jù)的預(yù)測(cè),最后選擇置信度最高的無(wú)標(biāo)簽樣本為偽標(biāo)簽,并將之放置于另一個(gè)分類(lèi)器的有標(biāo)記樣本子集中,如此反復(fù),直至兩個(gè)分類(lèi)器都不再發(fā)生變化,或達(dá)到了預(yù)先的迭代次數(shù)。
2.4.2 算法步驟
改進(jìn)的協(xié)同訓(xùn)練半監(jiān)督SVM算法如下所示。
算法1協(xié)同訓(xùn)練算法。
輸入: 基于X1的有標(biāo)簽樣本集L1,基于X2的有標(biāo)簽樣本集L2,基于X1的無(wú)標(biāo)簽樣本集U1,基于X2的無(wú)標(biāo)簽樣本集U2;
輸出:最終分類(lèi)器f,最優(yōu)參數(shù)組合{C1,γ}。
Step1油層數(shù)據(jù)樣本預(yù)處理。
Step2初始化粒子群。初始化粒子群(C1,γ),確定群體模型,設(shè)定粒子群參數(shù)及最大迭代次數(shù)Tmax,每個(gè)粒子的個(gè)體最優(yōu)解pbesti初始值為xi的初始值,gbesti為全局最優(yōu)解。
Step3評(píng)價(jià)各粒子適應(yīng)度(fitness)。首先用QPSO-S3VM分別對(duì)有標(biāo)簽樣本集L1、L2進(jìn)行訓(xùn)練,得到兩個(gè)初始分類(lèi)器f1、f2。其次將分類(lèi)器f1和f2分別對(duì)無(wú)標(biāo)簽樣本集U1和U2進(jìn)行測(cè)試,用于預(yù)測(cè)無(wú)標(biāo)簽樣本的標(biāo)簽。然后用無(wú)標(biāo)簽樣本及其預(yù)測(cè)標(biāo)簽構(gòu)造近鄰圖,并利用式(10)估計(jì)無(wú)標(biāo)簽樣本預(yù)測(cè)標(biāo)簽的置信度。分別從U1和U2中選擇最優(yōu)的一組無(wú)標(biāo)簽樣本及其預(yù)測(cè)標(biāo)簽放置對(duì)方的有標(biāo)簽樣本訓(xùn)練集中。最后更新有標(biāo)簽樣本集L1、L2。在更新后的樣本集L1、L2上重新訓(xùn)練,得到新的分類(lèi)器模型。再對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),采用K折交叉驗(yàn)證法計(jì)算的平均準(zhǔn)確率αk-cv計(jì)算每個(gè)樣本的粒子適應(yīng)度。
Step4對(duì)每個(gè)粒子,比較當(dāng)前適應(yīng)度f(wàn)(xi)和歷史最好位置適應(yīng)度f(wàn)(pbesti),如果f(xi) Step5使用式(2)~(4)更新粒子的位置,產(chǎn)生新種群X(t+1)。 Step6檢查結(jié)束條件,若滿(mǎn)足,則結(jié)束尋優(yōu),返回當(dāng)前最優(yōu)個(gè)體為結(jié)果,否則t=t+1,轉(zhuǎn)至Step 3。設(shè)定結(jié)束條件為無(wú)標(biāo)簽樣本集U1、U2為空且尋優(yōu)達(dá)到最大迭代次數(shù)Tmax或評(píng)價(jià)值小于給定精度。 Step7輸出參數(shù)尋優(yōu)結(jié)果。當(dāng)滿(mǎn)足結(jié)束條件時(shí),最大適應(yīng)度函數(shù)所對(duì)應(yīng)的C1和γ即為最優(yōu)組合{C1,γ}。 Step8輸出最終模型。當(dāng)無(wú)標(biāo)簽樣本集U1、U2為空,或達(dá)到最大迭代次數(shù)時(shí),合并兩個(gè)訓(xùn)練集L1、L2形成最終訓(xùn)練集L,重新訓(xùn)練得到最終分類(lèi)器f,即識(shí)別模型。 基于量子行為粒子群優(yōu)化的協(xié)同訓(xùn)練半監(jiān)督SVM(QPSO-CS3VM)油層識(shí)別模型如圖1所示。油層識(shí)別一共有5個(gè)步驟。 (1)油層數(shù)據(jù)樣本的預(yù)處理。對(duì)數(shù)據(jù)進(jìn)行歸一化的處理。 (2)油層屬性的離散化。使用0表示無(wú)油層,1表示油層,所以決策屬性為D=j5i0abt0b,d={di=i,i=0,1}。 (3)對(duì)油層數(shù)據(jù)樣本中的屬性進(jìn)行約簡(jiǎn)。常規(guī)的測(cè)井?dāng)?shù)據(jù)中不僅有多余的無(wú)效屬性,且至少含有15種以上的測(cè)井信息。因此,本文采用基于屬性重要性的約簡(jiǎn)算法[18]將屬性集X分為X1、X2兩部分。 (4)協(xié)同訓(xùn)練半監(jiān)督SVM算法建模。在協(xié)同訓(xùn)練半監(jiān)督SVM模型中,輸入經(jīng)屬性約簡(jiǎn)后的樣本信息,采用QPSO-S3VM算法進(jìn)行訓(xùn)練,對(duì)無(wú)標(biāo)簽樣本進(jìn)行標(biāo)注,同時(shí)利用數(shù)據(jù)剪輯技術(shù)以減少分類(lèi)器的錯(cuò)分,提高樣本標(biāo)注準(zhǔn)確率,最后得到QPSO-CS3VM分類(lèi)模型。 (5)油層數(shù)據(jù)識(shí)別。使用QPSO-CS3VM模型對(duì)油層數(shù)據(jù)進(jìn)行識(shí)別得到最終結(jié)果。 圖1 QPSO-CS3VM油層識(shí)別模型Figure 1 Oil layer recognition of QPSO-CS3VM 本文選取了具有代表性的兩口井(Q1和Q2)的實(shí)際測(cè)井?dāng)?shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試,用于證明本文提出的改進(jìn)協(xié)同訓(xùn)練半監(jiān)督SVM油層識(shí)別模型的應(yīng)用效果。Q1井的數(shù)據(jù)如表1所示,Q2井的數(shù)據(jù)如表2所示。 表1 Q1井的基本數(shù)據(jù)Table 1 Basic data of Q1 well 表2 Q2井的基本數(shù)據(jù)Table 2 Basic data of Q2 well (1)油層數(shù)據(jù)樣本的預(yù)處理。Q1井具有11個(gè)條件屬性,分別為:AC、CALI、GR、NG、RA2、RA4、RI、RM、RT、RXO、SP。決策屬性D=j5i0abt0b,d={di=i,i=0,1},0和1分別表示無(wú)油層和油層。 Q2井具有28個(gè)條件屬性,分別為:AC、CNL、DEN、GR、RT、RI、RXO、SP、R2M、R025、BZSP、RA2、C1、C2、CALI、RINC、PORT、VCL、VMA1、VMA6、RHOG、SW、VO、WO、PORE、VXO、VW、AC1。決策屬性D=j5i0abt0b,d={di=i,i=0,1}。0和1分別表示無(wú)油層和油層。 (2)對(duì)測(cè)井?dāng)?shù)據(jù)中的信息屬性進(jìn)行約簡(jiǎn)。Q1井的數(shù)據(jù)經(jīng)過(guò)屬性約簡(jiǎn)后,屬性X1由以下4個(gè)屬性組成:AC、NG、RI、SP,屬性X2由CALI、GR、RA2、RA4、RM、RT、RXO這7個(gè)屬性組成。 Q2井的數(shù)據(jù)經(jīng)過(guò)屬性約簡(jiǎn)后,屬性X1由以下5個(gè)屬性組成:AC、GR、RT、RXO、SP,屬性X2由CNL、DEN、RI、R2M、R025、BZSP、RA2、C1、C2、CALI、RINC、PORT、VCL、VMA1、VMA6、RHOG、SW、VO、WO、PORE、VXO、VW、AC1這23個(gè)屬性組成。 最后,對(duì)約簡(jiǎn)后的數(shù)據(jù)進(jìn)行歸一化處理以便模型進(jìn)行油層識(shí)別,其中,Q1井?dāng)?shù)據(jù)屬性X1的歸一化圖如圖2所示。 圖2 屬性X1歸一化處理Figure 2 Normalization attribute of X1 (3)識(shí)別結(jié)果及比較。將在Q1井的訓(xùn)練集上訓(xùn)練好的預(yù)測(cè)模型對(duì)Q1井1 180~1 320 m的2 537個(gè)樣本進(jìn)行油層識(shí)別。同時(shí)將在Q2井的訓(xùn)練集上訓(xùn)練好的預(yù)測(cè)模型對(duì)Q2井1 190~1 290 m的641個(gè)樣本進(jìn)行油層識(shí)別。最后,將本文提出的油層識(shí)別模型與PSO優(yōu)化的SVM模型、QPSO優(yōu)化的SVM模型[15]和傳統(tǒng)協(xié)同訓(xùn)練半監(jiān)督SVM(CS3VM)模型相比較,Q1井上測(cè)得的性能指標(biāo)見(jiàn)表3,Q2井上測(cè)得的性能指標(biāo)見(jiàn)表4,圖3表示Q1和Q2井的真實(shí)油層分布及其預(yù)測(cè)油層分布。其中,運(yùn)行時(shí)間是在CPU為Intel Core i7,內(nèi)存為8 GB的計(jì)算機(jī)上的運(yùn)行時(shí)間。 表3 Q1井的油層識(shí)別結(jié)果Table 3 Oil layer recognition results of Q1 well 表4 Q2井的油層識(shí)別結(jié)果Table 4 Oil layer recognition results of Q2 well 由表3和表4可知,在相同條件下,在識(shí)別率方面,本文提出的改進(jìn)的協(xié)同訓(xùn)練半監(jiān)督SVM識(shí)別模型明顯優(yōu)于協(xié)同訓(xùn)練半監(jiān)督SVM模型,主要是因?yàn)橛蒕PSO優(yōu)化的半監(jiān)督SVM模型的分類(lèi)效果要強(qiáng)于標(biāo)準(zhǔn)的半監(jiān)督SVM識(shí)別模型。與全監(jiān)督算法相比,本文算法在Q1井的測(cè)試集中得到了比PSO優(yōu)化的SVM與QPSO優(yōu)化的SVM模型更高的識(shí)別率,并且本文所提算法的識(shí)別率相較于基于S3VM的協(xié)同訓(xùn)練算法提高了5.00百分點(diǎn)。在Q2井的測(cè)試集訓(xùn)練結(jié)果中,本文算法與其他3種算法相比,取得了94.07%的最高識(shí)別率,并且相較于基于S3VM的協(xié)同訓(xùn)練算法,本文算法的識(shí)別率提高了3.12百分點(diǎn),說(shuō)明本文改進(jìn)算法應(yīng)用效果十分顯著。 由圖3可知,無(wú)論是對(duì)Q1井還是Q2井,本文提出模型預(yù)測(cè)的油層分布與真實(shí)油層分布十分接近,表現(xiàn)出了優(yōu)異的油層識(shí)別性能。由此可驗(yàn)證本文提出的QPSO優(yōu)化的協(xié)同訓(xùn)練半監(jiān)督學(xué)習(xí)在油層識(shí)別中的有效性。 圖3 Q1井與Q2井真實(shí)與預(yù)測(cè)油層分布對(duì)比Figure 3 Comparison of actual and predicted oil layer distribution of Q1 and Q2 wells 針對(duì)傳統(tǒng)S3VM算法分類(lèi)精度較低,分類(lèi)效果差的問(wèn)題,本文采用了協(xié)同訓(xùn)練的思想,構(gòu)建了兩個(gè)分類(lèi)器互相學(xué)習(xí)協(xié)同合作從而提高彼此分類(lèi)精度。其次,為提高兩個(gè)初始分類(lèi)器的分類(lèi)效果,引入了QPSO算法來(lái)優(yōu)化S3VM,以獲得一個(gè)較好的初始分類(lèi)結(jié)果,從而達(dá)到提高最終總體模型分類(lèi)效果的目的。最后,使用一種改進(jìn)的近鄰數(shù)據(jù)剪輯方法預(yù)測(cè)無(wú)標(biāo)簽樣本偽標(biāo)簽置信度,進(jìn)而提高無(wú)標(biāo)簽樣本預(yù)測(cè)精度,避免錯(cuò)分類(lèi)樣本進(jìn)入循環(huán)而導(dǎo)致模型性能惡化。此方法應(yīng)用于油層識(shí)別時(shí),實(shí)驗(yàn)結(jié)果表明該改進(jìn)模型分類(lèi)效果優(yōu)異,并在僅使用少量有標(biāo)簽樣本的條件下,相對(duì)于其他對(duì)比算法,本文模型識(shí)別精度高,從而減少了獲取有標(biāo)簽樣本的代價(jià),體現(xiàn)了半監(jiān)督思想的優(yōu)異性和有效性,具有很好的應(yīng)用前景。3 油層識(shí)別應(yīng)用
3.1 油層識(shí)別基本模型
3.2 實(shí)際應(yīng)用
4 結(jié)論