• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于新型集成學(xué)習(xí)算法的基巖潛山油藏儲(chǔ)層裂縫開(kāi)度預(yù)測(cè)算法

      2020-05-15 14:40:06孫致學(xué)姜寶勝李吉康
      油氣地質(zhì)與采收率 2020年3期
      關(guān)鍵詞:開(kāi)度測(cè)井聚類

      孫致學(xué),姜寶勝,肖 康,李吉康

      (1.中國(guó)石油大學(xué)(華東)石油工程學(xué)院,山東青島 266580;2.非常規(guī)油氣開(kāi)發(fā)教育部重點(diǎn)實(shí)驗(yàn)室中國(guó)石油大學(xué)(華東),山東青島 266580;3.中國(guó)石油勘探開(kāi)發(fā)研究院非洲研究所,北京 100083)

      近年來(lái),全球已在30余個(gè)盆地發(fā)現(xiàn)了基巖油氣資源,基巖油氣藏成為重要的勘探開(kāi)發(fā)陣地。相對(duì)于常規(guī)沉積巖油氣儲(chǔ)層,基巖儲(chǔ)層中天然裂縫類型、產(chǎn)狀、特征參數(shù)的精準(zhǔn)評(píng)價(jià)更加重要。由于該類油氣藏基巖致密、孔滲性極低,天然裂縫系統(tǒng)不僅控制了有效儲(chǔ)層發(fā)育程度和油氣儲(chǔ)量規(guī)模,同時(shí)也是油氣開(kāi)采過(guò)程中的重要運(yùn)移通道。裂縫開(kāi)度是評(píng)價(jià)基巖油氣藏儲(chǔ)層質(zhì)量的重要參數(shù)。相對(duì)于裂縫密度,裂縫開(kāi)度對(duì)儲(chǔ)層有效滲透率的貢獻(xiàn)更為顯著,也是影響其產(chǎn)能的主控因素之一[1-3]。目前儲(chǔ)層天然裂縫開(kāi)度預(yù)測(cè)方法主要分為2 大類:一類是直接觀察法,包括巖心觀測(cè)、露頭識(shí)別、電鏡觀測(cè)等;另一類是間接觀察法,包括成像測(cè)井、數(shù)值模擬、經(jīng)驗(yàn)公式、動(dòng)態(tài)資料分析等。其中露頭識(shí)別法是獲得裂縫開(kāi)度最直接的途徑[4],但地表風(fēng)化作用使裂縫充填特征發(fā)生顯著變化,影響測(cè)量結(jié)果,同時(shí)露頭區(qū)可能遭受后期的改造或掩埋,使得典型裂縫發(fā)育的露頭不容易獲得。巖心中包含著最為直觀、詳實(shí)的裂縫信息,但取心資料往往少且不連續(xù),同時(shí)機(jī)械應(yīng)力對(duì)巖心的破壞影響天然裂縫開(kāi)度的測(cè)量。隨著斷層掃描機(jī)、陰極射線發(fā)光、核磁共振、三維激光掃描技術(shù)的發(fā)展,裂縫開(kāi)度表征朝更微觀、更立體和更精細(xì)的方向發(fā)展[5-6]。但由于儀器探測(cè)能力的限制,無(wú)法系統(tǒng)、大規(guī)模表征天然裂縫開(kāi)度。成像測(cè)井具有高分辨率且連續(xù)測(cè)量的特點(diǎn),能夠直觀地反映裂縫信息,但由于測(cè)量成本高,導(dǎo)致獲得的數(shù)據(jù)非常有限。通過(guò)室內(nèi)數(shù)值模擬裝置進(jìn)行裂縫開(kāi)度模擬分析,測(cè)量相對(duì)誤差較小,但裝備適用范圍有限,實(shí)驗(yàn)參數(shù)難以獲得,無(wú)法真實(shí)還原地層條件。進(jìn)行應(yīng)力場(chǎng)有限元數(shù)值模擬需考慮地質(zhì)體的巖石物理特征,所需參數(shù)較多,難以準(zhǔn)確獲取。該方法可以在一定程度上預(yù)測(cè)裂縫分布,但由于模型并不能反映實(shí)際地層情況,導(dǎo)致誤差較大[7-8]。依據(jù)滲流力學(xué)原理,利用泥漿漏失數(shù)據(jù)建立裂縫泥漿漏失數(shù)學(xué)模型,根據(jù)鉆井資料進(jìn)行裂縫開(kāi)度計(jì)算也是當(dāng)下研究的熱點(diǎn)。但該方法受漏失數(shù)據(jù)的限制,適用范圍有限。對(duì)大多數(shù)油田而言,現(xiàn)有資料中除了少量取心資料外,其余幾乎是常規(guī)測(cè)井資料,因此如何利用常規(guī)測(cè)井信息建立裂縫的測(cè)井響應(yīng)機(jī)理模型,進(jìn)而計(jì)算天然裂縫開(kāi)度,是不得不面對(duì)的實(shí)際問(wèn)題。目前應(yīng)用測(cè)井?dāng)?shù)據(jù)解釋天然裂縫仍停留在定性分析水平上[9-10]。主要是由于傳感器捕獲的實(shí)時(shí)測(cè)井?dāng)?shù)據(jù)具有高維、非線性和高噪性的特點(diǎn),難以建立與裂縫開(kāi)度之間的量化關(guān)系。機(jī)器學(xué)習(xí)對(duì)于解決非線性問(wèn)題具有先天優(yōu)勢(shì),而集成學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)[11],相較于單一機(jī)器學(xué)習(xí)算法,集成學(xué)習(xí)算法具有更高的精度和更顯著的泛化性能。

      圖1 中非乍得某基巖潛山巖心裂縫照片F(xiàn)ig.1 Photos of fractured core samples from bedrock buried hill in Chad,Central Africa

      1 樣本集構(gòu)建

      研究區(qū)位于B 盆地中非乍得西南部、中非剪切帶中段北側(cè),大量巖心和井壁取心分析資料揭示B盆地基巖潛山巖性分為變質(zhì)巖和巖漿巖2 大類13個(gè)亞類30多種巖石類型,主要由花崗巖、正長(zhǎng)巖、閃長(zhǎng)巖和二長(zhǎng)巖等巖漿巖及混合花崗巖和片麻巖類等正變質(zhì)巖構(gòu)成[12]。通過(guò)對(duì)該潛山15口取心井(含新完鉆井)巖心裂縫形態(tài)、規(guī)模及典型特征進(jìn)行觀察及描述,發(fā)現(xiàn)研究區(qū)油氣運(yùn)移通道包括構(gòu)造裂縫、網(wǎng)狀縫、張剪縫及沿縫溶蝕孔洞,以張剪縫為主(圖1)。

      1.1 學(xué)習(xí)樣本特征

      準(zhǔn)確且全面的裂縫數(shù)據(jù)樣本是實(shí)現(xiàn)模型訓(xùn)練的基礎(chǔ)。所用數(shù)據(jù)集包括測(cè)井?dāng)?shù)據(jù)(表1)及相應(yīng)裂縫開(kāi)度值,共2 140 組,由基巖潛山油藏巖心描述、關(guān)鍵井成像測(cè)井、巖礦薄片鑒定等數(shù)據(jù)組成。由裂縫開(kāi)度分布(圖2)可知,樣本集中裂縫開(kāi)度最小值為0.011 mm,最大值為0.544 mm,平均值為0.183 mm,標(biāo)準(zhǔn)差為0.087 mm,裂縫開(kāi)度主要集中在0.126~0.258 mm。

      表1 測(cè)井?dāng)?shù)據(jù)統(tǒng)計(jì)結(jié)果Table1 Statistics of well logging parameters

      圖2 裂縫開(kāi)度分布Fig.2 Fracture aperture distribution

      1.2 Z-score標(biāo)準(zhǔn)化處理

      在進(jìn)行裂縫預(yù)測(cè)前,需將學(xué)習(xí)樣本進(jìn)行Z-score標(biāo)準(zhǔn)化處理,即將其轉(zhuǎn)換為均值為0、方差為1 的分布,其表達(dá)式為:

      如果一個(gè)特征的方差比其余特征的方差大許多個(gè)數(shù)量級(jí),那么該特征將會(huì)主導(dǎo)整個(gè)目標(biāo)函數(shù),使得模型不能從其余特征學(xué)習(xí)到數(shù)據(jù)的特征。相對(duì)于min-max 歸一化方法,該方法不僅能夠去除量綱,還能夠均衡考慮所有維度的變量。

      1.3 K均值聚類算法進(jìn)行樣本去噪

      樣本數(shù)據(jù)由于測(cè)量?jī)x器及人為因素的干擾,不可避免的引入噪聲。為此采取利用K均值聚類算法進(jìn)行數(shù)據(jù)過(guò)濾的思路,以去除冗余,提高學(xué)習(xí)樣本質(zhì)量。

      K均值聚類算法是基于距離的聚類算法,將距離作為相似性的評(píng)價(jià)指標(biāo),即對(duì)象之間的距離越近,相似度越大。而異常點(diǎn)通常距離中心點(diǎn)較遠(yuǎn),檢測(cè)異常點(diǎn),從而進(jìn)行樣本過(guò)濾[13]。假設(shè)輸入的樣本向量集合為:

      K均值聚類算法具體步驟包括:①?gòu)妮斎氲臉颖鞠蛄考现须S機(jī)選取1 個(gè)向量作為第1 個(gè)簇中心點(diǎn),簇中心集合記為center。②對(duì)于滿足條件的任意向量,計(jì)算與最近簇中心的距離。③計(jì)算每個(gè)向量被選為簇中心的概率,其表達(dá)式為:

      ④P(xj)最大時(shí)對(duì)應(yīng)的向量就是新的簇中心,若新的簇中心改變則重復(fù)步驟②—③直到目標(biāo)函數(shù)收斂,聚類結(jié)束。

      K的取值對(duì)聚類算法的效果具有極大影響。若K取值過(guò)小,將導(dǎo)致數(shù)據(jù)粗化,在剔除異常點(diǎn)的同時(shí)會(huì)誤判正常數(shù)據(jù),造成有效樣本丟失;若K取值過(guò)大,將致使聚類結(jié)果無(wú)法有效收斂,計(jì)算時(shí)間過(guò)長(zhǎng),導(dǎo)致無(wú)法有效篩選異常數(shù)據(jù)。為此采用手肘法來(lái)確定K值。手肘法的核心指標(biāo)是誤差平方和,其表達(dá)式為:

      該方法的核心思想是隨著K值的增加,樣本數(shù)據(jù)劃分更加精細(xì),各個(gè)簇的聚合度逐漸提高,誤差平方和逐漸減小。當(dāng)K值小于真實(shí)聚類數(shù)時(shí),K值增加會(huì)顯著增強(qiáng)各個(gè)簇的聚合度,誤差平方和下降幅度變大。當(dāng)K值接近真實(shí)聚類數(shù)時(shí),提高K值各個(gè)簇的聚合度變小,誤差平方和變化幅度驟減(圖3)。

      由圖3 可知,當(dāng)K取值為5,即當(dāng)聚類數(shù)為5 簇時(shí),K均值聚類算法性能最優(yōu),過(guò)濾異常值能力最強(qiáng),因此本文聚類數(shù)取5。同時(shí)計(jì)算距離時(shí)容易受較大數(shù)據(jù)的影響而忽略取值較小的數(shù)據(jù),需在聚類前進(jìn)行Z-score 標(biāo)準(zhǔn)化處理。然后通過(guò)K均值聚類算法對(duì)樣本數(shù)據(jù)進(jìn)行去噪,找出異常點(diǎn)72組。將異常點(diǎn)剔除,其余2 068 組樣本數(shù)據(jù)用于后續(xù)算法的訓(xùn)練與測(cè)試。

      圖3 誤差平方和、計(jì)算時(shí)間與聚類數(shù)的關(guān)系Fig.3 Relationship among sum of squared errors,calculation time and cluster number

      2 預(yù)測(cè)算法建立

      作為機(jī)器學(xué)習(xí)的最新技術(shù),集成學(xué)習(xí)在智能計(jì)算和機(jī)器學(xué)習(xí)領(lǐng)域引起了廣泛關(guān)注。集成學(xué)習(xí)不是一種特定的模型而是一種思想,通過(guò)結(jié)合較簡(jiǎn)單的基礎(chǔ)模型來(lái)構(gòu)建強(qiáng)化模型。本文引入集成學(xué)習(xí)技術(shù),將2種不同的基礎(chǔ)模型結(jié)合起來(lái),生成一個(gè)更好的模型來(lái)預(yù)測(cè)裂縫開(kāi)度。

      2.1 支持向量回歸算法

      鑒于地質(zhì)認(rèn)識(shí)及資料豐度的不確定性,以及特征之間具有復(fù)雜的非線性關(guān)系,應(yīng)用傳統(tǒng)回歸模型不能較好地進(jìn)行裂縫開(kāi)度預(yù)測(cè)。而支持向量回歸算法可通過(guò)核函數(shù)將樣本數(shù)據(jù)映射到高維空間,解決非線性問(wèn)題,同時(shí)該算法具有良好的穩(wěn)定性和泛化能力[14]。支持向量回歸算法可形式化為:

      引入松弛變量ξi和,可將(5)式寫(xiě)為:

      引入拉格朗日算子ui≥0,≥0,ai≥0,≥0,其拉格朗日函數(shù)表達(dá)式為:

      其中:

      根據(jù)wolf 對(duì)偶的定義,在KKT 條件下得到拉格朗日對(duì)偶形式為:

      支持向量回歸算法函數(shù)表達(dá)式為:

      對(duì)于非線性問(wèn)題,可通過(guò)非線性變換轉(zhuǎn)化為某個(gè)高維空間中的線性問(wèn)題,即用核函數(shù)k(x,xi)替換可以實(shí)現(xiàn)非線性函數(shù)擬合,能較好處理非線性以及高維數(shù)的問(wèn)題,可表示為:

      2.2 XGBoost回歸算法

      XGBoost 是由一系列回歸樹(shù)組成的強(qiáng)大的預(yù)測(cè)模型。其核心思想是不斷添加回歸樹(shù),通過(guò)生成新樹(shù)來(lái)擬合前一棵樹(shù)的殘差。當(dāng)訓(xùn)練完成得到N棵回歸樹(shù)時(shí),將每棵樹(shù)對(duì)應(yīng)的分?jǐn)?shù)加起來(lái)就是該樣本的預(yù)測(cè)值[15],其表達(dá)式為:

      XGBoost目標(biāo)函數(shù)為:

      為避免算法擬合過(guò)程中的過(guò)擬合,算法不能同時(shí)訓(xùn)練所有回歸樹(shù),因此利用固定訓(xùn)練好的回歸樹(shù),依次添加一棵新樹(shù)來(lái)解決,假設(shè)步驟t的預(yù)測(cè)值用表示,(12)式可以寫(xiě)為:

      將其進(jìn)行二階泰勒展開(kāi)為:

      則(15)式可以改寫(xiě)為:

      2.3 基于嶺回歸的集成學(xué)習(xí)算法

      本文所提的裂縫開(kāi)度預(yù)測(cè)集成算法以XGBoost回歸算法和支持向量回歸算法為基礎(chǔ)模型。每個(gè)基礎(chǔ)模型均接收輸入數(shù)據(jù),并給出獨(dú)立的裂縫開(kāi)度預(yù)測(cè)結(jié)果,這些預(yù)測(cè)結(jié)果均作為元特征,被饋送到元學(xué)習(xí)器中(本文的元學(xué)習(xí)器采用嶺回歸算法),并給出最終的裂縫開(kāi)度預(yù)測(cè)結(jié)果(圖4)。

      圖4 基于嶺回歸的集成學(xué)習(xí)算法Fig.4 Ensemble learning algorithm based on ridge regression

      該算法為基礎(chǔ)學(xué)習(xí)器δg=1,2(g=1 為支持向量回歸,g=2 為XGBoost 回歸)對(duì)于H折交叉驗(yàn)證中的每一個(gè)待預(yù)測(cè)的訓(xùn)練樣本集合DH都有與之對(duì)應(yīng)的訓(xùn)練集預(yù)測(cè)結(jié)果集合ZHg。這樣的循環(huán)過(guò)程完畢后,對(duì)于每個(gè)基礎(chǔ)學(xué)習(xí)器而言,都有H對(duì)同質(zhì)基礎(chǔ)學(xué)習(xí)器訓(xùn)練集預(yù)測(cè)值,將其整合為D2g。再將所有基礎(chǔ)學(xué)習(xí)器D2g整合作為元特征定義為D2。將D2饋送到嶺回歸算法得到加權(quán)結(jié)果即為最終預(yù)測(cè)開(kāi)度值?;趲X回歸的集成學(xué)習(xí)算法的最終表達(dá)式為:

      在此基礎(chǔ)上,經(jīng)K均值聚類算法去噪后,應(yīng)用基于嶺回歸的集成學(xué)習(xí)算法進(jìn)行裂縫開(kāi)度預(yù)測(cè),筆者將其定義為新型集成學(xué)習(xí)算法。

      3 預(yù)測(cè)算法應(yīng)用

      3.1 模型參數(shù)優(yōu)化求解

      機(jī)器學(xué)習(xí)算法參數(shù)的選擇直接決定了算法的性能。網(wǎng)格搜索法是當(dāng)前應(yīng)用最為廣泛的參數(shù)優(yōu)化算法。但該方法依靠窮舉所有參數(shù)進(jìn)行優(yōu)化,計(jì)算成本過(guò)于龐大,同時(shí)對(duì)于連續(xù)數(shù)據(jù)需要等間取樣,不一定能取得全局最優(yōu)。故采用隨機(jī)搜索進(jìn)行參數(shù)優(yōu)化,該方法主要原理是從指定的分布中采樣固定數(shù)量的參數(shù)設(shè)置。與網(wǎng)格搜索法相比,該方法在保障準(zhǔn)確度的同時(shí),顯著減少計(jì)算時(shí)間。

      根據(jù)測(cè)試集上模型的均方根誤差值來(lái)判斷基礎(chǔ)模型最佳超參數(shù)。其中支持向量回歸算法的主要超參數(shù)為懲罰系數(shù),XGBoost 回歸算法的主要超參數(shù)為最大深度,其超參數(shù)隨機(jī)優(yōu)化調(diào)參過(guò)程如圖5 所示。在搜索的過(guò)程中,超參數(shù)快速收斂,并找出最優(yōu)值。支持向量回歸算法的懲罰系數(shù)搜索范圍為0~20,最優(yōu)值為0.147,對(duì)應(yīng)均方根誤差為0.113;XGBoost 回歸算法的最大深度搜索范圍為0~18,最優(yōu)值為13,對(duì)應(yīng)均方根誤差為0.076。

      3.2 模型應(yīng)用評(píng)價(jià)分析

      確定好模型參數(shù)之后,隨機(jī)選取80%經(jīng)過(guò)Zscore 標(biāo)準(zhǔn)化處理后的樣本數(shù)據(jù)作為訓(xùn)練集共1 712組,20%的樣本數(shù)據(jù)作為測(cè)試集共428 組來(lái)驗(yàn)證模型效果。以均方根誤差(RMSE)和真實(shí)裂縫開(kāi)度值與預(yù)測(cè)裂縫開(kāi)度值間相關(guān)系數(shù)(R2)作為評(píng)價(jià)標(biāo)準(zhǔn)。將測(cè)試集分別代入訓(xùn)練好的支持向量回歸算法、XGBoost 回歸算法及基于嶺回歸的集成學(xué)習(xí)算法中,計(jì)算測(cè)試集中真實(shí)裂縫開(kāi)度與預(yù)測(cè)裂縫開(kāi)度間相關(guān)系數(shù)(圖6)。

      圖5 隨機(jī)搜索優(yōu)化調(diào)參過(guò)程Fig.5 Parameter adjustment optimization process based on random search

      圖6 預(yù)測(cè)裂縫開(kāi)度與真實(shí)裂縫開(kāi)度交會(huì)圖Fig.6 Cross plot of measured and predicted apertures

      由圖6 可以看出,3 種算法中,基于嶺回歸的集成學(xué)習(xí)算法的R2最高,達(dá)0.928。同時(shí)為探究K均值聚類降噪效果,將樣本數(shù)據(jù)饋送于基于嶺回歸的集成學(xué)習(xí)算法中進(jìn)行訓(xùn)練和測(cè)試,并與先前計(jì)算結(jié)果進(jìn)行綜合對(duì)比(表2),發(fā)現(xiàn)4 組方法中K均值-基于嶺回歸的集成學(xué)習(xí)算法的RMSE 最小,R2最大。即該算法的預(yù)測(cè)裂縫開(kāi)度值與真實(shí)裂縫開(kāi)度值之間的偏差最小,支持向量回歸算法的RMSE 最大,R2最小。K均值聚類算法能夠?qū)W(xué)習(xí)樣本進(jìn)行有效降噪,去除冗余,提高了學(xué)習(xí)樣本的質(zhì)量。

      表2 各算法預(yù)測(cè)效果對(duì)比Table2 Comprehensive comparison results of prediction effects in various algorithms

      圖7 樣本觀測(cè)值Fig.7 Sample observation values

      為進(jìn)一步綜合分析該算法的預(yù)測(cè)效果,將部分樣本真實(shí)值及各算法預(yù)測(cè)值進(jìn)行可視化研究。從圖7 可以明顯看出,支持向量回歸算法和XGBoost回歸算法預(yù)測(cè)值整體在真實(shí)值上下波動(dòng),支持向量回歸算法總體變化平穩(wěn),但對(duì)裂縫開(kāi)度突變值檢測(cè)不明顯。XGBoost 回歸算法對(duì)數(shù)據(jù)敏感,部分?jǐn)?shù)值波動(dòng)較大。新型集成學(xué)習(xí)算法的計(jì)算結(jié)果緊密圍繞真實(shí)裂縫開(kāi)度值波動(dòng),很好地結(jié)合了基礎(chǔ)算法的優(yōu)點(diǎn),平衡了基礎(chǔ)算法的缺點(diǎn),預(yù)測(cè)精度明顯提升。

      4 結(jié)論

      利用測(cè)井?dāng)?shù)據(jù)及其對(duì)應(yīng)裂縫開(kāi)度值,提出基于新型集成學(xué)習(xí)的基巖潛山油藏儲(chǔ)層裂縫開(kāi)度預(yù)測(cè)算法。該算法先通過(guò)K均值將學(xué)習(xí)樣本進(jìn)行聚類、降噪來(lái)提升學(xué)習(xí)樣本質(zhì)量;以支持向量回歸算法和XGBoost 回歸算法為基礎(chǔ)模型,并利用隨機(jī)搜索進(jìn)行基礎(chǔ)模型參數(shù)優(yōu)化。然后利用嶺回歸算法對(duì)優(yōu)化好的基礎(chǔ)模型進(jìn)行集成組合。所提出的新型集成學(xué)習(xí)算法建立的裂縫開(kāi)度預(yù)測(cè)模型彌補(bǔ)了單一回歸算法不穩(wěn)定的特點(diǎn),提升了預(yù)測(cè)精度,能夠充分挖掘測(cè)井?dāng)?shù)據(jù)中蘊(yùn)含的地質(zhì)信息,為裂縫開(kāi)度定量預(yù)測(cè)提供了新的思路。同時(shí)該方法可實(shí)現(xiàn)自動(dòng)、快速優(yōu)化調(diào)參,具有廣泛的適用性。

      符號(hào)解釋

      x'——標(biāo)準(zhǔn)化處理后的樣本數(shù)據(jù);x——樣本數(shù)據(jù);μ——樣本均值;δ——樣本方差;K——聚類數(shù),簇;X——樣本向量集合;j——樣本序號(hào);n——樣本向量總數(shù);center——簇中心集合;P(xj)——簇中心概率;D(xj)2——最近簇中心的距離;SSE——誤差平方和;i——樣本列號(hào);p——Ci中的樣本點(diǎn);Ci——第i個(gè)簇;mi——Ci中所有樣本的均值;w——法向量;b——位移項(xiàng);C——懲罰系數(shù);m——樣本數(shù)量;lε——不敏感損失函數(shù);ε——軟間隔帶;f(x)——支持向量回歸算法函數(shù);yi——開(kāi)度實(shí)際值;ξi和松弛變量;和——在第i數(shù)據(jù)下不同的拉格朗日算子;α——拉格朗日算子αi的合集;拉格朗日算子的合集;——在第j數(shù)據(jù)下不同的拉格朗日算子;xi和xj——輸入的第i和第j個(gè)數(shù)據(jù);k(x,xi)——核函數(shù)開(kāi)度預(yù)測(cè)值;N——回歸樹(shù)的總數(shù),個(gè);fk——第k棵回歸樹(shù)算法;Lt——步驟t下的目標(biāo)函數(shù);t——步驟序號(hào);——預(yù)測(cè)開(kāi)度值與真實(shí)開(kāi)度值的差;Ω(f)——懲罰項(xiàng);γ——回歸樹(shù)分割的難度系數(shù);T——回歸樹(shù)葉子節(jié)點(diǎn)個(gè)數(shù),個(gè);λ——L2正則系數(shù);w′——回歸樹(shù)葉子節(jié)點(diǎn)權(quán)重——步驟t的預(yù)測(cè)值;Const——常數(shù);gi——損失函數(shù)一階導(dǎo)數(shù);hi——損失函數(shù)二階導(dǎo)數(shù);Ij——第j個(gè)葉子的樣本集合;δg=1,2——基礎(chǔ)學(xué)習(xí)器;H——交叉驗(yàn)證折數(shù);DH——H折交叉驗(yàn)證中的每一個(gè)待預(yù)測(cè)的訓(xùn)練樣本集合;ZHg——與DH對(duì)應(yīng)的訓(xùn)練集預(yù)測(cè)結(jié)果集合;D2g——H對(duì)同質(zhì)基礎(chǔ)學(xué)習(xí)器訓(xùn)練集預(yù)測(cè)值;D2——元特征;Y——預(yù)測(cè)的最終開(kāi)度值;W——元特征數(shù)據(jù)矩陣;β^——嶺回歸估計(jì)值;λL——嶺參數(shù);I——單位矩陣。

      猜你喜歡
      開(kāi)度測(cè)井聚類
      本期廣告索引
      掘進(jìn)機(jī)用截止閥開(kāi)度對(duì)管路流動(dòng)性能的影響
      增大某車型車門開(kāi)度的設(shè)計(jì)方法
      北京汽車(2021年2期)2021-05-07 03:56:26
      燃燒器二次風(fēng)擋板開(kāi)度對(duì)爐內(nèi)燃燒特性的影響
      八扇區(qū)水泥膠結(jié)測(cè)井儀刻度及測(cè)井?dāng)?shù)據(jù)處理
      基于DBSACN聚類算法的XML文檔聚類
      基于改進(jìn)的遺傳算法的模糊聚類算法
      基于測(cè)井響應(yīng)評(píng)價(jià)煤巖結(jié)構(gòu)特征
      中石油首個(gè)全國(guó)測(cè)井行業(yè)標(biāo)準(zhǔn)發(fā)布
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      大石桥市| 贡觉县| 黔西| 柳林县| 凤城市| 定远县| 韶山市| 阿克| 丹东市| 萨嘎县| 织金县| 东乡族自治县| 湘阴县| 四会市| 淮南市| 财经| 台中市| 永定县| 资中县| 绥宁县| 大庆市| 容城县| 怀远县| 鄱阳县| 西城区| 彭山县| 尉氏县| 五原县| 根河市| 乌苏市| 囊谦县| 洞头县| 金昌市| 中阳县| 文水县| 简阳市| 江口县| 张家界市| 天津市| 平邑县| 辰溪县|