基于新型集成學(xué)習(xí)算法的基巖潛山油藏儲(chǔ)層裂縫開(kāi)度預(yù)測(cè)算法

2020-05-15 14:40:06孫致學(xué)姜寶勝李吉康

油氣地質(zhì)與采收率 2020年3期

孫致學(xué)，姜寶勝，肖康，李吉康

（1.中國(guó)石油大學(xué)（華東）石油工程學(xué)院，山東青島 266580；2.非常規(guī)油氣開(kāi)發(fā)教育部重點(diǎn)實(shí)驗(yàn)室中國(guó)石油大學(xué)（華東），山東青島 266580；3.中國(guó)石油勘探開(kāi)發(fā)研究院非洲研究所，北京 100083）

近年來(lái)，全球已在30余個(gè)盆地發(fā)現(xiàn)了基巖油氣資源，基巖油氣藏成為重要的勘探開(kāi)發(fā)陣地。相對(duì)于常規(guī)沉積巖油氣儲(chǔ)層，基巖儲(chǔ)層中天然裂縫類型、產(chǎn)狀、特征參數(shù)的精準(zhǔn)評(píng)價(jià)更加重要。由于該類油氣藏基巖致密、孔滲性極低，天然裂縫系統(tǒng)不僅控制了有效儲(chǔ)層發(fā)育程度和油氣儲(chǔ)量規(guī)模，同時(shí)也是油氣開(kāi)采過(guò)程中的重要運(yùn)移通道。裂縫開(kāi)度是評(píng)價(jià)基巖油氣藏儲(chǔ)層質(zhì)量的重要參數(shù)。相對(duì)于裂縫密度，裂縫開(kāi)度對(duì)儲(chǔ)層有效滲透率的貢獻(xiàn)更為顯著，也是影響其產(chǎn)能的主控因素之一［1-3］。目前儲(chǔ)層天然裂縫開(kāi)度預(yù)測(cè)方法主要分為2 大類：一類是直接觀察法，包括巖心觀測(cè)、露頭識(shí)別、電鏡觀測(cè)等；另一類是間接觀察法，包括成像測(cè)井、數(shù)值模擬、經(jīng)驗(yàn)公式、動(dòng)態(tài)資料分析等。其中露頭識(shí)別法是獲得裂縫開(kāi)度最直接的途徑［4］，但地表風(fēng)化作用使裂縫充填特征發(fā)生顯著變化，影響測(cè)量結(jié)果，同時(shí)露頭區(qū)可能遭受后期的改造或掩埋，使得典型裂縫發(fā)育的露頭不容易獲得。巖心中包含著最為直觀、詳實(shí)的裂縫信息，但取心資料往往少且不連續(xù)，同時(shí)機(jī)械應(yīng)力對(duì)巖心的破壞影響天然裂縫開(kāi)度的測(cè)量。隨著斷層掃描機(jī)、陰極射線發(fā)光、核磁共振、三維激光掃描技術(shù)的發(fā)展，裂縫開(kāi)度表征朝更微觀、更立體和更精細(xì)的方向發(fā)展［5-6］。但由于儀器探測(cè)能力的限制，無(wú)法系統(tǒng)、大規(guī)模表征天然裂縫開(kāi)度。成像測(cè)井具有高分辨率且連續(xù)測(cè)量的特點(diǎn)，能夠直觀地反映裂縫信息，但由于測(cè)量成本高，導(dǎo)致獲得的數(shù)據(jù)非常有限。通過(guò)室內(nèi)數(shù)值模擬裝置進(jìn)行裂縫開(kāi)度模擬分析，測(cè)量相對(duì)誤差較小，但裝備適用范圍有限，實(shí)驗(yàn)參數(shù)難以獲得，無(wú)法真實(shí)還原地層條件。進(jìn)行應(yīng)力場(chǎng)有限元數(shù)值模擬需考慮地質(zhì)體的巖石物理特征，所需參數(shù)較多，難以準(zhǔn)確獲取。該方法可以在一定程度上預(yù)測(cè)裂縫分布，但由于模型并不能反映實(shí)際地層情況，導(dǎo)致誤差較大［7-8］。依據(jù)滲流力學(xué)原理，利用泥漿漏失數(shù)據(jù)建立裂縫泥漿漏失數(shù)學(xué)模型，根據(jù)鉆井資料進(jìn)行裂縫開(kāi)度計(jì)算也是當(dāng)下研究的熱點(diǎn)。但該方法受漏失數(shù)據(jù)的限制，適用范圍有限。對(duì)大多數(shù)油田而言，現(xiàn)有資料中除了少量取心資料外，其余幾乎是常規(guī)測(cè)井資料，因此如何利用常規(guī)測(cè)井信息建立裂縫的測(cè)井響應(yīng)機(jī)理模型，進(jìn)而計(jì)算天然裂縫開(kāi)度，是不得不面對(duì)的實(shí)際問(wèn)題。目前應(yīng)用測(cè)井?dāng)?shù)據(jù)解釋天然裂縫仍停留在定性分析水平上［9-10］。主要是由于傳感器捕獲的實(shí)時(shí)測(cè)井?dāng)?shù)據(jù)具有高維、非線性和高噪性的特點(diǎn)，難以建立與裂縫開(kāi)度之間的量化關(guān)系。機(jī)器學(xué)習(xí)對(duì)于解決非線性問(wèn)題具有先天優(yōu)勢(shì)，而集成學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)［11］，相較于單一機(jī)器學(xué)習(xí)算法，集成學(xué)習(xí)算法具有更高的精度和更顯著的泛化性能。

圖1 中非乍得某基巖潛山巖心裂縫照片F(xiàn)ig.1 Photos of fractured core samples from bedrock buried hill in Chad，Central Africa

1 樣本集構(gòu)建

研究區(qū)位于B 盆地中非乍得西南部、中非剪切帶中段北側(cè)，大量巖心和井壁取心分析資料揭示B盆地基巖潛山巖性分為變質(zhì)巖和巖漿巖2 大類13個(gè)亞類30多種巖石類型，主要由花崗巖、正長(zhǎng)巖、閃長(zhǎng)巖和二長(zhǎng)巖等巖漿巖及混合花崗巖和片麻巖類等正變質(zhì)巖構(gòu)成［12］。通過(guò)對(duì)該潛山15口取心井（含新完鉆井）巖心裂縫形態(tài)、規(guī)模及典型特征進(jìn)行觀察及描述，發(fā)現(xiàn)研究區(qū)油氣運(yùn)移通道包括構(gòu)造裂縫、網(wǎng)狀縫、張剪縫及沿縫溶蝕孔洞，以張剪縫為主（圖1）。

1.1 學(xué)習(xí)樣本特征

準(zhǔn)確且全面的裂縫數(shù)據(jù)樣本是實(shí)現(xiàn)模型訓(xùn)練的基礎(chǔ)。所用數(shù)據(jù)集包括測(cè)井?dāng)?shù)據(jù)（表1）及相應(yīng)裂縫開(kāi)度值，共2 140 組，由基巖潛山油藏巖心描述、關(guān)鍵井成像測(cè)井、巖礦薄片鑒定等數(shù)據(jù)組成。由裂縫開(kāi)度分布（圖2）可知，樣本集中裂縫開(kāi)度最小值為0.011 mm，最大值為0.544 mm，平均值為0.183 mm，標(biāo)準(zhǔn)差為0.087 mm，裂縫開(kāi)度主要集中在0.126～0.258 mm。

表1 測(cè)井?dāng)?shù)據(jù)統(tǒng)計(jì)結(jié)果Table1 Statistics of well logging parameters

圖2 裂縫開(kāi)度分布Fig.2 Fracture aperture distribution

1.2 Z-score標(biāo)準(zhǔn)化處理

在進(jìn)行裂縫預(yù)測(cè)前，需將學(xué)習(xí)樣本進(jìn)行Z-score標(biāo)準(zhǔn)化處理，即將其轉(zhuǎn)換為均值為0、方差為1 的分布，其表達(dá)式為：

如果一個(gè)特征的方差比其余特征的方差大許多個(gè)數(shù)量級(jí)，那么該特征將會(huì)主導(dǎo)整個(gè)目標(biāo)函數(shù)，使得模型不能從其余特征學(xué)習(xí)到數(shù)據(jù)的特征。相對(duì)于min-max 歸一化方法，該方法不僅能夠去除量綱，還能夠均衡考慮所有維度的變量。

1.3 K均值聚類算法進(jìn)行樣本去噪

樣本數(shù)據(jù)由于測(cè)量?jī)x器及人為因素的干擾，不可避免的引入噪聲。為此采取利用K均值聚類算法進(jìn)行數(shù)據(jù)過(guò)濾的思路，以去除冗余，提高學(xué)習(xí)樣本質(zhì)量。

K均值聚類算法是基于距離的聚類算法，將距離作為相似性的評(píng)價(jià)指標(biāo)，即對(duì)象之間的距離越近，相似度越大。而異常點(diǎn)通常距離中心點(diǎn)較遠(yuǎn)，檢測(cè)異常點(diǎn)，從而進(jìn)行樣本過(guò)濾［13］。假設(shè)輸入的樣本向量集合為：

K均值聚類算法具體步驟包括：①?gòu)妮斎氲臉颖鞠蛄考现须S機(jī)選取1 個(gè)向量作為第1 個(gè)簇中心點(diǎn)，簇中心集合記為center。②對(duì)于滿足條件的任意向量，計(jì)算與最近簇中心的距離。③計(jì)算每個(gè)向量被選為簇中心的概率，其表達(dá)式為：

④P(xj)最大時(shí)對(duì)應(yīng)的向量就是新的簇中心，若新的簇中心改變則重復(fù)步驟②—③直到目標(biāo)函數(shù)收斂，聚類結(jié)束。

K的取值對(duì)聚類算法的效果具有極大影響。若K取值過(guò)小，將導(dǎo)致數(shù)據(jù)粗化，在剔除異常點(diǎn)的同時(shí)會(huì)誤判正常數(shù)據(jù)，造成有效樣本丟失；若K取值過(guò)大，將致使聚類結(jié)果無(wú)法有效收斂，計(jì)算時(shí)間過(guò)長(zhǎng)，導(dǎo)致無(wú)法有效篩選異常數(shù)據(jù)。為此采用手肘法來(lái)確定K值。手肘法的核心指標(biāo)是誤差平方和，其表達(dá)式為：

該方法的核心思想是隨著K值的增加，樣本數(shù)據(jù)劃分更加精細(xì)，各個(gè)簇的聚合度逐漸提高，誤差平方和逐漸減小。當(dāng)K值小于真實(shí)聚類數(shù)時(shí)，K值增加會(huì)顯著增強(qiáng)各個(gè)簇的聚合度，誤差平方和下降幅度變大。當(dāng)K值接近真實(shí)聚類數(shù)時(shí)，提高K值各個(gè)簇的聚合度變小，誤差平方和變化幅度驟減（圖3）。

由圖3 可知，當(dāng)K取值為5，即當(dāng)聚類數(shù)為5 簇時(shí)，K均值聚類算法性能最優(yōu)，過(guò)濾異常值能力最強(qiáng)，因此本文聚類數(shù)取5。同時(shí)計(jì)算距離時(shí)容易受較大數(shù)據(jù)的影響而忽略取值較小的數(shù)據(jù)，需在聚類前進(jìn)行Z-score 標(biāo)準(zhǔn)化處理。然后通過(guò)K均值聚類算法對(duì)樣本數(shù)據(jù)進(jìn)行去噪，找出異常點(diǎn)72組。將異常點(diǎn)剔除，其余2 068 組樣本數(shù)據(jù)用于后續(xù)算法的訓(xùn)練與測(cè)試。

圖3 誤差平方和、計(jì)算時(shí)間與聚類數(shù)的關(guān)系Fig.3 Relationship among sum of squared errors，calculation time and cluster number

2 預(yù)測(cè)算法建立

作為機(jī)器學(xué)習(xí)的最新技術(shù)，集成學(xué)習(xí)在智能計(jì)算和機(jī)器學(xué)習(xí)領(lǐng)域引起了廣泛關(guān)注。集成學(xué)習(xí)不是一種特定的模型而是一種思想，通過(guò)結(jié)合較簡(jiǎn)單的基礎(chǔ)模型來(lái)構(gòu)建強(qiáng)化模型。本文引入集成學(xué)習(xí)技術(shù)，將2種不同的基礎(chǔ)模型結(jié)合起來(lái)，生成一個(gè)更好的模型來(lái)預(yù)測(cè)裂縫開(kāi)度。

2.1 支持向量回歸算法

鑒于地質(zhì)認(rèn)識(shí)及資料豐度的不確定性，以及特征之間具有復(fù)雜的非線性關(guān)系，應(yīng)用傳統(tǒng)回歸模型不能較好地進(jìn)行裂縫開(kāi)度預(yù)測(cè)。而支持向量回歸算法可通過(guò)核函數(shù)將樣本數(shù)據(jù)映射到高維空間，解決非線性問(wèn)題，同時(shí)該算法具有良好的穩(wěn)定性和泛化能力［14］。支持向量回歸算法可形式化為：

引入松弛變量ξi和，可將（5）式寫(xiě)為：

引入拉格朗日算子ui≥0,≥0,ai≥0,≥0，其拉格朗日函數(shù)表達(dá)式為：

其中：

根據(jù)wolf 對(duì)偶的定義，在KKT 條件下得到拉格朗日對(duì)偶形式為：

支持向量回歸算法函數(shù)表達(dá)式為：

對(duì)于非線性問(wèn)題，可通過(guò)非線性變換轉(zhuǎn)化為某個(gè)高維空間中的線性問(wèn)題，即用核函數(shù)k(x,xi)替換可以實(shí)現(xiàn)非線性函數(shù)擬合，能較好處理非線性以及高維數(shù)的問(wèn)題，可表示為：

2.2 XGBoost回歸算法

XGBoost 是由一系列回歸樹(shù)組成的強(qiáng)大的預(yù)測(cè)模型。其核心思想是不斷添加回歸樹(shù)，通過(guò)生成新樹(shù)來(lái)擬合前一棵樹(shù)的殘差。當(dāng)訓(xùn)練完成得到N棵回歸樹(shù)時(shí)，將每棵樹(shù)對(duì)應(yīng)的分?jǐn)?shù)加起來(lái)就是該樣本的預(yù)測(cè)值［15］，其表達(dá)式為：

XGBoost目標(biāo)函數(shù)為：

為避免算法擬合過(guò)程中的過(guò)擬合，算法不能同時(shí)訓(xùn)練所有回歸樹(shù)，因此利用固定訓(xùn)練好的回歸樹(shù)，依次添加一棵新樹(shù)來(lái)解決，假設(shè)步驟t的預(yù)測(cè)值用表示，（12）式可以寫(xiě)為：

將其進(jìn)行二階泰勒展開(kāi)為：

則（15）式可以改寫(xiě)為：

2.3 基于嶺回歸的集成學(xué)習(xí)算法

本文所提的裂縫開(kāi)度預(yù)測(cè)集成算法以XGBoost回歸算法和支持向量回歸算法為基礎(chǔ)模型。每個(gè)基礎(chǔ)模型均接收輸入數(shù)據(jù)，并給出獨(dú)立的裂縫開(kāi)度預(yù)測(cè)結(jié)果，這些預(yù)測(cè)結(jié)果均作為元特征，被饋送到元學(xué)習(xí)器中（本文的元學(xué)習(xí)器采用嶺回歸算法），并給出最終的裂縫開(kāi)度預(yù)測(cè)結(jié)果（圖4）。

圖4 基于嶺回歸的集成學(xué)習(xí)算法Fig.4 Ensemble learning algorithm based on ridge regression

該算法為基礎(chǔ)學(xué)習(xí)器δg=1,2（g=1 為支持向量回歸，g=2 為XGBoost 回歸）對(duì)于H折交叉驗(yàn)證中的每一個(gè)待預(yù)測(cè)的訓(xùn)練樣本集合DH都有與之對(duì)應(yīng)的訓(xùn)練集預(yù)測(cè)結(jié)果集合ZHg。這樣的循環(huán)過(guò)程完畢后，對(duì)于每個(gè)基礎(chǔ)學(xué)習(xí)器而言，都有H對(duì)同質(zhì)基礎(chǔ)學(xué)習(xí)器訓(xùn)練集預(yù)測(cè)值，將其整合為D2g。再將所有基礎(chǔ)學(xué)習(xí)器D2g整合作為元特征定義為D2。將D2饋送到嶺回歸算法得到加權(quán)結(jié)果即為最終預(yù)測(cè)開(kāi)度值?；趲X回歸的集成學(xué)習(xí)算法的最終表達(dá)式為：

在此基礎(chǔ)上，經(jīng)K均值聚類算法去噪后，應(yīng)用基于嶺回歸的集成學(xué)習(xí)算法進(jìn)行裂縫開(kāi)度預(yù)測(cè)，筆者將其定義為新型集成學(xué)習(xí)算法。

3 預(yù)測(cè)算法應(yīng)用

3.1 模型參數(shù)優(yōu)化求解

機(jī)器學(xué)習(xí)算法參數(shù)的選擇直接決定了算法的性能。網(wǎng)格搜索法是當(dāng)前應(yīng)用最為廣泛的參數(shù)優(yōu)化算法。但該方法依靠窮舉所有參數(shù)進(jìn)行優(yōu)化，計(jì)算成本過(guò)于龐大，同時(shí)對(duì)于連續(xù)數(shù)據(jù)需要等間取樣，不一定能取得全局最優(yōu)。故采用隨機(jī)搜索進(jìn)行參數(shù)優(yōu)化，該方法主要原理是從指定的分布中采樣固定數(shù)量的參數(shù)設(shè)置。與網(wǎng)格搜索法相比，該方法在保障準(zhǔn)確度的同時(shí)，顯著減少計(jì)算時(shí)間。

根據(jù)測(cè)試集上模型的均方根誤差值來(lái)判斷基礎(chǔ)模型最佳超參數(shù)。其中支持向量回歸算法的主要超參數(shù)為懲罰系數(shù)，XGBoost 回歸算法的主要超參數(shù)為最大深度，其超參數(shù)隨機(jī)優(yōu)化調(diào)參過(guò)程如圖5 所示。在搜索的過(guò)程中，超參數(shù)快速收斂，并找出最優(yōu)值。支持向量回歸算法的懲罰系數(shù)搜索范圍為0～20，最優(yōu)值為0.147，對(duì)應(yīng)均方根誤差為0.113；XGBoost 回歸算法的最大深度搜索范圍為0～18，最優(yōu)值為13，對(duì)應(yīng)均方根誤差為0.076。

3.2 模型應(yīng)用評(píng)價(jià)分析

確定好模型參數(shù)之后，隨機(jī)選取80%經(jīng)過(guò)Zscore 標(biāo)準(zhǔn)化處理后的樣本數(shù)據(jù)作為訓(xùn)練集共1 712組，20%的樣本數(shù)據(jù)作為測(cè)試集共428 組來(lái)驗(yàn)證模型效果。以均方根誤差（RMSE）和真實(shí)裂縫開(kāi)度值與預(yù)測(cè)裂縫開(kāi)度值間相關(guān)系數(shù)（R2）作為評(píng)價(jià)標(biāo)準(zhǔn)。將測(cè)試集分別代入訓(xùn)練好的支持向量回歸算法、XGBoost 回歸算法及基于嶺回歸的集成學(xué)習(xí)算法中，計(jì)算測(cè)試集中真實(shí)裂縫開(kāi)度與預(yù)測(cè)裂縫開(kāi)度間相關(guān)系數(shù)（圖6）。

圖5 隨機(jī)搜索優(yōu)化調(diào)參過(guò)程Fig.5 Parameter adjustment optimization process based on random search

圖6 預(yù)測(cè)裂縫開(kāi)度與真實(shí)裂縫開(kāi)度交會(huì)圖Fig.6 Cross plot of measured and predicted apertures

由圖6 可以看出，3 種算法中，基于嶺回歸的集成學(xué)習(xí)算法的R2最高，達(dá)0.928。同時(shí)為探究K均值聚類降噪效果，將樣本數(shù)據(jù)饋送于基于嶺回歸的集成學(xué)習(xí)算法中進(jìn)行訓(xùn)練和測(cè)試，并與先前計(jì)算結(jié)果進(jìn)行綜合對(duì)比（表2），發(fā)現(xiàn)4 組方法中K均值-基于嶺回歸的集成學(xué)習(xí)算法的RMSE 最小，R2最大。即該算法的預(yù)測(cè)裂縫開(kāi)度值與真實(shí)裂縫開(kāi)度值之間的偏差最小，支持向量回歸算法的RMSE 最大，R2最小。K均值聚類算法能夠?qū)W(xué)習(xí)樣本進(jìn)行有效降噪，去除冗余，提高了學(xué)習(xí)樣本的質(zhì)量。

表2 各算法預(yù)測(cè)效果對(duì)比Table2 Comprehensive comparison results of prediction effects in various algorithms

圖7 樣本觀測(cè)值Fig.7 Sample observation values

為進(jìn)一步綜合分析該算法的預(yù)測(cè)效果，將部分樣本真實(shí)值及各算法預(yù)測(cè)值進(jìn)行可視化研究。從圖7 可以明顯看出，支持向量回歸算法和XGBoost回歸算法預(yù)測(cè)值整體在真實(shí)值上下波動(dòng)，支持向量回歸算法總體變化平穩(wěn)，但對(duì)裂縫開(kāi)度突變值檢測(cè)不明顯。XGBoost 回歸算法對(duì)數(shù)據(jù)敏感，部分?jǐn)?shù)值波動(dòng)較大。新型集成學(xué)習(xí)算法的計(jì)算結(jié)果緊密圍繞真實(shí)裂縫開(kāi)度值波動(dòng)，很好地結(jié)合了基礎(chǔ)算法的優(yōu)點(diǎn)，平衡了基礎(chǔ)算法的缺點(diǎn)，預(yù)測(cè)精度明顯提升。

4 結(jié)論

利用測(cè)井?dāng)?shù)據(jù)及其對(duì)應(yīng)裂縫開(kāi)度值，提出基于新型集成學(xué)習(xí)的基巖潛山油藏儲(chǔ)層裂縫開(kāi)度預(yù)測(cè)算法。該算法先通過(guò)K均值將學(xué)習(xí)樣本進(jìn)行聚類、降噪來(lái)提升學(xué)習(xí)樣本質(zhì)量；以支持向量回歸算法和XGBoost 回歸算法為基礎(chǔ)模型，并利用隨機(jī)搜索進(jìn)行基礎(chǔ)模型參數(shù)優(yōu)化。然后利用嶺回歸算法對(duì)優(yōu)化好的基礎(chǔ)模型進(jìn)行集成組合。所提出的新型集成學(xué)習(xí)算法建立的裂縫開(kāi)度預(yù)測(cè)模型彌補(bǔ)了單一回歸算法不穩(wěn)定的特點(diǎn)，提升了預(yù)測(cè)精度，能夠充分挖掘測(cè)井?dāng)?shù)據(jù)中蘊(yùn)含的地質(zhì)信息，為裂縫開(kāi)度定量預(yù)測(cè)提供了新的思路。同時(shí)該方法可實(shí)現(xiàn)自動(dòng)、快速優(yōu)化調(diào)參，具有廣泛的適用性。

符號(hào)解釋

x'——標(biāo)準(zhǔn)化處理后的樣本數(shù)據(jù)；x——樣本數(shù)據(jù)；μ——樣本均值；δ——樣本方差；K——聚類數(shù)，簇；X——樣本向量集合；j——樣本序號(hào)；n——樣本向量總數(shù)；center——簇中心集合；P(xj)——簇中心概率；D(xj)2——最近簇中心的距離；SSE——誤差平方和；i——樣本列號(hào)；p——Ci中的樣本點(diǎn)；Ci——第i個(gè)簇；mi——Ci中所有樣本的均值；w——法向量；b——位移項(xiàng)；C——懲罰系數(shù)；m——樣本數(shù)量；lε——不敏感損失函數(shù)；ε——軟間隔帶；f(x)——支持向量回歸算法函數(shù)；yi——開(kāi)度實(shí)際值；ξi和松弛變量；和——在第i數(shù)據(jù)下不同的拉格朗日算子；α——拉格朗日算子αi的合集；拉格朗日算子的合集；——在第j數(shù)據(jù)下不同的拉格朗日算子；xi和xj——輸入的第i和第j個(gè)數(shù)據(jù)；k(x,xi)——核函數(shù)開(kāi)度預(yù)測(cè)值；N——回歸樹(shù)的總數(shù)，個(gè)；fk——第k棵回歸樹(shù)算法；Lt——步驟t下的目標(biāo)函數(shù)；t——步驟序號(hào)；——預(yù)測(cè)開(kāi)度值與真實(shí)開(kāi)度值的差；Ω(f)——懲罰項(xiàng)；γ——回歸樹(shù)分割的難度系數(shù)；T——回歸樹(shù)葉子節(jié)點(diǎn)個(gè)數(shù)，個(gè)；λ——L2正則系數(shù)；w′——回歸樹(shù)葉子節(jié)點(diǎn)權(quán)重——步驟t的預(yù)測(cè)值；Const——常數(shù)；gi——損失函數(shù)一階導(dǎo)數(shù)；hi——損失函數(shù)二階導(dǎo)數(shù)；Ij——第j個(gè)葉子的樣本集合；δg=1,2——基礎(chǔ)學(xué)習(xí)器；H——交叉驗(yàn)證折數(shù)；DH——H折交叉驗(yàn)證中的每一個(gè)待預(yù)測(cè)的訓(xùn)練樣本集合；ZHg——與DH對(duì)應(yīng)的訓(xùn)練集預(yù)測(cè)結(jié)果集合；D2g——H對(duì)同質(zhì)基礎(chǔ)學(xué)習(xí)器訓(xùn)練集預(yù)測(cè)值；D2——元特征；Y——預(yù)測(cè)的最終開(kāi)度值；W——元特征數(shù)據(jù)矩陣；β^——嶺回歸估計(jì)值；λL——嶺參數(shù)；I——單位矩陣。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看