• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      利用聚類分析方法進(jìn)行模型優(yōu)選

      2015-05-14 03:00:04戴危艷李少華王軍宋道萬(wàn)史敬華陳蘇
      斷塊油氣田 2015年4期
      關(guān)鍵詞:儲(chǔ)量滲透率聚類

      戴危艷,李少華,王軍,宋道萬(wàn),史敬華,陳蘇

      (1.長(zhǎng)江大學(xué)地球科學(xué)學(xué)院,湖北 武漢430100;2.中國(guó)石化勝利油田分公司地質(zhì)研究院,山東 東營(yíng) 257015)

      0 引言

      儲(chǔ)層隨機(jī)建模技術(shù)產(chǎn)生于20世紀(jì)80年代初期,目前在油氣田勘探開發(fā)實(shí)踐中的應(yīng)用越來(lái)越廣泛。隨機(jī)建模能夠提供多個(gè)等概率的模型實(shí)現(xiàn),利用這些實(shí)現(xiàn)可以對(duì)儲(chǔ)層進(jìn)行不確定性評(píng)價(jià)[1-2]。而在油藏?cái)?shù)值模擬中,考慮到計(jì)算成本,通常只能夠?qū)τ邢薜膸讉€(gè)實(shí)現(xiàn)進(jìn)行模擬計(jì)算,故必須從多個(gè)模型中優(yōu)選出1個(gè)或幾個(gè)進(jìn)行數(shù)值模擬研究。常用的隨機(jī)模型篩選方法有算術(shù)平均法、地質(zhì)模式篩選法、數(shù)值模擬法、概率儲(chǔ)量法、實(shí)驗(yàn)設(shè)計(jì)、拉丁超立方抽樣和排序法[3-6]。算術(shù)平均法的原理是將多個(gè)實(shí)現(xiàn)進(jìn)行算術(shù)平均,將得到的平均模型作為優(yōu)選模型,其優(yōu)點(diǎn)是簡(jiǎn)單快捷,缺點(diǎn)是具有平滑效應(yīng),改變了儲(chǔ)層非均質(zhì)性和模型的統(tǒng)計(jì)分布特征。地質(zhì)模式篩選法是通過(guò)對(duì)比每個(gè)模型與地質(zhì)模式之間的差異,從中選出吻合程度較大的模型,它可以較好地滿足地質(zhì)概念模式,但非常耗時(shí),且受主觀因素影響較大。數(shù)值模擬法通過(guò)流線模擬、歷史擬合等方法優(yōu)選模型,其缺點(diǎn)也是比較耗時(shí)。概率儲(chǔ)量法、實(shí)驗(yàn)設(shè)計(jì)、拉丁超立方抽樣和排序法,都是以地質(zhì)儲(chǔ)量為指標(biāo)進(jìn)行模型優(yōu)選,這些方法不適用于滲透率模型優(yōu)選。聚類分析方法利用歐氏距離函數(shù)所計(jì)算的模型之間的差異對(duì)模型進(jìn)行分類,然后從每一類中選出1個(gè)或幾個(gè)模型進(jìn)行油藏?cái)?shù)值模擬。該方法操作簡(jiǎn)單,容易實(shí)現(xiàn),不僅適用于各類屬性(滲透率、孔隙度、含水飽和度等)模型的優(yōu)選,也適用于相模型的優(yōu)選。本文以50個(gè)滲透率模型為實(shí)例進(jìn)行計(jì)算,對(duì)比所選模型計(jì)算的儲(chǔ)量與用蒙特卡洛模擬法得到的P10,P50和P90儲(chǔ)量 (即樂(lè)觀、可能和悲觀儲(chǔ)量),驗(yàn)證了方法的可行性。

      1 聚類分析方法的基本原理

      聚類分析方法是通過(guò)度量研究對(duì)象的某種屬性的相似程度,使同一類中樣本的相似程度最大,而不同類中樣本的相似程度最小,即聚類分析的過(guò)程主要依賴于樣本之間的特征差異[7-8]。常用的聚類分析方法主要有5大類,即基于劃分、基于層次、基于密度、基于網(wǎng)格和基于模型的聚類分析方法[9-10]。

      K-means聚類分析方法是目前應(yīng)用最為廣泛的一種基于劃分的聚類分析方法。該方法采用誤差平方和作為準(zhǔn)則函數(shù),處理大數(shù)據(jù)集的效率較高[11-13]。它需要預(yù)先指定聚類個(gè)數(shù),通過(guò)反復(fù)運(yùn)算,得到最終聚類結(jié)果。其核心思想是找出k個(gè)聚類中心,使得每一個(gè)數(shù)據(jù)點(diǎn)和與其最近的聚類中心的平方距離和最小。該方法所獲得的k個(gè)聚類,具有類內(nèi)的差異較小、而類間的差異較大的特點(diǎn)。

      K-means聚類分析方法的一般步驟[14-15]:1)隨機(jī)指定k個(gè)聚類中心。2)計(jì)算各模型與k個(gè)聚類中心之間的距離。3)將模型分配到離其最近的聚類中心所標(biāo)明的類。4)重新計(jì)算新的k個(gè)樣本的聚類中心,以每個(gè)類的均值作為新的聚類中心點(diǎn)。5)與前一次計(jì)算得到的k個(gè)聚類中心比較,如果聚類中心發(fā)生變化,返回步驟2);否則,輸出聚類的結(jié)果。在實(shí)際應(yīng)用中,由于無(wú)法事先確定k取何值時(shí)能達(dá)到最佳的聚類效果,故本文根據(jù)普遍使用的經(jīng)驗(yàn)規(guī)則,將k值的范圍限定在2與之間[16](N為數(shù)據(jù)空間中的所有數(shù)據(jù)點(diǎn)的個(gè)數(shù)),然后利用聚類有效性評(píng)價(jià)指標(biāo)確定k的具體數(shù)值。

      2 聚類分析方法優(yōu)選模型基本步驟

      典型的利用聚類分析方法優(yōu)選模型的過(guò)程,主要包括數(shù)據(jù)準(zhǔn)備、計(jì)算相似度、特征選擇、聚類及對(duì)聚類結(jié)果進(jìn)行評(píng)估等步驟[17-18]。1)數(shù)據(jù)準(zhǔn)備。隨機(jī)模擬建立多個(gè)三維定量地質(zhì)模型,統(tǒng)計(jì)各個(gè)模型中每一網(wǎng)格節(jié)點(diǎn)的屬性值,并對(duì)這些值進(jìn)行標(biāo)準(zhǔn)化處理。2)模型差異計(jì)算。計(jì)算每?jī)蓚€(gè)模型之間的歐氏距離,得到一個(gè)表征各模型之間差異的相異性矩陣。3)降維。對(duì)所得到的相異性矩陣進(jìn)行降維,實(shí)現(xiàn)在二維空間中用向量來(lái)可視化模型的相似性,從而簡(jiǎn)化聚類過(guò)程。4)模型聚類及優(yōu)選。確定聚類個(gè)數(shù),編寫相關(guān)代碼對(duì)模型進(jìn)行聚類,然后從每一類中選出1個(gè)或幾個(gè)模型,一般選取離聚類中心近的模型。5)結(jié)果評(píng)估。對(duì)比井點(diǎn)屬性值直方圖與所選模型直方圖,看所選模型是否滿足地質(zhì)要求。6)可靠性驗(yàn)證。對(duì)比所選模型計(jì)算的儲(chǔ)量與用P10,P50,P90模型計(jì)算的儲(chǔ)量,判斷所選模型是否具有代表性。

      3 實(shí)例研究

      以WZ油田西區(qū)為例。該區(qū)縱向上有2套油層,由上至下分屬上第三系角尾組二段砂巖和下第三系潿洲組三段砂巖,分別稱之為“角二段油層”和“潿三段油層”。其中,角二段油層是主力油層,目前有5口開發(fā)水平井,1口裸眼井和1口探井,平均井距為400 m左右。目的層角二段屬于濱海相沉積,巖性以長(zhǎng)石石英砂巖為主,砂巖粒級(jí)多為細(xì)砂,在油田范圍內(nèi)厚度為110~130 m。

      3.1 模型差異刻畫

      利用順序高斯模擬方法隨機(jī)模擬生成50個(gè)滲透率模型,統(tǒng)計(jì)各個(gè)模型中每一網(wǎng)格節(jié)點(diǎn)的滲透率數(shù)值據(jù),將整理后的數(shù)據(jù)導(dǎo)入SPSS軟件中。對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后計(jì)算各個(gè)模型之間的距離(差異)。常用的計(jì)算距離的函數(shù)有歐氏距離、馬氏距離、明考斯基距離、豪斯多夫距離、基于連通性的距離、基于流線的距離、曼哈頓距離函數(shù)等[19-21]。用這些距離函數(shù)計(jì)算模型之間的差異各有其優(yōu)缺點(diǎn)。如:馬氏距離函數(shù)不受量綱的影響,還可以排除變量之間的相關(guān)性的干擾,其缺點(diǎn)是夸大了變化微小變量的作用[22];豪斯多夫距離函數(shù)比較大的缺陷是對(duì)于噪聲、孤立點(diǎn)、斷點(diǎn)等特殊點(diǎn)敏感,在處理的過(guò)程中無(wú)法避免這些異常點(diǎn)的發(fā)生[23-24]。本文應(yīng)用歐式距離函數(shù)進(jìn)行計(jì)算,其公式為

      式中:def為 e,f兩模型之間的差異;xen和 xfn分別為兩模型第n個(gè)網(wǎng)格的屬性值大?。ㄈ鐫B透率、孔隙度的大小或其他一些特征值的大?。?;n為網(wǎng)格個(gè)數(shù)。

      應(yīng)用式(1)計(jì)算每?jī)蓚€(gè)模型間相對(duì)應(yīng)的每一網(wǎng)格節(jié)點(diǎn)滲透率值差的平方和,然后取平方根,得到一個(gè)相異性矩陣(見表1)。該矩陣中的數(shù)據(jù)所表示的是每一點(diǎn)處滲透率模擬結(jié)果的差異累加。而在實(shí)際的地質(zhì)研究中,每處滲透率的大小都會(huì)直接影響流體的流動(dòng)方向,所以,用該方法刻畫滲透率模型之間的差異更加準(zhǔn)確,而根據(jù)此差異所選擇的模型也更具代表性。

      表1 相異性矩陣(部分)

      3.2 多維尺度分析

      由于高維會(huì)使數(shù)據(jù)之間的區(qū)分界限變得模糊,給聚類帶來(lái)困難,所以,在進(jìn)行聚類分析前都會(huì)對(duì)數(shù)據(jù)進(jìn)行降維處理,進(jìn)而實(shí)現(xiàn)在二維空間中用向量來(lái)可視化物體的相似性[25]。多維尺度分析是一種把高維降為低維,在低維空間展示距離數(shù)據(jù)結(jié)構(gòu)的多元數(shù)據(jù)分析技術(shù),簡(jiǎn)稱MDS[26-28]。利用MDS技術(shù)提取出各模型在一維度和二維度上的坐標(biāo)值(見表2)。一維度指滲透率高值偏少—偏多的維度,二維度指滲透率高值偏多—偏少的維度。進(jìn)行聚類分析時(shí),可直接采用這2列數(shù)據(jù)。

      表2 模型在一維度和二維度上的坐標(biāo)值

      3.3 模型聚類

      利用各模型在一維度和二維度上的坐標(biāo)值,運(yùn)用R語(yǔ)言編寫相關(guān)代碼進(jìn)行模型聚類研究[29-30]。應(yīng)用K-means聚類算法對(duì)模型進(jìn)行聚類時(shí),首先要確定聚類的個(gè)數(shù)k。由于k值的大小應(yīng)在2與之間,其中N為數(shù)據(jù)空間中的所有數(shù)據(jù)點(diǎn)的個(gè)數(shù),所以這里的k值大小在2~7。在此區(qū)間逐個(gè)選取k值進(jìn)行聚類,得到的結(jié)果如圖1所示。圖中:數(shù)據(jù)表示各個(gè)滲透率模型之間差異的量化值;顏色表示模型類別,不同類別用不同的顏色區(qū)分;“△”表示聚類中心;“○”表示滲透率模型。

      圖1 聚類分析結(jié)果

      一個(gè)有效聚類分析的分類結(jié)果應(yīng)達(dá)到類內(nèi)緊密、類間遠(yuǎn)離。評(píng)價(jià)聚類分析有效性的指標(biāo)有Sil指標(biāo)、DB指標(biāo)、CH 指標(biāo)、HS 指標(biāo)、SB 指標(biāo)、Dunn 指標(biāo)等[31]。 本文采用Dunn指標(biāo)來(lái)評(píng)價(jià)聚類結(jié)果的有效性。

      Dunn指標(biāo)使用同類數(shù)據(jù)類與類之間的最大距離來(lái)表示類內(nèi)相似度,使用不同類數(shù)據(jù)類與類之間的最小距離來(lái)表示類間差異,D指標(biāo)的取值為二者的商[32]。D越大,表示類與類之間間隔越遠(yuǎn),聚類效果越好。其計(jì)算公式為

      式中:ci為第i類數(shù)據(jù);cj為第j類數(shù)據(jù);ck為第k類數(shù)據(jù);d(x,y)為 2 個(gè)數(shù)據(jù)點(diǎn)之間的距離。

      表3是k取不同值時(shí)的D值。通過(guò)該表分析得出,聚類數(shù)為5時(shí)的聚類效果最佳。

      表3 k取不同值時(shí)的D值

      3.4 結(jié)果分析

      利用K-means聚類分析方法,將原始的50個(gè)模型分成5大類:第1類模型中,離聚類中心最近的模型是模型15;第2類模型中,離聚類中心最近的模型是模型49;第4類模型中,離聚類中心最近的模型是模型11;第3類和第5類都只有1個(gè)模型,分別為模型2和模型34。如圖2所示,對(duì)比模型15滲透率分布直方圖與井點(diǎn)滲透率直方圖發(fā)現(xiàn),結(jié)果比較相似,說(shuō)明模擬的結(jié)果與地質(zhì)概念一致。從這5類模型中分別選出1個(gè)或幾個(gè)進(jìn)行油藏?cái)?shù)值模擬,可以在一定程度上避免主觀選擇模型造成的不確定性,并提高研究的速度。

      圖2 井點(diǎn)滲透率直方圖與模型直方圖對(duì)比

      4 方法可靠性驗(yàn)證

      用上述方法可以分別優(yōu)選出相應(yīng)的孔隙度、含水飽和度以及NTG模型,從而利用這些模型計(jì)算儲(chǔ)量。圖3是用50組模型計(jì)算得到的儲(chǔ)量累積概率分布。

      圖3 儲(chǔ)量累計(jì)概率分布

      通過(guò)對(duì)比圖3中用蒙特卡洛模擬法得到的P10,P50和P90儲(chǔ)量與采用所選5類模型所計(jì)算的儲(chǔ)量可以看出,用聚類分析的方法所選的模型具有較好的代表性,即原本需要50次模擬才能得到的結(jié)果,現(xiàn)在只需5次模擬就能得到,大大減少了模擬的次數(shù)。

      5 結(jié)論

      1)K-means聚類分析方法,以模型之間的差異為依據(jù),結(jié)合距離函數(shù)對(duì)模型進(jìn)行分類,適用于沉積相、孔隙度、滲透率、含水飽和度等各類模型的優(yōu)選。

      2)基于該方法選擇的模型具有一定的代表性,避免了主觀選擇模型造成的不確定性,有效解決了模型數(shù)量大時(shí)優(yōu)選具有代表性的模型進(jìn)行油藏?cái)?shù)值模擬的難題。該方法可以大大減少數(shù)值模擬的次數(shù),簡(jiǎn)單且快速有效,實(shí)例研究也驗(yàn)證了該方法的可行性。

      3)在實(shí)際應(yīng)用中,可選用不同的聚類方法對(duì)模型進(jìn)行聚類,從而選出最佳的模型分類方案。

      [1]李少華,張昌民,彭裕林,等.儲(chǔ)層不確定性評(píng)價(jià)[J].西安石油大學(xué)學(xué)報(bào):自然科學(xué)版,2004,19(5):16-24.

      [2]Singh V,Hegazy M,F(xiàn)ontanelli L.Assessment of reservoir uncertainties for development evaluation and risk analysis[J].The Leading Edge,2009,28(3):272-282.

      [3]White C D,Royer S A.Experimental design as a framework for reservoir studies[J].SPE 79676,2003.

      [4]于興河.油氣儲(chǔ)層表征與隨機(jī)建模的發(fā)展歷程及展望[J].地學(xué)前緣,2008,15(1):1-7.

      [5]Maschio C,de Carvalho C P V,Schiozer D J.A new methodology to reduce uncertainties in reservoir simulation models using observed data and sampling techniques[J].Journal of Petroleum Science and Engineering,2010,72(1):110-119.

      [6]McLennan J A,Deutsch C V.Ranking geostatistical realizations by measures of connectivity[R].SPE 98168,2005.

      [7]吳革洪,高才松,劉玉民.聚類分析在油藏分類中的應(yīng)用[J].斷塊油氣田,2001,8(1):36-37.

      [8]霍凱中,趙永軍,孫立冬.灰色聚類分析在煤層氣選區(qū)評(píng)價(jià)中的應(yīng)用[J].斷塊油氣田,2007,14(2):14-17.

      [9]Bandyopadhyay S ,Coyle E J.An energy efficient hierarchical clustering algorithm for wireless sensor networks[C]//Twenty-Second Annual Joint Conference of the IEEE Computer and Communications.IEEE INFOCOM,2003:1713-1723.

      [10]Kriegel H P,Pfeifle M.Density-based clustering of uncertain data[C]//Proceedings of the Eleventh ACM SIGKDD International Conference on Knowledge Discovery in Data Mining.ACM,2005:672-677.

      [11]Kanungo T,Mount D M,Netanyahu N S,et al.An efficient k-means clustering algorithm:Analysis and implementation[J].Pattern Analysis and Machine Intelligence,IEEE Transactions,2002,24(7):881-892.

      [12]Hartigan J A,Wong M A.Algorithm AS 136:A K-means clustering algorithm[J].Applied statistics,1979:100-108.

      [13]Jain A K,Murty M N,F(xiàn)lynn P J.Data clustering:A review[J].ACM Computing Surveys,1999,51(5):264-525.

      [14]Sambasivam S,Theodosopoulos N.Advanced data clustering methods ofmining Web documents[J].Issues in Informing Science and Information Technology,2006(5):565-579.

      [15]Caers J.Modeling Uncertainty in the Earth Sciences[J].Bulletin of the American Meteorological Society,2012,93(10):1583.

      [16]周世兵,徐振源,唐旭清.K-means算法最佳聚類數(shù)確定方法[J].計(jì)算機(jī)應(yīng)用,2010,30(8):1995-1998.

      [17]孫吉貴,劉杰,趙連宇.聚類算法研究[J].軟件學(xué)報(bào),2008,19(1):48-61.

      [18]Jain A K,Duin R P W.Statistical pattern recognition:A review[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(1):4-57.

      [19]Scheidt C,Caers J.Representing spatial uncertainty using distances and kernels[J].Mathematical Geosciences,2009,41(4):597-419.

      [20]Groenen P J F,Jajuga K.Fuzzy clustering with squared Minkowski distances[J].Fuzzy Sets and Systems,2001,120(2):227-237.

      [21]Sherwood T,Perelman E,Hamerly G,et al.Automatically characterizing largescaleprogrambehavior[J].ACMSIGARCHComputerArchitecture News,2002,30(5):45-57.

      [22]De Maesschalck R,Jouan Rimbaud D,Massart D L.The mahalanobi s distance [J].Chemometrics and intelligent laboratory systems,2000, 50(1):1-18.

      [23]Huttenlocher D P,Rucklidge W J.A multi-resolution technique for comparing images using the Hausdorff distance[R].Cornell University,1992.

      [24]曹京京.Hansdorff距離的計(jì)算原理及其在二維匹配中的應(yīng)用[D].大連:大連理工大學(xué),2013.

      [25]Ding C,He X,Zha H,et al.Adaptive dimension reduction for clustering high dimensional data[C]//Proceedings of International Conference on Data Mining,2002.

      [26]Christophe Bécavin,Nicolas Tchitchek,Colette Mintsa-Eya,et al.Improving the efficiency of multidimensional scaling in the analysis of high-dimensional data using singular value decomposition [J].Advance Access publication,2011,27(10):1413-1421.

      [27]Kruskal J B.Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis[J].Psychometrika,1964,29(1):1-27.

      [28]Mardia K V.Some properties of clasical multi-dimesional scaling[J].Communications in Statistics-Theory and Methods,1978,7 (13):1233-1241.

      [29]Ihaka R,Gentleman R.R:a language for data analysis and graphics[J].Journal of Computational and Graphical Statistics,1996,5 (3):299-314.

      [30]方匡南.基于數(shù)據(jù)挖掘的分類和聚類算法研究及R語(yǔ)言實(shí)現(xiàn)[D].廣州:暨南大學(xué),2007.

      [31]Mark Chiang Ming-Tso,Mirkin Boris.Intelligent Choice of the Number of Clusters in K-means Clustering:An Experimental Study with Different Cluster Spreads[J].Journal of Classification,2010,27(1):3-40.

      [32]Halkidi M,Batistakis Y,Vazirgiannis M.Clustering validity checking methods:PartⅡ[J].ACM Sigmod Record,2002,31(3):19-27.?

      猜你喜歡
      儲(chǔ)量滲透率聚類
      《礦產(chǎn)資源儲(chǔ)量技術(shù)標(biāo)準(zhǔn)》修訂對(duì)資源儲(chǔ)量報(bào)告編寫的影響
      基于三維軟件資源儲(chǔ)量估算對(duì)比研究
      中煤階煤層氣井排采階段劃分及滲透率變化
      不同滲透率巖芯孔徑分布與可動(dòng)流體研究
      SAGD井微壓裂儲(chǔ)層滲透率變化規(guī)律研究
      基于DBSACN聚類算法的XML文檔聚類
      高滲透率風(fēng)電并網(wǎng)對(duì)電力系統(tǒng)失步振蕩的影響
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      概率統(tǒng)計(jì)法在儲(chǔ)量估算中的應(yīng)用
      斷塊油氣田(2014年5期)2014-03-11 15:33:45
      东港市| 阿荣旗| 留坝县| 油尖旺区| 教育| 石首市| 牡丹江市| 昌江| 旬阳县| 黄龙县| 翁源县| 镇江市| 盐池县| 平武县| 木兰县| 白城市| 台江县| 昌宁县| 阳春市| 中牟县| 房产| 微山县| 荆门市| 十堰市| 汝城县| 普安县| 乌恰县| 正镶白旗| 承德市| 陆河县| 光泽县| 岳阳市| 景德镇市| 尼勒克县| 象山县| 临沂市| 楚雄市| 彰化县| 甘德县| 昌图县| 崇仁县|