楊曉倩 張萍 熊振東 陶忠瑞 陳一帆 陳華
摘要:隨著我國油氣勘探技術(shù)的發(fā)展,裂縫性儲積層在油氣的勘探開發(fā)中發(fā)揮著越來越重要的作用?,F(xiàn)有的裂縫識別仍然局限于人工分割裂縫部分再進(jìn)行分類,沒法從整個油井地下的成像測井圖像中檢測出裂縫的存在。該文針對測井?dāng)?shù)據(jù)和圖像資料,研究了裂縫經(jīng)Hough變換后的正弦曲線特性,由此人工制造了大量圖像代替成像數(shù)據(jù)進(jìn)行標(biāo)注,并應(yīng)用目標(biāo)檢測相關(guān)知識,使用YOLOv3訓(xùn)練模型,通過fine-tuning基于ImageNet的預(yù)訓(xùn)練模型,對測試集進(jìn)行目標(biāo)檢測,不僅加快了收斂的速度,其在抽樣的測試集中還能夠有效地識別出一些裂縫;同時,制造了帶有不同程度噪音的測試集再進(jìn)行檢測,可知本文的模型允許曲線帶有一定范圍內(nèi)的噪聲。最后,該文提出了進(jìn)一步的研究思路,指出可以應(yīng)用領(lǐng)域生成網(wǎng)絡(luò)的思想,且對于不同類型的裂縫,可以考慮看作多個種類的目標(biāo)檢測問題,進(jìn)一步進(jìn)行分類研究。
關(guān)鍵詞:裂縫識別;目標(biāo)檢測;YOLO;遷移學(xué)習(xí)
中圖分類號:TP391? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2021)36-0032-05
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
1 引言
一直以來,裂縫性儲層都是勘探的難點(diǎn)和重點(diǎn),裂縫的導(dǎo)流程度對油氣井的產(chǎn)出情況有很大的影響,在采油過程中,裂縫和半裂縫的識別是非常重要的。地質(zhì)勘探工作中,反映裂縫信息較多的是成像測井圖像,傳統(tǒng)的人工拾取裂縫的方法工作量大,且存在較大誤差,所以需要提出一種智能提取裂縫,且對其進(jìn)行準(zhǔn)確識別的方法。
目前,在測井裂縫識別方面,與智能裂縫識別相關(guān)的研究成果很少。傳統(tǒng)的測井裂縫識別方法[1]很難找到定量分析方法,近年出現(xiàn)了一些使用智能算法及數(shù)字圖像處理方法進(jìn)行裂縫識別的成果:在裂縫提取中,使用改進(jìn)蟻群算法[2],使用Roberts算子[3]等,此外還有快速霍夫變換、數(shù)學(xué)形態(tài)學(xué)[4]、張量投票方法等圖像分割方法。
然而,現(xiàn)有的方法都基于人為捕捉裂縫的前提,再對手動選取的圖像進(jìn)行識別,這種應(yīng)用依舊存在著巨大的工作量要求,且高度依賴于人工判斷。并且,目前的算法都具有大數(shù)據(jù)量的要求,然而在實際的勘探開發(fā)工程中,勘探任務(wù)難以開展,采集數(shù)據(jù)尤為艱難。因此,需要一種基于目標(biāo)檢測的方法,從成像測井圖像中識別出裂縫的存在,并且能夠基于小樣本得到一個較好的效果。于是,本文基于這一問題展開了研究。
2 數(shù)據(jù)集的預(yù)處理
2.1 裂縫數(shù)據(jù)集的特征
針對電成像測井圖像的測井裂縫識別,主要原理是先對數(shù)據(jù)進(jìn)行圖像處理,再進(jìn)行裂縫信息的提取分析工作。文獻(xiàn)[5-6]使用Hough變換做自動識別。在成像測井圖像的平面展開圖上,測井裂縫一般都是正弦曲線形狀,Hough 變換最初是用來檢測直線的,所以賴富強(qiáng)[5]提出用改進(jìn)的 Hough 變換來進(jìn)行裂縫識別。
根據(jù)正弦曲線的一般方程公式(1):
[y=Asin(ωx-β)+y0]? ? ? ? ? ? ? ? ? ? ? ? (1)
其中,是式子里的自變量,y是因變量。A作為振幅,ω是角頻率,β是初相位,y0是中線(基線)。將成像測井信息進(jìn)行處理,可以得到 A、ω、β和 y0這幾個參數(shù),從而得到了裂縫的曲線表達(dá)式。如圖1所示,利用改進(jìn)的Hough 變換可以較好地識別出經(jīng)過預(yù)處理以后的圖像中的裂縫。
基于這一原理,本文假定測井裂縫圖像都能處理成帶一定范圍內(nèi)噪聲的正弦曲線圖像,因此,可以考慮隨機(jī)生成一組正弦曲線作為數(shù)據(jù)集使用。
2.2 裂縫數(shù)據(jù)集制備
1)數(shù)據(jù)集介紹
本文使用的數(shù)據(jù)集是VOC2007格式的標(biāo)準(zhǔn)數(shù)據(jù)集,具體格式見圖2。
Images這一文件夾存儲全部的訓(xùn)練圖片樣本數(shù)據(jù),ImageSets這個文件夾存儲4個文本文檔格式的文件,分別存儲記錄了所有訓(xùn)練圖片數(shù)據(jù)、測試圖片數(shù)據(jù)、驗證圖片數(shù)據(jù)的圖片樣本名稱,Annotations存儲了與圖片對應(yīng)的.xml格式的標(biāo)注數(shù)據(jù),labels這一文件夾存儲可以直接使用的標(biāo)注數(shù)據(jù),samples文件夾存儲了需要檢測的數(shù)據(jù)。
2)圖像生成
通過公式(2)[7]來生成模擬的裂縫圖像:
[y=128π×tanθ×cos(128π×(x+1))+257-128π×tanθ+n]? ? ? ? ? ? ? ? ? (2)
其中,[θ]是裂縫傾角,[n]是隨機(jī)噪聲。通過修改粗細(xì)、傾角等參數(shù),隨機(jī)生成了1000張圖片作為數(shù)據(jù)集,選取其中幾張如圖3。
3)數(shù)據(jù)標(biāo)注
通過數(shù)據(jù)標(biāo)注工具labelimg生成.xml格式的標(biāo)注數(shù)據(jù)。標(biāo)注圖像和xml文件分別見圖4和圖5。
將數(shù)據(jù)集及其標(biāo)注放至對應(yīng)位置,隨機(jī)將數(shù)據(jù)集劃分為訓(xùn)練集:驗證集 = 9:1的比例。
4)數(shù)據(jù)增強(qiáng)
深層神經(jīng)網(wǎng)絡(luò)一般是需要大量數(shù)據(jù)以獲得較好結(jié)果,因為它依賴于能足以概括一個事物不同角度的數(shù)據(jù)集量。由于地質(zhì)構(gòu)造運(yùn)動的復(fù)雜性,地層中的裂縫形態(tài)各異,尤其是經(jīng)歷了板塊擠壓后,裂縫普遍會發(fā)生旋轉(zhuǎn)、擴(kuò)張等現(xiàn)象,而僅僅1000張圖像顯然無法概括所有情況,為了改善數(shù)據(jù)有限的問題,采用數(shù)據(jù)增強(qiáng)的方法,增強(qiáng)樣本多樣性、提高模型魯棒性、避免過擬合。
在計算機(jī)視覺這一領(lǐng)域中,典型的數(shù)據(jù)增強(qiáng)的方式有翻轉(zhuǎn)、旋轉(zhuǎn)、縮放、隨機(jī)裁剪或補(bǔ)零、色彩抖動、加噪聲等。本文通過在訓(xùn)練模型的過程中對圖像進(jìn)行翻轉(zhuǎn)、改變光照強(qiáng)度等操作,即一種在線增強(qiáng)的方式,操作如圖6。
3 數(shù)據(jù)集目標(biāo)檢測YOLOv3
目標(biāo)檢測,也叫目標(biāo)提取,就是事先給定一個圖像,進(jìn)行分割和識別。目標(biāo)檢測過程需要包含此目標(biāo)在該圖像中的位置數(shù)據(jù)信息和分類標(biāo)簽信息。本文所描述的平均精度特別適合于我們的算法預(yù)測目標(biāo)和類的位置。同時,該平均精度可以用于評價模型定位、目標(biāo)監(jiān)控和分割的性能等。
YOLOv3是一種速度和準(zhǔn)確率都能達(dá)到較高水平的目標(biāo)檢測模型,使用Darknet-53網(wǎng)絡(luò)結(jié)構(gòu)(含53個卷積層),在多尺度、小物體檢測中都有著不凡的表現(xiàn)。
3.1 YOLOv3算法原理
1)特征提取器
YOLOv3[8]的網(wǎng)絡(luò)結(jié)構(gòu)如圖7所示。
2)邊界框檢測
YOLOv3用anchor boxex來選定邊界框,過程見圖8。每個邊界框預(yù)測4個坐標(biāo):[tx,ty,tw,th]。如果目標(biāo)單元距離圖像左上角的邊距是[(cx,cy)]且對應(yīng)圖像邊界框的寬和高為[pw,ph],那么網(wǎng)絡(luò)的預(yù)測為公式(3):
[bx=σ(tx)+cxby=σ(ty)+cybw=pwetwbh=pheth]? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (3)
YOLOv3使用邏輯回歸預(yù)測每個邊界框的目標(biāo)與真實目標(biāo)的符合程度。本文系統(tǒng)將忽略符合度未達(dá)到一定閾值的物體,設(shè)定閾值為0.5。
3.2 預(yù)訓(xùn)練模型的遷移
對于小樣本數(shù)據(jù),為了更快更有效地提取特征,需要基于大量數(shù)據(jù)的預(yù)訓(xùn)練參數(shù)來初始化。本文的訓(xùn)練是用ImageNet數(shù)據(jù)集訓(xùn)練[10],初始值為首次訓(xùn)練得到的權(quán)重值,然后繼續(xù)訓(xùn)練,不斷對參數(shù)進(jìn)行微調(diào)。在Imagenet數(shù)據(jù)集上預(yù)訓(xùn)練的模型的參數(shù)從微調(diào)開始就效果很好,接近最佳值,所以比直接從自制的訓(xùn)練集上開始訓(xùn)練再做微調(diào)得到的模型效果更好。因此,微調(diào)可以有效地減少迭代次數(shù),使收斂更快。
4 算法實現(xiàn)及結(jié)果分析
4.1 模型訓(xùn)練
我們使用yolov3-tiny預(yù)訓(xùn)練模型,該模型保存了yolov3的前15層卷積層的參數(shù)。
模型的四種評估度量如表1所示。
運(yùn)行時間為1.236h,可以看出,遷移預(yù)訓(xùn)練的模型比從頭訓(xùn)練更快收斂。
4.2 邊界框預(yù)測
1)使用測試機(jī)預(yù)測邊界框
使用原本劃分的測試集預(yù)測邊框,檢測結(jié)果如圖9。
而在輸出中,也存在著預(yù)測圖10中邊界框的情況。
在本文看來,這是因為訓(xùn)練集中出現(xiàn)了大量的只有一部分的曲線,這是因為在數(shù)據(jù)生成時的范圍設(shè)置使某種形態(tài)的圖像偏多,導(dǎo)致模型泛化能力受到影響。
2)重新生成不同程度噪聲的數(shù)據(jù)預(yù)測邊界框
在正弦曲線上加以一個隨機(jī)噪聲,不斷加大噪聲進(jìn)行裂縫檢測,效果如圖11。
由此可見,本文建立的模型能檢測出帶有一定范圍內(nèi)噪聲的裂縫曲線,具有一定的魯棒性。這是因為本文的預(yù)訓(xùn)練模型基于包含各種種類的標(biāo)準(zhǔn)數(shù)據(jù)集,其參數(shù)容許樣本存在多樣性,因此大大提升了泛化能力。
5 模型改進(jìn)
5.1 不同種類裂縫的識別
地質(zhì)勘探中,裂縫也有嚴(yán)格的分類[11],基于這一分類,可以延伸出許多工作:對于勘探開發(fā)工作而言,誘導(dǎo)縫是測量儀器在鉆測時壓裂地層時產(chǎn)生的,不具有指示意義,反而會誤導(dǎo)判斷,被稱為“假縫”,因此需要鑒別出天然裂縫與誘導(dǎo)縫,捕捉對地層分析有利的信息;若在檢測出裂縫的基礎(chǔ)上,需要識別出裂縫類型,則原問題變?yōu)槎嗄繕?biāo)檢測問題。由于正弦曲線的波長等參數(shù)中包含著與傾角有關(guān)的信息,可作出不同角度的裂縫圖像,進(jìn)行不同形態(tài)裂縫的識別。
5.2 領(lǐng)域生成網(wǎng)絡(luò)
在本文初步的試探性工作下,通過最簡單的遷移學(xué)習(xí)fine-tuning已經(jīng)能看出其對于處理小樣本數(shù)據(jù)的優(yōu)勢。而在遷移學(xué)習(xí)中,對于類別空間不共享但任務(wù)相似的源域與目標(biāo)域,可以使用領(lǐng)域生成網(wǎng)絡(luò)[12]的方法進(jìn)行模型訓(xùn)練。
而目前的DANN是進(jìn)行了非深度遷移,本文認(rèn)為,如果將特征提取器替換為Darknet-53,則可以提取源域的深層特征,由于基于正弦曲線的生成方法有能力制作出一個規(guī)模大的數(shù)據(jù)集,因此可以視作源域,而用成像測井裂縫圖像作Hough變換后的曲線作為目標(biāo)域,通過調(diào)整特征提取器的層數(shù),進(jìn)行試探性研究,探究這兩者究竟在第幾層時會發(fā)生負(fù)遷移,以做出合理地修正。
5.3 類別不平衡
在實際地質(zhì)勘探開發(fā)過程中,裂縫的類別是不平衡的,這主要是因為地質(zhì)的構(gòu)造運(yùn)動通常會傾向于同一個運(yùn)動模式,所以訓(xùn)練模型可能會側(cè)重于樣本中數(shù)量較大的一類,這樣模型的泛化能力就會降低,上文以F范數(shù)評價得到的效果并不好,一定程度上也是因為裂縫識別的模型過分側(cè)重于某一形狀,這亦是一種潛在的不平衡。
而在后續(xù)做不同種類裂縫檢測時,這一現(xiàn)象會更為明顯。首先,在生成數(shù)據(jù)集時,應(yīng)先控制范圍,使數(shù)據(jù)集符合自然界中的不平衡現(xiàn)象,再對該現(xiàn)象進(jìn)行處理。
不平衡數(shù)據(jù)的處理方法有重采樣、欠采樣、平衡抽樣、代價敏感學(xué)習(xí)等。而綜合考慮本問題中小樣本+不平衡的特點(diǎn),可以考慮選用生成式對抗網(wǎng)絡(luò)[13]。
6 總結(jié)
裂縫經(jīng)Hough變換后,皆可化為帶一定噪聲的正弦曲線,這一特性給予了人工繪制數(shù)據(jù)集一個有力的依據(jù),也一定程度上克服了在現(xiàn)階段裂縫識別上最大的問題:不可能采集到大量的數(shù)據(jù)以訓(xùn)練模型。這簡化了數(shù)據(jù)采集工作,節(jié)約了大量的人力資本。
本文通過fine-tuning基于標(biāo)準(zhǔn)數(shù)據(jù)集的YOLOv3 tiny預(yù)訓(xùn)練模型,對測試集進(jìn)行目標(biāo)檢測,從結(jié)果中可以看出,使用預(yù)訓(xùn)練的參數(shù)來初始化網(wǎng)絡(luò),不僅加快了收斂的速度,還能夠有效地識別出一些裂縫。對于帶有不同程度噪音的測試集再進(jìn)行檢測,也能識別出一部分,即該模型具備著一定的魯棒性,這也是因為基于標(biāo)準(zhǔn)數(shù)據(jù)集的模型容許輸入樣本的多樣性,因此大大提高了泛化能力。
最后,后續(xù)的研究可以將領(lǐng)域生成網(wǎng)絡(luò)改造成深度遷移,共享人造數(shù)據(jù)集于裂縫處理后的數(shù)據(jù)集之間的深層特征,以試探性研究其兩者之間的遷移。該工作有望解決許多問題,如將已有數(shù)據(jù)的陸相成因油田油藏遷移到很難采集數(shù)據(jù)以至于幾乎沒有數(shù)據(jù)的海相成因油藏中,或?qū)⒛车貐^(qū)的油藏數(shù)據(jù)應(yīng)用于新開發(fā)的油藏數(shù)據(jù)中,等等。
參考文獻(xiàn):
[1] 高霞,謝慶賓.儲層裂縫識別與評價方法新進(jìn)展[J].地球物理學(xué)進(jìn)展,2007,22(5):1460-1465.
[2] 彭誠,鄒長春.基于改進(jìn)蟻群算法的成像測井裂縫自動提取方法[J].計算機(jī)工程,2015,41(8):196-201.
[3] 田金文,高謙,杜擁軍,等.基于井壁成像測井圖像的溶洞自動檢測方法[J].江漢石油學(xué)院學(xué)報,1999,21(2):20-22.
[4] 秦巍,陳秀峰.成像測井井壁圖像裂縫自動識別[J].測井技術(shù),2001,25(1):64-69,81.
[5] 賴富強(qiáng).電成像測井處理及解釋方法研究[D].青島:中國石油大學(xué),2011.
[6] 劉文斌.火山巖儲層縫洞測井自動識別和定量評價[D].長春:吉林大學(xué),2017.
[7] 杜小強(qiáng),劉鑫,薛志波,等.基于深度學(xué)習(xí)的電成像測井裂縫自動識別方法初探[J].化工管理,2019(24):204-205.
[8] Redmon J,F(xiàn)arhadi A.YOLOv3:an incremental improvement[EB/OL].2018
[9] Redmon J,F(xiàn)arhadi A.YOLO9000:better,faster,stronger[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).July 21-26,2017,Honolulu,HI,USA.IEEE,2017:6517-6525.
[10] Zhou Z W,Sodha V,Siddiquee M M R,et al.Models genesis:generic autodidactic models for 3D medical image analysis[EB/OL].2019
[11] 周燦燦,楊春頂.砂巖裂縫的成因及其常規(guī)測井資料綜合識別技術(shù)研究[J].石油地球物理勘探,2003,38(4):425-430,462.
[12] Ganin Y,Ustinova E,Ajakan H,et al.Domain-adversarial training of neural networks[M]//Domain Adaptation in Computer Vision Applications.Cham:Springer International Publishing,2017:189-209.
[13] Goodfellow I.NIPS 2016 tutorial:generative adversarial networks[EB/OL].2016:arXiv:1701.00160[cs.LG].https://arxiv.org/abs/1701.00160.
【通聯(lián)編輯:唐一東】