劉 勇,吳曉紅,滕奇志,何海波
(1 四川大學(xué) 電子信息學(xué)院,成都 610065;2 成都西圖科技有限公司,成都 610065)
傳統(tǒng)的巖石薄片圖像分析鑒定依賴(lài)于專(zhuān)家在光學(xué)顯微鏡下對(duì)巖石的目視觀察,存在很多局限性。首先,薄片鑒定需要在多個(gè)角度反復(fù)觀察單偏光圖像和正交偏光圖像,大量巖石樣本的識(shí)別工作需要耗費(fèi)一定的人力資源和時(shí)間成本;其次,人工鑒定因人而異,不能保證準(zhǔn)確、量化的結(jié)果;第三,傳統(tǒng)的鑒定依賴(lài)實(shí)物送樣和人工觀察,但薄片樣品長(zhǎng)時(shí)間存放可能會(huì)變黃、脫膠,影響鑒定結(jié)果,最終導(dǎo)致資產(chǎn)損失。
近年來(lái),在礦物顆粒分類(lèi)識(shí)別方面,國(guó)內(nèi)外學(xué)者開(kāi)展了大量的研究工作,也取得了一定的應(yīng)用成果。2013 年,Mariusz Mlynarczuk[1]等人基于最近鄰算法等4 種模式識(shí)別方法,在4 種顏色特征空間中對(duì)白云石、石灰?guī)r、花崗巖等礦物進(jìn)行了顆粒識(shí)別;2014年,楊宗瑞[2]結(jié)合礦物顆粒的亮度均值、顏色、紋理特征以及灰度共生矩陣熵信息,采用隨機(jī)森林分類(lèi)器識(shí)別多種礦物顆粒;2015 年,Akka? E 等人[3]使用SEM-EDS 光譜儀獲取礦物顆粒的特征,再利用決策樹(shù)算法對(duì)橄欖石等十種礦物顆粒進(jìn)行分類(lèi);2016年,閔濤[4]針對(duì)礦物正交偏光序列圖的顏色、紋理等特征,采用機(jī)器學(xué)習(xí)模型,再結(jié)合復(fù)雜的權(quán)值投票機(jī)制,完成礦物顆粒識(shí)別任務(wù)。
隨著計(jì)算機(jī)硬件能力的迅速提升和深度學(xué)習(xí)技術(shù)的飛速發(fā)展,基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)分類(lèi)方法也相繼出現(xiàn)。2012 年,Krizhevsky A 等人[5]提出AlexNet,在圖像分類(lèi)領(lǐng)域取得突破性進(jìn)展;自此,用于分類(lèi)的各種卷積神經(jīng)網(wǎng)絡(luò)層出不窮,包括VGGNet、ResNet、MobileNet、InceptionResnet 等。2018 年,彭志偉[6]選用CaffeNet 作為識(shí)別分類(lèi)網(wǎng)絡(luò)模型,并提出一種基于顏色和紋理的序列圖像篩選算法,實(shí)現(xiàn)了礦物顆粒偏光序列圖像下的分類(lèi)識(shí)別;2019 年,T.Nanjo,S.Tanaka[7]等人提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的碳酸鹽巖巖性識(shí)別圖像分析技術(shù);2020 年Y Xu[8]等人利用卷積神經(jīng)網(wǎng)絡(luò)ResNet-18對(duì)變質(zhì)巖、火成巖、沉積巖(包括碎屑巖和碳酸鹽)的薄片圖像進(jìn)行自動(dòng)分類(lèi);2021 年,朱磊[9]提出了一種基于序列圖分類(lèi)的礦物顆粒識(shí)別方法,針對(duì)礦物顆粒偏光序列圖像分類(lèi)效果相對(duì)較好,但未充分利用巖石顆粒在不同正交偏光角度下的消光性信息,斜長(zhǎng)石礦物顆粒存在一定的誤識(shí)別情況。
綜上,充分利用礦物顆粒在多個(gè)正交偏光角度下的豐富信息是礦物顆粒分類(lèi)工作中十分值得探究的內(nèi)容。在不同正交偏光角度下,礦物顆粒的干涉、紋理及消光特征表現(xiàn)不同,如圖1 所示。石英顆粒表面整體較為光滑;堿性長(zhǎng)石表面紋理特征豐富,沒(méi)有規(guī)律,整體表現(xiàn)出一種“不干凈”的狀態(tài);斜長(zhǎng)石顆粒在特定角度會(huì)呈現(xiàn)聚片雙晶現(xiàn)象;巖屑顆粒在偏光序列圖中幾乎沒(méi)有消光變化,表面有零星分布的碎屑,沒(méi)有規(guī)律。本文在對(duì)巖石礦物顆粒偏光序列圖像進(jìn)行消光位校正處理的前提下,提出了基于改進(jìn)的SKnet 和雙向GRU 模型的巖石礦物顆粒分類(lèi)方法,將進(jìn)行了消光位校正對(duì)齊處理后的礦物顆粒偏光序列圖像送入改進(jìn)的SKnet 特征提取模塊進(jìn)行特征提取,再通過(guò)雙向GRU 門(mén)控單元捕獲序列圖的前后關(guān)聯(lián)特性,最終完成對(duì)常見(jiàn)的石英、斜長(zhǎng)石、堿性長(zhǎng)石、巖屑4 類(lèi)礦物顆粒的分類(lèi)識(shí)別。該網(wǎng)絡(luò)在礦物顆粒偏光序列圖識(shí)別分類(lèi)上取得了較好的效果。
圖1 4 類(lèi)巖石礦物偏光序列圖Fig.1 Polarization sequence images of four types of rock minerals
在進(jìn)行巖石礦物顆粒識(shí)別工作前需采集一定量的巖石薄片序列圖,便于后續(xù)分割提取巖石顆粒序列圖,制作實(shí)驗(yàn)所用訓(xùn)練集、測(cè)試集。將巖石樣本磨制到足夠“薄”,一般的標(biāo)準(zhǔn)薄片厚度為30 μm,將薄片制作成玻片放置光學(xué)顯微鏡下,即可觀察分析巖石薄片中的礦物。本文采用最新的薄片圖像采集系統(tǒng),在載物臺(tái)不動(dòng)的情況下,自動(dòng)旋轉(zhuǎn)上下偏振片來(lái)獲取不同角度的正交偏光圖像,從而實(shí)現(xiàn)序列圖像的對(duì)齊分析,更有利于后續(xù)圖像的智能識(shí)別,圖像采集工作中設(shè)置的正交偏光旋轉(zhuǎn)角度為15°,每一組采集9 張圖片。在正交偏光角度下采集的巖石薄片序列圖像如圖2 所示。
圖2 巖石薄片偏光序列圖像Fig.2 Polarized light sequence images of rock slices
在不同角度正交偏光鏡下,由于非均質(zhì)巖石薄片除垂直光軸以外的切片,光率體為橢圓,在偏振片的旋轉(zhuǎn)過(guò)程中,光率體橢圓長(zhǎng)、短半徑與上偏振片、下偏振片有4 次平行的機(jī)會(huì),平行下偏振片的偏光不能透過(guò)上偏振片,視域呈黑暗,說(shuō)明該礦物顆粒處于消光位,并且?guī)r石礦物顆粒的消光性在載物臺(tái)旋轉(zhuǎn)的過(guò)程中呈現(xiàn)以90°為周期的變化規(guī)律。在實(shí)際圖像采集過(guò)程中,由于顆粒自身的一些光學(xué)特性,實(shí)際處于消光位的礦物顆粒表現(xiàn)為周期內(nèi)的亮度最低值,并且不同礦物顆粒的消光位可能處于不同角度,分割提取的巖石顆粒偏光序列圖第一張圖像并不一定處于消光位,為了更好的利用后續(xù)雙向GRU 循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的特性,需要保證不同礦物顆粒正交偏光序列圖像相同序號(hào)位置處的消光程序盡可能接近,因此需要從巖石薄片偏光序列圖中提取出巖石顆粒序列圖,然后對(duì)巖石顆粒序列圖做消光位校正處理,步驟如下:
(1)對(duì)采集獲取的巖石薄片偏光序列圖像,一次讀入以15°為間隔的9 張正交偏光序列圖,利用實(shí)例分割或者交互式分割方法,提取其中的巖石礦物顆粒偏光序列圖像,如圖3 所示。
圖3 利用分割方法得到的礦物顆粒序列圖Fig.3 Mineral grain sequence map obtained by segmentation method
(2)對(duì)每一組提取出來(lái)偏光序列圖像,找到序列圖中處于消光位的顆粒圖像,并以該圖像為基準(zhǔn)對(duì)序列圖重新排序。
①把原來(lái)的9 張礦物顆粒RGB 序列圖記為rgb={r1,r2,r3,r4,r5,r6,r7,r8,r9},根據(jù)RGB 值與灰度值之間的轉(zhuǎn)換關(guān)系,將其轉(zhuǎn)換為9 張灰度序列圖,記為gray ={g1,g2,g3,g4,g5,g6,g7,g8,g9};
②在9 張灰度序列圖中,計(jì)算每張圖像的灰度值總和,并記錄灰度值總和最低的圖像序號(hào),如第四張圖g4;
③將原礦物顆粒RGB 序列圖中第四張(序號(hào)r4)之前的圖添加到序列圖末端,結(jié)果為rgb ={r4,r5,r6,r7,r8,r9,r1,r2,r3},此時(shí)偏光序列圖消光位校正工作已完成。
針對(duì)采集處理后的巖石礦物顆粒偏光序列圖像,巖石顆粒成分的識(shí)別不僅需要考慮單個(gè)圖像中的紋理、亮度等特征,還需要結(jié)合不同正交偏光角度下的圖像之間的關(guān)聯(lián)信息。本文將二維序列圖像類(lèi)比于視頻分類(lèi)的方式進(jìn)行巖石礦物顆粒成分識(shí)別,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的巖石礦物顆粒識(shí)別網(wǎng)絡(luò),CNN 采用改進(jìn)的SKnet 進(jìn)行特征提取,同時(shí)利用雙向門(mén)控循環(huán)單元(Bidirectional Gated Recurrent Unit,Bi-GRU)提取巖石礦物顆粒偏光序列圖像的前后關(guān)聯(lián)特征,完成識(shí)別任務(wù),其框架如圖4 所示。
圖4 結(jié)合改進(jìn)的SKnet 與Bi-GRU 的礦物顆粒識(shí)別框架Fig.4 Combining improved SKnet with Bi-GRU for mineral particle identification framework
整體輸入為巖石礦物顆粒正交偏光序列圖像,通過(guò)改進(jìn)的SKnet 特征提取模塊對(duì)每一張偏光序列圖像提取特征;將提取出來(lái)的特征送入后續(xù)雙向GRU 循環(huán)神經(jīng)網(wǎng)絡(luò)模塊進(jìn)行序列維度的信息建模;最后,利用全連接層得到最終的分類(lèi)識(shí)別結(jié)果。本文采用交叉熵作為損失函數(shù),計(jì)算公式為
其中,p(xij)表示第i個(gè)樣本的真實(shí)標(biāo)簽為j,q(xij) 表示第i個(gè)樣本預(yù)測(cè)為第j個(gè)標(biāo)簽值的概率,共有n個(gè)標(biāo)簽值,m個(gè)樣本。
SKnet 網(wǎng)絡(luò)由多個(gè)SK(Selective Kernel)單元堆疊而成,通過(guò)SK 卷積以非線(xiàn)性的方法聚合來(lái)自不同卷積核大小的特征,進(jìn)而實(shí)現(xiàn)動(dòng)態(tài)調(diào)整感受野的尺寸,便于對(duì)巖石顆粒多尺度信息的提?。?0]?;A(chǔ)的SK 卷積由分離、融合和選擇等操作組成。本文在基礎(chǔ)的SK 卷積中添加了空間維度上的特征融合和選擇,利用軟注意力機(jī)制使模型關(guān)注到更多重要的區(qū)域,從而提升巖石薄片圖像礦物識(shí)別分類(lèi)的性能。本文改進(jìn)的SK 卷積的內(nèi)部結(jié)構(gòu)圖如圖5 所示。
圖5 改進(jìn)的SK 卷積內(nèi)部結(jié)構(gòu)圖Fig.5 Improved SK convolution internal structure diagram
首先是分離操作,對(duì)于輸入的特征圖,默認(rèn)情況下進(jìn)行兩次轉(zhuǎn)換兩個(gè)變換對(duì)應(yīng)的卷積核的尺寸分別為3×3和5×5,并且都是由卷積、Relu 激活函數(shù)、BatchNorm批處理等操作組成。通道特征融合操作,融合的基本思路是設(shè)計(jì)一個(gè)門(mén)控裝置控制流入下一個(gè)卷積層中不同分支的信息流。sc表示s的第c個(gè)元素內(nèi)容,通過(guò)在U的H × W維度上進(jìn)行壓縮計(jì)算得到,其計(jì)算過(guò)程為
通過(guò)全連接層產(chǎn)生一個(gè)緊湊的特征圖像用于精確及調(diào)整的選擇,這部分也進(jìn)行了降維處理,式(3):
其中,δ表示ReLU 激活函數(shù);B表示批規(guī)范化;W∈RdxC。
為了驗(yàn)證W中d的作用,采用了一個(gè)衰減比r控制d的值,來(lái)探究d對(duì)于模型效率的影響為
其中,C表示通道數(shù),L為d的最小值。
在壓縮特征描述符z的引導(dǎo)下,采用跨通道的軟注意機(jī)制自適應(yīng)選擇不同空間尺度的信息,ac和bc分別為軟注意力矢量,通過(guò)對(duì)各個(gè)核的注意權(quán)值分別得到,式(5):
其中,A,B∈RC×d,Ac∈R1×d表示A的第c行,Bc∈R1×d表示B的第c行。
使用空間注意力融合操作來(lái)關(guān)注圖像哪些區(qū)域特征更有意義。不同于簡(jiǎn)單的像素級(jí)相加來(lái)整合多分支特征,引入自適應(yīng)分支特征融合,實(shí)現(xiàn)不同特征的高效融合,具體為不同分支的特征乘上相應(yīng)的可學(xué)習(xí)權(quán)重并相加得到新的融合特征。自適應(yīng)權(quán)重的學(xué)習(xí)過(guò)程為通過(guò)連接不同分支的特征圖進(jìn)行1×1 大小的卷積操作,改變特征圖的通道數(shù),得到與分支特征圖相同尺寸、通道數(shù)為2 的特征圖,2 個(gè)通道上的特征圖分別表示為Aij和Bij,然后通過(guò)softmax 函數(shù)對(duì)其進(jìn)行處理,分別得到不同分支特征的融合比例矩陣為
針對(duì)于兩個(gè)分支特征圖中同一位置的像素點(diǎn),經(jīng)過(guò)特征融合策略得到最終輸出特征圖像V,為
本文使用的特征提取模塊總體結(jié)構(gòu)如圖6 所示,包含多個(gè)層級(jí),每個(gè)層級(jí)內(nèi)部由多個(gè)SK 單元連接而成,每個(gè)層級(jí)內(nèi)包含的SK 單元的數(shù)量分別為3、4、6、3。通常情況下,在每一個(gè)層級(jí)中多個(gè)SK 單元的連接方式是簡(jiǎn)單的相加組合,不同的SK 單元之間并沒(méi)有共享信息,簡(jiǎn)單堆疊的方式無(wú)法有效地提取想要的特征。因此,本文借鑒Xu Ma[11]等人在2021 年提出的深度連接注意力網(wǎng)絡(luò)模式,在堆疊的相鄰SK 單元之間建立連接關(guān)系,使多個(gè)單元間能夠進(jìn)行信息交流,提高了網(wǎng)絡(luò)的學(xué)習(xí)能力。具體的多個(gè)SK 單元的連接結(jié)構(gòu)如圖7 所示,由于相互連接的兩個(gè)特征在空間、通道等方面維度有所不同,所以分別采用最大池化層和全連接層來(lái)實(shí)現(xiàn)特征間空間維度和通道維度的匹配。
圖6 特征提取模塊整體架構(gòu)Fig.6 The overall architecture of the feature extraction module
圖7 改進(jìn)的SK 單元互連結(jié)構(gòu)圖Fig.7 Improved SK cell interconnect structure diagram
巖石礦物顆粒成分的識(shí)別需要結(jié)合正交偏光序列圖像中每一張圖像的特征以及序列圖像的變化信息才能準(zhǔn)確的識(shí)別礦物顆粒種類(lèi)。本文采用雙向門(mén)控循環(huán)單元(Gated Recurrent Unit,GRU),利用SKnet 提取的序列圖特征信息送入GRU 循環(huán)卷積神經(jīng)網(wǎng)絡(luò),充分的利用巖石礦物顆粒序列圖像的相關(guān)信息。GRU 是基于門(mén)機(jī)制的,原理類(lèi)似于長(zhǎng)短期記憶(LSTM),依靠歷史信息在當(dāng)前點(diǎn)做出相應(yīng)的預(yù)測(cè)。LSTM 的門(mén)機(jī)制主要通過(guò)輸入門(mén)、遺忘門(mén)、輸出門(mén)來(lái)控制記憶單元的信息,解決信息的長(zhǎng)依賴(lài)問(wèn)題。GRU 模型改進(jìn)了LSTM 的門(mén)機(jī)制結(jié)構(gòu),比LSTM 更加簡(jiǎn)潔,訓(xùn)練效率相對(duì)較高。GRU 也是典型的RNN 架構(gòu),通過(guò)結(jié)合序列樣本中當(dāng)前樣本的信息和上一個(gè)樣本的隱狀態(tài),計(jì)算當(dāng)前樣本的隱狀態(tài)并向下繼續(xù)傳遞。GRU 的內(nèi)部結(jié)構(gòu)如圖8 所示。
圖8 GRU 內(nèi)部結(jié)構(gòu)圖Fig.8 GRU internal structure diagram
GRU 有兩個(gè)門(mén),一個(gè)是重置門(mén),另一個(gè)是更新門(mén)。更新門(mén)控的計(jì)算公式為
其中,ω(z)和uz為權(quán)重矩陣;xt是經(jīng)過(guò)線(xiàn)性變換后時(shí)間步長(zhǎng)的向量輸入;ht-1保存了上一個(gè)經(jīng)過(guò)線(xiàn)性變換后時(shí)間步長(zhǎng)的信息。
將變換后的信息匯總并輸入激活函數(shù),最終的結(jié)果在0 到1 之間變換。更新門(mén)決定了歷史信息在傳遞時(shí)的比例,復(fù)制過(guò)去的信息,以減少梯度消失的風(fēng)險(xiǎn)。重置門(mén)控的計(jì)算公式為
重置門(mén)的計(jì)算方法與更新門(mén)相同,只是改變了用于線(xiàn)性變換的參數(shù)ω(r)和ur。復(fù)位門(mén)計(jì)算非聚焦信息的比例,這些信息稍后會(huì)被過(guò)濾掉。GRU 結(jié)構(gòu)中還包含一個(gè)候選的隱藏層ht,計(jì)算公式為
其中,ω和u為權(quán)重矩陣。
候選隱藏層可以理解為當(dāng)前的記憶內(nèi)容??刂七^(guò)濾后的信息在隱藏層的比例,將這個(gè)信息與隱藏層當(dāng)前時(shí)刻的信息相加,得到隱藏層的最終輸出信息ht,也是當(dāng)前時(shí)刻的最終記憶狀態(tài),計(jì)算公式為
可以發(fā)現(xiàn),該模塊通過(guò)應(yīng)用注意力機(jī)制使得zt與1-zt是互相制約與影響的,對(duì)于前一個(gè)序列樣本的輸出遺忘的越多,當(dāng)前得到的候選狀態(tài)過(guò)濾掉的信息就越少,反之同理。直接丟棄與模型分類(lèi)無(wú)關(guān)的信息,可以在一定程度上解決模型接收到的信息過(guò)多的問(wèn)題,提高模型分類(lèi)的效率。
單向GRU 的狀態(tài)是從前到后單向傳輸?shù)?,也就是序列圖前面的樣本無(wú)法考慮后面樣本序列對(duì)前面樣本的影響,很容易忽略后面的序列圖的影響,雙向GRU 是單向GRU 的一種變體,其輸出依賴(lài)于向前和向后狀態(tài)的雙重作用,克服了單向GRU 的局限,從而提升基于正交偏光序列圖像的巖石薄片礦物識(shí)別網(wǎng)絡(luò)的性能。
本文利用課題組鑄體粒度圖像處理軟件中的交互式分割方法,從大量巖石薄片正交偏光序列圖像中提取出不同類(lèi)別礦物顆粒偏光序列圖像,以一組偏光序列圖像對(duì)應(yīng)一類(lèi)礦物顆粒標(biāo)簽的方式,構(gòu)建礦物顆粒分類(lèi)識(shí)別的原始數(shù)據(jù)集。該數(shù)據(jù)集包含4類(lèi)礦物顆粒偏光序列圖,分別為石英、堿性長(zhǎng)石、斜長(zhǎng)石、巖屑。在實(shí)際數(shù)據(jù)采集過(guò)程中,通常情況下,巖石薄片圖像中斜長(zhǎng)石顆粒含量相對(duì)較少,其余3種礦物顆粒數(shù)量相對(duì)較多。為了防止樣本數(shù)量的不均衡影響最終識(shí)別效果,本文根據(jù)4 種巖石礦物顆粒樣本數(shù)量占比,使用圖像幾何變換、仿射變換等方法對(duì)數(shù)據(jù)集進(jìn)行了進(jìn)一步的擴(kuò)充,建立最終數(shù)據(jù)集。通過(guò)數(shù)據(jù)增廣,石英、堿性長(zhǎng)石、斜長(zhǎng)石、巖屑4 類(lèi)礦物顆粒的偏光序列圖像的數(shù)量均達(dá)到每類(lèi)2 000組,按照8 ∶1 ∶1 的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,最終構(gòu)成的數(shù)據(jù)集分布情況見(jiàn)表1。
表1 礦物顆粒識(shí)別數(shù)據(jù)集Tab.1 Mineral particle identification dataset 個(gè)
實(shí)驗(yàn)中模型訓(xùn)練使用NVIDIA RTX2080Ti GPU,顯存為32 G,CPU 為Intel(R)Core(TM)i7-9700。實(shí)驗(yàn)環(huán)境基于Ubuntu20.04 系統(tǒng),使用CUDA 9.0 加速運(yùn)算平臺(tái),深度學(xué)習(xí)的框架使用Pytorch-1.2.0。
在送入網(wǎng)絡(luò)訓(xùn)練之前對(duì)巖石礦物顆粒正交偏光序列圖像進(jìn)行消光位校正處理,然后將圖像數(shù)據(jù)調(diào)整為224×224,再進(jìn)行歸一化操作,批處理大小設(shè)置為8,初始學(xué)習(xí)率設(shè)置為0.001,訓(xùn)練迭代次數(shù)為400,使用隨機(jī)梯度下降優(yōu)化器,并且采用poly 策略調(diào)整學(xué)習(xí)率。
本文使用混淆矩陣展示所提出的基于改進(jìn)的SKnet 和Bi-GRU 的巖石薄片圖像礦物識(shí)別方法對(duì)4 類(lèi)巖石礦物顆粒的預(yù)測(cè)結(jié)果,同時(shí)反映影響模型預(yù)測(cè)準(zhǔn)確性的樣本分布情況。此外,為了評(píng)估本文提出的方法面向不同巖石礦物偏光序列圖像在識(shí)別性能上的差異,采用識(shí)別率作為分類(lèi)網(wǎng)絡(luò)的評(píng)價(jià)指標(biāo)。識(shí)別率反映了每一類(lèi)礦物顆粒正確分類(lèi)的數(shù)量占該類(lèi)礦物顆粒實(shí)際總數(shù)量的比例,識(shí)別率越高,表明正確分類(lèi)的數(shù)量越多,公式為
其中,ni為第i類(lèi)礦物中正確分類(lèi)的數(shù)量,Ni為第i類(lèi)礦物顆粒實(shí)際總數(shù)量。
根據(jù)本文提出的方法,利用礦物顆粒序列圖像預(yù)測(cè)和真實(shí)類(lèi)別的識(shí)別結(jié)果,建立混淆矩陣見(jiàn)表2。表2 中每一行代表該類(lèi)別的判別結(jié)果的數(shù)量,識(shí)別正確的數(shù)量除以該類(lèi)別實(shí)際總數(shù)即為該類(lèi)別的召回率。每一列為其他類(lèi)別識(shí)別為當(dāng)前類(lèi)別的數(shù)量,識(shí)別正確的數(shù)量除以列內(nèi)數(shù)量總和即為該類(lèi)別的精確率。可以看出本文提出的分類(lèi)模型準(zhǔn)確率和召回率都達(dá)到90%以上,說(shuō)明利用本文提出的分類(lèi)方法,石英、堿性長(zhǎng)石、斜長(zhǎng)石、巖屑這4 類(lèi)礦物可以被有效的區(qū)分開(kāi)。
表2 基于本文分類(lèi)方法的混淆矩陣Tab.2 Confusion matrix based on the classification method in this paper
為表明本文所采用的巖石礦物顆粒識(shí)別方法的有效性,將本文提出的方法與現(xiàn)有的一些礦物顆粒識(shí)別算法進(jìn)行了對(duì)比,對(duì)比結(jié)果見(jiàn)表3。
表3 本文提出的方法與其他方法的實(shí)驗(yàn)結(jié)果對(duì)比Tab.3 The method proposed in this paper is compared with the experimental results of other methods %
由表3 可以發(fā)現(xiàn),利用傳統(tǒng)機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)礦物顆粒分類(lèi),總體識(shí)別率較低;使用CaffeNet 或SKnet 再結(jié)合一定的圖像篩選方法進(jìn)行識(shí)別分類(lèi),針對(duì)石英、堿性長(zhǎng)石、巖屑顆粒識(shí)別率相對(duì)較好,但是斜長(zhǎng)石顆粒識(shí)別率較低,由于礦物顆粒自身特征的復(fù)雜性,單張圖像很難將礦物顆粒特征完全表征出來(lái),在某些情況下斜長(zhǎng)石顆粒容易被誤識(shí)別為堿性長(zhǎng)石或者巖屑顆粒;基于SKnet 結(jié)合單向GRU 的分類(lèi)方法總體來(lái)說(shuō)識(shí)別率較前幾種方法已有明顯提升;本文提出的分類(lèi)方法,更充分的利用了巖石礦物顆粒正交偏光圖像的消光特征,改進(jìn)的SKnet 以及雙向GRU 門(mén)控單元更好的利用了序列圖像的前后關(guān)聯(lián)信息,對(duì)于4 種巖石礦物顆粒的識(shí)別率都達(dá)到了95%以上,相比于已有的算法有明顯的提升。
為了測(cè)試本文分類(lèi)方法中巖石礦物顆粒偏光圖像消光位校正處理以及網(wǎng)絡(luò)模型各模塊對(duì)最終的識(shí)別效果產(chǎn)生的影響,基于本文提出的網(wǎng)絡(luò)結(jié)構(gòu),分別進(jìn)行了使用消光位校正和不使用消光位校正操作的對(duì)比實(shí)驗(yàn)測(cè)試,使用改進(jìn)的SKnet 網(wǎng)絡(luò)模型和基礎(chǔ)SKnet 網(wǎng)絡(luò)模型的對(duì)比實(shí)驗(yàn)測(cè)試以及使用單向GRU門(mén)控單元和雙向GRU 門(mén)控單元對(duì)比實(shí)驗(yàn)測(cè)試,測(cè)試結(jié)果見(jiàn)表4。
表4 是否進(jìn)行礦物顆粒偏光序列圖像消光位校正實(shí)驗(yàn)結(jié)果對(duì)比Tab.4 Whether to carry out the comparison of the experimental results of the extinction position correction of the polarized sequence images of mineral particles %
由表4 可以發(fā)現(xiàn),對(duì)礦物顆粒偏光序列圖像進(jìn)行消光位校正,4 類(lèi)巖石礦物顆粒的最終識(shí)別率都得到了一定的提升,經(jīng)過(guò)消光位校正后,輸入到雙向GRU 門(mén)控單元的序列圖像特征保持了很好的一致性,更有利于網(wǎng)絡(luò)學(xué)習(xí)序列前后圖像的自身特征信息以及關(guān)聯(lián)信息。
使用基礎(chǔ)的SKnet 替換本文提出的改進(jìn)的SKnet 后,對(duì)4 種巖石礦物顆粒的識(shí)別率都產(chǎn)生了一定的影響,說(shuō)明本文利用特征融合優(yōu)化后的SKnet 特征提取模塊,更有效地提取出想要的特征信息,進(jìn)一步降低了誤識(shí)別的概率。雙向GRU 門(mén)控單元可以更好的學(xué)習(xí)巖石礦物顆粒偏光序列圖的序列信息,堿性長(zhǎng)石、斜長(zhǎng)石、巖屑礦物顆粒的識(shí)別率都得到了提升。
為了更有效地完成巖石薄片偏光序列圖的顆粒成分的分析工作,本文提出了一種結(jié)合改進(jìn)的SKnet 和雙向GRU 的巖石薄片正交偏光序列圖像礦物顆粒分類(lèi)方法。首先,利用已有分割方法,從巖石薄片正交偏光序列圖像中提取出石英、堿性長(zhǎng)石、斜長(zhǎng)石、巖屑4 類(lèi)巖石礦物顆粒圖像,對(duì)提取出的礦物顆粒序列圖做消光位校正處理,將消光位校正后的序列圖作為輸入數(shù)據(jù)進(jìn)行訓(xùn)練;其次,利用改進(jìn)的SKnet 網(wǎng)絡(luò)結(jié)合具有記憶的雙向GRU 循環(huán)神經(jīng)網(wǎng)絡(luò),加強(qiáng)對(duì)礦物顆粒序列圖中序列特征的提取。本文的方法在已有的數(shù)據(jù)集上表現(xiàn)良好,最終4 類(lèi)巖石礦物顆粒的識(shí)別率都達(dá)到95%以上,總體的識(shí)別率為97.25%,優(yōu)于已有的巖石礦物顆粒識(shí)別分類(lèi)方法。但本文只針對(duì)巖石薄片中相對(duì)較多的4 種巖石礦物顆粒進(jìn)行了分類(lèi)識(shí)別,在實(shí)際石油地質(zhì)開(kāi)采工作中,巖石礦物顆粒的種類(lèi)十分豐富,在后續(xù)的工作中可以繼續(xù)探索更多巖石礦物顆粒類(lèi)別下的識(shí)別分類(lèi)方法。