章 華 王 靜 黃小平 金 建 閃靜潔
(安徽新華學院電子通信工程學院 安徽合肥 230088)
煤是重要能源,是工業(yè)生產(chǎn)的重要原料,但近年來,煤礦事故頻發(fā),且多發(fā)生在采掘工作面,為了減少煤礦事故,保證煤礦的安全生產(chǎn),必須減少采掘現(xiàn)場的工作人員。目前已經(jīng)實現(xiàn)了煤的無人自動切割,但是井下除了煤還有巖石,所以要真正實現(xiàn)采掘工作面無人開采,煤巖識別則是實現(xiàn)無人采煤的關(guān)鍵技術(shù)之一[1]。同時,實現(xiàn)煤巖自動識別,能夠避免采煤機切割巖石,降低切割機的磨損率,降低煤中含矸量,減少丟煤、提高資源產(chǎn)出率。
本文提出的利用圖像技術(shù)進行煤巖識別,是基于卷積神經(jīng)網(wǎng)絡(luò)的煤巖石識別。以往的圖像識別都是通過圖像預處理提取煤和巖石的特征,再進行分類識別。本方法無需預復雜的圖像處理,可直接輸入圖像,克服傳統(tǒng)的圖像分類識別需要人工提取特征的缺點。把原始圖像作為輸入,進而學習相應的特征[2]。
卷積神經(jīng)網(wǎng)絡(luò),簡稱CNN,是一種前饋神經(jīng)網(wǎng)絡(luò),對于一些大型的圖像處理表現(xiàn)突出[3]。其網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、卷積層、下采樣層、全連接層和輸出層,如圖1所示。其中,卷積層可以和下采樣層一起組成多個卷積組,對圖像進行逐層提取特征,最后通過全連接層完成圖像的分類識別。卷積層可以認為是受局部感受野啟發(fā)完成響應的操作。下采樣層的作用則主要是為了降低數(shù)據(jù)維度。總的來講,卷積神經(jīng)網(wǎng)絡(luò)通過卷積來區(qū)分特征,且通過卷基層的權(quán)值共享和下采樣層的池化來減小整個網(wǎng)絡(luò)參數(shù)的數(shù)量級,最后利用傳統(tǒng)神經(jīng)網(wǎng)絡(luò)完網(wǎng)絡(luò)結(jié)構(gòu)如下圖1所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)模型
(一)卷積層。卷積層的主要作用是學習輸入的特征表示。由幾個特征圖(feature maps)組成。每個特征圖的神經(jīng)元和與它前一層的臨近神經(jīng)元相連,形成一個局部感知野。一般要計算一個新的特征圖,則輸入特征圖首先要與一個學習好的卷積核做卷積,卷積核被稱為濾波器,又叫做特征檢測器,卷積后再將結(jié)果傳遞給一個非線性激活函數(shù)。與不同的卷積核卷積得到新的不同特征圖。其中,生成一個特征圖的核是相同的,即權(quán)值共享,這樣的權(quán)值共享模式能夠降低模型的復雜度,能夠使得網(wǎng)絡(luò)更加容易訓練。而激活函數(shù)用來描述卷積神經(jīng)網(wǎng)絡(luò)的非線性度,其檢測多層網(wǎng)絡(luò)非線性特征非常準確。典型的激活函數(shù)有sigmoid、tanh[4]。
(二)下采樣層。下采樣層的作用是實現(xiàn)空間不變,其主要途徑是是降低特征圖的分辨率。下采樣層通常處在兩個卷積層之間。每個下采樣層的特征圖是和與它對應的的前一個卷積層的特征圖相連的,所以,其特征圖的數(shù)量是相同的。一般將幾個卷積層和下采樣層進行疊加起來就可以實現(xiàn)更抽象的特征表示提取[5]。通過下面的公式,每個輸入特征圖下采樣得到輸出特征圖。
其中,下采樣層1的第j個通道的凈激活是ulj,該凈激活由前一層輸出特征圖xl-1j進行下采樣和偏置求得,β表示下采樣層所占的權(quán)重系數(shù),而blj則表示下采樣層的偏置項。down(·)是下采樣函數(shù),該函數(shù)首先利用滑動窗口法將輸入特征圖xl-1j劃分為多個不重疊的n×n圖像塊。再對每個圖像塊內(nèi)的像素進行求和、求平均值或者求最大值,就這樣,輸出圖像在兩個維度上都縮小了n倍。
(三)全連接層。全連接層的作用是對原始圖像的一種高級抽象。是在卷積層和下采樣層處理之后,將所有的神經(jīng)元與當前層的每個神經(jīng)元連接在一起,也就是與標準神經(jīng)網(wǎng)絡(luò)之間的各層進行相連接。在全連接網(wǎng)絡(luò)中,所有二維的特征圖最后會被拼接為一維特征而作為全連接網(wǎng)絡(luò)的輸入。全連接層1的輸出可通過對輸入加權(quán)求和并通過相應的激活函數(shù)響應得到[6]。
其中,ul稱為全連接層1的凈激活,它由前一層輸出特征圖xl-1進行加權(quán)和偏置后達到。wl是全連接網(wǎng)絡(luò)的權(quán)重系數(shù),bl是全連接層1的偏置項。
本研究所設(shè)計的卷積神經(jīng)網(wǎng)絡(luò)主要由2個卷積層、2個下采樣層和一個全連接層組成,取卷積核為5*5,池化矩陣的大小為4*4。卷積神經(jīng)網(wǎng)絡(luò)在分類過程中的的工作流程,包括訓練過程、測試過程以及驗證過程三大部分,在進行分類識別之前,為了提高處理速度以及規(guī)范輸入樣本;對圖像進行簡單的預處理,包括圖像的灰度化和數(shù)據(jù)的歸一化操作。圖2是卷積神經(jīng)網(wǎng)絡(luò)提取特征的過程,輸入的圖像大?。ㄏ袼兀?00*500,第一個卷積層(C1)通過在特征空間重構(gòu)可獲得6個大小為496*496特征映射C1,再經(jīng)過下采樣層(S1)的池化作用后又得到的6個特征映射,其大小為124*124。下采樣層S1的特征映射再經(jīng)過卷積之后得到含有12個大小為120*120的特征映射的C2。卷積層C2通過池化作用后得到含有12個大小為30*30的特征映射S2。
圖2 卷積神經(jīng)網(wǎng)絡(luò)圖像特征提取過程
實驗全部在MatLab2018環(huán)境下完成,windows10操作系統(tǒng),intel core CPU。主頻3.30GHz、內(nèi)存8GB。本文實驗所用圖像均取自井下采煤現(xiàn)場,是通過在采煤機上安裝攝像頭獲取,圖像大小500*500,其中煤的圖像1000張,巖石圖像1000張,分別從煤和巖石的圖像中各取800張作為測試集,并將剩余的200張煤的圖像和200張巖石圖像作為訓練集,再從總體樣本2000幅圖像中隨機選取1000張圖像作為最后訓練過程中的驗證集,得到的實驗結(jié)果如表1所示,煤巖識別的準確率達到98.9%。
表1 基于卷積神經(jīng)網(wǎng)絡(luò)的煤巖分類識別實驗結(jié)果
本文結(jié)合煤礦實際,突出煤巖識別的重要性,提出了利用卷積神經(jīng)網(wǎng)絡(luò)識進行煤巖識別的新方法。對獲取的煤和巖石圖像進行訓練、測試和驗證,最后所得到的結(jié)果與實際相符,充分說明了該方法對煤巖識別的準確性,有一定的推廣應用價值前景。