楊靜嫻 ,任小洪
(1.四川輕化工大學(xué) 人工智能四川省重點(diǎn)實(shí)驗(yàn)室,四川宜賓 644000;2.四川輕化工大學(xué) 自動(dòng)化與信息工程學(xué)院,四川宜賓 644000)
在傳統(tǒng)摘酒工藝中,工人需要不斷觀測(cè)在酒甑蒸餾器出酒口接入酒桶時(shí)所形成的表面酒花大小形態(tài)及其分布,適時(shí)進(jìn)行白酒的分級(jí)摘取,這種“看花摘酒”的方法在現(xiàn)代白酒工藝中仍廣泛應(yīng)用。如何實(shí)現(xiàn)“看花摘酒”過(guò)程的自動(dòng)化、智能化已成為智能釀造亟需解決的難題。采用視覺(jué)傳感器獲取接酒器(桶)中不斷形成的酒花的視頻圖像,然后通過(guò)圖像分析處理技術(shù),實(shí)時(shí)提取白酒摘酒過(guò)程中酒花圖像的各類特征進(jìn)行識(shí)別分類的智能方法,具有方便快捷、判斷依據(jù)穩(wěn)定的優(yōu)點(diǎn),是實(shí)現(xiàn)大規(guī)模智能摘酒的關(guān)鍵技術(shù),對(duì)白酒工藝智能化發(fā)展有著重要意義[1-3]。
楊靜嫻等[4]通過(guò)OTSU與Canny邊緣檢測(cè)相結(jié)合,討論了白酒摘酒酒花輪廓提取的方法。這種方法能夠提取酒花的輪廓信息。在白酒摘酒過(guò)程中,輪廓信息中包含的酒花的尺寸、數(shù)量信息具有變化不確定性,單一的輪廓信息無(wú)法得出確切的酒花分類標(biāo)準(zhǔn)。因此,需要對(duì)白酒摘酒酒花圖像提取相對(duì)平穩(wěn)的特征值作為摘酒分級(jí)的標(biāo)準(zhǔn)。
在白酒摘酒過(guò)程中,酒花圖像的變化快速,但酒花圖像中紋理清晰,不同等級(jí)酒花在紋理形態(tài)上存在差別。因此,提取酒花的紋理特征能夠細(xì)致的進(jìn)行圖像的特征描述[5-8]。通過(guò)對(duì)酒花圖像提取不同的紋理特征并定量分析得到分類依據(jù),結(jié)合支持向量機(jī)(Support Vector Machine,SVM)的方法使酒花識(shí)別分類的結(jié)果更加準(zhǔn)確且有據(jù)可依[9-10]。
為此,本文提出基于局部二值模式(Local Binary Patterns,LBP)與灰度共生矩陣(Gray-level co-occurrence matrix,GLCM)的白酒摘酒酒花紋理特征提取方法,構(gòu)造不同的SVM分類器實(shí)現(xiàn)對(duì)不同等級(jí)酒花圖像的分類識(shí)別,通過(guò)視覺(jué)圖像方法實(shí)現(xiàn)白酒摘酒工藝的智能化轉(zhuǎn)變[11-17]。
LBP算法是一種描述像素點(diǎn)之間灰度關(guān)系的局部特征的非參數(shù)算法。在LBP的傳統(tǒng)算法與改進(jìn)算法中,是通過(guò)以定義的窗口中心點(diǎn)像素值為閾值,將相鄰任意領(lǐng)域范圍的多個(gè)像素點(diǎn)像素值與之進(jìn)行比較,若領(lǐng)域中點(diǎn)像素值大于中心點(diǎn)像素值,則標(biāo)記為1,反之標(biāo)記為0。不同的領(lǐng)域信息被標(biāo)記成不同的二進(jìn)制數(shù),通常將這些二進(jìn)制數(shù)轉(zhuǎn)換成十進(jìn)制數(shù),這樣便生成了LBP編碼值,這些數(shù)字可以用來(lái)反映圖像在這個(gè)區(qū)域的紋理特征[18-20]。
傳統(tǒng)的LBP算法是在3*3的正方形領(lǐng)域范圍,中心像素點(diǎn)周圍有8個(gè)像素點(diǎn),可以生成8位二進(jìn)制數(shù),共有256種LBP十進(jìn)制數(shù)碼。
式中 (xc、yc)——中心點(diǎn)像素坐標(biāo);
ip——相鄰點(diǎn)像素灰度值;
ic——中心點(diǎn)像素灰度值;
R——半徑;
P——采樣點(diǎn)數(shù)目。
1.2.1 旋轉(zhuǎn)不變模式LBP
傳統(tǒng)LBP算法的缺點(diǎn)在于只能覆蓋固定的一個(gè)小范圍,不能滿足對(duì)圖像紋理特征描述的需求。為了適應(yīng)不同程度的紋理特征需求,OJALA等對(duì)算法進(jìn)行改進(jìn),將傳統(tǒng)的3*3鄰域擴(kuò)展到任意鄰域,將方形鄰域改進(jìn)為圓形鄰域。改進(jìn)后的LBP圓形算法在允許以半徑為R圓形鄰域內(nèi)有任意多的像素點(diǎn)。一般有以下幾種采樣模式,為L(zhǎng)BP(1,8)、LBP(2,16)、LBP(2,8)等。
LBP(1,8)意為在半徑為1的圓形鄰域選擇8個(gè)采樣點(diǎn)計(jì)算中心像素點(diǎn)的LBP編碼值。
對(duì)于選定的采樣點(diǎn)數(shù)目P,傳統(tǒng)的LBP算法能輸出2p個(gè)編碼值,在每一個(gè)LBP編碼值中選取一個(gè)圍繞中心像素點(diǎn)轉(zhuǎn)動(dòng),在多次轉(zhuǎn)動(dòng)的過(guò)程中就會(huì)產(chǎn)生多種不同的結(jié)果。因此,這些結(jié)果中最小的LBP值就被定義為旋轉(zhuǎn)不變LBP值,用ri表示,ROR(x,i)表示對(duì)x編碼值循環(huán)按位右移i次。旋轉(zhuǎn)不變模式LBP一共有36維。
1.2.2 等價(jià)模式LBP
為了改進(jìn)LBP紋理提取維數(shù),OJALA等提出了一種等價(jià)LBP算法,通過(guò)降維的方法,限制二進(jìn)制模式從1到0或從0到1的跳變次數(shù)為2,重新統(tǒng)計(jì)灰度數(shù)據(jù)。試驗(yàn)證明不屬于灰度不變等價(jià)LBP特征的占LBP特征的85%~90%,而等價(jià)LBP只有58個(gè)。所以,等價(jià)模式LBP只有58維編碼值,實(shí)際應(yīng)用59維編碼值,加上的1維編碼值代表不是等價(jià)LBP的特征向量,用u2表示。這樣的特征向量不會(huì)丟失任何紋理信息,并且可以減少高頻噪聲帶來(lái)的影響。
1.2.3 旋轉(zhuǎn)不變等價(jià)模式LBP
LBP算法只是灰度尺度不隨任何單一的變化而變化,光照變化基本不會(huì)對(duì)特征描述產(chǎn)生影響,但是圖像旋轉(zhuǎn)會(huì)對(duì)LBP的值產(chǎn)生影響。基于這一特點(diǎn),MAENPAA等在旋轉(zhuǎn)不變模式LBP算法基礎(chǔ)上提出了旋轉(zhuǎn)不變等價(jià)模式LBP算法,此算法通過(guò)不斷旋轉(zhuǎn)圓形領(lǐng)域得到一系列初始定義的LBP值,取其中最小的值作為該像素點(diǎn)的LBP值,LBP模式在此時(shí)降為36維,并在此基礎(chǔ)上控制跳變次數(shù)為2,再次重新統(tǒng)計(jì)灰度數(shù)據(jù)。此時(shí)旋轉(zhuǎn)不變等價(jià)模式LBP只有10維LBP參量,用riu2表示。
基于統(tǒng)計(jì)的紋理特征方法是利用像素及其周圍空間領(lǐng)域的灰度進(jìn)行紋理特征統(tǒng)計(jì),方法可以統(tǒng)計(jì)像素的一階、二階以及更高階的特征。此統(tǒng)計(jì)方法中,最為經(jīng)典的便是灰度共生矩陣,是對(duì)特定方向、特定距離的量像素具有特定的灰度情況進(jìn)行統(tǒng)計(jì)得到。
GLCM 中對(duì)方向的取值一般為 0°、45°、90°、135°,d 為中心像元,取值一般為 1、2、3、4 等。通過(guò)對(duì)4個(gè)方向求出不同的特征值再進(jìn)行求均值計(jì)算得到灰度共生矩陣各參數(shù)?;叶裙采仃嚨碾A數(shù)與圖像灰度值的階數(shù)相同,當(dāng)灰度圖像灰度階數(shù)為N時(shí),灰度共生矩陣為N*N的矩陣。通過(guò)灰度共生矩陣方法可以得到不同的特征參數(shù),其中最有代表性的特征參數(shù)是能量(Angular Second Moment,ASM)、 對(duì) 比 度(Contrast,CON)、 熵(Entropy,ENT)、相關(guān)性(Correlation,COR)和逆差 矩(Inverse Different Moment,IDM)[21-25]。 各表達(dá)式分別:
(1)能量是對(duì)圖像紋理灰度變化的度量,反映圖像灰度分布均勻程度和紋理粗細(xì)程度。能量值越大,表示圖像紋理變化越均勻和規(guī)則;能量值越小,表示紋理變化越復(fù)雜。
(2)對(duì)比度是灰度共生矩陣主對(duì)角線附近的慣性矩,能夠體現(xiàn)矩陣中的值的分布特點(diǎn),反映了圖像中各個(gè)部分紋理的清晰度和紋理溝紋的深淺度。
(3)熵反映了圖像紋理的隨機(jī)性,熵值與能量值相反,當(dāng)紋理越均勻和規(guī)則時(shí),熵值越??;紋理越復(fù)雜時(shí),熵值越大,見式(3)。
(4)相關(guān)度反映了圖像局部的灰度相關(guān)性,體現(xiàn)了灰度共生矩陣元素在行或列方向上的相似程度,當(dāng)矩陣中元素分布均勻時(shí),相關(guān)度就越大;元素分布分散時(shí),相關(guān)度越小,見式(4)。
(5)逆差矩反映圖像紋理的同質(zhì)性,對(duì)圖像局部紋理變化的大小進(jìn)行度量。不同區(qū)域間紋理變化少,紋理非常均勻時(shí),逆差矩值越大(式5)。
在白酒摘酒過(guò)程中,傳統(tǒng)摘酒工藝一般將酒花分為以下3類,見表1。在不同的白酒釀造廠中,對(duì)白酒分級(jí)為區(qū)間范圍,沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)。以下白酒酒花分類以及酒度以進(jìn)行數(shù)據(jù)采集的白酒廠為例。
表1 白酒酒花分類Tab.1 Classification of liquor hops 單位:(%)
通過(guò)在宜賓某傳統(tǒng)工藝白酒釀造廠進(jìn)行白酒摘酒圖像采集,經(jīng)過(guò)釀酒師傅的指導(dǎo),分別獲取白酒摘酒過(guò)程中各段酒花的原始數(shù)據(jù)。通過(guò)人工分割視頻的方法,在酒花差別較明顯的3段酒的中間部分分別進(jìn)行數(shù)據(jù)采集,獲取大清花、小清花、油花3種白酒摘酒類別的試驗(yàn)圖像各74張,共222張酒花圖片,并進(jìn)行圖像預(yù)處理。將可能產(chǎn)生影響的大部分背景通過(guò)選取感興趣區(qū)域(Region of Interest,ROI)進(jìn)行試驗(yàn)預(yù)處理,保存大部分酒花圖像進(jìn)行紋理特征提取以及圖像分類識(shí)別。其中3類酒花各60張作為訓(xùn)練樣本,各14張作為測(cè)試樣本。選取3類酒花試驗(yàn)圖像各1張,如圖1所示。
圖1 白酒酒花試驗(yàn)數(shù)據(jù)Fig.1 Liquor hops experimental data
大清花與小清花階段的白酒出酒量大于油花階段的出酒量,在這部分中產(chǎn)生的圖像差異是普遍現(xiàn)象。對(duì)實(shí)際摘酒過(guò)程中進(jìn)行酒花圖像采集時(shí),當(dāng)固定相機(jī)位置與光照角度不同時(shí),會(huì)造成酒花圖像中部分的背景不同。因此在進(jìn)行酒花分析時(shí),將這部分的差異作為酒花圖像分析中的正常差異。
LBP進(jìn)行圖像特征提取具體分為兩步:第一步是圖像灰度化,第二步是對(duì)編碼值進(jìn)行統(tǒng)計(jì)。在本文中,針對(duì)已經(jīng)介紹的3種LBP方法進(jìn)行特征值提取,分別是旋轉(zhuǎn)不變模式LBP、等價(jià)模式LBP和旋轉(zhuǎn)不變等價(jià)模式LBP。
分別對(duì)白酒摘酒過(guò)程中的大清花、小清花、油花圖像進(jìn)行3種模式LBP編碼值統(tǒng)計(jì)得到以下各類酒花的3種LBP特征圖,如圖2所示。
圖2 LBP特征圖Fig.2 LBP characteristic diagram
在圖2的各LBP特征圖中,x軸為L(zhǎng)BP編碼值,y軸表示歸一化后各不同編碼值出現(xiàn)的頻次,次數(shù)的總和是圖像的張數(shù)。通過(guò)分別對(duì)比在不同LBP模式中大清花、小清花、油花的特征圖可以得出,在等價(jià)模式LBP特征圖中,特征編碼進(jìn)行歸一化后的值大多都低于0.2,沒(méi)有出現(xiàn)大范圍值偏大。即相比于旋轉(zhuǎn)不變模式LBP與旋轉(zhuǎn)不變等價(jià)模式LBP,等價(jià)模式LBP的特征提取效率更高。
在使用GLCM進(jìn)行紋理特征提取時(shí),首先將圖像進(jìn)行灰度化處理,然后進(jìn)行灰度級(jí)量化,選擇參數(shù)方向分別為 0°、45°、90°、135°,步距均為 1,分別對(duì)能量、對(duì)比度、熵、相關(guān)性和逆差矩進(jìn)行特征值計(jì)算,最后對(duì)4個(gè)角度的值進(jìn)行均值計(jì)算得到分類算法的輸入矩陣。
在試驗(yàn)中,3類酒花的訓(xùn)練樣本各60個(gè)。分別對(duì)各個(gè)樣本進(jìn)行特征值計(jì)算,并將訓(xùn)練類3類酒花樣本在每特征值的數(shù)據(jù)進(jìn)行比較對(duì)比,如圖3所示。
圖3 GLCM特征值參數(shù)對(duì)比Fig.3 Comparison of GLCM feature value parameters
通過(guò)特征值參數(shù)圖像對(duì)比可以清晰地看出,3類酒花的能量、對(duì)比度、熵、相關(guān)性和逆差矩的特征值、均值存在比較清晰的差別,故灰度共生矩陣的特征值均值適合作為SVM分類標(biāo)準(zhǔn)。
本文采用支持向量機(jī)(SVM)作為酒花分類識(shí)別的分類器。酒花分為3類,采用一對(duì)多分類,構(gòu)造出兩個(gè)分類器,先用分類器1將大清花與小清花、油花進(jìn)行分類,再用分類器2將小清花與油花進(jìn)行分類。分類器核函數(shù)使用了3種進(jìn)行對(duì)比,分別是線性核(Linear Kernel)、多項(xiàng)式核(Polynomial Kernel)和徑向基核函數(shù)(Radial Basis Function),并進(jìn)行3種分類結(jié)果的對(duì)比。
在試驗(yàn)中分別通過(guò)LBP和GLCM紋理特征進(jìn)行酒花分類。對(duì)3類共180張酒花圖片進(jìn)行紋理特征提取后分類訓(xùn)練,再對(duì)42張測(cè)試圖片進(jìn)行分類并進(jìn)行準(zhǔn)確率的計(jì)算。
對(duì)LBP(1,8)3種算法提取的紋理特征均進(jìn)行SVM分類得到以下識(shí)別結(jié)果,如表2所示。
表2 LBP特征提取分類結(jié)果Tab.2 LBP feature extraction and classification results 單位:(%)
通過(guò)對(duì)比可得,在對(duì)不同LBP模式下所得特征進(jìn)行分類時(shí),采用旋轉(zhuǎn)不變模式LBP與等價(jià)模式LBP進(jìn)行分類效果較好,SVM核函數(shù)為線性核與多項(xiàng)式核時(shí)對(duì)3類酒花的分辨率達(dá)到95%以上,等價(jià)模式LBP達(dá)到了100%。這與之前關(guān)于LBP特征圖的分析結(jié)果一致,等價(jià)模式LBP對(duì)白酒圖像特征描述更加細(xì)致,能夠得到很好的分類準(zhǔn)確率。
對(duì)GLCM紋理特征提取出的5個(gè)特征值分別采用單個(gè)和多個(gè)特征作為SVM分類器的輸入進(jìn)行分類,得到以下分類結(jié)果,如表3所示。
表3 GLCM特征提取分類結(jié)果Tab.3 GLCM feature extraction and classification results 單位:(%)
通過(guò)不同試驗(yàn)對(duì)比可得,選擇不同的SVM核函數(shù)與特征組合方式對(duì)白酒酒花分類準(zhǔn)確率會(huì)產(chǎn)生不同程度的影響。在選擇單一的特征值作為分類器輸入時(shí),分類率的準(zhǔn)確率并不穩(wěn)定,且普遍較低。當(dāng)核函數(shù)為線性核函數(shù)時(shí),單一特征分類率均較低,增加特征值數(shù)目進(jìn)行組合,其最高分類率也只能達(dá)到90.5%;當(dāng)核函數(shù)為多項(xiàng)式時(shí),采用兩種及以上特征作為輸入時(shí),分類率均高于95%,在特征數(shù)目變多時(shí),出現(xiàn)部分分類率下降,但基本保持在95%以上;當(dāng)核函數(shù)為徑向基核函數(shù)時(shí),選取除單一相關(guān)性以外的不同的特征組合均能得到95%以上的分類率,特征數(shù)目越多,得到的分類準(zhǔn)確率也越高,試驗(yàn)中分類率可以達(dá)到100%,但存在不穩(wěn)定性。
將LBP與GLCM紋理特征提取進(jìn)行特征級(jí)融合進(jìn)行SVM分類[26-30]。根據(jù)對(duì)LBP紋理特征的對(duì)比以及分類結(jié)果的分析,在LBP+GLCM特征分類試驗(yàn)中選取等價(jià)模式LBP與GLCM特征值進(jìn)行融合處理,得到不同的矩陣作為SVM分類器的輸入,試驗(yàn)中對(duì)核函數(shù)的選擇也為3種,試驗(yàn)結(jié)果如表4所示。
表4 LBP+GLCM特征提取分類結(jié)果Tab.4 LBP+GLCM features extraction and classification results 單位:(%)
通過(guò)對(duì)比 LBP、GLCM、LBP+GLCM 3種方法可得,LBP選擇等價(jià)模式,GLCM選擇兩種特征值、SVM核函數(shù)選擇多項(xiàng)式核函數(shù)分類準(zhǔn)確率能夠得到97%以上。LBP+GLCM能改進(jìn)在選取單個(gè)或多個(gè)GLCM特征值組合時(shí)的分類率,準(zhǔn)確率均有上升,在核函數(shù)選取為線性核函數(shù)和多項(xiàng)數(shù)核函數(shù)時(shí),達(dá)到了100%的分類準(zhǔn)確率。因此,對(duì)LBP與GLCM紋理特征進(jìn)行特征級(jí)融合進(jìn)行分類效果最好,且分類效果穩(wěn)定性最高。
本文提出的白酒摘酒特征提取以及分類算法,利用LBP與GLCM相結(jié)合,提取多個(gè)特征值并進(jìn)行特征級(jí)融合,采用支持向量機(jī)方法,實(shí)現(xiàn)了在白酒摘酒過(guò)程中對(duì)3類酒花的分類。試驗(yàn)結(jié)果表明,通過(guò)白酒摘酒酒花圖像對(duì)白酒摘酒過(guò)程進(jìn)行分析的方法是可行的,具有較好的穩(wěn)定性與準(zhǔn)確性,能夠得到較高分類準(zhǔn)確率。在后續(xù)的研究中,可以選取不同的特征提取方法以及不同算法的分類器進(jìn)行分類研究,對(duì)比選取出最佳的白酒摘酒酒花的分類方法,利用其實(shí)現(xiàn)的特征數(shù)據(jù)分類,設(shè)計(jì)出控制系統(tǒng),利用機(jī)器視覺(jué)進(jìn)行酒花分類和白酒摘酒分級(jí)。從而實(shí)現(xiàn)白酒摘酒的自動(dòng)化和智能化。