魏凡其
(江西制造職業(yè)技術(shù)學(xué)院信息工程學(xué)院 江西 南昌 330095)
圖像識(shí)別技術(shù)可將被識(shí)別的對(duì)象歸入相應(yīng)的類型,被廣泛應(yīng)用于各個(gè)領(lǐng)域[1]。通過對(duì)圖像特征的轉(zhuǎn)向提取,感知圖像特點(diǎn),劃分圖像類別。多媒體彩色圖像是人們獲取信息的最重要途徑,圖像語言能夠傳達(dá)給人們更直觀的視覺感受,在某種程度上更勝于文字語言[2]。根據(jù)統(tǒng)計(jì),超過75%的信息是由視覺系統(tǒng)獲取的,即通過多媒體彩色圖像傳播的。如何發(fā)揮多媒體彩色圖像在各個(gè)領(lǐng)域中的更高效能,成為科研工作的關(guān)注與研究重點(diǎn)。為落實(shí)此項(xiàng)工作,實(shí)現(xiàn)對(duì)多媒體彩色圖像的精準(zhǔn)識(shí)別與高效感知,本文引進(jìn)灰度編碼技術(shù),設(shè)計(jì)一種多媒體彩色圖像的高效識(shí)別方法。
為實(shí)現(xiàn)對(duì)多媒體彩色圖像的精準(zhǔn)識(shí)別,利用灰度編碼技術(shù)轉(zhuǎn)換圖像灰度。首先明確多媒體彩色圖像的色彩空間表現(xiàn)方式為RGB,將圖像錄入計(jì)算機(jī)后,可以用顯示屏幕上的24位真彩構(gòu)建圖像RGB模型。其次將原始圖像的色彩劃分為R、G、B三種原光色,每個(gè)光色在終端占用8bit[3]。最后為滿足人眼對(duì)多媒體彩色圖像的識(shí)別,在色彩空間中,設(shè)置一個(gè)任意光色,將其表示為Y,Y可以通過下述公式計(jì)算得到。
式(1)中:a、b、c表示三條信道的空間顏色占比。當(dāng)a=b=c時(shí),多媒體彩色圖像將呈現(xiàn)灰度陰影狀態(tài);當(dāng)R=G=B時(shí),多媒體彩色圖像呈現(xiàn)純白色或純黑色。使用灰度編碼技術(shù),將RGB模型按照HIS坐標(biāo)進(jìn)行轉(zhuǎn)換,將LAB色彩表現(xiàn)模式作為中介,明確圖像的LAB模式是一種全新的色彩模式,在此種模式下,L表示圖像呈現(xiàn)亮度;A表示圖像中色彩從紅色到綠色的過渡范圍;B表示圖像中黃色到藍(lán)色的過渡范圍[4]。可以使用LAB模式表示多媒體彩色圖像中的任意一種顏色,任何顏色都可以映射到此空間中[5]。
轉(zhuǎn)化處理過程中,按照標(biāo)準(zhǔn)將圖像的RGB色彩轉(zhuǎn)換為LAB模式,對(duì)原始圖像進(jìn)行去色處理后,再將圖像返回RGB表示方式,生成一種多媒體圖像的等值灰度階級(jí),根據(jù)圖像的階級(jí),確定當(dāng)前狀態(tài)下圖像的灰度值。通過此種方式,使多媒體彩色圖像的灰度處理過程簡易化[6]。
引進(jìn)Gabor小波處理法提取多媒體彩色圖像紋理特征[7]。目前,可用于描述圖像紋理特征的內(nèi)容包括幾何特征、混合特征、紋理特征與序列特征。其中紋理特征中的Gabor小波特征,可以直接反映出時(shí)域與頻域內(nèi)的頻譜信息。調(diào)整多媒體彩色圖像中的頻譜信息,可以起到強(qiáng)化圖像低頻信息的效果,以此種方式,實(shí)現(xiàn)對(duì)圖像呈現(xiàn)效果的視覺優(yōu)化。在此過程中,使用二維Gabor濾波器中的高斯核函數(shù),處理圖像在傳播過程中的正弦平面波,通過此種方式,實(shí)現(xiàn)對(duì)圖像中局部特征信息的專項(xiàng)提取[8]??紤]到多媒體彩色圖像在空間中的旋轉(zhuǎn)方式、尺寸變化、形變等行為存在一定的容錯(cuò)能力。計(jì)算其容錯(cuò)能力,公式如下。
式(2)中:ψ表示多媒體彩色圖像在空間中的容錯(cuò)能力;k表示特征波向量;T表示容錯(cuò)周期;σ表示變換尺度;e表示形變量。其中特征波向量k的計(jì)算公式如下。
式(3)中:u表示Gabor濾波器的濾波處理方向;v表示Gabor濾波器的濾波處理尺度。在此基礎(chǔ)上,定義多媒體彩色圖像表示為I(X,Y),使用Gabor濾波器對(duì)圖像I(X,Y)進(jìn)行卷積運(yùn)算處理,通過此種方式,得到針對(duì)多媒體彩色圖像在不同空間位置與不同尺度下的特征值[9]。此過程如下計(jì)算公式所示。
通過上述卷積運(yùn)算,掌握?qǐng)D像在不同幀數(shù)下的復(fù)數(shù)值,將此數(shù)值作為多媒體彩色圖像的幅值信息。輸入圖像大小為60×60,使用Gabor濾波器對(duì)圖像特征提取,得到28 800維度的數(shù)據(jù)。對(duì)具有雷同點(diǎn)的特征信息融合處理,采用降維處理的方式,降低特征數(shù)據(jù)的維度。
設(shè)定多媒體彩色圖像樣本數(shù)量為N,每個(gè)類別的圖像中都存在p個(gè)訓(xùn)練樣本,可以將訓(xùn)練樣本p劃分為i類,其中i的取值為1,2,3,4,5,…,N,設(shè)定訓(xùn)練圖像的空間大小為a*b,將圖像置于一個(gè)線性子空間內(nèi),使用臨近分類器,對(duì)多媒體彩色圖像進(jìn)行線性回歸分析處理。將多媒體彩色圖像按照原來的尺寸縮小到600×600以下。為避免圖像尺寸太大影響到運(yùn)算的速度,所以在圖像識(shí)別前先對(duì)其預(yù)處理。針對(duì)圖像中的文字特征,在計(jì)算灰度共生矩陣之前,提取圖像對(duì)比度,以獲得更好的紋理識(shí)別參數(shù)[10]。此過程如下計(jì)算公式所示。
式(5)中:L表示圖像灰度共生矩陣;P表示多媒體彩色圖像對(duì)比度。在此基礎(chǔ)上,利用GDI+中的函數(shù)對(duì)圖像壓縮,將樣本圖像合并為24×18的圖像集。根據(jù)上述灰度編碼方法對(duì)已壓縮的圖像進(jìn)行灰度處理。在此基礎(chǔ)上,采用9點(diǎn)光滑法和25點(diǎn)光滑法對(duì)灰度圖像模糊處理。前者是將3×3矩陣作為平滑模板,以模板的平均灰度取代原始像素點(diǎn),后者是指將5×5矩陣作為平滑模板,以模板的平均灰度取代原始像素點(diǎn)。該方法基于兩個(gè)像素點(diǎn)間的不同色彩成分與不同亮度,將處理后的圖像錄入Hamming網(wǎng)絡(luò)中,用于樣本識(shí)別。通過識(shí)別訓(xùn)練樣本,確定剔除邊界像素點(diǎn)之后的22×16灰度矩陣。將灰度矩陣作為參照,實(shí)現(xiàn)對(duì)彩色圖像的識(shí)別。
上文完成了基于灰度編碼的圖像識(shí)別方法設(shè)計(jì),為驗(yàn)證設(shè)計(jì)方法在實(shí)際應(yīng)用中的效果,下面將采用對(duì)比實(shí)驗(yàn)的方式,對(duì)設(shè)計(jì)方法展開測試。
考慮到圖像識(shí)別過程涉及大量的圖像預(yù)處理步驟,要確保圖像的規(guī)范化處理,應(yīng)在測試前,根據(jù)相關(guān)工作的實(shí)際需求,搭建計(jì)算機(jī)測試環(huán)境,用于處理圖像。測試環(huán)境技術(shù)參數(shù)如下表1所示。
表1 圖像預(yù)處理環(huán)境技術(shù)參數(shù)
完成多媒體彩色圖像預(yù)處理過程中需求工具的選擇后,考慮到實(shí)驗(yàn)需求,選擇國家公開圖像庫中的多媒體彩色圖像作為此次實(shí)驗(yàn)的測試樣本。此圖像庫中規(guī)格最大的圖像為116×156,規(guī)格最小的圖像為201×311。部分樣例圖像如下圖1所示。
圖1 公開圖像庫中的部分多媒體彩色圖像樣例
從上述圖1所示的內(nèi)容可以看出,識(shí)別的圖像樣本中包含多個(gè)類別,包括人臉圖像、動(dòng)物圖像、植物圖像與景觀圖像。隨機(jī)選擇10 000張圖像將其劃分為兩類,其中2 000張圖像用于識(shí)別中的訓(xùn)練處理,另外8 000張圖像用于識(shí)別測試。
完成實(shí)驗(yàn)中測試樣本的準(zhǔn)備后,為避免圖像識(shí)別過程中樣本數(shù)量較大占用過多內(nèi)存與空間,根據(jù)工作的具體需求,預(yù)處理圖像。先轉(zhuǎn)換樣本圖像色彩,使彩色圖像在計(jì)算中呈現(xiàn)灰度狀態(tài)。處理效果如下圖2所示。
圖2 樣本集合中人臉圖像灰度處理效果示例
在此基礎(chǔ)上,對(duì)打亂編碼順序后的圖像壓縮處理。完成上述處理后,使用本文設(shè)計(jì)方法,識(shí)別測試樣本圖像,識(shí)別過程中,引進(jìn)灰度編碼技術(shù),對(duì)多媒體彩色圖像灰度轉(zhuǎn)換處理,使用小波熵值算法,提取多媒體彩色圖像紋理特征,將特征作為參照,識(shí)別樣本圖像,根據(jù)圖像的特征劃分其類別。
為滿足實(shí)驗(yàn)結(jié)果的對(duì)比需求,引進(jìn)基于遷移學(xué)習(xí)ResNet技術(shù)的圖像識(shí)別方法,與基于Deeplab V3+技術(shù)的圖像識(shí)別方法,將提出的方法作為傳統(tǒng)方法1與傳統(tǒng)方法2。按照規(guī)范,將灰度轉(zhuǎn)換與壓縮處理后的測試圖像樣本作為三種方法的識(shí)別樣本,將三種方法提取到的多媒體彩色圖像特征與樣本圖像適配,將適配度作為評(píng)價(jià)設(shè)計(jì)方法可靠性的關(guān)鍵依據(jù)。在此過程中,明確提取圖像特征與圖像樣本的適配度越高,說明圖像識(shí)別結(jié)果越精準(zhǔn),反之明確提取圖像特征與圖像樣本的適配度越低,說明圖像識(shí)別結(jié)果精準(zhǔn)度越差。按照上述方式,對(duì)比三種方法提取圖像特征與圖像樣本的適配度。其結(jié)果如下圖3所示。
圖3 識(shí)別方法提取圖像特征與圖像樣本的適配度
從圖3可知,本文設(shè)計(jì)的基于灰度編碼的圖像識(shí)別方法識(shí)別效果良好,該方法可以精準(zhǔn)識(shí)別到圖像特征,從而提高多媒體彩色圖像識(shí)別的準(zhǔn)確率。
現(xiàn)階段,計(jì)算機(jī)視覺技術(shù)已經(jīng)成為相關(guān)領(lǐng)域內(nèi)的研究重點(diǎn),此項(xiàng)技術(shù)以人類視覺為基礎(chǔ),利用計(jì)算機(jī)與視覺感知效應(yīng),輔助人們獲取或采集需求信息。為發(fā)揮多媒體彩色圖像在相關(guān)領(lǐng)域內(nèi)更高的價(jià)值,本文通過基于灰度編碼的多媒體彩色圖像灰度轉(zhuǎn)換、圖像紋理特征提取、圖像識(shí)別與分類,完成了多媒體彩色圖像識(shí)別方法的設(shè)計(jì)。該方法在完成設(shè)計(jì)后,通過對(duì)比實(shí)驗(yàn)證明可以精準(zhǔn)識(shí)別到圖像特征,從而提高多媒體彩色圖像識(shí)別的準(zhǔn)確率。但此次研究也存在一些不足,包括沒有設(shè)計(jì)更多的評(píng)價(jià)指標(biāo)評(píng)估該方法的實(shí)際應(yīng)用效果、沒有選擇更多的傳統(tǒng)方法作為對(duì)照組等。可在后期的設(shè)計(jì)中,將提出的不足作為研究點(diǎn),深化設(shè)計(jì)該方法,持續(xù)完善該方法的綜合性能。