郭昊楠 趙 平*
(天津農(nóng)學(xué)院,天津300800)
1.1 研究背景與現(xiàn)狀。在目前的技術(shù)發(fā)展中,國內(nèi)外的人工智能以及自動(dòng)識別技術(shù)已經(jīng)發(fā)展的非常迅速,依賴于移動(dòng)APP平臺(tái)所實(shí)現(xiàn)的識別程序也越來越多,圖像處理技術(shù)也越來越得到人們的重視,尤其是在農(nóng)業(yè)領(lǐng)域,對于菌類的識別更是如此。因此,如同人臉識別技術(shù)的發(fā)展一樣,對于識別菌類來說,做到可以準(zhǔn)確識別并區(qū)分不同菌類是目前為止具有挑戰(zhàn)性的實(shí)踐。
在對圖像識別上的研究中,中國農(nóng)業(yè)大學(xué)于新文教授取得了較為顯著的進(jìn)步,他主要采用了相似距離分類法以及二差分類法,再加上他所使用的判別模型分類法,他將這三類方法相結(jié)合,在對相關(guān)數(shù)字圖像的識別進(jìn)行研究的同時(shí),也對所識別的圖像有了非常高的精確度[1]。
1.2 研究過程。所謂圖像識別技術(shù),就是以圖像本質(zhì)為基礎(chǔ),利用計(jì)算機(jī)對圖像進(jìn)行處理分析和整合理解。首先對圖像進(jìn)行預(yù)處理,利用不同的處理方法(灰度化處理以及平滑處理)處理菌類圖像;其次根據(jù)圖像的質(zhì)量以及針對性的去噪,以達(dá)到對基于閾值的圖像分割的目的[1];最后利用分類和提取出圖像的重要特征,采用其圖像具有的代表性特征來識別它本身所具有的作為匹配的指標(biāo)項(xiàng),然后將各個(gè)指標(biāo)值進(jìn)行對比,通過Sift 算法進(jìn)行特征匹配,確定指定范圍內(nèi)的識別種類。
2.1 圖像的灰度化處理。對圖像的顏色進(jìn)去處理后,圖像丟失顏色,保留下了其它方面信息的過程就是圖像灰度化處理。灰度化處理后的圖像中,去除了其本身所具有的一些顏色信息,因此便能減少在圖像處理過程中所包含的計(jì)算量,從而大大的提高圖像的處理效率。[2]
2.2 圖像的平滑處理。從信號處理的角度看圖像的平滑處理就是去除其中的高頻信息,保留低頻信息,它是一種能夠極大改善圖像質(zhì)量的一種圖像預(yù)處理的方法,在圖像經(jīng)過平滑處理后,其會(huì)增強(qiáng)本身圖像中的主要特征,進(jìn)而最后減弱圖像噪聲和失真對圖像的影響,最終使圖像亮度平緩[3]。
2.3 基于閾值的圖像分割。將圖像劃分成特定的和獨(dú)特的各個(gè)區(qū)域,提取出識別系統(tǒng)所需要的目標(biāo)和過程就是圖像分割,它是圖像分析中的關(guān)鍵步驟之一。對于菌類識別的圖像分割方法,選擇基于閾值分割圖像的方法更為合適,原因在于其更能處理較小的圖像,處理速度簡單快捷。
經(jīng)過分割處理后的圖像,不僅能夠減少除本目標(biāo)之外的圖像干擾,還突出了所抽取的特征目標(biāo)區(qū)域,提高了識別系統(tǒng)對圖像的處理效率。圖像分割的地位不能忽視,它會(huì)直接作用在圖像的后續(xù)處理和分析識別上,所以圖像分割在圖像識別過程中起著至關(guān)重要的作用[3]。
基于閾值的圖像分割法最重要的一點(diǎn)是閾值的選擇,它需要根據(jù)具體問題來確定[2]。對于給定的圖像,可以通過分析直方圖的方法確定最佳的閾值,當(dāng)直方圖明顯呈現(xiàn)雙峰情況時(shí),可以選擇兩個(gè)峰值的中點(diǎn)作為最佳閾值。也可以把圖像分成n*n塊子圖,取每一塊子圖的灰度均值,即為均值閾值法,其中子圖越多分割效果越好,但效率可能會(huì)變慢[3]。
3.1 特征抽取與選擇。在進(jìn)行菌類特征匹配之前,首先需要對不同菌類的各種特征項(xiàng)進(jìn)行抽取篩選,選擇出便于后續(xù)匹配的特征,在模式識別過程中,特征抽取是圖像識別的重要步驟之一,從大量的菌類原始數(shù)據(jù)中找出最能代表其種類的少量特征,以便于進(jìn)行分類和識別[4]。
降維是特征抽取的本質(zhì),同時(shí)還不能丟失模式的分類信息,在研究過程中采取了主成分分析(PCA)的方法,對菌類種類所具有的特征進(jìn)行分組降維,選擇出符合代表性的特征,利用SPSS 工具分別對不同種類的菌類進(jìn)行了主成分分析的步驟,最終抽取出每個(gè)菌類對應(yīng)的其代表性特征,總括如下:菌類的形狀,菌類的大小,菌類的紋理等幾種主成分分析中輸出結(jié)果貢獻(xiàn)率高于90%的特征點(diǎn)組,因此在進(jìn)行匹配特征時(shí),就采用這幾種特征值來進(jìn)行Sift 算法操作。
3.2 Sift 匹配算法。Sift 算法又稱尺度不變特征轉(zhuǎn)換,它是一種電腦視覺的算法,用來偵測與描述圖像中的局部性特征,并在空間尺度中尋找到對應(yīng)的極值點(diǎn),然后對其提取出位置、尺度、旋轉(zhuǎn)不變量等。選擇Sift 算法的原因在于:
該算法具有較好的穩(wěn)定性和不變性,能在一定程度上不受視角變化、仿射變換以及圖像噪聲的干擾;區(qū)分性好,多量性,能產(chǎn)生大量特征向量;高速性,能夠?qū)μ卣飨蛄靠焖龠M(jìn)行匹配;可擴(kuò)展性,能夠聯(lián)合其它形式的特征向量[5]。
Sift 算法步驟分為:提取關(guān)鍵點(diǎn)、定位關(guān)鍵點(diǎn)、確定特征方向、通過各關(guān)鍵點(diǎn)的特征向量,進(jìn)行兩兩比較找出相互匹配的若干對特征點(diǎn),建立之間的對應(yīng)關(guān)系[6]。算法實(shí)質(zhì)如圖所示。
其中對特征點(diǎn)的檢測以及描述過程就是Sift 算法所計(jì)算的過程,在對菌類的特征組進(jìn)行檢測之后,計(jì)算機(jī)中進(jìn)行描述把其中的特征點(diǎn)集與數(shù)據(jù)庫中所存儲(chǔ)的原圖像中的特征點(diǎn)集進(jìn)行對比匹配,在相應(yīng)的關(guān)鍵點(diǎn)的對比下,分離出相像的特征點(diǎn),由此得出對應(yīng)的特征向量,最終在原圖像與目標(biāo)圖像匹配的高度相似的特征點(diǎn)進(jìn)行收集矯正,但是由于Sift 算法的速度較慢、數(shù)據(jù)復(fù)雜、耗時(shí)長,以及對邊緣光滑的目標(biāo)無法準(zhǔn)確提取特征點(diǎn)的弊端,導(dǎo)致最后只能初步實(shí)現(xiàn)對不同菌類的粗略識別[6]。
在以上的研究過程中,重點(diǎn)的研究了圖像預(yù)處理過程以及匹配特征兩大方面,采用了灰度化處理、平滑處理、閾值分割等比較常見而且實(shí)用的預(yù)處理方法,在對菌類識別的過程中不斷更新著這些預(yù)處理方法。
對匹配特征值Sift 算法進(jìn)行深層次分析,利用Sift 算法的優(yōu)勢對菌類目標(biāo)圖像的特征點(diǎn)與原圖像的特征點(diǎn)進(jìn)行比較,并通過不斷改進(jìn)這種算法中的關(guān)鍵點(diǎn)對比來進(jìn)行最終的菌類識別。
圖像處理是當(dāng)今應(yīng)用領(lǐng)域非常廣泛的一門技術(shù),對圖像的各種處理及識別需要更多的知識與時(shí)間來研究學(xué)習(xí),才能掌握基于圖像處理技術(shù)的菌類識別方法,在對識別過程中的圖像預(yù)處理、圖像分割、圖像增強(qiáng)、匹配特征,以及最后實(shí)現(xiàn)成功識別不同菌類的功能,仍然需要改進(jìn),將識別的過程以及結(jié)果更加準(zhǔn)確化,才能更好的對所需要識別的圖像進(jìn)行分析研究。