張涵鈺 趙 平
(天津農(nóng)學(xué)院 計算機與信息工程學(xué)院,天津 300384)
在國內(nèi)這幾年,中國農(nóng)業(yè)大學(xué)于新文教授對圖像的研究取得了較為明顯的進步,于新文教授主要采用相似距離分類法、二差分類法以及判別模型分類法三種方法對相關(guān)數(shù)字圖像的識別進行鉆研,在待識別目標圖像極其規(guī)范的情況下有著極高的識別精準度。
在國外,美國新墨西哥州立大學(xué)哈比卜·加蘇米和納迪普拉薩德教授等人利用人工神經(jīng)網(wǎng)絡(luò)對棉花生態(tài)系統(tǒng)中的昆蟲進行分類識別。他們根據(jù)數(shù)學(xué)形態(tài)學(xué)中的基本理論對圖像進行膨脹與腐蝕操作,以達到對圖像進行分割的目的,最終成功實現(xiàn)了對生態(tài)系統(tǒng)中的植物進行識別[1]。
雖然現(xiàn)如今的圖像識別技術(shù)已經(jīng)有了顯著的發(fā)展,但是還沒有一個專門用于菌類識別的應(yīng)用技術(shù)去幫助人們了解想要了解的菌類的對應(yīng)情況,來區(qū)分哪些菌類可食用,而那些菌類不可食用。
通過運用現(xiàn)如今的已經(jīng)趨近成熟的圖像處理技術(shù),舉一反三實現(xiàn)菌類識別,其中具體方法如圖1 所示。
圖1 圖像識別技術(shù)流程示意圖
通過對圖像識別技術(shù)的研究,使機器具有視覺能力,然后直接對接收到的視覺信息進行處理,并行反饋處理。圖像識別過程首先需要從外界獲取目標圖像。 這一過程通常稱為圖像采集,它可以通過使用攝像機、攝像機等圖像采集設(shè)備實現(xiàn),然后根據(jù)圖像識別模式對采集到的圖像進行處理,在圖像識別過程中稱為圖像預(yù)處理,預(yù)處理后的圖像去除源圖像中的冗余信息,保存圖像的主要特征,最后選擇圖像的主要特征形成相應(yīng)的信息映射和信息存儲在信息庫中進行比較,最終實現(xiàn)圖像識別[1]。
在中國,大約有180 種毒蕈,其中至少有30 種可以導(dǎo)致死亡。一般來說,有毒菌的顏色比較鮮艷,菌帽上可能會有突起,紅點,溝渠和裂縫,有的菌子上有菌托、菌環(huán),因此此次項目可以利用這些真菌的特征信息來識別真菌,而圖像特征識別的步驟包括圖像預(yù)處理、圖像特征提取、圖像識別分類三個步驟。
2.2.1 圖像預(yù)處理
預(yù)處理是真菌鑒定過程中的重要環(huán)節(jié)。 由于圖像采集環(huán)境的不同,如光照程度和設(shè)備性能等因素,輸入圖像往往存在噪聲和對比度低等缺點。
因此菌類識別的預(yù)處理如下:a. 一幅圖像在實際應(yīng)用過程中可能存在各種各樣的噪聲,這些噪聲可能是在傳輸或量化過程中產(chǎn)生的。菌類圖像也是一樣,在采集過程中會產(chǎn)生各種噪聲,所以必須進行去噪處理。b.去除背景,即將真菌從背景中分離出來,形成二值圖像進行邊緣檢測和形狀特征參數(shù)計算。c.真菌圖像經(jīng)過去噪和背景去除后,可能仍會存在一些孤立的噪聲點,或者由于所選取的菌類本身受到過害蟲侵蝕而導(dǎo)致在其內(nèi)部有一些孔洞,這些都會影響菌類特征參數(shù)的準確計算。因此有必要對去除背景后的圖像進行膨脹運算,然后進行腐蝕運算,經(jīng)過多次處理,從而消除孤立的噪聲點和內(nèi)部孔洞,得到完整、準確的真菌二值圖像。
2.2.2 圖像特征提取
由于自然界中的菌類具有不同的形狀與顏色,因此這些特征都可以作為菌類分類的依據(jù)。
顏色是菌類的一個重要性狀特征,因為HSI 顏色模型更符合人類的顏色視知覺,因此我們使用HSI 顏色模型的色度(Hue)表示菌類的顏色特征不同的形狀特征為菌類識別提供分了分類依據(jù)??紤]到一些菌類菌帽呈扇形、一些菌帽形雨傘形等特征情況,我們選用致密度和三個不變矩等特征建模菌類的形狀特征,其計算方式如下[3]:
2.2.3 基于SVM的圖像識別分類
SVM 是一種基于結(jié)構(gòu)風(fēng)險最小化原則的可訓(xùn)練的通用機器學(xué)習(xí)方法,簡單概括來說的話,它只是一個分類器。支持向量機方法的原理即簡單的線性化和增維過程。在線性可分離情形下,從最優(yōu)分類超平面發(fā)展出支持向量機。如圖2 所示,空心點和實心點表示兩種類型的樣本,H 是H 維分類超平面,H1 和H2 分別為過各類點且離分類超平面舉例最近且平行于H 的超平面。最優(yōu)分類超平面理論要求分類超平面在正確分開兩類的基礎(chǔ)上最大化分類區(qū)間。
圖2 SVM 解釋圖
在得到含有真菌顏色和形狀特征的五維向量后,將這些特征作為真菌分類方法的輸入向量進行真菌鑒定。由于支持向量機(SVM)分類法具有非線性分類及良好的泛化性能,在模式識別領(lǐng)域是最具影響力的方法,所以此次項目選用SVM作為菌類的分類方法,在核函數(shù)上選擇徑向基核,因為它具有非線性分類性能和魯棒的性能。
2.2.4 研究效果
選擇5 種不同的真菌,每種真菌隨機選取30 個特征值作為訓(xùn)練數(shù)據(jù),其余的20 個特征值作為測試數(shù)據(jù)。在訓(xùn)練模型中,利用五折交叉驗證對訓(xùn)練模型進行優(yōu)化(訓(xùn)練樣本分為5 組,隨機選擇4 組進行訓(xùn)練,1 組進行模型性能測試),選擇最優(yōu)SVM懲罰參數(shù)c 和徑向基中的g[3]。
表1 基于徑向基SVM 的菌類分類性能
效果測試顯示此次項目所研究的菌類識別技術(shù)對于不同菌類的識別準確率較高,此方法具有一定科學(xué)效應(yīng)。
在此僅將菌類識別技術(shù)與人臉識別技術(shù)與指紋識別技術(shù)進行對比,對比情況具體如下:
菌類識別技術(shù)沒有人臉識別的技術(shù)復(fù)雜,由于人臉的差異性不大,甚至有雙胞胎相貌相同等情況,所以人臉識別的預(yù)處理和特征提取的算法要比菌類識別的算法更加復(fù)雜,而菌類識別技術(shù)則是僅僅對真菌的形狀與顏色作為特征提取。
其實菌類識別技術(shù)與指紋識別技術(shù)根據(jù)有相似性,都是通過把一個現(xiàn)場采集到的圖像與一個已經(jīng)登記錄入系統(tǒng)的圖像進行一對一的比對來確定身份的過程,但是,兩者的區(qū)別是指紋識別使用不同的數(shù)字化算法在指紋圖像上找到并比對指紋的特征,人們的十個手指產(chǎn)生最少4900 個獨立可測量的特征,指紋識別所提取的特征點更多也因此更加準確。
對比來看,如今項目所研究的菌類識別技術(shù)還處于初步階段,與現(xiàn)已成熟的熱門識別技術(shù)相比,菌類識別技術(shù)還太簡單,在后續(xù)的工作中需要對菌類識別技術(shù)進行不斷地更新完善。
菌類識別APP 的開發(fā)使得人們的生活更加快捷方便,其中主要特點列舉如下:
4.1.1 讓人們可以以快捷的方式學(xué)習(xí)相關(guān)的菌類知識
4.1.2 減少了人們誤食毒蘑菇的風(fēng)險
4.1.3 擺脫了過往只能輸入名稱查百度詞條的方法
所有的科技發(fā)展都是為了使人們的生活更加方便快捷,我們此次對于菌類識別APP 的開發(fā)也是以此目的出發(fā),幫助人們擺脫菌類盲區(qū)。
2017 年的一篇報道顯示:“目前有一款號稱使用‘革命性的AI’來識別蘑菇的APP,微生物學(xué)博士c(Colin Davidson)解釋說,用戶不能通過外觀識別APP來識別蘑菇,比如可致病的亮黃蘑菇在外觀上和可食用的馬菇外觀非常類似,用戶把它拿起來觸摸外觀或者聞它們的味道,需要從多角度觀察和判斷才行”。
這是此次項目開發(fā)菌類識別APP的一個顯著問題,畢竟識別菌類不是簡單地通過圖像識別就能識別出所有的菌類,有些菌類可能還需要通過其生長環(huán)境和氣味等等各種情況來辨別,而現(xiàn)在所研究的菌類識別卻只是將形狀與顏色作為識別特征,很多菌類仍無法識別,只能將現(xiàn)時期的菌類識別APP當作一個“識別蘑菇的粗略指南”。
在后續(xù)的菌類識別開發(fā)中可以將菌類的生長環(huán)境也納入特征識別當中,使得菌類識別的技術(shù)更加完善,成為一個真正能識別所有菌類的APP。