柴玉華,侯升飛,彭長祿
(1.東北農業(yè)大學電氣與信息學院,哈爾濱 150030;2.黑龍江省招生辦,哈爾濱 150090)
基于高光譜圖像技術的大豆分級識別方法研究
柴玉華1,侯升飛1,彭長祿2
(1.東北農業(yè)大學電氣與信息學院,哈爾濱 150030;2.黑龍江省招生辦,哈爾濱 150090)
對大豆進行快速準確分級,采集1~5等級大豆波長在1 000~2 500 nm范圍的高光譜圖像數(shù)據(jù),獲得光譜圖像;對不同大豆等級樣本的光譜曲線進行分析;通過主成分分析法,從每個等級大豆樣本中優(yōu)選出四個特征波長,得到特征圖像;從每個特征圖像中分別提取基于灰度共生矩陣的4個紋理特征參數(shù)——能量、熵、慣性矩和相關性,從16個特征變量中選取8個主要特征變量,應用BP神經網絡建立大豆品質分級識別模型。模型預測準確率為92%。結果表明,高光譜圖像技術對大豆等級具有較好的識別作用,可為大豆的在線無損檢測分級提供參考。
圖像處理;高光譜;大豆;BP神經網絡
大豆是重要經濟作物,由于不同等級大豆顏色、大小、飽滿度等外觀品質與其脂肪、蛋白質、碳水化合物等內在品質存在一定差異性,快速準確地識別大豆等級對提高大豆品質,增強市場競爭力具有重要意義。目前,我國在大豆的外觀品質檢測停留在人工操作水平,存在主觀性強、檢測效率低、檢測結果一致性差、檢測人員易疲勞等問題。內部品質檢測依賴于化學檢測方法,在客觀性、準確性、快速性等方面存在明顯不足。如何快速準確地檢測大豆品質,成為目前亟待解決的問題之一。學者對水果蔬菜等農產品檢測技術進行了廣泛研究[1]。時玉強等通過圖像獲取系統(tǒng)得到大豆的表面顏色特征,應用SAS對大豆表面顏色特征進行LOGISTIC回歸后,應用BP神經網絡對大豆進行標準粒與細菌斑點病粒分類[2]。高艷霞等提出利用神經網絡和大豆表面顏色特征對大豆進行標準粒和熱損傷粒分類的方法,選取大豆圖像的6種顏色特征值作為神經網絡的訓練樣本,并嘗試利用粒子群優(yōu)化算法與BP(Back propa?gation)結合算法訓練網絡[3]。譚克竹等應用近紅外光譜技術結合遺傳多層前饋神經網絡的方法檢測大豆脂肪酸含量[4]。
傳統(tǒng)檢測手段主要對大豆進行單一品質檢測,檢測質量信息具有局限性。高光譜成像技術,是近幾年出現(xiàn)的一種農產品無損檢測新技術,該技術集合圖像處理技術和光譜分析技術的優(yōu)點。圖像處理技術能全面反映農產品表面缺陷、污染情況等外在特征,光譜技術又能反應農產品的物理結構、化學成分等內在品質。通過高光譜成像技術,能對農產品的綜合品質進行檢測[5-6]。本文采用高光譜成像技術對大豆等級進行檢測,獲得不同等級大豆的光譜曲線并進行光譜特性分析,研究基于主成分分析法的特征波段選擇方法,提取基于灰度共生矩陣的紋理特征參數(shù),再結合BP神經網絡建立大豆分級識別模型,以期為高光譜成像技術用于大豆等級檢測提供參考。
1.1 儀器設備
基于成像光譜儀的高光譜圖像采集系統(tǒng)(見圖1),由短波紅外高光譜相機(含鏡頭,分光部件,MCT探測器,電源,封裝等)(SpectralCamera-N25E),標準反射白板(Cal-tile200)和計算機(HP Pro 2080 MT)等部件組成。高光譜測量光譜范圍是1 000~2 500 nm,平均間隔0.5 nm,曝光時間為20 ms。高光譜數(shù)據(jù)分析軟件采用ENVI4.7和Matlab 7.12。
圖1 高光譜圖像采集系統(tǒng)Fig.1 Hyperspectral image acquisition system
1.2 樣本來源及圖像的獲取
在《大豆》(GB 1352-2009)國家標準中[7],明確提出完整粒率與損傷粒率的要求。1~5等級大豆的完整粒率分別要求≥95、≥90、≥85、≥80、≥75,損傷粒率分別要求≤1%、≤2%、≤3%、≤5%和≤8%。以東北農業(yè)大學大豆研究所提供的墾豐16作為研究對象,按完整粒率分為1~5等級大豆。每個品質20個樣本,共100個樣本。將大豆均勻地鋪在規(guī)格為8 cm×8 cm的培養(yǎng)皿中,然后進行高光譜圖像采集。采集得到波長在1 000~2 500 nm范圍的高光譜圖像數(shù)據(jù)塊。
1.3 高光譜圖像標定
光源的強度在各波段下分布不均勻,同時攝像頭中存在暗電流噪音,造成在光源強度分布較弱的波段下,致使獲得的光譜圖像含有較大的噪音。因此,需要對獲得的高光譜圖像進行黑白標定[8-10]。在與樣品采集相同的系統(tǒng)條件下,掃描標準白色校正得到全白的標定圖像Iwhite,關閉相機快門進行圖像采集得到全黑的標定圖像Iblack,完成高光譜圖像的標定,使采集得到的絕對圖像Irace變成相對圖像R[8-10]。
圖2a是樣本大豆單一籽粒在波長為1 000~2 500 nm范圍內的光譜曲線,其中波長為1 400~1 800 nm范圍內最上面的曲線為籽粒高亮區(qū)光譜曲線,波長為1 000~1 800 nm范圍內最下面兩條曲線為背景光譜曲線。圖2b和圖2c分別是不同大豆樣本的均值波譜曲線和標準偏差曲線,從b、c二圖可以看出,不同等級大豆樣本在1 000~1 800nm區(qū)域存在著明顯的差異性,因此在后期的數(shù)據(jù)處理過程中,主要對1 000~1 800nm范圍內的高光譜圖像進行分析。
圖2 大豆樣本光譜曲線Fig.2 Soybean sample spectral curve
2.1 特征波段的提取
在分析之前,應用ENVI軟件對原始高光譜數(shù)據(jù)進行重采樣,以減少高光譜圖像包含的數(shù)據(jù)量。由于大豆樣本物理結構與化學成分的不均勻性,同時避免單一大豆樣本對分級結果的影響,選擇像素為100×100的矩形區(qū)域為感興趣區(qū)域,得到100×100×284的三維數(shù)據(jù)塊,由284張大小為100×100的一系列圖像組成[11-15]。然后進行主成分分析,得到前4個主成分分析圖像:PC1、PC2、PC3、PC4(見圖3)。
圖3 大豆的前4個主成分分析圖像Fig.3 First four principal component images of soybean varieties
主成分分析法是將原來相互冗余的數(shù)據(jù)組成互相無關的數(shù)據(jù),同時根據(jù)實際需要從中選取較少的數(shù)據(jù)替換原有數(shù)據(jù)。因此,主成分分析法既能消除原始數(shù)據(jù)中的冗余信息,又能實現(xiàn)數(shù)據(jù)的降維[16]。
主成分圖像是由原始高光譜圖像數(shù)據(jù)中所有波段下的圖像經過線性組合而成:
式中,pcm為第m個主成分,?i為該主成分的權重系數(shù),Ii為單個波段的原始圖像。
大豆樣本第一個主成分分析圖像包含最多的大豆信息,因此試驗通過pc1尋找特征波長。在該線性組合中,權重系數(shù)較大的所對應波長下的圖像貢獻越大[17]。通過對比284個權重系數(shù),發(fā)現(xiàn)權重系數(shù)較大的是?42,?69,?105,?120,其所對應波段就是特征波長,分別為1 153,1 322,1 547,1 641 nm。
2.2 特征提取
灰度共生矩陣是一種描述紋理特征的常用方法。采用該方法對大豆不同等級樣本進行4個特征波段下圖像的紋理特征提取。隨機截取每個特征波段下的圖像區(qū)域,然后分別提取基于灰度共生矩陣的8個特征參量[18]:均值、方差、同質性、對比度、差異性、熵、二階矩、相關性,應用ENVI軟件獲得不同等級大豆的8個紋理特征圖像,如表1所示。從這8個特征參量中選取最能表現(xiàn)圖像信息的4個紋理特征參數(shù)——二階矩、熵、慣性矩和相關性,得到16個特征變量,再通過第二次主成分分析,選取8個特征變量結合人工神經網絡建立大豆等級的識別模型。
表1 不同大豆等級的8個紋理特征參數(shù)Table 1 Eight texture feature parameters with different levels of soybean
2.3 模型建立與結果
人工神經網絡具有很強的非線性表達能力,其校正效果優(yōu)于主成分回歸、加權主成分回歸、偏最小二乘、二次主成分回歸等方法。試驗將大豆樣本進行分級,應用Matlab軟件,結合人工神經網絡建立大豆的分級模型,該網絡由輸入層、隱含層、輸出層構成。試驗共有100個樣本,每個樣本提取兩個特征波段,共200個數(shù)據(jù)樣本,其中隨機選取100個樣本進行訓練,剩余100個樣本用于驗證。訓練結果如圖4所示。
該模型的輸入層包含8個節(jié)點,分別為主成分分析下前兩個波段下的基于灰度共生矩陣的4個參數(shù),經過多次試驗,隱含層包含10個節(jié)點為最優(yōu),輸出層為1[19-20]。經過多次試驗確定學習率為0.2,動量因子為0.5。獲得最優(yōu)結果見表2,從中可以看出,預測時總判別率為90%,說明該模型對大豆等級的分級識別可行。
圖4 訓練過程Fig.4 Process of training
表2 預測集中5個等級大豆的預測結果Table 2 Discriminating results of five grade of soybean in prediction set
利用高光譜成像技術獲得高光譜圖像,對高光譜數(shù)據(jù)進行主成分分析,實現(xiàn)高光譜數(shù)據(jù)的降維,并找出大豆的4個特征波長,采用基于灰度共生矩陣的紋理特征提取方法,提取大豆的8個紋理參數(shù);利用人工神經網絡建立大豆分級識別模型,預測分級準確率為92%。說明可以利用高光譜圖像技術對大豆進行分級。但由于試驗條件有限,還需在以下幾方面得到提高和改善:大豆樣本的多樣性。本文只選擇墾豐16作為研究對象,缺少對多品種的共性研究,對試驗結果會產生影響;光譜波段選擇不全面,試驗選擇1 000~2 500 nm波段范圍,未對其他波段范圍進行分析,試驗的精度有待提高;分類方法單一。由于人工神經網絡體系結構只適用于一類或幾類問題,因此需要尋找簡潔、穩(wěn)定、通用的分類方法。
學者已將高光譜成像技術應用在玉米、水稻等農產品的無損檢測中,并獲得較好成果。目前暫無利用高光譜成像技術對大豆品質檢測的研究。在今后試驗中,將利用高光譜成像技術對大豆的脂肪、蛋白質、碳水化合物等內在品質進行無損檢測,結合大豆的外在品質進行分析,尋求大豆內外品質的關聯(lián)性,為大豆在線無損檢測提供試驗和理論依據(jù)。
[1]趙丹婷,柴玉華,張長利.基于圖像處理技術的大豆灰斑病的檢測技術研究[J].東北農業(yè)大學學報,2010,41(4):119-123.
[2]時玉強,柴玉華,鄭先哲.基于機器視覺的大豆細菌斑點病粒檢測[J].東北農業(yè)大學學報,2009,40(4):106-110.
[3]高艷霞,胡昌標.基于機器視覺的大豆熱損傷粒檢測[J].計算機與現(xiàn)代化,2011(7):88-91.
[4]譚克竹,張長利,柴玉華.基于遺傳多層前饋神經網絡的大豆脂肪酸含量近紅外光譜檢測[J].東北農業(yè)大學學報,2008,39 (7):112-117.
[5]陳全勝,趙杰文,蔡健榮,等.利用高光譜圖像技術評判茶葉的質量等級[J].光學學報,2008,28(4):669-674.
[6]黎靜,劉木華,薛龍.基于高光譜圖像技術的大米堊白檢測[J].南方農機,2009(1):27-29.
[7]中華人民共和國國家技術監(jiān)督局.GB 1352—2009,中華人民共和國國家標準-大豆[S].北京:中國標準出版社,2009.
[8]韓熹,嚴紅兵,盧福潔,等.基于國產近紅外谷物分析儀的大豆中粗蛋白與粗脂肪含量的檢測研究[J].現(xiàn)代科學儀器,2009 (2):119-121.
[9]李江波,饒秀勤,應義斌.農產品外部品質無損檢測中高光譜成像技術的應用研究進展[J].光譜學與光譜分析,2011,31(8): 2021-2026.
[10]郭恩有,劉木華,趙杰文,等.臍橙糖度的高光譜圖像無損檢測技術[J].農業(yè)機械學報,2008(5):91-93.
[11]趙杰文,劉劍華,陳全勝,等.利用高光譜圖像技術檢測水果輕微損傷[J].農業(yè)機械學報,2008(1):106-109.
[12]劉木華,趙杰文,鄭建鴻,等.農畜產品品質無損檢測中高光譜圖像技術的應用進展[J].農業(yè)機械學報,2005,36(9):139-142.
[13]單佳佳,吳建虎,陳菁菁,等.基于高光譜成像的蘋果多品質參數(shù)同時檢測[J].光譜學與光譜分析,2010,30(10):2729-2733.
[14]楊諸勝,郭雷,羅欣,等.一種基于主成分分析的高光譜圖像波段選擇算法[J].微電子學與計算機,2006,23(12):72-74.
[15]馮燕,何明一,宋江紅,等.基于獨立成分分析的高光譜圖像數(shù)據(jù)降維及壓縮[J].電子與信息學報,2007,29(12):2871-2875.
[16]鄒小波,趙杰文.農產品檢測技術與數(shù)據(jù)分析方法[M].北京:中國輕工業(yè)出版社,2008.
[17]鄒偉,方慧,劉飛等,基于高光譜圖像技術的油菜籽品質鑒別方法研究[J].浙江大學學報,2011,37(2):175-180.
[18]馮雷,張德榮,陳雙雙,等.基于高光譜成像技術的茄子葉片灰霉病早期檢測[J].浙江大學學報,2012,389(3):311-317.
[19]傅文林,圖像分割技術研究及頭發(fā)分割應用[D].上海:上海交通大學,2010.
[20]李江波,蘇憶楠,饒秀勤.基于高光譜成像及神經網絡技術檢測玉米含水率[J].包裝與食品機械,2010(6):1-4.
Identification of different soybean grades based on hyperspectral imagery
CHAI Yuhua1,HOU Shengfei1,PENG Changlu2
(1.School of Electrical and Information,Northeast Agricultural University,Harbin 150030,China;2.Admissions Office of Heilongjiang Province,Harbin 150090,China)
In order to fast and exact classification of soybean,collection 1-5 grades soybean 1 000-2 500 nm range of hyperspectral image data to obtain spectral image;analysis of different samples of soybean grade spectral curve;application of principal component analysis(PCA),from the 4 features of each variety selected optimal wavelength,extracted four texture feature parameters(moment of inertia,energy,entropy and correlation)from each feature in the image based on statistical moment.Select 8 main characteristic variables from 16 characteristic variables,establishment of soybean grade identification model based on BP neural network.Experimental results showed that discriminating rate was 92%in the prediction set.Results showed that the hyperspectral image technology had better recognition effects on soybean grade,Provided a good reference for soybean online non-destructive testing classification.
image processing;hyperspectral imagery;principal component analysis;soybean
S565.1
A
1005-9369(2014)04-0107-06
2012-10-24
中國博士后科學基金資助項目(20070410883);黑龍江省自然科學基金重點項目(ZD201303)
柴玉華(1965-),女,教授,博士生導師,研究方向為模式識別與智能控制。E-mail:houshengfei@126.com
時間2014-4-21 13:21:11[URL]http://www.cnki.net/kcms/detail/23.1391.S.20140421.1321.004.html
柴玉華,侯升飛,彭長祿.基于高光譜圖像技術的大豆分級識別方法研究[J].東北農業(yè)大學學報,2014,45(4)∶107-112.
Chai Yuhua,Hou Shengfei,Peng Changlu.Identification of different soybean grade based on hyperspectral imagery[J].Journal of Northeast Agricultural University,2014,45(4)∶107-112.(in Chinese with English abstract)