李含光,王 琦
(南京信息工程大學(xué)計(jì)算機(jī)與軟件學(xué)院,江蘇南京210044)
云的形成和變化不僅反映了當(dāng)時(shí)大氣的運(yùn)動(dòng)、穩(wěn)定程度和水汽狀況,也是預(yù)示未來(lái)天氣變化的重要征兆之一[1]。對(duì)衛(wèi)星云圖的分類識(shí)別主要采用統(tǒng)計(jì)模式法和結(jié)構(gòu)法,統(tǒng)計(jì)模式法是對(duì)衛(wèi)星云圖像模式的統(tǒng)計(jì)特征進(jìn)行提取,并對(duì)這些特征值集合進(jìn)行識(shí)別;統(tǒng)計(jì)結(jié)構(gòu)法是選取圖像的結(jié)構(gòu)特征基元,把這些基元按一定的規(guī)則進(jìn)行組織、排列來(lái)實(shí)現(xiàn)分類識(shí)別。利用這些方法對(duì)衛(wèi)星云圖的分類識(shí)別,都取得了較好的效果[2]。由于地基云觀測(cè)具有成本低、易操作、簡(jiǎn)單直觀以及對(duì)局部地區(qū)天氣指導(dǎo)性強(qiáng)等優(yōu)勢(shì),逐漸成為研究的熱點(diǎn)。但由于受到獲取圖像設(shè)備的限制,目前取得的研究成果有限,主要靠人工目測(cè)和經(jīng)驗(yàn)分析為主,具有很大的局限性。Singh等[2]對(duì)地基云圖自動(dòng)識(shí)別進(jìn)行了研究。通過(guò)紋理特征提取的方法來(lái)對(duì)圖像進(jìn)行紋理特征的提取,使用了k最近鄰和神經(jīng)網(wǎng)絡(luò)作為分類器來(lái)對(duì)不同的云類進(jìn)行分類。TIAN B等 提取了衛(wèi)星云圖中紅外和可見光兩通道的紋理特征和頻域,利用神經(jīng)網(wǎng)絡(luò)對(duì)云團(tuán)進(jìn)行了分類。CALBO等[4]利用位于不同地區(qū)的TSI和WSC儀器收集到的數(shù)據(jù)對(duì)晴空、積狀云、層狀云、卷狀云、波狀云這5類不同的天空狀況進(jìn)行了分類。雖然,目前地基云分類識(shí)別的研究取得了一定的成績(jī),但是也存在識(shí)別率較低等問(wèn)題,本文在研究了目前地基云識(shí)別已有的成果上,分析得出,一般可以通過(guò)紋理提取的方法提取圖像紋理特征,然后,利用圖像紋理特征構(gòu)成特征向量,實(shí)現(xiàn)對(duì)地基云圖的分類和識(shí)別。通過(guò)對(duì)地基云云圖云狀的分析與研究,提出用Gabor變換對(duì)地基云圖像的紋理特征進(jìn)行分析,獲得能夠最有效地表示云圖云狀的紋理特征。然后,應(yīng)用這些紋理特征,利用最短距離來(lái)構(gòu)造陀螺分類器,采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類樣本訓(xùn)練,用陀螺分類器實(shí)現(xiàn)對(duì)地基云的分類識(shí)別。
圖像紋理是一種重要的視覺手段,使圖像普遍存在而又難以準(zhǔn)確描述的特征。紋理分析一直是計(jì)算機(jī)視覺、圖像處理、圖像檢索等領(lǐng)域的研究熱點(diǎn),一般通過(guò)對(duì)圖像紋理特征的處理實(shí)現(xiàn)對(duì)圖像的分析。因此,如何提取圖像特征就成為解決問(wèn)題的關(guān)鍵,目前采取的主要方法有自相關(guān)法、LAW能量法以及灰度共生矩陣法等[2]。由于地基云具有不規(guī)則性,并且存在過(guò)渡云和邊界消融等特征,上述方法取得的效果普遍較差,而Gabor小波變換利用其自身具有多方向的分析能力,在空間分布和方向上有很強(qiáng)的特性,具有很好的時(shí)域和頻域分辨能力,非常適用于圖像特征提?。?],因此,采用Gabor小波變換來(lái)提取地基云圖紋理特征是不錯(cuò)的選擇。
Gabor小波是一種功能強(qiáng)大的紋理分析工具[6-8],二維 Gabor濾波器與哺乳動(dòng)物視覺皮層簡(jiǎn)單細(xì)胞二維感受剖面非常相似,因此,Gabor小波變換在圖像紋理分析上具有獨(dú)特的優(yōu)勢(shì),Gabor小波的核函數(shù)定義為
(1)式中:φμ,v(z)是 Gabor小波的核函數(shù);kμ,ν表示波向量,μ和ν分別表示波向量的方向和波長(zhǎng);z=(x,y)為圖像坐標(biāo)函數(shù);運(yùn)算符‖·‖則表示標(biāo)準(zhǔn)的運(yùn)算操作。kμ,ν定義為
(2)式中:kν=kmax/fν,kmax表示最高頻率的帶通濾波器中心頻率,f是頻率域中核函數(shù)的間隔因子[9];Φμ=πμ/8。
在(1)式中的小波核心可以由波向量kμ,ν生成。模‖k‖控制高斯窗口的寬度以及正弦波的波長(zhǎng);Φ可以控制濾波器的方向,改變?chǔ)悼梢赃M(jìn)行濾波器的旋轉(zhuǎn),σ定義了高斯窗口寬和波長(zhǎng)的比。
對(duì)于一幅大小為I(z)的地基云圖像,進(jìn)行M個(gè)尺度、N個(gè)方向上Gabor小波變換可得到在不同方向和尺度上能量信息。
(3)式中,Xμ,ν(z)表示在尺度 ν方向 μ 上 Gabor核函數(shù)的卷積結(jié)果。地基云圖像在5個(gè)尺度(5個(gè)像素單位)和8 個(gè)方向(0°,45°,90°,135°,180°,225°,270°,315°)上卷積結(jié)果如圖1 所示。
圖1 地基云圖像卷積結(jié)果Fig.1 Convolution results of a ground nephogram
雖然Xμ,ν(z)能有效地表示地基云的紋理特征,但易造成較高的分類誤差。因此,這里采用能量均值Pμ,ν(z)和標(biāo)準(zhǔn)方差 Qμ,ν(z)作為紋理特征,則更能達(dá)到較高分類準(zhǔn)確率的目的。尺寸為M×N圖像I(z)的均值和標(biāo)準(zhǔn)方差為
用T表示圖像I(z)的紋理特征向量,則T可以表示為
為了增強(qiáng)該紋理特征向量在圖像特征表示中的魯棒性和抗噪聲性以及后期數(shù)據(jù)處理,將能量信息在紋理特征向量中的元素按從大到小的順序排列。假設(shè)在μ1方向和ν1尺度具有最大能量,在μ2方向和ν2尺度上具有次大能量,則T可以修改為
BP神經(jīng)網(wǎng)絡(luò)包含了前向傳播訓(xùn)練和反向傳播連接權(quán)值修正的過(guò)程,具有很強(qiáng)的識(shí)別和分類能力[10]。前向神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的誤差反向傳播算法解決了多層網(wǎng)絡(luò)中隱含層神經(jīng)連接權(quán)值的學(xué)習(xí)問(wèn)題。將提取的地基云圖的紋理特征向量作為BP神經(jīng)網(wǎng)絡(luò)的輸入,利用中國(guó)云圖庫(kù)中的標(biāo)準(zhǔn)云圖結(jié)合氣象站實(shí)際地基云圖數(shù)據(jù)作為訓(xùn)練樣本,得到BP神經(jīng)網(wǎng)絡(luò)分類器。為了提高解決方案的效率和分類精度,提出將多個(gè)BP神經(jīng)網(wǎng)絡(luò)并聯(lián),類似陀螺的分類器,該分類器的主要思想就是通過(guò)在學(xué)習(xí)和泛化中使用距離作為目標(biāo)函數(shù)來(lái)實(shí)現(xiàn),分類器中的一個(gè)網(wǎng)絡(luò)代表一個(gè)類,這樣就能使得一個(gè)網(wǎng)絡(luò)對(duì)應(yīng)一個(gè)類。對(duì)一個(gè)未知模式進(jìn)行分類就是選取最適合它的一個(gè)網(wǎng)絡(luò)模型,使兩者之間具有最小差別。陀螺分類器的優(yōu)勢(shì)在于只需要計(jì)算全部類數(shù)目的距離,與學(xué)習(xí)數(shù)據(jù)大小無(wú)關(guān)[11]。對(duì)于N類不同的地基云圖像,把提取的圖像特征組成特征矩陣,對(duì)應(yīng)的期望輸出為一個(gè)N×N的矩陣T,T的每一行代表所要分類的某類地基云,其分類實(shí)現(xiàn)的主要過(guò)程如下。
1)訓(xùn)練得到BP神經(jīng)網(wǎng)絡(luò)分類器neti。
2)設(shè)待分類地基云圖像數(shù)據(jù)為P,將P輸入分類器,計(jì)算出BP神經(jīng)網(wǎng)絡(luò)分類器的輸出矩陣A,輸出矩陣A的計(jì)算公式為
3)計(jì)算輸出矩陣A中的最大元素Am=max[A1,A2,A3,A4,…,AN]。
4)輸出矩陣 A 位于第m(m∈(1,2,3,4,…,N))列,那么根據(jù)Am就可以得出,分類結(jié)果就是在期望輸出矩陣T的第m行所表示的那類云上。圖2為陀螺分類器的結(jié)構(gòu)圖。
圖2 陀螺分類器結(jié)構(gòu)Fig.2 Structure of gyro classifier
為了驗(yàn)證本文中的方法在地基云圖分類識(shí)別中的效果,實(shí)驗(yàn)采用經(jīng)人工精確判別過(guò)的地基云圖像作為訓(xùn)練樣本,這些樣本來(lái)自于氣象站和《中國(guó)云圖》數(shù)據(jù)集等,并且這些圖片都是經(jīng)過(guò)灰度化處理的尺寸為18×27像素的圖像。
1)將采集到的地基云圖樣本圖例進(jìn)行適當(dāng)?shù)幕叶然?、裁剪等預(yù)處理,形成統(tǒng)一的樣本庫(kù)。
2)使用Gabor小波變換提取實(shí)驗(yàn)樣本的紋理特征,作為該類地基云圖的分類識(shí)別特征參數(shù)。在Gabor小波提取紋理特征時(shí)尺度的選擇很重要。過(guò)大了不能很好地體現(xiàn)圖像的局部特性,過(guò)小了又容易受噪聲影響。
3)定義一個(gè)矩陣 F,F(xiàn)[1]存儲(chǔ)特征向量 T,F(xiàn)[2]存儲(chǔ)分類信息。在實(shí)驗(yàn)中,地基云圖樣本的預(yù)期輸出為0.9。將F作為BP神經(jīng)網(wǎng)絡(luò)的輸入輸出,進(jìn)行訓(xùn)練。訓(xùn)練過(guò)程中,樣本相互之間形成正樣本與負(fù)樣本,例如濃積云為正樣本時(shí),其他4類云樣本為負(fù)樣本,以此類推。如圖3所示。
圖3 神經(jīng)網(wǎng)絡(luò)輸入輸出Fig.3 Input and Output of Neural Network
由此可以得到,具有較強(qiáng)分類能力的神經(jīng)網(wǎng)絡(luò),并以此作為各個(gè)地基云圖云類的分類依據(jù)。經(jīng)過(guò)多次的測(cè)試訓(xùn)練,實(shí)驗(yàn)中訓(xùn)練函數(shù)采用尺度共軛梯度法(scaled conjugate gradient,SCG),訓(xùn)練精度要求為0.001。
4)訓(xùn)練完成后,使用此BP神經(jīng)網(wǎng)絡(luò)構(gòu)成的陀螺分類器來(lái)檢測(cè)未知樣本的云類。
針對(duì)步驟2)所面臨的問(wèn)題,處理數(shù)字圖像的Gabor小波通常在當(dāng)參數(shù)σ=2π,kmax=π/2和f=的條件下在5個(gè)尺度ν∈{0,…,4}和8個(gè)方向μ∈{0°,…,315°}上進(jìn)行采樣。為了獲得理想的實(shí)驗(yàn)參數(shù),共進(jìn)行了4次比較試驗(yàn),每次實(shí)驗(yàn)都是在其他條件不變的情況下,分別選取3個(gè)尺度、4個(gè)方向(3S4D);3個(gè)尺度、12個(gè)方向(3S12D);5個(gè)尺度、8個(gè)方向(5S8D);9個(gè)尺度、4個(gè)方向(9S4D);9個(gè)尺度、12個(gè)方向(9S12D),共5個(gè)有比較意義的參數(shù),得出分類正確率,實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果如表1所示。其中,選取的5個(gè)尺度、8個(gè)方向的實(shí)驗(yàn)參數(shù)獲得了最好的實(shí)驗(yàn)結(jié)果。這里選取在5個(gè)尺度ν∈{0,…,4}和8個(gè)方向μ∈{0,…,7}上提取地基云圖的特征向量T。
表1 不同尺度和方向下的實(shí)驗(yàn)結(jié)果Tab.1 Experiment results with different scales and directions
本實(shí)驗(yàn)的對(duì)象主要是5類常見的云:濃積云、積雨云、雨層云、透光高層云、卷積云。訓(xùn)練過(guò)程中使用濃積云等5類云各200幅圖片,共1 000幅作為整個(gè)實(shí)驗(yàn)的訓(xùn)練樣本。
按照上述實(shí)驗(yàn)方案,把收集到的訓(xùn)練樣本輸入,得到圖像紋理特征矩陣F,數(shù)據(jù)分布如圖4所示。將矩陣F應(yīng)用到神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,訓(xùn)練神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差曲線如圖5所示。最后,可將訓(xùn)練完成的網(wǎng)絡(luò)應(yīng)用于地基云圖的分類。
圖4 紋理特征數(shù)據(jù)分布Fig.4 Distribution of texture feature data
本實(shí)驗(yàn)方案中提出了將神經(jīng)網(wǎng)絡(luò)并聯(lián)形成陀螺分類器的思想,在同等條件下提高了單獨(dú)使用BP神經(jīng)網(wǎng)絡(luò)分類器的準(zhǔn)確率。BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成之后,用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)進(jìn)行分類,輸入5類云圖各50幅進(jìn)行分類實(shí)驗(yàn),根據(jù)神經(jīng)網(wǎng)絡(luò)分類輸出,得出分類結(jié)果統(tǒng)計(jì)如圖6所示。圖6中,每部分中的5個(gè)數(shù)據(jù)統(tǒng)計(jì)表示輸入的50幅該類云圖樣本最終得到的分類結(jié)果統(tǒng)計(jì),如第1部分表示輸入50幅濃積云圖,分類得到了41個(gè)濃積云分類結(jié)果、2個(gè)積雨云分類結(jié)果、3個(gè)雨層云分類結(jié)果、1個(gè)透光高層云分類結(jié)果、3個(gè)卷積云分類結(jié)果。
圖5 神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差曲線圖Fig.5 Error graph of BPNN training
圖6 實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)圖Fig.6 Statistic diagram of experimental result
圖6中,濃積云分類的正確率為82%;積雨云分類的正確率為78%;雨層云分類的正確率為78%;透光高層云分類的正確率為80%;卷積云分類的正確率為76%;平均正確率達(dá)到了78.8%。前文中提到Singh等和Calbo等人也對(duì)地基云分類作了相關(guān)的研究,并取得了一定的研究成果。從實(shí)驗(yàn)結(jié)果分類正確率上來(lái)看,本方案較優(yōu)于前兩者的方案。但是在3種實(shí)驗(yàn)方案中,實(shí)驗(yàn)樣本并不一致,這可能會(huì)導(dǎo)致實(shí)驗(yàn)結(jié)果有所偏差,所以,將Singh和Calbo 2個(gè)人的實(shí)驗(yàn)方案結(jié)合本文中的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),平均分類準(zhǔn)確率統(tǒng)計(jì)圖7所示。
從圖6和圖7中看出,本文提出的方案不僅能有效地應(yīng)用于地基云圖分類,而且取得的效果也是比較理想的,相比以往分類方案的正確率要高出10%~20%。
圖7 3種方案正確率比對(duì)Fig.7 Comparation of three schemes
但是,同時(shí)從圖6和圖7中看出,實(shí)驗(yàn)中出現(xiàn)了部分判斷錯(cuò)誤的情況,造成判斷錯(cuò)誤的原因是多因素的。首先,實(shí)驗(yàn)樣本數(shù)量有限,描述不夠精細(xì),而且還受到成像設(shè)備的局限性、太陽(yáng)光照、能見度等影響,部分樣本的清晰度不高,對(duì)某一類云的形態(tài)的概括性不強(qiáng),導(dǎo)致標(biāo)準(zhǔn)特征參數(shù)不夠全面,在分類的過(guò)程中產(chǎn)生了一些誤差。然后,在對(duì)未知樣本進(jìn)行分類識(shí)別的過(guò)程中,如果未知樣本圖片像素較高,整個(gè)識(shí)別過(guò)程時(shí)間花費(fèi)較大。
將圖像處理、模式識(shí)別等技術(shù)應(yīng)用于地基云圖像的分類識(shí)別中,從實(shí)驗(yàn)結(jié)果來(lái)看,文章提出的方法取得了較好的效果,具有較高的實(shí)用價(jià)值。同時(shí),在未來(lái)的研究過(guò)程中,可以從擴(kuò)大實(shí)驗(yàn)樣本,提高樣本精度,優(yōu)化特征提取算法、提高識(shí)別效率等方面進(jìn)行改進(jìn)與完善。另外,實(shí)驗(yàn)研究表明,在使用Gabor小波提取紋理特征時(shí),正確的參數(shù)選取在特征向量形成中起了至關(guān)重要的作用,這也是今后研究的一個(gè)重點(diǎn)。
[1]楊俊,呂偉濤,馬穎,等.基于自適應(yīng)閾值的地基云自動(dòng)檢測(cè)方法[J]. 應(yīng)用氣象學(xué)報(bào),2009,20(006):713-721.YANG Jun,LV Weitao,MA Yin,et al.An automatic ground-based cloud detection method based on adaptive threshold[J].Journal of applied meteorological science,2009,20(006):713-721.
[2]SINGH M,GLENNEN M.Automated ground-based cloud recognition[J].Pattern Analysis & Applications,2005,8(3):258-271.
[3]TIAN B,SHAIKH M A,AZIMI-SADJADI M R,et al.A study of cloud classification with neural networks using spectral and textural features[J].Neural Networks,IEEE Transactions on,1999,10(1):138-151.
[4]CALBO J,SABBURG J.Feature extraction from wholesky ground-based images for cloud-type recognition[J].Journal of Atmospheric and Oceanic Technology,2008,25(1):3-14.
[5]MUTELO R M,WOO W L,DLAY S S.Discriminant analysis of the two-dimensional Gabor features for face recognition[J].IET Computer Vision,2008,2(2):37-49.
[6]曹林,王東峰,劉小軍,等.基于二維Gabor小波的人臉識(shí)別算法[J].電子與信息學(xué)報(bào),2006,28(3):490-494.CAO Lin,WANG Dongfeng,LIU Xiaojun,et al.Face recognition based on two-dimensional Gabor wavelets[J].Journal of electronics& information technology,2006,28(3):490-494.
[7]張剛,馬宗民.一種采用Gabor小波的紋理特征提取方法[J].中國(guó)圖像圖形學(xué)報(bào),2010,15(002):247-254.ZHANG Gang,MA Zhongmin.An approach of using Gabor wavelets for texture feature extraction[J].Journal of image and graphics,2010,15(002):247-254.
[8]羅亮,金文標(biāo),龔勛.基于Gabor小波和支持向量機(jī)的人臉識(shí)別[J].重慶郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2008,20(2):230-235.LUO Liang,JIN Wenbiao,GONG Xun.Face recognition based on Gabor wavelet and support vector machine[J].Journal of Chongqing University of Posts and Telecommunications:Natural Science Edition,2008,20(2):230-235.
[9]何源,羅予頻,胡東成.基于測(cè)地線活動(dòng)區(qū)域模型的非監(jiān)督式紋理分割[J].軟件學(xué)報(bào),2007,18(3):592-599.HE Yuan,LUO Yupin,HU Dongcheng.Unsupervised texture segmentation based on geodesic active regions[J].Journal of software,2007,18(3):592-599.
[10]陳美,朱琦.基于改進(jìn)神經(jīng)網(wǎng)絡(luò)的自動(dòng)調(diào)制識(shí)別研究[J].重慶郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2009,21(6):764-770.CHEN Mei,ZHU Qi.Research on automatic modulation recognition based on improved neural network[J].Journal of Chongqing University of Posts and Telecommunications:Natural Science Edition,2009,21(6):764-770.
[11]SCHWENK H,MILGRAM M.Constraint tangent distance for on-line character recognition[C]//13th International Conference on Pattern Recognition(ICPR’96).Vienra,Austria:IEEE Press,1996,4:520-524.