李冰潔,李國(guó)東
(新疆財(cái)經(jīng)大學(xué),新疆 烏魯木齊 830012)
基于灰度共生矩陣與AdaBoost判別法的冰雹預(yù)測(cè)
李冰潔,李國(guó)東
(新疆財(cái)經(jīng)大學(xué),新疆 烏魯木齊 830012)
選取新疆地區(qū)雹云與非雹云雷達(dá)反射率圖像進(jìn)行降雹與無(wú)雹天氣分析。用中值濾波與九階拉普拉斯算子處理圖像得到圖像的紋理信息。用灰度共生矩陣方法提取圖像的能量、熵、慣性矩、相關(guān)性、逆差矩并提取圖像的一、二、三階顏色矩,將這8個(gè)變量進(jìn)行標(biāo)準(zhǔn)化作為特征數(shù)據(jù),利用AdaBoost判別法建立判別分類(lèi)器,對(duì)雹云圖像進(jìn)行分析判別。結(jié)果顯示該文采用的方法能夠明顯的區(qū)分降雹與無(wú)雹云層,判別誤差較小,具有參考價(jià)值。
拉普拉斯變換;灰度共生矩陣;顏色矩;AdaBoost分類(lèi)器
強(qiáng)對(duì)流天氣指的是陸地水循環(huán)系統(tǒng)中氣流擾動(dòng)造成的對(duì)大于17.2 m/s的氣流性大風(fēng)和大于20 mm/h的短時(shí)強(qiáng)降水的天氣現(xiàn)象。強(qiáng)對(duì)流天氣往往作用范圍小,持續(xù)時(shí)間短,但是造成破壞力很大,對(duì)正常的生產(chǎn)生活有很大影響,由強(qiáng)對(duì)流天氣而造成的人身以及財(cái)產(chǎn)損失的報(bào)道屢見(jiàn)不鮮。冰雹是常發(fā)的一種強(qiáng)對(duì)流天氣。
我國(guó)是冰雹災(zāi)害天氣發(fā)生較為頻繁的國(guó)家。數(shù)據(jù)統(tǒng)計(jì)我國(guó)每年冰雹災(zāi)害損失極高,僅2016年5—9月期間就發(fā)生多次冰雹災(zāi)害,造成嚴(yán)重?fù)p失。如:5月3日河北張家口市的13個(gè)縣遭受強(qiáng)冰雹災(zāi)害,其中造成的農(nóng)業(yè)損失高達(dá)5.81億元,受災(zāi)面積達(dá)30 648.9 hm2,其中大部分農(nóng)田絕收;6月23日下午江蘇省的鹽城遭遇龍卷風(fēng)、冰雹等強(qiáng)對(duì)流天氣,造成了嚴(yán)重的人生傷亡,當(dāng)?shù)氐耐ㄓ?、電力、交通、農(nóng)業(yè)、經(jīng)濟(jì)都遭受?chē)?yán)重創(chuàng)傷;8月23日22時(shí)左右,新疆生產(chǎn)建設(shè)兵團(tuán)第一師阿拉爾市已接近成熟的香梨、紅棗等農(nóng)作物受到嚴(yán)重的毀壞,受災(zāi)面積超過(guò)1.36萬(wàn)hm2,初步統(tǒng)計(jì)的損失為4.76億元;9月5日罕見(jiàn)冰雹突襲煙臺(tái)市,冰雹天氣持續(xù)30 min左右,雹粒有一元硬幣大小,據(jù)統(tǒng)計(jì)僅農(nóng)作物受損面積高達(dá)2 281 hm2,造成直接經(jīng)濟(jì)損失4億多元等。冰雹災(zāi)害的發(fā)生對(duì)農(nóng)業(yè)、建筑業(yè)、交通、通訊、娛樂(lè)等方面都有影響,且每年由冰雹災(zāi)害造成的損失十分嚴(yán)重。所以需要及時(shí)的預(yù)測(cè)預(yù)警冰雹的發(fā)生。
美國(guó)運(yùn)用名為WSR-88D的冰雹算法(Hail Detection Algorithm,簡(jiǎn)稱(chēng)HAD) 對(duì)冰雹概率(Possibility of Hail,簡(jiǎn)稱(chēng)POH)、強(qiáng)冰雹概率(Possibility of Strong Hail,簡(jiǎn)稱(chēng)POSH)及冰雹災(zāi)害中的最大預(yù)期冰雹直徑(Maximum Expected Hail Diameter,簡(jiǎn)稱(chēng)MEHS),在預(yù)防冰雹災(zāi)害和減少其帶來(lái)的損失方面有著突出貢獻(xiàn)。我國(guó)在冰雹災(zāi)害預(yù)測(cè)領(lǐng)域也有很大成就。王瑾[1]采用GIS分析了貴州省的降雹與地形分布的關(guān)系;廖運(yùn)勛[2]采用低、中頻重力波指數(shù)對(duì)冰雹暴雨進(jìn)行診斷分析;周金蓮[3]等人檢驗(yàn)了CINRAD/SA雷達(dá)的冰雹識(shí)別算法;張秉祥[4]用模糊邏輯對(duì)冰雹天氣雷達(dá)識(shí)別;許弋[5]等人采用高空氣溫壓場(chǎng)相似指標(biāo)算法對(duì)冰雹預(yù)警方法進(jìn)項(xiàng)檢驗(yàn)。
由于冰雹的形成與積雨云的高度、環(huán)境溫度、含水量、氣流等因素都有關(guān)系,國(guó)內(nèi)的研究數(shù)據(jù)多為云層的高度、溫度、厚度,而忽略了云層圖像蘊(yùn)含的信息。本文以新疆地區(qū)的雹云圖像為基礎(chǔ),利用圖像增強(qiáng)技術(shù),灰度共生矩陣,顏色矩與AdaBoost判別來(lái)識(shí)別降與不降雹的雷達(dá)圖像。通過(guò)驗(yàn)證此方法可有效地區(qū)分雹云圖像。
2.1 圖像增強(qiáng)
圖像增強(qiáng)在圖像處理中是應(yīng)用最廣、最基本的技術(shù)之一,其目的是對(duì)研究圖像進(jìn)行有效處理,從而得到視覺(jué)效果更好、更適于某個(gè)應(yīng)用處理的圖像。圖像增強(qiáng)有很多種方法,大致分為兩類(lèi):空間域和頻域兩種。在空間域上的圖像增強(qiáng)技術(shù)是對(duì)圖像像素對(duì)應(yīng)的灰度值直接進(jìn)行處理;頻域上的圖像增強(qiáng)技術(shù)則是在某個(gè)變換域上對(duì)圖像進(jìn)行相應(yīng)變換。本文先采用中值濾波對(duì)圖像去除噪聲,再用拉普拉斯算子提取圖像的邊緣信息。
雷達(dá)圖像在生成和傳輸過(guò)程中因?yàn)槟承┰蛉菀桩a(chǎn)生噪聲,所以一般在提取圖像特征之前應(yīng)先對(duì)圖像進(jìn)行平滑處理,即圖像去噪。圖像去噪的方法分為線(xiàn)性與非線(xiàn)性濾波兩種,在線(xiàn)性濾波的過(guò)程中容易丟失圖像的某些細(xì)節(jié)與邊緣。所以一般采用非線(xiàn)性濾波。中值濾波是非線(xiàn)性濾波的一種,不僅能夠有效的去除圖像中所含的噪聲而且還能將圖像的邊緣較好的保留。根據(jù)實(shí)驗(yàn)對(duì)比本文采用3×3模板的中值濾波對(duì)雷達(dá)云層圖像做去噪處理。
圖像邊緣提取是圖像處理中重要的處理過(guò)程,常被用于圖像數(shù)字信息提取,紋理分析等。圖像的邊緣紋理蘊(yùn)含了重要的信息。拉普拉斯算子[6]在數(shù)學(xué)和物理學(xué)中運(yùn)用非常廣泛,可以作為一個(gè)n維歐式空間的二階微分的邊緣檢測(cè)算子,有旋轉(zhuǎn)不變性即各方向相同。本文采用的算子為9×9的拉普拉斯邊緣檢測(cè)算子,具體如下:
2.2 圖像特征提取
2.2.1 顏色矩(Color Moment) 對(duì)于彩色圖像而言顏色是最重要的特征之一,其廣泛的被用于圖像的檢索之中。
顏色矩可以明顯的表示出彩色圖像的顏色分布特征。此方法的特點(diǎn)是:不需要進(jìn)行顏色空間的量化,從而減少出現(xiàn)誤檢的概率,得到的圖像特征值維數(shù)較低,方便運(yùn)算。包含:一階矩(圖像均值)、二階矩(圖像方差)和三階矩(圖像斜度)等,一般情況下彩色圖像的顏色特征分布信息在一、二、三階的顏色矩中即可呈現(xiàn),所以一般采用低階矩來(lái)衡量圖像的顏色特征,它們的計(jì)算方法為:
(1)
(2)
(3)
其中,pi,j為彩色圖像中第i個(gè)行中第j列的像素的值,N表示為圖像像素總個(gè)數(shù)。
2.2.2 灰度共生矩陣 圖像的紋理是一種區(qū)域性的特征,描述的是圖像各像素之間的空間分布特征。因?yàn)閳D像的特征信息能被紋理特征充分的展現(xiàn),它是描述圖像、分析圖像、識(shí)別圖像的重要依據(jù),所以紋理的提取在目標(biāo)識(shí)別中是非常重要的。圖像紋理特征的提取方法有很多,如:基于空間頻率、局部統(tǒng)計(jì)特性、隨機(jī)場(chǎng)模型等方法,其中,應(yīng)用最廣泛的是基于灰度共生矩陣的數(shù)字紋理特征。
灰度共生矩陣作為分析圖象結(jié)構(gòu)的基礎(chǔ),是一個(gè)綜合信息,反映的是圖象的灰度在間隔、不同方向、變化幅度。是在圖像紋理模式下像素之間的灰度空間關(guān)系,體現(xiàn)了各灰度的空間依賴(lài)性。它的元素表示的是圖像中的兩個(gè)灰度像素值i和j,它們之間的距離為d,在某一特定方向下(i,j)這兩個(gè)像素出現(xiàn)的次數(shù)。一般選擇0°、45°、90°、135° 4個(gè)方向。根據(jù)灰度共生矩陣可以得到圖像的:能量、熵、共生和熵、共生差熵、對(duì)比度、相關(guān)、紋理方差、 逆差矩等。本文則選取以下5種典型特征數(shù)據(jù)作為判別變量。
①角二階矩(ASM):
(4)
②對(duì)比度(CON):
(5)
③相關(guān)(COR):
(6)
④熵(ENT):
(7)
⑤逆差距(IDM):
(8)
p(i,j,d,θ)為灰度共生矩陣。
3.1Boosting方法
在實(shí)際中只用一個(gè)模型來(lái)判別一組數(shù)據(jù)的分類(lèi)是不明智的,如果用一個(gè)模型來(lái)清晰地判別數(shù)據(jù)會(huì)非常復(fù)雜,對(duì)模型的精準(zhǔn)性要求也較高,這樣就引出組合模型的概念。組合模型的基本原理是:用現(xiàn)有的一些方法建立一些識(shí)別率不高的回歸模型或弱分類(lèi)器,再將這些準(zhǔn)確率不高的模型結(jié)合起來(lái),組成一個(gè)新的整體分類(lèi)體系達(dá)到改善模型識(shí)別率的效果。Boosting是這類(lèi)方法的典型。
Boosting方法通過(guò)構(gòu)造一組預(yù)測(cè)函數(shù),然后將這組預(yù)測(cè)函數(shù)以一定的方式組合成一個(gè)整體函數(shù)。Boosting方法思想就是:將其他的弱分類(lèi)器作為基礎(chǔ),放于Boosting方法中處理訓(xùn)練樣本,得到不同的訓(xùn)練樣本子集,用所得的樣本子集生成新的基分類(lèi)器。n個(gè)樣本集就會(huì)有n個(gè)基分類(lèi)器產(chǎn)生。每個(gè)基分類(lèi)器反復(fù)調(diào)整誤判數(shù)據(jù)的權(quán)重,進(jìn)行加權(quán)融合,最終用投票方法(voting)產(chǎn)生一個(gè)預(yù)測(cè)模型:
(9)
得到的n個(gè)基分類(lèi)器,每個(gè)分類(lèi)器的識(shí)別率不一定很高,但用Boosting方法將他們聯(lián)合后的結(jié)果的識(shí)別率大大提升。Boosting算法有很多種本文采用Adaboost算法。
3.2Adaboost算法
Boosting算法中最具代表性的算法之一就是AdaBoost,這種算法對(duì)基分類(lèi)器的識(shí)別率的要求不是很高。AdaBoost算法的核心任務(wù)就是把容易的,識(shí)別率低的弱分類(lèi)算法提升為強(qiáng)分類(lèi)算法,以此來(lái)提高模型的識(shí)別率。
Adaboost算法步驟(以?xún)深?lèi)為例):
①輸入訓(xùn)練樣本數(shù)據(jù)。(x1,y1),(x2,y2),…,(xn,yn)。其中xi表示待分類(lèi)樣本各特征數(shù)據(jù)組成的向量,yi表示該分類(lèi)樣本的類(lèi)別標(biāo)簽。本文中每個(gè)xi是一個(gè)八維的向量(x1,x2,…,x8),yi∈{-1,1}。
③令t=1,2,…,T
在Wt下選出樣本數(shù)據(jù),得到不同的弱分類(lèi)器ht:X→{-1,1}。
計(jì)算所得的分類(lèi)器的誤差:
計(jì)算每個(gè)分類(lèi)器的權(quán)重:
更改訓(xùn)練樣本的權(quán)重:
Wt+1(i)=Wt(i)e-αtyiht(xi)/Zt
其中Wt(i)表示第t次迭代時(shí)的樣本權(quán)值向量,Zt為歸一化因子。
3.2Adaboost判別法的實(shí)現(xiàn)與檢驗(yàn)
本文選取新疆地區(qū)氣象雷達(dá)探測(cè)的云層圖像,利用拉普拉斯邊緣提取技術(shù)提取云層圖像的邊緣特征,再提取圖像的灰度共生矩陣中的5個(gè)特征值,并提取一、二、三階顏色矩,把這8個(gè)變量的數(shù)據(jù)標(biāo)準(zhǔn)化求其均值,作為特征數(shù)據(jù)庫(kù),在數(shù)據(jù)庫(kù)中隨機(jī)選取30組數(shù)據(jù)用Adaboost判別法分類(lèi)。如表1,其中分類(lèi)1代表降雹為第1~10組數(shù)據(jù),分類(lèi)2代表無(wú)雹為第11~20組數(shù)據(jù),將這20組數(shù)據(jù)作為判別的基準(zhǔn)類(lèi)生成判別器,對(duì)待測(cè)樣本第21~30組進(jìn)行分類(lèi)(其中前5組為降雹后5組為無(wú)雹)。
表1 訓(xùn)練樣本
將數(shù)據(jù)導(dǎo)入分類(lèi)器,得出前5組均為無(wú)雹,后5組均為降雹。判別均正確。
由于數(shù)據(jù)選取的判別基準(zhǔn)數(shù)據(jù)較少僅20組,AdaBoost分類(lèi)器判別形成的組合分類(lèi)器的準(zhǔn)確率可能存在偶然性,所以在數(shù)據(jù)庫(kù)中另外在隨機(jī)選取60組數(shù)據(jù)作為基準(zhǔn)類(lèi)來(lái)判別,對(duì)樣本重新訓(xùn)練檢驗(yàn)AdaBoost組合分類(lèi)器方法的有效性。
表2 檢驗(yàn)樣本
檢驗(yàn)結(jié)果與表1的一樣,即在輸入的訓(xùn)練樣本較多的情況此方法所建立的分類(lèi)器仍然有較高的準(zhǔn)確性,說(shuō)明本文采取的組合分類(lèi)器的方法具有普適性。
目前冰雹災(zāi)害的預(yù)測(cè)主要分為短期預(yù)測(cè)和短臨預(yù)測(cè)。短期預(yù)測(cè)是指通過(guò)氣象探測(cè)手段來(lái)收集各種天氣要素導(dǎo)入至程序中,以計(jì)算推測(cè)天氣變化的趨勢(shì),以某些特定要素(例如云層中產(chǎn)生冰雹的概率,溫度對(duì)數(shù)壓力系數(shù),風(fēng)廓線(xiàn)圖等等)的變化作為冰雹災(zāi)害發(fā)生和強(qiáng)度預(yù)測(cè)的根據(jù)。用此方法,冰雹災(zāi)害于何時(shí)降臨何地,災(zāi)害達(dá)到何種程度這些數(shù)據(jù)的獲得依賴(lài)于預(yù)測(cè)模型選取,不同的模型對(duì)預(yù)測(cè)結(jié)果影響比較大。短臨預(yù)測(cè)主要利用多普達(dá)雷達(dá)、氣象衛(wèi)星等觀(guān)察對(duì)流層的氣流變化。氣象雷達(dá)發(fā)射雷達(dá)波對(duì)雷達(dá)進(jìn)行掃描,回收諸如反射率因子、組合發(fā)射率、回波頂高、平均徑向速度等數(shù)據(jù)。同短期預(yù)測(cè)相比,雖然短臨預(yù)測(cè)提高了冰雹災(zāi)害預(yù)測(cè)的精度,基本可以精確判斷冰雹災(zāi)害發(fā)生的時(shí)間、區(qū)域和強(qiáng)度,但是犧牲了時(shí)效性,對(duì)于防災(zāi)救災(zāi)工作的開(kāi)展還是有很大制約作用。
如以上介紹的兩種方法,氣象局所應(yīng)用的天氣系統(tǒng)都是利用雷達(dá)探測(cè)的直接數(shù)據(jù)建立數(shù)據(jù)庫(kù)進(jìn)行分析,對(duì)云層反射率圖像的分析較少,如果直接對(duì)天氣雷達(dá)所獲取的數(shù)據(jù)進(jìn)行分析,分析因子就會(huì)局限在溫度,濕度,地表溫度等外在條件,而忽略云層的內(nèi)因,在分析由相似外因形成的極為相近的天氣系統(tǒng)中容易產(chǎn)生誤判。因此判別樣本庫(kù)的建立是提高判別準(zhǔn)確率的有效途徑。
本文通過(guò)新疆自治區(qū)氣象局提供的2009—2010年的氣象雷達(dá)反射率圖像中,選取資料,利用拉普拉斯變換和中值濾波對(duì)圖像增強(qiáng),得到圖像的紋理信息,計(jì)算圖像的灰度共生矩陣的特征值獲取紋理特征數(shù)據(jù),且求得圖像的顏色特征數(shù)據(jù)一、二、三階顏色矩,由這些數(shù)據(jù)構(gòu)成判別分析中的訓(xùn)練樣本。判別分析法中選取Adaboost判別法建立分類(lèi)器進(jìn)行實(shí)際數(shù)據(jù)檢驗(yàn)。檢驗(yàn)結(jié)果表明,分類(lèi)器判別的準(zhǔn)確性較高,可以實(shí)現(xiàn)利用反射率圖像對(duì)雹云的識(shí)別,對(duì)氣象雷達(dá)云圖處理方法有一定的參考價(jià)值。
[1] 王瑾,劉黎平.基于GIS的貴州省冰雹分布于地形因子關(guān)系分析[J].應(yīng)用氣象學(xué)報(bào),2008.10.
[2] 廖云勛,周明,張先俊.中尺度重力波指數(shù)與暴雨冰雹等強(qiáng)對(duì)流天氣的關(guān)系[J].貴州氣象,2010.9.
[3] 周金蓮,鐘敏,等.CINRAD/SA雷達(dá)的強(qiáng)冰雹識(shí)別算法進(jìn)行檢驗(yàn)[J].暴雨災(zāi)害,2012.12.
[4] 張秉祥,李哲,劉黎平,等.基于模糊邏輯的冰雹天氣雷達(dá)識(shí)別算法[J]. 應(yīng)用氣象學(xué)報(bào),2014.7.
[5] 許弋,孫濤,張平.基于相似指標(biāo)法的貴州春季冰雹預(yù)警方法的檢驗(yàn)[J]. 貴州氣象報(bào),2012.10.
[6] 盧允偉,陳友榮.基于拉普拉斯算法的圖像銳化算法研究和實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù),2009,5(6):1513-1515.
[7] 高志忠.基于灰度共生矩陣的織物紋理分析[J].計(jì)算機(jī)工程與設(shè)計(jì),2008.8.
[8] 焦蓬蓬,郭依正,劉麗娟,等. 灰度共生矩陣紋理提取的Matlab實(shí)現(xiàn)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2012-11.
[9] 陳超等.MATLAB應(yīng)用實(shí)例精講—圖像處理與GUI設(shè)計(jì)篇[M]. 北京:電子工業(yè)出版社,2011.
[10]王斌會(huì).多元統(tǒng)計(jì)分析及R語(yǔ)言建模[M]. 廣州:暨南大學(xué)出版社,2011.
[11]王星,褚挺進(jìn).非參數(shù)統(tǒng)計(jì)[M].北京:清華大學(xué)出版社,2015:268-271.
Hail prediction based on gray level co-occurrence matrixand AdaBoost discriminant analysis
LI Bingjie,LI Guodong
(School of Applied Mathematics, Xinjiang University of Finance and Economics, Urumqi 830012, China)
Xinjiang region hail cloud and non-hail cloud radar reflectivity image were selected for analysis. The texture information of the image was processed by median filter and nine order Laplasse operator. Gray level co-occurrence matrix method was adopted to extract the energy, entropy, moment of inertia, correlation, inverse moment of the image, and The first, second and third order color moments of the image were extracted and the eight variables were normalized as feature data. AdaBoost method was used to establish discriminant analysis discriminant classifier, identification of hail cloud image. The results show that this method can obviously distinguish between hail and hail clouds; discriminant error is small, with a reference value.
Laplasse transform; gray level co-occurrence matrix; color moment; AdaBoost classifier
1003-6598(2017)01-0035-05
2016-09-21
李冰潔(1991—),女,在讀碩士,主要從事數(shù)據(jù)挖掘與圖像處理工作,E-mail:295685112@qq.com。
P457
B