王紀輝,李峰,鹿明, 馬駿,郭毅
1. 河南大學 軟件學院,開封 475100 2. 中國空間技術(shù)研究院 錢學森空間技術(shù)實驗室,北京 100094 3. 澳大利亞西悉尼大學,悉尼 NSW 2150
高分四號(GF-4)衛(wèi)星是一顆地球同步軌道高分辨率的光學遙感衛(wèi)星,配置了一個全色多光譜傳感器(panchromatic multispectral sensor,PMS)和一個中紅外傳感器(infrared sensor,IRS)。PMS傳感器的空間分辨率為50 m,重訪時間為20 s,單幅成像幅寬超過500 km。IRS傳感器的空間分辨為400 m,重訪時間為20 s,單幅成像幅寬超過400 km[2]。GF-4可以對地面進行連續(xù)觀測,提供高時間分辨率的連續(xù)圖像,為觀測地面移動目標變化提供有利條件,在減災、氣象、林業(yè)、地震等方面發(fā)揮著重要作用[3]。
在利用遙感圖像獲取地表信息的過程中,云會阻礙地表與傳感器之間的輻射能量傳輸,導致獲取到地表信息存在誤差,從而降低數(shù)據(jù)的利用率。因此為了提高遙感圖像數(shù)據(jù)的利用率和精度,云的檢測和去除是非常重要的,遙感圖像的云檢測一直是一個非?;钴S的研究領(lǐng)域[4]。
云檢測方法大致上可以分為兩類。一類為基于單時相遙感圖像云檢測方法,其中包括基于光譜分析的方法,利用云與典型地表的光譜特征差異來進行云檢測。文獻[5]利用單時相的高分一號數(shù)據(jù)來進行云檢測,但是該方法僅考慮了裸土和植被這兩種下墊面沒有考慮冰雪的情況。文獻[4]利用單時相的GF-4多光譜影像來進行云檢測,但是該方法對于薄云的檢測能力較差且較難區(qū)分冰雪與云像元。還有基于深度學習的云檢測方法,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)、生成式對抗神經(jīng)網(wǎng)絡(luò)(generative adversarial networks,GAN)等深度學習算法被應用于遙感圖像云檢測領(lǐng)域。文獻[6]將影像的特征信息輸入到支持向量機分類器進行分類,從而獲得資源三號衛(wèi)星影像的云檢測結(jié)果,但是該方法步驟較多、網(wǎng)絡(luò)復雜且無法實現(xiàn)像素級的云檢測。另一類為基于多時相遙感圖像云檢測方法,這種方法通過計算多張不同時間獲取的衛(wèi)星影像之間的差異,將這些圖像之間光譜特征發(fā)生顯著變化的像元標記為云像元,來實現(xiàn)遙感圖像的云檢測。文獻[7]提出了一種多時相多通道閾值結(jié)合的風云四號氣象衛(wèi)星云檢測方法,但是GF-4影像的波段較少,該方法不適用于GF-4影像的云檢測。文獻[8]提出了一種不依賴于熱紅外波段增強型多時相云檢測算法,解決了單時相云檢測中難以區(qū)分高亮地表和云的問題,有效提高了云檢測的精度,但是該方法需要一景無云的影像作為參考,存在一定的局限性,文獻[2]提出一種多時相RTD云檢測算法來實現(xiàn)GF-4影像的云檢測,但是該算法在下墊面為冰雪時云檢測精度較低。
云與像元在可見光波段的表觀反射率相近,僅依靠可見光波段難以區(qū)分云與冰雪像元。而與其他地球同步軌道衛(wèi)星相比,GF-4衛(wèi)星影像的波段較少,只有全色、紅、綠、藍、近紅外和中紅外這6個波段。這導致了單時相云檢測算法由于缺乏熱紅外波段難以檢測出冰雪像元,而多時相云檢測算法又依賴于云的移動來區(qū)分云與冰雪像元,這很大程度上影響了云檢測的精度,進而影響了GF-4影像的下一步利用率和精度。
根據(jù)GF-4衛(wèi)星可以提供高時間分辨率連續(xù)的可見光影像和中紅外影像[9]這一特征,本文提出了一種多時相多通道云檢測算法。該算法利用云與典型地表的光譜特征分析來識別出潛在云像元,使用多時相影像像元之間的光譜差異來識別出移動的云像元,利用中紅外波段反演出地表的亮度溫度識別出冰雪像元。通過大量試驗和驗證結(jié)果表明該算法對GF-4號衛(wèi)星影像具有較高的云檢測精度,特別是在區(qū)分云與冰雪像元的方面優(yōu)于其他算法。
為了驗證算法的適用性,選取了3個研究區(qū)域,研究區(qū)域一為中國海南省及其相鄰海域,位于106°44′(E)~111°37′(E),17°42′(N)~22°31′(N),該區(qū)域包括海面、山地、河道豐富的地表類型;選擇2017-07-27,當日薄云較多。研究區(qū)域二為中國遼寧省和吉林省部分地區(qū),位于120°14′(E)~127°21′(E),37°38′(N)~44°10′(N),該區(qū)域的覆蓋地表類型大多為積雪覆蓋的裸土,還包括森林和結(jié)冰的河流、冰雪等多種地表類型;選擇2017-01-17,當日大面積厚云覆蓋于冰雪表面。研究區(qū)域三為中國安徽省和江蘇省部分地區(qū),位于115°68′(E)~121°51′(E),29°47′(N)~35°26′(N),該區(qū)域包含大面積積雪覆蓋的城區(qū);選擇2017-01-08,當日大面積薄雪覆蓋在城區(qū)。豐富的地表覆蓋類型可以充分驗證本文算法對于不同下墊面云的檢測精度。
本文采用的研究數(shù)據(jù)為GF-4衛(wèi)星全色多光譜傳感器獲取的50m分辨率的多光譜影像和中紅外傳感器獲取的400 m分辨率的中紅外影像。GF-4衛(wèi)星獲取的多光譜影像和中紅外影像的波段分布以及相關(guān)參數(shù)如表1所示[10]。其中,10組不同地區(qū)不同時間的多光譜和中紅外影像作為參考影像包含裸土、水體、植被和冰雪等地表覆蓋類型,用于確定光譜分析的閾值參數(shù)。每組有3張地點相同且時間為同一天的影像,用于多時相云檢測。3組海南、遼寧和安徽研究區(qū)域的多光譜和中紅外影像,作為測試影像用于驗證本文云檢測算法的精度。
表1 GF-4衛(wèi)星傳感器波段分布以及相關(guān)參數(shù)
云檢測算法主要分為4個步驟:①對GF-4衛(wèi)星多光譜影像和中紅外影像進行預處理;②利用可見光近紅外波段中云和其他典型地表的光譜差異識別出潛在云像元;③利用多時相可見光影像藍光波段之間的差異識別出地表上移動的云像元;④利用中紅外影像反演的地表亮度溫度去除冰雪像元。GF-4衛(wèi)星影像云檢測算法流程如圖1所示。
圖1 GF-4衛(wèi)星影像云檢測算法流程Fig.1 GF-4 satellite image cloud detection algorithm flow
預處理模塊主要分為4個步驟:輻射定標、多時相可見光波段配準、多光譜波段間配準以及多光譜和中紅外波段配準。
(1)輻射定標
對GF-4號多光譜影像和中外影像進行輻射定標,將原始DN值轉(zhuǎn)換為表觀輻亮度[11]:
L=Gain×DN+offset
(1)
式中:L為表觀輻亮度;DN為像元灰度值;Gain為定標斜率;offset為絕對定標系數(shù)偏移量。GF-4號衛(wèi)星影像自帶的XML文件中的輻射定標系數(shù)與實際值差別較大,可以從中國資源衛(wèi)星應用中心(http:∥www.cresda.com/CN/)發(fā)布的GF-4絕對定標系數(shù)文件中獲取得到。將上一步計算得到的表觀輻亮度轉(zhuǎn)換成表觀反射率[12]。
(2)
式中:ρ為表觀反射率;D為日地天文單位距離;ESUN為大氣層頂?shù)钠骄柟庾V輻照度;θ為太陽天頂角,可以從GF-4衛(wèi)星影像自帶的XML文件中獲得。
(2)多時相可見光波段配準
GF-4衛(wèi)星采用的是面陣成像機制對地凝視觀測[13],使得L1級的相鄰時間相同地點的多光譜影像通過簡單的平移與旋轉(zhuǎn)就能實現(xiàn)配準。采用基于相位相關(guān)和重采樣的亞像素配準算法[14]來實現(xiàn)多時相可見光波段的亞像素級配準。首先基于相位相關(guān)實現(xiàn)像素級的粗定位,然后在粗定位點1.5倍的鄰域范圍內(nèi)利用二維快速傅里葉變換實現(xiàn)100倍上采樣,最后基于相位相關(guān)實現(xiàn)重采樣范圍內(nèi)亞像素級的細定位。
(3)多光譜波段間配準
GF-4衛(wèi)星的L1級產(chǎn)品雖然經(jīng)過初步的幾何校正,但是譜段間還是存在一定的偏差,本文采用多時相可見光波段配準的算法進行配準。
(4)多光譜和中紅外波段配準
GF-4號衛(wèi)星的多光譜影像的空間分辨率為50 m,而中紅外影像的空間分辨率為400 m,因此,需要先將影像重采樣至相同分辨率。中紅外影像與多光譜影像是由不同的傳感器拍攝的,在地理位置上還存在著偏差。使用GF-4影像自帶的RPC文件對處理后的GF-4衛(wèi)星多光譜影像與中紅外影像進行波段合成[15],使影像重投影到同一個投影坐標,并使用3次卷積內(nèi)插法將中紅外影像重采樣至50 m分辨率,生成一個具有6個波段的新影像,新生成影像的6個波段分別為全色、藍光、綠光、紅光、近紅外、中紅外,然后以第3個波段為參考圖像,第6個波段為配準圖像使用ENVI[16]的配準方法進行配準。
根據(jù)云與典型地表的光譜分析可以看出,云在可見光和近紅外波段的表觀反射率要高于大多數(shù)典型地表。因此,利用云與典型地表在可見光和近紅外波段的光譜差異來識別潛在云像元。本文通過藍光波段檢測、“白度”指數(shù)檢測、HOT檢測、NDWI檢測和NDVI檢測這5種檢測方法來檢測潛在云像元,只有同時滿足以上5種檢測方法的像元才會被認定為潛在云像元。
(1)藍光波段檢測
云在藍光波段具有很高的表觀反射率,一般都高于其他典型地表。因此,可以根據(jù)藍光波段的表觀反射率來識別基于藍光波段檢測的潛在云像元,檢測方法為:
Rband2>0.15
(3)
式中:Rband2為藍光波段的表觀反射率。
(2)“白度”指數(shù)檢測
部分地物在藍光波段也有較高的反射率,但是云相較于其他典型地物在紅、綠、藍3個可見光波段的反射率變化趨于平緩,因此,文獻[17]提出了“白度”指數(shù)測試的方法用于云檢測。通過“白度”指數(shù)來識別基于“白度”指數(shù)的潛在云像元,檢測方法如下:
Raver=(Rband2+Rband3+Rband4)÷3
(4)
(5)
式中:Rband3為綠光波段表觀反射率;Rband4為紅光波段表觀反射率;Raver為紅、綠、藍光3個波段表觀反射率的均值。
(3)HOT檢測
霧霾最優(yōu)化轉(zhuǎn)換(haze optimized transformation,HOT)最初是用來檢測衛(wèi)星影像中的霧霾,在可見光波段中大多數(shù)晴空像元的藍光與紅光波段的表觀反射率存在線性關(guān)系,當受到霧霾影響時線性關(guān)系會發(fā)生變化[18]。因此,文獻[19]將HOT檢測應用于區(qū)分云與霧霾,取得了很好的效果。通過HOT值來識別基于HOT檢測的潛在云像元,檢測方法為:
Rband2-0.5×Rband4>0.15
(6)
(4)NDWI檢測
歸一化水指數(shù)(normalized difference water index,NDWI)一般是用來提取影像中的水體信息,水體在綠光波段的表觀反射率較高,而在近紅外波段卻隨著波長的增加而下降[20]。因此,水體的NDWI值一般較高,通過NDWI值來識別基于NDWI檢測的潛在云像元,檢測方法為:
(7)
式中:Rband5為近紅外波段的表觀反射率。
(5)NDVI檢測
歸一化植被指數(shù)(normalized difference vegetation index,NDVI)一般是用來檢測衛(wèi)星影像中的植被覆蓋情況[21]。植被在紅光波段的表觀反射率較低,而在近紅外波段卻迅速增加。因此,可以通過NDVI值來識別基于NDVI檢測的潛在云像元,檢測方法為:
(8)
GF-4衛(wèi)星獲取多光譜影像的重訪時間為20 s,因此,便于獲取同一天相鄰時間內(nèi)同一地點的多幅影像。GF-4衛(wèi)星影像的空間分辨率為50 m,在GF-4多光譜影像的重訪時間內(nèi)可以合理地假設(shè)地表沒有發(fā)生改變。在藍光波段云的表觀反射率一般高于其他典型地表,而云陰影的表觀反射率明顯低于大部分的典型地表,當云發(fā)生移動的時候云陰影也會隨之發(fā)生移動。因此,當同一位置像元的表觀反射率發(fā)生較大增加時,可以認定此像元為移動的云像元或者云陰影像元。通過3幅時間相鄰預處理配準后的影像之間的藍光波段表觀反射率差值來檢測移動的云像元并且去除云陰影像元,檢測方法如下:
(9)
(10)
在可見光近紅外波段,冰雪與云的表觀反射率無論是在數(shù)值上還是在變化的趨勢上都非常接近,僅利用可見光近紅外波段很難去除冰雪像元。文獻[22]利用綠光和短波紅外的表觀反射率計算歸一化雪蓋指數(shù)(normalized difference snow index,NDSI)來去除冰雪像元,而GF-4衛(wèi)星僅有可見光近紅外和中紅外波段,缺少短波紅外和熱紅外波段。本文通過GF-4中紅外影像來反演地表的亮度溫度,根據(jù)亮度溫度設(shè)立閾值來區(qū)分云與冰雪像元。亮度溫度(brightness temperature,BT),是與傳感器觀測地表物體輻射出射度相等的黑體溫度,在數(shù)值上等于輻射溫度[23]。其計算方法為:
(11)
式中:h=6.626 2×10-34J·s為普朗克常數(shù);T為亮度溫度;c=2.997 93×108m/s為光速;k=1.380 6×10-23J/K為玻爾茲曼常數(shù);λ為波長。
固定閾值很難精準識別云像元,這是由于云像元的表觀反射率會受到地表類型的影響,特別是薄云像元,不同的地表類型表觀反射率會發(fā)生很大變化。本文將10組參考影像裁切成大小為512×512像素的下墊面分別為裸土、水體、植被和冰雪的影像,每種下墊面各10張影像,通過試驗驗證確定了如表2所示的云檢測閾值。
表2 不同地表類型的云檢測閾值
為了對云檢測的精度精確評估,本文采用了對比試驗和定量分析的方法。
(1)傳統(tǒng)單時相云檢測算法
本文采用的傳統(tǒng)單時相云檢測算法是一種基于光譜分析的閾值云檢測算法[4],基于云與典型地表的光譜特征,使用光譜差異檢測出潛在云像元,然后根據(jù)有云像元和無云像元的光譜變化率差異計算云概率。
(2)SVM算法
支持向量機(support vector machine,SVM)算法是一種高精度的機器學習分類算法[24],適用于云檢測領(lǐng)域。在實現(xiàn)SVM算法的過程中,使用本文算法相同的參考圖像獲取SVM算法最佳參數(shù)。通過測試線性核函數(shù)、多項式核函數(shù)、徑向核函數(shù)和sigmod核函數(shù)的云分類效果,核函數(shù)選擇徑向核函數(shù)、核函數(shù)系數(shù)選擇0.2、懲罰參數(shù)選擇100時云分類效果最佳。
(3)RTD算法
實時差分(real time difference,RTD)算法是一種高精度的多時相云檢測算法[2],通過計算一對實時影像之間的差異來獲得移動的云,以便去除高亮地表和冰雪像元。
(4)定量分析
為了對云檢測的精度進行定量分析,本文采用云檢測領(lǐng)域通常用到的準確識別率、誤檢率和漏檢率[25]來對結(jié)果進行量化分析。
(12)
(13)
(14)
式中:correct為云像元的準確識別率,true為影像中被正確檢測為云像元的個數(shù),miss為影像中云像元被檢測為晴空像元的個數(shù),commission為云像元的誤檢率,false為影像中晴空像元被檢測為云像元的個數(shù),omission為云像元的漏檢率。
為了驗證本文算法的適用性,選擇了海南、遼寧和安徽3個不同的研究區(qū)域進行實驗,采取對比試驗的方式驗證算法的正確性,將本文算法的檢測結(jié)果與其他3個云檢測算法進行對比并進行定量分析,其中包括傳統(tǒng)單時相云檢測算法、SVM算法, RTD云檢測算法。
海南研究區(qū)域有豐富的水體和薄云,便于測試本文算法對水體上的薄云的檢測能力,檢測結(jié)果如圖2所示。
圖2 海南研究區(qū)域云檢測結(jié)果Fig.2 Cloud detection results in Hainan study area
圖2(a)為海南研究區(qū)域截取大小為2048×2048像素的紅、綠、藍波段組成的RGB影像,圖2(b)為預處理后的中紅外影像,圖2(c)(d)(e)分別為單時相算法云檢測結(jié)果和SVM算法云檢測結(jié)果和RTD算法云檢測結(jié)果,圖2(e)為多時相多通道算法云檢測結(jié)果。為了更好地評價算法的適用性,在可見光影像中隨機選取了2 000個像素點對算法進行定量分析。4種算法的定量分析結(jié)果如表3所示。通過分析結(jié)果對比發(fā)現(xiàn),準確識別率都達到了90%以上,但其他3種算法漏檢率比多時相多通道算法高,這是由于在可見光波段水體表面薄云的表觀反射率與水體差別不大,導致其他3種算法沒有將部分水體表面的薄云檢測出來。而RTD算法的誤檢率相較于本文算法低,這是由于RTD算法通過多時相云檢測將海岸線邊緣的高亮地表檢測出來,而本文算法將少部分高亮地表檢測為云像元。
表3 海南研究區(qū)域云檢測結(jié)果定量分析
遼寧研究區(qū)域中含有大面積冰雪覆蓋的裸土和森林以及結(jié)冰的河流,便于檢測本文算法去除冰雪的能力,檢測結(jié)果如圖3所示。
圖3 遼寧研究區(qū)域云檢測結(jié)果Fig.3 Cloud detection results in Liaoning study area
從檢測結(jié)果可以看出多時相多通道算法能很好地區(qū)分出云與冰雪像元,而單時相算法卻將部分被積雪覆蓋的地表以及結(jié)冰的河道誤判成云,這是由于在可見光近紅外波段冰雪與云的表觀反射率差別不大,而SVM算法和RTD算法將部分裸土檢測為云,部分薄云沒有檢測出來。對遼寧研究區(qū)域進行定量分析,分析結(jié)果如表4所示。通過對分析結(jié)果對比發(fā)現(xiàn),多時相多通道算法的云檢測正確率高于其他3種算法,而且誤檢率也低于其他3種算法。
表4 遼寧研究區(qū)域云檢測結(jié)果定量分析
安徽研究區(qū)域中包括由大量被積雪覆蓋的城區(qū)和部分覆蓋在積雪上面的云,便于驗證本文算法檢測冰雪表面云的能力,檢測結(jié)果如圖4所示。
圖4 安徽研究區(qū)域云檢測結(jié)果Fig.4 Cloud detection results in Anhui study area
從檢測結(jié)果上看多時相多通道算法能夠很好地檢測出積雪表面的云像元,而其他3種算法卻將部分積雪覆蓋的城區(qū)檢測為云像元,這是由于兩者在可見光近紅外波段的表觀反射率相近。SVM算法將積雪表面覆蓋薄云像元檢測為冰雪像元,導致部分薄云沒有檢測出來。對安徽研究區(qū)域進行定量分析,分析結(jié)果如表5所示,通過分析結(jié)果對比發(fā)現(xiàn),多時相多通道算法的識別準確率高于單時相算法和SVM算法,而且誤檢率和漏檢率均低于單時相算法和SVM算法。
表5 安徽研究區(qū)域云檢測結(jié)果定量分析
GF-4衛(wèi)星是中國第一個高分辨率地球同步軌道衛(wèi)星,GF-4衛(wèi)星影像波段較少且缺少熱紅外波段,導致云檢測過程中去除冰雪像元面臨著較大困難。本研究根據(jù)GF-4衛(wèi)星的特點,提出一種多時相多通道的云檢測算法,采用光譜分析的方法[26]來檢測影像中的潛在云像元,并采用多時相數(shù)據(jù)光譜差異的方法來檢測影像中移動的云像元,結(jié)合中紅外影像來去除影像中的冰雪像元。該算法在海南、遼寧和安徽3個研究區(qū)域進行了測試,并與傳統(tǒng)單時相云檢測算法、SVM算法和RTD算法的檢測結(jié)果進行對比,結(jié)果表明,本文算法在不同下墊面的云檢測準確識別率均優(yōu)于其他3種算法,特別是對于薄云和冰雪像元有更好的檢測精度。
雖然本文算法在GF-4衛(wèi)星影像的云檢測方面取得了較高的精度,但是也有一定的局限性。一方面是GF-4的多光譜影像和中紅外影像是由不同傳感器獲取的,兩者的分辨率和幾何位置不同,配準的難度較大,而配準的精度影響冰雪像元的去除,從而導致云檢測精度的下降。另一方面是在高亮地表的檢測方面誤檢率較高。未來可以考慮更加精確的配準方法來實現(xiàn)GF-4可見光波段和中紅外波段高精度的配準以及降低高亮地表的誤檢率,進一步完善GF-4衛(wèi)星影像的云檢測。