白云博 歐陽斯達(dá) 楊朦朦 夏學(xué)齊 王婷
基于雙樹復(fù)小波分解的云量時間序列模型預(yù)測
白云博1,2歐陽斯達(dá)2楊朦朦3夏學(xué)齊1王婷4
(1 中國地質(zhì)大學(xué)(北京),北京 100083)(2 國土衛(wèi)星遙感應(yīng)用中心,北京 100048)(3 山東科技大學(xué),青島 266590)(4 成都理工大學(xué),成都 610059)
針對傳統(tǒng)云量預(yù)測模型應(yīng)用于高分辨率衛(wèi)星影像云量時間序列數(shù)據(jù)時存在的實用性差、擬合效果差及預(yù)測結(jié)果準(zhǔn)確度低的問題,提出了一種基于雙樹復(fù)小波分解的云量時間序列組合模型預(yù)測方法。該方法利用DT-CWT分解的方法提取出云量時間序列的低頻趨勢信息和高頻隨機(jī)信息,對低頻和高頻序列分別應(yīng)用時間序列分析與Elman神經(jīng)網(wǎng)絡(luò)的預(yù)測方法,然后將兩個序列的預(yù)測結(jié)果重構(gòu)得到最終的云量預(yù)測結(jié)果。實驗結(jié)果表明,應(yīng)用雙樹復(fù)小波分解的低頻信息可以更好的反應(yīng)云量變化趨勢,高頻信息也可以更好的保留云量變化的隨機(jī)信息。該方法預(yù)測結(jié)果的平均絕對誤差和均方根誤差相比傳統(tǒng)預(yù)測模型均有所減小,預(yù)測準(zhǔn)確度有所提高,能夠更好的擬合高分辨率衛(wèi)星云量時間序列的變化規(guī)律。在衛(wèi)星成像任務(wù)規(guī)劃時將云量預(yù)測的結(jié)果作為參考信息,選擇云量覆蓋較小的時間窗口,可以獲取更高品質(zhì)的衛(wèi)星有效成像數(shù)據(jù)。
高分辨率影像 雙樹復(fù)小波分解 時間序列分析 神經(jīng)網(wǎng)絡(luò) 衛(wèi)星遙感云量預(yù)測 遙感載荷
隨著遙感技術(shù)的發(fā)展,越來越多的應(yīng)用領(lǐng)域,如全球礦產(chǎn)資源、作物估產(chǎn)、水資源、森林生態(tài)和城市變化檢測等,需要高分辨率、高品質(zhì)衛(wèi)星影像數(shù)據(jù)為生產(chǎn)、生活提供信息支持[1]。在衛(wèi)星運(yùn)行中,針對預(yù)期的成像條件進(jìn)行成像預(yù)估,可為任務(wù)計劃提供重要依據(jù)[2]。其中,對于高分辨率光學(xué)衛(wèi)星影像的獲取,云量占比是影響衛(wèi)星成像品質(zhì)的重要因素,也是判別影像是否為有效數(shù)據(jù)的主要因素[3]。對于特定的成像目標(biāo)區(qū)域,為提升少云或無云的高品質(zhì)衛(wèi)星影像數(shù)據(jù)的獲取成功率,需要提前預(yù)判成像區(qū)域的云量覆蓋情況,選擇在云量較少的時段進(jìn)行高效率的衛(wèi)星成像。因此,對衛(wèi)星成像云量進(jìn)行預(yù)測,提高預(yù)測的準(zhǔn)確度,對最大程度發(fā)揮光學(xué)衛(wèi)星影像獲取能力以及提高衛(wèi)星拍攝效率都有著重大的意義。
在云量預(yù)測相關(guān)模型方法方面,應(yīng)用較廣泛的就是與氣象相關(guān)的短期預(yù)測模型,此方法主要是利用一些模型方法,如模式識別、交叉方法等對云量變化進(jìn)行短期預(yù)測,預(yù)測期通常為幾小時[4]。文獻(xiàn)[5]等將衛(wèi)星圖像(第二代氣象衛(wèi)星)與空中攝像機(jī)(魚眼鏡頭相機(jī))的圖像結(jié)合使用來進(jìn)行云量預(yù)測,短期(1h)或中期(3h)預(yù)測成功率較高。而一般衛(wèi)星的成像任務(wù)計劃通常提前一至兩天,短期預(yù)測模型外推的幾小時預(yù)測結(jié)果較難為任務(wù)計劃提供可靠預(yù)測信息[6]。此外,采用時間序列分析預(yù)測是目前較為常用的中長期云量預(yù)測方法,文獻(xiàn)[7]等通過分析云量時間序列的特點(diǎn)對其進(jìn)行分類,然后采用不同模型對未來云量進(jìn)行預(yù)測,應(yīng)用在氣象衛(wèi)星“風(fēng)云”系列等衛(wèi)星數(shù)據(jù)上,得到了較好的預(yù)測效果。文獻(xiàn)[8]等也應(yīng)用時間序列分析的方法,在低分辨率的國際衛(wèi)星云氣候?qū)W計劃月平均云量數(shù)據(jù)上,得到了很好的驗證。但對于類似“資源三號”(ZY-3)、“高分一號”(GF-1)等高分辨率衛(wèi)星影像所包含的云量數(shù)據(jù),因空間分辨率的提高及時間分辨率的降低,導(dǎo)致云量變化規(guī)律被隨機(jī)性干擾或掩蓋,干擾了時間序列預(yù)測模型對數(shù)據(jù)本質(zhì)規(guī)律的識別。
為解決以上問題,降低高分辨率影像云量數(shù)據(jù)的隨機(jī)性干擾,本文提出一種基于雙樹復(fù)小波分解的云量時間序列分析的高分辨率衛(wèi)星成像預(yù)測方法,通過對高分辨率衛(wèi)星成像的云量時間序列數(shù)據(jù)進(jìn)行雙數(shù)復(fù)小波分解,提取出云量時間序列的低頻趨勢信息和高頻隨機(jī)信息;對低頻、高頻信號分別選取時間序列分析、人工神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,再將預(yù)測結(jié)果重構(gòu)為最終的成像云量預(yù)測值。本文采用ZY-3、GF-1等衛(wèi)星2013—2019年的云量數(shù)據(jù)作為數(shù)據(jù)源,并以月為時間分辨率尺度單位,通過選取攀枝花、喀什、包頭等地區(qū)約為20km×20km矩形區(qū)域作為實驗研究區(qū)進(jìn)行實驗,與針對于低分辨率氣象衛(wèi)星數(shù)據(jù)的傳統(tǒng)預(yù)測方法相比,該方法可以有效挖掘歷史高分辨率影像長序列云量數(shù)據(jù)的內(nèi)在聯(lián)系,提取云量數(shù)據(jù)的趨勢信息,在規(guī)避了隨機(jī)信息對變化規(guī)律的影響的同時,也有效利用了易被忽略的高分辨率影像時間序列的隨機(jī)信息的潛在規(guī)律。
傳統(tǒng)離散小波變換分解后存在頻率混疊及平移敏感性等問題,Kingsbury等人提出了雙樹復(fù)小波變換(dual-tree complex wavelet transform,DT-CWT)[9]。2005年,Selesnick等在原有雙樹復(fù)小波基礎(chǔ)上設(shè)計出的新的雙樹復(fù)小波變換分解與重構(gòu)的算法,推動了雙樹復(fù)小波變換的發(fā)展[10]。
采用Selesnick等提出的DT-CWT方法,將高分辨率存檔云量數(shù)據(jù)進(jìn)行分解,得到低頻信息和高頻信息。假設(shè)造成成像結(jié)果的各類不確定性條件一致,所有的因素的隨機(jī)性和趨勢性,都體現(xiàn)在了成像結(jié)果的高頻和低頻信息上,低頻信息可以較好的保留原始云量趨勢走向信息,高頻可以很好的保留因其他因素所導(dǎo)致的云量突變信息。DT-CWT構(gòu)造過程如圖1所示。
圖1 DT-CWT的分解與重構(gòu)
不同于傳統(tǒng)的離散小波變換,這里是將復(fù)小波的實部和虛部分離開,采用二叉樹結(jié)構(gòu)的兩路離散小波變換形式,兩棵并行的實小波變換樹來對信息進(jìn)行分解與重構(gòu),其中一棵為實部樹,另一棵為虛部樹[11]。在分解與重構(gòu)過程中,始終保持虛部樹的采樣位置點(diǎn)正好位于實部樹的中間,這樣就能使得兩樹分解系數(shù)達(dá)到信息互補(bǔ)[12],這樣利用實數(shù)的小波變換來實現(xiàn)帶有復(fù)數(shù)形式的復(fù)數(shù)小波變換,根據(jù)DT-CWT的構(gòu)造方法[13],復(fù)小波表示為
時間序列分析廣泛應(yīng)用于氣象水文[14],通過時間序列分析的方法挖掘出低頻序列數(shù)據(jù)內(nèi)在的聯(lián)系[15],找到云量序列變化的規(guī)律,建立能夠準(zhǔn)確描述這種變化關(guān)系的時間序列模型,然后進(jìn)行數(shù)據(jù)序列趨勢的預(yù)測,可宏觀的描述云量時間序列趨勢走向。
非平穩(wěn)序列通過判定是否具有周期性,分為普通非平穩(wěn)序列和季節(jié)性非平穩(wěn)序列[17]。主要判斷標(biāo)準(zhǔn)是自相關(guān)函數(shù)ACF(auto-correlation function)。對于一個第期云量時間序列的自相關(guān)函數(shù)為
式中為第期的偏移量,隨機(jī)過程Corr為
式中 Cov表示求云量序列的協(xié)方差;Var表示求云量序列的方差。云量作為一種天氣自然現(xiàn)象,決定了其季節(jié)周期為12,即如果ACF具有周期性特點(diǎn),并且在滯后期12的整數(shù)倍出現(xiàn)峰值,則存在季節(jié)特征。若不具備周期性特點(diǎn),在滯后期12的整數(shù)倍不出現(xiàn)峰值,則序列不存在季節(jié)特征[18]。
對于非平穩(wěn)序列,通常采用一階差分方程轉(zhuǎn)換成平穩(wěn)時間序列。差分方程為
式中為差分算子;為延遲算子。如果高分辨率衛(wèi)星影像云量序列存在周期性特點(diǎn),則在滯后期12的整數(shù)倍出現(xiàn)峰值,采用季節(jié)性差分自回歸滑動平均模型(seasonal autoregressive integrated moving average,SARIMA)進(jìn)行預(yù)測,否則為普通非平穩(wěn)序列,采用差分整合移動平均自回歸模型(autoregressive integrated moving average model,ARIMA)進(jìn)行預(yù)測。
由DT-CWT分解高分辨率云量數(shù)據(jù)得出的高頻序列包含了大量的隨機(jī)信息,表現(xiàn)出規(guī)律性差、振幅跨度大、波動頻率不規(guī)則等特點(diǎn),且對于以月為觀測數(shù)據(jù)的時間尺度而言,高頻信息中所包含的隨機(jī)性是云量變化規(guī)律中不可忽略的影響因素。所以本文采用Elman神經(jīng)網(wǎng)絡(luò)作為預(yù)測模型,既可以有效應(yīng)對高頻隨機(jī)信息規(guī)律性差的問題,又較好的解決高頻信息難以適應(yīng)單一變化類型預(yù)測模型的問題。
Elman神經(jīng)網(wǎng)絡(luò)是典型的循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN),具有良好的逼近能力和適應(yīng)時變特性,用于預(yù)測混合預(yù)測模型中由小波分解的高頻信息[19]。由于其具有較強(qiáng)的學(xué)習(xí)能力、聯(lián)想力和容錯力,Elman神經(jīng)網(wǎng)絡(luò)被廣泛用于時域和空域的模式識別[20]。Elman神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層、承接層和輸出層組成,其結(jié)構(gòu)如圖2。
圖2 Elman神經(jīng)網(wǎng)絡(luò)
Elman神經(jīng)網(wǎng)絡(luò)與前饋型網(wǎng)絡(luò)相比,多了一個承接層,用來記憶隱含層單元的輸出值并返回給輸入,構(gòu)成局部反饋,其傳輸函數(shù)為線性函數(shù),但多了一個延遲單元,可回憶過去的狀態(tài),使網(wǎng)絡(luò)具有動態(tài)記憶功能[21]。Elman神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)公式為:
利用高頻隨機(jī)序列構(gòu)造訓(xùn)練樣本,確定神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)對網(wǎng)路進(jìn)行訓(xùn)練,使誤差沿梯度方向下降,當(dāng)達(dá)到設(shè)定的閾值標(biāo)準(zhǔn)的時候,確定模型的權(quán)值,利用訓(xùn)練好的網(wǎng)絡(luò)模型對高頻隨機(jī)序列進(jìn)行預(yù)測。
本文設(shè)計的方法流程主要分為幾個步驟,如圖3所示。
圖3 方法流程圖
1)采用ZY-3、GF-1等高分辨率衛(wèi)星影像歷史云量存檔數(shù)據(jù),并以月為時間分辨率對研究區(qū)高分辨率影像云量數(shù)據(jù)進(jìn)行提取,以百分比的形式進(jìn)行記錄,作為原始數(shù)據(jù)源。
2)由于國產(chǎn)高分辨率衛(wèi)星影像時間分辨率有限,存在個別月份數(shù)據(jù)缺失,為保證實驗數(shù)據(jù)的連續(xù)性但又不偏離實驗數(shù)據(jù)的準(zhǔn)確性,本研究采用線性擬合的方法對原始數(shù)據(jù)進(jìn)行缺失數(shù)據(jù)的擬合,補(bǔ)充缺失數(shù)據(jù)得到待分析數(shù)據(jù)源。
3)對研究區(qū)數(shù)據(jù)源全部進(jìn)行DT-CWT分解,分別得到低頻趨勢序列信息和高頻隨機(jī)序列信息,將兩序列信息分別分為前段樣本訓(xùn)練組和后段預(yù)測對比組。
4)對高、低頻序列信息樣本訓(xùn)練組的數(shù)據(jù)采用不同的方法進(jìn)行分析、建模、預(yù)測,低頻趨勢序列信息選擇時間序列分析法,采用ADF檢驗判定時間序列模型并進(jìn)行預(yù)測,高頻隨機(jī)序列信息選用Elman神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過訓(xùn)練后神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測。
5)將低頻趨勢序列信息和高頻隨機(jī)序列信息的預(yù)測結(jié)果進(jìn)行重構(gòu),得到最終的云量預(yù)測結(jié)果。
6)分別將全部序列的低頻信息與原始云量、預(yù)測組的低頻信息預(yù)測值與實際值、高頻信息預(yù)測值與實際值、重構(gòu)云量預(yù)測值與原始云量實際值進(jìn)行對比,以平均絕對誤差和均方根誤差作為評價指標(biāo)進(jìn)行評價分析。
本研究選取攀枝花、喀什、包頭三個研究地區(qū)進(jìn)行實驗,三個地區(qū)的地理位置、氣候特征等差異較大,云量覆蓋情況也有顯著不同。攀枝花地區(qū)云雨天氣較多,陽光照射時間少,地區(qū)云覆蓋情況比較明顯,云量大部分時間處于50%以上。而喀什和包頭地區(qū)云雨天氣相對較少,光照比較充足,特別是包頭地區(qū)云量大部分時間處于40%以下,同時兩地極端天氣時云量差異大,特別是喀什云量變化頻率高。
以月為單位下載研究區(qū)面積為20km×20km的高分辨率衛(wèi)星影像,時間跨度從2013年5月—2019年 2月,共60~70個月,分為每月一期。對下載的高分辨率影像進(jìn)行云量占比判斷,得到以百分?jǐn)?shù)形式記錄的云量序列。
對于實驗中存在衛(wèi)星影像缺失問題,導(dǎo)致云量數(shù)據(jù)的不連續(xù),本研究采用線性擬合的方法將研究區(qū)云量數(shù)據(jù)擬合出線性方程,根據(jù)擬合方程計算出缺失云量數(shù)據(jù),確保實驗數(shù)據(jù)的時間連續(xù)性,以得到可進(jìn)行時間序列分析的數(shù)據(jù)源。對數(shù)據(jù)源全部數(shù)據(jù)進(jìn)行分組,分為前段約50~60期的樣本訓(xùn)練組和后段約10期的預(yù)測對比組。并對全部序列進(jìn)行DT-CWT分解。
應(yīng)用EVIEWS軟件對樣本訓(xùn)練組分解的低頻信息進(jìn)行平穩(wěn)性檢驗,依據(jù)單位根統(tǒng)計量ADF與非平穩(wěn)假設(shè)的顯著性水平1%~10%的臨界值進(jìn)行比較,判斷序列類型。當(dāng)ADF全部小于臨界值,則不接受序列有單位根(非平穩(wěn))的假設(shè),該序列為平穩(wěn)序列,否則為非平穩(wěn)序列。
本研究三個研究區(qū)經(jīng)過ADF檢驗,均為平穩(wěn)序列,根據(jù)自相關(guān)函數(shù)圖分析計算出ARMA模型參數(shù)。以樣本訓(xùn)練組的所有數(shù)據(jù)為基礎(chǔ),利用具體的ARMA模型進(jìn)行低頻序列的預(yù)測。逐次向后預(yù)測單個序列數(shù)值,經(jīng)多次預(yù)測推進(jìn)后,得到預(yù)測組全部預(yù)測值。將預(yù)測結(jié)果與實際低頻趨勢信息進(jìn)行對比,計算兩組數(shù)據(jù)之間的平均絕對誤差和均方根誤差,進(jìn)行評價分析。
針對于樣本訓(xùn)練組分解出的高頻信息,首先對高頻序列數(shù)據(jù)進(jìn)行歸一化處理,輸入全部樣本訓(xùn)練組序列對Elman神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使訓(xùn)練后神經(jīng)網(wǎng)絡(luò)具備此研究區(qū)高頻信息隨機(jī)變化的特性。用訓(xùn)練好的Elman神經(jīng)網(wǎng)絡(luò),對高頻信息預(yù)測組進(jìn)行預(yù)測,并進(jìn)行反歸一化處理,得到高頻預(yù)測結(jié)果。將高頻預(yù)測結(jié)果與實際高頻信息進(jìn)行對比,計算兩組數(shù)據(jù)之間的平均絕對誤差和均方根誤差,進(jìn)行評價分析。
對包含訓(xùn)練組實際值和預(yù)測組預(yù)測值的全部序列預(yù)測的低頻趨勢信息和高頻隨機(jī)信息進(jìn)行DT-CWT重構(gòu),并進(jìn)行[0,100]有限區(qū)間截斷處理,得到最終云量的預(yù)測結(jié)果,將云量預(yù)測結(jié)果與原始實際云量信息進(jìn)行對比,并求出兩組序列的平均絕對誤差MAD和均方根誤差RMSE,進(jìn)行評價分析。
選取攀枝花研究區(qū)2014年10月—2019年1月的歷史云量數(shù)據(jù),其中缺失2017年6月和2018年6月數(shù)據(jù),應(yīng)用線性擬合將數(shù)據(jù)補(bǔ)全為52期,分成前40期作為樣本訓(xùn)練組,后12期作為預(yù)測對比組。實驗結(jié)果如圖4所示,表1為攀枝花研究區(qū)評價指標(biāo)。
圖4 攀枝花研究區(qū)實驗結(jié)果
表1 攀枝花評價指標(biāo)
Tab.1 Panzhihua Evaluation Indicators
對全部52期數(shù)據(jù)應(yīng)用DT-CWT分解,得到低頻趨勢信息和高頻隨機(jī)信息。圖4(a)中,橫坐標(biāo)表示時間,縱坐標(biāo)表示云量所占百分比,藍(lán)線代表實際云量,紅線代表提取的低頻趨勢信息。由圖4(a)可知,DT-CWT實現(xiàn)了低頻趨勢序列信息的分離,獲取的低頻趨勢序列較好的反映出了云量真實序列的變化趨勢,基本沒有相位差。表1中實際云量與低頻趨勢信息的MAD為14.754 56,RMSE為19.294 746 35。因此,選用此低頻趨勢序列信息作為訓(xùn)練樣本,對未來云量變化的趨勢進(jìn)行預(yù)測。
對于低頻趨勢信息進(jìn)行ADF檢驗,單位根統(tǒng)計量ADF=–4.236 557,小于EVIEWS軟件給出的顯著性水平1%~10%的臨界值,所以不接受序列有單位根(非平穩(wěn))的假設(shè)。該低頻趨勢序列為平穩(wěn)序列,選用ARMA模型進(jìn)行預(yù)測,預(yù)測結(jié)果如圖4(b),圖中藍(lán)線代表云量低頻趨勢信息,紅線代表低頻預(yù)測信息,由圖4(b)可知,預(yù)測值可以基本反應(yīng)低頻信息的趨勢變化,波動情況基本一致,不存在相位差,由表1可知,MAD為26.654 42,RMSE為29.542 39。整體評價分析,低頻趨勢序列的預(yù)測結(jié)果較理想。
對于高頻隨機(jī)信息,采用Elman神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,將分解所得26期高頻隨機(jī)序列分為兩組,前20期數(shù)據(jù)作為數(shù)據(jù)源組,構(gòu)造訓(xùn)練樣本對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,后6期數(shù)據(jù)作為預(yù)測樣本。圖4(c)中,藍(lán)線代表高頻序列真實值,紅線代表預(yù)測值,由圖4(c)看出,Elman神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果反映了云量高頻信息的變化趨勢,預(yù)測值的波動情況與實際高頻隨機(jī)序列波動情況基本一致。由表1可知,MAD為18.532 557 36,RMSE為25.349 25,可見Elman神經(jīng)網(wǎng)絡(luò)的高頻隨機(jī)序列預(yù)測結(jié)果較為理想。
最后,包含預(yù)測值的低頻趨勢信息和高頻隨機(jī)信息進(jìn)行DT-CWT重構(gòu),得到包含后12期云量預(yù)測值的最終云量結(jié)果,如圖4(d)。圖中,藍(lán)線代表云量信息的真實值,紅線代表預(yù)測值。由圖4(d)可以看出云量預(yù)測值與真實值比較貼合。由表1可知,本文方法的MAD為14.881 681 25,RMSE為20.472 31,相比較傳統(tǒng)的云量預(yù)測方法MAD為16.369 568 14,RMSE為23.685 23,本文方法的預(yù)測準(zhǔn)確度有較大的提升。重構(gòu)后的預(yù)測值更為精確的反映了云量真實值的變化趨勢。
選取喀什研究區(qū)2013年7月—2019年2月的歷史云量數(shù)據(jù),其中缺失16年2月和18年4月數(shù)據(jù),應(yīng)用線性擬合將數(shù)據(jù)補(bǔ)全為68期,分為前58期數(shù)據(jù)源組,后10期作為預(yù)測對比組。實驗結(jié)果如圖5,表2為喀什研究區(qū)評價指標(biāo)。
圖5 喀什研究區(qū)實驗結(jié)果
表2 喀什評價指標(biāo)
Tab.2 Kashi Evaluation Indicators
低頻趨勢信息與實際云量MAD為15.989 41,RMSE為21.721 02,基本反映了云量的變化趨勢。通過時間序列分析方法建模預(yù)測出的低頻趨勢序列的變化趨勢基本符合。Elman神經(jīng)網(wǎng)絡(luò)預(yù)測出的高頻信息趨勢符合,波動基本一致。圖5(d)中,重構(gòu)后的云量預(yù)測序列走勢與云量真實值相似,僅部分時間節(jié)點(diǎn)上的云量預(yù)測值與實際值不同,但節(jié)點(diǎn)兩端的變化趨勢基本一致。同時由表2可知,本文方法的云量真實值與預(yù)測值的MAD為13.842 93,RMSE為19.366 12,傳統(tǒng)方法的MAD為14.658 13,RMSE為21.335 41。由數(shù)據(jù)結(jié)果可知,本文方法具有明顯的優(yōu)勢,基本反映了云量近期的變化趨勢。
選取包頭研究區(qū)2013年6月—2019年1月的歷史云量數(shù)據(jù),其中缺失13年10月和18年5月數(shù)據(jù),應(yīng)用線性擬合將數(shù)據(jù)補(bǔ)全為68期,分為前58期數(shù)據(jù)作為數(shù)據(jù)源組,后10期數(shù)據(jù)作為預(yù)測對比組。實驗結(jié)果如圖6,表3為包頭研究區(qū)評價指標(biāo)。
圖6 包頭研究區(qū)實驗結(jié)果
表3 包頭評價指標(biāo)
分解后的低頻趨勢信息與實際云量的MAD為10.907 775 16,RMSE為14.627 92,可以很好的反應(yīng)云量信息的變化趨勢。低頻信息的預(yù)測值與真實值的MAD為16.932 45,RMSE為20.343 547 58,變化趨勢較為吻合,預(yù)測值與真實值誤差較小。經(jīng)過Elman神經(jīng)網(wǎng)絡(luò)預(yù)測的高頻信息反映了云量高頻信息的變化趨勢,相位無偏差。本文方法的云量真實值與重構(gòu)后的預(yù)測值MAD為8.494 573 098,RMSE為12.978 64,傳統(tǒng)方法的MAD為10.344 156 853,RMSE為13.755 326 951,誤差值明顯減小,且由圖6(d)可以看出包頭地區(qū)應(yīng)用本文方法重構(gòu)后的云量預(yù)測值變化趨勢與實際值也較符合,僅有一處時間節(jié)點(diǎn)預(yù)測值與真實值誤差較大,其他時間節(jié)點(diǎn)處的預(yù)測走向反映了云量真實值的波動情況,時間適用性較好。
本研究選取攀枝花、喀什、包頭三個地區(qū)進(jìn)行實驗,因為三個地區(qū)的地理位置、氣候特征等差異較大,因此云量覆蓋情況也有顯著不同。攀枝花地區(qū)云雨天氣較多,陽光照射時間少,地區(qū)云量覆蓋情況會比較明顯,44.2%的數(shù)據(jù)達(dá)到30%以上云量覆蓋??κ驳貐^(qū)云雨天氣相對較少32.3%的數(shù)據(jù)達(dá)到30%以上云量覆蓋,光照比較充足,具有云量變化差異大的特點(diǎn)。包頭地區(qū)氣候干燥云覆蓋較少,11.8%的數(shù)據(jù)處于30%以上云覆蓋量,光照比較充足,也存在極端變化天氣。
通過對三個研究區(qū)高分辨率衛(wèi)星影像云量數(shù)據(jù)進(jìn)行雙樹復(fù)小波分解,得到了低頻趨勢信息和高頻隨機(jī)信息,低頻趨勢信息可以較好的反應(yīng)原始云量數(shù)據(jù)的趨勢走向信息,高頻信息也反映了云量信息隨機(jī)性強(qiáng)的特點(diǎn)。
對三個地區(qū)的云量低頻序列采用時間序列方法預(yù)測,預(yù)測結(jié)果表明:對雙樹復(fù)小波分解后低頻信息進(jìn)行時間序列分析,對高分辨率衛(wèi)星影像云量趨勢預(yù)測有較好的適用性,預(yù)測結(jié)果與云量真實值變化趨勢基本都相符。
對三個地區(qū)的云量高頻序列采用神經(jīng)網(wǎng)絡(luò)方法預(yù)測,預(yù)測結(jié)果表明:對雙樹復(fù)小波分解后高頻信息進(jìn)行Elman神經(jīng)網(wǎng)絡(luò)訓(xùn)練,能有效提取高分辨率衛(wèi)星影像云量的隨機(jī)性特征,預(yù)測值的波動情況與實際的高頻隨機(jī)序列波動情況基本一致。
將云量低頻序列預(yù)測值與高頻序列預(yù)測值通過DT-CWT重構(gòu)后得到云量數(shù)據(jù)預(yù)測值,與云量真實值擬合效果較好,預(yù)測值能較好的刻畫云量數(shù)據(jù)在各時間節(jié)點(diǎn)的走勢,對三個研究區(qū)的評價指標(biāo)平均絕對誤差和均方根誤差進(jìn)行分析表明,與傳統(tǒng)預(yù)測方法相比較,本文的預(yù)測準(zhǔn)確度大大提升,將高頻與低頻信息重構(gòu)可有效減小誤差,云量預(yù)測值兼顧了研究區(qū)實際的云量變化趨勢性與隨機(jī)特征,準(zhǔn)確預(yù)測云量變化趨勢的同時刻畫了變化細(xì)節(jié)。
本文所提出的結(jié)合復(fù)小波分解的時間序列分析云量預(yù)測方法,可以解決傳統(tǒng)云量預(yù)測方法對高分辨率遙感影像數(shù)據(jù)適用性差、擬合效果差、時間適應(yīng)性差及預(yù)測結(jié)果精度低的問題。該方法運(yùn)用了復(fù)小波分解數(shù)據(jù)分離思想,充分挖掘了隱藏在云量數(shù)據(jù)內(nèi)的深層規(guī)律,采用DT-CWT分解將歷史云量數(shù)據(jù)分離出低頻趨勢序列和高頻隨機(jī)序列,對不同的序列采用不同的方法進(jìn)行分析建模預(yù)測,最后再重構(gòu)出最終的預(yù)測結(jié)果。該方法有效地吸納了國產(chǎn)高分辨率衛(wèi)星長期存檔影像數(shù)據(jù)源的優(yōu)勢,充分利用了存檔影像云量數(shù)據(jù)中的趨勢與隨機(jī)信息,在準(zhǔn)確預(yù)測云量變化趨勢的同時增加了細(xì)節(jié)處的刻畫,改善了云量預(yù)測的符合度,提高了云量預(yù)測的精度,為高分辨率光學(xué)衛(wèi)星的成像任務(wù)規(guī)劃提供了很好的技術(shù)支持,有效地減少規(guī)劃任務(wù)不當(dāng)而造成的衛(wèi)星資源的浪費(fèi)。
云量本身的影響因素眾多,變化較復(fù)雜,要高精度預(yù)測云量變化的趨勢,得到云量的準(zhǔn)確值,對存檔影像的時間頻率有較高要求。隨著衛(wèi)星對地觀測技術(shù)的不斷發(fā)展,高分辨率遙感影像數(shù)據(jù)的空間分辨率不斷增加,存檔影像的時間分辨率越來越大,云量預(yù)測的精度將會更加準(zhǔn)確。本文對基于雙樹復(fù)小波分解的云量時間序列分析的高分辨率衛(wèi)星成像預(yù)測方法進(jìn)行了可行性的驗證,但尚未實現(xiàn)全自動化的數(shù)據(jù)分析,大范圍區(qū)域(全國范圍)的實驗還有待進(jìn)一步驗證。
[1] 賀仁杰, 高鵬, 白保存, 等. 成像衛(wèi)星任務(wù)規(guī)劃模型、算法及其應(yīng)用[J]. 系統(tǒng)工程理論與實踐, 2011, 31(3): 411-422. HE Renjie, GAO Peng, BAI Baocun, et al. Imaging Satellite Mission Planning Model, Algorithm and Its Application[J]. System Engineering Theory and Practice, 2011, 31(3): 411-422. (in Chinese)
[2] 陳世平. 景物和成像條件對遙感圖像品質(zhì)的影響[J]. 航天返回與遙感, 2010, 31(1): 1-10. CHEN Shiping. Effects of Scenery and Imaging Conditions on Remote Sensing Image Quality[J]. Spacecraft Recovery & Remote Sensing, 2010, 31(1): 1-10. (in Chinese)
[3] 余婧, 陳浩, 李軍. 地理因子對衛(wèi)星成像質(zhì)量影響預(yù)估方法研究[J]. 遙感信息, 2011(5): 104-108. YU Jing, CHEN Hao, LI Jun. Study on the Method of Predicting the Influence of Geographical Factors on Satellite Imaging Quality[J]. Remote Sensing Information, 2011(5): 104-108. (in Chinese)
[4] 劉瑞霞, 劉玉潔, 杜秉玉. 中國云氣候特征的分析[J]. 應(yīng)用氣象學(xué)報, 2004, 15(4): 468-476. LIU Ruixia, LIU Yujie, DU Bingyu. Analysis of Cloud Climate Characteristics in China[J]. Journal of Applied Meteorological Science, 2004, 15(4): 468-476. (in Chinese)
[5] ALONSO J, TERNERO A, BATLLES F J, et al. Prediction of Cloudiness in Short Time Periods Using Techniques of Remote Sensing and Image Processing[J]. Energy Procedia, 2014, 49: 2280-2289.
[6] 歐陽斯達(dá), 汪匯兵, 何召寧, 等. 基于大數(shù)據(jù)回歸分析的衛(wèi)星有效成像概率預(yù)估[J]. 航天返回與遙感, 2017, 38(3): 116-124. OUYANG Sida, WANG Huibing, HE Zhaoning, et al. Estimation of Satellite Effective Imaging Probability Based on Big Data Regression Analysis[J]. Spacecraft Recovery & Remote Sensing, 2017, 38(3): 116-124. (in Chinese)
[7] 王喆文, 黃鵬, 林友明. 利用小波分解的時間序列云量預(yù)測方法[J]. 遙感信息, 2016, 31(4): 1-8. WANG Zhewen, HUANG Peng, LIN Youming. Time Series Cloud Prediction Method Using Wavelet Decomposition[J]. Remote Sensing Information, 2016, 31(4): 1-8. (in Chinese)
[8] 王志信, 林友明, 黃鵬, 等. 基于時間序列的中亞地區(qū)云量特征分類及云量變化趨勢[J]. 遙感技術(shù)與應(yīng)用, 2014, 29(5): 839-845. WANG Zhixin, LIN Youming, HUANG Peng, et al. Classification of Cloud Amount Characteristics and Variation Trend of Cloud Amount in Central Asia Based on Time Series[J]. Remote Sensing Technology and Application, 2014, 29(5): 839-845. (in Chinese)
[9] KINGSBURY N. Complex Wavelets for Shift Invariant Analysis and Filtering of Signals[J]. Applied and Computational Harmonic Analysis, 2001, 10(3): 234-253.
[10] SELESNICK I, BARANIUK R, KINGSBURY N. The Dual-tree Complex Wavelet Transform[J]. IEEE Signal Processing Magazine, 2005, 22(6): 123-151.
[11] 胥永剛, 孟志鵬, 陸明, 等. 雙樹復(fù)小波和奇異差分譜在滾動軸承故障診斷中的應(yīng)用[J]. 振動工程學(xué)報, 2013, 26(6): 965-973. XU Yonggang, MENG Zhipeng, LU Ming, et al. Application of Double Tree Complex Wavelet and Singular Difference Spectrum in Fault Diagnosis of Rolling Bearings[J]. Journal of Vibration Engineering, 2013, 26(6): 965-973. (in Chinese)
[12] 李輝, 鄭海起, 唐力偉. 基于改進(jìn)雙樹復(fù)小波變換的軸承多故障診斷[J]. 振動、測試與診斷, 2013, 33(1): 53-59. LI Hui, ZHENG Haiqi, TANG Liwei. Multi-fault Diagnosis of Bearings Based on Improved Double Tree Complex Wavelet Transform[J]. Vibration, Test and Diagnosis, 2013, 33(1): 53-59. (in Chinese)
[13] 梁月吉, 任超, 楊秀發(fā), 等. 結(jié)合雙樹復(fù)小波和廣義回歸神經(jīng)網(wǎng)絡(luò)的鐘差預(yù)報方法研究[J]. 測繪通報, 2016(1): 6-10. LIANG Yueji, REN Chao, YANG Xiufa, et al. Research on Clock Error Prediction Method Combining Double Tree Complex Wavelet and Generalized Regression Neural Network[J]. Surveying and Mapping Bulletin, 2016(1): 6-10. (in Chinese)
[14] 張美英, 何杰. 時間序列預(yù)測模型研究綜述[J]. 數(shù)學(xué)的實踐與認(rèn)識, 2011, 41(18): 189-195. ZHANG Meiying, HE Jie. Review of Research on Time Series Prediction Models[J]. Mathematics Practice and Cognition, 2011, 41(18): 189-195. (in Chinese)
[15] 潘迪夫, 劉輝, 李燕飛. 基于時間序列分析和卡爾曼濾波算法的風(fēng)電場風(fēng)速預(yù)測優(yōu)化模型[J]. 電網(wǎng)技術(shù), 2008(7): 82-86. PAN Difu, LIU Hui, LI Yanfei. Wind Speed Forecast Optimization Model for Wind Farm Based on Time Series Analysis and Kalman Filter Algorithm[J]. Power Grid Technology, 2008(7): 82-86. (in Chinese)
[16] 王燕. 應(yīng)用時間序列分析[M]. 北京: 中國人民大學(xué)出版社, 2012. WANG Yan. Applied Time Series Analysis[M]. Beijing: Renmin University of China Press, 2012. (in Chinese)
[17] 何書元. 應(yīng)用時間序列分析[M]. 北京: 北京大學(xué)出版社, 2003. HE Shuyuan. Applied Time Series Analysis[M]. Beijing: Peking University Press, 2003. (in Chinese)
[18] 王志信, 黃鵬, 林友明, 等. 面向遙感衛(wèi)星數(shù)據(jù)獲取應(yīng)用的時間序列云量預(yù)測方法[J]. 遙感信息, 2014, 29(3): 8-13. WANG Zhixin, HUANG Peng, LIN Youming, et al. Time Series Cloudiness Prediction Method for Remote Sensing Satellite Data Acquisition Application[J]. Remote Sensing Information, 2014, 29(3): 8-13. (in Chinese)
[19] LIU H, Mi X, LI Y. Wind Speed Forecasting Method Based on Deep Learning Strategy Using Empirical Wavelet Transform, Long Short Term Memory Neural Network and Elman Neural Network[J]. Energy Conversion and Management, 2018, 156: 498-514.
[20] 時小虎, 梁艷春, 徐旭. 改進(jìn)的Elman模型與遞歸反傳控制神經(jīng)網(wǎng)絡(luò)[J]. 軟件學(xué)報, 2003(6): 1110-1119. SHI Xiaohu, LIANG Yanchun, XU Xu. Improved Elman Model and Recursive Backpropagation Control Neural Network[J]. Journal of Software, 2003(6): 1110-1119. (in Chinese)
[21] SHI X, LIANG Y, LEE H, et al. Improved Elman Networks and Applications for Controlling Ultrasonic Motors[J]. Applied Artificial Intelligence, 2004, 18(7): 603-629.
[22] 任麗娜. 基于Elman神經(jīng)網(wǎng)絡(luò)的中期電力負(fù)荷預(yù)測模型研究[D]. 蘭州: 蘭州理工大學(xué), 2007. REN Lina. Research on Medium Term Load Forecasting Model Based on Elman Neural Network[D]. Lanzhou: Lanzhou University of Technology, 2007. (in Chinese)
[23] 韓旭明. Elman神經(jīng)網(wǎng)絡(luò)的應(yīng)用研究[D]. 天津: 天津大學(xué), 2006. HAN Xuming. Applied Research of Elman Neural Network[D]. Tianjin: Tianjin University, 2006. (in Chinese)
Cloud Time Series Combination Model Prediction Based on Dual-tree Complex Wavelet Decomposition
BAI Yunbo1,2OUYANG Sida2YANG Mengmeng3XIA Xueqi1WANG Ting4
(1 China University of Geosciences, Beijing 100083, China)(2 Land Satellite Remote Sensing Application Center, Beijing 100048, China)(3 Shandong University of Science and Technology, Qingdao 266590, China)(4 Chengdu University of Technology, Chengdu 610059, China)
Aiming at the problems of poor practicability, poor fitting effect and low accuracy of the traditional cloud prediction model when applied to cloud time series data of high-resolution satellite images, a cloud time series combination model prediction method based on dual-tree complex wavelet decomposition is proposed. The method uses DT-CWT decomposition method to extract low-frequency trend information and high-frequency random information of cloud amount time series, applies time series analysis and Elman neural network prediction methods to low-frequency and high-frequency sequences respectively, and then reconstructs the prediction results of the two sequences to obtain the final cloud amount prediction results. The experimental results show that the low-frequency information decomposed by dual-tree complex wavelet can better reflect the change trend of cloud cover, and the high-frequency information can also better retain the random information of cloud cover change. Compared with the traditional prediction model, the average absolute error and root mean square error of the prediction results of this method are reduced, the prediction accuracy is improved, and the change rule of high-resolution satellite cloud cover time series can be better fitted. The results of cloud cover prediction are taken as reference information in satellite imaging mission planning, and a smaller time window covered by cloud cover can be selected to obtain satellite effective imaging data with higher quality.
high resolution image; dual-tree complex wavelet decomposition; time series analysis; neural network; forecast of cloud volume by satellite remote sensing; remote sensing payload
TP79
A
1009-8518(2019)05-0106-12
白云博, 歐陽斯達(dá), 楊朦朦, 等. 基于雙樹復(fù)小波分解的云量時間序列模型預(yù)測[J]. 航天返回與遙感, 2019, 40(5): 106-117.
BAI Yunbo, OUYANG Sida, YANG Mengmeng, et al. Cloud Time Series Combination Model Prediction Based on Dual-tree Complex Wavelet Decomposition[J]. Spacecraft Recovery & Remote Sensing, 2019, 40(5): 106-117. [DOI: 10.3969/j.issn.1009- 8518.2019.05.011]
白云博,男,1994年生,中國地質(zhì)大學(xué)(北京)地質(zhì)工程碩士在讀研究生,主要研究方向為遙感數(shù)據(jù)存儲與挖掘,大數(shù)據(jù)分析。E-mail:jackbaiyun@126.com。
歐陽斯達(dá),男,1986年生,2011年獲中國測繪科學(xué)研究院地圖制圖學(xué)與地理信息工程專業(yè)碩士學(xué)位,工程師。主要研究方向為測繪衛(wèi)星任務(wù)計劃與調(diào)度、測繪衛(wèi)星影像數(shù)據(jù)管理與應(yīng)用等。E-mail:ouyangsd@sasmac.cn。
2019-07-19
陸地衛(wèi)星測繪類產(chǎn)品生產(chǎn)技術(shù)與專題生產(chǎn)(2018YFB0504903)
(編輯:龐冰)