• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于CRT-EL的海洋環(huán)境數(shù)據(jù)綜合預(yù)測方法

      2021-08-03 09:42才迪金宇悅李志剛孫曉川
      電腦知識與技術(shù) 2021年17期
      關(guān)鍵詞:數(shù)據(jù)分析

      才迪 金宇悅 李志剛 孫曉川

      摘要:針對海洋生態(tài)環(huán)境受多種因素共同影響,現(xiàn)存模型不能較好反映因素間的關(guān)聯(lián)關(guān)系,需建立一個集分析與預(yù)測于一體的海洋環(huán)境數(shù)據(jù)預(yù)測模型。利用交叉遞歸理論對海洋數(shù)據(jù)進行綜合分析,選取對海洋生態(tài)環(huán)境影響較大的因素。將選擇結(jié)果作為集成學(xué)習(xí)模型的輸入,進一步對海洋生態(tài)環(huán)境狀態(tài)進行預(yù)測。仿真結(jié)果證明,該模型具有較高的準(zhǔn)確率,可以應(yīng)用到實際工程中。

      關(guān)鍵詞:海洋生態(tài)環(huán)境;數(shù)據(jù)分析;交叉遞歸理論;海洋序列預(yù)測;集成學(xué)習(xí)

      中圖分類號:TP391? ? ? ? 文獻標(biāo)識碼:A

      文章編號:1009-3044(2021)17-0004-03

      開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):

      Comprehensive Prediction for Marine Environment Data based on CRT-EL

      CAI Di, JIN Yu-yue, LI Zhi-gang, SUN Xiao-chuan

      (North China University of Science and Technology, Tangshan 063210, China)

      Abstract:Ocean ecological environment is affected by many factors, and the existing models cant reflect the correlation between factors. An ocean environmental data prediction model combining analysis and prediction is established for this problem. Cross recurrence theory is applied to comprehensively analyze ocean data, aimed at selecting the factors that have great influence on ocean ecological environment. The result is used as the input of the ensemble learning model to predict ocean ecological environment state. The simulation results show that this model has high accuracy, and is applied to practical projects.

      Key words: ocean ecological environment; data analysis; cross recurrence theory; ocean sequence prediction; ensemble learning

      1 引言

      海洋生態(tài)環(huán)境是支撐經(jīng)濟發(fā)展與人類生活的重要支柱。近年來,海洋污染及海洋災(zāi)害頻繁發(fā)生[1-2]。因此,實時預(yù)測海洋環(huán)境數(shù)據(jù),對防治海洋污染及海洋災(zāi)害、保護海洋生態(tài)環(huán)境具有指導(dǎo)意義。海洋環(huán)境受多種因素共同影響,以往的數(shù)據(jù)預(yù)測研究中,大多數(shù)采用了單輸入單輸出的模式,未考慮影響海洋生態(tài)環(huán)境的多方面影響因素[3-4]。在海洋多因素預(yù)測領(lǐng)域的研究中,預(yù)測模型的精度還有待改善。交叉遞歸理論? ? ? ? ? ? ? ? ? ? ? ?(Cross Recurrence Theory,CRT)可以用于分析多個數(shù)據(jù)之間的相關(guān)性,從多方面考慮與海洋環(huán)境具有相關(guān)性的因素[5-6]。此外,集成學(xué)習(xí)(Ensemble Learning,EL)由于其優(yōu)良的預(yù)測性能,已被廣泛應(yīng)用于時間序列預(yù)測領(lǐng)域,通過融合多個機器學(xué)習(xí)模型來改善單一模型的精度[7-8]。鑒于此,本文基于CRT分析算法和EL預(yù)測算法的優(yōu)勢,提出了新型的海洋環(huán)境數(shù)據(jù)綜合預(yù)測模型CRT-EL,并應(yīng)用于多輸入單輸出的海洋環(huán)境數(shù)據(jù)預(yù)測方面。結(jié)構(gòu)上,該模型包含CRT分析器和EL預(yù)測器兩個模塊。EL預(yù)測器基于Stacking集成算法,以長短時記憶神經(jīng)網(wǎng)絡(luò)(Long Short–Term Memory Neural Network,LSTM)和多核支持向量機(Multi-kernel Support Vector Machine, Mk-SVM)為基預(yù)測器,以多層感知機(Multilayer Perceptron, MLP)為元預(yù)測器。仿真實驗表明該模型可以找出與海洋生態(tài)環(huán)境相關(guān)性較強的因素,實現(xiàn)多變量海洋環(huán)境數(shù)據(jù)預(yù)測,具有較強的非線性逼近能力。

      2 海洋數(shù)據(jù)綜合預(yù)測模型

      2.1 CRT-EL分析器

      CRT-EL分析器是以CRT為基礎(chǔ),對海洋環(huán)境數(shù)據(jù)進行綜合分析,其包括四個階段:相空間重構(gòu),構(gòu)造遞歸矩陣,繪制交叉遞歸圖,遞歸定量分析。首先,將一維海洋環(huán)境數(shù)據(jù)通過重構(gòu)映射到高維相空間中。其次,計算高維相空間中軌跡之間的距離,將此距離與固定閾值進行比較,若此距離大于閾值,則遞歸矩陣中對應(yīng)的值為0,反之,遞歸矩陣中相應(yīng)的值為1。然后,基于遞歸矩陣中值的大小,進行交叉遞歸圖的繪制。1對應(yīng)交叉遞歸圖中的白點,0對應(yīng)交叉遞歸圖中的黑點。最后,對交叉遞歸圖中的圖形結(jié)構(gòu)進行定量計算,平均對角線長度(Mean Diagonal Length,MDL)是用來描述數(shù)據(jù)間相關(guān)性的主要指標(biāo),以此得出海洋環(huán)境數(shù)據(jù)中的定量分析結(jié)果,找出與海洋生態(tài)環(huán)境相關(guān)性最大的因素。MDL的計算公式如下:

      [MDL=l=lminSl?Pll=lminSPl]? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(1)

      [Pl=i,j=1S1-CRi-1,j-11-CRi+l,j+lk=0l-1CRi+k,j+k]? ? ? (2)

      其中,S代表交叉遞歸圖中對角線的個數(shù),l代表交叉遞歸圖中對角線長度的變量。

      基于CRT-EL分析器綜合分析海洋環(huán)境數(shù)據(jù)之間的相關(guān)性大小,得出相關(guān)性較強的前50%因素,作為CRT-EL預(yù)測器的輸入。

      2.2 CRT-EL預(yù)測器

      CRT-EL的預(yù)測器采用EL模型。為適應(yīng)海洋環(huán)境數(shù)據(jù)的時序性和小樣本特點,CRT-EL的預(yù)測器以Stacking算法為基礎(chǔ),采用擅長處理時間序列數(shù)據(jù)的LSTM和擅長處理小樣本數(shù)據(jù)的Mk-SVM為基預(yù)測器,以訓(xùn)練時間較短的MLP為元預(yù)測器。

      LSTM是一個具有特殊門結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),包括遺忘門,輸入門,輸出門。它的優(yōu)勢在于可以存儲長期的數(shù)據(jù)信息。Mk-SVM是在SVM的基礎(chǔ)上,通過線性加權(quán)求和的方式融合了多個核函數(shù),提高了單一核函數(shù)的準(zhǔn)確率。MLP模型結(jié)構(gòu)簡單,在預(yù)測精度滿足要求的前提下又降低了訓(xùn)練時間。在模型訓(xùn)練中,CRT-EL的基預(yù)測器利用海洋環(huán)境原始數(shù)據(jù)進行訓(xùn)練,元預(yù)測器采用基預(yù)測器的預(yù)測值進行訓(xùn)練,最終得出海洋環(huán)境數(shù)據(jù)的預(yù)測結(jié)果。

      在CRT-EL的模型訓(xùn)練中,采用均方根誤差(Root Mean Square Error, RMSE)和皮爾遜相關(guān)系數(shù)(Pearson Correlation Coefficient,PCCs)來評估模型的預(yù)測性能。

      3 仿真實驗

      3.1 數(shù)據(jù)集說明

      實驗中所用的數(shù)據(jù)為中國某海域浮標(biāo)采集的數(shù)據(jù),分別是有效波高、最大波浪高度、平均波浪周期、氣溫、氣壓、雨量、氨氮、磷酸鹽、硝酸鹽、鹽度、水溫、pH值。利用CRT-EL模型的分析器找出與海洋生態(tài)環(huán)境相關(guān)性較強的因素,同時作為CRT-EL模型預(yù)測器的輸入。葉綠素a是衡量海洋生態(tài)環(huán)境狀態(tài)的重要標(biāo)準(zhǔn)。為方便討論,將葉綠素a作為CRT-EL的輸出。將數(shù)據(jù)集以7:3的比例劃分為訓(xùn)練集和測試集,從而對CRT-EL模型進行訓(xùn)練和評估。

      3.2 性能評估

      CRT-EL模型通過融合CRT分析法與EL預(yù)測理論實現(xiàn)對海洋環(huán)境數(shù)據(jù)的綜合預(yù)測。CRT-EL模型包含兩個模塊,分別是CRT分析器和EL預(yù)測器。CRT分析器用于分析不同數(shù)據(jù)與海洋生態(tài)環(huán)境的相關(guān)性。表1給出了不同海洋環(huán)境數(shù)據(jù)的定量分析結(jié)果。表中給出了每個因素與葉綠素a進行分析后對應(yīng)的MDL值。MDL的值代表兩種數(shù)據(jù)在高維空間中軌跡的相似性大小,即數(shù)據(jù)的相關(guān)性程度。從表1可以看出,NIT與葉綠素a的相關(guān)性最大,值為18,其次是SalN,值為13.1111。依照此原則,選擇MDL值較大的前50%因素作為下一步CRT-EL預(yù)測器的輸入。

      CRT-EL預(yù)測器的輸出為葉綠素a時間序列。圖1給出了CRT-EL模型的預(yù)測結(jié)果。圖中黑色曲線代表葉綠素a序列的真實值,紅色曲線代表CRT-EL模型的預(yù)測值。從圖中可以看出,兩條曲線的擬合程度較高。為清晰的觀察圖中曲線的差異性,采用了圖中圖的方式。從小圖中可以更清晰地看出兩條曲線之間存在的較小差異性。綜合來看,CRT-EL模型的預(yù)測性能較好,可以對海洋數(shù)據(jù)進行準(zhǔn)確預(yù)測。模型的RMSE值為0.0041,PCCs值為0.9973。此結(jié)果表明,模型的誤差較小,預(yù)測值和葉綠素a真實值的相關(guān)系數(shù)較大,模型的非線性逼近能力較強。

      此外,從統(tǒng)計分析的角度度量了模型的性能。利用累計分布函數(shù)比較真實值與預(yù)測值的數(shù)據(jù)分布特征。圖2給出了預(yù)測值和葉綠素a真實值的累計分布函數(shù)圖。黑色曲線表示葉綠素a真實數(shù)據(jù)的分布情況,紅色線表示其對應(yīng)預(yù)測值的分布情況。橫坐標(biāo)表示葉綠素a值的范圍,縱坐標(biāo)表示小于等于當(dāng)前值的概率。紅色曲線越接近黑色曲線時,模型的性能越好。從圖中可以看出,黑色曲線和紅色曲線近似重合,表明CRT-EL具有較好的預(yù)測效果。從小圖中可以看出,兩條曲線依然存在較小的差距。綜上所述,CRT-EL模型在海洋環(huán)境數(shù)據(jù)預(yù)測領(lǐng)域具有優(yōu)良的預(yù)測性能,能很好地應(yīng)用到具體工程實踐中。

      4 結(jié)論

      基于CRT分析算法和EL機制,提出了一種用于海洋環(huán)境數(shù)據(jù)綜合預(yù)測方法CRT-EL。通過CRT-EL的分析器選取與海洋環(huán)境數(shù)據(jù)相關(guān)性較大的因素,并以此作為預(yù)測的輸入。利用CRT-EL的預(yù)測器對葉綠素a序列進行多輸入單輸出預(yù)測。該模型通過融合綜合分析與多變量預(yù)測的方法,對海洋環(huán)境數(shù)據(jù)進行精準(zhǔn)預(yù)測。仿真實驗證明,該模型適用于海洋生態(tài)環(huán)境數(shù)據(jù)的分析與預(yù)測任務(wù),并能取得較好的效果,此結(jié)果對海洋污染或海洋災(zāi)害的防治具有重要意義。

      參考文獻:

      [1] 李華,高強,丁慧媛.中國海洋經(jīng)濟發(fā)展的生態(tài)環(huán)境響應(yīng)變化及影響因素分析[J].統(tǒng)計與決策,2020,36(20):114-118.

      [2] Loueipour M, Keshmiri M, Danesh M and Mojiri M. Wave filtering and state estimation in dynamic positioning of marine vessels using position measurement[J]. IEEE Transactions on Instrumentation and Measurement, 2015, 64(12): 3253-3261.

      [3] Kwon Y, et al. Monitoring coastal chlorophyll A concentrations in coastal areas using machine learning models[J].Water, 2018, 10(8): 1020-1036.

      [4] Park S and Seong R L. Red tides prediction system using fuzzy reasoning and the ensemble method[J].Applied Intelligence, 2014, 40(2): 244-255.

      [5] Takakura I T, Hoshi R A, Santos M A,et al. Recurrence plots: a new tool for quantification of cardiac autonomic nervous system recovery after transplant[J].Brazilian Journal of Cardiovascular Surgery, 2017, 32(4): 245-252.

      [6] Haneef S M, et al. Accurate determination of Brillouin frequency based on cross recurrence plot analysis in Brillouin distributed fiber sensor[C]. //25th Optical Fiber Sensors Conference (OFS)., 2017: 1-4.

      [7] 歐桐桐. 基于集成學(xué)習(xí)的在線廣告轉(zhuǎn)化率預(yù)估算法的研究[D]. 北京:北京交通大學(xué), 2019.

      [8] Goudos S K and Athanasiadou G. Application of an ensemble method to UAV power modeling for cellular communications[J]. IEEE Antennas and Wireless Propagation Letters, 2019, 18(11): 2340-2344.

      【通聯(lián)編輯:王力】

      猜你喜歡
      數(shù)據(jù)分析
      基于matlab曲線擬合的數(shù)據(jù)預(yù)測分析
      分眾媒體趨勢下場景營銷的商業(yè)前景
      佛山某給水管線控制測量探討
      SPSS在環(huán)境地球化學(xué)中的應(yīng)用
      大數(shù)據(jù)時代高校數(shù)據(jù)管理的思考
      新常態(tài)下集團公司內(nèi)部審計工作研究
      淺析大數(shù)據(jù)時代對企業(yè)營銷模式的影響
      基于讀者到館行為數(shù)據(jù)分析的高校圖書館服務(wù)優(yōu)化建議
      石泉县| 武夷山市| 宜川县| 广饶县| 阜康市| 武宣县| 青海省| 柘荣县| 延吉市| 化州市| 桑日县| 秭归县| 天峨县| 通城县| 永定县| 大厂| 宜宾县| 南城县| 赣榆县| 越西县| 夹江县| 大新县| 讷河市| 洮南市| 沙湾县| 乌拉特前旗| 连江县| 时尚| 娄烦县| 溆浦县| 黄浦区| 龙山县| 富裕县| 鹰潭市| 米泉市| 盐边县| 东丽区| 祁东县| 屯昌县| 房产| 民权县|