• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于GMM與LSTM耦合模型的船舶航跡預(yù)測(cè)算法

      2023-01-03 07:02:22趙煜尤再進(jìn)吳麗淑李婉瑩
      關(guān)鍵詞:航速航跡聚類

      趙煜, 尤再進(jìn), 吳麗淑, 李婉瑩

      (大連海事大學(xué)交通運(yùn)輸工程學(xué)院, 遼寧 大連 116026)

      0 引 言

      隨著海上交通運(yùn)輸?shù)某掷m(xù)穩(wěn)定發(fā)展,船舶的數(shù)量、尺度、性能得到不斷提升,但與此同時(shí),海上交通安全風(fēng)險(xiǎn)也在加劇,因此在海上交通密集、復(fù)雜水域進(jìn)行精確、高效的交通事故預(yù)警尤為重要。另外,在海事搜救、海關(guān)緝私活動(dòng)中,為保證搜救和緝私的順利進(jìn)行,需要基于已知的目標(biāo)船歷史位置信息對(duì)其航跡進(jìn)行預(yù)測(cè),以此推斷其未來一段時(shí)間的位置信息[1]。因此,船舶航跡預(yù)測(cè)在減少海上交通密集水域船舶碰撞風(fēng)險(xiǎn)以及輔助進(jìn)行海事搜救、海關(guān)緝私等方面均有重要的經(jīng)濟(jì)及科學(xué)意義。

      近年來,國(guó)內(nèi)外學(xué)者在船舶航跡預(yù)測(cè)方面做了大量的研究工作。胡玉可等[2]設(shè)計(jì)了一種基于對(duì)稱分段路徑距離的數(shù)據(jù)預(yù)處理方法,構(gòu)建基于門控循環(huán)單元的循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)模型對(duì)船舶航跡進(jìn)行預(yù)測(cè),側(cè)重于預(yù)測(cè)環(huán)節(jié),數(shù)據(jù)處理部分的研究工作較少。NGUYEN等[3]將航行海域劃分為空間網(wǎng)格,將船舶自動(dòng)識(shí)別系統(tǒng)(automatic identification system, AIS)信息轉(zhuǎn)化為序列到序列的形式,提出一種序列到序列的長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory network, LSTM)預(yù)測(cè)模型,實(shí)現(xiàn)了船舶航跡的實(shí)時(shí)預(yù)測(cè)以及目標(biāo)港和到達(dá)時(shí)間的預(yù)測(cè),但預(yù)測(cè)精度有待進(jìn)一步提升。甄榮等[4]根據(jù)AIS信息和反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network, BPNN)對(duì)船舶的位置、航向和航速進(jìn)行預(yù)測(cè),取得了較好的效果,但直接使用原始AIS數(shù)據(jù)進(jìn)行預(yù)測(cè),導(dǎo)致預(yù)測(cè)結(jié)果受原始數(shù)據(jù)影響較大,算法的通用性和魯棒性都有待提高。MURRAY等[5]提出一種新的雙線性自編碼器方法來預(yù)測(cè)船舶軌跡,先通過高斯混合模型(Gaussian mixture model, GMM)對(duì)數(shù)據(jù)進(jìn)行聚類,然后利用雙線性自編碼器方法對(duì)分類后的數(shù)據(jù)進(jìn)行軌跡預(yù)測(cè),取得了較好的預(yù)測(cè)結(jié)果,但耗時(shí)較長(zhǎng)。劉姍姍等[6]和王研婷[7]提出卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)與LSTM相結(jié)合的船舶航跡預(yù)測(cè)方法,取得了較好效果,然而這兩篇文獻(xiàn)的實(shí)證部分都僅采用一艘船進(jìn)行研究,結(jié)果存在偶然性,同時(shí)模型都缺少對(duì)航跡提取部分的研究。謝新連等[8]提出一種基于極限學(xué)習(xí)機(jī)(extreme learning machine, ELM)的船舶航行行為預(yù)測(cè)模型,其預(yù)測(cè)精度比傳統(tǒng)的BPNN有了較大提升,但該文獻(xiàn)實(shí)證部分僅選取瓊州海峽水域進(jìn)行研究,所提的預(yù)測(cè)模型在其他水域的適用性還有待驗(yàn)證。劉嬌等[9]利用小波閾值去噪法處理訓(xùn)練數(shù)據(jù),并提出一種差分進(jìn)化與支持向量機(jī)(support vector machine, SVM)相結(jié)合的預(yù)測(cè)模型對(duì)船舶航跡進(jìn)行預(yù)測(cè),但難以實(shí)現(xiàn)實(shí)時(shí)預(yù)測(cè)。

      國(guó)內(nèi)外對(duì)船舶航跡預(yù)測(cè)的研究普遍存在航跡提取部分研究不足的情況,若使用同一艘船的歷史航跡數(shù)據(jù)對(duì)該船的未來航跡進(jìn)行預(yù)測(cè),則這種預(yù)測(cè)對(duì)有固定航線的班輪較為有效,而對(duì)航線相對(duì)不固定的船舶就難以精準(zhǔn),還需要借助航線上其他船舶的歷史航跡數(shù)據(jù)。船舶航跡預(yù)測(cè)的難點(diǎn)之一就是如何在海量的航跡數(shù)據(jù)中提取出符合要求的數(shù)據(jù)。本文針對(duì)這一關(guān)鍵問題,構(gòu)建一種基于GMM與LSTM耦合模型的船舶航跡預(yù)測(cè)算法,這種算法需提前構(gòu)建航跡數(shù)據(jù)庫,再利用高斯混合聚類等數(shù)據(jù)處理方法從數(shù)據(jù)庫中提取用于輔助預(yù)測(cè)的歷史航跡數(shù)據(jù),最后將提取出的數(shù)據(jù)輸入LSTM預(yù)測(cè)模型完成航跡預(yù)測(cè)。

      1 研究方法

      本文研究基于大量歷史航跡數(shù)據(jù),通過數(shù)據(jù)挖掘的方法對(duì)目標(biāo)船航跡進(jìn)行預(yù)測(cè)。研究?jī)?nèi)容主要由數(shù)據(jù)庫構(gòu)建、航跡提取、航跡預(yù)測(cè)等3個(gè)部分構(gòu)成。數(shù)據(jù)庫構(gòu)建包括數(shù)據(jù)預(yù)處理、航跡分割和航跡插值:數(shù)據(jù)預(yù)處理可以清除異常數(shù)據(jù)、噪聲數(shù)據(jù);航跡分割和航跡插值可以將航跡數(shù)據(jù)轉(zhuǎn)化為等時(shí)間間隔的數(shù)據(jù),實(shí)現(xiàn)航跡數(shù)據(jù)庫的有效構(gòu)建。航跡提取是從數(shù)據(jù)庫中提取出用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的訓(xùn)練集數(shù)據(jù),具體分為航跡初步提取和航跡聚類兩部分。航跡聚類對(duì)初步提取出的航跡進(jìn)行分類,并篩選出與預(yù)測(cè)航跡相似度最高的一類航跡;有效的航跡聚類是獲取高質(zhì)量訓(xùn)練集的核心。在航跡預(yù)測(cè)階段,構(gòu)建LSTM預(yù)測(cè)模型,將訓(xùn)練集和測(cè)試集數(shù)據(jù)輸入模型進(jìn)行運(yùn)算,完成船舶未來航跡預(yù)測(cè)。通過實(shí)驗(yàn)驗(yàn)證這種方法的精確性和實(shí)用性。

      2 數(shù)據(jù)庫構(gòu)建

      定義船舶航跡數(shù)據(jù)庫為

      Di={H1,H2,…,Hn},i=1,2,3,4,5,6

      (1)

      式中:Di為船型為i的船舶航跡數(shù)據(jù)庫,i=1,2,3,4,5,6分別對(duì)應(yīng)貨船、漁船、客船、游船、油船、拖船;Hj(j=1,2,…,n)為第j條航跡。

      Hj={h1,h2,…,hm}

      (2)

      式中,hk(k=1,2,…,m)為第k個(gè)航跡點(diǎn)的相關(guān)數(shù)據(jù),包括船型、船舶水上移動(dòng)通信業(yè)務(wù)標(biāo)識(shí)碼(MMSI)、船舶在tk時(shí)刻的位置pk、航速vk和航向ck。

      若航跡Hj與Hl具有相同的航跡點(diǎn)數(shù)m, 則這2條航跡之間對(duì)應(yīng)點(diǎn)距離的集合為

      Tjl={d1,d2,…,dm}

      (3)

      式中:dk為航跡Hj中第k個(gè)航跡點(diǎn)與航跡Hl中第k個(gè)航跡點(diǎn)之間的歐氏距離。

      航跡長(zhǎng)度采用歐氏距離度量,航跡Hj的長(zhǎng)度為

      (4)

      2.1 數(shù)據(jù)預(yù)處理

      從網(wǎng)址www.marinecadastre.gov/ais選取2019—2020年美國(guó)沿岸AIS數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),該數(shù)據(jù)包含大量信息,本文僅使用其中的7類數(shù)據(jù):船型、MMSI、數(shù)據(jù)記錄時(shí)間、經(jīng)度、緯度、航速、航向。數(shù)據(jù)預(yù)處理如下:從總數(shù)據(jù)中選取特定經(jīng)緯度范圍內(nèi)的數(shù)據(jù),清除其中異常和不需要的數(shù)據(jù),如MMSI不是9位、無效航向(不在區(qū)間[0,360°)內(nèi)的航向數(shù)據(jù))、船型缺失、航速為0的數(shù)據(jù);將數(shù)據(jù)記錄時(shí)間重置,以2019年1月1日0時(shí)0分0秒為0 s,其后的時(shí)間轉(zhuǎn)化為相應(yīng)秒數(shù),便于后續(xù)處理。

      2.2 航跡分割

      按照船型不同,將預(yù)處理后的數(shù)據(jù)分為6類,分別對(duì)應(yīng)前文提到的6類船型。為進(jìn)行航跡插值,同時(shí)保證所提取的航跡點(diǎn)數(shù)據(jù)都來自同一條航跡,需要根據(jù)式(5)對(duì)船舶航跡進(jìn)行分割點(diǎn)標(biāo)注:

      Ik≠Ik+1或|tk+1-tk|>1 200 s

      (5)

      式中:Ik和tk分別為第k個(gè)航跡點(diǎn)的MMSI和數(shù)據(jù)記錄時(shí)間。滿足式(5)的航跡點(diǎn)即為分割點(diǎn),最終得到分割點(diǎn)集合G。

      2.3 航跡插值

      若原始數(shù)據(jù)不是基于等時(shí)間步長(zhǎng)記錄的,則航速相同的船在兩個(gè)記錄點(diǎn)間的航行距離一般是不同的,如不進(jìn)行插值將其處理成等時(shí)間步長(zhǎng)數(shù)據(jù),就會(huì)極大地增加航跡提取和預(yù)測(cè)的難度,降低預(yù)測(cè)精度。對(duì)于部分原始數(shù)據(jù)缺失的情況,需要通過航跡插值進(jìn)行修復(fù)。因此,經(jīng)過航跡分割后的數(shù)據(jù)需要以航跡段為單位進(jìn)行航跡插值,從而提高數(shù)據(jù)的質(zhì)量和連續(xù)性。本文選擇常用的分段三次Hermite插值法,以60 s的時(shí)間步長(zhǎng)對(duì)原航跡數(shù)據(jù)進(jìn)行插值[10],經(jīng)過插值后的數(shù)據(jù)需要再通過式(5)進(jìn)行航跡分割,更新集合G。

      3 基于GMM的航跡提取算法

      3.1 航跡初步提取

      航跡初步提取是航跡提取算法的第一階段,通過限定距離,提取出測(cè)試航跡段一定范圍內(nèi)的航跡數(shù)據(jù)。測(cè)試集可以分為已知航跡和待測(cè)航跡,已知航跡是航跡初步提取的依據(jù)。確定合理的距離閾值是航跡初步提取的重點(diǎn):閾值過大,會(huì)導(dǎo)致大量無關(guān)數(shù)據(jù)被提取,增加聚類難度和程序運(yùn)行時(shí)間,降低預(yù)測(cè)精度;閾值過小,會(huì)剔除大量可以用于預(yù)測(cè)的航跡數(shù)據(jù),致使數(shù)據(jù)量較少甚至找不到可用的航跡數(shù)據(jù)。

      合理的距離閾值需綜合考慮航速、預(yù)測(cè)步長(zhǎng)等因素,本文將已知航跡的長(zhǎng)度Lq及其包含的航跡點(diǎn)數(shù)m納入計(jì)算。在大量實(shí)驗(yàn)的基礎(chǔ)上,得到距離閾值ε的估算公式:

      ε=6Lq/m

      (6)

      再利用已知航跡上最后一個(gè)航跡點(diǎn)的數(shù)據(jù)ce、ve和pe,在數(shù)據(jù)庫中尋找同時(shí)滿足以下要求的航跡點(diǎn):

      |ck-ce|<30°,|vk-ve|<5 kn

      (7)

      d(pk,pe)<ε

      (8)

      假定預(yù)測(cè)未來t時(shí)間內(nèi)的船舶航跡,記錄滿足式(7)和(8)的所有航跡點(diǎn),選取每個(gè)航跡點(diǎn)前t時(shí)間內(nèi)所有的航跡點(diǎn)數(shù)據(jù),構(gòu)成航跡集合Df。Df中每條航跡上的航跡點(diǎn)都需要根據(jù)式(8)進(jìn)行檢驗(yàn),刪除不滿足式(8)的航跡點(diǎn)所屬的航跡,最終得到經(jīng)初步提取后的航跡集合Df。

      3.2 航跡聚類

      航跡初步提取只是通過限定距離提取出一定范圍內(nèi)的航跡數(shù)據(jù),這部分?jǐn)?shù)據(jù)中的航速、航向等特征仍存在較大差異。為提高預(yù)測(cè)精度,需將航跡集合通過航跡聚類進(jìn)一步提取后再用于航跡預(yù)測(cè)。

      本文使用GMM進(jìn)行航跡聚類,GMM用高斯概率密度函數(shù)來量化事物,任意形狀的概率分布都可以用多個(gè)高斯分布函數(shù)來近似,其分布函數(shù)如下:

      (9)

      在進(jìn)行航跡聚類時(shí),每組航跡數(shù)據(jù)集都可以通過GMM被劃分為r個(gè)子集,故r值在很大程度上影響著聚類效果,本文采用貝葉斯信息準(zhǔn)則(Bayesian information criterion,BIC)來確定最佳r值。BIC通過衡量模型擬合的優(yōu)良性來確定模型最佳參數(shù),是一種較好的模型參數(shù)數(shù)量確定準(zhǔn)則,BIC值的計(jì)算式如下:

      NlnO-2lnR

      (10)

      式中:N為模型參數(shù)的數(shù)量;O為樣本數(shù)量;R為似然函數(shù)。從一組可供選擇的模型中選擇最佳模型時(shí),通常選擇似然程度高、模型復(fù)雜度較低的模型,即BIC值最小的模型[14]。

      在進(jìn)行航跡聚類時(shí),選用弗雷歇距離度量不同航跡之間的相似度。弗雷歇距離用來描述路徑空間相似度,可以應(yīng)用于平面曲線之間的相似度估量。同方向不能回溯的離散點(diǎn)組間,其對(duì)應(yīng)點(diǎn)之間最短距離的最大值就是離散點(diǎn)組間的弗雷歇距離。選用弗雷歇距離計(jì)算相似度時(shí),相似度越高,弗雷歇距離越小。對(duì)于Hj、Hl兩條航跡,弗雷歇距離可以根據(jù)式(3)表示成以下形式:

      F(j,l)=maxTjl

      (11)

      3.3 聚類算法流程

      聚類算法分兩步進(jìn)行,其具體步驟如下:

      第一步,航行趨勢(shì)的聚類。在航跡初步提取階段,無法去除與對(duì)應(yīng)點(diǎn)間距離的平均值較小、航行趨勢(shì)差異較大的航跡。經(jīng)實(shí)驗(yàn)檢驗(yàn),應(yīng)用航行趨勢(shì)差異大的航跡進(jìn)行訓(xùn)練會(huì)導(dǎo)致預(yù)測(cè)航跡出現(xiàn)較大誤差。為提高預(yù)測(cè)精度,聚類算法的第一步要提取出與測(cè)試集中航行趨勢(shì)相似度最高的一類航跡數(shù)據(jù),具體步驟如下:

      ①將經(jīng)航跡初步提取得出的每條航跡都通過最小二乘法進(jìn)行航跡的二階擬合。②將擬合的結(jié)果矩陣作為聚類對(duì)象,設(shè)置最大聚類簇?cái)?shù)為10,應(yīng)用GMM進(jìn)行聚類,根據(jù)式(10)計(jì)算每次聚類的BIC值。③選擇BIC值最小的簇?cái)?shù)b1作為最佳簇?cái)?shù),記錄最佳簇?cái)?shù)下聚類時(shí)各航跡所屬的類,得到類別標(biāo)定矩陣。④根據(jù)類別標(biāo)定矩陣中的對(duì)應(yīng)關(guān)系將Df分成b1個(gè)航跡集合。⑤將每個(gè)航跡集合中所有航跡通過對(duì)應(yīng)點(diǎn)加權(quán)平均合并為一條航跡,得到b1條航跡。⑥通過式(11)計(jì)算每條航跡與測(cè)試集中已知航跡的相似度。⑦選擇相似度最高的航跡對(duì)應(yīng)的航跡集合構(gòu)建新的航跡數(shù)據(jù)集Dz。

      第二步,航跡距離的聚類。在航跡趨勢(shì)聚類后,得到與測(cè)試航跡航行趨勢(shì)最相近的一類航跡集合,但這類航跡在單位時(shí)間步長(zhǎng)內(nèi)的航行距離差異較大,致使預(yù)測(cè)航跡與真實(shí)航跡相比過長(zhǎng)或過短。為降低這類誤差,提高預(yù)測(cè)精度,需要對(duì)航跡距離進(jìn)行聚類,具體步驟如下:

      ①根據(jù)式(4)計(jì)算Dz中每條航跡的長(zhǎng)度。②以航跡長(zhǎng)度為聚類對(duì)象,設(shè)置最大聚類簇?cái)?shù)為10,應(yīng)用GMM進(jìn)行聚類,根據(jù)式(10)計(jì)算每次聚類的BIC值。③選擇BIC值最小的簇?cái)?shù)b2作為最佳簇?cái)?shù),記錄最佳簇?cái)?shù)下聚類時(shí)各航跡所屬的類,得到類別標(biāo)定矩陣。④根據(jù)類別標(biāo)定矩陣中的對(duì)應(yīng)關(guān)系將Dz分成b2個(gè)航跡集合。⑤計(jì)算每個(gè)航跡集合中所有航跡長(zhǎng)度的平均值,得到b2個(gè)航跡長(zhǎng)度平均值。⑥計(jì)算每個(gè)航跡長(zhǎng)度平均值與已知航跡的長(zhǎng)度的差。⑦選擇差值絕對(duì)值最小的航跡長(zhǎng)度平均值對(duì)應(yīng)的航跡集合構(gòu)建新的數(shù)據(jù)集De,De即為通過航跡聚類得到的航跡數(shù)據(jù)集。

      4 LSTM預(yù)測(cè)模型

      選用LSTM用于航跡預(yù)測(cè),LSTM是一種時(shí)間遞歸神經(jīng)網(wǎng)絡(luò),在時(shí)間序列預(yù)測(cè)上有著較好的表現(xiàn)[15]。與其他神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型相比,LSTM增加了3個(gè)“門”結(jié)構(gòu):遺忘門、輸入門和輸出門。通過“門”結(jié)構(gòu),LSTM可以保存、丟棄記憶單元中的原信息以及保存新信息,使得LSTM在處理和預(yù)測(cè)延遲較長(zhǎng)的時(shí)序數(shù)據(jù)上更具優(yōu)勢(shì),且克服了梯度消失和梯度爆炸的問題。LSTM訓(xùn)練采用基于時(shí)間的反向傳播(back propagation through time, BPTT)算法,其基本原理與經(jīng)典的BP算法相似,包含正向和反向傳播的過程[16]。

      在預(yù)測(cè)時(shí),先將訓(xùn)練集De輸入預(yù)測(cè)模型,完成預(yù)測(cè)模型的訓(xùn)練,再將已知航跡輸入訓(xùn)練好的模型中,得到預(yù)測(cè)航跡。預(yù)測(cè)模型輸入數(shù)據(jù)為二維數(shù)據(jù),即歷史航跡的經(jīng)度和緯度數(shù)據(jù);輸出數(shù)據(jù)也為二維數(shù)據(jù),即預(yù)測(cè)航跡的經(jīng)度和緯度數(shù)據(jù)。

      對(duì)輸入數(shù)據(jù)進(jìn)行歸一化處理:

      (12)

      式中:x為原始訓(xùn)練數(shù)據(jù);maxX和minX分別為原始訓(xùn)練數(shù)據(jù)中的最大值和最小值。通過歸一化處理,能消除數(shù)據(jù)量綱和取值范圍的影響,同時(shí)保留原始數(shù)據(jù)中存在的關(guān)系[4]。將處理后的數(shù)據(jù)輸入以LSTM層為主的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,其具體結(jié)構(gòu)見圖1。

      圖1 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型結(jié)構(gòu)

      該神經(jīng)網(wǎng)絡(luò)包括1個(gè)輸入層、1個(gè)輸出層和4個(gè)隱藏層,隱藏層由LSTM層、Dropout層和Dense層(全連接層)構(gòu)成。根據(jù)實(shí)驗(yàn)將LSTM層和第一個(gè)Dense層的節(jié)點(diǎn)數(shù)分別設(shè)置為10和8;利用第二個(gè)Dense層進(jìn)行維度轉(zhuǎn)換,導(dǎo)出最終的二維數(shù)據(jù),其節(jié)點(diǎn)數(shù)為2;為防止過擬合出現(xiàn),在第一個(gè)Dense層后設(shè)置一個(gè)Dropout層。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練批量為n/30,n為De包含的數(shù)據(jù)數(shù)量;模型使用Adam優(yōu)化器,學(xué)習(xí)率為0.03,Dropout層參數(shù)為0.1,最大迭代次數(shù)為200。

      5 實(shí)證分析

      為驗(yàn)證提出的船舶航跡預(yù)測(cè)算法在航跡數(shù)據(jù)提取和預(yù)測(cè)上的有效性,采用大量隨機(jī)對(duì)比實(shí)驗(yàn)進(jìn)行驗(yàn)證。從網(wǎng)址www.marinecadastre.gov/ais獲取AIS數(shù)據(jù),限定經(jīng)度(西經(jīng))范圍為[-76.5°, -71.5°],緯度(北緯)范圍為[36.0°, 41.5°]。采集2019年全年數(shù)據(jù)構(gòu)建數(shù)據(jù)庫,采集2020年6月的數(shù)據(jù)構(gòu)建測(cè)試集。表1記錄了數(shù)據(jù)處理前后的航跡點(diǎn)數(shù)量。實(shí)驗(yàn)設(shè)備使用Intel(R) Core(TM) i5-1035G1的處理器,內(nèi)存16.0 GB,顯卡mx350。

      表1 數(shù)據(jù)處理前后的航跡點(diǎn)數(shù)量

      5.1 典型航跡預(yù)測(cè)

      為了更直觀地展示模型的預(yù)測(cè)效果,以穩(wěn)定航速直道航跡、穩(wěn)定航速小角度轉(zhuǎn)向航跡、變化航速小角度轉(zhuǎn)向航跡、穩(wěn)定航速大角度轉(zhuǎn)向航跡、穩(wěn)定航速復(fù)雜航跡、變化航速復(fù)雜航跡這6種典型航跡為例,對(duì)預(yù)測(cè)效果進(jìn)行展示和評(píng)價(jià)。圖2是這6種典型航跡真實(shí)值和預(yù)測(cè)值點(diǎn)狀圖。

      從圖2可以看出,對(duì)直道航跡的預(yù)測(cè)效果最好,對(duì)小角度轉(zhuǎn)向航跡的預(yù)測(cè)效果次之,對(duì)大角度轉(zhuǎn)向航跡的預(yù)測(cè)效果稍差,對(duì)復(fù)雜航跡的預(yù)測(cè)結(jié)果相對(duì)較差,同時(shí)對(duì)穩(wěn)定航速航跡的預(yù)測(cè)結(jié)果要比對(duì)變化航速航跡的預(yù)測(cè)結(jié)果好。由于這6種典型航跡各具特點(diǎn),所以圖2中各子圖坐標(biāo)尺度不一,這可能對(duì)圖片的直觀性有一定的影響。從穩(wěn)定航速直道航跡到變化航速復(fù)雜航跡這6種典型航跡預(yù)測(cè)結(jié)果的MSE如下:經(jīng)度預(yù)測(cè)結(jié)果的MSE分別為1.72×10-6、5.82×10-6、1.03×10-5、5.94×10-6、4.89×10-5、4.49×10-5;緯度預(yù)測(cè)結(jié)果的MSE分別為5.25×10-6、2.67×10-5、2.82×10-5、4.95×10-5、1.55×10-5、4.36×10-5;經(jīng)度和緯度預(yù)測(cè)結(jié)果的MSE均值分別為3.49×10-6、1.63×10-5、1.93×10-5、2.77×10-5、3.22×10-5、4.42×10-5。MSE結(jié)果與點(diǎn)狀圖的觀測(cè)相一致:隨著航速變化和航跡復(fù)雜度增大,預(yù)測(cè)結(jié)果逐漸變差。接下來的實(shí)證部分由于預(yù)測(cè)航跡較多,不再用圖展示預(yù)測(cè)結(jié)果,僅給出預(yù)測(cè)結(jié)果的MSE。

      5.2 聚類效果分析

      為驗(yàn)證聚類算法的有效性,隨機(jī)從測(cè)試集中提取各類型船舶航跡數(shù)據(jù)共計(jì)100組作為測(cè)試集,然后從數(shù)據(jù)庫中得到100組對(duì)應(yīng)的初步提取的航跡集合Df,再將Df中的航跡進(jìn)行航跡聚類后得到相應(yīng)航跡集合De。分別將Df和De作為訓(xùn)練集,通過LSTM預(yù)測(cè)模型進(jìn)行預(yù)測(cè),分別得到未經(jīng)過航跡聚類和經(jīng)過航跡聚類情況下的預(yù)測(cè)結(jié)果。對(duì)這2種情況下的預(yù)測(cè)結(jié)果的MSE平均值進(jìn)行分析,結(jié)果見圖3。

      a)穩(wěn)定航速直道航跡

      b)穩(wěn)定航速小角度轉(zhuǎn)向航跡

      c)變化航速小角度轉(zhuǎn)向航跡

      d)穩(wěn)定航速大角度轉(zhuǎn)向航跡

      e)穩(wěn)定航速復(fù)雜航跡

      f)變化航速復(fù)雜航跡

      a)經(jīng)度預(yù)測(cè)誤差

      b)緯度預(yù)測(cè)誤差

      從圖3可以看出:各個(gè)預(yù)測(cè)時(shí)間下,經(jīng)度和緯度預(yù)測(cè)結(jié)果的MSE在經(jīng)過航跡聚類后都有明顯下降,證明所使用的聚類算法可以根據(jù)航跡特征有效提取航跡數(shù)據(jù)集,提高預(yù)測(cè)精度;MSE平均值隨預(yù)測(cè)時(shí)間的增加而不斷上升,經(jīng)航跡聚類后算法在預(yù)測(cè)到30 min時(shí)的經(jīng)度和緯度MSE平均值分別為3.65×10-5和4.85×10-5。

      5.3 不同預(yù)測(cè)模型的預(yù)測(cè)效果對(duì)比

      為驗(yàn)證提出的LSTM預(yù)測(cè)模型的有效性,選取BPNN、SVM、ELM這3種常用的預(yù)測(cè)模型進(jìn)行對(duì)比實(shí)驗(yàn)。BPNN的輸入和輸出節(jié)點(diǎn)數(shù)都為2,隱藏層節(jié)點(diǎn)數(shù)為3,學(xué)習(xí)率為0.02,最大迭代次數(shù)為1 000;SVM的核函數(shù)為“l(fā)inear”,核尺度參數(shù)為“auto”,其他參數(shù)都采用MATLAB深度學(xué)習(xí)工具箱默認(rèn)值;ELM的隱藏層神經(jīng)元數(shù)量為9,激活函數(shù)為“sig”,其他參數(shù)都采用工具箱默認(rèn)值。

      對(duì)比實(shí)驗(yàn)按不同船型進(jìn)行,從每種船型航跡數(shù)據(jù)庫中隨機(jī)選取100組航跡數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)時(shí)間統(tǒng)一為30 min,取預(yù)測(cè)結(jié)果MSE的平均值進(jìn)行對(duì)比,結(jié)果見圖4。從圖4可以看出,無論是在哪種船型數(shù)據(jù)集中進(jìn)行的實(shí)驗(yàn),LSTM預(yù)測(cè)的經(jīng)度和緯度MSE遠(yuǎn)低于其他預(yù)測(cè)模型,充分驗(yàn)證了本文方法比傳統(tǒng)的BPNN、SVM、ELM有著更高的預(yù)測(cè)精度。

      a)經(jīng)度預(yù)測(cè)誤差

      b)緯度預(yù)測(cè)誤差

      5.4 LSTM預(yù)測(cè)結(jié)果分析

      從圖4 LSTM預(yù)測(cè)誤差可以看出,6類船舶經(jīng)度和緯度預(yù)測(cè)結(jié)果的MSE均處于10-5數(shù)量級(jí),只有油船經(jīng)度預(yù)測(cè)結(jié)果的MSE和客船緯度預(yù)測(cè)結(jié)果的MSE值略大,超過了4×10-5。航跡預(yù)測(cè)過程中可能由于聚類錯(cuò)誤等情況,出現(xiàn)MSE過大的異常點(diǎn)??紤]到平均值在異常點(diǎn)影響下可能無法反映真實(shí)情況,對(duì)不同類型船舶航跡預(yù)測(cè)結(jié)果的MSE進(jìn)行進(jìn)一步分析,其箱線圖見圖5。

      a)經(jīng)度預(yù)測(cè)誤差

      b)緯度預(yù)測(cè)誤差

      從圖5可以看出:除客船外的其他5類船舶大部分(75%以上)預(yù)測(cè)結(jié)果的MSE都在5×10-5以下;客船經(jīng)度預(yù)測(cè)結(jié)果MSE的非異常最大值為1.05×10-4,最小值為3.70×10-7,箱體數(shù)據(jù)表明75%的預(yù)測(cè)結(jié)果MSE都不大于5.09×10-5;客船緯度預(yù)測(cè)結(jié)果MSE的非異常最大值為1.25×10-4,最小值為1.70×10-7,箱體數(shù)據(jù)表明75%的預(yù)測(cè)結(jié)果MSE都不大于5.82×10-5。去除掉異常點(diǎn)后,客船大部分預(yù)測(cè)結(jié)果MSE也都在5×10-5以下,因此所提出的模型可以對(duì)包括客船在內(nèi)的6類船舶在未來30 min內(nèi)的航跡進(jìn)行有效預(yù)測(cè),箱線圖的結(jié)果進(jìn)一步驗(yàn)證了所提出算法的有效性。

      5.5 LSTM預(yù)測(cè)算法耗時(shí)分析

      在航跡預(yù)測(cè)領(lǐng)域,預(yù)測(cè)算法處理時(shí)間的快慢是衡量其性能的重要指標(biāo),如果耗時(shí)過長(zhǎng),其實(shí)用價(jià)值就會(huì)大大降低。為驗(yàn)證所提出算法的實(shí)用性,按船型分別對(duì)6類船舶進(jìn)行100組隨機(jī)實(shí)驗(yàn),記錄每次實(shí)驗(yàn)的各部分運(yùn)行時(shí)間并計(jì)算平均值,結(jié)果見表2。

      表2 LSTM預(yù)測(cè)算法耗時(shí) s

      從表2可以看出,不同類型船舶航跡的平均預(yù)測(cè)時(shí)間都在20 s以內(nèi),其中:油船的航跡預(yù)測(cè)總時(shí)間最短,只有9.87 s;客船和拖船的航跡預(yù)測(cè)總時(shí)間較長(zhǎng),分別達(dá)到了19.69 s和18.60 s。由于客船大多有固定的航線,每條航線上航次量大,所以客船的航跡預(yù)測(cè)運(yùn)算量大;拖船的航跡數(shù)據(jù)量是所有船舶中最多的:因此對(duì)這兩類船舶的航跡預(yù)測(cè)耗時(shí)較長(zhǎng)。雖然各類船舶的航跡預(yù)測(cè)總耗時(shí)不同,但總時(shí)間平均值都小于20 s,同時(shí)根據(jù)記錄的數(shù)據(jù)顯示,600組數(shù)據(jù)中只有關(guān)于拖船的3組數(shù)據(jù)航跡預(yù)測(cè)總時(shí)間超過了60 s,最大為75.62 s,考慮到模型可預(yù)測(cè)船舶在未來30 min內(nèi)的航跡,模型總運(yùn)行時(shí)間在1 min內(nèi)是可以接受的。

      6 結(jié) 論

      本文綜合考慮航跡提取和模型預(yù)測(cè),提出一種基于高斯混合模型(GMM)與長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)耦合模型的船舶航跡預(yù)測(cè)算法。將歷史數(shù)據(jù)按不同船型構(gòu)建航跡數(shù)據(jù)庫,通過限定距離實(shí)現(xiàn)航跡初步提取,采用基于GMM的聚類算法將初步提取出的數(shù)據(jù)進(jìn)一步提取,最后通過LSTM預(yù)測(cè)模型完成航跡預(yù)測(cè)。大量的隨機(jī)對(duì)比實(shí)驗(yàn)證明,本文所提出的基于GMM的航跡提取算法可以準(zhǔn)確高效地提取航跡數(shù)據(jù),LSTM預(yù)測(cè)模型在航跡預(yù)測(cè)上的預(yù)測(cè)精度遠(yuǎn)高于一般的BPNN、SVM和ELM預(yù)測(cè)模型。本文所提出的航跡預(yù)測(cè)算法可以有效地對(duì)各類船舶在未來30 min內(nèi)的航跡進(jìn)行預(yù)測(cè),整個(gè)預(yù)測(cè)過程一般用時(shí)短于1 min,該方法在實(shí)現(xiàn)任意船舶中短期航跡實(shí)時(shí)預(yù)測(cè)上具有重要的實(shí)際價(jià)值。

      本文基于船型建立數(shù)據(jù)庫進(jìn)行預(yù)測(cè)主要是為了在保證預(yù)測(cè)精度的前提下提高預(yù)測(cè)速度,但未對(duì)不同類型船舶的航跡特征進(jìn)行深入分析。未來將在此方面展開深入研究,根據(jù)不同類型船舶的航跡內(nèi)在特征為各類船舶設(shè)計(jì)專門的航跡預(yù)測(cè)算法,進(jìn)一步提高預(yù)測(cè)精度。

      猜你喜歡
      航速航跡聚類
      VLCC在波浪中的航速優(yōu)化與能效優(yōu)化分析
      提升全回轉(zhuǎn)港作拖輪航速的有效途徑
      水上消防(2022年1期)2022-06-16 08:06:56
      夢(mèng)的航跡
      青年歌聲(2019年12期)2019-12-17 06:32:32
      低速水面目標(biāo)航速精度分析及精確解算
      基于DBSACN聚類算法的XML文檔聚類
      自適應(yīng)引導(dǎo)長(zhǎng)度的無人機(jī)航跡跟蹤方法
      視覺導(dǎo)航下基于H2/H∞的航跡跟蹤
      基于CFD的波浪滑翔機(jī)航速預(yù)測(cè)
      基于改進(jìn)的遺傳算法的模糊聚類算法
      基于航跡差和航向差的航跡自動(dòng)控制算法
      合肥市| 朝阳县| 天等县| 隆回县| 建水县| 日喀则市| 太白县| 富宁县| 商水县| 姜堰市| 泉州市| 玉屏| 六安市| 浮山县| 洛隆县| 三江| 竹山县| 崇仁县| 积石山| 南阳市| 清水河县| 仁怀市| 大庆市| 牟定县| 讷河市| 房产| 蒙阴县| 汤阴县| 石嘴山市| 奉新县| 金昌市| 宁阳县| 乃东县| 罗江县| 浑源县| 东兰县| 碌曲县| 绥芬河市| 阿尔山市| 肃南| 通海县|