• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      海洋底質(zhì)類型圖矢量化智能制作技術(shù)研究

      2023-11-28 10:08:10王風帆孔敏余佳韓璐遙
      關(guān)鍵詞:底質(zhì)柵格決策樹

      王風帆,孔敏,余佳,韓璐遙

      (國家海洋信息中心,天津 300171)

      海洋底質(zhì)類型圖是開展海洋環(huán)境研究的基礎(chǔ)圖件之一,常用于海洋工程、沉積環(huán)境研究等領(lǐng)域[1-2]。傳統(tǒng)底質(zhì)制圖方法依賴于制圖人員的專業(yè)知識,主觀性強且效率不高[3]。隨著計算機技術(shù)的發(fā)展,空間插值技術(shù)的引入大大提高了底質(zhì)類型圖制作的效率。張立華等[4]和王濤等[5]引入了Voronoi圖生成技術(shù);楊康等[3]利用反距離加權(quán)和克里金法進行網(wǎng)格點粒級組分插值,然后采用柵格疊合法計算底質(zhì)類型。Jerosch[6]改進了柵格疊合法,利用協(xié)同克里金法引入地形信息,并證明該方法適用于不含礫石的謝帕德分類。Lark等[7]直接利用協(xié)同克里金法進行底質(zhì)類型預(yù)測,但只針對簡化的??朔诸悾ê[),且實現(xiàn)過程復(fù)雜,對統(tǒng)計學知識要求較高。由于克里金法對數(shù)據(jù)在空間平穩(wěn)性和統(tǒng)計分布上的要求較高,限制了其在底質(zhì)類型圖制作中的應(yīng)用。劉付程等[8-9]和袁瑋等[10]提出了一種基于概率測度的底質(zhì)類型制圖法,降低了對數(shù)據(jù)的要求,且能夠?qū)Σ逯到Y(jié)果的不確定性進行評價,但對空間統(tǒng)計相關(guān)知識要求較高。上述海洋底質(zhì)類型圖制作方法均需要準確的沉積物組分信息,無法應(yīng)用于組分信息缺失的場景,且其目標產(chǎn)品均為網(wǎng)格或位圖數(shù)據(jù),不利于后續(xù)圖件修改工作的開展。

      本文針對傳統(tǒng)底質(zhì)類型圖制作中存在的問題,基于隨機森林算法分類功能,研究海洋底質(zhì)類型網(wǎng)格數(shù)據(jù)智能制作方法,設(shè)計了底質(zhì)類型分布矢量圖的制作與平滑流程,能夠獲取準確的底質(zhì)類型分布矢量數(shù)據(jù),使底質(zhì)類型邊界光滑美觀,最終利用渤海區(qū)域底質(zhì)數(shù)據(jù)進行應(yīng)用試驗,結(jié)果與柵格疊合法進行對比分析,證明了該方法的有效性。

      1 數(shù)據(jù)情況

      本文選用渤海區(qū)域歷史調(diào)查獲取的表層沉積物樣品粒度數(shù)據(jù),共790 站,包含經(jīng)度、緯度、各組分比例(礫石、砂、粉砂、黏土)信息,數(shù)據(jù)完整且較為規(guī)范(組分比例之和為100%±1%)[11],可精準確定底質(zhì)類型并用于后期方法驗證。站位數(shù)空間分布如圖1所示。

      圖1 底質(zhì)數(shù)據(jù)站位數(shù)空間分布圖

      依據(jù)??朔诸惙╗7],將數(shù)據(jù)劃分為11 種底質(zhì)類型。從數(shù)量上看(圖2),以砂質(zhì)粉砂、粉砂質(zhì)砂、泥質(zhì)砂和粉砂為主,黏土、礫質(zhì)泥質(zhì)砂、含礫泥、礫質(zhì)砂十分稀少。

      圖2 底質(zhì)類型站位數(shù)量分布圖

      2 技術(shù)方法

      2.1 隨機森林算法

      考慮到海洋底質(zhì)歷史數(shù)據(jù)中,沉積物組分信息經(jīng)常存在缺失的情況,因此對于一些缺少詳細數(shù)據(jù)的區(qū)域只能利用已知的底質(zhì)類型直接成圖。而底質(zhì)類型屬于離散數(shù)據(jù),大部分插值方法不適用該場景,因此本文利用機器學習隨機森林算法的分類功能,通過學習底質(zhì)數(shù)據(jù)的空間自相關(guān)性來預(yù)測未采樣位置的底質(zhì)類型。

      2.1.1 算法原理

      隨機森林算法是指為增強決策樹的多樣性而在決策樹構(gòu)建過程中對樣本和特征進行隨機化選擇的集成化學習方法(圖3),即具有隨機化決策樹的Bagging 集成,屬于非參數(shù)統(tǒng)計方法與決策樹算法的結(jié)合[12]。隨機森林算法不需要先驗假設(shè),可以充分利用輸入信息,能夠處理樣本不平衡問題且不容易出現(xiàn)過擬合,具有較高的運算速度和穩(wěn)健性,易于操作和使用,因而在數(shù)據(jù)分類中廣泛應(yīng)用。

      圖3 隨機森林算法原理圖

      隨機森林算法首先對具有K個特征的訓練數(shù)據(jù)集進行有放回隨機采樣,形成m個子訓練集,針對每個子訓練集隨機抽取k個特征(k≤K)來建立m個決策樹,然后在測試或?qū)嶋H分類時,采用投票作為結(jié)合策略,以決策樹預(yù)測最多(票數(shù)最高)的類別作為最終結(jié)果。這種通過隨機抽取部分樣本來生成決策樹的方法稱為Bagging 集成。決策樹建立需要確定分裂方法,常用的是不純度度量法,包括Gini 系數(shù)法、信息增益法、增益比率法等。這里采用應(yīng)用最廣泛的Gini 系數(shù),其公式為:

      式中:pl為輸入樣本屬于第l個類別(共L個類別)的概率。Gini系數(shù)越小代表樣本純度越高。

      2.1.2 模型評估指標

      評估分類模型性能的指標有準確率、精準率、召回率和F1 值等[13]。其中,準確率是常用的模型評價指標:

      式中:TP為真正類,指一個正類實例被預(yù)測為正類;TN為真負類,指一個負類被預(yù)測為負類;FP為假正類,指一個負類被預(yù)測為正類;FN為假負類,指一個正類被預(yù)測為負類。

      在數(shù)據(jù)不均衡的情況下,準確率對模型性能的反映存在很大缺陷,因此需要從不同角度去評價分類效果。

      精準率Pre為真正類與預(yù)測為正類的數(shù)量之比。

      召回率Rec為真正類與實際為正類的數(shù)量之比。

      F1 值是精準率與召回率的結(jié)合,能夠?qū)δP瓦M行整體評價。

      考慮到本文數(shù)據(jù)中各底質(zhì)類型數(shù)量并不均衡,雖然算法構(gòu)建過程中采取了一定措施,但為了進一步減小數(shù)據(jù)不均衡帶來的影響,最終采用F1 值作為建模過程中的評價指標。

      2.1.3 類型編碼

      將輸入數(shù)據(jù)中的經(jīng)度和緯度作為特征變量,底質(zhì)類型為標簽變量。底質(zhì)類型為字符型數(shù)據(jù),算法無法識別,需要將其轉(zhuǎn)換為離散化數(shù)值[12](表1)。

      表1 底質(zhì)類型編碼

      將數(shù)據(jù)輸入模型進行訓練,決策樹數(shù)量設(shè)置為100,完成后將成圖網(wǎng)格點處坐標輸入模型,以預(yù)測坐標點處的坐標類型編碼,然后利用表1進行反編碼,即可獲取底質(zhì)類型的網(wǎng)格數(shù)據(jù)。根據(jù)數(shù)據(jù)空間分布范圍,設(shè)置網(wǎng)格步長為0.6'。

      2.2 矢量圖制作

      獲取網(wǎng)格數(shù)據(jù)后,便可進行底質(zhì)類型圖的制作。底質(zhì)類型圖不同于等值線及等值線填充圖,其以多邊形面為主體,內(nèi)部的底質(zhì)類型一致。常規(guī)作圖法采用網(wǎng)格填充或者最近鄰插值方式,但在網(wǎng)格步長較大時會產(chǎn)生明顯的鋸齒狀邊界。而等值線生成法雖然能夠產(chǎn)生光滑的邊界,但由于其將輸入編碼作為連續(xù)數(shù)值,最終會產(chǎn)生連續(xù)疊加的“厚”邊界甚至不正確的面要素,需要后期進行手工編輯修正,增加了工作量[14]。

      為了改善這一問題,本文利用ArcGIS 的矢量數(shù)據(jù)操作功能[15-16],提出了一種底質(zhì)類型邊界平滑方法。具體如下:

      采用最近鄰插值獲取底質(zhì)類型面要素,利用Data Management Tools -> Feature -> Feature to Point 功能提取面要素的代表點,并利用Spatial Analyst Tools -> Extraction -> Extract Values to Points功能將底質(zhì)類型信息添加到代表點中。

      將面要素轉(zhuǎn)換為線要素(邊界線),利用Cartography Tools -> Generalization -> Smooth Line功能對邊界線進行光滑。這里平滑算法選用Peak,容差為1°。

      利用Data Management Tools -> Feature ->Feature to Polygon 將邊界線與研究區(qū)多邊形結(jié)合生成具有光滑邊界的面要素。

      利用Analysis Tools -> Overlay -> Spatial Join功能,將代表點的底質(zhì)類型信息賦給面要素。

      最終,對面要素進行顏色填充等操作,完成底質(zhì)類型圖的編制??傮w技術(shù)路線如圖4所示。

      圖4 技術(shù)路線圖

      3 試驗與分析

      為了測試模型的有效性,需要將數(shù)據(jù)集劃分成兩個部分,分別用于模型構(gòu)建與測試??紤]到含礫泥質(zhì)砂等5 種沉積物數(shù)量過少(<10),無法開展測試,因此將其剔除,然后按6∶4 的比例將數(shù)據(jù)集劃分為訓練集與測試集,利用訓練集建立底質(zhì)類型空間預(yù)測模型,并利用測試集對模型進行評估。分析評估結(jié)果(表2)發(fā)現(xiàn),模型總體加權(quán)平均F1 值為60%,其中對泥質(zhì)砂的預(yù)測性能較好,F(xiàn)1 值達到了71%,但對砂和砂質(zhì)泥的預(yù)測性能很差,F(xiàn)1 值為0%。這里影響模型性能的因素主要有兩個,一個是樣本數(shù)量,另一個則是樣本的分布情況。樣本數(shù)量越少,算法挖掘其規(guī)律的效果就越差;而分布零散,會導(dǎo)致某一種沉積物的分布區(qū)內(nèi)沒有樣本用于模型建立,也會影響測試結(jié)果。因此除了量化分析結(jié)果外,還需要通過繪制底質(zhì)類型圖并與已有方法制作的圖件相比較進行驗證分析。

      表2 隨機森林模型測試結(jié)果

      將渤海沉積物粒度數(shù)據(jù)按照本文建立的智能制圖方法進行網(wǎng)格化與圖件制作,即假設(shè)研究區(qū)內(nèi)底質(zhì)數(shù)據(jù)僅有底質(zhì)類型信息,沉積物組分信息缺失,在該情形下制作獲取底質(zhì)類型圖(圖5(a))。為了分析圖件的有效性,需對比底質(zhì)數(shù)據(jù)中沉積物組分信息完整的場景,即采用柵格疊合法制作底質(zhì)類型圖進行比較(圖5(b))。面要素顏色填充均依據(jù)國家標準《海洋要素圖示圖例及符號》(GB/T 32067-2015)[16]。

      圖5 不同方法制作的底質(zhì)分類圖

      首先,隨機森林與柵格疊合的制圖結(jié)果十分接近,整體趨勢基本一致。柵格疊合的結(jié)果可靠性較高,但也是基于詳細的組分信息,在許多收集的海洋底質(zhì)類型圖等資料中并不包含這些信息,因此隨機森林方法在一定情形下作為常規(guī)制圖法的補充是比較可靠的。

      其次,柵格疊合比隨機森林結(jié)果多出3 個底質(zhì)類型,砂質(zhì)黏土(sC)、礫質(zhì)泥(gM)和含礫砂((g)S),這是由于柵格疊合是基于組分進行插值,疊合后需要重新進行類型劃分。沉積物的空間分布具有一定的漸變性特征,不同底質(zhì)類型之間的邊界具有模糊性(不確定性)[10],因此出現(xiàn)這種現(xiàn)象是合理的。但這些類型占比非常小,對結(jié)果影響不是很大,因此隨機森林結(jié)果可用性還是很高的。

      最后,柵格疊合法產(chǎn)生的底質(zhì)類型邊界由于最近鄰插值呈鋸齒狀,一般為了消除這種現(xiàn)象需要設(shè)計更小的網(wǎng)格間距,會加大計算量。而本文提出的邊界平滑方法可以解決這個問題,并能夠獲取易于編輯的矢量數(shù)據(jù),有利于后期的圖件修改。此外,該平滑方法也可應(yīng)用于柵格疊合法邊界平滑,效果明顯(圖5(c))。

      4 結(jié)語

      本文針對底質(zhì)類型數(shù)據(jù),提出基于隨機森林算法的底質(zhì)類型圖網(wǎng)格制作方法,并利用ArcGIS的矢量數(shù)據(jù)操作功能構(gòu)建底質(zhì)類型邊界平滑方法,開發(fā)了底質(zhì)類型矢量圖智能制作技術(shù),最終利用渤海沉積物粒度數(shù)據(jù)進行應(yīng)用試驗,并與柵格疊合技術(shù)進行了對比,得出結(jié)論如下:

      (1)本文提出的底質(zhì)類型智能預(yù)測方法能夠?qū)ξ床蓸游恢玫牡踪|(zhì)類型進行有效預(yù)測。

      (2)利用本文提出的底質(zhì)類型邊界平滑方法可以獲得平滑的底質(zhì)類型邊界,制作出的圖件較為美觀。

      (3)本文提出的底質(zhì)類型矢量圖智能制作方法,是對傳統(tǒng)底質(zhì)類型圖制作方法的補充與改進,能夠有效提高圖件制作效率,有利于后續(xù)研究工作的開展。

      猜你喜歡
      底質(zhì)柵格決策樹
      不同發(fā)育階段中華絨螯蟹對底質(zhì)的喜好性研究
      一種ReliefF和隨機森林模型組合的多波束海底底質(zhì)分類方法
      海洋通報(2022年2期)2022-06-30 06:06:28
      基于鄰域柵格篩選的點云邊緣點提取方法*
      用于海底目標識別與底質(zhì)分類的多波束水體波形預(yù)處理
      海洋通報(2021年1期)2021-07-23 01:55:24
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      文蛤的底質(zhì)選擇性及潛沙能力研究
      基于決策樹的出租車乘客出行目的識別
      不同剖面形狀的柵格壁對柵格翼氣動特性的影響
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      克什克腾旗| 尼木县| 班玛县| 西华县| 沿河| 富宁县| 孝昌县| 女性| 汤阴县| 甘洛县| 遵化市| 滕州市| 临海市| 松原市| 来安县| 汽车| 临高县| 五原县| 临泉县| 金乡县| 台州市| 平谷区| 涞水县| 绥滨县| 崇礼县| 年辖:市辖区| 东丽区| 明星| 松溪县| 大渡口区| 永清县| 凤城市| 长垣县| 乌什县| 和静县| 武清区| 竹北市| 晋城| 武威市| 安庆市| 唐河县|