劉世界
商丘工學(xué)院 河南商丘 476000
數(shù)字高程模型(Digital Elevation Model,DEM)[1]包含了豐富的地形、地貌、水文信息,它能反映各種分辨率的地形特征,通過DEM可以提取大量的地表形態(tài)信息[2]。
傳統(tǒng)貝葉斯方法[3]在DEM地形分類和預(yù)測應(yīng)用[4]中存在一些不足之處。主要從以下兩個方面進(jìn)行闡述。
(1)沒有考慮DEM中地形屬性如坡向,坡度等不確定分析受到對不同地形分類如丘陵、平原地區(qū)影響;
(2)沒有考慮如坡度同一地形屬性[5]對于具體地形分類準(zhǔn)確率的影響;對于地形分類,如果地形屬性所占比例越多,一般情況下,屬性個數(shù)越多地形分類的準(zhǔn)確率就越高,但是地形屬性個數(shù)越多,地形分類的效率就越低。
因此,需要針對傳統(tǒng)貝葉斯算法的不足以及DEM地形數(shù)據(jù)的特點(diǎn),尋找一個有效的算法,基于此基礎(chǔ)本文提出一種基于相對信任度[6-8]的貝葉斯算法用于DEM地形分類。并且利用該方法對DEM坡度、坡向、山脊線、山谷線地形因素進(jìn)行數(shù)據(jù)分析,為地形研究和考察評價提供了一種新的可靠的預(yù)測分類方法。
樸素貝葉斯算法是通過計(jì)算后驗(yàn)概率的方法來確定樣本所屬類別的概率,基本思想是基于概率論中的貝葉斯公式和簡化假設(shè),采用屬性和類別的聯(lián)合概率來估計(jì)新樣本的類別。
如果Aj是分類屬性,P(xj|Ci)等于類別為Ci的訓(xùn)練樣本中屬性Aj等于xj的比例[1]。
從理論上分析,樸素貝葉斯比其他分類算法如決策樹、SVM等具有更好的分類精度,但是貝葉斯分類模型在對樣本進(jìn)行分類時沒有考慮屬性不同時對分類所起作用不同,冗余的數(shù)據(jù)屬性會提高數(shù)據(jù)的維數(shù),增加分類計(jì)算量和帶來噪聲影響,造成分類準(zhǔn)確率的下降。
基于相對信任度貝葉斯算法在對DEM地形屬性數(shù)據(jù)進(jìn)行不確定分析和預(yù)測分類時候,具體算法流程如下所述。
Stpe1:對原始DEM地形屬性數(shù)據(jù)進(jìn)行預(yù)處理,如:離散化處理和空值處理。
Stpe2:對于訓(xùn)練坡度,坡向等DEM數(shù)據(jù)屬性樣本,用上述算法公式計(jì)算每個屬性Ai分類的相對可信度Ri(1≤i≤N),并把Ri由大到小進(jìn)行排列,選取前K個屬性作為最佳屬性,刪除排在后面的(N-K)個屬性,得到特征選擇后的一個新屬性集合B={B1,B2,…,BK}。K是人為預(yù)定的一個整數(shù),作為所選特征屬性的個數(shù)。
為了弄清DEM預(yù)測分類系統(tǒng)的信息處理工作,哪些與系統(tǒng)有關(guān),哪些與系統(tǒng)無關(guān),就必須了解組織的業(yè)務(wù)流程。因此提供信息的時間和信息形態(tài)等有關(guān)調(diào)查情況并用“業(yè)務(wù)流程圖”來表示。
基于貝葉斯DEM預(yù)測分類系統(tǒng)需要大量數(shù)據(jù)為支撐,一般收集或?qū)崪y的資料格式多種多樣,數(shù)據(jù)的存儲需要對數(shù)據(jù)進(jìn)行格式統(tǒng)一。本文是通過對數(shù)據(jù)歸類統(tǒng)一,建立基礎(chǔ)數(shù)據(jù)庫,基礎(chǔ)數(shù)據(jù)庫包括屬性數(shù)據(jù)庫和空間屬性數(shù)據(jù)庫兩類。在進(jìn)行數(shù)據(jù)庫設(shè)計(jì)時,通過數(shù)據(jù)分層、圖層管理、屬性編碼和空間索引設(shè)計(jì),建立空間數(shù)據(jù)庫,然后進(jìn)行屬性數(shù)據(jù)庫設(shè)計(jì),最后建立空間數(shù)據(jù)庫與屬性數(shù)據(jù)庫的連接關(guān)系。
本文針對改好后的基于相對信任度的貝葉斯算法在實(shí)際系統(tǒng)應(yīng)用情況進(jìn)行測試,在測試中對DEM地形模型中的屬性坡向,坡度以及山谷線,山脊線作為分類屬性,對它們進(jìn)行特征提取,根據(jù)分析結(jié)果對地形進(jìn)行分類測試。
把改進(jìn)的基于相對信任度的貝葉斯算法和傳統(tǒng)貝葉斯算法進(jìn)行在DEM預(yù)測分類過程中的時間復(fù)雜度進(jìn)行時間性能分析。
改進(jìn)后的基于相對信任度的貝葉斯算法和傳統(tǒng)貝葉斯算法在DEM地形分類,坡度,坡向以及其他DEM屬性進(jìn)行預(yù)測分類過程中耗費(fèi)時間都有所提高。
評測DEM地形分類準(zhǔn)確率,是貝葉斯算法優(yōu)劣的一個很重要的指標(biāo),其定義如下:
準(zhǔn)確率(precision)=分類的正確記錄數(shù)總的記錄數(shù)
改進(jìn)后的基于相對信任度的貝葉斯算法和傳統(tǒng)貝葉斯算法在DEM地形分類,坡度,坡向以及其他DEM屬性進(jìn)行分析過程中準(zhǔn)確率都有所提高。
本文在結(jié)合前人優(yōu)勢的基礎(chǔ)上,提取的坡度等地形屬性數(shù)據(jù)進(jìn)行分析,提出一種基于相對信任度的貝葉斯算法用于DEM地形分析,通過具體的實(shí)驗(yàn)結(jié)果對上述改進(jìn)后貝葉斯算法進(jìn)行驗(yàn)證,從DEM分類準(zhǔn)確率和時間性能進(jìn)行建模比較,驗(yàn)證了改進(jìn)后貝葉斯算法的可行性和合理性。