時(shí)會(huì)省 朱文軍
(河南測(cè)繪職業(yè)學(xué)院,河南 鄭州 450015)
地圖可以用來表示任何類型的數(shù)據(jù),比表格和文字更能有效地表現(xiàn)地理特征。很多制圖工作都是統(tǒng)計(jì)性的,利用公開發(fā)表的各種統(tǒng)計(jì)數(shù)據(jù),編制的有關(guān)經(jīng)濟(jì)、人口、社會(huì)等方面的專題地圖是最明顯的“統(tǒng)計(jì)”地圖,在編制此類地圖時(shí)要遵循統(tǒng)計(jì)原則來處理制圖數(shù)據(jù)[1]。其中,對(duì)數(shù)據(jù)進(jìn)行分級(jí)處理是地圖數(shù)據(jù)處理特別是專題地圖數(shù)據(jù)表達(dá)和分析的一種重要方法。
數(shù)據(jù)的分級(jí)處理包括對(duì)數(shù)據(jù)的排序和分析,其中確定分級(jí)數(shù)和分級(jí)界限是統(tǒng)計(jì)數(shù)據(jù)分級(jí)處理的重心。統(tǒng)計(jì)數(shù)據(jù)資料分級(jí),是將數(shù)據(jù)通過列表、繪頻率直方圖以及計(jì)算分析以后,對(duì)分析結(jié)果作出地理解釋,為所編地圖尋求合理的分級(jí),以求充分地反映其分布的地理規(guī)律性。
分級(jí)算法的研究,一直在不斷改進(jìn)發(fā)展。20世紀(jì)50年代以來,地學(xué)研究方法從定性分析發(fā)展到定量分析;60年代,多元統(tǒng)計(jì)分析應(yīng)用于地學(xué)領(lǐng)域,推動(dòng)了地圖制圖數(shù)據(jù)處理模型的發(fā)展;70年代,不少地圖制圖學(xué)者應(yīng)用統(tǒng)計(jì)分析學(xué)和信息論分析地圖內(nèi)容,形成了比較系統(tǒng)的地圖制圖數(shù)據(jù)處理模型的理論與方法;80年代,模糊數(shù)學(xué)、最優(yōu)化方法等現(xiàn)代數(shù)學(xué)被引入專題地圖制圖領(lǐng)域,取得了不少成果;90年代以來,許多地圖制圖學(xué)者利用數(shù)學(xué)形態(tài)學(xué)、分型理論和小波理論等現(xiàn)代數(shù)學(xué)對(duì)空間數(shù)據(jù)多尺度處理與表示進(jìn)行深入探討,取得了許多研究成果,使地圖數(shù)據(jù)處理模型得到進(jìn)一步發(fā)展[2]。
長(zhǎng)期以來,制圖要素的分級(jí)算法一直備受關(guān)注。20世紀(jì)70年代以前,制圖員從制圖學(xué)的要求出發(fā),根據(jù)經(jīng)驗(yàn)選擇某種數(shù)列或級(jí)數(shù)來分級(jí),分級(jí)界限的確定僅取決于分級(jí)數(shù)據(jù)的最大值、最小值和分級(jí)數(shù)。70年代以后,人們開始用統(tǒng)計(jì)學(xué)尋找數(shù)據(jù)分布的自然裂點(diǎn)作為分級(jí)界限。我們把用數(shù)列和級(jí)數(shù)分級(jí)的方法稱為傳統(tǒng)分級(jí)方法,把從統(tǒng)計(jì)學(xué)角度研究確定分級(jí)界限的方法稱為統(tǒng)計(jì)分級(jí)方法。
用傳統(tǒng)方法產(chǎn)生的分級(jí)界限有規(guī)則變化,易于被讀者理解,能增強(qiáng)地圖的易讀性,提高信息傳輸?shù)男Ч?。常用的傳統(tǒng)分級(jí)算法主要有:
(1)數(shù)列分級(jí):數(shù)列分級(jí)的分級(jí)界限是某種數(shù)列中的一些點(diǎn),一旦選定了某種數(shù)列,則分級(jí)界限就完全取決于數(shù)據(jù)的最大值、最小值和分級(jí)數(shù)。數(shù)列分級(jí)的優(yōu)點(diǎn)是分級(jí)界限嚴(yán)格按照數(shù)學(xué)法則確定,有規(guī)律可循,便于對(duì)比分析,但它不能很好地顧及數(shù)據(jù)本身的隨機(jī)分布特征。數(shù)列分級(jí)包括等差數(shù)列分級(jí)和等比數(shù)列分級(jí)。
(2)級(jí)數(shù)分級(jí):當(dāng)人們關(guān)注分級(jí)間隔的變化時(shí),就要考慮使用級(jí)數(shù)分級(jí)法,直接求得分級(jí)間隔。目前,級(jí)數(shù)分級(jí)方法主要有算術(shù)級(jí)數(shù)分級(jí)和幾何級(jí)數(shù)分級(jí)。
用傳統(tǒng)分級(jí)方法確定分級(jí)界限沒有充分利用數(shù)據(jù)本身提供的大量信息,因而產(chǎn)生的分級(jí)方式往往不符合數(shù)據(jù)的分布特點(diǎn)。在這種情況下,統(tǒng)計(jì)分級(jí)方法應(yīng)運(yùn)而生。這種方法在確定分級(jí)界限時(shí),要對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。確定的分級(jí)界限有一定的數(shù)學(xué)規(guī)則,分級(jí)結(jié)果能反映數(shù)據(jù)分布特征。
(1)平均值 —標(biāo)準(zhǔn)差分級(jí)法:標(biāo)準(zhǔn)差是反映各數(shù)據(jù)間離散程度的一種方法。按標(biāo)準(zhǔn)差進(jìn)行分級(jí),需要?
合理的分級(jí)是專題地圖表現(xiàn)的基礎(chǔ)和關(guān)鍵,因此,分級(jí)算法模型的實(shí)現(xiàn)是專題地圖模塊的關(guān)鍵技術(shù)。一些非專業(yè)制圖人員對(duì)一些分級(jí)算法并不了解,只有通過制作專題地圖實(shí)驗(yàn)來選用合理的分級(jí)算法。在進(jìn)入系統(tǒng)界面后,用戶可以根據(jù)需求選擇制作專題地圖的圖層和屬性字段。由于符號(hào)法中的符號(hào)均有定位意義,所以用戶需要選擇記錄地理坐標(biāo)的屬性字段輸入系統(tǒng),同時(shí)選擇自動(dòng)分級(jí)方式或者手動(dòng)分級(jí)方式。
對(duì)于用戶來講,友好的交互界面是衡量系統(tǒng)是否實(shí)用的重要指標(biāo),為此,在充分分析用戶需求的基礎(chǔ)上,兼顧開發(fā)的方式與平臺(tái),定制了自動(dòng)分級(jí)模型交互界面。
(1)數(shù)據(jù)分布直方圖的顯示
為了選擇適合的專題數(shù)據(jù)分級(jí)模型,以制作出符合數(shù)據(jù)分布特征的專題地圖,用戶必須對(duì)數(shù)據(jù)的分布情況有一個(gè)明確而直觀的概念。在自動(dòng)分級(jí)模式界面,首先根據(jù)用戶選取的需分級(jí)的屬性字段,讀入相應(yīng)的屬性數(shù)據(jù),經(jīng)過排序等預(yù)處理后,由開源的Zedgraph.dll繪制出數(shù)據(jù)分布直方圖。數(shù)據(jù)分布直方圖可以讓用戶直觀地認(rèn)識(shí)數(shù)據(jù)的整體分布特征,并通過鼠標(biāo)獲取每一個(gè)柱形所代表的屬性數(shù)據(jù),從而讓用戶結(jié)合所掌握的數(shù)據(jù)分級(jí)算法的適用范圍特征,選擇合適的分級(jí)方式。
(2)數(shù)學(xué)分級(jí)模型的實(shí)現(xiàn)
在系統(tǒng)界面中,為用戶提供了分級(jí)數(shù)、分級(jí)方式、取舍精度的選擇。
①分級(jí)數(shù)設(shè)置:結(jié)合制圖數(shù)據(jù)的分級(jí)原則和幾何符號(hào)的定點(diǎn)符號(hào)法特點(diǎn),為用戶提供了3~7的分級(jí)數(shù),以供選擇。
②分級(jí)方式設(shè)置:通過對(duì)現(xiàn)有數(shù)學(xué)分級(jí)模型的研究和實(shí)驗(yàn),分析其所適應(yīng)的數(shù)據(jù)特征、分級(jí)誤差等,選擇一些常用的各有特點(diǎn)的分級(jí)算法進(jìn)行實(shí)現(xiàn)。最終為用戶提供了等差分級(jí)、等比分級(jí)、倒數(shù)數(shù)列分級(jí)、等分位數(shù)分級(jí)、平均值—標(biāo)準(zhǔn)差分級(jí)、最優(yōu)分割分級(jí)六種考慮數(shù)據(jù)類型及其分布特征的分級(jí)方法。
③取舍精度設(shè)置:計(jì)算得到的分級(jí)界限有一個(gè)共同的缺點(diǎn),即分級(jí)界限是零碎的,不方便地圖使用者的記憶和分析,需要將分級(jí)界限湊整。分級(jí)界限的湊整就是把分級(jí)界限的零碎值轉(zhuǎn)換到湊整值,通常湊整值是某個(gè)十進(jìn)制數(shù)的倍數(shù)。分級(jí)界限的起點(diǎn)和終點(diǎn)分別向較小和較大的數(shù)據(jù)湊整,使分級(jí)界限包含整個(gè)數(shù)據(jù)范圍。中間的分級(jí)間隔按照“四舍六入五成雙”的方式就近取整。系統(tǒng)中湊整過程是根據(jù)用戶的選擇進(jìn)行的,在程序中為用戶提供了0.1、1、10和100四種湊整值。
在系統(tǒng)使用過程中,用戶無需了解具體的分級(jí)計(jì)算過程,只需要選擇分級(jí)的屬性字段,根據(jù)系統(tǒng)獲取其屬性值后自動(dòng)生成的數(shù)據(jù)分布直方圖選擇分級(jí)數(shù)、分級(jí)方式和界限湊整值,以此作為參數(shù)傳給分級(jí)模型,然后按用戶選擇的算法進(jìn)行相應(yīng)計(jì)算,返回分級(jí)界限。分級(jí)處理后通過輸出接口獲取分級(jí)界限值和相關(guān)的統(tǒng)計(jì)結(jié)果。每一種分級(jí)情況計(jì)算出來后,分級(jí)界面上通過在原數(shù)據(jù)分布直方圖上繪制折線圖和表格(Datagridview控件)顯示數(shù)據(jù)的分級(jí)情況。用戶可以進(jìn)行多次實(shí)驗(yàn),選取最合適的分級(jí)方式。另外,如果用戶需要調(diào)整某些分級(jí)界限,也可以在分級(jí)間隔表格上手動(dòng)修改分級(jí)間隔數(shù)據(jù)。
數(shù)據(jù)手動(dòng)分級(jí)模塊為用戶提供了另外一種分級(jí)方式,與自動(dòng)分級(jí)模塊的界面相似,也是結(jié)合圖表(Zedgraph.dll)和表格(Datagridview控件)以分級(jí)數(shù)據(jù)的數(shù)據(jù)頻率直方圖為基礎(chǔ)。一般數(shù)據(jù)頻率直方圖的“谷點(diǎn)”被認(rèn)為是最有用的分級(jí)界限。用戶可以選擇分類數(shù),系統(tǒng)以該分類數(shù)計(jì)算等差分級(jí)的分級(jí)界限,從而顯示該組數(shù)據(jù)的頻率直方圖。用戶可以從直方圖上找出數(shù)據(jù)的分布特征,并確定分級(jí)數(shù),用鼠標(biāo)點(diǎn)擊獲取較適宜的分割點(diǎn)的數(shù)值,并在分級(jí)間隔列表中輸入相應(yīng)數(shù)據(jù),以便系統(tǒng)獲取并確定分級(jí)界限。
專題數(shù)據(jù)中的定量數(shù)據(jù)多呈離散分布,難以直觀反映現(xiàn)象在空間分布上的規(guī)律性、由于數(shù)量差異而產(chǎn)生的質(zhì)量差異感、特殊的水平或集群性等,因此對(duì)原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分級(jí)后建立分級(jí)模型是十分必要的。專題數(shù)據(jù)的合理分級(jí)是提高專題地圖質(zhì)量的根本。如何用恰當(dāng)?shù)姆椒ㄊ狗旨?jí)后的數(shù)據(jù)客觀地反映現(xiàn)象的地理規(guī)律性并滿足專題制圖的要求,是數(shù)據(jù)分級(jí)處理的主要任務(wù)。制圖者把空間分布的專題數(shù)據(jù)轉(zhuǎn)換成專題地圖時(shí),必須先對(duì)數(shù)據(jù)進(jìn)行分級(jí)處理,將這些數(shù)據(jù)劃入一些等級(jí)中,然后將分級(jí)后的數(shù)據(jù)進(jìn)行符號(hào)化,這樣制作的專題地圖才能達(dá)到較好的信息傳輸效果。
[1]祝國(guó)瑞,郭禮珍,尹貢白,等.地圖設(shè)計(jì)與編繪[M].武漢:武漢大學(xué)出版社,2001:34-46,67-80,102-123.
[2]孫娟娟.專題地圖數(shù)據(jù)分級(jí)模型的研究:現(xiàn)代數(shù)學(xué)在地圖數(shù)據(jù)分級(jí)中的應(yīng)用[D].鄭州: 解放軍信息工程大學(xué)理學(xué)院,2007.
[3]王艷.最優(yōu)分割算法的計(jì)算機(jī)程序?qū)崿F(xiàn)與武漢市洪澇災(zāi)害預(yù)測(cè)[D].武漢: 華中師范大學(xué),2007.