江明周
摘要:隨著信息科技發(fā)展,信息大數(shù)據(jù)時(shí)代的到來改變了傳統(tǒng)數(shù)據(jù)的采集與處理技術(shù)。地理信息系統(tǒng)對數(shù)據(jù)具有實(shí)時(shí)性要求,地理信息系統(tǒng)對城市建設(shè)有至關(guān)重要的作用,因此,地理信息系統(tǒng)對大數(shù)據(jù)的需求極為迫切?;谶@種狀況,本文從解析地理信息系統(tǒng)應(yīng)用大數(shù)據(jù)的重要性的角度,闡述了大數(shù)據(jù)技術(shù)在地理信息系統(tǒng)應(yīng)用。
關(guān)鍵詞:地理信息系統(tǒng);大數(shù)據(jù);數(shù)據(jù)存儲
一、前言
隨著信息時(shí)代到來,大數(shù)據(jù)被眾多領(lǐng)域廣泛應(yīng)用。在地理信息系統(tǒng)數(shù)據(jù)應(yīng)用方面,傳統(tǒng)的工作研究重點(diǎn)偏向整體層面的研究,缺少在地理信息系統(tǒng)應(yīng)用大數(shù)據(jù)的技術(shù)方面的研究。筆者從地理信息系統(tǒng)應(yīng)用大數(shù)據(jù)在存儲和信息處理角度進(jìn)行探討。
二、地理信息系統(tǒng)應(yīng)用大數(shù)據(jù)的重要性
大數(shù)據(jù)的處理方式與傳統(tǒng)數(shù)據(jù)處理方式存在著很大差異。第一,大數(shù)據(jù)在數(shù)據(jù)處理上針對的是全部的數(shù)據(jù),而傳統(tǒng)的數(shù)據(jù)處理技術(shù)都是在海量數(shù)據(jù)中抽取數(shù)據(jù)樣本來進(jìn)行分析和處理,這就使提供的數(shù)據(jù)具有片面性;第二,傳統(tǒng)的數(shù)據(jù)只注重?cái)?shù)據(jù)的因果關(guān)系的研究與分析,而大數(shù)據(jù)舍棄這種對數(shù)據(jù)處理方式,取而代之的是數(shù)據(jù)的關(guān)聯(lián)信息;第三,傳統(tǒng)RDBMS在數(shù)據(jù)處理技術(shù)層面上過于追求精準(zhǔn)性和一致性,致使RDBMS系統(tǒng)沒有優(yōu)良的可擴(kuò)展性,大數(shù)據(jù)則由于自身的數(shù)據(jù)多樣化具有優(yōu)良的可擴(kuò)展性。第四,大數(shù)據(jù)對數(shù)據(jù)的處理方式不同于傳統(tǒng)的處理模式,大數(shù)據(jù)的數(shù)據(jù)處理類型有三大類:包括數(shù)字、字符串為主的結(jié)構(gòu)性數(shù)據(jù)、人員的簡歷為主的半結(jié)構(gòu)化數(shù)據(jù)、視頻音頻為主的非結(jié)構(gòu)化數(shù)據(jù)。
三、地理信息系統(tǒng)應(yīng)用大數(shù)據(jù)的問題解析
1.數(shù)據(jù)存儲方面
地理信息系統(tǒng)的數(shù)據(jù)具有空間性的特點(diǎn),因此,決定了地理信息系統(tǒng)數(shù)據(jù)的存儲具有非結(jié)構(gòu)化的特征,其數(shù)據(jù)呈現(xiàn)出大數(shù)據(jù)的特點(diǎn),即海量數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流動(dòng)和動(dòng)態(tài)的受體制、多樣的數(shù)據(jù)類型、變化迅速的數(shù)據(jù)模型和高價(jià)值密度等較高復(fù)雜的大數(shù)據(jù)特征?;趯Φ乩硇畔⑾到y(tǒng)的市場要求,迅速增長的空間數(shù)據(jù)存儲、飛快的數(shù)據(jù)處理響應(yīng)速度和多樣化的數(shù)據(jù)描述需求都對地理信息系統(tǒng)應(yīng)用大數(shù)據(jù)做出了更高的要求。同時(shí),地理信息系統(tǒng)的數(shù)據(jù)信息的互享保密工作、海量數(shù)據(jù)信息的處理工作對地理信息系統(tǒng)應(yīng)用大數(shù)據(jù)提出了更高的挑戰(zhàn)。
2.數(shù)據(jù)處理方面
目前,地理信息系統(tǒng)已經(jīng)實(shí)現(xiàn)了對大量信息的匯總工作,大量空間的數(shù)據(jù)組織、處理、加工和存儲的技術(shù)仍然很落后,在對數(shù)據(jù)進(jìn)行處理方面,非結(jié)構(gòu)類型的數(shù)據(jù)處理技術(shù)沒能達(dá)到與傳統(tǒng)sQL數(shù)據(jù)處理技術(shù)兼容的狀態(tài),所以,導(dǎo)致對大量空間數(shù)據(jù)的處理效果不盡人意,基于這種情況,數(shù)據(jù)的增值產(chǎn)品無法順利產(chǎn)生,這制約著我國地理信息系統(tǒng)產(chǎn)業(yè)和的發(fā)展和城市的建設(shè)進(jìn)程。隨著社會(huì)的不斷發(fā)展,地理信息系統(tǒng)的信息應(yīng)具有實(shí)時(shí)性,這不僅是地理信息系統(tǒng)自身發(fā)展的價(jià)值的體現(xiàn),更是社會(huì)發(fā)展對其提出的要求。
四、地理信息系統(tǒng)應(yīng)用大數(shù)據(jù)的探討
1.數(shù)據(jù)存儲方面
大數(shù)據(jù)對數(shù)據(jù)處理模式與傳統(tǒng)數(shù)據(jù)處理模式的不同,主要區(qū)別是對數(shù)據(jù)存儲方式有很大差異。傳統(tǒng)的數(shù)據(jù)處理在數(shù)據(jù)存儲上主要通過RDNMS來完成,RDBMS的對數(shù)據(jù)的存儲特點(diǎn)是對結(jié)構(gòu)化數(shù)據(jù)的存儲,無法很好的完成對半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的存儲。而大數(shù)據(jù)在數(shù)據(jù)存儲方面顯示了其優(yōu)勢。其文檔型的NoSQL對數(shù)據(jù)的存儲技術(shù)適合地理信息系統(tǒng)空間數(shù)據(jù)存儲的需求,節(jié)約了地理信息系統(tǒng)中傳統(tǒng)數(shù)據(jù)存儲大量空間數(shù)據(jù)的壓縮的資金,而且,大數(shù)據(jù)對數(shù)據(jù)的存儲技術(shù)對數(shù)據(jù)存儲的模式提升,有效的提高了地理信息系統(tǒng)數(shù)據(jù)信息的實(shí)時(shí)性。
2.數(shù)據(jù)處理方面
傳統(tǒng)模式對增強(qiáng)數(shù)據(jù)處理的相應(yīng)速度上,運(yùn)用繁瑣的數(shù)據(jù)庫比例尺的調(diào)動(dòng)方式來完成對數(shù)據(jù)的處理,對其實(shí)際操作來講,無法滿足地理信息系統(tǒng)對數(shù)據(jù)的實(shí)時(shí)處理的需求,而且,數(shù)據(jù)的自動(dòng)綜合能力不能滿足實(shí)際工作的要求。大數(shù)據(jù)對空間數(shù)據(jù)的處理方法是通過大數(shù)據(jù)的交互方式來處理的。交互數(shù)據(jù)的處理模式主要是通過人機(jī)交互的形式來完成對數(shù)據(jù)的處理。通過這種模式數(shù)據(jù)能及時(shí)的被修補(bǔ)和處理,數(shù)據(jù)的處理結(jié)果能在第一時(shí)間被用戶了解和使用。目前的數(shù)據(jù)處理系統(tǒng)主要是通過Spark和Dremel等。簡單來講,交互數(shù)據(jù)的處理方式是通過對數(shù)據(jù)的分解存儲和對查詢功能,進(jìn)行優(yōu)化而實(shí)現(xiàn)對地理信息系統(tǒng)大量數(shù)據(jù)的敏捷處理。
五、結(jié)論
通過對地理信息系統(tǒng)在大數(shù)據(jù)應(yīng)用,數(shù)據(jù)存儲和數(shù)據(jù)處理問題在大數(shù)據(jù)的技術(shù)協(xié)助下能很好地被解決,同時(shí)節(jié)約了傳統(tǒng)模式對數(shù)據(jù)處理中的時(shí)間和資金,大大提升了其工作效率。大數(shù)據(jù)的數(shù)據(jù)處理技術(shù)在今后地理信息系統(tǒng)的發(fā)展中有廣闊的前景。