黃英
(湖南省城鄉(xiāng)建設(shè)勘測(cè)院 湖南衡陽(yáng) 421000 湖南省地質(zhì)礦產(chǎn)勘查開發(fā)局417隊(duì) 湖南衡陽(yáng) 421000)
大數(shù)據(jù)為地理信息行業(yè)發(fā)展帶來(lái)了新的機(jī)遇。伴隨大數(shù)據(jù)技術(shù)的發(fā)展,地理信息采用的各種新技術(shù)也在不斷涌現(xiàn)。大數(shù)據(jù)表現(xiàn)出體量大、變化速度快、模態(tài)多樣、真?zhèn)坞y辨等特征,但背后隱藏的價(jià)值巨大。從目前的實(shí)際角度來(lái)說(shuō),大數(shù)據(jù)時(shí)代下的地理信息系統(tǒng)的應(yīng)用研究已經(jīng)成為了當(dāng)代地理學(xué)術(shù)方面重要的研究應(yīng)用,人們最關(guān)心的是如何從大數(shù)據(jù)中挖掘出巨大的自身能夠受惠的價(jià)值。
大數(shù)據(jù)又稱為Big Data或稱巨量資料,最早源于美國(guó)科學(xué)家的研究理論,后來(lái)在全世界大范圍盛行是由于麥肯錫研究院發(fā)表的研究報(bào)告,指的是所涉及的數(shù)據(jù)量規(guī)模龐大到無(wú)法通過(guò)目前主流軟件工具,在可以容忍的時(shí)間內(nèi)對(duì)其進(jìn)行抓取、管理、處理的數(shù)據(jù)集合。它的數(shù)據(jù)規(guī)模和轉(zhuǎn)輸速度要求都很高,一般單個(gè)數(shù)據(jù)集在10TB左右,其結(jié)構(gòu)不適合原本的數(shù)據(jù)庫(kù)系統(tǒng)。大數(shù)據(jù)同過(guò)去的海量數(shù)據(jù)有所區(qū)別,其基本特征可以用4個(gè)V來(lái)總結(jié):Volume、Variety、Value和Velocity即數(shù)據(jù)規(guī)模大、種類繁多、價(jià)值密度低、處理速度快。①數(shù)據(jù)規(guī)模大,數(shù)據(jù)量從TB級(jí)別躍升到PB級(jí)別。②數(shù)據(jù)類型繁多,現(xiàn)在的數(shù)據(jù)不僅是文本形式,更多的是視頻、音頻、圖片、地理位置信息多類型的數(shù)據(jù)。③價(jià)值密度低,價(jià)值密度高低與數(shù)據(jù)總量成反比。以網(wǎng)絡(luò)視頻為例,1小時(shí)的視頻,可能其中只有一分鐘甚至幾秒鐘的數(shù)據(jù)有價(jià)值。④處理速度快,數(shù)據(jù)處理遵循“1秒定律”,可以從各類型數(shù)據(jù)中快速獲得高價(jià)值信息,這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。
在目前社會(huì)經(jīng)濟(jì)、科技不斷的發(fā)展的大環(huán)境下,大數(shù)據(jù)時(shí)代已經(jīng)悄然到來(lái),從某種意義上來(lái)說(shuō),地理信息的測(cè)繪部門和相應(yīng)的技術(shù)在某方面來(lái)說(shuō)受到了重大的影響和挑戰(zhàn),如果我們可以合理的對(duì)大數(shù)據(jù)技術(shù)進(jìn)行應(yīng)用,那么就可以起到一個(gè)推進(jìn)器的作用,推動(dòng)地理測(cè)繪信息部門和機(jī)構(gòu)的發(fā)展,但同時(shí),我們要注意一點(diǎn),從目前階段我國(guó)的測(cè)繪地理信息機(jī)構(gòu)已經(jīng)開始重視大數(shù)據(jù)技術(shù),逐步的研究推廣把大數(shù)據(jù)技術(shù)運(yùn)用到地理信息系統(tǒng)的數(shù)據(jù)的獲取、管理與更新上。逐步的探索,如果地理信息系統(tǒng)部門和機(jī)構(gòu)可以在工作中加入大數(shù)據(jù)系統(tǒng),那么大數(shù)據(jù)會(huì)讓地理信息部門和機(jī)構(gòu)的工作變得更加便捷。大數(shù)據(jù)技術(shù)讓地理信息行業(yè)發(fā)生了天翻地覆的變化:①許多專家和學(xué)者都希望在大數(shù)據(jù)技術(shù)的環(huán)境下對(duì)地理信息系統(tǒng)大展拳腳;②大數(shù)據(jù)有效的促進(jìn)了企業(yè)的發(fā)展和變革;③大數(shù)據(jù)時(shí)代下,他的商業(yè)價(jià)值無(wú)法估量,他的潛力無(wú)疑是巨大的,我們應(yīng)該進(jìn)行具體的探究和思考,完成一系列的轉(zhuǎn)型,讓技術(shù)和管理之間聯(lián)系密切,把握住商機(jī),獲得足夠的發(fā)展空間,為地理信息行業(yè)取得良好發(fā)展做出一定程度上的探索。
(1)地理空間數(shù)據(jù)為什么一直在持續(xù)的增加?因?yàn)閺哪壳皝?lái)看,我國(guó)的地理空間數(shù)據(jù)處理在速度方面在不斷的增加,在這個(gè)不斷加快的過(guò)程中,地理空間數(shù)據(jù)的結(jié)構(gòu)化特點(diǎn)就會(huì)凸顯出來(lái),所以這個(gè)情況我們要及時(shí)的針對(duì)好,利用地理空間數(shù)據(jù)整體的特點(diǎn),來(lái)進(jìn)行大數(shù)據(jù)空間存取技術(shù)的大范圍普及和使用,經(jīng)過(guò)我們反復(fù)的實(shí)踐和分析,可以得出一個(gè)結(jié)論,那就是當(dāng)前地理信息系統(tǒng)在目前的大數(shù)據(jù)技術(shù)時(shí)代下面臨著嚴(yán)峻的挑戰(zhàn),其中最大的問(wèn)題是在于是否我們可以有效的實(shí)現(xiàn)數(shù)據(jù)信息存儲(chǔ),以至我們可以完成大數(shù)據(jù)文件管理和大數(shù)據(jù)文件的保護(hù),同時(shí)可以在面對(duì)眾多文件和重復(fù)數(shù)據(jù)的情況下,進(jìn)行科學(xué)有效的整理,保證自身的效率和存儲(chǔ)質(zhì)量。
(2)我們還有一個(gè)數(shù)據(jù)整理的問(wèn)題要進(jìn)行分析,眾所周知,大量的地理信息數(shù)據(jù),地理信息數(shù)據(jù)可以用傳統(tǒng)的辦法進(jìn)行數(shù)據(jù)收集或者別的途徑來(lái)進(jìn)行信息上的獲取,但是目前傳統(tǒng)的組織方法和處理方法等不能適應(yīng)現(xiàn)在的大數(shù)據(jù)結(jié)技術(shù)的走向,在這樣的背景下,我們要最大限度的提高自身的基礎(chǔ)性數(shù)據(jù)的收集整理效率,我們要最大程度的提升基礎(chǔ)性數(shù)據(jù)更新效率,從而有效的滿足用戶需求,從而逐漸在這個(gè)大時(shí)代背景下被人們所重視。
(3)大數(shù)據(jù)是一個(gè)海量數(shù)據(jù),價(jià)值密度低。以網(wǎng)絡(luò)視頻為例,1h的視頻,可能其中只有一分鐘甚至幾秒鐘的數(shù)據(jù)有價(jià)值。對(duì)于不同的用戶,如何從海量數(shù)據(jù)中提取對(duì)自身有價(jià)值的數(shù)據(jù),這是個(gè)值得深刻研討的問(wèn)題。不同的用戶,它的需求不同。如何在海量數(shù)據(jù)中慧眼識(shí)珠,在哪個(gè)特定的區(qū)域,運(yùn)用什么樣的方式方法提取到對(duì)自身有價(jià)值的數(shù)據(jù),這是每個(gè)用戶所要面臨的問(wèn)題,也是我們的地理信息系統(tǒng)人員研究方向。
(4)如何把大數(shù)據(jù)刷選出來(lái)的基礎(chǔ)數(shù)據(jù)加工成以圖片、視頻等用戶喜聞樂(lè)見的形式展現(xiàn)出來(lái)的數(shù)據(jù),讓用戶可以直接使用,讓數(shù)據(jù)增值,這也是地理信息系統(tǒng)人員所要解決的問(wèn)題。
(1)首先大數(shù)據(jù)在地理信息系統(tǒng)的應(yīng)用,完美的提高了地理信息系統(tǒng)的高效存儲(chǔ)能力。隨著目前科技的飛速發(fā)展,計(jì)算機(jī)的硬件設(shè)備已經(jīng)呈現(xiàn)出了頹勢(shì),已經(jīng)不能和以往相比了,對(duì)于計(jì)算機(jī)的存儲(chǔ)也已經(jīng)變的更加的簡(jiǎn)單。特別要注意的是,計(jì)算機(jī)標(biāo)配硬盤的容量一般都符合原定的標(biāo)準(zhǔn)要求,單體磁盤的服務(wù)器標(biāo)準(zhǔn)容量可以達(dá)到30TB,但是在客觀世界的影響下,我們通常所說(shuō)的地理信息系統(tǒng)經(jīng)常在應(yīng)急保障方面和實(shí)時(shí)導(dǎo)航上已經(jīng)獲得了社會(huì)等廣泛的應(yīng)用,所以這就要求了數(shù)據(jù)的存儲(chǔ)量變得越來(lái)越高,相反,如果儲(chǔ)存量越來(lái)越低,那么地理信息系統(tǒng)會(huì)受到打擊,所以這樣說(shuō)來(lái)數(shù)據(jù)庫(kù)就要多個(gè)類型的數(shù)據(jù)支持和結(jié)構(gòu)化的數(shù)據(jù)支持才行。
(2)在大數(shù)據(jù)的時(shí)代背景下,我們要進(jìn)行數(shù)據(jù)庫(kù)的擴(kuò)展和升級(jí),因?yàn)閺哪壳皝?lái)看,大數(shù)據(jù)背景下基礎(chǔ)性的數(shù)據(jù)量已經(jīng)發(fā)展的速度越來(lái)越快,如果不升級(jí)就導(dǎo)致了無(wú)法進(jìn)行信息的及時(shí)更新容納。從目前來(lái)看,現(xiàn)階段的數(shù)據(jù)庫(kù)使用,關(guān)系類型的數(shù)據(jù)庫(kù)比較常用而且硬件的升級(jí)也是十分重要,他在一定程度上,有利于數(shù)據(jù)庫(kù)進(jìn)行采分割擴(kuò)展和非規(guī)范擴(kuò)展等。升級(jí)硬件設(shè)備會(huì)花費(fèi)大量的資金,同時(shí),數(shù)據(jù)庫(kù)的服務(wù)器性能和容量提升的空間也很小,而數(shù)據(jù)庫(kù)分割不適合非結(jié)構(gòu)化數(shù)據(jù),我們要進(jìn)行進(jìn)一步的程序修改,這就導(dǎo)致了程序和模型的獨(dú)立性受到了破壞,然而非規(guī)范化的處理,可以增加大量冗余的同時(shí)來(lái)實(shí)現(xiàn)一致性的難度大幅度增加,由此可見,我們必須要爭(zhēng)取與理信息系統(tǒng)的數(shù)據(jù)庫(kù)進(jìn)行水平發(fā)展,才能保證他有足夠的伸縮性和擴(kuò)展性。
地理信息系統(tǒng)的工作是大量存取數(shù)據(jù)等任務(wù),在我國(guó)的科技在不斷的發(fā)展和生活水平不斷提高的大前提下,我們應(yīng)該對(duì)地理信息系統(tǒng)進(jìn)行重視,眾所周知,大數(shù)據(jù)是地理信息系統(tǒng)中最重要的組成部分,(其內(nèi)容為遙感技術(shù)、地理信息采集等)所以在大數(shù)據(jù)的前提背景下,地理信息系統(tǒng)的未來(lái)有著廣闊的前景,在未來(lái)的發(fā)展中地理信息系統(tǒng)會(huì)出現(xiàn)質(zhì)的飛躍。
未來(lái),數(shù)據(jù)可能成為最大的交易商品,就如同現(xiàn)在的基礎(chǔ)設(shè)施一樣,有數(shù)據(jù)的提供方、數(shù)據(jù)管理部門、監(jiān)管部門,數(shù)據(jù)的交叉重復(fù)會(huì)用將大數(shù)據(jù)變成一大產(chǎn)業(yè)。而這種產(chǎn)業(yè)實(shí)現(xiàn)盈利的關(guān)鍵,就在于提高對(duì)數(shù)據(jù)的“加工能力”,通過(guò)“加工”實(shí)現(xiàn)數(shù)據(jù)的增值,基于數(shù)據(jù)交易就能產(chǎn)生很好的效益。到那時(shí),得數(shù)據(jù)者則得天下!