宋蕾
摘要:近年來,生態(tài)多樣性的保護(hù)已上升到國(guó)家戰(zhàn)略層面。大數(shù)據(jù)是融合了云計(jì)算、物聯(lián)網(wǎng)等互聯(lián)網(wǎng)技術(shù)的產(chǎn)物。如何有效地將大數(shù)據(jù)系統(tǒng)與生態(tài)多樣性研究結(jié)合起來是當(dāng)前研究的熱點(diǎn)。本文重點(diǎn)探討在云南省這種復(fù)雜生態(tài)環(huán)境中構(gòu)建大數(shù)據(jù)平臺(tái),以及應(yīng)用大數(shù)據(jù)過程中所面臨的挑戰(zhàn)。最后,分析了深度學(xué)習(xí)及知識(shí)圖譜在生態(tài)大數(shù)據(jù)中的潛在應(yīng)用價(jià)值。
關(guān)鍵詞:大數(shù)據(jù);生態(tài)多樣性;數(shù)據(jù)采集;信息融合
中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2019)04-0064-02
隨著社會(huì)的發(fā)展,人類生活的范圍在不斷地?cái)U(kuò)大,對(duì)自然資源的過度開發(fā)也在日益增加,這些行為都對(duì)生態(tài)環(huán)境造成了嚴(yán)重的破壞,使得生態(tài)系統(tǒng)越來越脆弱。任何一種資源的枯竭或動(dòng)物的滅絕都會(huì)對(duì)生態(tài)系統(tǒng)中的其他物種產(chǎn)生級(jí)聯(lián)效應(yīng)。因此,對(duì)生態(tài)系統(tǒng)進(jìn)行監(jiān)控以及保護(hù),是人類刻不容緩的頭等大事。近年來,國(guó)家已將生態(tài)多樣性的保護(hù)上升到了國(guó)家戰(zhàn)略層面[1]。
云南省地處中國(guó)西南邊陲,由于其特殊的地理位置和地貌分布,云南省氣候兼具季風(fēng)氣候、低緯氣候和山原氣候等,從而導(dǎo)致了云南具有復(fù)雜多樣的植被和物種分布[2]。然而,由于信息化的相對(duì)落后,目前云南省的生態(tài)多樣性保護(hù)仍然是個(gè)難題。大數(shù)據(jù)是一種新興的互聯(lián)網(wǎng)技術(shù),它是云計(jì)算、物聯(lián)網(wǎng)、機(jī)器學(xué)習(xí)等技術(shù)的融合產(chǎn)物[3]。相對(duì)于傳統(tǒng)的數(shù)據(jù)分析技術(shù),大數(shù)據(jù)處理的數(shù)據(jù)對(duì)象多為非結(jié)構(gòu)化數(shù)據(jù),且需要更為快速、高效的分析。本文重點(diǎn)討論如何在生態(tài)多樣性保護(hù)中建立大數(shù)據(jù)平臺(tái),以及應(yīng)對(duì)挑戰(zhàn)的策略,為讀者提供一個(gè)思路。
1 生態(tài)多樣性與大數(shù)據(jù)概念
首先,分別闡述生態(tài)多樣性及大數(shù)據(jù)兩個(gè)領(lǐng)域涉及的基本概念和作用。
1.1 生態(tài)多樣性
生態(tài)多樣性(Ecological diversity)沒有一個(gè)較為完整的定義,核心內(nèi)容主要涉及到諸如物種多樣性,景觀多樣性和HLZ生態(tài)系統(tǒng)等,是眾多研究對(duì)象在空間分布的綜合[4]。換句話說,生態(tài)多樣性可以理解為生物多樣性的最大規(guī)模。
生態(tài)多樣性與人們生活密不可分,人類從生態(tài)多樣性中獲取價(jià)值的方式大致分為兩種:
(1)直接獲取。生態(tài)系統(tǒng)為人類提供了食物、材料和藥物等,保障了人們的生活及健康。另外,動(dòng)植物的多樣性以及秀麗的山河不僅可以陶冶情操,還為人類的藝術(shù)創(chuàng)作提供了靈感。
(2)間接獲取。生態(tài)系統(tǒng)中包含各種動(dòng)植物以及微生物,它們都是不可或缺的組成部分,與人類生存構(gòu)成一個(gè)良性循環(huán)的整體。某個(gè)組成部分的破壞(如,物種滅絕)都可能引起更多的自然災(zāi)難。此外,空氣和水源通過大氣流動(dòng)及土壤過濾,能保證人類生活在一個(gè)干凈的環(huán)境中。
1.2 大數(shù)據(jù)
2011年,國(guó)際數(shù)據(jù)公司IDC對(duì)大數(shù)據(jù)(Big data)的定義是:“大數(shù)據(jù)技術(shù)是全新的一代技術(shù)和架構(gòu)體系,該技術(shù)通過高速采集、分析,從各式各樣的龐大數(shù)據(jù)量中提取出經(jīng)濟(jì)價(jià)值”[5]。而維基百科對(duì)大數(shù)據(jù)的描述是“大數(shù)據(jù)是指無法在一定時(shí)間內(nèi)用傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合”。雖然學(xué)術(shù)界和工業(yè)界對(duì)大數(shù)據(jù)的定義仍存在爭(zhēng)議,但是提出大數(shù)據(jù)的目的是解決問題,而非如何界定。因此,本文認(rèn)為如果數(shù)據(jù)滿足以下5個(gè)特性(如圖1所示),就可利用大數(shù)據(jù)的相關(guān)技術(shù)來解決問題。
如圖1所示,相對(duì)于傳統(tǒng)數(shù)據(jù)集,大數(shù)據(jù)具有規(guī)模大(Volume)、多樣性(Variety)、高速性(Velocity)、價(jià)值密度低(Value)和在線產(chǎn)生(Online)五個(gè)特性,具體而言:(a)規(guī)模大,相對(duì)于傳統(tǒng)數(shù)據(jù)集,大數(shù)據(jù)的規(guī)模大刻畫的是單位時(shí)間內(nèi)的增量大;(b)多樣性,指的是產(chǎn)生數(shù)據(jù)的設(shè)備多種多樣,以及數(shù)據(jù)格式的多樣性(如,結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù));(c)高速性,表達(dá)的是處理速度快,一般在秒級(jí)內(nèi)就要給出分析結(jié)果;(d)價(jià)值密度低,雖然產(chǎn)生的數(shù)據(jù)量極其龐大,但是真正有價(jià)值的信息相對(duì)來說范圍極小;(e)在線產(chǎn)生,相對(duì)于傳統(tǒng)的數(shù)據(jù)分析技術(shù),大數(shù)據(jù)的數(shù)據(jù)集必須是實(shí)時(shí)在線產(chǎn)生的,并且數(shù)據(jù)的收集、分析也需要在線完成。
2 生態(tài)大數(shù)據(jù)平臺(tái)
大數(shù)據(jù)平臺(tái)能將現(xiàn)有的互聯(lián)網(wǎng)技術(shù)集成起來,基于龐大的數(shù)據(jù)集來快速提取出有價(jià)值的信息,從而促使生態(tài)多樣性的保護(hù)工作從業(yè)務(wù)驅(qū)動(dòng)的功能形態(tài)轉(zhuǎn)為數(shù)據(jù)驅(qū)動(dòng)的智能形態(tài)。表1統(tǒng)計(jì)了web of science數(shù)據(jù)庫(kù)上關(guān)于大數(shù)據(jù)、生態(tài)多樣性以及兩者結(jié)合的主題文章數(shù)量。
從表1可得,近五年各個(gè)領(lǐng)域關(guān)于大數(shù)據(jù)的研究都是熱點(diǎn)。生態(tài)多樣性的研究也在逐年上升。同時(shí),把兩者結(jié)合起來的研究也日益得到重視。接下來,本文重點(diǎn)討論生態(tài)大數(shù)據(jù)的特點(diǎn)以及針對(duì)云南特殊氣候如何布局生態(tài)大數(shù)據(jù)平臺(tái)。
2.1 數(shù)據(jù)特點(diǎn)
生態(tài)是一個(gè)涉及范圍相當(dāng)廣泛的集合,若要建立生態(tài)大數(shù)據(jù)平臺(tái),各個(gè)領(lǐng)域的數(shù)據(jù)整合是第一步,也是最為重要的一步。當(dāng)前,統(tǒng)計(jì)的數(shù)據(jù)類型有:
(1)環(huán)境類數(shù)據(jù)。環(huán)境對(duì)生態(tài)的影響最為直接,所以需要實(shí)時(shí)地、全方位的跟蹤區(qū)域的環(huán)境變化。這類數(shù)據(jù)主要有:水資源、土資源、空氣質(zhì)量、噪聲污染,植被覆蓋情況,固體廢棄物,以及不同生態(tài)數(shù)據(jù)情況等。
(2)氣象數(shù)據(jù)。經(jīng)過多年的生存演化,整個(gè)生態(tài)群體對(duì)當(dāng)?shù)氐臍夂蚨家堰m應(yīng)。但是,隨著社會(huì)的發(fā)展,氣候也在發(fā)生改變,而且變化的速度也在增加。所以,很有必要收集氣象數(shù)據(jù),包括日照、溫度、氣壓和濕度等。
(3)社會(huì)統(tǒng)計(jì)數(shù)據(jù)。人類的活動(dòng)會(huì)對(duì)生態(tài)造成一定影響,因此需要統(tǒng)計(jì)農(nóng)藥施用強(qiáng)度、土地墾殖率和人口密度等。此外,對(duì)動(dòng)物的遷徙及種群分布也要統(tǒng)計(jì)。
(4)其他數(shù)據(jù)。社會(huì)輿論、科學(xué)研究以及政策導(dǎo)向都會(huì)讓一個(gè)地區(qū)的生態(tài)發(fā)生變化。這些數(shù)據(jù)的統(tǒng)計(jì),主要通過互聯(lián)網(wǎng)實(shí)時(shí)收集。
綜上分析,生態(tài)大數(shù)據(jù)的特點(diǎn)是涉及面廣、數(shù)據(jù)類型極其復(fù)雜、數(shù)據(jù)增量龐大以及不斷更新。
2.2 平臺(tái)部署
由于云南特殊的地理位置及氣候原因,其氣候著有“一山分四季,十里不同天”之說。如果盲目地將各個(gè)地區(qū)的數(shù)據(jù)收集統(tǒng)計(jì)在一起,不僅代價(jià)高,而且數(shù)據(jù)的價(jià)值極低,容易適得其反。為此,本文提出了邊緣分區(qū)來解決此問題。
如圖2所示,相對(duì)于傳統(tǒng)大數(shù)據(jù)平臺(tái),本文主要增設(shè)了邊緣分區(qū)來處理局部地區(qū)的生態(tài)數(shù)據(jù)。每個(gè)邊緣分區(qū)既是整個(gè)平臺(tái)的組成部分,又可以看成單個(gè)大數(shù)據(jù)平臺(tái)的縮減版。具體而言,邊緣分區(qū)主要包括三層架構(gòu):第一層是數(shù)據(jù)采集層,主要來源有監(jiān)控?cái)z像頭、無線傳感器以及分區(qū)中的數(shù)據(jù)中心(包括當(dāng)?shù)氐恼?、科研部門數(shù)據(jù)中心等);第二層是數(shù)據(jù)收集層,不僅要存儲(chǔ)數(shù)據(jù),還要對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的抽取、轉(zhuǎn)換及分析處理;第三層是服務(wù)層,除了對(duì)中心平臺(tái)提供數(shù)據(jù)外,還應(yīng)包含一些簡(jiǎn)單的查詢、統(tǒng)計(jì)應(yīng)用服務(wù)。
2.3 面臨的主要挑戰(zhàn)
大數(shù)據(jù)平臺(tái)的架設(shè)都會(huì)遇到一些如數(shù)據(jù)采集過濾以及安全等經(jīng)典問題[6],而本文重點(diǎn)討論云南省部署生態(tài)大數(shù)據(jù)主要面臨的挑戰(zhàn)。具體包括:
(1)部門數(shù)據(jù)交換困難。由于云南省信息化相對(duì)落后,不同的生態(tài)數(shù)據(jù)分散在不同的部門,而且部門之間的信息交換幾乎是人工完成,沒有完整的信息化平臺(tái)。其次,部分單位雖然建設(shè)了信息化平臺(tái),但是數(shù)據(jù)收集及統(tǒng)計(jì)手段相對(duì)落后,導(dǎo)致數(shù)據(jù)不全,格式混亂等。
(2)大數(shù)據(jù)人才稀缺??傮w來講,全國(guó)的大數(shù)據(jù)人才都是供不應(yīng)求的。而云南省由于經(jīng)濟(jì)相對(duì)落后,真正數(shù)量掌握大數(shù)據(jù)的人才基本留不住,導(dǎo)致了該領(lǐng)域的儲(chǔ)備人才極其稀缺。
(3)區(qū)域資源分配不平衡。云南省面積較廣,包含不同的氣候帶。對(duì)于生態(tài)多樣性的研究需要統(tǒng)計(jì)及分析不同地州的生態(tài)數(shù)據(jù),然而由于貧困差距較大,部分地州沒有足夠的資源(如,資金、人力、信息化設(shè)備等)用于支撐該領(lǐng)域的研究。
針對(duì)以上三個(gè)難題,本文給出的建議是:
1)數(shù)據(jù)分散問題,應(yīng)采用局部到整體策略。即,先引導(dǎo)企業(yè)與企業(yè)之間,單位與單位之間分別建立好信息交換平臺(tái)。再,進(jìn)一步深化推進(jìn)單位與企業(yè)之間構(gòu)件大數(shù)據(jù)平臺(tái);
2)人才稀缺問題,可以從兩方面入手:第一,給予優(yōu)惠的政策,引進(jìn)該領(lǐng)域的專家、企業(yè)家等,推動(dòng)大數(shù)據(jù)領(lǐng)域發(fā)展;第二,鼓勵(lì)高校及科研機(jī)構(gòu),重點(diǎn)培養(yǎng)大數(shù)據(jù)方面的人才,為云南省提供后備人才;
3)資源分配問題,需要政府相關(guān)部門多進(jìn)行宣傳,讓部分地州重視大數(shù)據(jù)行業(yè)的發(fā)展。其次,提供便利的服務(wù),鼓勵(lì)企業(yè)和科研單位入駐地州進(jìn)行工作推廣。同時(shí),加大地州對(duì)于大數(shù)據(jù)科技產(chǎn)業(yè)的財(cái)政投入。
3 應(yīng)用前景
隨著社會(huì)發(fā)展,人們對(duì)生活質(zhì)量的要求也在不斷提升。生態(tài)多樣性的保護(hù)涉及到每個(gè)人的生活和健康。而生態(tài)大數(shù)據(jù)可以為人們提供更加多元化的服務(wù),更加便捷生活體驗(yàn)。比如,在生態(tài)大數(shù)據(jù)的基礎(chǔ)上,結(jié)合深度學(xué)習(xí)[7]和虛擬技術(shù),可以讓人們足不出戶就能領(lǐng)略到大好河山的美麗。在科普教育上,利用生態(tài)大數(shù)據(jù)平臺(tái),可以構(gòu)建出動(dòng)植物的知識(shí)圖譜[8],提高人們對(duì)生態(tài)多樣性的保護(hù)意識(shí)。
無論是深度學(xué)習(xí)還是知識(shí)圖譜,只要構(gòu)建好生態(tài)大數(shù)據(jù)平臺(tái),就能讓新興的技術(shù)大方光彩,更好地服務(wù)于社會(huì),服務(wù)于人類。
4 結(jié)語(yǔ)
本文首先闡述了生態(tài)多樣性及大數(shù)據(jù)的相關(guān)概念,然后重點(diǎn)提出了如何在生態(tài)多樣性中構(gòu)建生態(tài)大數(shù)據(jù)平臺(tái)。最后,列出了平臺(tái)部署及應(yīng)用的挑戰(zhàn),并給出了相應(yīng)的策略建議。同時(shí),闡述了新興技術(shù)在生態(tài)大數(shù)據(jù)平臺(tái)基礎(chǔ)上的應(yīng)用前景。
參考文獻(xiàn)
[1] 馬克平,朱敏,紀(jì)力強(qiáng),等.中國(guó)生物多樣性大數(shù)據(jù)平臺(tái)建設(shè)[J].中國(guó)科學(xué)院院刊,2018,33(8):80-87.
[2] 李俊梅,樊林,段昌群.全球氣候變化條件下云南生態(tài)環(huán)境變化趨勢(shì)研究[J].云南地理環(huán)境研究,2012,24(5):67-73.
[3] 程學(xué)旗,靳小龍,王元卓等.大數(shù)據(jù)系統(tǒng)和分析技術(shù)綜述[J].軟件學(xué)報(bào),2014(9):1889-1908.
[4] 馬勝男,岳天祥.中國(guó)西部地區(qū)遙感數(shù)據(jù)生態(tài)多樣性多尺度模擬[J].地球信息科學(xué)學(xué)報(bào),2006,8(1):97-102.
[5] 張引,陳敏,廖小飛.大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J].計(jì)算機(jī)研究與發(fā)展,2013,50(S2):216-233.
[6] 王珊,王會(huì)舉,覃雄派等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2011,34(10).
[7] 余凱,賈磊,陳雨強(qiáng)等.深度學(xué)習(xí)的昨天、今天和明天[J].計(jì)算機(jī)研究與發(fā)展,2013,50(9):1799-1804.
[8] 官賽萍,靳小龍,賈巖濤等.面向知識(shí)圖譜的知識(shí)推理研究進(jìn)展[J].軟件學(xué)報(bào),2018,29(10):74-102.