藍(lán)學(xué) 韋緒 覃德文
摘 要:隨著大數(shù)據(jù)時代的來臨,生態(tài)林業(yè)、森林培育、森林經(jīng)營等方面的應(yīng)用,基于森林資源云計算的數(shù)據(jù)處理與應(yīng)用模式,通過數(shù)據(jù)的整合共享,交叉復(fù)用,形成的智力資源和知識服務(wù)能力?;诖髷?shù)據(jù)發(fā)展動態(tài),大數(shù)據(jù)的性質(zhì)和趨勢、林業(yè)部門的大數(shù)據(jù)應(yīng)用三個方面,對大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)等進(jìn)行系統(tǒng)講解,深入分析當(dāng)前信息化前沿技術(shù)的發(fā)展現(xiàn)狀與趨勢,結(jié)合生態(tài)林業(yè)民生林業(yè)的建設(shè)目標(biāo),闡述如何利用大數(shù)據(jù)為林業(yè)現(xiàn)代化服務(wù)。
關(guān)鍵詞:大數(shù)據(jù);生態(tài)林業(yè);民生林業(yè);林業(yè)現(xiàn)代化服務(wù)
中圖分類號:F124.5 文獻(xiàn)標(biāo)志碼:A 文章編號:1673-291X(2015)06-0055-02
大數(shù)據(jù)的興起(作者是英國《經(jīng)濟(jì)學(xué)家》雜志數(shù)據(jù)編輯肯尼思·內(nèi)爾·丘基爾、牛津大學(xué)互聯(lián)網(wǎng)研究院互聯(lián)網(wǎng)管理與法規(guī)教授維克托·梅耶—舍恩伯洛)[1]。近二年,大數(shù)據(jù)運用于生態(tài)林業(yè)風(fēng)頭正勁,一時之間成為生態(tài)林業(yè)熱門主題。什么是大數(shù)據(jù)生態(tài)林業(yè)目前還沒有統(tǒng)一的定義。但是不能否認(rèn)的是,互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)使得數(shù)據(jù)量陡然變大了很多,而云帶來的計算能力的變革,使得處理這些大數(shù)據(jù)成為一種可能,也使得云計算有了新的實用價值,還有更大的市場等著林業(yè)工作者去發(fā)現(xiàn)。
一、大數(shù)據(jù)的意義與內(nèi)涵
每個人都知道互聯(lián)網(wǎng)改變了企業(yè)經(jīng)營、政府運作以及人們生活的方式。但是一種新的、不那么明顯的技術(shù)趨勢卻有著同樣巨大的變革能力,那就是“大數(shù)據(jù)”(BigData)。大數(shù)據(jù)的趨勢發(fā)端于下面這個事實:如今到處傳播的信息比以往任何時候都多出了許多,而且這一趨勢正在應(yīng)用于非同尋常的新用途。大數(shù)據(jù)與互聯(lián)網(wǎng)截然不同,雖然互聯(lián)網(wǎng)使數(shù)據(jù)的收集和共享方便了很多。大數(shù)據(jù)的意義并不僅僅是通信:其本質(zhì)是我們可以從大量的信息中學(xué)習(xí)到從較少量的信息中無法獲取的東西。
二、國內(nèi)外發(fā)展動態(tài)
在公元前3世紀(jì),亞歷山大圖書館被認(rèn)為收藏了全部的人類知識。而如果把今天全世界的信息平分給每一個活著的人,那么每個人擁有的信息量將足足超過當(dāng)年亞歷山大圖書館全部藏書的320倍。如果把所有這些信息刻到光盤上并且分5摞疊起來的話,那么這些光盤可以一直堆到月球。而大數(shù)據(jù)的特征是它能夠用數(shù)據(jù)來表現(xiàn)世界的眾多層面,而這些層面以往從來都沒有被量化過—這種特征可以被稱為“數(shù)據(jù)化”[2]。
在國內(nèi),第七次全國森林資源清查暴露的問題也令人警惕——清查五年間隔期內(nèi),林地轉(zhuǎn)為非林地的面積數(shù)字有所上升,形勢十分嚴(yán)峻,但這些逆轉(zhuǎn)的林地主要發(fā)生在哪些地區(qū)?數(shù)據(jù)之大、復(fù)雜性是林業(yè)各個崗位上難以完成的嚴(yán)峻工作。但《全國林地保護(hù)利用規(guī)劃綱要(2010—2020年)》提出了大數(shù)據(jù)分析應(yīng)用于林業(yè)生態(tài)統(tǒng)計,是林業(yè)有史以來可及時動態(tài)監(jiān)測、及時決策的最全面、最細(xì)致、最先進(jìn)的一項措施。大數(shù)據(jù)統(tǒng)計了全國林地,歸類成為了一張簡單的分布地圖,是高分辨率的遙感影像,全國林地落界數(shù)據(jù)、二類調(diào)查資料,基礎(chǔ)地理信息等多源數(shù)據(jù)集合,以林地界線為核心內(nèi)容,構(gòu)建的全國統(tǒng)一的林地資源管理系統(tǒng)[2]。為國家林業(yè)局各業(yè)務(wù)司局提供數(shù)據(jù)支撐服務(wù),將推進(jìn)在森林經(jīng)營、工程建設(shè)、森林防火等業(yè)務(wù)上的應(yīng)用提供了便利。
三、林業(yè)運用上的特點
大數(shù)據(jù)分析要求林業(yè)工作人員在三個方面徹底改變對數(shù)據(jù)的態(tài)度:第一是收集和使用大量數(shù)據(jù),而不是像統(tǒng)計學(xué)家們在過去一百多年里所做的那樣,只滿足于少量的數(shù)據(jù)或樣本。第二是拋棄林業(yè)工作者對有條理和純凈的數(shù)據(jù)的偏愛,轉(zhuǎn)而接受雜亂無章——在越來越多的情形下,少許的不精確是可以容忍的。第三,在許多場合,我們需要放棄對事情原委的追究,而代之以對相關(guān)性的接納。利用大數(shù)據(jù),而不是試圖弄懂發(fā)動機拋錨或藥物副作用消失的確切原因,研究人員可以收集和分析大量有關(guān)此類事件的信息及一切相關(guān)素材,找出可能有助于預(yù)測未來事件發(fā)生的規(guī)律。大數(shù)據(jù)有助于回答是什么、而不是為什么的問題——通常有這樣的回答就足夠了。
中國林業(yè)大數(shù)據(jù)處理需要建立完整的數(shù)據(jù)庫整合和新建了林業(yè)政策法規(guī)庫、歷年統(tǒng)計數(shù)據(jù)庫、林業(yè)年鑒庫、林業(yè)發(fā)展報告庫、自然資源和地理空間庫、林業(yè)檔案庫等多個專題數(shù)據(jù)庫,內(nèi)容豐富,查詢便捷,是信息化服務(wù)林業(yè)的又一重要成果。中國林業(yè)數(shù)字圖書館依托國家林業(yè)局內(nèi)外網(wǎng)平臺建設(shè),將為林業(yè)行業(yè)提供豐富的圖書、期刊、論文等信息資源,為林業(yè)職工和廣大公眾提供更好的服務(wù)。國家衛(wèi)星林業(yè)遙感數(shù)據(jù)應(yīng)用平臺作為林業(yè)行業(yè)提供遙感基礎(chǔ)數(shù)據(jù)、數(shù)據(jù)處理平臺、數(shù)據(jù)產(chǎn)品發(fā)布平臺將大幅提高林業(yè)遙感應(yīng)用水平。林業(yè)綜合辦公系統(tǒng)群將把國家林業(yè)局機關(guān)和直屬單位納入統(tǒng)一的辦公平臺中,真正實現(xiàn)辦公一體化。豐富了林業(yè)數(shù)據(jù)云的內(nèi)容,增強了林業(yè)信息服務(wù)能力,將促進(jìn)林業(yè)發(fā)展更上一層樓。
四、大數(shù)據(jù)分析在林業(yè)應(yīng)用上存在的問題
生態(tài)林業(yè)數(shù)據(jù)資源和時間、空間資源有很大的不同。如何對林業(yè)資源變更數(shù)據(jù)帶來便利,但是數(shù)據(jù)卻不是這樣,并不是給你越多的數(shù)據(jù)對數(shù)據(jù)統(tǒng)計分析將會增加復(fù)雜系數(shù)。目前來看,越來越多的大數(shù)據(jù)分析會給林業(yè)生態(tài)資源的統(tǒng)計帶來越來越大的麻煩。因此我們必須找到一個解決這個問題的辦法,一種是統(tǒng)計學(xué)的方式,另外一種是計算的方式。統(tǒng)計學(xué)方式可能更微妙,所以林業(yè)工作者更需要正視大數(shù)據(jù)分析造成的弊端。
1.現(xiàn)在問題就是我們需要指數(shù)級的列和行增長的組合方式,隨著行數(shù)和列數(shù)的線性增長,我們考慮的數(shù)據(jù)就會呈指數(shù)倍的增加。我們來舉一個生態(tài)林業(yè)方面的案例,把列設(shè)想成人工林的信息—1是人工林,0是天然林;但是有一些列所描述的情況能夠很好地預(yù)測人工林的發(fā)生。假設(shè)如果東北平原地區(qū)分布,地勢平坦,光照充足,雨水充沛,適合進(jìn)行人工林種植。如果在青藏高原等地區(qū),由于地勢較高,天氣溫度變動較大,且林地土地瘠薄,適合進(jìn)行人工林的種植。這當(dāng)然是個假設(shè)。任何指令集里面都需要看這些數(shù)據(jù),進(jìn)行論證,找到有意義的模式。但當(dāng)數(shù)據(jù)變得越來越大,找到有意義的模式和信息變得越來越難。所以,大數(shù)據(jù)并不是非常好的事情,并不是有更多的數(shù)據(jù)就會獲得更多的知識。大數(shù)據(jù)其實才是最大的麻煩?,F(xiàn)在來看數(shù)據(jù)越來越難轉(zhuǎn)變成知識,如果我們想要獲得真正有意義的東西,我們需要采取一些行動。我們生態(tài)學(xué)家、林學(xué)家非常擔(dān)心:如何區(qū)分各個物種間的DNA數(shù)據(jù),如何高效對DNA數(shù)據(jù)進(jìn)行歸類[3]。統(tǒng)計學(xué)上的程序和算法,必須運行在計算機上。大的數(shù)據(jù)會花更多的時間運行,使我們不能快速地做決策了。真正有大問題的時候,我們不知道如何解決和運行統(tǒng)計的程序,做出快速的決策,因此我們發(fā)現(xiàn)了第二個解決方案。第一個是統(tǒng)計學(xué)上,第二個是計算方面。
2.第二個就是計算方面,算法需要時間運行,還要登錄、輸出等,需要幾秒鐘的決策,比如在線的拍賣需要幾秒鐘做決策,我們還需要給予一些林地種類、生長情況的數(shù)據(jù),比如說統(tǒng)計馬尾松蓄積量的輸出的算法。當(dāng)數(shù)據(jù)變多,這種方法可能會完成不了,或者是需要很多的運行時間,這是我們要怎么做?要把舍棄掉四旁樹和零散種植樹種。還是舍棄會造成怎樣的誤差。能使我的林業(yè)資源數(shù)據(jù)庫空間增加,如果我不斷地刪除原始的數(shù)據(jù),更新林業(yè)資源動態(tài)數(shù)據(jù)。我應(yīng)當(dāng)讓數(shù)據(jù)運行慢一些,但是這樣就會使處理的時間過長。我們面臨很大的問題,我們將樹木生長時間時間、物種分布空間與數(shù)據(jù)、不斷增長的數(shù)據(jù)規(guī)模結(jié)合在一起,如果沒有很好地處理這些大數(shù)據(jù)的擴(kuò)展算法。這確實是一個存在的問題,我認(rèn)為這個問題是根本且基礎(chǔ)的。
五、大數(shù)據(jù)分析在林業(yè)上應(yīng)用的措施
林業(yè)資源大數(shù)據(jù)分析的理論核心就是數(shù)據(jù)挖掘算法,各種林業(yè)資源數(shù)據(jù)挖掘的算法基于不同的物種數(shù)據(jù)類型和格式才能更加科學(xué)地呈現(xiàn)出數(shù)據(jù)本身具備的特點,也正是因為林業(yè)資源變更數(shù)據(jù)被全世界統(tǒng)計學(xué)家所公認(rèn)的各種統(tǒng)計方法(可以稱之為真理)才能深入數(shù)據(jù)內(nèi)部,才能體現(xiàn)大數(shù)據(jù)分析的便利。首先,大數(shù)據(jù)林業(yè)內(nèi)涵與重要意義,包括大數(shù)據(jù)林業(yè)內(nèi)涵特征、產(chǎn)生背景、關(guān)系分析、關(guān)鍵技術(shù)、新觀念分析;第二部分是大數(shù)據(jù)林業(yè)總體發(fā)展思路,包括大數(shù)據(jù)林業(yè)戰(zhàn)略定位、基本思路、基本原則、建設(shè)目標(biāo)、總體架構(gòu);第三部分是大數(shù)據(jù)林業(yè)的主要任務(wù)與重點工程,包括加快建設(shè)大數(shù)據(jù)林業(yè)立體感知體系、大力提升智大數(shù)據(jù)林業(yè)管理協(xié)同水平、有效構(gòu)建大數(shù)據(jù)林業(yè)生態(tài)價值體系、全面完善大數(shù)據(jù)林業(yè)民生服務(wù)體系、大力構(gòu)建大數(shù)據(jù)林業(yè)標(biāo)準(zhǔn)及綜合管理體系;第四部分是大數(shù)據(jù)林業(yè)推進(jìn)策略,包括大數(shù)據(jù)林業(yè)推進(jìn)路線圖、保障措施。
數(shù)據(jù)化是大數(shù)據(jù)的基礎(chǔ)。在生態(tài)林業(yè)資源動態(tài)變化中,數(shù)字化和數(shù)據(jù)化大相徑庭。“數(shù)字化”指的是將生態(tài)林業(yè)資源變動中產(chǎn)生的信息、森林演替所產(chǎn)生的資源或環(huán)境變化的軌跡轉(zhuǎn)換成電子數(shù)據(jù)存入數(shù)據(jù)庫的過程;而“數(shù)據(jù)化”則是指在數(shù)字化的基礎(chǔ)上,利用數(shù)據(jù)來對森林變更進(jìn)行描述,使之能同時被人和計算機所理解的結(jié)果[4]。生態(tài)林業(yè)資源信息大量數(shù)據(jù)來自于不同來源、數(shù)量龐大的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)群,大部分都不能直接用于預(yù)測和分析。而通過對數(shù)據(jù)有效的組織,能將大量來自不同源的異構(gòu)數(shù)據(jù)量化組合,形成森林資源據(jù)化、森林類別數(shù)據(jù)化、生態(tài)資源使用量的數(shù)據(jù)化、森林屬性數(shù)據(jù)化等在信息化服務(wù)中管理者比較關(guān)心的數(shù)據(jù)化形式。數(shù)據(jù)化是將數(shù)據(jù)從無序到有序的加工階段,數(shù)據(jù)化的最終成果是將森林?jǐn)?shù)據(jù)對象屬性量化,構(gòu)建數(shù)據(jù)挖掘和服務(wù)的基本對象,簡化數(shù)據(jù)分析和利用過程。
六、展望大數(shù)據(jù)分析的應(yīng)用
大數(shù)據(jù)是一種資源和一種工具。它的目的是告知,而不是解釋;它意在促進(jìn)理解,但仍然會導(dǎo)致誤解——關(guān)鍵在于人們對它的掌握程度。我們必須以一種不僅欣賞其力量,而且承認(rèn)其局限的態(tài)度來接納這種技術(shù)。大數(shù)據(jù)林業(yè)就是在數(shù)字林業(yè)的基礎(chǔ)上,全面應(yīng)用云計算、物聯(lián)網(wǎng)、移動互聯(lián)、大數(shù)據(jù)等新一代信息技術(shù),使林業(yè)實現(xiàn)智慧感知、智慧管理、智慧服務(wù)。通過大數(shù)據(jù)林業(yè)建設(shè),形成信息基礎(chǔ)條件國際領(lǐng)先、生態(tài)管理與民生服務(wù)質(zhì)量明顯提高、林業(yè)產(chǎn)業(yè)結(jié)構(gòu)與創(chuàng)新能力優(yōu)化發(fā)展的現(xiàn)代化模式。
參考文獻(xiàn):
[1] 維克托·邁爾·舍恩伯格.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013.
[2] 郭建斌,秦向華,萬志紅,等.大數(shù)據(jù)時代林業(yè)科普信息化發(fā)展研究[J].經(jīng)濟(jì)師,2014,(9):40-41.
[3] 覃德文,云朝光,秦武明,等.PCR技術(shù)發(fā)展?fàn)顩r研究[J].林業(yè)實用技術(shù),2013,(6):6-8.
[4] 盧庸,覃德文,韋中綿,等.麻櫟人工林經(jīng)濟(jì)效益分析[J].南方農(nóng)業(yè)學(xué)報,2014,(7).
[責(zé)任編輯 劉嬌嬌]