安學軍
(1.同濟大學 上海 200092;2.天津市靜??h團泊新城開發(fā)建設委員會 天津 301636)
大數(shù)據(jù)技術(shù)的出現(xiàn)將信息技術(shù)和數(shù)據(jù)處理技術(shù)引入一個全新的發(fā)展階段。與傳統(tǒng)的數(shù)據(jù)信息技術(shù)相比,大數(shù)據(jù)技術(shù)具有體量大、來源廣、更新快、數(shù)據(jù)應用方向不確定等特點。這使得大數(shù)據(jù)對信息分析和處理的方法完全異于傳統(tǒng)數(shù)據(jù),由傳統(tǒng)的以計算機程序分析為中心演化為以海量數(shù)據(jù)為中心。
大數(shù)據(jù)不僅是簡單的數(shù)據(jù)量線性增長,更是由大量數(shù)據(jù)匯集帶來的由量變到質(zhì)變的變革。大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的差異主要表現(xiàn)在以下幾個方面:
大數(shù)據(jù)包含數(shù)字類的結(jié)構(gòu)化數(shù)據(jù)和文本、圖片、音視頻類的非結(jié)構(gòu)化數(shù)據(jù),其數(shù)據(jù)密度相對較低,應用價值具有不確定性,但有較高的挖掘價值,潛力極大。傳統(tǒng)數(shù)據(jù)則以數(shù)字等結(jié)構(gòu)化數(shù)據(jù)為主,具有較為確定和有限的應用價值。
大數(shù)據(jù)的來源多樣,可以說只要有數(shù)據(jù)產(chǎn)生,就能成為大數(shù)據(jù)的來源。來自公眾、移動設備、計算機設備等的數(shù)據(jù)通過互聯(lián)網(wǎng)實時傳輸,匯集至大數(shù)據(jù)的處理中心。大數(shù)據(jù)的來源具有開放、并發(fā)、實時等特點。
大數(shù)據(jù)能夠更加全面、深入、連續(xù)地反映事物。通過多角度、多形式的信息整合,大數(shù)據(jù)擴展了人類對數(shù)據(jù)的認知,并拓展了數(shù)據(jù)的用途,相比傳統(tǒng)數(shù)據(jù)的應用,其顯著改善了由于信息不完整、不充分帶來的數(shù)據(jù)處理問題。
信息時代由于各類數(shù)據(jù)的發(fā)布、共享與應用方式的多樣化,數(shù)據(jù)的可獲得性顯著增強,基于共享和私有數(shù)據(jù)的大數(shù)據(jù)應用范圍也會更加廣泛。
傳統(tǒng)的數(shù)據(jù)處理和分析方法一般是基于單一結(jié)構(gòu)數(shù)據(jù),只能進行單純的因果分析。大數(shù)據(jù)技術(shù)基于海量信息,可以深挖信息之間的內(nèi)在關聯(lián),有一定的預測作用,其數(shù)據(jù)分析方法與傳統(tǒng)方式相比必然有較大差異。
大數(shù)據(jù)技術(shù)的應用需要大量的數(shù)據(jù)存儲和計算,其對計算機的存儲性能和計算能力有很高要求,硬件成本相對較高。當前很多政府部門的信息化經(jīng)費預算還達不到或跟不上大數(shù)據(jù)應用所需的資金。這使得云計算脫穎而出,逐漸成為政府部門開展大數(shù)據(jù)應用的基礎。云計算具有諸多特征,如按需提供服務、反應快速、寬帶網(wǎng)絡訪問和服務的可擴縮性等。通過云計算服務實施大數(shù)據(jù),能夠有效提高計算資源的利用效率、增強 IT服務的擴展性,為大數(shù)據(jù)的處理、分析和應用提供了靈活、經(jīng)濟的平臺。大數(shù)據(jù)的優(yōu)越性及其對電子政務的良好支持和擴展將促進政府電子政務體系向云平臺轉(zhuǎn)變。
傳統(tǒng)的電子政務系統(tǒng)大多數(shù)是以縱向為主的體系結(jié)構(gòu),是面對部門專用的、特定的、封閉的信息系統(tǒng),而大數(shù)據(jù)的應用要求數(shù)據(jù)具有廣泛的來源,并要求數(shù)據(jù)具有可用性和經(jīng)濟性。因而要更好地利用大數(shù)據(jù),就必須立足于大數(shù)據(jù)的需求,轉(zhuǎn)變現(xiàn)有電子政務系統(tǒng)的運營思路。一方面,要從專屬系統(tǒng)向共享系統(tǒng)轉(zhuǎn)變,加強橫向整合。在電子政務信息系統(tǒng)開發(fā)過程中,要統(tǒng)一考慮政府相關部門的資源和需求,加強信息共享和復用,避免重復采集和資源浪費。另一方面,要從封閉系統(tǒng)向開放系統(tǒng)轉(zhuǎn)變,增強各政府部門不同信息系統(tǒng)之間的互操作性。同時,要通過社交媒體、政府門戶網(wǎng)站等加強政府與公眾之間、政府部門之間的信息交流,提升各級政府、機構(gòu)的協(xié)同辦事效率。
大數(shù)據(jù)在信息處理方面,強調(diào)非結(jié)構(gòu)化數(shù)據(jù)的整合、跨部門數(shù)據(jù)的集合和碎片化數(shù)據(jù)的處理。在大數(shù)據(jù)處理技術(shù)方面,需要采用學科主題門戶、知識管理、信息組織系統(tǒng)、語義網(wǎng)和網(wǎng)絡資源分類等信息組織方法,同時還需要采用一些數(shù)據(jù)挖掘方法,如神經(jīng)網(wǎng)絡、決策樹等。大數(shù)據(jù)時代的電子政務系統(tǒng)需要更多地采用分布式處理技術(shù)、數(shù)據(jù)倉庫、流計算、搜索接口和可視化等技術(shù),以應對和處理大量各種來源、各種類別的數(shù)據(jù)。
發(fā)達國家在其電子政務中已廣泛應用大數(shù)據(jù)技術(shù),但是由于我國計算機技術(shù)水平和數(shù)據(jù)資源的匯集程度等方面都與發(fā)達國家有一定的差距,在體制和法律等方面也存在較大的差異。這就要求我們要立足國情,發(fā)展有中國特色的大數(shù)據(jù)應用,在提高數(shù)據(jù)源質(zhì)量、優(yōu)化電子政務系統(tǒng)的基礎上,推進大數(shù)據(jù)技術(shù)的應用。
數(shù)據(jù)收集是實現(xiàn)大數(shù)據(jù)的基礎,提升政府數(shù)據(jù)采集能力要明確數(shù)據(jù)資源管理的綜合協(xié)調(diào)部門,建立數(shù)據(jù)資源收集的標準,完善數(shù)據(jù)采集、共享和利用等相關制度,擴大數(shù)據(jù)的采集和共享范圍。在數(shù)據(jù)收集過程中,要注意以下幾點:
3.1.1 要進行跨部門數(shù)據(jù)整合
可按照經(jīng)濟、社會、文化等方面和主題分類,全面覆蓋社會運行產(chǎn)生的數(shù)據(jù),并在此基礎上形成經(jīng)濟、人口、交通信息等數(shù)據(jù)庫。
3.1.2 要進行非結(jié)構(gòu)化數(shù)據(jù)匯集
除了主要的政務數(shù)據(jù),還要注意收集網(wǎng)絡輿論數(shù)據(jù)、城市運行監(jiān)控數(shù)據(jù)等,數(shù)據(jù)類型應包含文本、音頻、視頻等形式。這些數(shù)據(jù)也將成為政務信息的重要組成部分。
3.1.3 要利用不同方式獲取相關數(shù)據(jù)
通過統(tǒng)籌建設跨部門大數(shù)據(jù)共享平臺,擴展共享平臺的覆蓋范圍,并推進跨地區(qū)信息資源共享,為深化電子政務大數(shù)據(jù)應用提供數(shù)據(jù)支撐。同時可以同企業(yè)合作,為企業(yè)提供一些開放的政府平臺以交換企業(yè)相關數(shù)據(jù),也可以將一些數(shù)據(jù)采集服務外包給企業(yè)。
由于我國政府的大數(shù)據(jù)應用還處于初探期,缺乏合縱連橫和及時更新機制,難以保證數(shù)據(jù)的準確性和及時性。例如,在進行人口信息采集時,各部門側(cè)重于各自所服務的人群,人口采集的途徑不盡相同,直接服務對象的數(shù)據(jù)相對準確,而不直接相關的人口數(shù)據(jù)質(zhì)量較低。由于部門間、系統(tǒng)間數(shù)據(jù)缺乏共享和比對機制,難以將各部門的數(shù)據(jù)進行集合優(yōu)化。因此,建立數(shù)據(jù)對比、更新機制,采用第三方驗證的方法,通過引入個人和企業(yè)等的相關數(shù)據(jù)對政府采集數(shù)據(jù)加以校驗,有助于提高數(shù)據(jù)的準確性和及時性。
大數(shù)據(jù)的應用可遵循“效益優(yōu)先、突出重點、先易后難、逐步推進”的原則,有序探索大數(shù)據(jù)在電子政務領域的應用。通過綜合考慮數(shù)據(jù)的易獲得性,分析數(shù)據(jù)的復雜度和可能帶來的經(jīng)濟、社會效益等因素,確定大數(shù)據(jù)的應用順序和范疇。例如,可以先從數(shù)據(jù)結(jié)構(gòu)相對簡單的綜合治稅、治安管理、企業(yè)信用信息共享平臺建設入手,逐步拓展到數(shù)據(jù)復雜多變的醫(yī)療、交通領域。在各項技術(shù)趨于成熟的情況下,還可以開發(fā)綜合能源管理平臺,輔助優(yōu)化區(qū)域能源結(jié)構(gòu)、提高能源使用效率。大數(shù)據(jù)技術(shù)的應用不應僅限于政府自身的應用,還可以將部分政務數(shù)據(jù)對社會和企業(yè)開放,同企業(yè)互惠互利,這樣才能擴展大數(shù)據(jù)平臺的應用范圍,有利于大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。
大數(shù)據(jù)不僅是一種數(shù)據(jù)形態(tài),更是一種思維方式。運用大數(shù)據(jù)思維行事將會對電子政務產(chǎn)生重大影響,數(shù)據(jù)集中化處理帶來的不同視角、數(shù)據(jù)開放促進的各種應用、數(shù)據(jù)與業(yè)務融合創(chuàng)造的新的需求和價值使得大數(shù)據(jù)將為電子政務領域帶來質(zhì)的飛躍,進一步促進政府管理水平的提升?!?/p>
[1]宋偉東,孫尚宇,耿繼原,等.用大數(shù)據(jù)思維建構(gòu)信息時代的電子政務[J].測繪科學,2014(5):18-22.
[2]黃鏵煥,薛麗芳.大數(shù)據(jù),大政務,新網(wǎng)絡——大數(shù)據(jù)時代電子政務網(wǎng)絡的發(fā)展方向[J].電子政務,2013(5):104-109.
[3]于施洋,楊道玲, 璟王 璇,等.基于大數(shù)據(jù)的智慧政府門戶:從理念到實踐[J].電子政務,2013(5):65-74.