崔嘯
大數據一詞在計算機術語中叫做“巨量數據集合”,從字面即可看出其最基本的便是“巨量數據”。并且這些“巨量數據”具備四個特點,亦是被廣泛認可的4V:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。而在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理的方法。無論對大數據一詞理解有何不同,其歸根結底不在于數據簡單的龐大,而是能夠應用專業(yè)且有效的方法、手段從龐大的數據中分析和總結出具有規(guī)律性的信息,從而應用到實踐中。
我國早在西周時就已出現了類似于行政監(jiān)督的法律規(guī)文,并成書于東周的《周官》,其記載了行政職責的劃分和對各地方權力的劃分。在近代孫中山先生在《五權jh憲法》中提出了國家機關除設立立法、司法、行政機構外,還有設立考試和檢查兩大機構,進一步促進了我國行政監(jiān)督的發(fā)展。現如今我國行政監(jiān)督經過了數千年的發(fā)展,并采納東西方之所長,逐漸形成了政黨監(jiān)督、國家權力機關監(jiān)督、司法監(jiān)督、社會團體監(jiān)督、群眾監(jiān)督、輿論監(jiān)督和審計監(jiān)督幾大方面,已經形成一套覆蓋全面、行之有效的系統(tǒng)。并且自1992年國務院辦公室下發(fā)文件《國務院辦公廳關于建設全國政府行政首腦機關辦公決策服務系統(tǒng)的通知》首次提起政府機關信息化,至2001年國務院辦公廳制定全國政府系統(tǒng)政務信息化建設的五年計劃,即《全國政府信息化建設2001-2005年規(guī)劃綱要》正式對我國政府信息化的指導思想、方針和政策作出了明確的規(guī)定,也正式標志著我國政府信息化進入了高速發(fā)展階段。而特別是基層政府部門中政府信息化普及率的提高,增加了相關數據庫的數量,擴展了相關內容類別,豐富了信息獲取手段。
2015年3月5日上午十二屆全國人大三次會議上,李克強總理在政府工作報告中首次提出”互聯網+”行動計劃。李克強總理在政府工作報告中提出,制定”互聯網+”行動計劃,推動移動互聯網、云計算、大數據、物聯網等雨現代制造業(yè)結合,促進電子商務、工業(yè)互聯網和互聯網金融健康發(fā)展,引導互聯網企業(yè)拓展國際市場。由此可以看出”互聯網+”的提出將要改變中國信息資源與其產生的利益的重新分配,而對行使社會利益分配功能的公共政策的監(jiān)督,如何保證分配符合規(guī)定透明執(zhí)行的監(jiān)督方面將面臨巨大挑戰(zhàn)。現如今較為落后的監(jiān)督方法必須得以進步才能跟上執(zhí)行”互聯網+”后相關執(zhí)行部門的腳步。然而隨著大數據經過三十年逐步發(fā)展,并且隨著我國政府已經進入政府信息化的高速發(fā)展階段,有效數據逐步增加,將大數據應用于行中監(jiān)督中無疑成為提高我國行政監(jiān)督能力的有效途徑。
一、大數據中數據倉庫技術在行政監(jiān)督中應用分析
數據倉庫是一種數據庫,它與其鏈接的單位數據庫分別進行維護。數倉庫系統(tǒng)允許將各種系統(tǒng)集成在一起,為統(tǒng)一的歷史數據分析提供堅實的平臺,對信息處理提供支持。并且數據倉庫中的數據應圍繞主題組織。數據存儲是從歷史的角度提供信息,并且是匯總的。例如,數據倉庫中存放的并不是各級政府具體某一部門中的某一位人員辦公的細節(jié),而是存放每個行政類別、每個部門辦公事務的匯總,或匯總到較高層次,即各市級政府、各省級政府的辦公事務的匯總。簡單來說,數據倉庫是一個從多個數據源收集信息的存儲庫,存放在已知的模式下,并且通過數據清理、數據變換、數據集成、數據裝入和定期數據刷新來構造一個鏈接多個單獨數據庫的數據倉庫。
數據倉庫是一個面向主題的、集成的、事變的、非易失的數據集合。第一,面向主題的是指數據倉庫主要是圍繞重要的主題,如政府辦公人員、政府部門、行政權力被執(zhí)行者。數據倉庫關注決策者(監(jiān)督權利執(zhí)行者)的數據建模與分析,而不是戴維的日常操作和事務處理。因此,數據倉庫通常能夠排除對于決策者無用的數據,提供特定主題的簡明信息。加快了監(jiān)督執(zhí)行人員執(zhí)行監(jiān)督過程中對特定主題查詢的速度。第二,集成的是指數據倉庫使用數據清理和數據集成技術,確保命名約定、編碼結構、屬性度量等的一致性。提高了數據庫中政府信息的條理性。第三、時變的是指數據存儲從歷史的角度提供信息。數據倉庫中的關鍵結構都隱式或顯示的包含時間因素。第四,非易失的是指數據倉庫總是無理地分離存放數據,這些數據源于操作環(huán)境下的應用數據。由于這些分離式的存儲,數據倉庫不需要事務處理、恢復和并發(fā)控制機制,它只需要數據的初始化裝入和數據訪問。簡化了監(jiān)督執(zhí)行人員操作的復雜性。
二、大數據中數據挖掘技術對行政監(jiān)督的應用分析
行政監(jiān)督主要是國家機關、社會團體或個人對國家行政機關及其公務人員的行政行為進行約束、檢查和督促。而現今行政監(jiān)督主要局限于事后監(jiān)督,無法行之有效的在事件發(fā)生前進行預測和預防,因此在大數據環(huán)境下,我國行政監(jiān)督應對大量數據進行分析,從而能夠實現事前預防和對于重點對象的預測。
重點行政監(jiān)督對象預測主要目標是為了縮小監(jiān)督的范圍,提升監(jiān)督的預判性,加強監(jiān)督的針對性。重點行政監(jiān)督對象的預測主要強調的是預測,強調對未發(fā)生情況的“未卜先知”,而任何對未來的預測都是建立在對現有或之前事件的分析與總結之上,憑空猜測是有失偏頗又毫無依據的。因此,對重點行政監(jiān)督對象的預測需要對相關數據進行切實有效且邏輯嚴謹的分析。在政府信息化高速發(fā)展的環(huán)境下,政府機關及其公務人員的相關數據呈現井噴式的上漲,其中雖有著大量有效信息,但伴隨著有效信息的卻是幾何倍數的無關信息。故而僅僅依靠人力從大量數據之中提取出對預測重點行政監(jiān)督目標切實有效的信息將會花費大量的人力和財力卻可能無法得出準確的結果。所以為了能夠迅速縮小監(jiān)督范圍或是準確的確定重點監(jiān)督目標,應運用數據挖掘技術。
數據挖掘具有描述和預測兩種性質。描述性能夠刻畫出目標數據中數據的一般性質,預測性能夠在當前數據上進行歸納,以便作出預測。數據挖掘的描述性能夠通過對政府各個部門及其公務員所產生的數據進行統(tǒng)計并加以分析,得出其部門內部或其公務員在行使其行政權力時忽略的不足之處或是不正確之處發(fā)生于何種情況、何種時間、關聯人物等結論,極大的縮小了監(jiān)督的范圍。數據挖掘的預測行是通過對政府各部門及其公務員現有數據進行分析而得出去未來將要出現結果的預測,通過預測出的結果對現有狀況進行反推,能夠更加清晰的反應出現階段應該著重監(jiān)督的目標與方向。
通過數據挖掘對監(jiān)督對象進行預測主要運用分類分析法。而在分類法中運用較為廣泛,準確率較高的即為”決策樹歸納法”。
決策樹是一種類似于流程圖的樹結構,其中,每個內部節(jié)點表示在一個屬性上的測試,每個分枝代表該測試的一個輸出,而每個樹葉節(jié)點存放一個類標號,樹的最頂層節(jié)點是根節(jié)點。將決策樹歸納法運用于行政監(jiān)督對象預測中的主要原因是決策樹可以處理高維數據。獲取的數據用樹的形式表示是直觀的,容易被監(jiān)督執(zhí)行人員所理解的,并且決策樹歸納法在具有良好準確率的前提下的學習和分類步驟是簡單和快速的。因此將數據挖掘應用于行政監(jiān)督的重點監(jiān)督對象預測是可行的亦是對行政監(jiān)督有深遠意義的。
綜上所述,基于現今各種數據爆發(fā)的大環(huán)境下,將大數據應用于行政監(jiān)督中降低了行政監(jiān)督執(zhí)行的成本,豐富了行政監(jiān)督的手段,提高了行政監(jiān)督的準確率。因此,將大數據應用于行政監(jiān)督中是現實的需求,亦是政府信息化發(fā)展的必要結果。(作者單位:湘潭大學)