蘇峻青
摘 要 本文針對當前公共權力運行中出現(xiàn)的各類職業(yè)腐敗風險問題,結合預防職業(yè)腐敗風險系統(tǒng)建設工程研究,將數(shù)據(jù)挖掘技術引入職業(yè)腐敗風險防控系統(tǒng)建設中,探討運用更為科學管用的數(shù)據(jù)挖掘算法,編織一個監(jiān)督權力濫用的“電籠子”,篩選、抽取公共權力腐敗風險的預警信息,強化苗頭性問題監(jiān)管,從源頭上防范職業(yè)腐敗風險問題發(fā)生。
關鍵詞 數(shù)據(jù)挖掘 預防職業(yè)腐敗 科技手段 信息平臺
中圖分類號:TP311.13 文獻標識碼:A
0 引言
在云計算和信息時代,“大數(shù)據(jù)”對于公共管理顯得日益重要。有效的公共管理和權力監(jiān)督,越來越依賴于公共部門對來自外部世界各類信息數(shù)據(jù)可靠的、高質量的解讀。在預防公共職業(yè)權力腐敗方面,如何充公運用GB或TB數(shù)量級龐大、海量的公共權力運行信息數(shù)據(jù)進行分析,實現(xiàn)對公共管理腐敗風險的實時監(jiān)測、預警糾錯、動態(tài)跟蹤,從源頭上預防腐敗風險發(fā)生,已經(jīng)成為紀檢監(jiān)察機關研究和關注的重要課題。
1 基于數(shù)據(jù)挖掘技術的預防職業(yè)腐敗風險系統(tǒng)的構建
預防職業(yè)腐敗風險系統(tǒng),就是將公共權力運行和監(jiān)督數(shù)據(jù)全部集中統(tǒng)一起來,形成公共權力運行與監(jiān)督數(shù)據(jù)倉庫,運用數(shù)據(jù)挖掘技術,建立綜合分析和預警功能模塊,對權力運行實行網(wǎng)絡化監(jiān)督監(jiān)察,保證公共權力公開、公平、公正地行使。
1.1 預防職業(yè)腐敗風險數(shù)據(jù)的準備
數(shù)據(jù)選擇。預防職業(yè)腐敗風險系統(tǒng)是基于公共權力基礎數(shù)據(jù)庫和輿論監(jiān)督數(shù)據(jù)庫挖掘的預警平臺。其中,公共權力基礎數(shù)據(jù)庫主要是面向電子政務的大型公共權力運行數(shù)據(jù)庫及相關文件,具體包括行政審批、行政執(zhí)法、行政征收、公共資源交易、公共資金管理、行政確認、行政裁決、三重一大事項決策與運行、基層農(nóng)村“三資”管理等數(shù)據(jù)庫,涵蓋各類公共權力事項、流程、時限、結果等權力運行要素信息;輿論監(jiān)督基礎數(shù)據(jù)主要指與互聯(lián)網(wǎng)交互的投訴舉報和輿情監(jiān)督數(shù)據(jù)庫,具體包括效能投訴、行風投訴、信訪舉報以及網(wǎng)站論壇、博客、新聞評論、社交網(wǎng)絡等基于Web的分散的網(wǎng)絡輿情數(shù)據(jù)庫。在上述兩類基礎數(shù)據(jù)庫中,有的屬于關系型數(shù)據(jù)庫,有的是面向對象的數(shù)據(jù)庫,還有的是Web數(shù)據(jù)或TEXT文本數(shù)據(jù)源、多媒體數(shù)據(jù)庫、空間數(shù)據(jù)庫、時態(tài)數(shù)據(jù)庫等。根據(jù)預防腐敗風險知識發(fā)現(xiàn)的實際需要,可以選擇以上各類基礎數(shù)據(jù)庫的一種或幾種,作為備選源數(shù)據(jù)庫。
圖 1 云計算模式下的預防職業(yè)腐敗風險平臺數(shù)據(jù)挖掘過程示意圖
數(shù)據(jù)清洗、抽取、轉換。在弄清公共權力源數(shù)據(jù)的信息及其結構的基礎上,通過清洗,去除或修補公共權力運行源數(shù)據(jù)中那些不完整、不一致或含有噪音的數(shù)據(jù)。然后界定所選取的公共權力數(shù)據(jù)源及數(shù)據(jù)抽取規(guī)則及新抽取數(shù)據(jù)的數(shù)據(jù)庫結構,建立抽取數(shù)據(jù)庫與公共權力基礎數(shù)據(jù)庫之間的轉換和裝載機制,以便讓系統(tǒng)能夠自動、實時、準確地從每個公共權力數(shù)據(jù)源中抽取紀檢監(jiān)察機關所需的風險數(shù)據(jù)。這些被抽取的風險數(shù)據(jù)庫的數(shù)據(jù)結構、數(shù)據(jù)轉換規(guī)則等信息應當作為元數(shù)據(jù)(Metadata)被封裝、存儲起來,以便將來根據(jù)挖掘需求及時作出調整。在數(shù)據(jù)抽取過程中,應當全面掌握公共權力數(shù)據(jù)源的詳細結構及特點,任何小的疏忽都可能導致職業(yè)腐敗風險數(shù)據(jù)抽取的失敗。由于各類基礎數(shù)據(jù)庫一般來自不同公共權力運行部門,這些數(shù)據(jù)庫往往具有異質異構的特征,而數(shù)據(jù)庫基礎信息的完備性直接影響預防職業(yè)腐敗風險系統(tǒng)平臺的建設質量和應用效果。因此,需要按照統(tǒng)一確定的基礎數(shù)據(jù)庫標準,將各部門的異構異質數(shù)據(jù)庫轉換為符合統(tǒng)一標準要求的數(shù)據(jù),最后集成到待挖掘的目標數(shù)據(jù)庫中。
1.2 預防職業(yè)腐敗風險數(shù)據(jù)的挖掘
結合預防腐敗風險系統(tǒng)建設,根據(jù)數(shù)據(jù)類型、特點,選取特定的挖掘模型與算法,運用數(shù)據(jù)挖掘SaaS云服務部件,對清洗、抽取和轉換后的數(shù)據(jù)進行挖掘,對規(guī)格化的目標數(shù)據(jù)集進行知識提煉,分析出腐敗風險發(fā)生的趨勢、規(guī)律、特點、關鍵部位、關鍵點行業(yè),以量化或圖線等形式生成數(shù)據(jù)結果,形成紀檢監(jiān)察人員關心關注的風險數(shù)據(jù)集,用于實現(xiàn)不同抽象層次、適應于不同維度的風險數(shù)據(jù)分析和輔助決策;對系統(tǒng)預警風險或違規(guī)問題,按照相應的工作程序進行查處。具體地講,預防職業(yè)腐敗風險系統(tǒng)通過數(shù)據(jù)挖掘算法,一是對各類公共權力基礎數(shù)據(jù)庫進行關聯(lián)分析、聚類分析、分類、預測和偏差分析,及時識別各級公共組織行使公共權力、管理公共事務的行為是否正確、及時、公開、公平、公正,發(fā)現(xiàn)依法浪費或權力濫用問題;二是發(fā)揮預測分析功能,找出職業(yè)腐敗風險的重點領域和關鍵環(huán)節(jié)并加強監(jiān)督,幫助公務人員及時規(guī)避錯誤;三是匯總反饋公眾對公共管理和服務的新訴求,引導和督促公共管理領域加強嚴格自律,更加有效地履行公共服務職能,從而構建起預防職務風險的前期預警機制,使反腐倡廉工作從事后監(jiān)督向風險防控等事前、事中監(jiān)督轉變。在預防職業(yè)腐敗風險平臺建設中,主要應用到以下數(shù)據(jù)挖掘算法。
(1)關聯(lián)規(guī)則(Association Analysis)。通過簡單關聯(lián)、時序關聯(lián)、因果關聯(lián)等方法,找出預防職業(yè)腐敗風險數(shù)據(jù)庫中不同數(shù)據(jù)變量之間關聯(lián)的規(guī)律性,即一種腐敗行為與另一種腐敗行為發(fā)生的支持依賴關系,建立腐敗風險數(shù)據(jù)的頻繁項集。例如行政審批環(huán)節(jié)過多、服務質量差與行政審批效率低之間的關聯(lián)關系;不依法使用規(guī)范票據(jù)罰款收費與私設“小金庫”之間的關聯(lián)關系;不認真落實民主集中制度與“三重一大”事項管理混亂之間的關聯(lián)關系等。通過對這些關聯(lián)關系進行分析,幫助有針對性查找分析影響腐敗風險的關鍵因素。
(2)分類分析(Classification Analysis)。包括決策樹方法、神經(jīng)網(wǎng)絡方法等算法。其中,決策樹方法適用于對數(shù)據(jù)分類進行分析和預測的領域,比如若將所有部門工作人員發(fā)生的腐敗問題作為一個整體來考慮,按照違規(guī)問題情節(jié)輕重進行分類,可將其分為嚴重型、較重型、一般型、較輕型、苗頭型等多種類型的違規(guī)行為。針對不同類型的違規(guī)行為,紀檢監(jiān)察機關可采取相應的防范或懲戒措施。神經(jīng)網(wǎng)絡法適用于識別哪些部門屬于重點防控部門、哪些權力屬于重點防范的權力,例如運用自組織特征映射網(wǎng)絡(Self-organizing feature Map,SOM),通過輸入某部門的公共權力運行種類、權力數(shù)量、行使頻度、公開透明數(shù)量、電子監(jiān)察發(fā)現(xiàn)的違規(guī)問題數(shù)量、被投訴舉報的信訪數(shù)量等信息,系統(tǒng)根據(jù)事先確定的各個參數(shù)重要性的權重(Wi),最終計算并輸出該部門發(fā)生腐敗風險的機率,從而通過該機率和相關標準,判斷該部門應當屬于嚴密監(jiān)察部門或重點監(jiān)察部門,還是一般監(jiān)控部門,從而幫助紀檢監(jiān)察機關根據(jù)不同情況采取相應措施對其加以防范。
(3)聚類分析(Clustering Analysis)。根據(jù)監(jiān)察監(jiān)督數(shù)據(jù)的相似性,從公共權力、行業(yè)部門、監(jiān)察類型等不同維度,對監(jiān)察監(jiān)督數(shù)據(jù)進行歸納,聚合為若干未知類別,幫助紀檢監(jiān)察機關揭示隱含在監(jiān)察監(jiān)督數(shù)據(jù)背后的風險分布模式、發(fā)展變化規(guī)律及其相互關系,從而發(fā)現(xiàn)腐敗風險集中的部門、風險集中的環(huán)節(jié)、風險集中的問題,增強預防腐敗的針對性。例如,在行政處罰電子監(jiān)察系統(tǒng)建設中,通過對工作流程監(jiān)察事項的聚類分析發(fā)現(xiàn),“調查取證”、“作出處罰決定”階段辦事效率太低是造成辦案“時限超期”的重點因素,那么,就應當在這些階段加強對執(zhí)法人員的提醒,防止執(zhí)法人員在這些環(huán)節(jié)上發(fā)生效率低下、吃拿卡要報等風險問題。
(4)“預測”。運用該算法,可以在對已發(fā)生的腐敗問題歷史數(shù)據(jù)進行分析的基礎上,找出腐敗行為的變化規(guī)律,據(jù)此對權力運行及腐敗風險突出問題及未來發(fā)展態(tài)勢進行研判,為紀檢監(jiān)察機關從源頭上預防腐敗蔓延提供決策依據(jù)。在預防腐敗風險系統(tǒng)建設中,可采用灰色—馬爾科夫模型算法,對過去幾年或十幾年發(fā)生的信訪舉報、網(wǎng)絡輿情、電子監(jiān)察異常等腐敗風險數(shù)據(jù)進行分析,對未來一段時間內(nèi)某領域、某部門或某項公共權力發(fā)生腐敗風險的趨勢進行預測,使紀檢監(jiān)察機關更有針對性地明確監(jiān)管重點,防患于未然。
(5)“偏差分析”。就是充分運行計算機高速、高效的特點,通過記錄搜索等技術,從大量的公共權力基礎數(shù)據(jù)庫中,對照正常運行的規(guī)則進行“偏差”監(jiān)測和分析,找出各項權力存在的異常、異動、違規(guī)情況的“偏差點”和“獨立點”,為查處腐敗風險問題提供案源線索。目前,在已建的行政審批、行政處罰、公共資金、公共資源交易電子監(jiān)察系統(tǒng)中,多數(shù)都采用了這種算法,發(fā)現(xiàn)了諸多電子監(jiān)察預警信息,為促進行政權力規(guī)范運行發(fā)揮了重要作用。
1.3 預防職業(yè)腐敗風險模型的評估
為了提高預防腐敗風險系統(tǒng)的針對性和實效性,需要對數(shù)據(jù)挖掘工作進行反復測試,通過實驗和訓練得到濃縮的知識,對風險預防模式特別是數(shù)據(jù)挖掘模式進行評估,驗證知識模型的有效性,為預防腐敗系統(tǒng)平臺提供科學準確的模型,形成標準的模型庫,作為電子政務“云”資源池中的SaaS服務部件,為各級各紀檢監(jiān)察機關采集監(jiān)察數(shù)據(jù)時予以調用或重用。