劉輝 劉迎迎 朱濤
摘要:大數(shù)據(jù)是通過快速獲取、處理、分析以從中提取價值的海量、多樣化的交易數(shù)據(jù)、交互數(shù)據(jù)與傳感數(shù)據(jù)。目前人類已經(jīng)處于“大數(shù)據(jù)”時代,大數(shù)據(jù)的產(chǎn)生對傳統(tǒng)國庫統(tǒng)計和分析產(chǎn)生了巨大沖擊,同時也提供了重大機遇,如何利用大數(shù)據(jù)支持國庫統(tǒng)計與分析成為當前國家和個基層國庫關注的重點。本文從大數(shù)據(jù)時代的統(tǒng)計分析轉變?yōu)榍腥朦c,提出應以大數(shù)據(jù)思維開展國庫統(tǒng)計分析,接著從大數(shù)據(jù)的全流程管理具體闡述國庫統(tǒng)計中對大數(shù)據(jù)的運用,最后為有效提升大數(shù)據(jù)應用,提出了相應的政策建議。
關鍵詞:國庫統(tǒng)計 大數(shù)據(jù) 分析與預測
一、大數(shù)據(jù)時代國庫統(tǒng)計分析轉變
(一)樹立大數(shù)據(jù)思維
“大數(shù)據(jù)時代預言家”維克托認為:世界的本質(zhì)就是數(shù)據(jù),大數(shù)據(jù)將開啟一次重大的時代轉型,一直以來所延續(xù)的傳統(tǒng)統(tǒng)計分析思想已變得陳舊且落后。國庫統(tǒng)計分析思維應當在大數(shù)據(jù)背景下加以轉變。一是關于大數(shù)據(jù)抽樣調(diào)查工作的思想。抽樣調(diào)查是目前統(tǒng)計分析工作中的重要調(diào)查方式,但應該清醒地認識到,傳感器、網(wǎng)絡和數(shù)據(jù)處理技術,為獲取全局數(shù)據(jù)提供了可能,抽樣調(diào)查方式越來越多的被大數(shù)據(jù)取代成為必然。二是大數(shù)據(jù)統(tǒng)計思想:允許數(shù)據(jù)存在不精確性??v觀目前的各類數(shù)據(jù),一方面,數(shù)據(jù)來源不斷擴展,另一方面數(shù)據(jù)處理方法飛速發(fā)展,我們應該把重心放在統(tǒng)計分析效率上,而不是一味地追求數(shù)據(jù)的精確性上。三是大數(shù)據(jù)相關關系的思想,由驗證因果向?qū)で箨P聯(lián)轉變。統(tǒng)計分析報告是統(tǒng)計工作的下游產(chǎn)品,對決策的意義常常大于常規(guī)報表。大數(shù)據(jù)的應用,統(tǒng)計分析也將發(fā)生轉變,在做好因果分析的基礎上向?qū)で箨P聯(lián)轉變,原因分析更加精準和深刻,對策建議更具參考價值。
(二)被動統(tǒng)計到主動分析,從人工統(tǒng)計到智能統(tǒng)計
在這樣一個信息爆炸的大數(shù)據(jù)時代,無論政府機構還是社會公眾都可以通過多種途徑獲取信息,國庫統(tǒng)計分析部門也不例外,更應該變被動為主動,對經(jīng)濟轉型期的一些重大問題尤其是關系到可持續(xù)發(fā)展的重要問題,做好數(shù)據(jù)統(tǒng)計分析,提高發(fā)展質(zhì)量,實現(xiàn)經(jīng)濟轉型。涂子沛指出人類使用數(shù)據(jù)的巔峰形式,是通過數(shù)據(jù)賦予機器“智能”。大數(shù)據(jù)在包括國庫統(tǒng)計分析中應用的終極形式就是分析智能化。
(三)從事后統(tǒng)計向事前預測轉變
統(tǒng)計分析報告是統(tǒng)計工作的重要產(chǎn)品,完整的進度性常規(guī)分析應該包括對未來一定時期數(shù)據(jù)的預測。但由于小數(shù)據(jù)和信息量的局限,預測一般很少作為報告的重點,多是在假定發(fā)展條件、相關政策不變的情況下對未來情況做出的粗略研判,影響了統(tǒng)計對決策的參考價值。而大數(shù)據(jù)的核心就是將數(shù)學算法與海量的數(shù)據(jù)有效結合,來預測事情發(fā)生的可能性。大數(shù)據(jù)的廣泛應用,將有利于統(tǒng)計報告實現(xiàn)由單一的事后分析,向注重事前預測轉變。
二、大數(shù)據(jù)在國庫統(tǒng)計分析全流程應用的探討
當前,大數(shù)據(jù)浪潮帶來了一場新的革命,面對經(jīng)濟發(fā)展的新形勢新要求,國庫統(tǒng)計分析要學會積極的運用大數(shù)據(jù)的思想和方法,來應對各種新挑戰(zhàn)。國庫統(tǒng)計分析要積極主動建立大數(shù)據(jù)分析應用機制,破解新常態(tài)下面對的各種問題,實現(xiàn)工作的創(chuàng)新與發(fā)展。本文重點分析國庫統(tǒng)計分析全流程下大數(shù)據(jù)的應用。
(一)數(shù)據(jù)源:建立國庫統(tǒng)計分析數(shù)據(jù)池
目前國庫統(tǒng)計分析所用數(shù)據(jù)主要通過“3T”系統(tǒng)產(chǎn)生基礎數(shù)據(jù)和監(jiān)管類數(shù)據(jù),通過收集各類型政策文件、影像資料、領導講話、內(nèi)網(wǎng)信息等形成綜合性數(shù)據(jù)。但這些數(shù)據(jù)遠未達到支撐大數(shù)據(jù)統(tǒng)計分析的基礎。國庫統(tǒng)計分析應當建立“數(shù)據(jù)池”這一基礎工程,通過人行內(nèi)部數(shù)據(jù)整合、銀行和其它機構數(shù)據(jù)接入、互聯(lián)網(wǎng)數(shù)據(jù)抓取和引入等多渠道擴充基礎信息源和數(shù)據(jù)庫,為國庫統(tǒng)計分析的大數(shù)據(jù)應用奠定數(shù)據(jù)基礎。
一是加速整合現(xiàn)有國庫數(shù)據(jù)。我國國庫匯集了各級政府財務數(shù)據(jù)和各級國庫管理數(shù)據(jù),包括從中央到縣鄉(xiāng)的各級機構化和非結構化數(shù)據(jù),也包括稅務、海關、財政、銀行等部門處理的各類收支退存等國庫資金運行數(shù)據(jù),涵蓋面極廣。但現(xiàn)有數(shù)據(jù)資源存在著部門隸屬、無法共享等問題,大數(shù)據(jù)要求建立統(tǒng)一、高效、共享的國庫業(yè)務大數(shù)據(jù)池,就必須打破現(xiàn)有藩籬,盡早實施“國家金庫工程”,完善內(nèi)部數(shù)據(jù)源。
二是擴大國庫統(tǒng)計分析數(shù)據(jù)源。最重要的是打通各級政府及其下屬各部門之間的數(shù)據(jù)傳輸通道,實現(xiàn)政府辦公、工商行政、招商引資、外貿(mào)出口、仲裁訴訟等政府活動所產(chǎn)生的數(shù)據(jù)接入共享。其次是實現(xiàn)一行三會、商業(yè)銀行、行業(yè)協(xié)會、企業(yè)實體等生產(chǎn)運營數(shù)據(jù)的持續(xù)傳輸和報送。最后是互聯(lián)網(wǎng)數(shù)據(jù),互聯(lián)網(wǎng)是大數(shù)據(jù)的重要載體,也是數(shù)據(jù)收集的快捷途徑,通過各類互聯(lián)網(wǎng)平臺,門戶以及行業(yè)網(wǎng)站,可以收集海量數(shù)據(jù)來增加國庫統(tǒng)計分析領域數(shù)據(jù)采集的前置性和時效性。
(二)數(shù)據(jù)采集與存儲:軟件與硬件結合
大數(shù)據(jù)的應用中,由于數(shù)據(jù)來源非常廣泛且類型多樣化,需要存儲和分析挖掘的數(shù)據(jù)量也是十分龐大的,因此數(shù)據(jù)展現(xiàn)和處理的高效性以及可用性十分重要。因而,大數(shù)據(jù)的收集和存儲應當通過先進的計算機技術自動實現(xiàn),并結合線下需求采取人工收集等傳統(tǒng)方法,以補足系統(tǒng)無法收集的數(shù)據(jù)的遺漏。國庫統(tǒng)計分析數(shù)據(jù)的采集應當在國庫大數(shù)據(jù)資源池基礎上,通過構建云計算應用平臺,統(tǒng)籌整合各直屬國庫大量分散的數(shù)據(jù)和軟硬件資源,通過應用云計算平臺的資源和功能,以提升和優(yōu)化整體效能,從而實現(xiàn)全國國庫統(tǒng)計分析的大集成、大整合以及大應用。對于其他橫向聯(lián)網(wǎng)數(shù)據(jù),比如一些保密性較強的科學研究數(shù)據(jù)和企業(yè)生產(chǎn)經(jīng)營數(shù)據(jù),則可以與研究機構和企業(yè)建立合作關系,使用特定系統(tǒng)接口等相關方式采集數(shù)據(jù)。
在數(shù)據(jù)存儲方面,在通過完善的物理存儲技術和云計算平臺等軟硬件設施的基礎上,按國庫統(tǒng)計層級建立分級倉儲式數(shù)據(jù)中心,以人行總行為總庫,各項業(yè)務與非業(yè)務數(shù)據(jù)達到匯總存儲,各級行通過內(nèi)部接口或云計算平臺實現(xiàn)數(shù)據(jù)上傳下載,同時本級行建立分中心數(shù)據(jù)存儲倉,采集本級區(qū)域內(nèi)縱向和橫向數(shù)據(jù)并存儲。同時按照保密和信息安全等要求,實施分級授權和設置防火墻、實時加密存儲數(shù)據(jù)和卷標存儲加密等技術。
(三)數(shù)據(jù)清洗與結構化處理
國庫海量的、不規(guī)則的數(shù)據(jù)無法提供有效決策支持,只有通過數(shù)據(jù)清洗技術將大數(shù)據(jù)轉變?yōu)榻Y構化和規(guī)則化的數(shù)據(jù),才能體現(xiàn)大數(shù)據(jù)價值。數(shù)據(jù)清洗包括檢查數(shù)據(jù)一致性,處理無效值和缺失值等,是發(fā)現(xiàn)并糾正數(shù)據(jù)文件中可識別的錯誤的最后一道程序。經(jīng)過數(shù)據(jù)清洗技術處理殘缺數(shù)據(jù)、錯誤數(shù)據(jù)和重復數(shù)據(jù)后將有效數(shù)據(jù)寫入數(shù)據(jù)庫。
在國庫大數(shù)據(jù)統(tǒng)計分析上,通過數(shù)學知識(概率、統(tǒng)計、離散化等)建立合理模型,充分利用和挖掘數(shù)據(jù)內(nèi)容。綜合運用開源類和非開源類數(shù)據(jù)分析工具包括R、Python、MATLAB、SPSS、EVIEWS等軟件進行數(shù)據(jù)分析。具體實現(xiàn)統(tǒng)計分析、數(shù)據(jù)挖掘和模型預測等功能,并以可視化的結果予以呈現(xiàn)。統(tǒng)計分析包含假設檢驗、差異分析、相關分析、方差分析、回歸分析、logistic回歸分析、因子分析、聚類分析、主成分分析、判別分析、bootstrap技術等。數(shù)據(jù)挖掘包含相關性分組或關聯(lián)規(guī)則、聚類、描述和可視化、復雜數(shù)據(jù)類型挖掘等。模型預測包含預測模型、機器學習、建模仿真等。
在統(tǒng)計分析過程中,國庫統(tǒng)計分析應該重點實現(xiàn)云應用的創(chuàng)新與共享。統(tǒng)計人員可以根據(jù)業(yè)務的新要求,在云平臺數(shù)據(jù)開放接口的基礎上,自由構建合理的數(shù)學模型和算法,實現(xiàn)業(yè)務應用的創(chuàng)新和擴展。與此同時,以算法的方式將統(tǒng)計人員的智力成果和業(yè)務知識固化,當經(jīng)驗證為可信任應用時,可自動進入云平臺的應用共享庫,在得到授權的前提下,自由使用或補充完善,實現(xiàn)知識固化、資源共享。
(四)國庫運行智能化統(tǒng)計分析
在云應用平臺上,國庫統(tǒng)計分析首先要將日、旬、月和年作為數(shù)據(jù)的時間維度,將國庫收入、國庫支出以及國庫庫存等統(tǒng)計指標作為數(shù)據(jù)的為空間維度,利用云計算的強大能力,并借助數(shù)據(jù)分析展示工具,預先計算處理數(shù)據(jù)?;蛘吒鶕?jù)用戶事先提交的數(shù)據(jù)挖掘需求自動完成相關數(shù)據(jù)預處理。統(tǒng)計分析人員隨時可以從兩個維度上深度挖掘數(shù)據(jù),并使用QLikView等數(shù)據(jù)分析工具,實現(xiàn)統(tǒng)計大數(shù)據(jù)的多維度、可視化展示。
二是實現(xiàn)常規(guī)統(tǒng)計分析的智能化生產(chǎn)??梢酝ㄟ^完善和豐富大數(shù)據(jù)應用平臺的分析功能,實現(xiàn)機器式的學習,輸入必要的參數(shù)后,系統(tǒng)將自動計算數(shù)據(jù),并關聯(lián)提取大數(shù)據(jù)池中的相關數(shù)據(jù)和信息,進而依據(jù)特定的模板輸出分析報告,最后由分析人員對輸出的分析報告進行質(zhì)量把關和進一步的補充完善。
三是構建統(tǒng)計分析數(shù)據(jù)模型,提高預警預測水平。不斷進行新的分析預測數(shù)學模型的探索和構建,充分利用國庫統(tǒng)計大數(shù)據(jù)平臺上的海量數(shù)據(jù)和動態(tài)實時數(shù)據(jù),不斷提高預測水平。
(五)數(shù)據(jù)展示與反饋
以智能化統(tǒng)計分析為主的大數(shù)據(jù)應用技術,為數(shù)據(jù)結構化和可視化的展示提供了支持。簡要國庫運行數(shù)據(jù)、系統(tǒng)化運行指標、國庫資金運行報告、國情和輿情監(jiān)測報告、企業(yè)和金融服務報告、國庫運行情況預測等為中央銀行、各級政府部門制定有關政策提供統(tǒng)計信息和參考依據(jù),充分發(fā)揮國庫在國家預算執(zhí)行中的促進、反映和監(jiān)督作用。同時建立信息反饋機制,對現(xiàn)有統(tǒng)計分析結果予以反饋,還包括對未滿足需求提出反饋,豐富和完善大數(shù)據(jù)應用成果,充分發(fā)揮國庫統(tǒng)計分析應用大數(shù)據(jù)的社會價值。
綜上所述,從全流程看,大數(shù)據(jù)應用自數(shù)據(jù)端建立“”數(shù)據(jù)池“”到處理端智能分析在到應用端數(shù)據(jù)展示,大致可以通過下圖(圖1)形象展示:
三、有效提升大數(shù)據(jù)應用的政策建議
(一)從制度層面保障大數(shù)據(jù)統(tǒng)計分析的有效開展
制定專門的大數(shù)據(jù)應用法律法規(guī),在由總行統(tǒng)一部署、統(tǒng)一實施的基礎上,各地區(qū)分支機構結合當?shù)貙嶋H制定特色大數(shù)據(jù)應用和發(fā)展規(guī)章制度。從數(shù)據(jù)產(chǎn)生、采集、存儲、挖掘和應用等大數(shù)據(jù)處理全流程做出明確安排。一是通過總行層面的發(fā)文、通知等鼓勵通過大數(shù)據(jù)方法加強國庫統(tǒng)計分析,建設大數(shù)據(jù)共享和應用平臺;二是強化大數(shù)據(jù)統(tǒng)計所需軟硬件采購、數(shù)據(jù)源互聯(lián)互通及模塊化分割等作出具體安排;三是要求大數(shù)據(jù)應用所應達到的在信息發(fā)布、統(tǒng)計報告、預測與預警等功能上的目標和績效予以明確,充分利用大數(shù)據(jù)平臺提供統(tǒng)計分析支持;四是強化信息技術安全,防止信息泄露、網(wǎng)絡攻擊、系統(tǒng)失靈等問題,明確應急處置方案。做到嚴格立法,有法可依,有章可循。
(二)加大基礎設施建設和人才投入,滿足大數(shù)據(jù)應用的軟硬件要求
大數(shù)據(jù)基礎設施可分為硬件和軟件兩類。硬基礎設施主要包括用于收集、存儲、分析和應用大數(shù)據(jù)的信息化系統(tǒng)架構;軟件基礎設施主要包括各類數(shù)據(jù)信息、數(shù)據(jù)挖掘和大數(shù)據(jù)應用專業(yè)軟件以及金融企業(yè)的人力資源。人民銀行應通過專項資金投入等方式構建大數(shù)據(jù)應用的軟硬件設施和和培養(yǎng)專業(yè)人才,并通過持續(xù)培訓使全體員工了解并使用大數(shù)據(jù)進行國庫統(tǒng)計分析。也可邀請專業(yè)的大數(shù)據(jù)解決方案服務商作為咨詢顧問,整合國庫不同生產(chǎn)系統(tǒng)數(shù)據(jù),優(yōu)化數(shù)據(jù)應用行為,加快統(tǒng)計系統(tǒng)建設步伐。
(三)提高大數(shù)據(jù)管理和應用能力
國庫統(tǒng)計分析應不斷的加強國庫運行數(shù)據(jù)的采集、儲存、保護和管理工作,不斷提升統(tǒng)計分析水平。加強對國庫統(tǒng)計分析中涉及的地方債、營改增、房地產(chǎn)、小微企業(yè)經(jīng)營、財政專戶、盤活庫存等熱點領域可以設計建立相應跟蹤監(jiān)測指標體系。與此同時加強改革數(shù)據(jù)的統(tǒng)計制度、方法以及程序,研究大數(shù)據(jù)共享制度,為宏觀經(jīng)濟分析提供便捷、堅實的大數(shù)據(jù)基礎。
建立國庫大數(shù)據(jù)分析應用機制是新形勢下的當務之急。國庫統(tǒng)計分析需不斷改革創(chuàng)新,強化大數(shù)據(jù)的思維,提高大數(shù)據(jù)的意識和駕馭大數(shù)據(jù)的能力,積極探索新的大數(shù)據(jù)應用方法和途徑,從而在國家宏觀決策、服務經(jīng)濟社會發(fā)展、服務國庫管理方面,進一步提升國庫統(tǒng)計分析服務的能力和水平。
參考文獻:
[1]沈昱池.大數(shù)據(jù)時代我國財政信息共享的思考[J].地方財政研究,2015(11):47-67
[2]陳健慧,趙昕.國庫統(tǒng)計分析數(shù)據(jù)集中系統(tǒng)建設[J].金融電子化,2010,03:89-90
[3]中國人民銀行包頭市中心支行課題組,飛嶺. 做好國庫統(tǒng)計分析工作新思路的探討[J].內(nèi)蒙古金融研究, 2014, 09: 64 -65
[4]石勇.大數(shù)據(jù)技術在金融行業(yè)的應用及未來展望[J].金融電子化,2014( 7) : 22-23