□ 賈悅 王超
大數(shù)據(jù)是一場管理革命。利用政務(wù)云平臺的各種軟硬件和大數(shù)據(jù)技術(shù),為公共信用信息系統(tǒng)和公共信用信息平臺提供更先進的數(shù)據(jù)采集、處理、分析等基礎(chǔ)支撐技術(shù),為信用評級機構(gòu)、征信機構(gòu)等第三方應(yīng)用平臺進行信用信息資源增值開發(fā)提供應(yīng)用支撐技術(shù),已成為社會信用體系建設(shè)的發(fā)展趨勢。
2008年,經(jīng)杭州市委、市政府同意,杭州市發(fā)改委(市信用辦)牽頭,杭州市信息中心(市信用中心)具體負責(zé),啟動了杭州市聯(lián)合征信系統(tǒng)項目建設(shè),2013年起項目名稱正式更名為杭州市公共信用信息平臺。杭州市公共信用信息平臺經(jīng)過前幾期的建設(shè),已形成一定規(guī)模,增加了歸集數(shù)據(jù)、拓寬了業(yè)務(wù)范圍、拓展了用信方式,信用數(shù)據(jù)不僅來源于政府部門、事業(yè)單位,還有互聯(lián)網(wǎng)公共信息的搜索抓取、移動應(yīng)用采集等多種渠道。
杭州市公共信用信息平臺的數(shù)據(jù)處理主要包含以下幾個步驟:一是數(shù)據(jù)準備,即各業(yè)務(wù)部門將相關(guān)數(shù)據(jù)匯集到電子政務(wù)辦,電子政務(wù)辦將數(shù)據(jù)匯總到統(tǒng)一電子政務(wù)交換云平臺。二是數(shù)據(jù)采集,即通過網(wǎng)間交換,將統(tǒng)一電子政務(wù)交換云平臺中的增量數(shù)據(jù)采集到杭州市公共信用信息平臺的歸集庫。三是數(shù)據(jù)歸集,即杭州市公共信用信息平臺通過程序處理,將歸集庫中的數(shù)據(jù)轉(zhuǎn)換成資源目錄對應(yīng)的數(shù)據(jù)結(jié)構(gòu),并存儲到中心庫。該步驟同時包含清洗、比對、去重等數(shù)據(jù)處理內(nèi)容。四是數(shù)據(jù)計算(指標生成),即杭州市公共信用信息平臺根據(jù)指標配置的規(guī)則,進行指標結(jié)果的計算,并輸出到固化表中。目前該環(huán)節(jié)需要人工干預(yù)處理。由數(shù)據(jù)運維人員對數(shù)據(jù)歸集的情況進行分析判斷,確認當(dāng)前系統(tǒng)的壓力度,以及是否能進行固化。
截至2017年5月,杭州市公共信用信息平臺已形成1300余萬份自然人信用記錄和120余萬份法人信用記錄,完全覆蓋了全市常住人口、流動人口及注冊法人,實現(xiàn)政府信用信息的全量歸集,涵蓋全市55家市級行政機關(guān),水、電、公交等9家公用事業(yè)單位,13個區(qū)、縣(市),共338類2947項1.4億多條信用信息。
引入大數(shù)據(jù)技術(shù),對杭州市公共信用信息平臺進行升級改造,利用技術(shù)的創(chuàng)新推進信用應(yīng)用場景的創(chuàng)新和信用服務(wù)模式的創(chuàng)新,延伸信用信息服務(wù)的廣度和深度,是杭州市推動和加快社會信用體系建設(shè)的一個具有里程碑意義的創(chuàng)新舉措。
大數(shù)據(jù)技術(shù)的運用,使當(dāng)前政府信用數(shù)據(jù)的來源不再局限于傳統(tǒng)的組織登記、市場監(jiān)管、審批審核等傳統(tǒng)領(lǐng)域和組織內(nèi)數(shù)據(jù),而是擴展到電子商務(wù)、社交數(shù)據(jù)、網(wǎng)絡(luò)行為等領(lǐng)域,大大拓展了數(shù)據(jù)的來源渠道,擴大了數(shù)據(jù)歸集的范圍。
公共信用信息平臺大數(shù)據(jù)改造后,支持結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),涵蓋包括文件、靜態(tài)圖片、指紋、視音頻等更多種類,實現(xiàn)歸集的信用數(shù)據(jù)類型更全面、更完整。
公共信用信息大數(shù)據(jù)應(yīng)用支撐平臺利用分布式存儲和并行計算框架,結(jié)合多種分布式計算引擎,大大提高了數(shù)據(jù)處理的時效性和精確度;通過采用BI技術(shù),包括大數(shù)據(jù)倉庫建模、ETL、OLAP分析、可視化等技術(shù),可實現(xiàn)對信用數(shù)據(jù)不同主題的多維度分析;平臺通過采用數(shù)據(jù)標簽化、聚類、判別模型、群像分析等一系列大數(shù)據(jù)技術(shù),利用不斷積累的數(shù)據(jù)資源,通過機器學(xué)習(xí)算法,對信用模型進行矯正與進化,可實現(xiàn)信用大數(shù)據(jù)主題應(yīng)用的深入分析。
大數(shù)據(jù)的價值不在于擁有,更重要的是應(yīng)用,這不僅需要持久的關(guān)注研究和大量的研發(fā)投入,更需要和政府監(jiān)管要求、征信商業(yè)模式以及社會需求緊密結(jié)合,對數(shù)據(jù)進行深入的理解和分析,充分發(fā)掘數(shù)據(jù)價值。大數(shù)據(jù)技術(shù)的應(yīng)用是一個綜合性的過程,是從數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)分析挖掘到數(shù)據(jù)服務(wù)的一體化過程。通過運用大數(shù)據(jù)技術(shù),不僅促進了信用產(chǎn)品及信用創(chuàng)新型應(yīng)用的開發(fā)和推廣、推動了信用服務(wù)產(chǎn)業(yè)的深入發(fā)展,同時為政府監(jiān)管決策精細化、前置化提供了輔助和支撐,降低了行政執(zhí)法成本,提升了政府公信力。