盧勇
在真正數(shù)據(jù)開放的過程中,生態(tài)作為一個非常重要的形式,可以推動整個行業(yè)發(fā)展,從這個角度講,公共數(shù)據(jù)開放要構(gòu)建在一個生態(tài)的基礎(chǔ)上,那么怎樣做生態(tài)?我們有許多的方法。
公共數(shù)據(jù)開放本身的目的并不只是為了開放,而是希望通過開放帶來更多社會價值實施。無論是從政府還是行業(yè)的角度來看,大家都持有較多的困惑與疑慮,數(shù)據(jù)是否能開放?如何保證數(shù)據(jù)開放在創(chuàng)造價值的同時又能減少危害?這些都是我們需要著重考慮的內(nèi)容。
中國在政府?dāng)?shù)據(jù)開放方面相比其他國家起步稍晚,但自2018年開始快速增長,近兩年開放的平臺、數(shù)據(jù)集都在成倍增長。各省市也加快步伐,比如上海會在未來1~2個月內(nèi)發(fā)布公共數(shù)據(jù)開放管理條例,有了此類法律法規(guī)的支撐,相信我國會更快實現(xiàn)公共數(shù)據(jù)開放發(fā)展。
公共數(shù)據(jù)開放以后,能在什么樣的場景下使用呢?我們簡單歸納了四個場景,分別是信息開放、自查自用、他查他用、融合計算。首先是信息開放,很多省份都有公共數(shù)據(jù)開放網(wǎng)站,在網(wǎng)站上進(jìn)行查詢下載,就可以獲取很多開放的信息,比如政策文件、統(tǒng)計數(shù)據(jù)、經(jīng)濟(jì)數(shù)據(jù)等。第二是自查自用,個體可以獲取自身的數(shù)據(jù),比如市民查詢自身戶籍信息,企業(yè)查詢自身證照和資質(zhì)。第三是他查他用。當(dāng)需要去查第三方企業(yè)或某個人的數(shù)據(jù)時,往往很難確定數(shù)據(jù)源頭在哪兒,比如通過人民銀行查詢他們在其他銀行的貸款情況或還款情況,這樣就知道數(shù)據(jù)的源頭了。上海數(shù)據(jù)交易中心和公安三所合作,研發(fā)出匿名化的脫敏技術(shù),可以對任何一個ID進(jìn)行轉(zhuǎn)化,轉(zhuǎn)化之后就可以在合法合理的環(huán)境下,不直接獲取對方的敏感信息,但可以獲取跟ID相關(guān)的標(biāo)簽類數(shù)據(jù),用技術(shù)手段保障數(shù)據(jù)安全。第四是融合計算,它不僅能加快整個行業(yè)數(shù)字化,同時能推動供應(yīng)鏈金融等應(yīng)用的實現(xiàn)。關(guān)于融合計算,有不同的說法,有的說讓數(shù)據(jù)“多跑路”,有的說數(shù)據(jù)不動、模型動。融合計算結(jié)合這兩種類型應(yīng)用,同時又融合不同的數(shù)據(jù)源,用脫敏的方式進(jìn)行數(shù)據(jù)交換,這是未來開放數(shù)據(jù)比較看重的應(yīng)用。通過數(shù)據(jù)開放平臺,我們可以為個人、科研機(jī)構(gòu)、企業(yè)提供服務(wù),讓他們通過界面或系統(tǒng)與系統(tǒng)之間對接的方式來獲取數(shù)據(jù)。
公共數(shù)據(jù)的開放需要實現(xiàn)合法、可監(jiān)管、公平、可持續(xù)。尤其是保證匿名化技術(shù)的合法,能夠推進(jìn)數(shù)據(jù)開放使用和監(jiān)管,同樣地,在管理和運(yùn)營過程中也要保證合規(guī)合法。可持續(xù)也是非常重要的一個方面,所謂的可持續(xù)不是數(shù)據(jù)的供應(yīng)可持續(xù),而是應(yīng)用在未來的生態(tài)環(huán)境中能讓各方獲益,可持續(xù)地為大家提供服務(wù)。
數(shù)據(jù)開放中一個比較重要的話題是如何對數(shù)據(jù)進(jìn)行分級、分類。數(shù)據(jù)徹底泛化以后,甚至已經(jīng)超過統(tǒng)計級以后,價值就不會那么高了。如何根據(jù)不同的使用場景,將數(shù)據(jù)進(jìn)行更好的分級分類,是我們需要考慮的問題。在一些限定的條件下,不同類型的數(shù)據(jù)通過分級分類,可以提供不同的服務(wù),我們需要考慮將數(shù)據(jù)分類到人、物還是群等,同時通過不同的層級,將數(shù)據(jù)分為基礎(chǔ)類或應(yīng)用類,通過這些手段對數(shù)據(jù)進(jìn)行更合理的分級分類。
數(shù)據(jù)開放以后,要在不損害相關(guān)方利益基礎(chǔ)上,讓公共數(shù)據(jù)有限地社會化使用。數(shù)據(jù)開放是沒有條件的,但是如何在各類場景中合理使用,就要考慮個人的隱私、商業(yè)的機(jī)密、國家的安全,在真正實踐操作時都要解決這幾個方面的問題。
我們已經(jīng)推廣了一些應(yīng)用,目前在跟上海市政府大數(shù)據(jù)中心合作,大數(shù)據(jù)中心推出的第一個業(yè)務(wù)就是一網(wǎng)通辦,將各個委辦局的數(shù)據(jù)進(jìn)行共享,讓市民、企業(yè)辦理業(yè)務(wù)更加方便。面對匯聚的大量數(shù)據(jù),我們找到了一定的開發(fā)數(shù)據(jù)應(yīng)用場景。比如普惠金融通過數(shù)據(jù)的方式、通過政府對中小企業(yè)進(jìn)行了解,并形成一定的評估數(shù)據(jù),為中小企業(yè)提供更好的服務(wù),所以開放數(shù)據(jù)的目的是為了解決服務(wù)的問題。同時通過這樣的實踐,我們數(shù)據(jù)開放的效果也得到了很好的評判,實際上開放并不是衡量業(yè)務(wù)有多少、開放平臺有多少數(shù)據(jù)集,而是需要對數(shù)據(jù)開放之后產(chǎn)生應(yīng)用的社會價值進(jìn)行評估。
我們本著數(shù)據(jù)服務(wù)應(yīng)用的理念,從應(yīng)用出發(fā)探索數(shù)據(jù)需求,再以數(shù)據(jù)需求尋找、治理數(shù)據(jù)資源,最終在應(yīng)用產(chǎn)生的社會價值層面評估效果。
另外就是前面提到的生態(tài),由于在開放數(shù)據(jù)過程中不僅牽涉政府,也包括了整個行業(yè)和提供服務(wù)的機(jī)構(gòu),從產(chǎn)業(yè)發(fā)展的角度出發(fā),需要調(diào)動產(chǎn)業(yè)鏈各個層級,比如數(shù)據(jù)提供方、數(shù)據(jù)加工方、數(shù)據(jù)應(yīng)用方等,讓多方都從中獲益,實現(xiàn)可持續(xù)發(fā)展的良性數(shù)據(jù)生態(tài)系統(tǒng)。
數(shù)據(jù)應(yīng)用開放能夠反過來推動前端對數(shù)據(jù)的治理。我們在近兩年的業(yè)務(wù)實踐中,在幫企業(yè)進(jìn)行數(shù)據(jù)治理的同時,也跟行業(yè)知名的標(biāo)準(zhǔn)研究院一起推出數(shù)據(jù)成熟度模型,對數(shù)據(jù)治理工作進(jìn)行評估,探測企業(yè)本身的數(shù)據(jù)治理能力達(dá)到了哪個層級。通過這些實踐活動,一方面使政府?dāng)?shù)據(jù)更加開放,使行業(yè)得到更多應(yīng)用,另一方面幫助企業(yè)更好地提升自身數(shù)據(jù)治理和數(shù)據(jù)管理能力。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)