欒國春
我國當前正處于數(shù)字經(jīng)濟高速發(fā)展時期,數(shù)字經(jīng)濟作為高質(zhì)量發(fā)展的“穩(wěn)定器”和“驅(qū)動器”作用將日益凸顯。數(shù)據(jù)作為新型生產(chǎn)要素,是整個數(shù)字經(jīng)濟發(fā)展的基礎(chǔ),數(shù)據(jù)只有流通交易和共享才能創(chuàng)造更多價值。因此,如何更好地保障數(shù)據(jù)流通、交易和共享是構(gòu)建數(shù)據(jù)基礎(chǔ)制度的重點,也是充分釋放數(shù)據(jù)要素價值、發(fā)展數(shù)字經(jīng)濟的關(guān)鍵。
一、當前數(shù)據(jù)流通、交易和共享存在的主要問題
一是確權(quán)難,存在數(shù)據(jù)主體多元,數(shù)據(jù)流通、交易和共享過程多變,對數(shù)據(jù)的貢獻不明確等問題。在數(shù)據(jù)市場實際應(yīng)用場景中,判定數(shù)據(jù)歸屬以及數(shù)據(jù)是否被限定的用戶使用,屬于數(shù)據(jù)所有權(quán)中的重要內(nèi)容。當前大多隱私保護技術(shù)一般由數(shù)據(jù)擁有者制定相關(guān)的訪問規(guī)則,然而接收方一旦獲得數(shù)據(jù),數(shù)據(jù)擁有者就對這些數(shù)據(jù)失去了控制。為此,在數(shù)據(jù)流通、交易和共享之前,應(yīng)該明確數(shù)據(jù)資產(chǎn)的各項權(quán)利,包括數(shù)據(jù)的所有權(quán)和使用權(quán)。當前數(shù)據(jù)行業(yè)大多用服務(wù)換數(shù)據(jù),這種方式混淆了數(shù)據(jù)的所有權(quán)和使用權(quán),使得數(shù)據(jù)所有者無法管控自身數(shù)據(jù)的使用情況。個人日?;顒铀a(chǎn)生數(shù)據(jù)的所有權(quán)毫無疑問屬于個人,然而,數(shù)據(jù)不同于傳統(tǒng)的商品,具有看過就等同于擁有的特征,難以清晰地界定所有權(quán)。
二是互信難,數(shù)據(jù)來源不可信、質(zhì)量不可靠、隱私安全風(fēng)險較高。真實可信的數(shù)據(jù)是數(shù)據(jù)流通、交易和共享的基石。由于有些數(shù)據(jù)源單位之間缺乏相互信任,導(dǎo)致不愿或不敢主動共享核心數(shù)據(jù),目前也無有效手段推動數(shù)據(jù)自由地跨區(qū)域流動,數(shù)據(jù)要素價值得不到充分挖掘,而且數(shù)據(jù)易被復(fù)制的特性使得數(shù)據(jù)主體擔心用戶隱私泄露,導(dǎo)致不愿共享數(shù)據(jù)。此外,很多數(shù)據(jù)中包含著大量的敏感信息,數(shù)據(jù)市場的隱私保護對于敏感數(shù)據(jù)的流通、交易及共享尤為重要。隱私保護問題誕生自數(shù)據(jù)共享場景中,制訂數(shù)據(jù)的安全防護措施時,需要在充分地考慮數(shù)據(jù)使用場景及數(shù)據(jù)主體知情的前提下,發(fā)揮數(shù)據(jù)使用價值,但這可能會降低對隱私的要求。攻擊者可能會在數(shù)據(jù)傳輸?shù)倪^程中竊取用戶的隱私信息,造成數(shù)據(jù)用戶的敏感信息泄露等問題。目前由中心節(jié)點集中存儲數(shù)據(jù)信息的方法,可能存在存儲節(jié)點單點故障,一旦被攻擊導(dǎo)致服務(wù)器宕機,整個系統(tǒng)將不再可用,同時,管理員的權(quán)限比較高,有可能從內(nèi)部造成數(shù)據(jù)泄露。
三是監(jiān)管難,數(shù)據(jù)流通、交易及共享的過程比較復(fù)雜,對其進行有效的監(jiān)管面臨著較大挑戰(zhàn)。在傳統(tǒng)的數(shù)據(jù)市場模式下,由于中心化系統(tǒng)的黑盒特性,數(shù)據(jù)流通、交易及共享記錄容易被篡改和刪除。數(shù)據(jù)應(yīng)限定使用范圍并保證被有限次使用。然而由于無法對數(shù)據(jù)的使用進行有效地監(jiān)管,可能存在數(shù)據(jù)被二次售賣、并造成數(shù)據(jù)無法追溯的情況。因此,對數(shù)據(jù)流通、交易及共享進行有效監(jiān)管是一個亟需解決的問題。
二、基于區(qū)塊鏈技術(shù)的數(shù)據(jù)流通、交易及共享安全保障體系
(一)建立數(shù)據(jù)流通、交易及共享安全保障體系
區(qū)塊鏈技術(shù)具有去信任化、去中心化、不可篡改性、可追溯性、密碼算法安全性和不可否認性等安全特征,可以有效解決確權(quán)、互信等問題。筆者以區(qū)塊鏈技術(shù)為基礎(chǔ),結(jié)合訪問控制、加解密等多種數(shù)據(jù)安全保護方法,設(shè)計建立一個保障數(shù)據(jù)安全流通、交易和共享的體系。主要是利用聯(lián)盟區(qū)塊鏈對用戶身份進行認證與管理,實現(xiàn)用戶身份注冊、證書管理、公鑰管理、身份認證等功能。同時區(qū)塊鏈網(wǎng)絡(luò)提供的數(shù)據(jù)信息存儲與搜索過程,記錄數(shù)據(jù)的摘要信息、數(shù)據(jù)流通、交易和共享過程等信息。通過智能合約機制驗證搜索的密文所需要的屬性和數(shù)據(jù)請求者的權(quán)限。采用分布式文件系統(tǒng)IPFS(Interplanetary File System),能夠降低區(qū)塊鏈上數(shù)據(jù)存儲的成本,當數(shù)據(jù)擁有者將數(shù)據(jù)文件上傳至 IPFS以后,它就會為每個數(shù)據(jù)文件分配唯一的哈希值,具體如圖1所示。接下來以此圖為基礎(chǔ)架構(gòu),分別就如何保障數(shù)據(jù)流通、交易和共享安全進行說明闡述。
(二)數(shù)據(jù)流通安全保障
據(jù)統(tǒng)計,單個組織或機構(gòu)一般僅僅存儲15%與其業(yè)務(wù)關(guān)聯(lián)的數(shù)據(jù),其他所需的數(shù)據(jù)是來自于其它組織或機構(gòu)。聯(lián)盟式的數(shù)據(jù)流通系統(tǒng)不斷出現(xiàn),加入聯(lián)盟系統(tǒng)的用戶提供數(shù)據(jù)信息,同時能夠獲取其他用戶提供的數(shù)據(jù)。通過數(shù)據(jù)流通能夠打破“數(shù)據(jù)孤島”,從而深度挖掘數(shù)據(jù)的價值。
目前我國數(shù)據(jù)流通面臨著數(shù)據(jù)隱私保護不足、數(shù)據(jù)權(quán)屬界定不清晰、流通各階段標準缺乏共識等問題。因此,對流通的數(shù)據(jù)建立完善的追溯體制非常重要,即在機構(gòu)之間的數(shù)據(jù)流通過程中,在跨不同利益主體之間追溯與控制數(shù)據(jù)流轉(zhuǎn)。利用區(qū)塊鏈技術(shù)可以解決以上問題。一是完成對敏感行為的記錄與控制,為數(shù)據(jù)流通系統(tǒng)提供可審計性。二是分布式數(shù)據(jù)存儲結(jié)合區(qū)塊鏈審計能夠保證數(shù)據(jù)隱私。三是清晰地界定數(shù)據(jù)權(quán)屬,在不同系統(tǒng)之間統(tǒng)一身份認證,使得數(shù)據(jù)訪問的行為被正確地審計。四是通過區(qū)塊鏈技術(shù)保證數(shù)據(jù)的流通可追溯、不可篡改,促進安全可信的數(shù)據(jù)流通的生態(tài)建設(shè)。
(三)數(shù)據(jù)交易安全保障
數(shù)據(jù)交易是指以數(shù)據(jù)作為商品進行分類定價、流通和買賣的行為,它將有效發(fā)揮數(shù)據(jù)價值,實現(xiàn)從數(shù)據(jù)資源到數(shù)據(jù)要素到數(shù)據(jù)資產(chǎn)再到數(shù)據(jù)資本的多重轉(zhuǎn)變。隨著數(shù)據(jù)需求的存在,數(shù)據(jù)交易的市場也在逐步形成。目前市場上主要存在兩種數(shù)據(jù)交易方式:第三方數(shù)據(jù)交易平臺和雙方定向交易。其中第三方數(shù)據(jù)交易平臺,我國現(xiàn)存有兩種較主流的形式:一種是由政府主導(dǎo)的政府或國企獨資或政府和民營合資的大數(shù)據(jù)交易中心;另一種是以企業(yè)獨資或合資運營為主導(dǎo)的數(shù)據(jù)交易平臺。
當前數(shù)據(jù)交易市場處在初步發(fā)展階段,整體還不夠成熟完善,存在數(shù)據(jù)定價機制不明確、數(shù)據(jù)價格與其價值不符、數(shù)據(jù)存儲缺乏安全性、數(shù)據(jù)交易過程不透明且難以追溯等問題。此外,數(shù)據(jù)交易是一種新興商品交易方式,與傳統(tǒng)的商品交易存在明顯的區(qū)別,數(shù)據(jù)擁有可見即可得、易獲取、易被復(fù)制、易傳播等特征,且復(fù)制前后的數(shù)據(jù)在本質(zhì)上并無太大差異,數(shù)據(jù)一旦被復(fù)制甚至被傳播后,會大幅度降低其價值,因此在數(shù)據(jù)交易過程中安全問題至關(guān)重要,如何保證數(shù)據(jù)隱私不被泄露是亟待解決的一大問題。
根據(jù)區(qū)塊鏈的不可篡改性、可追溯性、去中心化、匿名性等特點,若將區(qū)塊鏈技術(shù)用于數(shù)據(jù)交易平臺的數(shù)據(jù)存儲部分,將極大程度上解決目前數(shù)據(jù)交易面臨的問題。不可篡改性確保數(shù)據(jù)在定價之后不被人為惡意修改;可追溯性能夠?qū)ζ脚_上價格變動、交易過程全記錄等信息進行溯源;去中心化確保各主體的權(quán)益得到充分保護等;匿名性可用于保護數(shù)據(jù)交易平臺用戶隱私。
數(shù)據(jù)交易過程中主要包括三大類主體:數(shù)據(jù)擁有者、數(shù)據(jù)消費者、數(shù)據(jù)交易平臺。數(shù)據(jù)擁有者首先將隱私數(shù)據(jù)上鏈,然后根據(jù)某種定價策略對上傳的數(shù)據(jù)商品進行定價。加入?yún)^(qū)塊鏈技術(shù)后,區(qū)塊鏈網(wǎng)絡(luò)主要用于存儲各種數(shù)據(jù)信息,包括數(shù)據(jù)商品概要信息、數(shù)據(jù)價格、數(shù)據(jù)內(nèi)容和數(shù)據(jù)交易記錄等信息。數(shù)據(jù)存儲采用將真實數(shù)據(jù)內(nèi)容存放在 IPFS 網(wǎng)絡(luò)中的存儲方式,將 IPFS 返回的哈希值地址,同數(shù)據(jù)信息一起存儲在區(qū)塊鏈。但存儲在IPFS中也并不能完全保證數(shù)據(jù)的安全性,為了降低內(nèi)容被泄露的風(fēng)險,運用對稱加密算法、非對稱加密算法、代理重加密算法對數(shù)據(jù)訪問進行有效控制,從而保障數(shù)據(jù)內(nèi)容的安全性。數(shù)據(jù)消費者購買數(shù)據(jù)商品后,可請求下載數(shù)據(jù),經(jīng)過一定過程,生成加密密鑰和解密密鑰,最后數(shù)據(jù)消費者即可獲取到明文數(shù)據(jù)。
(四)數(shù)據(jù)共享安全保障
現(xiàn)在各行業(yè)中均存在“數(shù)據(jù)孤島”“數(shù)據(jù)煙囪”等現(xiàn)象。究其原因主要是無法保證數(shù)據(jù)隱私性、保密性和數(shù)據(jù)的確權(quán)。目前應(yīng)用最廣泛的數(shù)據(jù)共享方法是以第三方平臺作為中介,數(shù)據(jù)所有者將數(shù)據(jù)上傳到第三方平臺后,其他用戶再獲取。然而,這種傳統(tǒng)的數(shù)據(jù)共享方式采用中心化服務(wù)器和中心化存儲,主要存在以下問題:一是管理員權(quán)限過高,如從內(nèi)部主動作惡,竊取用戶的隱私數(shù)據(jù),容易造成數(shù)據(jù)泄露;二是中心化服務(wù)器容易被黑客攻擊,從而導(dǎo)致單點故障,一旦中心化服務(wù)器宕機,整個數(shù)據(jù)共享系統(tǒng)將不可再用;三是傳統(tǒng)的數(shù)據(jù)共享方式共享過程不透明、數(shù)據(jù)所有權(quán)歸屬難以確定。
將區(qū)塊鏈技術(shù)與數(shù)據(jù)共享結(jié)合起來,能有效解決傳統(tǒng)中心化數(shù)據(jù)共享方案存在的問題。區(qū)塊鏈技術(shù)可以將用戶間共享數(shù)據(jù)過程在智能合約中實現(xiàn),能夠?qū)⒂脩舻墓蚕頂?shù)據(jù)的記錄呈現(xiàn)在區(qū)塊鏈賬本上,實現(xiàn)用戶數(shù)據(jù)確權(quán)和數(shù)據(jù)共享過程透明可追溯。數(shù)據(jù)申請者從基于區(qū)塊鏈的數(shù)據(jù)安全共享平臺中獲取所需數(shù)據(jù)信息,并輸入自身屬性對稱密鑰解密,只有當數(shù)據(jù)申請者擁有該數(shù)據(jù)的訪問權(quán)限時,才能夠獲得解密密鑰。經(jīng)過一定流程,數(shù)據(jù)申請者可獲得密文并解密密文,從而獲得所需數(shù)據(jù)。當申請者發(fā)出申請并執(zhí)行搜索時,基于區(qū)塊鏈的數(shù)據(jù)安全共享平臺會將用戶的行為記錄到區(qū)塊鏈上,便于追溯及監(jiān)管。
(作者為國家公共信用信息中心副處長、高級工程師)