王玉菲
(中國華電海外資產(chǎn)管理有限公司,北京)
伴隨著信息時代中現(xiàn)代化技術、數(shù)字化技術的不斷發(fā)展,數(shù)據(jù)已經(jīng)逐漸成為當前時代中的一種重要、核心資源,隨著數(shù)據(jù)規(guī)模的快速增加,數(shù)據(jù)的加工處理技術水平也在持續(xù)地提高,這就使得數(shù)據(jù)在社會生產(chǎn)發(fā)展過程中起到了越來越大的作用,數(shù)據(jù)在社會中的應用價值也越來越高[1]。2020 年4 月,國務院首次將“數(shù)據(jù)交易”納入了生產(chǎn)要素管理范圍之內(nèi),這也是“數(shù)據(jù)交易”第一次正式出現(xiàn)在官方文件之中。近年來,各地政府、企業(yè)紛紛將數(shù)據(jù)作為重要的發(fā)展因素,并認識到了“數(shù)據(jù)交易”在數(shù)字經(jīng)濟中的重要地位??傊瑪?shù)據(jù)屬于市場內(nèi)一種重要的戰(zhàn)略性資源,合理應用數(shù)據(jù),將加速企業(yè)發(fā)展、推動經(jīng)濟繁榮、全面提高國家安全。
為推動資料分享與數(shù)據(jù)流通,各地政府都在積極推行“數(shù)據(jù)交易”政策,為滿足產(chǎn)業(yè)發(fā)展需求,資料市場與數(shù)據(jù)交換中心便應運而生。數(shù)據(jù)處理中心能夠為使用者提供數(shù)據(jù)處理服務,使數(shù)據(jù)充分發(fā)揮其價值。然而,目前數(shù)據(jù)交易平臺還存在著數(shù)據(jù)保留、隱私保護、交易不規(guī)范、信任成本高等問題,限制了數(shù)據(jù)使用者對數(shù)據(jù)交易的期待與積極性[2]。因此,設計一個高度安全的“數(shù)據(jù)交易”方案,將成為當前數(shù)據(jù)領域的一個熱門話題。
數(shù)據(jù)交易過程可以用圖1 表示。由數(shù)據(jù)請求者DS 向數(shù)據(jù)提供者DP 請求數(shù)據(jù),并支付一定獎勵金額,以此獲取DP 所提供的數(shù)據(jù)。通過云服務器,將交易數(shù)據(jù)打包成區(qū)塊,上傳到區(qū)塊鏈上。在一個區(qū)塊中,包含了目前區(qū)塊的散列值,前一個區(qū)塊的散列值、隨機數(shù)、以及時間標記。為確保用戶協(xié)議的隱私性,DS要求用戶提供相應的保證金R,并保證用戶不會泄露用戶的數(shù)據(jù)資產(chǎn)以及用戶的隱私性。由于數(shù)據(jù)的時效或保密資料的時間戳T,定金會在T 之后被退還[3]。但是,由于每個交易用戶的投資額度都是有限制的,因此,在這個項目中,最重要的問題就是如何確定保證金的數(shù)額。
圖1 數(shù)據(jù)交易流程示意
為了激勵數(shù)據(jù)提供者降低噪聲、改善數(shù)據(jù)品質(zhì),合同中要求項目負責人必須繳納一定金額的保證金。不同的數(shù)據(jù)包含了不同的隱私信息,如數(shù)據(jù)的隱私價值、數(shù)據(jù)的交易意愿等,構(gòu)成了用戶對數(shù)據(jù)的偏好。傳送的隱私值越小,說明其愿意降低數(shù)據(jù)噪聲[4]。假設一個噪聲度可表示為△n,△n 的取值越大,其偏好類型越高,表明其希望傳輸降噪水平越低的數(shù)據(jù)。當然,偏好類型越低的數(shù)據(jù)提供者,越愈擔心隱私會被泄露[5]。假設在DTN 中的數(shù)據(jù)提供者DP 有N 個降噪優(yōu)先選擇類型,那么以N 個降噪優(yōu)先選擇類型對于各節(jié)點來說是以升序表示為:
式中:α 代表對應節(jié)點的噪聲偏好類型。對于高偏好類型的數(shù)據(jù)提供者更容易受到數(shù)據(jù)請求者的青睞,同時也需要更多的保證金[6]。由于數(shù)據(jù)請求者更希望自己能夠接收到數(shù)據(jù)效用更高的數(shù)據(jù)資源,因此結(jié)合合同,可以通過自我揭示數(shù)據(jù)請求者對數(shù)據(jù)的噪聲版本需求的方式,激勵數(shù)據(jù)提供者主動降低噪聲。對于數(shù)據(jù)提供者而言,其愿意主動降低的噪聲△n可表示為:
式中:W代表降噪度調(diào)整參數(shù)。數(shù)據(jù)請求者根據(jù)數(shù)據(jù)提供者的不同類型提供不同合同包,提供者可根據(jù)自己實際隱私價值自由接收或拒絕任何類型的合同[7]。若提供者拒絕接受合同,則將調(diào)按△n的最小取值為0,也就意味著不愿意妥協(xié)降低任何噪聲。
由于在數(shù)據(jù)交易的過程中,消費者無法掌握數(shù)據(jù),處于相對劣勢地位,因此本研究針對這一問題,建立了數(shù)據(jù)交易信任評估方案,用于對數(shù)據(jù)交易中間人的行為進行評估。針對不誠實的數(shù)據(jù)中間人將在交易前將其過濾。數(shù)據(jù)交易信任評估體系的建立,結(jié)合有效分交易記錄和評分相似度推薦,產(chǎn)生一個信任值tm,c,tm,c的取值在0~1 之間。tm,c取值越高,則說明對應節(jié)點在數(shù)據(jù)交易過程中越積極、越誠實、越具有權威性[8]。每個數(shù)據(jù)交易中間人的信任度均通過服務器根據(jù)區(qū)塊鏈中內(nèi)容計算得出,在每一輪交易結(jié)束后自動更新。對于任意一個數(shù)據(jù)交易中間人,其與任意數(shù)據(jù)消費者在歷史記錄當中的交互次數(shù)可以用行為交互矩陣的形式表示:
消費者對中間人的評價在交互之后進行,若消費者對此次交易數(shù)據(jù)滿意,則評價值較高,信任度較高;反之,若消費者對此次交易數(shù)據(jù)不滿意,則評價值較低,信任度較低,以此實現(xiàn)對數(shù)據(jù)交易信任的評估。圖2 為信任與數(shù)據(jù)質(zhì)量之間的關系曲線。
圖2 信任與數(shù)據(jù)質(zhì)量之間的關系曲線
高信用值的中間人可以分配質(zhì)量更高的數(shù)據(jù),這是由于信用值意味著其侵權轉(zhuǎn)售的概率更低,添加的噪聲更少。
在完成對數(shù)據(jù)交易信任的評估后,已經(jīng)將惡意中間人排除。在此基礎上,模擬一個理性中間人和理性消費者進行數(shù)據(jù)交易,并在其建議的過程中,簽訂基于信任驅(qū)動的數(shù)據(jù)交易合同。中間人作為消費者提供不同的合同,消費者選擇最適合其自身偏好的合同。該合同包是離散的,不同的數(shù)據(jù)激勵對應不同類型服務。偏好類型越高,則說明接收的意愿越大。偏好類型按照升序排列表示為:
式中:N代表偏好類型種類?;谛湃悟?qū)動的數(shù)據(jù)交易合同設計的目的是吸引消費者接收數(shù)據(jù),獲取更大利潤。中間人自我揭示能夠提高數(shù)據(jù)質(zhì)量?;谛湃悟?qū)動的數(shù)據(jù)交易合同必須為偏好類型更高的消費者提供更高效用。將合同制定用一對函數(shù)表示為:
式中:Γ 代表數(shù)據(jù)交易合同;Q(xi)代表消費者提供數(shù)據(jù)質(zhì)量;T(xi)代表數(shù)據(jù)占用資源。合同表明,只有高質(zhì)量的數(shù)據(jù),才能吸引更多的消費者,而高質(zhì)量的數(shù)據(jù)和其自身的信任度有關,越高的數(shù)據(jù)提供者,越容易得到噪音越小的數(shù)據(jù),也就越容易與消費者進行高質(zhì)量的數(shù)據(jù)交換。反之,如果數(shù)據(jù)提供商的信任度較低,則很難在DTN 內(nèi)找到與其進行交易的消費者。此外,由于用戶對數(shù)據(jù)提供者的感知能力,其對消費者的感知能力將產(chǎn)生較大的影響。
為滿足數(shù)據(jù)交易中的安全保障需求,實現(xiàn)對數(shù)據(jù)交易中的安全訪問按制,應明確在數(shù)據(jù)安全訪問按制過程中,主要參與對象有三個,分別為USER、CDC、TPA,同理,安全訪問按制方案的初始化也需要所提出三個部分的協(xié)同作業(yè),對方案初始化過程進行描述,見圖3。
圖3 安全訪問按制方案初始化過程
對安全訪問按制方案初始化的具體步驟進行描述:USER 需要根據(jù)數(shù)據(jù)交易的請求,向CDC 提出對應的交易數(shù)據(jù)存儲文件訪問請求,此時,CDC 根據(jù)交易數(shù)據(jù)文件的類型,生成加密密鑰,進行“數(shù)據(jù)交易”過程中相關文件的加密處理。由CDC 進行“數(shù)據(jù)交易”文件的分塊處理,處理時,需要進行文件根節(jié)點、Merkle Hash Tree 構(gòu)造樹的計算等。完成計算后,由CDC 進行Pkey Gen()函數(shù)的調(diào)用,使用Pkey Gen()函數(shù)生成“數(shù)據(jù)交易”文件的公開參數(shù),同時,再由CDC進行Mkey Gen()函數(shù)的調(diào)用,使用Mkey Gen()函數(shù)生成“數(shù)據(jù)交易”文件的主密鑰。完成主密鑰的生成后,根據(jù)“數(shù)據(jù)交易”文件的實際權限,提取文件中的關鍵屬性信息,整理屬性信息成為一個集合,將集合按照文件列表排列,生成對應的屬性列表。
當終端接收到對應的信息或數(shù)據(jù)后,需要調(diào)用Skey Gen()函數(shù),進行文件的解密處理,完成以上相關操作后,將不同的交易數(shù)據(jù)與文件數(shù)據(jù),按照對應的網(wǎng)絡通信信道進行傳輸,當文件數(shù)據(jù)傳輸?shù)絋PA 時,由TPA 進行數(shù)據(jù)交易文件副本的保存,以備后續(xù)相關人員對文件的查驗與追溯。
在上述內(nèi)容的基礎上,為進一步保障數(shù)據(jù)交易過程中相關文件、信息的安全性,引進第三方數(shù)據(jù)交易審計機構(gòu),由此機構(gòu)進行數(shù)據(jù)交易中文件的訪問管理,在此過程中要注意,交易的數(shù)據(jù)文件中,只有USER,具有對交易數(shù)據(jù)的“寫”操作權限,當USER 對交易數(shù)據(jù)進行更改后,擁有權限的USER 私鑰會隨著Merkle Hash Tree 構(gòu)造結(jié)構(gòu)的改變從而發(fā)生變化,此時,所有USER 對交易數(shù)據(jù)的操作權限都將發(fā)生變化或?qū)⒈恢匦率谟琛?/p>
當USER 提出交易數(shù)據(jù)的訪問需求后,CDC 將USER 提出的請求轉(zhuǎn)交,轉(zhuǎn)交信息傳輸?shù)絋PA,由TPA進行處理,TPA 需要在確定了USER 的身份后,根據(jù)USER 的權限進行私鑰的重新分發(fā)。如果USER 仍擁有此部分交易數(shù)據(jù)或文件的訪問權限,TPA 需要為USER 重新分配對應文件的密鑰,以便于USER 能夠及時對數(shù)據(jù)交易文件進行操作,如不符合上述要求,TPA 會拒絕USER 的請求,此過程見圖4。
圖4 數(shù)據(jù)交易中文件的安全訪問與權限變更
在具體交易過程中,將根據(jù)USER 最后一次執(zhí)行交易數(shù)據(jù)的時間節(jié)點,進行文件訪問按制權限的調(diào)整,總之,所有與數(shù)據(jù)交易相關的安全訪問按制與權限變更,都需要與按制樹結(jié)構(gòu)共同決定。為排除相關因素的影響,避免USER 識別或讀取到臟數(shù)據(jù),需要在具體的工作中,結(jié)合實際情況,進行交易文件屬性的標識,通過此種方式,進行數(shù)據(jù)交易權限的合理化分配與規(guī)范化管理。綜合上述內(nèi)容,實現(xiàn)數(shù)據(jù)交易中文件的安全訪問與權限變更。
在當今的信息化社會中,數(shù)據(jù)是一種極其重要的資源,其深刻地影響著人們的生產(chǎn)和生活。在醫(yī)療領域中,通過對醫(yī)學大數(shù)據(jù)進行分析,可以為醫(yī)生提供類似的病例癥狀以及治療方案,進而為醫(yī)生提供醫(yī)療方面的參考,幫助醫(yī)生治療、診斷,提高醫(yī)療水平、效率。在交通領域,利用交通數(shù)據(jù),可以幫助城市進行智慧交通的運營,為城市交通規(guī)劃提供資源基礎和技術支撐。因此,如何從數(shù)據(jù)中挖掘出更多的信息,使其發(fā)揮最大的價值,并打破數(shù)據(jù)“孤島”的局面,已成為目前數(shù)據(jù)挖掘領域的一個熱門課題,而“數(shù)據(jù)交易”作為一種全新的數(shù)據(jù)共享方案,也受到了諸多研究領域的關注。
為全面落實并推進此項工作,本研究對“數(shù)據(jù)交易”中的安全關鍵技術展開了設計研究。通過此次的研究,明確了數(shù)據(jù)交易過程中文件、數(shù)據(jù)、信息安全的重要性,為實現(xiàn)對與之方面相關工作的進一步優(yōu)化,可以在現(xiàn)有內(nèi)容的基礎上,嘗試將數(shù)據(jù)交易過程中轉(zhuǎn)移到計算機環(huán)境下,通過對交易過程的按制,實現(xiàn)對相關方面工作予以保障,進而為企業(yè)交易、社會生產(chǎn)、產(chǎn)業(yè)發(fā)展等提供全面的指導與技術支持。