劉靜
摘要:為解決科學(xué)數(shù)據(jù)共享時(shí)容易產(chǎn)生數(shù)據(jù)泄露和不可用的問題,文章設(shè)計(jì)了基于區(qū)塊鏈的圖書館科學(xué)數(shù)據(jù)安全共享機(jī)制。首先,在數(shù)據(jù)安全共享模型方面,設(shè)計(jì)了科學(xué)數(shù)據(jù)安全共享體系架構(gòu),包括數(shù)據(jù)源、從區(qū)塊鏈、主區(qū)塊鏈、數(shù)據(jù)存儲(chǔ)平臺(tái)、認(rèn)證服務(wù)5個(gè)模塊,對(duì)主從區(qū)塊鏈、數(shù)據(jù)存儲(chǔ)平臺(tái)的關(guān)鍵技術(shù)進(jìn)行了詳細(xì)設(shè)計(jì),從技術(shù)層面保障了科學(xué)數(shù)據(jù)的安全性和不可篡改性;其次,在數(shù)據(jù)的安全共享機(jī)制方面,設(shè)計(jì)了安全便捷的數(shù)據(jù)共享機(jī)制,包括科研人員注冊(cè)、科學(xué)數(shù)據(jù)存儲(chǔ)、本圖書館科學(xué)數(shù)據(jù)共享、跨圖書館科學(xué)數(shù)據(jù)共享4個(gè)流程;最后,從數(shù)據(jù)使用方面對(duì)機(jī)制的性能進(jìn)行了分析,驗(yàn)證了該機(jī)制具有較高的安全性和便捷性。
關(guān)鍵詞:圖書館;科學(xué)數(shù)據(jù);數(shù)據(jù)共享;數(shù)據(jù)安全;區(qū)塊鏈
中圖分類號(hào):TN919.3文獻(xiàn)標(biāo)志碼:A
0 引言
近年來,國(guó)家對(duì)創(chuàng)新發(fā)展越來越重視,科學(xué)技術(shù)研究成果的數(shù)量和質(zhì)量得到快速提升。在科學(xué)研究過程中,科研人員產(chǎn)出大量研究成果的同時(shí),也積累了大量的科學(xué)研究數(shù)據(jù)(以下簡(jiǎn)稱“科學(xué)數(shù)據(jù)”)??茖W(xué)數(shù)據(jù)對(duì)科研人員來說是研究的必要工具,對(duì)政府部門來說是制定科學(xué)決策的重要依據(jù)[1-2]??茖W(xué)數(shù)據(jù)的重復(fù)使用和共享已成為學(xué)術(shù)界研究的重要內(nèi)容[3]。只瑩瑩[4]從數(shù)據(jù)中臺(tái)的戰(zhàn)略思維出發(fā),設(shè)計(jì)了基于數(shù)據(jù)中臺(tái)的圖書館數(shù)據(jù)共享架構(gòu)。李洋等[5]對(duì)清華、北大等我國(guó)一流大學(xué)的科學(xué)數(shù)據(jù)共享平臺(tái)發(fā)展現(xiàn)狀進(jìn)行了介紹。申雪倩[6]對(duì)圖書館數(shù)據(jù)共享中存在的問題進(jìn)行了分析,并提出了針對(duì)性的發(fā)展策略。上述從理論視角對(duì)科學(xué)數(shù)據(jù)重復(fù)利用和共享問題進(jìn)行了分析,并提出了針對(duì)性的策略[4-6]。但是,如何解決科學(xué)數(shù)據(jù)共享過程中的安全問題,并沒有給出較好的解決辦法。為解決此問題,牛勇等[7]和周耀[8]提出將區(qū)塊鏈技術(shù)應(yīng)用到圖書館數(shù)據(jù)安全管理領(lǐng)域,并給出了應(yīng)用發(fā)展策略。孫紅亮等[9]基于區(qū)塊鏈技術(shù)設(shè)計(jì)了科學(xué)數(shù)據(jù)共享的架構(gòu),并分析了該架構(gòu)在資源利用和服務(wù)效率方面的性能。只瑩瑩[10]將5G技術(shù)與區(qū)塊鏈技術(shù)進(jìn)行融合,提出了多種信息技術(shù)融合的圖書館服務(wù)平臺(tái)。張雪媛等[11]和張新鳳[12]分別從通用科學(xué)數(shù)據(jù)和醫(yī)學(xué)科學(xué)數(shù)據(jù)兩個(gè)維度,設(shè)計(jì)了圖書館數(shù)據(jù)共享平臺(tái)的建設(shè)和管理策略。
從文獻(xiàn)分析可知,區(qū)塊鏈技術(shù)已成為科學(xué)數(shù)據(jù)共享的一項(xiàng)關(guān)鍵技術(shù),得到了學(xué)術(shù)界的一致認(rèn)可[9-12]。但是,當(dāng)前研究缺少對(duì)科學(xué)數(shù)據(jù)共享如何實(shí)現(xiàn)的具體機(jī)制的設(shè)計(jì)和分析,導(dǎo)致數(shù)據(jù)共享過程中數(shù)據(jù)泄露和共享難的問題不能被很好地解決。因此,本文設(shè)計(jì)了科學(xué)數(shù)據(jù)安全共享體系架構(gòu),基于該架構(gòu)設(shè)計(jì)了安全、便捷的數(shù)據(jù)共享機(jī)制,并且通過具體的數(shù)據(jù)使用情況,驗(yàn)證了該機(jī)制具有較高的安全性和便捷性。
1 科學(xué)數(shù)據(jù)安全共享體系架構(gòu)
本文提出科學(xué)數(shù)據(jù)安全共享體系架構(gòu),如圖1所示。該體系架構(gòu)主要包括數(shù)據(jù)源、從區(qū)塊鏈、主區(qū)塊鏈、數(shù)據(jù)存儲(chǔ)平臺(tái)、認(rèn)證服務(wù)5個(gè)模塊。
數(shù)據(jù)源模塊由科研人員生成數(shù)據(jù),并按照科學(xué)數(shù)據(jù)管理規(guī)范,對(duì)數(shù)據(jù)進(jìn)行規(guī)范化處理,從而滿足科學(xué)數(shù)據(jù)訪問和共享的要求。從區(qū)塊鏈模塊由單個(gè)高校的圖書館進(jìn)行創(chuàng)建和維護(hù),主要工作是對(duì)本機(jī)構(gòu)科研人員的身份進(jìn)行認(rèn)證、對(duì)科學(xué)數(shù)據(jù)進(jìn)行安全管理,從區(qū)塊鏈中的節(jié)點(diǎn)由單個(gè)高校的科研人員節(jié)點(diǎn)構(gòu)成。主區(qū)塊鏈模塊由多個(gè)高校的圖書館共同創(chuàng)建和維護(hù),主要工作是對(duì)聯(lián)盟高校的圖書館數(shù)據(jù)進(jìn)行安全共享。主區(qū)塊鏈中的節(jié)點(diǎn)由聯(lián)盟鏈中的高校圖書館關(guān)鍵節(jié)點(diǎn)構(gòu)成。數(shù)據(jù)存儲(chǔ)平臺(tái)模塊采用分布式存儲(chǔ)技術(shù),實(shí)現(xiàn)科學(xué)數(shù)據(jù)的安全存儲(chǔ)。認(rèn)證服務(wù)模塊與從區(qū)塊證書服務(wù)器、主區(qū)塊證書服務(wù)器進(jìn)行協(xié)作,完成從區(qū)塊鏈和主區(qū)塊鏈的身份認(rèn)證服務(wù)。其中,從區(qū)塊鏈認(rèn)證服務(wù)器主要完成單個(gè)圖書館內(nèi)部科研人員數(shù)據(jù)的域內(nèi)認(rèn)證,主區(qū)塊鏈認(rèn)證服務(wù)器主要完成多個(gè)圖書館之間數(shù)據(jù)共享時(shí)科研人員數(shù)據(jù)的域間共享。
2 數(shù)據(jù)安全共享機(jī)制
2.1 科研人員注冊(cè)
為實(shí)現(xiàn)科學(xué)數(shù)據(jù)的訪問和共享,科研人員在數(shù)據(jù)共享平臺(tái)上注冊(cè)是實(shí)現(xiàn)數(shù)據(jù)共享的第一步工作??蒲腥藛T在平臺(tái)上通過注冊(cè)后,就可以從平臺(tái)上獲取認(rèn)證證書,用于后期數(shù)據(jù)訪問和數(shù)據(jù)共享的認(rèn)證依據(jù)??蒲腥藛T注冊(cè)工作主要在單個(gè)圖書館的從區(qū)塊鏈節(jié)點(diǎn)上完成,為完成關(guān)鍵信息的加密,科研人員生成公鑰和私鑰密鑰對(duì)。
2.2 科學(xué)數(shù)據(jù)存儲(chǔ)
由于科學(xué)數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)安全要求高的特點(diǎn),在科學(xué)數(shù)據(jù)存儲(chǔ)時(shí),采用區(qū)塊鏈平臺(tái)與數(shù)據(jù)存儲(chǔ)平臺(tái)相互結(jié)合存儲(chǔ)的策略。在區(qū)塊鏈平臺(tái),主要存儲(chǔ)數(shù)據(jù)的所有者屬性信息和數(shù)據(jù)指紋信息,用于唯一標(biāo)志數(shù)據(jù)的所有者和數(shù)據(jù)自身屬性信息。在數(shù)據(jù)存儲(chǔ)平臺(tái),按照數(shù)據(jù)管理規(guī)范對(duì)數(shù)據(jù)進(jìn)行分布式存儲(chǔ)。
在區(qū)塊鏈平臺(tái)存儲(chǔ)數(shù)據(jù)屬性信息時(shí),科研人員先要使用證書服務(wù)器發(fā)送的證書進(jìn)行身份驗(yàn)證。身份驗(yàn)證通過后,科研人員將身份信息、數(shù)據(jù)指紋信息、數(shù)據(jù)加密密鑰、數(shù)據(jù)使用權(quán)限進(jìn)行簽名,將數(shù)據(jù)信息和簽名信息保存到區(qū)塊鏈節(jié)點(diǎn)。在數(shù)據(jù)存儲(chǔ)平臺(tái)存儲(chǔ)數(shù)據(jù)信息時(shí),科研人員使用公鑰對(duì)待存儲(chǔ)的數(shù)據(jù)進(jìn)行加密,可以提升數(shù)據(jù)存儲(chǔ)的安全性。數(shù)據(jù)的編號(hào)為數(shù)據(jù)指紋信息,可以實(shí)現(xiàn)數(shù)據(jù)的全局唯一性。
2.3 本圖書館的科學(xué)數(shù)據(jù)共享
本圖書館的科學(xué)數(shù)據(jù)共享包括使用者身份認(rèn)證、使用者權(quán)限判斷、獲取數(shù)據(jù)屬性、獲取數(shù)據(jù)4個(gè)步驟。
在使用者身份認(rèn)證步驟中,使用者向認(rèn)證服務(wù)器發(fā)送自身證書進(jìn)行認(rèn)證請(qǐng)求。認(rèn)證服務(wù)器驗(yàn)證使用者的證書后,要求使用者采用私鑰對(duì)認(rèn)證服務(wù)器生成的隨機(jī)數(shù)進(jìn)行簽名,從而驗(yàn)證使用者身份的真實(shí)性,避免中間人攻擊事件的發(fā)生。在使用者權(quán)限判斷步驟中,身份管理合約根據(jù)使用者的身份,與權(quán)限管理合約協(xié)作,判斷使用者訪問數(shù)據(jù)的權(quán)限。權(quán)限管理合約是使用者對(duì)請(qǐng)求數(shù)據(jù)內(nèi)容訪問權(quán)限的判斷合約,采用指定訪問者身份ID和身份權(quán)限屬性兩種策略。對(duì)于數(shù)據(jù)安全級(jí)別較高的科學(xué)數(shù)據(jù),采用指定訪問者身份ID的策略;對(duì)于安全性級(jí)別低且通過共享數(shù)據(jù)獲得獎(jiǎng)勵(lì)的數(shù)據(jù),采用身份權(quán)限屬性策略進(jìn)行管理。下面以身份權(quán)限屬性進(jìn)行權(quán)限驗(yàn)證為例進(jìn)行說明。在獲取數(shù)據(jù)屬性步驟中,數(shù)據(jù)存儲(chǔ)合約根據(jù)數(shù)據(jù)描述從區(qū)塊鏈中查找數(shù)據(jù)的編號(hào),并將數(shù)據(jù)描述信息發(fā)送使用者進(jìn)行確認(rèn)。當(dāng)數(shù)據(jù)使用者確認(rèn)數(shù)據(jù)存儲(chǔ)合約返回的數(shù)據(jù)為自身需求的數(shù)據(jù),數(shù)據(jù)共享合約將為使用者返回?cái)?shù)據(jù)的屬性數(shù)據(jù),其中包含數(shù)據(jù)在數(shù)據(jù)存儲(chǔ)平臺(tái)中的位置和數(shù)據(jù)哈希值。在獲取數(shù)據(jù)步驟中,使用者根據(jù)數(shù)據(jù)位置和數(shù)據(jù)哈希值向數(shù)據(jù)存儲(chǔ)平臺(tái)請(qǐng)求數(shù)據(jù)。為保障數(shù)據(jù)的安全,數(shù)據(jù)存儲(chǔ)平臺(tái)與使用者進(jìn)行交互時(shí),采用使用者的公鑰對(duì)交互數(shù)據(jù)進(jìn)行加密,從而保障數(shù)據(jù)的安全共享。
2.4 跨圖書館的科學(xué)數(shù)據(jù)共享
跨圖書館的科學(xué)數(shù)據(jù)共享主要用于滿足不同圖書館機(jī)構(gòu)中科研人員的數(shù)據(jù)共享請(qǐng)求。相對(duì)于本圖書館的科學(xué)數(shù)據(jù)共享,跨圖書館的科學(xué)數(shù)據(jù)共享需要主區(qū)塊鏈中的節(jié)點(diǎn)和主區(qū)塊認(rèn)證服務(wù)器互相配合,才能完成數(shù)據(jù)訪問權(quán)限的認(rèn)證和數(shù)據(jù)獲取服務(wù)??鐖D書館的科學(xué)數(shù)據(jù)共享包括使用者身份跨館認(rèn)證、使用者權(quán)限跨館判斷、跨館獲取數(shù)據(jù)屬性、跨館獲取數(shù)據(jù)4個(gè)步驟。
在使用者身份跨館認(rèn)證步驟中,包括使用者身份本館內(nèi)認(rèn)證、使用者身份跨館認(rèn)證兩個(gè)步驟。使用者身份本館內(nèi)認(rèn)證由從區(qū)塊證書服務(wù)器與認(rèn)證服務(wù)器協(xié)作進(jìn)行認(rèn)證;使用者身份跨館認(rèn)證需要主區(qū)塊證書服務(wù)器與認(rèn)證服務(wù)器協(xié)作進(jìn)行認(rèn)證。在使用者權(quán)限跨館判斷步驟中,需要主區(qū)塊鏈中的節(jié)點(diǎn)互相配合完成,當(dāng)使用者身份跨館認(rèn)證通過后,使用者所在圖書館在主區(qū)塊鏈中的節(jié)點(diǎn)作為權(quán)限認(rèn)證的發(fā)起者。發(fā)起者首先在主區(qū)塊鏈中查找被訪問數(shù)據(jù)所在的圖書館節(jié)點(diǎn)(以下稱為“提供者”),提供者調(diào)用權(quán)限管理合約,對(duì)發(fā)起者的權(quán)值進(jìn)行判斷。在跨館獲取數(shù)據(jù)屬性步驟中,提供者按照本館數(shù)據(jù)屬性獲取步驟獲取數(shù)據(jù)屬性后,經(jīng)主區(qū)塊鏈的發(fā)起者節(jié)點(diǎn)轉(zhuǎn)發(fā)給數(shù)據(jù)使用者。數(shù)據(jù)屬性信息由提供者調(diào)用數(shù)據(jù)存儲(chǔ)合約,將數(shù)據(jù)屬性信息提交給發(fā)起者,發(fā)起者再調(diào)用本館的數(shù)據(jù)存儲(chǔ)合約,將數(shù)據(jù)屬性信息轉(zhuǎn)發(fā)給數(shù)據(jù)使用者。在跨館獲取數(shù)據(jù)步驟中,數(shù)據(jù)使用者可以根據(jù)數(shù)據(jù)屬性信息中的數(shù)據(jù)位置和數(shù)據(jù)哈希值向數(shù)據(jù)存儲(chǔ)平臺(tái)請(qǐng)求數(shù)據(jù)。此步驟與本圖書館數(shù)據(jù)共享過程類似。
3 性能分析
為了解本文設(shè)計(jì)的數(shù)據(jù)共享機(jī)制的性能,下面從數(shù)據(jù)的采集、存儲(chǔ)、訪問、共享4個(gè)環(huán)節(jié),分析數(shù)據(jù)共享過程中的安全性和便捷性。
在數(shù)據(jù)采集環(huán)節(jié),科研人員根據(jù)數(shù)據(jù)管理規(guī)范對(duì)數(shù)據(jù)進(jìn)行整理,在數(shù)據(jù)使用時(shí)可以提升數(shù)據(jù)的使用效率。由于科研人員需要經(jīng)過注冊(cè)才能獲得身份認(rèn)證證書,保障了數(shù)據(jù)的規(guī)范性和數(shù)據(jù)來源的安全性。在數(shù)據(jù)存儲(chǔ)環(huán)節(jié),科研人員所在的區(qū)塊鏈節(jié)點(diǎn)會(huì)調(diào)用數(shù)據(jù)存儲(chǔ)管理合約,不需要科研人員進(jìn)行繁雜的操作,就可以方便地對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)。在數(shù)據(jù)存儲(chǔ)時(shí),采用數(shù)據(jù)屬性信息和加密數(shù)據(jù)分開存儲(chǔ)的策略,保障了數(shù)據(jù)使用和數(shù)據(jù)共享的雙重安全認(rèn)證。在數(shù)據(jù)存儲(chǔ)時(shí),使用IPFS技術(shù)可以實(shí)現(xiàn)數(shù)據(jù)的安全、無(wú)冗余存儲(chǔ),也節(jié)約了存儲(chǔ)空間的占用。在數(shù)據(jù)訪問和共享環(huán)節(jié),將數(shù)據(jù)分為本圖書館數(shù)據(jù)和跨圖書館數(shù)據(jù),并且提供了不同的數(shù)據(jù)共享機(jī)制。在圖書館數(shù)據(jù)共享時(shí),采用權(quán)限判斷和數(shù)據(jù)共享激勵(lì)兩種策略,可以提高數(shù)據(jù)共享過程的效率。在跨圖書館數(shù)據(jù)共享時(shí),采用主從區(qū)塊鏈中相關(guān)區(qū)塊節(jié)點(diǎn)共同參與認(rèn)證,就可以實(shí)現(xiàn)跨圖書館數(shù)據(jù)的訪問。在數(shù)據(jù)共享的安全性方面,本圖書館和跨圖書館數(shù)據(jù)訪問時(shí),都需要經(jīng)過認(rèn)證服務(wù)器認(rèn)證才能訪問數(shù)據(jù);訪問數(shù)據(jù)時(shí),需要使用權(quán)限判斷合約和數(shù)據(jù)共享合約進(jìn)行自動(dòng)化權(quán)限判斷,提升數(shù)據(jù)共享的安全性。綜上所述,本文設(shè)計(jì)的機(jī)制在科學(xué)數(shù)據(jù)共享過程中,具有較高的安全性和便捷性。
4 結(jié)語(yǔ)
隨著創(chuàng)新型國(guó)家發(fā)展戰(zhàn)略的實(shí)施,科學(xué)數(shù)據(jù)的重復(fù)使用和共享得到越來越多的圖書館和研究學(xué)者的重視,科學(xué)數(shù)據(jù)的安全、高效共享已成為學(xué)術(shù)界研究的重要內(nèi)容。通過對(duì)已有研究的分析可知,科學(xué)數(shù)據(jù)的共享已經(jīng)取得了非常多的研究成果。但是,仍然缺少如何具體實(shí)現(xiàn)科學(xué)數(shù)據(jù)共享機(jī)制方面的研究成果,導(dǎo)致數(shù)據(jù)共享中的數(shù)據(jù)泄露和共享難的問題不能很好地解決。為此,本文設(shè)計(jì)了科學(xué)數(shù)據(jù)安全共享體系架構(gòu),基于該架構(gòu)設(shè)計(jì)了安全便捷的數(shù)據(jù)共享機(jī)制,并且驗(yàn)證了該機(jī)制具有較高的安全性和便捷性。
參考文獻(xiàn)
[1]陳薇.我國(guó)圖書館科學(xué)數(shù)據(jù)管理研究現(xiàn)狀與趨勢(shì)分析[J].圖書館工作與研究,2020(12):39-47.
[2]石晨.日本大學(xué)圖書館研究數(shù)據(jù)管理服務(wù)探析與啟示[J].新世紀(jì)圖書館,2022(6):83-90.
[3]袁先文,程結(jié)晶.圖書館用戶數(shù)據(jù)共享空間的構(gòu)建及應(yīng)用研究[J].圖書館理論與實(shí)踐,2021(4):113-120.
[4]只瑩瑩.中臺(tái)在國(guó)家圖書館的應(yīng)用思考[J].圖書館論壇,2021(10):76-82.
[5]李洋,溫亮明.我國(guó)高校圖書館科學(xué)數(shù)據(jù)開發(fā)現(xiàn)狀調(diào)研與分析——以一流大學(xué)建設(shè)高校圖書館為例[J].圖書館工作與研究,2021(12):5-15.
[6]申雪倩.大數(shù)據(jù)視角下對(duì)圖書館網(wǎng)絡(luò)信息資源共建共享的研究[J].科技資訊,2022(11):205-207.
[7]牛勇,陳松青.區(qū)塊鏈與圖書館發(fā)展研究[J].圖書館學(xué)研究,2019(4):41-45.
[8]周耀.區(qū)塊鏈技術(shù)在智慧圖書館中的應(yīng)用研究[J].現(xiàn)代情報(bào),2019(4):94-102.
[9]孫紅亮,邵彥坤,潘瑩.區(qū)塊鏈技術(shù)驅(qū)動(dòng)智慧圖書館智慧增值服務(wù)路徑研究[J].2021(10):99-102.
[10]只瑩瑩.5G+區(qū)塊鏈技術(shù)在圖書館智慧服務(wù)中的應(yīng)用研究[J].圖書館工作與研究,2020(10):12-17.
[11]張雪媛,都平平,雷鐳.基于區(qū)塊鏈技術(shù)的科學(xué)實(shí)驗(yàn)數(shù)據(jù)協(xié)同管理研究[J].情報(bào)雜志,2022(8):149-155.
[12]張新鳳.區(qū)塊鏈視域下醫(yī)學(xué)圖書館科學(xué)數(shù)據(jù)共享機(jī)制研究[J].圖書館工作與研究,2022(9):13-18,28.
(編輯 沈 強(qiáng))