王柯文,楊亞夢
(鄭州航空工業(yè)管理學(xué)院信息管理學(xué)院,河南 鄭州 450046)
近年來,云計算、大數(shù)據(jù)、人工智能、區(qū)塊鏈等信息技術(shù)的不斷發(fā)展,為數(shù)字圖書館帶來高速發(fā)展的機遇。館藏數(shù)字資源是圖書館的重要組成部分,也是圖書館的服務(wù)之本。目前,數(shù)字資源的所有權(quán)一直控制在出版商或數(shù)據(jù)庫商手中[1],尤其是外文數(shù)據(jù)庫存在嚴(yán)重壟斷情況,圖書館每年要花費高昂的成本購買各種數(shù)據(jù)庫,完全處于劣勢地位。另外,數(shù)字圖書館由于管理理念、體系架構(gòu)、服務(wù)機制的不同,缺乏信息資源的合作,造成顯著的“信息孤島”現(xiàn)象[2]。因此,解決數(shù)字資源壟斷以及打破“信息孤島”現(xiàn)象,實現(xiàn)數(shù)字資源自由流通與共享仍是當(dāng)前數(shù)字圖書館發(fā)展中需要解決的問題。
區(qū)塊鏈概念一經(jīng)提出,就受到社會各界的關(guān)注,已是目前信息技術(shù)發(fā)展最前沿應(yīng)用。目前,區(qū)塊鏈技術(shù)應(yīng)用已從貨幣金融領(lǐng)域擴展到醫(yī)療衛(wèi)生、教育、文化等領(lǐng)域。本文將區(qū)塊鏈技術(shù)與數(shù)字圖書館相結(jié)合,利用公有鏈、私有鏈以及聯(lián)盟鏈構(gòu)建高校圖書館數(shù)字資源共建共享整體架構(gòu),分析圖書館數(shù)字資源的購買方式以及資源安全共享的有效途徑,以期為解決數(shù)字資源建設(shè)問題提供新思路。
2008年,中本聰發(fā)表的論文《比特幣:一種點對點的電子現(xiàn)金系統(tǒng)》[3]中首次提出區(qū)塊鏈的概念。區(qū)塊鏈涉及數(shù)學(xué)、密碼學(xué)、互聯(lián)網(wǎng)和計算機等多種學(xué)科,是分布式數(shù)據(jù)存儲、時間戳、共識機制、非對稱加密算法、智能合約等計算機技術(shù)的新型應(yīng)用模式[4]。相比其他的信息技術(shù),區(qū)塊鏈技術(shù)具有去中心化、去信任化、匿名性、安全性、開放性、不可篡改等特征[5],它實現(xiàn)了不需要一個中心機構(gòu)或者第三方監(jiān)管機構(gòu)來協(xié)調(diào)、驗證交易活動,能夠在多利益主體參與的場景下以低成本的方式構(gòu)建信任基礎(chǔ)。也正是區(qū)塊鏈的這些特性能為數(shù)字資源建設(shè)與共享帶來新思路。
目前,區(qū)塊鏈技術(shù)按照開放程度可以分為公有鏈、私有鏈、聯(lián)盟鏈等類型[6]。公有鏈?zhǔn)侵溉魏蝹€人或團體都能自由參與,且能夠獲得區(qū)塊鏈的有效確認(rèn),任何人都可以參與其共識過程;私有鏈的寫入權(quán)限僅限于組織內(nèi)部,可以是一個公司,也可以是個人,讀取權(quán)限有限開放;聯(lián)盟鏈的參與主體由構(gòu)建區(qū)塊鏈群體內(nèi)部指定,其他任何人可以通過區(qū)塊鏈開放的API進行限定查詢。
目前,圖書館領(lǐng)域不少學(xué)者針對區(qū)塊鏈做了一系列研究與探索。區(qū)塊鏈雖然誕生于貨幣金融領(lǐng)域,但區(qū)塊鏈技術(shù)在圖書館領(lǐng)域同樣也有發(fā)展?jié)摿η覂?yōu)勢明顯,“圖書館+區(qū)塊鏈”是發(fā)展的新方向[7]。牛勇等人基于區(qū)塊鏈從數(shù)字資源、紙本資源、知識產(chǎn)權(quán)角度分析圖書館的資源建設(shè)[8];柳子琳等人探討了區(qū)塊鏈技術(shù)對于個人信息保護的適用性[9],并且能幫助圖書館移動用戶行為大數(shù)據(jù)挖掘?qū)崿F(xiàn)從網(wǎng)絡(luò)信息服務(wù)向價值服務(wù)的轉(zhuǎn)變[10],進一步推動圖書館服務(wù)升級[11]。
從具體的應(yīng)用層面看,張忠林等人分析了區(qū)塊鏈技術(shù)在信息共享、版權(quán)保護、身份認(rèn)證、資源存儲、網(wǎng)絡(luò)眾籌五大應(yīng)用場景[12]??梢妼W(xué)者針對區(qū)塊鏈技術(shù)在圖書館各業(yè)務(wù)領(lǐng)域的應(yīng)用進行了積極探索,涉及圖書館的各個方面。在服務(wù)方面,學(xué)者探討了圖書館基于區(qū)塊鏈技術(shù)閱讀云平臺的構(gòu)建[13]、智慧閱讀平臺的構(gòu)建[14]、智慧服務(wù)的應(yīng)用[15]、隱性知識采集[16]、機構(gòu)數(shù)據(jù)庫中的應(yīng)用[17];在資源共建共享方面,學(xué)者探討了基于區(qū)塊鏈的高校圖書館館藏資源建設(shè)[18]、文獻采購[19]、電子書出版交易[20]45、基于聯(lián)盟鏈的信息資源共享[21];在信息保護方面,學(xué)者探討了基于區(qū)塊鏈技術(shù)數(shù)字版權(quán)管理[20]46、用戶隱私保護[22]等方面的應(yīng)用。
上述研究成果為研究區(qū)塊鏈技術(shù)在高校圖書館數(shù)字資源共建共享的應(yīng)用提供了借鑒,但現(xiàn)有關(guān)區(qū)塊鏈技術(shù)的數(shù)字資源共建共享方面研究在整體上較為分散,沒有將圖書館數(shù)字資源的建設(shè)與共享結(jié)合起來研究,本文將高校圖書館數(shù)字資源的建設(shè)與共享相結(jié)合,構(gòu)建圖書館數(shù)字資源共建共享整體架構(gòu),為數(shù)字圖書館的建設(shè)提供新思路。
本文將區(qū)塊鏈技術(shù)與數(shù)字圖書館相結(jié)合,構(gòu)建高校圖書館數(shù)字資源建設(shè)的整體架構(gòu)(如圖1所示):該架構(gòu)從數(shù)字資源的公有鏈、高校圖書館私有鏈以及高校圖書館的聯(lián)盟鏈三個方面進行研究。
圖1 高校圖書館數(shù)字資源建設(shè)的整體架構(gòu)
數(shù)字資源公有鏈?zhǔn)怯糜谡细咝D書館的數(shù)字資源信息。公有鏈去中心化的特點,可以實現(xiàn)作者直接與圖書館完美對接,圖書館可以通過區(qū)塊鏈實現(xiàn)“圖書館-作者”購買模式(如圖2所示),向作者直接購買,無須任何第三方的參與。作者在完成創(chuàng)作后,可自行上傳至公有鏈。公有鏈基于智能合約技術(shù)對其內(nèi)容、格式、結(jié)構(gòu)以及版權(quán)等進行審查,對于審查不通過的予以退回,并告知作者,以保障數(shù)字資源質(zhì)量。對于審查通過的資源進行版權(quán)登記確認(rèn),資源登記確認(rèn)后自動傳輸給知識產(chǎn)權(quán)管理部門備案,并將資源加蓋時間戳存儲在數(shù)字資源數(shù)據(jù)庫中。
圖2 “圖書館-作者”購買模式
私有鏈具有完全中心化的特點,適用于機構(gòu)內(nèi)部數(shù)據(jù)管理,中心機構(gòu)控制寫入權(quán)限,選擇性對外開放讀取權(quán)限,并且能夠防止數(shù)據(jù)被篡改。高校圖書館私有鏈數(shù)字資源管理機制如圖3所示。
圖3 高校私有鏈數(shù)字資源管理機制
將購買的公有鏈數(shù)據(jù)庫中的數(shù)字資源加密上傳至高校圖書館私有鏈上,寫入權(quán)限歸高校圖書館所有。同時,圖書館還可以通過智能合約選擇性地對資源使用者開放讀取權(quán)限。如高校圖書館可以選擇僅對本校師生開放讀取權(quán)限,或者對全體社會人員開放讀取權(quán)限等。用戶接入圖書館私有鏈?zhǔn)紫冗M行權(quán)限驗證,符合圖書館開放讀取權(quán)限的用戶持密鑰和私有鏈上的元數(shù)據(jù)向高校圖書館中心機構(gòu)發(fā)送請求,中心機構(gòu)通過對請求中資源信息解密并在數(shù)據(jù)庫檢索,之后將真實資料提取給用戶。另外,高校圖書館還能將使用本館數(shù)字資源用戶的相關(guān)行為數(shù)據(jù)存儲在私有鏈上,這些數(shù)據(jù)包括用戶檢索數(shù)據(jù)、瀏覽數(shù)據(jù)、下載數(shù)據(jù)等。這些行為數(shù)據(jù)指導(dǎo)本館館藏資源采購、管理,是圖書館大數(shù)據(jù)分析的基礎(chǔ)。通過對用戶的行為數(shù)據(jù)分析,為用戶提供更好的個性化服務(wù)。
聯(lián)盟鏈的參與主體由構(gòu)建區(qū)塊鏈群體內(nèi)部組織或個人確定,通過確認(rèn)后的新節(jié)點才能加入聯(lián)盟鏈,它具有部分中心化的特點。過多的高校圖書館加入聯(lián)盟鏈會影響聯(lián)盟鏈整體運行效率,因此可以按照地域劃分選出每個地域具有代表性的高校作為高校圖書館聯(lián)盟鏈的成員。為保證數(shù)字資源安全共享,高校圖書館將數(shù)字資源的元數(shù)據(jù)上傳至聯(lián)盟鏈上,將真實數(shù)字資源儲存至數(shù)據(jù)庫。其他高校圖書館要獲得該數(shù)字資源,需要通過身份認(rèn)證之后發(fā)送請求至數(shù)字圖書館聯(lián)盟服務(wù)層,服務(wù)層通過對請求中資源信息解密生成哈希值,根據(jù)哈希值在數(shù)據(jù)庫檢索,獲得真實數(shù)字資源存儲位置,提取資料,整理傳給需求方,從而獲取真實數(shù)據(jù)資源,再將真實數(shù)字資源存儲在高校圖書館私有鏈上,有效保障數(shù)字資源在高校圖書館間安全共享。其數(shù)字資源共享過程如圖4所示。
圖4 數(shù)字圖書館資源共享過程
該模型利用區(qū)塊鏈技術(shù)實現(xiàn)圖書館直接向作者購買數(shù)字資源,圖書館充當(dāng)了為讀者實現(xiàn)聯(lián)合資源購買的角色。同時,公有鏈開放性的特點能夠有效擴大數(shù)字圖書館數(shù)字資源的來源量,并且利用智能合約技術(shù)有效保證資源質(zhì)量,更好地為讀者服務(wù)。圖書館可以根據(jù)本館的特色購買特定的資源,打破傳統(tǒng)“打包”購買模式,降低了圖書館采購資源的成本。此外,數(shù)字圖書館還可以從數(shù)字圖書館聯(lián)盟鏈獲取本館所需數(shù)字資源,無須采購,只要按照聯(lián)盟鏈上的協(xié)議進行操作即可,極大降低了圖書館的采購成本。
該模型利用區(qū)塊鏈技術(shù)能夠很好地解決數(shù)字資源版權(quán)問題。首先,不管是接入公有鏈的作者、接入高校圖書館私有鏈的用戶還是接入高校圖書館聯(lián)盟鏈的高校,其身份信息必須公開透明,且不可篡改,保證了身份信息的真實性和準(zhǔn)確性。其次,作者提供的數(shù)字資源在進行版權(quán)確認(rèn)登記后,所有用戶均可見版權(quán)信息,保證數(shù)字資源版權(quán)的獨特性與權(quán)威性。另外,通過時間戳保證鏈上數(shù)字資源可追溯,避免重復(fù)資源的上傳登記以及傳統(tǒng)資源交易中出現(xiàn)的版權(quán)糾紛問題,從而保障資源所有者權(quán)益。最后,在私有鏈和聯(lián)盟鏈上,只有被授權(quán)的用戶才能通過密鑰解密出真實資源,獲取真實數(shù)字資源,有效保護數(shù)字資源版權(quán)。
數(shù)字資源的安全性體現(xiàn)在數(shù)字資源的完整性、不可篡改性等方面。區(qū)塊鏈采用分布式存儲技術(shù)能夠?qū)崿F(xiàn)圖書館數(shù)字資源多重備份,這樣極大保證了數(shù)字資源的完整性。另外,區(qū)塊鏈上出現(xiàn)的交易信息均是由建立在非對稱加密算法之上的分布式共識機制來完成的,使數(shù)據(jù)信息一旦寫入就無法篡改。而私有鏈和聯(lián)盟鏈真實數(shù)據(jù)資源訪問開放權(quán)限由高校圖書館和聯(lián)盟鏈成員控制,沒有其授權(quán)信息無法從數(shù)據(jù)庫提取出真實數(shù)據(jù)資源,從而保證了數(shù)字資源的安全。
數(shù)字圖書館元數(shù)據(jù)互操作性是指由不同的組織制定與管理且技術(shù)規(guī)范不盡相同的元數(shù)據(jù)環(huán)境下,要向用戶提供一個統(tǒng)一的數(shù)據(jù)檢索界面,確保系統(tǒng)對用戶的一致性服務(wù)[23]。而該模型中的聯(lián)盟鏈很好地解決了這一問題。聯(lián)盟鏈中的數(shù)據(jù)共享是通過哈希值來進行的,查找真實數(shù)字資源位置是通過哈希值計算來識別對應(yīng)交易區(qū)塊的。哈希值能夠?qū)⒉煌枋鲶w系的元數(shù)據(jù)統(tǒng)一起來,實現(xiàn)不同元數(shù)據(jù)體系下元數(shù)據(jù)之間的交換。這就使得異構(gòu)圖書館元數(shù)據(jù)方面達成統(tǒng)一標(biāo)準(zhǔn),保證數(shù)字圖書館館間互操作性,從而打破“信息孤島”現(xiàn)象。
本文基于區(qū)塊鏈技術(shù)構(gòu)建了圖書館數(shù)字資源建設(shè)共享整體架構(gòu),利用區(qū)塊鏈分布式存儲、共識機制、智能合約等技術(shù)以及去中心化、不可篡改等特點,滿足作者與高校圖書館資源之間購買關(guān)系需要以及高校圖書館和資源使用者之間、高校與高校之間的數(shù)字資源自由流通、安全共享,打破“信息孤島”。