李莘 李蕾
(哈爾濱工業(yè)大學(xué)圖書館,黑龍江 哈爾濱 150001)
數(shù)字資源的標(biāo)準(zhǔn)化建設(shè)主要涉及對各項相關(guān)技術(shù)標(biāo)準(zhǔn)的制定和實(shí)施,是關(guān)系到當(dāng)前圖書館資源使用和共享的關(guān)鍵因素。如果不按照標(biāo)準(zhǔn)化建設(shè),數(shù)字資源就容易出現(xiàn)重復(fù)開發(fā)和建設(shè)、重復(fù)投入和使用,造成人力和物力的浪費(fèi),同時造成資源信息的冗余[1]。美國信息學(xué)專家Gail M.Hodge將數(shù)字資源生命周期劃分為創(chuàng)建、資源獲取與集合生成、標(biāo)識與編目、存儲、保存成檔以及檢索與復(fù)用6個階段[2]。因此,數(shù)字資源標(biāo)準(zhǔn)規(guī)范體系的建設(shè)規(guī)劃應(yīng)該圍繞數(shù)字資源生命周期的全過程進(jìn)行。國外關(guān)于數(shù)字資源建設(shè)的標(biāo)準(zhǔn)研究主要集中在對不同標(biāo)準(zhǔn)的理解[3~4]、元數(shù)據(jù)管理與長期保存[5-7],依據(jù)OAIS參考模型構(gòu)建的數(shù)字資源長期保存系統(tǒng)[8],不同國家的長期保存認(rèn)證標(biāo)準(zhǔn)體系情況[2],采用ISO15489系列標(biāo)準(zhǔn)的電子資源呈繳等[8]方面。我國數(shù)字資源建設(shè)標(biāo)準(zhǔn)研究主要包括國家數(shù)字圖書館的數(shù)字資源建設(shè)類、數(shù)字資源發(fā)布與服務(wù)規(guī)范類、數(shù)字資源統(tǒng)計類、數(shù)字資源長期保存規(guī)范類的標(biāo)準(zhǔn)規(guī)范;科技部制訂的《數(shù)字圖書館建設(shè)中標(biāo)準(zhǔn)規(guī)范應(yīng)用指南》《基本元數(shù)據(jù)規(guī)范》《元數(shù)據(jù)擴(kuò)展規(guī)劃》《專門元數(shù)據(jù)規(guī)范》《唯一標(biāo)識符應(yīng)用規(guī)范》等;CALIS管理中心制訂的《中國高等教育數(shù)字圖書館技術(shù)標(biāo)準(zhǔn)與規(guī)范》[9]等。
綜上,國內(nèi)外關(guān)于數(shù)字資源標(biāo)準(zhǔn)體系建設(shè)的研究除國標(biāo)委提出的規(guī)范體系外[9],基本只研究了數(shù)字資源全生命周期中某一階段的標(biāo)準(zhǔn)或者雖然圍繞生命周期階段制訂了標(biāo)準(zhǔn),但是未形成通用的國家標(biāo)準(zhǔn)。因此,筆者提出在圖標(biāo)委擬定的標(biāo)準(zhǔn)規(guī)范體系下,按照全生命周期6階段收集整理現(xiàn)存國內(nèi)外相應(yīng)標(biāo)準(zhǔn)及已出版的國家標(biāo)準(zhǔn)及數(shù)字資源的發(fā)展規(guī)律,以生命周期理論規(guī)劃不同階段的數(shù)字資源建設(shè)標(biāo)準(zhǔn)。
筆者以數(shù)字資源建設(shè)、數(shù)字圖書館、標(biāo)準(zhǔn)等主題詞在中外文數(shù)據(jù)庫進(jìn)行檢索。將檢索結(jié)果利用知識圖譜軟件進(jìn)行解析,以便更加直觀地了解數(shù)字資源標(biāo)準(zhǔn)的國內(nèi)外研究現(xiàn)狀。
以主題=(數(shù)字資源建設(shè)or數(shù)字圖書館)and主題=標(biāo)準(zhǔn),在中國知網(wǎng)中檢索相關(guān)文獻(xiàn)1385篇。該主題發(fā)表文獻(xiàn)的整體趨勢,關(guān)鍵詞出現(xiàn)頻次分布如圖1、2所示。
圖1 中文文獻(xiàn)發(fā)表趨勢分析
圖2 中文文獻(xiàn)主題分布情況(前40個主題詞)
為了進(jìn)一步細(xì)化該領(lǐng)域的研究主題,選取了SATI軟件為該領(lǐng)域文獻(xiàn)繪制了知識圖譜。利用該軟件對所研究主題下的文獻(xiàn)關(guān)鍵詞網(wǎng)絡(luò)做進(jìn)一步的分析,圖3、4分別是對前40個、前100個出現(xiàn)頻率最高的關(guān)鍵詞網(wǎng)絡(luò)的呈現(xiàn)。由關(guān)鍵詞知識圖譜可見,關(guān)于數(shù)字資源建設(shè)的標(biāo)準(zhǔn)研究主要圍繞Marc格式、XML格式、SGML格式、互操作格式、元數(shù)據(jù)等方面,參考的標(biāo)準(zhǔn)主要有ISO、Dublin、Core、Z39.50等。
圖3 中文文獻(xiàn)中前40個關(guān)鍵詞的共現(xiàn)情況
圖4 中文文獻(xiàn)中前100個關(guān)鍵詞的共現(xiàn)情況
對于外文文獻(xiàn),選擇了VOSviewer進(jìn)行關(guān)鍵詞網(wǎng)絡(luò)繪制。選擇Emerald數(shù)據(jù)庫采集樣本,該數(shù)據(jù)庫于1967年由來自世界著名百所商學(xué)院之一Bradford University Management Center的學(xué)者建立。主要出版管理學(xué)、圖書館學(xué)、工程學(xué)等專業(yè)領(lǐng)域的期刊(出版32種圖書館和信息管理學(xué)期刊,其中10種被ISI收錄)。在Emerald數(shù)據(jù)庫以("digital resource*"or"digital library*")and construct*and(standard*or criteria*)為檢索式在任意字段進(jìn)行檢索,共檢出文獻(xiàn)1278篇。在VOSviewer中選擇在題名摘要字段提取關(guān)鍵詞,以共現(xiàn)40次以上的詞匯形成共詞網(wǎng)絡(luò),如圖5所示。
圖5 外文文獻(xiàn)共現(xiàn)40次以上的關(guān)鍵詞共詞網(wǎng)絡(luò)
由圖5可見,外文文獻(xiàn)中關(guān)于數(shù)字資源建設(shè)的標(biāo)準(zhǔn)研究主要涉及對不同標(biāo)準(zhǔn)的理解[3-4]、元數(shù)據(jù)管理與長期保存[5-7]、數(shù)字資源獲取方式[10]、基于云計算范式的圖書館電子書采用標(biāo)準(zhǔn)[11]、比較中外同義詞庫標(biāo)準(zhǔn)[12]、數(shù)字圖書館建設(shè)與管理中涉及的標(biāo)準(zhǔn)[13-14]、OAI標(biāo)準(zhǔn)[15]、數(shù)字資源的保存[16]等方面,研究范圍較為寬泛。
綜上所述,中文文獻(xiàn)中關(guān)于數(shù)字資源建設(shè)的標(biāo)準(zhǔn)研究主要圍繞Marc格式、XML格式、SGML格式、互操作格式、元數(shù)據(jù)等方面,參考的標(biāo)準(zhǔn)主要有ISO、Dublin、Core、Z39.50等。外文文獻(xiàn)對于數(shù)字資源建設(shè)的標(biāo)準(zhǔn)研究主要集中于元數(shù)據(jù)、文獻(xiàn)(館藏)、資源獲取等方面,參考的標(biāo)準(zhǔn)主要有Dublin、OAI等。
以ISO網(wǎng)站及李晶等對ISO數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范體系內(nèi)容體系的總結(jié)[17]、NISO網(wǎng)站頒布的標(biāo)準(zhǔn)、國家數(shù)字圖書館工程建設(shè)標(biāo)準(zhǔn)為對象,對比分析不同國家、機(jī)構(gòu)制訂的標(biāo)準(zhǔn),國內(nèi)外按數(shù)字資源生命周期制定的標(biāo)準(zhǔn)或規(guī)范在數(shù)字資源建設(shè)不同階段的覆蓋情況如下。
主要包括數(shù)字內(nèi)容的編碼標(biāo)準(zhǔn)、對象標(biāo)識標(biāo)準(zhǔn),如ISO10646、GB1803、DOI、EPUB[18]等;WH/T系列包括網(wǎng)絡(luò)資源、圖像、音頻資源、視頻資源、電子連續(xù)性資源、電子圖書、古籍、期刊論文、學(xué)位論文的元數(shù)據(jù)規(guī)范及WH/T52-2012《管理元數(shù)據(jù)規(guī)范》[9]等。
資源獲取與集合生成階段的資源組織管理標(biāo)準(zhǔn) 主 要 包 括 PIE-J、KBART、DOI、ODI、Z39.2、Z39.71[19]等,國內(nèi)標(biāo)準(zhǔn)有WH/T系列射頻識別數(shù)據(jù)模型標(biāo)準(zhǔn)及兩個待審查標(biāo)準(zhǔn)、WH/T47-2012《圖書館數(shù)字資源統(tǒng)計規(guī)范》、WH/T48-2012《數(shù)字對象唯一標(biāo)識符》等[9]。
主要包括ISO15836:2009《信息與文獻(xiàn)-都柏林核心元數(shù)據(jù)元素集》、ISO 23081-1:2017《信息與文獻(xiàn)-文件管理-文件管理過程-元數(shù)據(jù)-第1部分:原則》《第2部分-概念與實(shí)施問題》[17]等涵蓋元數(shù)據(jù)格式、編碼體系、元數(shù)據(jù)置標(biāo)等內(nèi)容的標(biāo)準(zhǔn),GB/T31219系列圖書館館藏資源數(shù)字化加工規(guī)范第2部分:文本資源、第3部分:圖像資源、第5部分:視頻資源及WH/T系列的文本、圖像、音頻數(shù)據(jù)加工規(guī)范[9]。
主要包括DOI、DDA、ISO 14721:2012《空間數(shù)據(jù)和信息傳輸系統(tǒng)》——開放檔案信息系統(tǒng)(OAIS)——參考模型》、WH/T72-2015《圖書館數(shù)字資源長期保存信息包封裝規(guī)范》、WH/Z1-2012《圖書館數(shù)字資源長期保存元數(shù)據(jù)規(guī)范》[9]等。
主要包括ISO 25964-1:2011《信息與文獻(xiàn)-敘詞表及與其他詞表的互操作-第1部分:用于信息檢索的敘詞表》、ISO 25964-2:2013《信息與文獻(xiàn)-詞庫和互操作性與其他詞匯-第2部分:互操作性與其他詞匯》、ISO 10160:2015《信息與文獻(xiàn)-開放系統(tǒng)互連-館際互借應(yīng)用服務(wù)定義》[17]等。
高校圖書館數(shù)字資源的標(biāo)準(zhǔn)化建設(shè)應(yīng)該在圖標(biāo)委框架下以避免出現(xiàn)標(biāo)準(zhǔn)不統(tǒng)一,未來無法與國家標(biāo)準(zhǔn)兼容統(tǒng)一的問題。目前,圖標(biāo)委在數(shù)據(jù)加工、數(shù)字圖書館管理、對象元數(shù)據(jù)規(guī)范、數(shù)字資源長期保存4大類制訂了25項數(shù)字圖書館相關(guān)標(biāo)準(zhǔn),其中22項已發(fā)布[9]。
當(dāng)前,高校圖書館的數(shù)字資源主要包括數(shù)據(jù)庫、電子出版物(電子期刊、電子圖書、光盤等)、網(wǎng)絡(luò)資源、新媒體資源等。數(shù)據(jù)庫包括購買的中外文數(shù)據(jù)庫、自建的數(shù)據(jù)庫(如特色資源庫、學(xué)科導(dǎo)航庫、光盤資源庫、網(wǎng)絡(luò)資源庫、新媒體資源庫等)。對于購買的中外文數(shù)據(jù)庫,可以通過summon等一站式檢索平臺進(jìn)行檢索,其主要的數(shù)字資源建設(shè)問題是長期保存。而自建數(shù)據(jù)庫的問題是系統(tǒng)多樣、操作困難、數(shù)據(jù)兼容性與互操作性差、原始數(shù)據(jù)處理方式不統(tǒng)一等,非常不利于資源的共享。因此,高校圖書館的數(shù)字資源建設(shè)對于不同類型的數(shù)字資源要考慮設(shè)計的標(biāo)準(zhǔn)也不同。
高校圖書館應(yīng)該發(fā)揮CALIS聯(lián)盟共建共享優(yōu)勢,充分考慮用戶使用需求,結(jié)合數(shù)字資源的特性進(jìn)行評估,積極參與圖標(biāo)委標(biāo)準(zhǔn)制訂。在與NISO合作獲得標(biāo)準(zhǔn)翻譯的授權(quán)下,按照圖標(biāo)委籌建中擬定的標(biāo)準(zhǔn)規(guī)范體系,考慮數(shù)字資源全生命周期各個階段標(biāo)準(zhǔn)覆蓋情況,在已完成的25項標(biāo)準(zhǔn)外重點(diǎn)規(guī)劃建設(shè)下列標(biāo)準(zhǔn)。
江蘇師范大學(xué)蒲筱哥等以數(shù)字資源使用績效評價的5個準(zhǔn)則層為基礎(chǔ),構(gòu)建了包括收錄量、學(xué)科覆蓋率、權(quán)威出版物、檢索結(jié)果準(zhǔn)確性、數(shù)字資源適用率、年漲價幅度等23個反映數(shù)字資源使用績效的指標(biāo)層指標(biāo),利用改進(jìn)熵權(quán)法和網(wǎng)絡(luò)分析法相結(jié)合的賦權(quán)模型計算被評價數(shù)字資源使用績效指標(biāo)的組合權(quán)重,并應(yīng)用改進(jìn)TOPSIS模型對各樣本數(shù)字資源使用績效進(jìn)行了實(shí)證分析[20]。張瑩(音譯)調(diào)查來自22個國家學(xué)者對數(shù)字圖書館整體評價指標(biāo)的意見后,建立了數(shù)字圖書館評估模型,用于數(shù)字圖書館的整體評價[21]。Hariri、Nadjla等通過文獻(xiàn)比較研究了數(shù)字圖書館建設(shè)用戶界面的評估標(biāo)準(zhǔn)[22]。上述研究僅涉及數(shù)字資源績效評估標(biāo)準(zhǔn)的部分內(nèi)容,而考慮全生命周期的數(shù)字資源績效評估標(biāo)準(zhǔn)應(yīng)包括數(shù)字圖書館績效評估標(biāo)準(zhǔn)、電子出版物服務(wù)績效評估標(biāo)準(zhǔn)、二次文獻(xiàn)數(shù)據(jù)庫服務(wù)績效標(biāo)準(zhǔn)、自建數(shù)據(jù)庫績效評估標(biāo)準(zhǔn)等。
可參照ISO15489、ISO9000[23]制定包括數(shù)據(jù)資源創(chuàng)建、資源獲取與集合生成、標(biāo)識與編目、存儲、保存成檔以及檢索與復(fù)用6個階段的數(shù)字資源建設(shè)全生命周期管理標(biāo)準(zhǔn)。在管理中避免出現(xiàn)數(shù)據(jù)孤島,規(guī)范數(shù)據(jù)格式,保證資源的完整性,注意數(shù)字資源的版權(quán)保護(hù)問題,提高服務(wù)、管理與建設(shè)效率[24]。
在國際標(biāo)準(zhǔn)基礎(chǔ)上,構(gòu)建中國特色數(shù)字資源長期保存的認(rèn)證標(biāo)準(zhǔn)體系,該體系建設(shè)可參照歐盟的ERPANET電子資源存儲和獲取項目、德國數(shù)字資源長期保存項目Nestor、美國數(shù)字信息設(shè)施保存項目NDIIPP[2]、英國長期保存的應(yīng)用服務(wù)PLANETS和國家數(shù)字記憶、澳大利亞數(shù)字信息長期保存和利用PADI、荷蘭網(wǎng)絡(luò)化歐洲存儲圖書館NEDLIB、日本網(wǎng)絡(luò)信息保存項目WARP、新西蘭聯(lián)合數(shù)字保存戰(zhàn)略JDPS[25]等,這些長期保存項目多由國家圖書館主導(dǎo),而國外很多高校也自主或作為合作方參與到數(shù)字保存項目[25]。在數(shù)字資源長期保存標(biāo)準(zhǔn)建設(shè)中可參照的標(biāo)準(zhǔn)包括OAIS和ISO15489[8]。
作為高校圖書館的協(xié)調(diào)管理部門,CALIS管理中心可以借鑒國家公共文化數(shù)字支撐平臺資源共享系統(tǒng)的數(shù)字資源建設(shè)標(biāo)準(zhǔn)化流程[26],前瞻性地以智慧圖書館[27-28]為研究對象選擇上述尚未建立或者尚不完整的方向與國家圖書館合作制定建設(shè)標(biāo)準(zhǔn)框架體系,組織協(xié)調(diào)聯(lián)盟內(nèi)各高校圖書館參與編撰上述標(biāo)準(zhǔn),完成標(biāo)準(zhǔn)制定后先在聯(lián)盟內(nèi)各成員館中試行相關(guān)標(biāo)準(zhǔn),及時就出現(xiàn)的問題進(jìn)行標(biāo)準(zhǔn)修訂,完成修訂后通過圖標(biāo)委認(rèn)證并報請國家標(biāo)準(zhǔn)化管理委員會批準(zhǔn)成為正式標(biāo)準(zhǔn),推廣并及時組織貫標(biāo)、標(biāo)準(zhǔn)培訓(xùn)等工作,使各成員館可以統(tǒng)一工作標(biāo)準(zhǔn),按照數(shù)字資源全生命周期創(chuàng)建、資源獲取與集合生成、標(biāo)識與編目、存儲、保存成檔以及檢索與復(fù)用的6個階段完成數(shù)字資源的呈繳、管理、長期保存等,同時推進(jìn)聯(lián)盟內(nèi)及與公共圖書館、專業(yè)圖書館的數(shù)字資源共建共享,避免交叉重復(fù)研究。
數(shù)字資源的建設(shè)標(biāo)準(zhǔn)一直是近年國內(nèi)外的研究熱點(diǎn),在標(biāo)準(zhǔn)建設(shè)方面,國內(nèi)仍存在信息互通不暢的問題,筆者主要利用文獻(xiàn)調(diào)研及知識圖譜等方法研究國內(nèi)外已發(fā)表的文獻(xiàn)及相關(guān)標(biāo)準(zhǔn),厘清了數(shù)字資源建設(shè)全生命周期6階段標(biāo)準(zhǔn)覆蓋情況。同時為避免重復(fù)研究,建議高校圖書館數(shù)字資源標(biāo)準(zhǔn)建設(shè)應(yīng)利用CALIS聯(lián)盟優(yōu)勢,與國家圖書館合作,在目前圖標(biāo)委的數(shù)字資源建設(shè)標(biāo)準(zhǔn)框架下查缺補(bǔ)漏,重點(diǎn)選擇6階段中未制訂或制訂不完善的標(biāo)準(zhǔn)如數(shù)字資源績效評估標(biāo)準(zhǔn)、數(shù)字資源建設(shè)全生命周期的管理標(biāo)準(zhǔn)、數(shù)字資源長期保存標(biāo)準(zhǔn)進(jìn)行研究。并且,在標(biāo)準(zhǔn)制定規(guī)劃中要具有前瞻性,充分考慮未來智慧圖書館的發(fā)展需求,力求使研究制訂的標(biāo)準(zhǔn)符合智慧圖書館的發(fā)展需要。