(國家圖書館 北京 100081)
在數(shù)字圖書館發(fā)展新時期和“大數(shù)據(jù)”時代背景下,需要將分散游離于各數(shù)字圖書館之間的資源及服務(wù)進(jìn)行有效集成并協(xié)同,以提高數(shù)字圖書館海量文獻(xiàn)數(shù)據(jù)的處理能力和服務(wù)能力。唯一標(biāo)識符作為數(shù)字資源的條形碼,〔1〕它采用機(jī)器可以識別的一串?dāng)?shù)字描述資源,對數(shù)字資源進(jìn)行統(tǒng)一標(biāo)識,貫穿于數(shù)字資源采集與加工、服務(wù)與保存等環(huán)節(jié),將數(shù)字資源的生命周期的管理進(jìn)一步簡單化、標(biāo)準(zhǔn)化、規(guī)范化。
國外唯一標(biāo)識符技術(shù)經(jīng)過近二十年的發(fā)展,陸續(xù)出現(xiàn)了標(biāo)識互聯(lián)網(wǎng)資源的URI/URN/URL,〔2〕標(biāo)識連續(xù)出版物、圖書等文獻(xiàn)的 SICI〔3〕/BICI〔4〕/PII〔5〕,標(biāo)識數(shù)字對象的 DOI〔6〕等多種形式的標(biāo)識不同載體的唯一標(biāo)識符規(guī)范和應(yīng)用。由于大多標(biāo)識符方案和技術(shù)僅僅定義了標(biāo)識符名稱空間及標(biāo)識符構(gòu)成機(jī)制,尚未形成包含規(guī)范、應(yīng)用、管理等完整的唯一標(biāo)識符服務(wù)體系?;贖andleSystem技術(shù)〔7〕的DOI唯一標(biāo)識符服務(wù)體系,在DOI國際標(biāo)準(zhǔn)〔8〕支撐下,形成了以命名、申請、授權(quán)、注冊、解析、變更為功能核心,以全球注冊中心、本地服務(wù)為主體框架的名稱服務(wù)體系,目前在全球已有10個注冊代理機(jī)構(gòu),在數(shù)字出版行業(yè)得到了廣泛的應(yīng)用。〔9〕
在國內(nèi),有些機(jī)構(gòu)直接納入到國外唯一標(biāo)識符服務(wù)體系,開展中文數(shù)字資源的唯一標(biāo)識符服務(wù);〔10〕也有一些單位自主研發(fā)了唯一標(biāo)識符的應(yīng)用功能和命名規(guī)則。〔11〕唯一標(biāo)識符技術(shù)在公共圖書館領(lǐng)域的應(yīng)用與研究尚處起步階段,隨著圖書館數(shù)字資源種類和數(shù)量的不斷增多,數(shù)字資源的網(wǎng)絡(luò)服務(wù)愈發(fā)重要,正逐漸成為公共圖書館的主要服務(wù)內(nèi)容,而數(shù)字資源在管理及服務(wù)上的問題也日益凸顯。
唯一標(biāo)識符規(guī)范、系統(tǒng)的建設(shè)是國家數(shù)字圖書館工程的重要內(nèi)容,國家圖書館以推廣工程為平臺,利用已有的建設(shè)成果,聯(lián)合全國各級公共圖書館共同探索和創(chuàng)新,構(gòu)建涵蓋唯一標(biāo)識符的標(biāo)準(zhǔn)、應(yīng)用和管理機(jī)制等環(huán)節(jié)的完整的唯一標(biāo)識符體系,以實現(xiàn)對全國公共圖書館數(shù)字資源的統(tǒng)一標(biāo)識和規(guī)范管理,促進(jìn)跨區(qū)域跨平臺的資源調(diào)用和系統(tǒng)集成。
( 1 )實用性
唯一標(biāo)識符體系應(yīng)選用高可靠性的存儲、設(shè)計高效的查找策略、使用合理的通訊協(xié)議、設(shè)計滿足用戶需求的服務(wù)模型、采用高效靈活的分布式架構(gòu)進(jìn)行體系的規(guī)劃和研究。確保各省、市圖書館可獨(dú)立完成本地數(shù)字資源唯一標(biāo)識符的注冊和管理,可及時對數(shù)字對象的URL地址進(jìn)行更新,避免資源鏈接的“死鏈”現(xiàn)象。
( 2 )穩(wěn)定性
唯一標(biāo)識符體系應(yīng)面向互聯(lián)網(wǎng)用戶采用多鏈路方式提供高效、穩(wěn)定的唯一標(biāo)識符解析服務(wù),服務(wù)終端與服務(wù)提供者之間通過建立簡單、快捷的鏈接通道,保證服務(wù)的穩(wěn)定性。在單個節(jié)點(diǎn)出現(xiàn)故障時,可以通過中心節(jié)點(diǎn)作為橋梁建立鏈接,不會影響整個體系,確保資源的及時、準(zhǔn)確定位。
( 3 )擴(kuò)展性
唯一標(biāo)識符體系應(yīng)具備軟硬件層面的擴(kuò)展能力,能夠通過增加硬件設(shè)備和優(yōu)化軟件策略的方式來提高處理能力。在業(yè)務(wù)層面,應(yīng)立足公共圖書館,具備向出版單位、研究機(jī)構(gòu)、博物館等全國其它有需要的單位提供公益性的唯一標(biāo)識符注冊和解析服務(wù)能力,促進(jìn)跨系統(tǒng)、跨機(jī)構(gòu)的資源鏈接和共享利用。
( 4 )兼容性
唯一標(biāo)識符體系應(yīng)能夠?qū)崿F(xiàn)圖書館多版本、多復(fù)本數(shù)字資源的注冊和解析,只要提供與數(shù)字對象相關(guān)的元數(shù)據(jù),各圖書館的應(yīng)用系統(tǒng)就可以定位相應(yīng)的資源,能夠有效促進(jìn)圖書館間的業(yè)務(wù)融合。此外,唯一標(biāo)識符體系還應(yīng)該兼容唯一標(biāo)識符的相關(guān)國際標(biāo)準(zhǔn),提供規(guī)范的解析接口,保證在業(yè)界的持續(xù)競爭力。
唯一標(biāo)識符體系的建設(shè)首先要考慮公共圖書館數(shù)字資源的建設(shè)情況,制定出科學(xué)、規(guī)范、適用的唯一標(biāo)識符命名規(guī)則、注冊規(guī)則和解析規(guī)則,指導(dǎo)系統(tǒng)平臺的建設(shè)。通過系統(tǒng)平臺完成標(biāo)識全國公共圖書館的所有數(shù)字資源,形成能夠容納國家圖書館、省級館、市級館的總分式唯一標(biāo)識符體系,實現(xiàn)唯一標(biāo)識符的統(tǒng)一規(guī)劃和服務(wù)。同時,在國家圖書館的協(xié)調(diào)組織和各級公共圖書館的積極配合下,建立公共圖書館共同參與的多層管理體系,形成一套完善的運(yùn)行和管理機(jī)制,保證各服務(wù)節(jié)點(diǎn)的協(xié)調(diào)工作和穩(wěn)定運(yùn)行。
為保證唯一標(biāo)識符體系的安全、穩(wěn)定,國家圖書館參照HANDLE系統(tǒng)的體系架構(gòu),采用分布式的服務(wù)框架,按照“國家-省-市”三層架構(gòu)進(jìn)行設(shè)計,既能保證每個服務(wù)節(jié)點(diǎn)的獨(dú)立管理,系統(tǒng)高度自治,還能提高系統(tǒng)的可靠性,不會因為單個節(jié)點(diǎn)的故障導(dǎo)致服務(wù)的中斷。如圖1所示,最上層為頂層服務(wù),由中心節(jié)點(diǎn)提供,管理n個分支服務(wù)節(jié)點(diǎn),對各分支服務(wù)節(jié)點(diǎn)進(jìn)行命名授權(quán)和管理。在頂層節(jié)點(diǎn)下,具有多個唯一標(biāo)識符的二級服務(wù)節(jié)點(diǎn),各服務(wù)節(jié)點(diǎn)可接收本地范圍內(nèi)注冊機(jī)構(gòu)的申請和審批,各注冊機(jī)構(gòu)即為實際提供唯一標(biāo)識符注冊服務(wù)的實體服務(wù)機(jī)構(gòu);二級節(jié)點(diǎn)下可繼續(xù)發(fā)展三級服務(wù)節(jié)點(diǎn),滿足市級及以下圖書館的數(shù)字資源注冊需求。頂層服務(wù)采用星型結(jié)構(gòu)同步各子層圖書館的系統(tǒng)配置信息,通過分層模式逐層同步各省、市唯一標(biāo)識符信息,保存各子層提交的注冊數(shù)據(jù),提供唯一標(biāo)識符的查詢功能,在其他節(jié)點(diǎn)出現(xiàn)故障時,直接提供解析服務(wù),保證系統(tǒng)的穩(wěn)定性。
圖1 唯一標(biāo)識符體系框架
唯一標(biāo)識符體系以分級注冊和統(tǒng)一解析的模式對外提供服務(wù)。各服務(wù)節(jié)點(diǎn)不僅負(fù)責(zé)本地區(qū)有唯一標(biāo)識符注冊需求的機(jī)構(gòu)申請和管理,還要負(fù)責(zé)本地唯一標(biāo)識符的解析服務(wù)。各注冊機(jī)構(gòu)為直接進(jìn)行唯一標(biāo)識符注冊和管理的單位。
唯一標(biāo)識符體系的構(gòu)建應(yīng)該以標(biāo)準(zhǔn)化和開放性為原則,從標(biāo)準(zhǔn)規(guī)范、技術(shù)平臺、服務(wù)體系和管理體系四個方面進(jìn)行建設(shè)。
公共圖書館數(shù)字資源唯一標(biāo)識符標(biāo)準(zhǔn)規(guī)范的建設(shè)包括數(shù)據(jù)格式的標(biāo)準(zhǔn)化、資源種類的標(biāo)準(zhǔn)化、命名規(guī)則的標(biāo)準(zhǔn)化、注冊數(shù)據(jù)的標(biāo)準(zhǔn)化等等。
根據(jù)文化部統(tǒng)計數(shù)據(jù),2012年全國共有縣級以上獨(dú)立建制的公共圖書館3076個?!?2〕唯一標(biāo)識符體系需要能夠覆蓋和服務(wù)所有的公共圖書館,還要保持不同圖書館數(shù)字資源之間的通用性、交互性以及不同應(yīng)用系統(tǒng)之間的互操作,因此,研制唯一標(biāo)識符標(biāo)準(zhǔn)規(guī)范是建設(shè)唯一標(biāo)識符體系的重要前提。國家圖書館自2002年以來,一直跟蹤國內(nèi)外唯一標(biāo)識符相關(guān)標(biāo)準(zhǔn)規(guī)范的前沿動態(tài),并于2010年正式發(fā)布了《國家圖書館數(shù)字資源唯一標(biāo)識符規(guī)范和應(yīng)用指南》。〔13〕2012年參與了文化部行業(yè)標(biāo)準(zhǔn)“數(shù)字對象唯一標(biāo)識符”規(guī)范的研制工作,同年國家圖書館也開展了公共圖書館唯一標(biāo)識符命名規(guī)則的制定工作,采用“前綴/后綴”的方式進(jìn)行命名,前綴和后綴各段采用英文半角“.”分隔,如“108.ndlc.2.1100009031010001/T1F24.003171449”。前綴包括四段,分別為國家區(qū)域代碼、國家數(shù)字圖書館代碼、服務(wù)節(jié)點(diǎn)代碼以及注冊機(jī)構(gòu)代碼;后綴為綜合信息編號和系統(tǒng)內(nèi)部標(biāo)識號,主要體現(xiàn)了該資源的種類、文件格式等基本信息。
唯一標(biāo)識符系統(tǒng)平臺的建設(shè)是建立唯一標(biāo)識符體系的基礎(chǔ)。根據(jù)《國家圖書館數(shù)字資源唯一標(biāo)識符規(guī)范和應(yīng)用指南》,國家圖書館進(jìn)行了唯一標(biāo)識符系統(tǒng)的前期需求調(diào)研和應(yīng)用調(diào)研,于2011年啟動了“國家圖書館數(shù)字資源唯一標(biāo)識符系統(tǒng)”項目,〔14〕系統(tǒng)主要用于數(shù)字資源唯一標(biāo)識符的注冊、管理和服務(wù),它不僅是國家數(shù)字圖書館工程的一個核心配套子系統(tǒng),也是推廣工程軟件平臺建設(shè)的一項重要內(nèi)容。唯一標(biāo)識符系統(tǒng)按照數(shù)據(jù)層、應(yīng)用層和服務(wù)層三層結(jié)構(gòu)進(jìn)行設(shè)計,如圖2所示,數(shù)據(jù)層依托ORACLE數(shù)據(jù)庫存儲和管理唯一標(biāo)識符的注冊數(shù)據(jù),并利用ORACLE全文檢索技術(shù)提供高效的檢索能力;應(yīng)用層采用J2EE架構(gòu),簡化并規(guī)范了應(yīng)用系統(tǒng)的開發(fā)與部署,采用標(biāo)準(zhǔn)的WebService接口實現(xiàn)了異構(gòu)平臺間的互通,有力保證了唯一標(biāo)識符系統(tǒng)與各省、市圖書館業(yè)務(wù)系統(tǒng)的整合;服務(wù)層面向用戶提供唯一標(biāo)識符的注冊、解析、機(jī)構(gòu)管理以及數(shù)據(jù)管理等服務(wù)。
圖2 唯一標(biāo)識符系統(tǒng)結(jié)構(gòu)圖
服務(wù)體系建設(shè)是唯一標(biāo)識符體系的核心環(huán)節(jié),主要定義了一套兩層的服務(wù)模型,即注冊服務(wù)層和解析服務(wù)層。
( 1 )注冊服務(wù)
國家圖書館為唯一標(biāo)識符體系的中心節(jié)點(diǎn),各省、市圖書館原則上都需要搭建系統(tǒng)環(huán)境,省級圖書館為二級服務(wù)節(jié)點(diǎn),市級圖書館為三級服務(wù)節(jié)點(diǎn)。各省、市圖書館根據(jù)數(shù)字資源建設(shè)情況,可以建立唯一標(biāo)識符的注冊中心,獨(dú)立完成本地唯一標(biāo)識符的注冊和管理。
公共圖書館之外其它有唯一標(biāo)識符注冊需要的單位,利用相應(yīng)服務(wù)節(jié)點(diǎn)軟硬件平臺,申請成為注冊機(jī)構(gòu),各注冊機(jī)構(gòu)獲得命名授權(quán)后方可進(jìn)行授權(quán)范圍內(nèi)唯一標(biāo)識符的注冊。
( 2 )解析服務(wù)
唯一標(biāo)識符體系面向全球提供中文數(shù)字資源的唯一標(biāo)識符解析服務(wù)。唯一標(biāo)識符解析包含正向和反向兩種解析模式,正向解析是通過唯一標(biāo)識符獲取資源的URL地址,該服務(wù)面向包括互聯(lián)網(wǎng)用戶在內(nèi)的所有用戶開放;反向解析是通過查詢注冊數(shù)據(jù)的相應(yīng)字段獲取資源的URL地址,該服務(wù)僅面向注冊機(jī)構(gòu)的用戶開放。
唯一標(biāo)識符解析體系采用分層解析的策略,系統(tǒng)根據(jù)唯一標(biāo)識符的命名規(guī)則,首先選擇指定的服務(wù)節(jié)點(diǎn)進(jìn)行解析,如果該服務(wù)節(jié)點(diǎn)存在異常,則利用中心節(jié)點(diǎn)進(jìn)行二次解析。通過唯一標(biāo)識符的解析體系,可以實現(xiàn)資源的穩(wěn)定定位,一個數(shù)字化對象的標(biāo)識符一經(jīng)產(chǎn)生就永久不變,不隨其所標(biāo)識的數(shù)字化對象的存儲地址等屬性的變更而改變,保證數(shù)據(jù)在互聯(lián)網(wǎng)上的穩(wěn)定性。
管理體系建設(shè)是唯一標(biāo)識符體系運(yùn)行的重要保障。建立高效、穩(wěn)定的管理體系不僅可以實現(xiàn)各級節(jié)點(diǎn)數(shù)據(jù)和機(jī)構(gòu)的有序運(yùn)行,還可以保障公共圖書館唯一標(biāo)識符各服務(wù)節(jié)點(diǎn)的安全穩(wěn)定。
國家圖書館作為唯一標(biāo)識符體系中心節(jié)點(diǎn)的管理者,提供唯一標(biāo)識符系統(tǒng)的整體運(yùn)行策略、標(biāo)準(zhǔn)規(guī)范、協(xié)調(diào)管理、技術(shù)支持等保障服務(wù),作為國內(nèi)唯一標(biāo)識符行業(yè)代表與國際相關(guān)機(jī)構(gòu)溝通聯(lián)系。管理對象主要為服務(wù)節(jié)點(diǎn),負(fù)責(zé)服務(wù)節(jié)點(diǎn)的申請、審批和考核工作,并對其提供技術(shù)和業(yè)務(wù)等各方面的指導(dǎo),保存服務(wù)節(jié)點(diǎn)成功注冊的唯一標(biāo)識符數(shù)據(jù)。
服務(wù)節(jié)點(diǎn)是唯一標(biāo)識符體系的重要實施運(yùn)作機(jī)構(gòu)。服務(wù)節(jié)點(diǎn)對本節(jié)點(diǎn)命名授權(quán)下的注冊機(jī)構(gòu)進(jìn)行管理,負(fù)責(zé)注冊機(jī)構(gòu)的申請、審核、技術(shù)支持和業(yè)務(wù)培訓(xùn)工作,為注冊機(jī)構(gòu)提供賬號維護(hù)和唯一標(biāo)識符的注冊、解析、管理和修改等多種服務(wù)。各服務(wù)節(jié)點(diǎn)應(yīng)配合中心節(jié)點(diǎn)完成體系運(yùn)行的各項輔助工作,協(xié)調(diào)并處理與注冊機(jī)構(gòu)之間、注冊機(jī)構(gòu)與注冊機(jī)構(gòu)之間的各類數(shù)據(jù)協(xié)同的問題。
注冊機(jī)構(gòu)作為唯一標(biāo)識符注冊的實體,向相應(yīng)的服務(wù)節(jié)點(diǎn)申請,待審批通過以后,注冊機(jī)構(gòu)獲得服務(wù)節(jié)點(diǎn)分配的操作賬號后,對唯一標(biāo)識符進(jìn)行數(shù)據(jù)注冊、修改、刪除等操作,并自動逐級同步至中心節(jié)點(diǎn)備案存檔。
近十年來,國內(nèi)學(xué)者一直在跟蹤和研究唯一標(biāo)識符技術(shù),已經(jīng)從理論研究逐漸過渡到應(yīng)用層面。然而,在圖書館領(lǐng)域,專業(yè)技術(shù)人才的缺乏和經(jīng)費(fèi)支持力度不夠,唯一標(biāo)識符技術(shù)的前期研究僅在少數(shù)圖書館開展,其推廣和應(yīng)用緩慢。
國家圖書館依托數(shù)字圖書館推廣工程,聯(lián)合全國各級公共圖書館共同建立起推廣工程唯一標(biāo)識符體系,形成公共圖書館行業(yè)的唯一標(biāo)識符標(biāo)準(zhǔn)規(guī)范,以指導(dǎo)行業(yè)唯一標(biāo)識符數(shù)據(jù)、系統(tǒng)和管理的建設(shè);研制出系統(tǒng)平臺,實現(xiàn)了行業(yè)內(nèi)唯一標(biāo)識符申請、注冊、解析等各流程的一整套系統(tǒng)平臺應(yīng)用,以及通過接口擴(kuò)展兼容國內(nèi)外平臺,為公共圖書館數(shù)字資源的集中揭示和統(tǒng)一調(diào)度提供相應(yīng)的應(yīng)用支撐;制定出數(shù)據(jù)、系統(tǒng)、運(yùn)行的配套管理機(jī)制,為唯一標(biāo)識符在全國各地順利開展應(yīng)用服務(wù)提供行之有效的保障。唯一標(biāo)識符體系的建成,將推動各地數(shù)字圖書館建設(shè)的進(jìn)一步完善,促進(jìn)全國公共圖書館服務(wù)水平的提升。同時,建設(shè)我國具有自主知識產(chǎn)權(quán)的唯一標(biāo)識符體系,還可以擺脫公共文化服務(wù)領(lǐng)域?qū)庀到y(tǒng)和平臺的技術(shù)依賴,這對于保證我國公共文化信息安全也具有重要的戰(zhàn)略意義。
2.R.Moats.URNSyntax.May 1997.http://www.ietf.org/rfc/rfc2141.txt
3.ANSI/NISO Z39.56-1996 Serial Item and Contribution Identifier.http://www.niso.org/apps/group_public/download.php/6514/Serial%20 Item%20and%20Contribution%20Identifier%20%28SICI%29.pdf
4.SICI and BICI: Identifiers for Serials and Books.https://www.google.com.hk/#newwindow=1&q=BICI+SICI&safe=strict
5.Publisher Item Identifier. http://www.ch.ic.ac.uk/ectoc/ectoc_pii.html
6.Digital Object Identifier System. http://www.doi.org
7.Handle System. http://www.handle.net/documentation.html
8.ISO 26324:2012.Information and documentation--Digital object identifier system.http://www.doi.org/ISO_Standard/sc9n475.pdf
9, 10.DOI: Registration Agencies. http://www.doi.org/registration_agencies.html
11.CALIS數(shù)字對象唯一標(biāo)識符命名規(guī)范.〔2007-10-09〕http://lib.njtu.edu.cn/pub/bjtu/xswhjl/gnpx/P020071009509903283516.doc
12.全國第五次公共圖書館評估定級綜述.〔2013-09-13〕 http://ceshi.mcprc.gov.cn/sjzz/shwhs_sjzz/shwhs_gzdt/201309/t20130923_391926.htm
13.孫坦等.國家圖書館數(shù)字資源唯一標(biāo)識符規(guī)范和應(yīng)用指南.北京:北京圖書館出版社,2010
14.童忠勇,李志堯,孫秀萍.國家數(shù)字圖書館數(shù)字資源唯一標(biāo)識符系統(tǒng)的設(shè)計與實現(xiàn). 圖書館學(xué)研究,2013(21):53-58