潘彤聲, 望艷春
(三峽大學(xué) 圖書館, 湖北 宜昌 443002)
高校圖書館在支撐學(xué)校教學(xué)科研、服務(wù)地方經(jīng)濟(jì)的過程中,不斷調(diào)整自身的發(fā)展方向,積累了一定數(shù)量的特色資源,這些特色資源主要包括:與學(xué)校重點學(xué)科相關(guān)的圖書、期刊、會議論文、標(biāo)準(zhǔn)專利、圖紙圖像、音視頻;地方經(jīng)濟(jì)重點發(fā)展方向的新技術(shù)、新進(jìn)展;反映區(qū)域特有的人文、歷史、地理的古籍、地方志、手稿;反映學(xué)校及地方學(xué)者的學(xué)術(shù)水平的文集等。
特色資源的收藏范圍、數(shù)量和質(zhì)量,反映了高校圖書館的歷史底蘊,反映了圖書館服務(wù)高校教研的水平,將這些珍稀的特色資源利用現(xiàn)代化技術(shù)實現(xiàn)數(shù)字化建庫,具有極為重要的作用,一是有利于資源的保存,二是提高了資源的利用效率,三是方便了用戶的檢索與獲取。很多985、211的高校很早開始嘗試進(jìn)行特色資源的數(shù)字化,而中國高等教育文獻(xiàn)保障系統(tǒng)(CALIS)從1999年起就組織高校圖書館進(jìn)行了共3期近200個特色數(shù)據(jù)庫的建設(shè),表1列舉了其中幾個較具影響的特色庫。
表1 CALIS較具代表性的特色庫
(1)建庫情況
三峽大學(xué)依托三峽工程與周邊的眾多水電工程,因此辦學(xué)的重點方向就是突出水電特色和三峽文化,這也一直是我們建設(shè)特色資源的重點,關(guān)于這些水電工程的建設(shè)歷史、現(xiàn)狀和發(fā)展,三峽地區(qū)的人文、歷史地理、動植物、地質(zhì)地貌的圖書、期刊、報紙、會議、音視頻、圖像、圖紙、古籍、地方志甚至手稿一直是我們的收藏方向,以此為基礎(chǔ),近10年來,三峽大學(xué)圖書館進(jìn)行了一系列的特色資源數(shù)字化建庫嘗試,較具代表性的如表2所示。
表2 三峽大學(xué)圖書館建設(shè)的特色數(shù)據(jù)庫
(2)存在的問題——標(biāo)準(zhǔn)缺失
數(shù)字資源在建庫過程中,需要遵循并建立一定的標(biāo)準(zhǔn),以控制并保證數(shù)據(jù)質(zhì)量。這些標(biāo)準(zhǔn)包括元數(shù)據(jù)和數(shù)字對象兩個方面。元數(shù)據(jù)指題名、分類等揭示信息,數(shù)字對象則是紙質(zhì)、音視頻等資源本身,前者需要制定著錄標(biāo)引標(biāo)準(zhǔn),后者需要加工標(biāo)準(zhǔn)。數(shù)字資源由于其特殊性、新穎性和發(fā)展性,在其發(fā)展過程中沒有形成完善系統(tǒng)的標(biāo)準(zhǔn),很多元數(shù)據(jù)的建庫標(biāo)準(zhǔn)都大量參照一些成熟標(biāo)準(zhǔn),如GB2659-81世界各國和地區(qū)名稱代碼、GB3469-83文獻(xiàn)類型與文獻(xiàn)載體代碼等。1995年OCLC與國家超級計算應(yīng)用中心(NCSA)聯(lián)合發(fā)起建立了一套描述網(wǎng)絡(luò)電子文獻(xiàn)的方法,以便網(wǎng)上信息檢索,后來此方法形成都柏林核心元數(shù)據(jù)(DC)標(biāo)準(zhǔn),其基本方案是包括15個“核心元素”的集合,用來供數(shù)字化建庫遵循與參照,表3列舉了都柏林核心元數(shù)據(jù)(DC)標(biāo)準(zhǔn)部分元數(shù)據(jù)。
表3 都柏林核心元數(shù)據(jù)(DC)標(biāo)準(zhǔn)部分元數(shù)據(jù)
很多機構(gòu)以DC標(biāo)準(zhǔn)為基礎(chǔ),對自身的數(shù)字化建庫標(biāo)準(zhǔn)進(jìn)行了補充與完善,形成了較為系統(tǒng)的標(biāo)準(zhǔn)體系。在國內(nèi),CALIS專門為其三期特色庫建立一套包含17種數(shù)字資源類型的Schema規(guī)范;國家圖書館建立關(guān)于十幾種數(shù)字對象的《數(shù)字資源加工標(biāo)準(zhǔn)》;CNKI建立《清華同方特色庫建庫相關(guān)標(biāo)準(zhǔn)》。
我館在進(jìn)行建庫之時,缺乏統(tǒng)一規(guī)劃,元數(shù)據(jù)字段不齊全,著錄與加工標(biāo)準(zhǔn)缺失,數(shù)據(jù)質(zhì)量良莠不齊,以CALIS三期的幾個子項目為例,表4、表5分別反映了初次提交驗收時元數(shù)據(jù)字段與記錄質(zhì)量不達(dá)標(biāo)的情況。
表4 三峽大學(xué)圖書館CALIS子項目元數(shù)據(jù)字段缺失情況
表5 三峽大學(xué)圖書館CALIS子項目元數(shù)據(jù)字段缺失情況
其他的特色庫也存在類似的元數(shù)據(jù)或數(shù)字對象的標(biāo)準(zhǔn)缺失,歸納起來有如下幾點:(1)元數(shù)據(jù)字段缺失,導(dǎo)致揭示資源不全面客觀;(2)元數(shù)據(jù)著錄標(biāo)引標(biāo)準(zhǔn)缺失,導(dǎo)致揭示資源不準(zhǔn)確;(3)數(shù)字對象加工標(biāo)準(zhǔn)缺失,導(dǎo)致資源本身的可利用性降低;(4)審核標(biāo)準(zhǔn)缺失,導(dǎo)致資源的綜合質(zhì)量下降。
綜上所述,特色資源數(shù)字化過程中,如標(biāo)準(zhǔn)缺失,將會嚴(yán)重影響資源質(zhì)量,導(dǎo)致資源的利用率和圖書館的服務(wù)水平下降。因此,建立一套完善的特色數(shù)字資源的標(biāo)準(zhǔn),并以之為基礎(chǔ),規(guī)范數(shù)據(jù)質(zhì)量,提高服務(wù)水平,是勢在必行的。三峽大學(xué)圖書館需要一套適合自身特色資源發(fā)展的標(biāo)準(zhǔn),包括各類型特色庫的通用模板,即元數(shù)據(jù)字段標(biāo)準(zhǔn)、元數(shù)據(jù)著錄規(guī)則和數(shù)字對象加工標(biāo)準(zhǔn)。經(jīng)過反復(fù)的對比、借鑒、論證和修改,制定了這么一套體系,下文簡述相關(guān)標(biāo)準(zhǔn)及實施辦法。
(1)元數(shù)據(jù)字段標(biāo)準(zhǔn)制定
這一部分內(nèi)容包含了圖書、期刊、會議論文、標(biāo)準(zhǔn)專利、音頻、視頻、教參、圖像等通用的特色庫以及我館在建特色庫的元數(shù)據(jù)字段定義,包括每一個元素的定義、描述、類型、DC映射、必備性、唯一性內(nèi)容,表6為工程移民數(shù)據(jù)庫的部分元數(shù)據(jù)定義。
表6 工程移民數(shù)據(jù)庫部分元數(shù)據(jù)定義
(2)元數(shù)據(jù)著錄標(biāo)引標(biāo)準(zhǔn)制定
很多元數(shù)據(jù)的錄入都需要遵循一定的固有標(biāo)準(zhǔn),如ISSN號遵循ISO3297,地區(qū)名稱代碼遵循GB2659-81;某些特色庫因為具備一定的地域文化特性,無法用現(xiàn)有的標(biāo)準(zhǔn)來約束,我們必須自定標(biāo)準(zhǔn),如武陵民族資源庫中的所屬武陵地區(qū)、所屬武陵文化內(nèi)容等項目。
元數(shù)據(jù)錄入根據(jù)元素本身的性質(zhì)分為著錄和標(biāo)引兩類,直接錄入原始信息是著錄,如題名、著者等,需要進(jìn)行提煉的是標(biāo)引,如主題詞、分類號等,錄入方式不同,采用的質(zhì)量標(biāo)準(zhǔn)也不同,對于著錄我們采用著錄項錯誤率和著錄文字錯誤率兩個指標(biāo)來衡量,對于標(biāo)引,我們采用標(biāo)引正確率和標(biāo)引一致度來衡量,具體定義如下:
一是著錄項錯誤率:(元數(shù)據(jù)項著錄錯誤的數(shù)據(jù)項數(shù)量/數(shù)據(jù)項數(shù)量)×100%,著錄錯誤的數(shù)量與總數(shù)量的比率。著錄項錯誤是按元數(shù)據(jù)項計算,凡未能對元數(shù)據(jù)項進(jìn)行客觀著錄的均計為著錄項錯誤,適用于文字錯誤對元數(shù)據(jù)項內(nèi)容影響大的元數(shù)據(jù)項。元數(shù)據(jù)項內(nèi)容為單值的,計為一項;元數(shù)據(jù)項內(nèi)容為多值的,則按值的數(shù)量計算項數(shù)。
二是著錄文字錯誤率:(元數(shù)據(jù)項內(nèi)容文字錯誤的數(shù)量/元數(shù)據(jù)項文字?jǐn)?shù)量)×100%,表示內(nèi)容文字錯誤的數(shù)量與總數(shù)量的比率。著錄文字錯誤按文字計算,適用于文字錯誤對元數(shù)據(jù)內(nèi)容影響較小的元數(shù)據(jù)。元數(shù)據(jù)中文字與原文不符的計為著錄文字錯誤,但不包括對原文的文字錯誤進(jìn)行糾正的情況。
三是標(biāo)引正確率:(元數(shù)據(jù)標(biāo)引正確的數(shù)據(jù)項數(shù)量/數(shù)據(jù)項數(shù)量)×100%,標(biāo)引正確的數(shù)據(jù)項數(shù)量和總數(shù)量的比率。標(biāo)引項目基本反映文獻(xiàn)主題,無原則性錯誤,則計為標(biāo)引正確。
四是標(biāo)引一致度:(元數(shù)據(jù)標(biāo)引一致的數(shù)據(jù)項數(shù)量/數(shù)據(jù)項數(shù)量)×100%,表示元數(shù)據(jù)標(biāo)引一致的數(shù)據(jù)項數(shù)量與總數(shù)量的比率。標(biāo)引一致度反映同主題文獻(xiàn)標(biāo)引一致的程度。
據(jù)上述原則,對在建庫進(jìn)行了著錄標(biāo)準(zhǔn)的制定,表7以武陵地區(qū)資源庫部分字段為例。
表7 武陵地區(qū)資源庫部分元數(shù)據(jù)著錄標(biāo)引標(biāo)準(zhǔn)
(3)數(shù)字對象加工標(biāo)準(zhǔn)制定
不同的數(shù)字對象,需要進(jìn)行的加工方式不同,因此,也就有不同的加工規(guī)范,例如普通紙質(zhì)需要進(jìn)行掃描和OCR識別,古籍需要拍照,網(wǎng)絡(luò)資源需要采集,音頻需要進(jìn)行無損失壓縮,視頻需要采集和轉(zhuǎn)換格式,圖像需要掃描和圖像處理等,歸納起來,我們能用到的最主要的數(shù)字對象就是普通紙質(zhì)(圖書期刊)、網(wǎng)絡(luò)資源、音視頻和圖像等,表8簡述各種處理方式的統(tǒng)一規(guī)范。
表8 常見數(shù)字對象處理統(tǒng)一規(guī)范
其中,對于紙質(zhì)文獻(xiàn),在掃描過程中,需要遵守一定的版面錯誤率和頁面錯誤率:
1)版面錯誤率:(錯誤版面數(shù)/版面總數(shù))×100%,錯誤版面數(shù)與版面總數(shù)的比率。它是衡量文本型全文數(shù)據(jù)制作質(zhì)量的指標(biāo)。其質(zhì)量要求包括:a)文字內(nèi)容應(yīng)與原版印刷本一致,版式應(yīng)與原版印刷本基本一致;b)文獻(xiàn)不應(yīng)出現(xiàn)缺頁、多頁、錯頁、重頁現(xiàn)象;c)文獻(xiàn)不應(yīng)出現(xiàn)版面重疊的現(xiàn)象;
2)頁面錯誤率:(錯誤頁數(shù)/頁面總數(shù))×100%,錯誤頁面數(shù)與頁面總數(shù)的比率,它是衡量圖像型全文數(shù)據(jù)制作質(zhì)量的指標(biāo)。同一頁面內(nèi)出現(xiàn)一個或一個以上錯誤,均計為一個錯誤。其質(zhì)量要求包括:a)文獻(xiàn)不應(yīng)出現(xiàn)缺頁、多頁、錯頁、重頁等現(xiàn)象;b)頁面應(yīng)保持完整;c)頁面無污損;d)頁面清晰。
表9是紙質(zhì)資源中的普通印刷型加工技術(shù)規(guī)范。
表9 普通印刷型文本的加工技術(shù)規(guī)范
據(jù)此,我們確定水利水電資源庫數(shù)字對象部分加工標(biāo)準(zhǔn)如表10。對其他資源,我們也參照制定相關(guān)標(biāo)準(zhǔn),表11為課件視頻數(shù)字對象部分加工標(biāo)準(zhǔn)。
表10 水利水電資源庫數(shù)字對象部分加工標(biāo)準(zhǔn)
表11 專業(yè)課件視頻庫數(shù)字對象部分加工標(biāo)準(zhǔn)
在完善的標(biāo)準(zhǔn)制定后,我們需要從以下幾點來嚴(yán)格實施,才能真正提高質(zhì)量:一是工作流程細(xì)致化:資源的采訪由數(shù)字采訪研究員完成,結(jié)構(gòu)建庫由系統(tǒng)管理員完成,數(shù)字對象加工由數(shù)字對象加工員完成,元數(shù)據(jù)編目由編目員完成,工作流程細(xì)致規(guī)范,消除工序交叉帶來的影響;二是標(biāo)準(zhǔn)執(zhí)行常態(tài)化:對照圖書館的紙質(zhì)資源編目工作,人手一份編目與加工標(biāo)準(zhǔn),將其作為工作手冊,將標(biāo)準(zhǔn)化工作常態(tài)化;三是建立互審制度:除了常規(guī)的審核機制,還要完成相似工作互審,表12是數(shù)字對象的互審記錄和整改情況。
表12 數(shù)字對象加工互審表
特色資源數(shù)字化過程中,標(biāo)準(zhǔn)缺失對于特色庫的品質(zhì)影響巨大。因此,建立一套完善的編目標(biāo)準(zhǔn)和加工規(guī)范,能夠提高資源的利用效率,提升特色庫的品質(zhì),更好地為高等院校的教學(xué)科研服務(wù)。
參考文獻(xiàn):
[1] 劉 瑩.高校圖書館特色數(shù)據(jù)庫的建庫研究[J].現(xiàn)代情報,2004(9):177-179.
[2] 夏 紅.對高校特色數(shù)據(jù)庫建設(shè)的探討[J].情報雜志,2005(9):75-77.
[3] 石含芳.西北地方文獻(xiàn)資源數(shù)據(jù)庫建設(shè)述要[J].圖書與情報,2007(5):120-122.
[4] 同方光盤股份有限公司.水利文獻(xiàn)信息系統(tǒng)建設(shè)標(biāo)準(zhǔn)[S].2012:1-37.
[5] 孫一鋼,龍 偉.?dāng)?shù)字資源加工標(biāo)準(zhǔn)[S].我國數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè).2006:1-35.
[6] 張新玲,鄭宗榮.應(yīng)對期刊數(shù)字化的編輯策略[J].重慶三峽學(xué)院學(xué)報,2012(4).