張 丹
(遼寧省圖書館,遼寧 沈陽 110015)
張 丹 女,1981年生,助理館員。
《盛京時報》以中國國內(nèi)時事和評論為主,大量報道了1906~1944年東北地區(qū)金融、商貿(mào)、交通、教育、文學等許多方面的信息,具有很高的學術(shù)研究價值[1]。它是研究近現(xiàn)代史、民族關(guān)系史、國際關(guān)系史、北洋軍閥史、東北軍民抗日史極為重要的珍貴資料[2]。為適應數(shù)字圖書館的發(fā)展,遼寧省圖書館首次與清華同方公司合作建設了《盛京時報》數(shù)據(jù)庫,揭示報紙所蘊涵的極其豐富的文獻資源和信息,方便讀者查找有關(guān)內(nèi)容及長期保護與利用。
《盛京時報》是由日本人中島真雄創(chuàng)辦的一份中文報紙,是一部記載當時社會百態(tài)的百科全書式的東北地方文獻,極具地方特色,有較強的學術(shù)價值[2]。本館收藏的《盛京時報》比較全面,是目前國內(nèi)僅存的較為完整的一套,而且早在1985年遼寧省圖書館就與遼沈書社合作,對《盛京時報》重新整理補缺,影印出版發(fā)行了141冊。收錄的《盛京時報》從光緒三十二年(1906)到康德十一年(1944),比較完整。該報每日出版,版面多為4到6版,后期為對開8版,1937年后,該報達到高峰期有時達14個版面,最多時加上祝詞和廣告有40多個版面[1]。錄成題名數(shù)據(jù)庫,數(shù)據(jù)量約達150萬條,數(shù)據(jù)量相當龐大。
以往數(shù)據(jù)庫的建設都由本館專業(yè)部門網(wǎng)絡數(shù)字中心來完成。但隨著數(shù)字化圖書館的發(fā)展,圖書館依靠網(wǎng)絡數(shù)字中心的十幾名工作人員建設數(shù)據(jù)庫已跟不上讀者的需求,加上圖書館館藏資源極其豐富,每個數(shù)據(jù)庫的數(shù)據(jù)量又非常大,建設地方文獻數(shù)據(jù)庫需要相關(guān)專業(yè)技術(shù)及大量的人力、物力、財力,任何一個圖書館都將受到這些因素的制約,無法適應數(shù)據(jù)庫建設的規(guī)模和發(fā)展的需要。于是一種新型的合作建庫方式便應運而生,合作建庫是建設高質(zhì)量數(shù)據(jù)庫發(fā)展的方向,能夠充分發(fā)揮其各自優(yōu)勢。因此根據(jù)本館實際情況,經(jīng)過多方面調(diào)查研究,《盛京時報》數(shù)據(jù)庫更適合合作建設。這樣不僅能縮短建庫時間,提高工作效率,后期的數(shù)據(jù)庫維護和發(fā)布軟件也能得到專業(yè)的技術(shù)支持。
提供給合作公司《盛京時報》的影印版及縮微膠片,交代有關(guān)建庫細則和相關(guān)技術(shù)指標,審核合作公司的地方文獻資源數(shù)字化的相關(guān)資質(zhì),簽訂有關(guān)合同書。合作公司需無償提供數(shù)據(jù)使用平臺,提供發(fā)布系統(tǒng),實現(xiàn)廣域網(wǎng)發(fā)布穩(wěn)定運行。經(jīng)多方調(diào)研,論證遼寧省圖書館最終選擇與清華同方公司合作建庫,并利用TPI系統(tǒng)對數(shù)據(jù)進行數(shù)字加工及后期維護。
數(shù)據(jù)庫錄入字段的選擇是建設數(shù)據(jù)庫的基礎,構(gòu)成了數(shù)據(jù)庫的基本框架,遼寧省圖書館結(jié)合《盛京時報》文獻特點,并在多方面調(diào)研討論的基礎上對《盛京時報》數(shù)據(jù)庫設立了如下27個數(shù)據(jù)字段:ID、編號、報名、總期號、出版日期、公歷、星期、年號、責任者團體、責任者個體、發(fā)行者團體、發(fā)行者個體、文件名、序號、題名、版號、創(chuàng)建者、其他責任者團體、其他責任者個體、欄目、主題、頁碼、說明、作品語種、出版地、館藏代碼、格式,全方面揭示文獻的特征,反映報紙的各種信息?!妒⒕r報》欄目多樣,有評論、中國時勢、民國要聞、各國電訊、東三省新聞、東三省要聞、京師要聞、各省要聞、時論、批示、小說、社說、文苑、欽差行蹤、專電、世界新聞、來函、市井雜俎、公文匯錄、緊要專件、廣告等。針對《盛京時報》的這種特點,我們特意增設“欄目”著錄項。由于《盛京時報》報道多為東三省新聞,所以增設“主題”著錄項,反映新聞的具體地點,即在主題項目中錄入長春、吉林、安東等。所有錄入字段可以按照這些項目二次排序,方便讀者檢索,真正實現(xiàn)全方位開發(fā)《盛京時報》的目的。
根據(jù)《盛京時報》的實際情況,確定圖像數(shù)字化技術(shù)指標為PDF格式,色彩模式采用灰度模式,符合《國家圖書館征集數(shù)字資源建設規(guī)范》中的規(guī)定。同時錄入如遇繁體字,按照《普通圖書著錄規(guī)則》中的“對著錄的文字必須規(guī)范化”的要求,著錄時需將《盛京時報》中的各項錄入字段中的繁體字轉(zhuǎn)換成簡體字著錄。根據(jù)《中國文獻編目規(guī)則》的規(guī)定,著錄時對出版發(fā)行年月應按原題的紀年如實著錄,然后把非公元紀年轉(zhuǎn)換為公元紀年,在原題的紀年后著錄公元紀年并加方括號。公元紀年用4位阿拉伯數(shù)字著錄,以“宣統(tǒng)”、“民國”、“康德”、“大同”、“大正”、“昭和”等紀年的,年號照錄,并換算成公元紀年表示[6]。如1911年9月22日則著錄出版日期為宣統(tǒng)三年(1911)九月二十二日。每條題錄作為一條數(shù)據(jù),對應一張圖片,生成文章索引,實現(xiàn)文獻資料的題名、出版日期、作者、欄目等的檢索,用戶接口多為菜單驅(qū)動型,檢索直接[3]。
由于回溯建庫的數(shù)據(jù)量很大,而圖書館長期從事建庫工作的只有十幾人,建成一個數(shù)據(jù)庫往往需要2~5年。在《盛京時報》數(shù)據(jù)庫建設中,我們可以按欄目形成東三省新聞庫、文學庫、小說庫等,這樣有利于構(gòu)建全方位的文獻信息服務體系,這對于滿足各界人士對《盛京時報》文獻信息資源的需要具有重要的意義。合作建庫,利用圖書館以外的專業(yè)數(shù)據(jù)加工公司來完成建庫工作,既能縮短建庫的時間又能提高建庫的效率。《盛京時報》數(shù)據(jù)量約為150萬條,如由本館人員10人建庫,每人每天著錄100條,則需4年完成。而將此外包給合作公司只花了1年,大大縮短了工作時間,提高了工作效率。
標準化是圖書館實現(xiàn)資源共享、保障數(shù)據(jù)庫質(zhì)量的必要條件。目前,各館自行建庫都普遍存在著錄信息不全、不規(guī)范等問題,數(shù)據(jù)的準確性、完整性難以保證;另一方面,圖書館工作人員在進行數(shù)據(jù)著錄時也存在理解偏差,難免會造成著錄的差別,數(shù)據(jù)的標準化程度難以控制。合作建庫的外包公司一般都有統(tǒng)一的制作標準,很大程度上解決了由各館單獨建庫造成的制作標準不統(tǒng)一、方法不一致等問題。合作建庫則提高了數(shù)據(jù)的質(zhì)量、檢索能力和使用效率。
專業(yè)的外包公司能給圖書館帶來強大的技術(shù)支持,不但能提供專業(yè)的數(shù)據(jù)加工軟件,而且為我們?nèi)粘5臄?shù)據(jù)維護和后期軟件發(fā)布提供專業(yè)的技術(shù)保障。《盛京時報》數(shù)據(jù)庫應用合作公司的TPI系統(tǒng)即清華同方專業(yè)數(shù)據(jù)庫制作管理系統(tǒng),是經(jīng)過很多圖書館和用戶證實的非常成熟穩(wěn)定的用于實現(xiàn)數(shù)字化圖書館電子資源網(wǎng)絡共享的專用軟件,為本館提供了強大的技術(shù)支持[5]。
由于圖書館人員有限,除去基本業(yè)務需要的人員后,從事專業(yè)地方文獻數(shù)字化的人員則少之更少,而圖書館館藏資源極其豐富,每個數(shù)據(jù)庫的數(shù)據(jù)量又非常大。因此,外包給專業(yè)的公司進行合作建庫是建設高質(zhì)量特色數(shù)據(jù)庫的發(fā)展方向。
數(shù)據(jù)庫的質(zhì)量是整個數(shù)據(jù)庫生命力的體現(xiàn),是數(shù)據(jù)庫能否長期存在的關(guān)鍵。建設數(shù)據(jù)庫時要對數(shù)據(jù)資源、服務平臺、著錄標引、數(shù)據(jù)庫系統(tǒng)等方面認真制定質(zhì)量保障措施。高質(zhì)量的具有地方特色的數(shù)據(jù)庫所涵蓋的資源內(nèi)容應做到全、專、精,服務平臺要符合既定主題特點和用戶使用習慣,滿足用戶基本需求,從用戶的角度出發(fā)。數(shù)據(jù)著錄加工應準確無誤,數(shù)據(jù)庫系統(tǒng)能夠提供良好運行狀態(tài)及基本功能要求。外包公司往往更重視“量”而忽略了“質(zhì)”,而且前期本館與合作公司也并沒有講明相應的制約制度。在以后合作建庫時,合同中應明確質(zhì)量要求,錯誤率達到多少時應有相應的懲罰措施,并組織人員定期進行考核檢驗,以確保地方特色庫建設質(zhì)量。
《盛京時報》合作建庫是遼寧省圖書館的首次嘗試,因此缺乏相關(guān)經(jīng)驗。交代相關(guān)技術(shù)指標和錄入規(guī)范后并沒有及時對數(shù)據(jù)質(zhì)量進行跟蹤檢查,等到數(shù)據(jù)庫全部建成后才發(fā)現(xiàn)其中存在的錯誤,這給后期檢查修正工作造成了麻煩,增加了許多不必要的工作量。因此合作建庫時,前期應對外包公司進行短期培訓,進行良好的溝通。工作初期就進行及時檢查,發(fā)現(xiàn)錯誤立即改正,避免在數(shù)據(jù)庫整體建成時一起檢查,導致問題堆積,錯誤量擴大,增加后期檢查的工作量,造成不必要的麻煩。
數(shù)據(jù)庫的建設要符合規(guī)范的技術(shù)標準,這是建設高質(zhì)量數(shù)據(jù)庫的重要保障之一。建庫時應采用符合標準規(guī)定的軟件平臺,不同類型和不同層面的應用系統(tǒng)遵循統(tǒng)一標準規(guī)范。標準規(guī)范地建設數(shù)據(jù)庫是保證數(shù)據(jù)質(zhì)量、滿足用戶需求、實現(xiàn)資源共享的前提[5]。因此,在建設過程中,著錄標準依據(jù)《中文圖書著錄條例》,以確保讀者能夠準確、完整、迅速地檢索到所需信息資源。我們在合作建庫時應制定詳細的技術(shù)標準,并在合同中有所體現(xiàn)。
目前,圖書館建好數(shù)據(jù)庫后,只是在主頁上顯示,很少進行一些宣傳和推廣,讀者了解和知道的不多,數(shù)據(jù)庫并不能充分發(fā)揮其作用,因此今后圖書館建好數(shù)據(jù)庫后一定要加強宣傳和推廣工作。可以主動為用戶提供數(shù)據(jù)庫使用情況的培訓,演示數(shù)據(jù)庫使用方法,提高用戶使用數(shù)字資源的技能,以實現(xiàn)數(shù)據(jù)庫效益最大化,讓地方文獻數(shù)據(jù)庫更好地發(fā)揮長期作用和價值。也可以考慮讓合作公司在一些專業(yè)網(wǎng)站上進行地方文獻數(shù)據(jù)庫的宣傳,讓廣大讀者了解并充分利用。
隨著數(shù)字圖書館的迅猛發(fā)展,具有地方特色的數(shù)據(jù)庫的開發(fā)腳步已經(jīng)跟不上讀者的需求,如何用最短的時間創(chuàng)造最大的價值,已經(jīng)成為我們工作的首要任務。合作建庫形式從實踐結(jié)果看,利大于弊,確實大大縮短了加工時間,提高了工作效率,也給以后合作建庫指明了方向,并提供了寶貴的經(jīng)驗。數(shù)據(jù)庫建設是數(shù)字圖書館服務的前提和基礎,地方特色數(shù)據(jù)庫的建設更是數(shù)字圖書館建設的核心與關(guān)鍵,其建設的數(shù)量和質(zhì)量直接決定著一所圖書館的現(xiàn)代化發(fā)展水平與服務水平。只要我們共同努力,地方特色數(shù)據(jù)庫的建設必將實現(xiàn)質(zhì)的飛躍。
[1]徐紅嵐.《盛京時報》述略[J].圖書館學刊,1989(2):38,32.
[2]王路.《盛京時報》研究[D].長春:東北師范大學,2008.
[3]郭廣堃.利用TPI系統(tǒng)建設特色館藏數(shù)據(jù)庫——以《盛京時報》數(shù)據(jù)庫為例[J].河南圖書館學刊,2009(6):74-75.
[4]張明霞.委托建庫——回溯書目數(shù)據(jù)庫建設的新方式[J].圖書情報工作,2002(11):76-78.
[5] 劉毅力,秦靜.高校圖書館特色數(shù)據(jù)庫建設的研究[J].現(xiàn)代情報,2009(12):95-96.
[6]吳麗杰.民國文獻數(shù)據(jù)庫建設管見——以遼寧省圖書館為例[J].圖書館工作與研究,2011(11):35-38.