李芳+陳進(jìn)+王昕
摘要 長期以來,圖書館對地方歷史文獻(xiàn)重發(fā)現(xiàn)和收藏、輕科學(xué)整理的狀況,致使這些珍貴的文獻(xiàn)得不到全面系統(tǒng)的揭示和充分利用。此文以上海交通大學(xué)圖書館新藏地方歷史文獻(xiàn)的整理和數(shù)字化建設(shè)為例,分析地方歷史文獻(xiàn)的特點及對其數(shù)字化的方案,通過行業(yè)掃描和自身環(huán)境分析,在數(shù)字化建設(shè)通用原則的基礎(chǔ)上,提出了“求真”、“求用”的補充性原則,從資料整理、數(shù)字化標(biāo)準(zhǔn)、元數(shù)據(jù)規(guī)范、質(zhì)量審核、資源保存和過程管理六個方面,系統(tǒng)深入地論述了地方歷史文獻(xiàn)的數(shù)字化管理和規(guī)范體系建設(shè)。
關(guān)鍵詞 地方歷史文獻(xiàn) 數(shù)字化 上海交通大學(xué)圖書館
l 引言
近十年來,地方歷史文獻(xiàn)的發(fā)現(xiàn)、收藏數(shù)量呈井噴態(tài)勢,“徽州、清水江流域、浙南,是目前發(fā)現(xiàn)量最大的三個地域,總數(shù)已超過100萬件”[1],其中徽州文書被譽為是“繼甲骨文字、漢晉簡帛、敦煌文書、明清檔案之后中國文獻(xiàn)史上第五大發(fā)現(xiàn)”[2]。但是在規(guī)模不斷增長的地方歷史文獻(xiàn)中,經(jīng)過整理、出版和數(shù)字化的只是極少部分,對地方歷史文獻(xiàn)重發(fā)現(xiàn)收藏、輕科學(xué)整理的狀況,致使這些珍貴的文獻(xiàn)得不到全面系統(tǒng)的揭示和充分利用。近年來,“史學(xué)研究與數(shù)字化時代同步推進(jìn)趨勢日益明顯”[3],數(shù)字資源已成為學(xué)術(shù)交流與研究的重要基礎(chǔ),作為為歷史研究提供原始文獻(xiàn)資料加工的基礎(chǔ)工作,地方歷史文獻(xiàn)的數(shù)字化是當(dāng)務(wù)之急。
上海交通大學(xué)圖書館目前新藏地方歷史文獻(xiàn)33萬件,主要來自浙江、安徽、福建、江西,此外還有湖北、河北、遼寧、云南等多個省份,最北至遼寧喀喇沁左旗,最南至云南蒙自縣。入藏文獻(xiàn)已覆蓋浙江、安徽、福建、江西四省總計36%的縣份,是目前最能夠系統(tǒng)反映東南地區(qū)傳統(tǒng)社會的文獻(xiàn)群。上海交通大學(xué)圖書館聯(lián)合上海交通大學(xué)歷史系,依托?!?85計劃”三期專項建設(shè)項目——契約文書的數(shù)字化加工及編目、教育部CALIS三期專題特色數(shù)據(jù)庫建設(shè)項目等,對館藏地方歷史文獻(xiàn)開展了系統(tǒng)的整理、保護(hù)性修復(fù)和數(shù)字化工作。在文獻(xiàn)調(diào)研和分析的基礎(chǔ)上,探索和總結(jié)出一套完整的數(shù)字化管理和規(guī)范體系,以期激發(fā)圖書館界對地方特色文獻(xiàn)的組織和揭示的重視,為地方歷史文獻(xiàn)的數(shù)字化建設(shè)提供參考。
2 文獻(xiàn)特點及其對數(shù)字化的影響
2.1 特點
地方歷史文獻(xiàn)主要產(chǎn)生于民間的日常生活,目前尚無達(dá)成學(xué)界共識的定義,在不同的語境中也被稱為民間歷史文獻(xiàn)、民間文書、歷史文書檔案等。主要包括買賣契約、賬本、家譜、書信、收據(jù)、分家文書等,學(xué)者可從中窺見民間的歷史記憶,復(fù)原活生生的、豐富多彩的民間社會生活。從整理和數(shù)字化的角度看,地方歷史文獻(xiàn)的特點也明顯區(qū)別于其他文獻(xiàn):
(1) 民間性。地方歷史文獻(xiàn)的創(chuàng)造主體或使用主體是普通老百姓。未經(jīng)過知識再整理的過程,是地方歷史文獻(xiàn)民間性最顯著的特點,其原始留存狀態(tài)往往是學(xué)術(shù)研究中重要的線索。
(2) 歸戶性。整理者和研究者將收集到的文獻(xiàn)以家族為單位進(jìn)行分類整理,這一過程稱為歸戶[4]。民間文獻(xiàn)的特性在于其具有特定的生產(chǎn)使用機制、流傳方式、保存系統(tǒng),尤其是同一家庭的各種文獻(xiàn)之間有內(nèi)在的系統(tǒng)性和關(guān)聯(lián)性。
(3) 非組織化。地方歷史文獻(xiàn)是一種非組織化的知識載體,不存在學(xué)術(shù)傳承脈絡(luò)?,F(xiàn)代文獻(xiàn)分類使用《中國圖館分類法》以及古籍圖書使用的四部分類法等具有共同的特點,它們主要是針對有組織的知識載體的分類體系,無法適用于地方歷史文獻(xiàn),需要設(shè)計新的分類法。
(4) 動態(tài)性。地方歷史文獻(xiàn)的時間跨度長,跨越明、清,延至民國時期,數(shù)量龐大,分散于民間,隨著學(xué)者的不斷收集和發(fā)掘,其收藏數(shù)量與涉及的內(nèi)容,都將持續(xù)擴增,因此是一個動態(tài)的概念。
2.2 對文獻(xiàn)整理和數(shù)字化的影響
地方歷史文獻(xiàn)從其載體形態(tài)到文獻(xiàn)內(nèi)容都與現(xiàn)代文獻(xiàn)、外國文獻(xiàn)不同,與成冊的古籍文獻(xiàn)不同,分析其文獻(xiàn)特點及其對數(shù)字化的影響,是文獻(xiàn)整理和數(shù)字化管理的基礎(chǔ)和前提。
(1) 原始狀態(tài)的記錄和保存??紤]到原始留存狀態(tài)對文獻(xiàn)研究的重要作用,為避免原始留存記錄受到文獻(xiàn)買賣中介的阻斷和影響,有必要在收購過程中,對文獻(xiàn)中介持有人進(jìn)行深入了解和記錄;在清點、登記、入藏、修復(fù)和數(shù)字化過程中,保存文獻(xiàn)原始的留存狀態(tài),保持文獻(xiàn)狀態(tài)在數(shù)字化前后的一致性。
(2) 歸戶與文獻(xiàn)編目:歸戶有利于揭示文獻(xiàn)內(nèi)在的關(guān)聯(lián)性,因此地方歷史文獻(xiàn)的整理和編目必須歸戶,并以村落為中心,元數(shù)據(jù)集的設(shè)計必須考慮歸戶信息,才能保證文書具有完整性和配套性,從而避免打破文獻(xiàn)之間既有的有機聯(lián)系。
(3) 分類及其擴展性。設(shè)計新的分類體系來組織和揭示地方歷史文獻(xiàn)應(yīng)考慮人工判定的快速有效;數(shù)字化信息時代,分類法的應(yīng)用與數(shù)據(jù)庫開發(fā)、知識庫的構(gòu)建有關(guān),便于檢索和知識組織體系的兼容都是必須考慮的因素。此外,地方歷史文獻(xiàn)的動態(tài)性為其分類法的編制提出了挑戰(zhàn),我們不能僅僅著眼于已入藏的文獻(xiàn),還要考慮較強的可擴展性。
3 地方歷史文獻(xiàn)的數(shù)字化建設(shè)規(guī)劃
地方歷史文獻(xiàn)具有的民間性和原生態(tài)、動態(tài)性和非組織化,使其數(shù)字化處理和編目的難度更大,但也因此更具探索性和挑戰(zhàn)性。面對規(guī)??捎^、獨具特色、珍貴稀缺的史料,其數(shù)字化建設(shè)發(fā)展規(guī)劃要有充分的調(diào)研和多角度的整體考量,既要符合數(shù)字圖書館的發(fā)展特點,又能滿足歷史學(xué)研究的需求;既要為人文社會科學(xué)的信息化、數(shù)字化發(fā)展提供支持,也要為今后的資源共享提供服務(wù),以滿足多層次的需求。為制定數(shù)字化建設(shè)的規(guī)劃,上海交通大學(xué)圖書館開展了行業(yè)掃描,行業(yè)包括圖書館和史學(xué)研究領(lǐng)域,以明確建設(shè)目標(biāo);并對所處的內(nèi)部環(huán)境進(jìn)行剖析,確定關(guān)鍵問題和突破點。
3.1 行業(yè)掃描:明確目標(biāo)和關(guān)鍵點
行業(yè)掃描是一種橫向考察和比較,通過與同行進(jìn)行比較分析,發(fā)現(xiàn)地方歷史文獻(xiàn)數(shù)字化建設(shè)的現(xiàn)狀和存在的問題,同時還可以參考相關(guān)機構(gòu)的做法,制定更具特色和前瞻性的發(fā)展規(guī)劃和目標(biāo)。地方歷史文獻(xiàn)數(shù)字化建設(shè)的行業(yè)掃描不應(yīng)僅局限于圖書館行業(yè),還應(yīng)擴展到歷史學(xué)研究機構(gòu)。endprint
首先,我們對圖書館行業(yè)、地方歷史文獻(xiàn)研究機構(gòu)進(jìn)行了調(diào)研,調(diào)研數(shù)據(jù)顯示[5],國內(nèi)徽州民間歷史文獻(xiàn)的收藏單位約20家,極少數(shù)單位開展了數(shù)字化和數(shù)據(jù)庫建設(shè),且均處于小批量嘗試階段,摸索和總結(jié)地方歷史文獻(xiàn)數(shù)字化的科學(xué)管理流程和規(guī)范,既具有基礎(chǔ)性,又具有前沿性。通過網(wǎng)上調(diào)研、文獻(xiàn)調(diào)研和實地考察我們發(fā)現(xiàn),地方歷史文獻(xiàn)的數(shù)字化和數(shù)據(jù)庫建設(shè)存在一些問題,大體可概括為:
1) 缺乏針對地方歷史文獻(xiàn)的數(shù)字化標(biāo)準(zhǔn)。在過去的十年中,世界各國各地的圖書館及機構(gòu),如美國國會圖書館、英國的AHRC(Arts and HumanitiesResearch Council)、歐洲的TAPE(Training for Audiovisual Preservation in Europe)項目、美國馬里蘭大學(xué)圖書館和哈佛大學(xué)圖書館等開展了一系列數(shù)字化項目,積累了大量的數(shù)字資源和標(biāo)準(zhǔn)規(guī)范成果。在國內(nèi),國家科技部的《我國數(shù)字圖書館標(biāo)準(zhǔn)與規(guī)范建設(shè)》(CDLS)項目和國家數(shù)字圖書館工程標(biāo)準(zhǔn)規(guī)范項目等也在這方面取得了階段性進(jìn)展。但是在現(xiàn)有的數(shù)字資源加工標(biāo)準(zhǔn)規(guī)范中,通用數(shù)字資源一般包括文本、圖像、視頻和音頻等。而地方歷史文獻(xiàn)并非普通的文本資源,由于來自民間,其載體多樣(紙、皮、布)、幅面不規(guī)則、顏色深淺不一,沒有現(xiàn)成的標(biāo)準(zhǔn)可以直接用于其數(shù)字化,給文獻(xiàn)數(shù)字化標(biāo)準(zhǔn)的選擇和加工帶來難度。
2) 學(xué)界尚無統(tǒng)一的分類標(biāo)準(zhǔn)。地方歷史文獻(xiàn)的分類復(fù)雜,20世紀(jì)90年代初,“徽學(xué)界提出了兩種分類方法《徽學(xué)文書類目》和《徽州歷史檔案總目提要》”[1],這是大陸學(xué)界較早編制的民間文書目錄與分類體系,根據(jù)文獻(xiàn)敘述內(nèi)容進(jìn)行分類,代表了當(dāng)時大陸學(xué)界的意見。黃山學(xué)院圖書館特藏部徽學(xué)資料中心[3]就是使用《徽學(xué)文書類目》,將文書劃分成9大類。中山大學(xué)圖書館“采用文獻(xiàn)類型分類和文獻(xiàn)內(nèi)容分類相結(jié)合的綜合分類原則”[4],將徽州民間歷史文獻(xiàn)分為16大類。分類整理工作陷于眾多收藏研究機構(gòu)各自為戰(zhàn)的混亂狀態(tài)。
3)專門元數(shù)據(jù)規(guī)范尚未建立。2007年,國家科技部推出《專門數(shù)字對象描述元數(shù)據(jù)規(guī)范》[6],元數(shù)據(jù)規(guī)范涉及十余項不同類型的資源對象,包括具有中國文化特色的文獻(xiàn)資料類型(如古籍、拓片、輿圖等),但地方歷史文獻(xiàn)不在其列。2011年國家數(shù)字圖書館工程標(biāo)準(zhǔn)規(guī)范項目相關(guān)研究成果推出,專門元數(shù)據(jù)規(guī)范分為古文獻(xiàn)、電子書刊和網(wǎng)絡(luò)多媒體資源三大類型,共涉及13種文獻(xiàn)[7]。地方歷史文獻(xiàn)的元數(shù)據(jù)規(guī)范均未列入現(xiàn)有的專門元數(shù)據(jù)規(guī)范中。
4) 資源分散收藏,不利于系統(tǒng)研究。通過調(diào)研發(fā)現(xiàn),被譽為中國文獻(xiàn)史上第五大發(fā)現(xiàn)的徽州文書,目前分散在中山大學(xué)、安徽大學(xué)、黃山學(xué)院、上海交通大學(xué)、中國社會科學(xué)院等多家不同機構(gòu),這種因征集渠道、征集地點和征集時間的不同,而導(dǎo)致收藏分散,破壞了文獻(xiàn)研究的整體性和系統(tǒng)性,不利于徽州文書的研究和利用。
在對環(huán)境掃描進(jìn)行綜合分析后,上海交通大學(xué)圖書館明確了在現(xiàn)有國家標(biāo)準(zhǔn)和規(guī)范框架的指導(dǎo)下,開展數(shù)字化建設(shè)工作,并最終建成地方歷史文獻(xiàn)特色數(shù)據(jù)庫服務(wù)系統(tǒng)的基本目標(biāo)。為實現(xiàn)上述目標(biāo),明確了任務(wù)和關(guān)鍵點,包括:
1) 通過對國內(nèi)外數(shù)字化加工標(biāo)準(zhǔn)和規(guī)范的調(diào)研,盡可能直接引用或參考國際上已經(jīng)普遍應(yīng)用的技術(shù)標(biāo)準(zhǔn),如國家圖書館數(shù)字資源唯一標(biāo)識符規(guī)范研究成果可直接成為地方歷史文獻(xiàn)的參考標(biāo)準(zhǔn)。
2) 尋求專業(yè)合作,依托學(xué)校地方歷史文獻(xiàn)研究中心,“根據(jù)文書特定的產(chǎn)生源流和社會功能,提出以數(shù)據(jù)庫應(yīng)用為導(dǎo)向的分類原則,分類法的原則遵循批量處理時的效率、分類概念間的不相容性以及二次檢索的效率”[1],并進(jìn)行分類法的適用性測試。考慮到文書作為一個不斷擴展的資料群,分類法應(yīng)具有可擴展性。3)元數(shù)據(jù)規(guī)范方面,遵從科技部《專門數(shù)字對象描述元數(shù)據(jù)規(guī)范設(shè)計指南》的總體框架,在將復(fù)用DC15個元素中的大部分元素作為核心元素集的同時,根據(jù)地方歷史文獻(xiàn)的特點,制定所需的個別元素。
4) 數(shù)字資源合作共享,在調(diào)研、比較的基礎(chǔ)上,明確數(shù)字化建設(shè)應(yīng)遵循的標(biāo)準(zhǔn)化、兼容性等原則,開展數(shù)字化和知識組織,建設(shè)地方歷史文獻(xiàn)特色數(shù)據(jù)庫。數(shù)字資源將有利于實現(xiàn)珍貴歷史文獻(xiàn)的共享,有助于研究者發(fā)現(xiàn)文獻(xiàn)內(nèi)部的有機聯(lián)系,拓展新的研究議題。
3.2 微觀審視:找準(zhǔn)問題和突破口
在制定地方歷史文獻(xiàn)數(shù)字化建設(shè)規(guī)劃時,要在掃描宏觀環(huán)境、行業(yè)形勢后,對所處的微觀環(huán)境(即內(nèi)部環(huán)境)進(jìn)行剖析。微觀環(huán)境直接決定著具體規(guī)劃的實施,是確定數(shù)字化建設(shè)發(fā)展目標(biāo)的決定性因素。
上海交通大學(xué)的文科建設(shè)正處于重點扶持和大力發(fā)展階段,地方歷史文獻(xiàn)是由學(xué)校出巨資、由歷史系深人民間收購而來,它對于文化保存與學(xué)術(shù)研究所具有的重要性不言而喻,只有開展文獻(xiàn)的整理和數(shù)字化才是對這些珍貴史料的保護(hù)和利用。歷史系、地方歷史文獻(xiàn)研究中心的研究團隊依托這些文獻(xiàn),可以展開對中國東南山區(qū)社會經(jīng)濟史的全面研究,研究團隊現(xiàn)已開辟多個專項研究,正迫切希望通過文獻(xiàn)的整理和數(shù)字化建設(shè),挖掘并開拓出一系列嶄新的研究課題。
通過對學(xué)校發(fā)展要求、用戶群的需求分析,圖書館積極爭取學(xué)校領(lǐng)導(dǎo)的支持,與歷史系、地方歷史文獻(xiàn)研究中心聯(lián)合并保持密切協(xié)同,主動與學(xué)校相關(guān)部門溝通,就項目建設(shè)的經(jīng)費、專業(yè)隊伍、合作建設(shè)、業(yè)務(wù)規(guī)范等逐一規(guī)劃、落實。
1) 經(jīng)費問題:在項目規(guī)劃建設(shè)初期,經(jīng)費的落實成為首要問題。圖書館積極爭取分管校領(lǐng)導(dǎo)的支持,學(xué)校支持并召開了項目建設(shè)任務(wù)和經(jīng)費落實的會議,并設(shè)立985專項建設(shè)項目,數(shù)字化加工、殺蟲除菌設(shè)備等費用得以落實,項目的實質(zhì)性啟動具備了條件;
2) 專業(yè)隊伍:圖書館成立專項小組開展地方歷史文獻(xiàn)的數(shù)字化和編目,以保證人員的穩(wěn)定性;并開辟專門空間開展數(shù)字化、編目和修復(fù)工作;
3) 合作建設(shè):地方歷史文獻(xiàn)的整理工作是融研究于整理,需要史學(xué)專業(yè)人員的參與和指導(dǎo),圖書館與歷史系、地方歷史文獻(xiàn)研究中心聯(lián)合開展文獻(xiàn)整理工作,歷史系派專業(yè)人員全程參與現(xiàn)場指導(dǎo),并開展文獻(xiàn)的保護(hù)性修復(fù);在數(shù)據(jù)庫建設(shè)上,與出版社結(jié)成戰(zhàn)略合作伙伴,在數(shù)字出版和數(shù)據(jù)庫制作、搜索等方面緊密合作,使數(shù)字產(chǎn)品更加易用化、人性化。endprint
4) 業(yè)務(wù)規(guī)范:編制《上海交通大學(xué)圖書館地方歷史文獻(xiàn)業(yè)務(wù)規(guī)范手冊》,就文獻(xiàn)的整理、編號、掃描、修復(fù)、編目、包裝等業(yè)務(wù)流程進(jìn)行規(guī)劃設(shè)計。
上海交通大學(xué)圖書館通過對行業(yè)環(huán)境掃描和對所處微觀環(huán)境的全面分析,向?qū)W校提交了地方歷史文獻(xiàn)專項建設(shè)的申請和任務(wù)計劃書,提出了建設(shè)目標(biāo):基本建成國內(nèi)外有影響力的地方文化研究專題特色資源的元數(shù)據(jù)倉儲服務(wù)系統(tǒng),為學(xué)校歷史學(xué)、社會學(xué)等學(xué)科發(fā)展和研究提供保障,并力爭成為國內(nèi)乃至世界上最好、最完整的地方歷史文獻(xiàn)服務(wù)中心。在這一目標(biāo)的引領(lǐng)下,科學(xué)規(guī)范地開展地方歷史文獻(xiàn)的數(shù)字化建設(shè)工作。
4 地方歷史文獻(xiàn)數(shù)字化建設(shè)的總體原則
在數(shù)字化建設(shè)總體規(guī)劃和目標(biāo)的指導(dǎo)下,首先確定了建設(shè)過程中應(yīng)遵循的原則??傮w上,地方歷史文獻(xiàn)的數(shù)字化遵循“我國數(shù)字圖書館工程標(biāo)準(zhǔn)規(guī)范建設(shè)”的通用性原則,同時結(jié)合地方歷史文獻(xiàn)的特點和需求,還提出地方歷史文獻(xiàn)數(shù)字化的兩個補充性原則。
4.1 通周性原則
1) 標(biāo)準(zhǔn)化原則。
標(biāo)準(zhǔn)化將提升地方歷史文獻(xiàn)數(shù)字化產(chǎn)品在將來使用的可能性,有助于數(shù)據(jù)交換和資源共享。具體表現(xiàn)在元數(shù)據(jù)標(biāo)準(zhǔn)的選擇、內(nèi)容主題描述語言的選擇、資源組織描述的標(biāo)準(zhǔn)規(guī)范、數(shù)字資源系統(tǒng)服務(wù)的標(biāo)準(zhǔn)規(guī)范、數(shù)字資源長期保存的標(biāo)準(zhǔn)規(guī)范等多個方面。上述標(biāo)準(zhǔn)規(guī)范的選擇須認(rèn)真參照和采用國家科技部和國家圖書館的研究成果。
2) 可擴展性原則。
遵從《專門數(shù)字對象描述元數(shù)據(jù)規(guī)范設(shè)計指南》的總體框架,在地方歷史文獻(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn)選擇和制定中,一方面應(yīng)盡可能采用國際主流元數(shù)據(jù)標(biāo)準(zhǔn)都柏林核心元數(shù)據(jù)集(Dublin Core,DC),同時按需復(fù)用DC各應(yīng)用方案和其他元數(shù)據(jù)規(guī)范中的元素或修飾詞,并建立相應(yīng)的映射關(guān)系。
同時,考慮到地方歷史文獻(xiàn)既不是一般檔案資料,又非單一內(nèi)容的專業(yè)學(xué)科主題文獻(xiàn),加之目前尚未形成統(tǒng)一的分類標(biāo)準(zhǔn),其數(shù)字化產(chǎn)品的分類法宜結(jié)合文獻(xiàn)的動態(tài)性,著眼于未來發(fā)展,提供較高的可擴展性。
3) 兼容性原則。
考慮與國內(nèi)代表性元數(shù)據(jù)應(yīng)用方案,如《專門數(shù)字對象描述元數(shù)據(jù)規(guī)范》的兼容問題;同時,要充分考慮與CALIS、中科院以及其他一些行業(yè)的數(shù)字圖書館系統(tǒng)的標(biāo)準(zhǔn)兼容問題,以保證各系統(tǒng)間互操作的實現(xiàn)。
4.2 補充性原則
1)求“真”原則。
地方歷史文獻(xiàn)的重要功能是保存,所以必須求真。在整理方式上通過一次編號、二次編號以確保文獻(xiàn)的原有留存狀態(tài)和次序。在數(shù)字化加工時,對不規(guī)則幅面等細(xì)節(jié),在圖像中保留毛邊等原始文獻(xiàn)的物理狀態(tài)。
2) 求“用”原則。
地方歷史文獻(xiàn)的地域特征明顯,無論是對于單件還是成冊的地方歷史文獻(xiàn),在元數(shù)據(jù)的元素設(shè)置時,都要求我們對研究者和使用者的需求進(jìn)行深入的調(diào)研和分析,找出最重要的著錄事項,如事主、歸戶、標(biāo)的等信息,使得元素設(shè)置能滿足研究者的檢索需求。如用戶有需求,還應(yīng)對重要文獻(xiàn)進(jìn)行全文抄錄,融研究于整理,在此基礎(chǔ)上構(gòu)建便于檢索、便于研究的全文數(shù)據(jù)庫。
5 地方歷史文獻(xiàn)的數(shù)字化規(guī)范設(shè)計
在整體規(guī)劃、目標(biāo)和建設(shè)原則的指導(dǎo)下,數(shù)字化建設(shè)的規(guī)范設(shè)計主要涉及:資料整理規(guī)范、數(shù)字化加工標(biāo)準(zhǔn)、元數(shù)據(jù)規(guī)范與設(shè)計、質(zhì)量審核標(biāo)準(zhǔn)、保存和過程管理。
5.1 資料整理規(guī)范
地方歷史文獻(xiàn)的整理既要考慮保持地方歷史文獻(xiàn)的原始關(guān)聯(lián)性,又要揭示不同文本類型的意義,上海交通大學(xué)圖書館通過地方歷史文獻(xiàn)的整理實踐,融研究人整理,建立了科學(xué)的地方歷史文獻(xiàn)整理流程和規(guī)范。
(1) 編制了符合地方歷史文獻(xiàn)特點和研究需求的《上海交通大學(xué)圖書館地方歷史文獻(xiàn)業(yè)務(wù)規(guī)范手冊》,用以指導(dǎo)數(shù)字化工作的開展;
(2) 明確了文獻(xiàn)著錄中參照采用的規(guī)范,包括“常見異體字及俗字與規(guī)范字對照表”、“中西歷法轉(zhuǎn)換系統(tǒng)”、“上海交通大學(xué)地方文獻(xiàn)整理分類法”等;
(3) 制定了清晰的業(yè)務(wù)流程,包括清點、登記、編號、殺蟲除菌、入藏、拍照、保護(hù)性修復(fù)、數(shù)字化、編目著錄、包裝、整理入庫等步驟;
(4) 建立了規(guī)范的清點、登記、著錄的制度,如“待掃描文書登記表”、“轉(zhuǎn)出修復(fù)登記表”、“需修復(fù)文獻(xiàn)跟蹤表”、“文獻(xiàn)編號工作手冊”等。
為確保文獻(xiàn)的原有留存狀態(tài)和歸戶,設(shè)計了分次、分級編號,因此文獻(xiàn)的編號分為初次編號、二次編號和分級編號。初次編號是文獻(xiàn)清點時,根據(jù)初始的保存形態(tài),以袋、包為依據(jù)對每一袋、每一包編號。二次編號是對每一件歷史文獻(xiàn)進(jìn)行編號,包含來源碼(文獻(xiàn)的收集來源)、收集日期編碼、歸戶信息碼、掃描件編碼(整理時自然產(chǎn)生的流水號)等信息。由于大量的地方歷史文獻(xiàn)需修復(fù)后才能正式編號、分級編號,是依據(jù)《古籍特藏破損定級標(biāo)準(zhǔn)》對文獻(xiàn)的破損等級進(jìn)行分級,判斷為A、B級的文獻(xiàn)歸為不需修復(fù)一類,C級文獻(xiàn)歸為需要修復(fù)一類。需要修復(fù)的文書在修復(fù)完成后再正式編號。
5.2 數(shù)字化標(biāo)準(zhǔn)
分析確立應(yīng)采用的數(shù)字編碼與內(nèi)容標(biāo)記標(biāo)準(zhǔn),針對保存格式、瀏覽格式提出該采用的數(shù)字內(nèi)容格式標(biāo)準(zhǔn),確立數(shù)字資源加工標(biāo)準(zhǔn)和程序的選擇原則,編制數(shù)字資源建設(shè)指南的基本操作規(guī)范。我們將地方歷史文獻(xiàn)的數(shù)字化分為長期保存級和發(fā)布服務(wù)級,并根據(jù)文獻(xiàn)特點制定了相應(yīng)的技術(shù)標(biāo)準(zhǔn)和格式,詳見表1。
5.3 元數(shù)據(jù)規(guī)范與設(shè)計
(1) 元數(shù)據(jù)規(guī)范的基本結(jié)構(gòu)及擴展。
我國科技部重大項目《我國數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)》的子項目《專門數(shù)字對象描述元數(shù)據(jù)規(guī)范》,對14種不同類型的元數(shù)據(jù)規(guī)范進(jìn)行了設(shè)計,并且推出了《專門數(shù)字對象描述元數(shù)據(jù)規(guī)范設(shè)計指南》,以保證各種元數(shù)據(jù)規(guī)范在功能、數(shù)據(jù)結(jié)構(gòu)、格式、語義、語法等方面的一致性和整體性。
地方歷史文獻(xiàn)元數(shù)據(jù)規(guī)范遵從《專門數(shù)字對象描述元數(shù)據(jù)規(guī)范設(shè)計指南》的總體框架,在復(fù)用DC15個元素中的大部分元素作為核心元素集的同時,根據(jù)地方歷史文獻(xiàn)的特點,制定所需的個別元素。地方歷史文獻(xiàn)描述元數(shù)據(jù)規(guī)范的基本結(jié)構(gòu)由核心元素、個別元素兩部分組成。這兩個層次的劃分目的是為了在保證各種不同元數(shù)據(jù)標(biāo)準(zhǔn)的一致性與整體性的基礎(chǔ)上,最大限度地體現(xiàn)地方歷史文獻(xiàn)的個性特征,使標(biāo)準(zhǔn)具有更強的包容性和靈活性,支持?jǐn)?shù)據(jù)交換和檢索,實現(xiàn)數(shù)據(jù)共享。遵循這一結(jié)構(gòu),地方歷史文獻(xiàn)元數(shù)據(jù)設(shè)置了核心元素、個別元素共20個。endprint
(2) 元數(shù)據(jù)關(guān)聯(lián)。
對下列情況建立關(guān)聯(lián),主要是文獻(xiàn)、事件、記錄和對象的關(guān)聯(lián)。
文獻(xiàn)關(guān)聯(lián)——設(shè)置元素“歸戶”,將來源于同一家戶、不同類型的文獻(xiàn)之問實現(xiàn)關(guān)聯(lián)。示例:同一家戶的地契、賬本,通過歸戶建立關(guān)聯(lián)。
事件關(guān)聯(lián)——設(shè)置元素“事主”和“第一事主”等,將同一事主參與的不同的經(jīng)濟活動、鄉(xiāng)俗活動等事件實現(xiàn)關(guān)聯(lián)。
對象關(guān)聯(lián)——制定編碼和編號規(guī)則,在數(shù)字對象和記錄之間建立關(guān)聯(lián)。示例:編碼為011109150144的文獻(xiàn)和編號為0111091501440001至011109150144——0012的數(shù)字對象表明來自于“歙縣三十七區(qū)八段三甲歸戶清冊”的文獻(xiàn)和數(shù)字對象。
除元數(shù)據(jù)關(guān)聯(lián)外,在元數(shù)據(jù)加工時,規(guī)范了計算機用字,積累了大量民間屬性數(shù)據(jù),自動進(jìn)行繁簡字關(guān)聯(lián),收錄了異體字字典的內(nèi)容,從而實現(xiàn)異體關(guān)聯(lián)。檢索功能有特色,實現(xiàn)了正文、事主、標(biāo)的等小范圍內(nèi)的全文檢索。
(3) 分類標(biāo)準(zhǔn)的建立。
當(dāng)代出版物使用的《中國圖書館圖書分類法》以及古籍圖書使用的四部分類法等,是針對有組織的知識載體的分類體系;地方歷史文獻(xiàn)的特色恰在于其非組織化,不能適用于以上分類法。而目前史學(xué)界和圖書館界尚無統(tǒng)一的地方歷史文獻(xiàn)的分類標(biāo)準(zhǔn)。
上海交通大學(xué)圖書館嘗試探索分類法的設(shè)計及其理論依據(jù),和歷史系聯(lián)合編制設(shè)計了地方歷史文獻(xiàn)分類法。該分類法的設(shè)計以文獻(xiàn)的產(chǎn)生源流和社會功能為依據(jù),以數(shù)據(jù)庫應(yīng)用為導(dǎo)向,遵循四項原則:①分類主要依照文書性質(zhì);②確保批量處理的效率;③分類概念間不相容;④確保二次檢索效率。分類法設(shè)置一級類目13個,分別用字母A——M表示,包括:契約、賬本、賦役、訴訟、行政、家譜、信函、日用類書與工具書、家禮、宗教、戲劇、教育考試、醫(yī)藥。此外,考慮到地方歷史文獻(xiàn)的動態(tài)擴增,其數(shù)字化產(chǎn)品的分類法設(shè)計應(yīng)結(jié)合文獻(xiàn)的動態(tài)性,著眼于未來發(fā)展,該分類法在設(shè)計時提供了較高的可擴展性。“在每一大類下,都設(shè)置一個0號二級分類,供未來這一大類中新發(fā)現(xiàn)的尚無法歸人已有二級分類的文獻(xiàn)歸類,直到可以確定其性質(zhì)或建立新的二級分類?!盵1]見表2。
為測定分類法的適用性,利用編目抽檢結(jié)果、文獻(xiàn)計量等方法進(jìn)行了檢測,驗證該分類法在編目著錄中的有效性,該分類法在上海交通大學(xué)圖書館地方歷史文獻(xiàn)數(shù)字化項目建設(shè)中得以實際應(yīng)用。內(nèi)有表格
5.4 質(zhì)量審核
質(zhì)量審核主要針對元數(shù)據(jù)和數(shù)字對象質(zhì)量的審校。
(1) 元數(shù)據(jù)質(zhì)量檢驗。明確規(guī)定元數(shù)據(jù)的檢驗范圍,主要包括必備字段的完整著錄、各字段描述的準(zhǔn)確性、元數(shù)據(jù)和數(shù)字對象的對應(yīng)等。
(2) 數(shù)字對象質(zhì)量檢驗。檢驗范圍主要針對可用性信息和格式信息,可用性主要檢查數(shù)字對象是否可用、文件名命名是否正確、是否符合命名規(guī)范、附屬文件是否齊備、存儲路徑是否正確、掃描完整性等。各項技術(shù)指標(biāo)應(yīng)達(dá)到表1中的加工標(biāo)準(zhǔn)和規(guī)范,嚴(yán)格控制各種數(shù)據(jù)的綜合錯誤率。出現(xiàn)問題的應(yīng)進(jìn)行修正或重新掃描。
5.5 資源保存
數(shù)字資源的保存分為長期保存級和發(fā)布服務(wù)級,分別滿足長期保存和數(shù)據(jù)庫利用的需要。主要參考“國家圖書館數(shù)字資源對象管理規(guī)范”以及“數(shù)字資源加工標(biāo)準(zhǔn)與工作規(guī)范”的研究成果。
5.6 過程管理
(1) 過程管理表。
建立過程管理表,包括“待掃描文書登記表”、“轉(zhuǎn)出修復(fù)登記表”、“需修復(fù)文獻(xiàn)跟蹤表”、“文獻(xiàn)編號工作手冊”等,及時整理匯總,在數(shù)字化工作完成的同時建立完整規(guī)范的記錄。
(2) 安全管理機制。
為維護(hù)地方歷史文獻(xiàn)的稀缺性和珍貴性,應(yīng)建立數(shù)字加工各環(huán)節(jié)的安全管理機制,確保實物在掃描和修復(fù)等加工過程中不丟失、不損壞。例如,文獻(xiàn)入庫前,用真空除氮設(shè)備開展殺蟲除菌工作;文獻(xiàn)加工過程中采取全記錄跟蹤,建立各種登記表;依據(jù)國家《古籍特藏破損定級標(biāo)準(zhǔn)》,對破損文獻(xiàn)進(jìn)行分級,開展不同程度的保護(hù)性修復(fù)。
6 結(jié)語
各收藏機構(gòu)對地方歷史文獻(xiàn)重發(fā)現(xiàn)、收藏,而不重科學(xué)整理的狀況,致使這些珍貴的文獻(xiàn)得不到全面系統(tǒng)的揭示,阻礙了以地方歷史文獻(xiàn)為基礎(chǔ)的各項人文社會科學(xué)的研究。上海交通大學(xué)將地方歷史文獻(xiàn)與數(shù)字化這一現(xiàn)代信息組織和處理技術(shù)有機結(jié)合,探索和總結(jié)出一套完整的數(shù)字化管理和規(guī)范體系,全面科學(xué)地揭示新藏歷史文獻(xiàn)。希望這些有益探索對當(dāng)前的地方歷史文獻(xiàn)整理機構(gòu)或個人有所啟發(fā)和借鑒,我們同時希望能與相關(guān)機構(gòu)開展資源共享和合作,發(fā)揮資源規(guī)模優(yōu)勢,幫助史學(xué)研究者拓展新的研究課題。
參考文獻(xiàn)
1 趙思淵,湯萌.上海交通大學(xué)新藏地方歷史文獻(xiàn)的分類法及其依據(jù)[J].上海交通大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2014(3):76-86
2 張曉峰.徽州文書分類整理要點和疑難解析[J].大學(xué)圖書情報學(xué)刊,2008,(2):58-61,67
3 陸航,張翼.史學(xué)文獻(xiàn)數(shù)字化呼喚學(xué)者主動介入.中國社會科學(xué)報,2014年4月2日第A02版
4 劉伯山.徽州文書的整理與遺存.徽州文書(第一輯).桂林:廣西師范大學(xué)出版社,2005
5 王蕾,申斌.徽州民間歷史文獻(xiàn)整理方法研究——以中山大學(xué)圖書館館藏為例.圖書館論壇,2014,(4):120-126
6 “我國數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范專門數(shù)字對象捕述元數(shù)據(jù)規(guī)范”子項目.[2014 - 10 - 30]. http://cdls. nstl. gov. cn/2003/SpcMetadata/
7 國家數(shù)字圖書館工程標(biāo)準(zhǔn)規(guī)范.[2014 -10 - 30].http://jwww.nlc.gov.cn/newstgc/gjsztsggc/bzgf/
8 訪談郊振滿:為什么我們要進(jìn)村找廟、進(jìn)廟找碑?endprint