朱 利
(重慶中國三峽博物館,重慶 400015)
博物館古籍文獻的數(shù)字化建設(shè)分析
朱 利
(重慶中國三峽博物館,重慶 400015)
我國古籍數(shù)量繁多,并且內(nèi)容十分豐富,是文化遺產(chǎn)中十分重要組成部分,在文化史上發(fā)揮著積極的作用。古籍由于年代較久,破損、老化是必然的,因此,古籍的數(shù)字化建設(shè)極為必要。當前博物館提高了對古籍文獻數(shù)字化建設(shè)的重視程度,使用信息技術(shù)及數(shù)字化手段保護利用古籍文獻,實現(xiàn)古籍文獻的再生性保護,更好地發(fā)揮古籍文獻的重要作用。本文就博物館古籍文獻的數(shù)字化建設(shè)情況進行分析和研究。
博物館;古籍文獻;數(shù)字化建設(shè)
經(jīng)過5000年的歷史沉淀與積累,我國擁有很多古籍文獻,是無比珍貴的史料,也是重要的古代文化遺產(chǎn)。但是由于受到環(huán)境及人為因素的影響,一些傳世的古籍文獻遭到了損壞。當前博物館中的許多古籍文獻資料都是破損的,為此為了更好地收藏古籍文獻,對其進行科學(xué)的研究與利用,發(fā)揮其價值,就應(yīng)使用數(shù)字信息化手段對古籍文獻進行整理加工,建立數(shù)據(jù)庫,實現(xiàn)數(shù)字資源的共享。
1.1有助于保護古籍文獻資源
我國有著豐富的古籍文獻資源,這是我國古代文化的寶貴資源,必須要提高重視,加強保護。當前盡管我國已經(jīng)投入了大量的人力、物力開展古籍保護,但是這項工作依舊是比較困難和艱巨的。古籍文獻是不可再生的文化資產(chǎn),隨著時間的推移,其數(shù)量會逐漸減少。當前文獻資源逐步實現(xiàn)網(wǎng)絡(luò)化、數(shù)字化發(fā)展,古籍文獻也應(yīng)使用新的載體,數(shù)字化建設(shè)能夠?qū)崿F(xiàn)古籍文獻的永久保存,有助于古籍文獻史料價值的順利實現(xiàn)。
1.2實現(xiàn)古籍文獻資源的高效利用
古籍文獻是我國幾千年的文化精華,是前輩留給當代人的寶貴遺產(chǎn)。由于年代久遠,博物館收藏的很多古籍文獻的紙張已經(jīng)變質(zhì),不能再繼續(xù)流傳,有些珍本、孤本需要珍藏,不能流通使用。在防蟲、防霉工作的基礎(chǔ)上,通過禁止使用古籍文獻,從而對古籍文獻進行保護。但是這種方式與“書是為了使用”的原則相違背。對古籍文獻進行數(shù)字化建設(shè)能夠無限地檢索、復(fù)制使用,不需要直接使用古籍文獻原本,能夠長期保存,還有助于古籍文獻的傳播,對于開發(fā)利用是極為有利的。
1.3能夠全面揭示古籍文獻信息
實現(xiàn)古籍文獻的數(shù)字化建設(shè)能夠?qū)偶墨I中的信息資源進行有效開發(fā)。傳統(tǒng)的古籍文獻目錄只能依據(jù)書名、種類等進行檢索。古籍文獻的書目數(shù)據(jù)庫著錄書目涉及的信息比較廣,有題名、資源形式、種類、來源、責任者及相關(guān)資源等。古籍文獻書目數(shù)據(jù)庫能夠組配檢索,全面揭示古籍文獻書目信息,能夠更好地開發(fā)利用古籍文獻。
1.4能夠為使用者提供便利的檢索形式
古人治學(xué)不注重學(xué)科的細化,文、史、哲不分家,如果用手工的形式對古籍文獻進行檢索,不僅速度慢,而且查準率也比較低。為了查找一段引文、一件事會花費大量的時間。利用數(shù)字化的檢索系統(tǒng),可以將任何的字符作為檢索的著手點,不僅是關(guān)鍵詞檢索還是模糊檢索都能夠有良好的效果。全文檢索系統(tǒng)能夠?qū)Y(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)進行有效處理,能夠?qū)⑽墨I中的各種成分展示出來。這種檢索方式速度快,同時可以實現(xiàn)模糊檢索,在古籍文獻檢索中應(yīng)用是極為有利的。
2.1制訂計劃方案,進一步優(yōu)化管理機構(gòu)
工作開展前需要有完善的計劃方案,并明確工作的具體流程,能夠從實用性、整體性及效益等方面進行綜合分析,然后通過文檔的方式進行展現(xiàn),工作中保證嚴格按照計劃進度推進,因此在古籍文獻數(shù)字化建設(shè)前,博物館及相關(guān)單位需要針對工作流程進行細致的探究和分析,保證工作計劃及時間表的詳細完善。當前,博物館已經(jīng)積極推進古籍文獻的數(shù)字化建設(shè),但是博物館都是各自為政,彼此間的交流溝通不到位,而且缺少統(tǒng)一的領(lǐng)導(dǎo)者,不能對古籍文獻進行統(tǒng)一的指導(dǎo)。這時就需要發(fā)揮政府部門的作用,成立古籍文獻數(shù)字化小組,對博物館古籍文獻數(shù)字化建設(shè)的情況進行分析,制定統(tǒng)一的標準,為今后古籍文獻資源的利用奠定基礎(chǔ)。
2.2做好人才的培養(yǎng)工作
博物館的工作人員基本都是古文字、歷史文獻及圖書館等專業(yè)出身,古籍文獻數(shù)字化建設(shè)是比較系統(tǒng)的工作,需要長期推進,將傳統(tǒng)的方法與現(xiàn)代化的信息技術(shù)相結(jié)合。因此,博物館工作人員不僅需要掌握歷史文獻及古文字等相關(guān)知識,還需要熟練操作計算機。因此,應(yīng)積極加強復(fù)合型人才的培養(yǎng),建設(shè)專業(yè)化的博物館管理隊伍建設(shè),使其更好地為古籍文獻數(shù)字化建設(shè)服務(wù)。
2.3優(yōu)化數(shù)字化技術(shù)
第一,科學(xué)地選擇檢索方法。相比于閱讀,古籍文獻的查找檢索更多,古籍文獻數(shù)字化產(chǎn)品要求檢索系統(tǒng)比較強大,因此需要明確通過各種方式古籍文獻的數(shù)字化,以此為依據(jù)確定檢索方法??梢詫z索方法分為傳統(tǒng)、全文及整合三種。
第二,制作圖像資源。主要有兩種方法,一是拍照,二是掃描。對特大開本或者卷軸的古籍文獻進行拍照,像素保證在2 000萬~3 300萬像素之間,文件格式為RAW格式,拍照時需要避免光照影響圖片質(zhì)量,圖片的顏色應(yīng)正常,拍照人員也需要具有專業(yè)拍照技術(shù)。掃描古籍文獻資源時,首先,需要選擇掃描的方式,主要分為灰度掃描和彩色掃描兩種。其次,設(shè)計掃描參數(shù),比如:色彩、位深及掃描精度等,這些參數(shù)的設(shè)置需要與圖像的用途相適應(yīng),數(shù)據(jù)庫發(fā)布的圖片,其分辨率需要達到150 DPI,而需要永久保存的圖片,其分辨率需要達到300 DPI以上。再次,確定掃描儀,由于古籍文獻都是線裝的,并且不能拆裝,所以一般使用零邊距的掃描儀。最后,要對掃描后的圖片進行拼版、裁切,在工作中需要保證圖片是完整的、清晰的,不能錯位,要將古籍文獻的原貌如實地反映出來,使古籍文獻數(shù)字化后依舊能夠保真。
第三,識別古籍文獻中的文字。OCR識別技術(shù)對于古籍文獻的識別率比較低,特別是抄稿本,需要對識別后的文本進行核對,如果古籍文獻的版本比較特殊還需要還原版本,這一工作會消耗更多的人力及財力。但是不管是人工錄入還是通過文字識別方式在識別字時都會遇到問題,比較繁體字、異體字、避諱字等,以此在將古籍文獻文字轉(zhuǎn)化為文本信息時還有很多問題需要解決。
第四,挑選輔助功能。古籍文獻資源數(shù)字化建設(shè)中,還需要研發(fā)輔助性的功能,比如:聯(lián)機的字詞典、年代表、人物介紹、古今地名對照表及相應(yīng)人物鏈接等,開發(fā)這些輔助性的功能能夠使研究者更加便利地使用數(shù)字化資源,有助于古籍文獻價值的發(fā)揮與凸顯。
現(xiàn)如今,博物館中的很多古籍文獻都是通過紙質(zhì)方式進行保存的,這種保管形式如果在保存使用中存在不當操作,就極容易使古籍文獻受到損壞,因此需要對這些古籍文獻進行數(shù)字化管理,實現(xiàn)全文掃描錄入,做好古籍文獻的數(shù)字化建設(shè)能夠?qū)崿F(xiàn)資源的有效共享,使古籍文獻的價值得到充分的開發(fā)利用。在數(shù)字化建設(shè)過程中還需要有統(tǒng)一的機構(gòu)、計劃,培養(yǎng)高素質(zhì)水平的人才,加強相關(guān)數(shù)字化技術(shù)的研究與應(yīng)用,提高博物館古籍文獻資源數(shù)字化建設(shè)的效率。
主要參考文獻
[1]李寶金,藍韶清,張曉旭.中醫(yī)藥古籍數(shù)字化建設(shè)的探索與實踐——以廣東中醫(yī)藥博物館為例[J].大學(xué)圖書情報學(xué)刊,2012(1).
[2]薛立靜.東北地區(qū)公共圖書館古籍數(shù)字化的實踐與展望[J].農(nóng)業(yè)圖書情報學(xué)刊,2012(11).
[3]祿玉萍,吳勰,黃衛(wèi)華.論黔西北彝文古籍文獻數(shù)字化建設(shè)[J].畢節(jié)學(xué)院學(xué)報,2010(9).
[4]朱成林,袁曦臨.中國古籍的數(shù)字化導(dǎo)讀研究[J].圖書館建設(shè),2014(11).
[5]李洋.古籍文獻數(shù)字化之思考[J].農(nóng)業(yè)圖書情報學(xué)刊,2015(3).
10.3969/j.issn.1673 - 0194.2016.20.112
G255.1
A
1673-0194(2016)20-0164-02
2016-09-02