高建輝
(楚雄師范學(xué)院圖書館,楚雄 675000)
彝文古籍是彝族十分珍貴的歷史文化遺產(chǎn),是彝族先民在社會(huì)活動(dòng)中直接形成和使用的文獻(xiàn)資料。文化部《“十三五”時(shí)期全國(guó)古籍保護(hù)工作規(guī)劃》要求,“到2020年,要完成古籍?dāng)?shù)字化并發(fā)布古籍?dāng)?shù)字資源7萬(wàn)部,鼓勵(lì)和支持各古籍收藏單位加快古籍?dāng)?shù)字化步伐,借助互聯(lián)網(wǎng)、大數(shù)據(jù)、云服務(wù)等高新技術(shù),率先對(duì)館藏特色文獻(xiàn)和珍貴古籍進(jìn)行數(shù)字化,擴(kuò)大古籍?dāng)?shù)字資源開放,促進(jìn)資源共享,提高利用效率”。[1]據(jù)調(diào)查,彝文古籍?dāng)?shù)量眾多、內(nèi)容豐富,分布廣泛,彝族聚居地區(qū)的文化機(jī)構(gòu)一般都有收藏,但很多機(jī)構(gòu)保存的彝文古籍質(zhì)量參差不齊,保存條件差,且內(nèi)容重復(fù)率高,利用效率低。要解決這些問題,應(yīng)當(dāng)對(duì)彝文古籍進(jìn)行一體化管理,但在目前的體制下這一做法幾乎不可能實(shí)現(xiàn),只有將散存于各個(gè)保存機(jī)構(gòu)的彝文古籍按照一定的模式進(jìn)行數(shù)字化整合,才符合國(guó)家發(fā)展規(guī)劃和各方利益需求,才有實(shí)施的基礎(chǔ)。古籍資源整合后有利于維護(hù)民族文化的完整性,有利于古籍的有效保護(hù)和利用,有利于民族地區(qū)的社會(huì)穩(wěn)定和民族文化的傳承與傳播。
彝文古籍是1949年以前用彝文寫成的少數(shù)民族文獻(xiàn),其內(nèi)容體現(xiàn)在彝族政治、經(jīng)濟(jì)、文化、宗教、哲學(xué)、軍事等社會(huì)活動(dòng)的方方面面,具有重要的歷史文化價(jià)值,主要分布在云南、貴州、四川和廣西等省或自治區(qū),據(jù)統(tǒng)計(jì),其總量在10萬(wàn)冊(cè)以上。彝文古籍具有多元屬性,它既是古籍,又是文物,也是檔案和史料,除散落民間外,有很多機(jī)構(gòu)都有收藏[2-3]。據(jù)調(diào)查,彝文古籍保存機(jī)構(gòu)包括圖書館、博物館、檔案館、民族事務(wù)委員會(huì)(以下簡(jiǎn)稱“民委”)、民族宗教事務(wù)局(以下簡(jiǎn)稱“民宗局”)、彝學(xué)會(huì)、紀(jì)念館、民族文化研究所、文化館、史志辦等。據(jù)不完全統(tǒng)計(jì),部分機(jī)構(gòu)保存數(shù)量如下。云南省民委古籍辦1 200冊(cè),省圖書館32冊(cè),省博物館37冊(cè),省社科院圖書館20余冊(cè)。楚雄彝族自治州彝族文化研究院1 000余冊(cè),州博物館36冊(cè),州民委古籍辦30余冊(cè),州檔案館150冊(cè),州圖書館1 000余冊(cè);楚雄師范學(xué)院圖書館93冊(cè);雙柏縣文化館400余冊(cè);武定縣民委226冊(cè)。紅河州民族研究所191冊(cè),州群眾藝術(shù)館3冊(cè);州民宗局8冊(cè),縣圖書館3冊(cè)。貴州省博物館2 500余冊(cè),省民族研究所100冊(cè),省民族學(xué)院500余冊(cè);貴州民族圖書館30冊(cè);畢節(jié)市檔案館171冊(cè);大方縣奢香博物館109冊(cè),縣民委284冊(cè);赫章縣民委250多冊(cè);威寧縣民委50冊(cè);六盤水市民委30冊(cè);水城縣民委90余冊(cè);盤縣民委20冊(cè);納雍縣民委30余冊(cè)。四川涼山州彝文編譯局1 500余冊(cè),州博物館60余冊(cè);西南民族大學(xué)6 000余冊(cè);西昌學(xué)院30余冊(cè);雷波縣民委85冊(cè);昭覺語(yǔ)言文字工作委員會(huì)100多冊(cè);樂山市峨邊縣民委77冊(cè)。廣西壯族自治區(qū)圖書館2冊(cè),博物館1冊(cè);隆林縣民委2冊(cè),縣文化館5冊(cè)[4-5]。
彝文古籍?dāng)?shù)字資源主要有以下5種存在形式,即彝文古籍書目數(shù)據(jù)庫(kù)、圖片版全文數(shù)據(jù)庫(kù)、文本版全文數(shù)據(jù)庫(kù)、圖片版電子圖書、文本版電子圖書。目前的建設(shè)情況如下。云南楚雄州圖書館的“彝文文獻(xiàn)數(shù)據(jù)庫(kù)檢索平臺(tái)中有70冊(cè)彝文古籍書目數(shù)據(jù),楚雄師范學(xué)院圖書館彝文古籍?dāng)?shù)據(jù)庫(kù)中包含300多冊(cè)彝文古籍書目數(shù)據(jù),彝族文化數(shù)字資源平臺(tái)數(shù)據(jù)庫(kù)中包含5冊(cè)圖片版彝文古籍電子圖書,楚雄彝族優(yōu)秀文化作品數(shù)據(jù)庫(kù)中有200多條彝文古籍書目數(shù)據(jù);西南民族大學(xué)民族古籍?dāng)?shù)據(jù)庫(kù)中包含部分彝文古籍,云南紅河學(xué)院的彝族文化相關(guān)數(shù)據(jù)庫(kù)中有少量彝文古籍(以上兩個(gè)數(shù)據(jù)庫(kù)還在建設(shè)中,其包含的古籍?dāng)?shù)量不詳)。楚雄彝族自治州編制的彝族畢摩經(jīng)典譯注106冊(cè)中含有云南、四川、貴州、廣西四省區(qū)的6 000多冊(cè)(篇、條)文本版彝文古籍資源和電子版圖書,如《武定歷算書》《雙柏拉婚經(jīng)》《昭通喪葬經(jīng)》《查姆》等。云南紅河州編制《紅河彝族文化遺產(chǎn)古籍典藏》20冊(cè)中包含110多部圖片版彝文古籍,如《尼蘇奪節(jié)》《蘇嫫》《萬(wàn)物的起源》《吾查們查》等。楚雄師范學(xué)院編制的《彝族古籍文獻(xiàn)考略(一)》中包含10部圖片版彝文古籍電子圖書,如《驅(qū)重喪經(jīng)書》《祈雨經(jīng)合經(jīng)》《裝殮經(jīng)》等。此外,在彝族主要分布區(qū)域的各類型圖書館的書目數(shù)據(jù)庫(kù)中也包含部分彝文古籍書目數(shù)據(jù),其數(shù)量無(wú)法統(tǒng)計(jì)??傊壳耙呀?jīng)數(shù)字化的彝文古籍?dāng)?shù)量不多,根據(jù)彝文古籍總量10萬(wàn)冊(cè)測(cè)算,彝文古籍?dāng)?shù)字化比例還不到現(xiàn)存總量的10%,如果只是整合已有的數(shù)字資源,其意義不大,在數(shù)字資源整合之前,還需要對(duì)各機(jī)構(gòu)保存的彝文古籍資源進(jìn)行數(shù)字化處理[6]。
(1)數(shù)字化整合的理論研究情況。首先,國(guó)家近年來加大了少數(shù)民族古籍資源的收集、整理和數(shù)字化力度,也加大了對(duì)相關(guān)項(xiàng)目的支持力度,相關(guān)領(lǐng)域的項(xiàng)目立項(xiàng)數(shù)量和學(xué)術(shù)研究成果不斷增加。目前資源整合領(lǐng)域主要研究以下方面。一是古籍資源整合的基礎(chǔ)理論。如李榮艷[7]、薩蕾[8]等提出古籍整合過程中要利用文本自動(dòng)分析技術(shù),加強(qiáng)多方合作,構(gòu)建古籍知識(shí)庫(kù),借鑒國(guó)外的資源整合平臺(tái)和項(xiàng)目,設(shè)計(jì)自己的整合模型。二是圖檔博資源整合、合作與發(fā)展相關(guān)理論。羅紅等[9]提出基于LAM協(xié)作的圖書館館藏建設(shè)理論,以及張衛(wèi)東[10]關(guān)于LAM合作模式的研究。三是區(qū)域性數(shù)字資源整合方式的相關(guān)理論。如近年來周俊燁[11]、程靜[12]等提出的基于關(guān)聯(lián)數(shù)據(jù)、異構(gòu)數(shù)據(jù)、GIS、知識(shí)集成、云計(jì)算、總分館的資源整合模式。這些成果為彝文古籍?dāng)?shù)字資源的整合奠定了理論基礎(chǔ)。此外,華林等[13]提出“彝文古籍既是圖書,又是文物和檔案的多元屬性”為資源整合主體的確定提供了理論依據(jù)。根據(jù)國(guó)內(nèi)外資源建設(shè)的發(fā)展趨勢(shì),最終必然走向圖檔博等文化機(jī)構(gòu)的資源整合。
(2)彝文古籍?dāng)?shù)字化整合的資源基礎(chǔ)。首先,彝文古籍資源數(shù)量眾多、分布廣泛,雖然還有很多彝文古籍資源散落民間,但文化機(jī)構(gòu)可以通過采集、收集、征集、交換、購(gòu)買等方法不斷獲取。從目前的保存情況看,大量的彝文古籍已經(jīng)被收集到了各類文化機(jī)構(gòu)中進(jìn)了統(tǒng)一保存。如1.1中所述,其中檔案館、圖書館、博物館和民委四大系統(tǒng)保存的數(shù)量最多,只要條件具備,隨時(shí)可以進(jìn)行數(shù)字化處理。其次,有部分資源已經(jīng)進(jìn)行數(shù)字化,并且已經(jīng)建成數(shù)據(jù)庫(kù)或制作成電子圖書。如1.2中所述,這些資源以彝文古籍的書目、圖片、圖書、文字、數(shù)據(jù)庫(kù)條目等形式存在,在整合時(shí)可以直接利用。
(3)數(shù)字化整合技術(shù)的應(yīng)用情況。首先,隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,古籍?dāng)?shù)字化轉(zhuǎn)換和存儲(chǔ)技術(shù)已經(jīng)成熟,大數(shù)據(jù)和云計(jì)算技術(shù)的廣泛應(yīng)用為彝文古籍?dāng)?shù)字資源的檢索和利用開拓了新的領(lǐng)域。如國(guó)家圖書館對(duì)古籍?dāng)?shù)據(jù)庫(kù)的元數(shù)據(jù)著錄標(biāo)準(zhǔn)已經(jīng)有了明確的規(guī)范,彝文古籍可以參考使用。其次,異構(gòu)數(shù)據(jù)的整合方法不斷完善,而且已經(jīng)應(yīng)用到很多數(shù)據(jù)庫(kù)整合平臺(tái),彝文古籍?dāng)?shù)字資源的整合可以直接借鑒和利用。如元數(shù)據(jù)收割協(xié)議的廣泛應(yīng)用。最后,近年來彝文信息化技術(shù)得到快速發(fā)展,在彝文輸入法和彝文信息化標(biāo)準(zhǔn)的制定方面形成很多成果。如彝漢互譯軟件已于2012年上線運(yùn)行,標(biāo)準(zhǔn)彝文識(shí)別和手寫彝文識(shí)別技術(shù)已于2017年產(chǎn)生[14]。
(1)宏觀層面。首先,彝文古籍資源數(shù)字化整合所涉及的機(jī)構(gòu)眾多,并且隸屬于不同的主管部門,例如文化局、檔案局、文物局等,復(fù)雜的隸屬關(guān)系是阻礙整合工作的關(guān)鍵。沒有相關(guān)的政策或規(guī)定來支持和保障資源整合工作,再加上部分機(jī)構(gòu)的整合意愿不強(qiáng),整合措施難以實(shí)施。其次,資源整合工作的理念和思路,機(jī)構(gòu)間的合作模式,數(shù)字化模式和數(shù)據(jù)整合模式都有待進(jìn)一步研究和明確,這是啟動(dòng)整合工作的關(guān)鍵所在。最后,由于我國(guó)還沒有開展過此類工作,缺乏實(shí)踐經(jīng)驗(yàn),難以進(jìn)行頂層設(shè)計(jì)和系統(tǒng)規(guī)劃,因此可以先進(jìn)行區(qū)域性整合試驗(yàn),最終把各個(gè)區(qū)域的數(shù)字資源再整合到一起。
(2)微觀層面。第一,目前可直接利用的數(shù)字彝文古籍資源不多,而且這些資源大多為書目數(shù)據(jù)庫(kù),沒有全文,數(shù)字化工作十分繁重。如果要實(shí)現(xiàn)彝文古籍電子化和全文或彝文檢索,需要消耗大量的時(shí)間和人力物力進(jìn)行彝文錄入和翻譯。第二,已經(jīng)完成數(shù)字化的資源數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,難以實(shí)現(xiàn)資源的統(tǒng)一檢索和深度開發(fā)。第三,所有自建數(shù)據(jù)庫(kù)都存在資源整合后如何做好后續(xù)維護(hù)和更新工作,如何在總體規(guī)劃時(shí)考慮后續(xù)工作的經(jīng)費(fèi)和人員投入,如何保持?jǐn)?shù)據(jù)庫(kù)的生命力等難題。
由于紙質(zhì)古籍資源保存比較分散,且很多機(jī)構(gòu)沒有古籍保存和修復(fù)的條件,容易出現(xiàn)損壞和重復(fù)收藏的情況;彝文古籍?dāng)?shù)字資源總量較少,建設(shè)數(shù)據(jù)庫(kù)的機(jī)構(gòu)屈指可數(shù),且各機(jī)構(gòu)所用的標(biāo)準(zhǔn)不統(tǒng)一,很多都是書目或圖片數(shù)據(jù),檢索和利用效率極低。因此,彝文古籍?dāng)?shù)字化整合十分必要。首先,資源整合有利于維護(hù)彝族歷史文化的完整性,永久保存完整的民族記憶。內(nèi)容豐富、學(xué)科齊全、門類繁多的彝文古籍資源對(duì)增強(qiáng)彝族人民的文化自信,弘揚(yáng)民族文化具有深遠(yuǎn)的歷史意義和重要的現(xiàn)實(shí)意義。其次,資源整合工程可以把彝文古籍按照統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行數(shù)字化處理,保證數(shù)字資源質(zhì)量,避免重復(fù)建設(shè),能為國(guó)家節(jié)約人力物力和經(jīng)費(fèi)。再次,資源整合可以實(shí)現(xiàn)統(tǒng)一檢索,這為利用者提供了極大的便利,提高了利用率,擴(kuò)大了利用范圍,提升相關(guān)機(jī)構(gòu)的服務(wù)質(zhì)量。最后,彝文古籍?dāng)?shù)字資源的集中管理是資源大規(guī)模開發(fā)利用的前提。資源整合后可提供利用的資源數(shù)量倍增,通過大數(shù)據(jù)的統(tǒng)計(jì)和分析,可以進(jìn)行數(shù)據(jù)挖掘和知識(shí)關(guān)聯(lián),深度開發(fā)彝文古籍資源。
彝文古籍的數(shù)字資源整合工作的指導(dǎo)思想是易于實(shí)現(xiàn)、可持續(xù)更新、方便檢索利用、降低成本、注重效益、避免版權(quán)糾紛、便于開發(fā)。資源整合的思路如下。首先,組建相關(guān)管理機(jī)構(gòu)。一是由政府部門統(tǒng)一組建領(lǐng)導(dǎo)和協(xié)調(diào)機(jī)構(gòu)。二是組建牽頭和責(zé)任機(jī)構(gòu),形成資源共建共享聯(lián)動(dòng)機(jī)制。三是落實(shí)主體責(zé)任,就工作的考核評(píng)價(jià)達(dá)成共識(shí)。其次,進(jìn)行總體規(guī)劃。一是時(shí)間和進(jìn)度規(guī)劃,資源整合是一項(xiàng)長(zhǎng)期的工作,對(duì)每年完成的資源數(shù)量要做好長(zhǎng)期規(guī)劃,從而保證相關(guān)經(jīng)費(fèi)和人力的持續(xù)投入。二是整合層次規(guī)劃,整合層次包括國(guó)家、省、州(市)和縣級(jí)層面。三是資源類型規(guī)劃,彝文古籍按主題可分為十大類,如祭祀類、軍事類、歷史類、祈福類等,按數(shù)字化程度可分為未數(shù)字化、書目已數(shù)字化和全文已數(shù)字化、全文已文本化4種。四是協(xié)作區(qū)域規(guī)劃,區(qū)域可以是一個(gè)城市、一個(gè)彝族分布區(qū)、區(qū)域聯(lián)盟、一個(gè)系統(tǒng)等。最后,具體工作的開展。一是由牽頭機(jī)構(gòu)制定和出臺(tái)相關(guān)政策,為整合工作的開展提供基本制度保障。二是建立標(biāo)準(zhǔn)規(guī)范,包括工作考核標(biāo)準(zhǔn)、數(shù)字化標(biāo)準(zhǔn)、數(shù)據(jù)及平臺(tái)接口標(biāo)準(zhǔn)等。三是分步實(shí)施,可以分層次,逐層落實(shí);也可以分類型,劃分重點(diǎn),不同類型分部進(jìn)行;還可以分區(qū)域?qū)嵤?,先在小范圍?nèi)開展,積累經(jīng)驗(yàn),最終把各個(gè)區(qū)域的整合成果匯集后再進(jìn)一步整合。
整合工作的主體包括資源整合區(qū)域內(nèi)彝文古籍保存機(jī)構(gòu)和政府的行政主管部門,這是一項(xiàng)涉及面較廣的系統(tǒng)工程,需要相關(guān)單位長(zhǎng)期的通力合作。因此,應(yīng)由政府相關(guān)部門負(fù)責(zé)人組成區(qū)域性彝文古籍資源數(shù)字化整合領(lǐng)導(dǎo)小組負(fù)責(zé)整個(gè)過程的監(jiān)督和指導(dǎo),由區(qū)域內(nèi)的彝文古籍保存機(jī)構(gòu)的主要負(fù)責(zé)人組成協(xié)調(diào)委員會(huì)負(fù)責(zé)相關(guān)規(guī)定和標(biāo)準(zhǔn)的制定和日常事務(wù)的商討與協(xié)調(diào),由區(qū)域內(nèi)影響力較大的圖書館負(fù)責(zé)這項(xiàng)工程的具體實(shí)施。
整合工作的內(nèi)容由三個(gè)階段組成。第一階段主要是開展前期工作,包括資源保存地點(diǎn)、數(shù)量和質(zhì)量的詳細(xì)調(diào)查,協(xié)商并簽訂資源共建共享協(xié)議或整合意向,以及破損資源的修復(fù)等工作。第二階段是開展中期工作,包括制定項(xiàng)目規(guī)劃,確定主體機(jī)構(gòu)與合作機(jī)構(gòu),確定整合的對(duì)象、范圍、類型和層次,制定紙質(zhì)資源數(shù)字化標(biāo)準(zhǔn)和規(guī)范,確定數(shù)字資源整合的模式,實(shí)施信息資源的數(shù)字化整合。第三階段是開展后續(xù)工作,包括各合作機(jī)構(gòu)新增資源的數(shù)字化整合以及軟硬件平臺(tái)的日常維護(hù)。
協(xié)作模式可分為以下類型。一是政府主導(dǎo)的國(guó)家層面的協(xié)作模式。在這一模式中政府發(fā)揮著主導(dǎo)作用,為機(jī)構(gòu)的協(xié)作制定有關(guān)政策提供資金和人力支持,通過行政手段引導(dǎo),為協(xié)作過程及效果提供保障。二是跨行業(yè)的協(xié)作模式。很多彝文古籍保存機(jī)構(gòu)都有業(yè)務(wù)與學(xué)術(shù)的行業(yè)機(jī)構(gòu)(如彝學(xué)會(huì)、圖書館學(xué)會(huì)、檔案學(xué)會(huì)、檔案工作者協(xié)會(huì)等),可以從學(xué)會(huì)和協(xié)會(huì)的角度成立跨行業(yè)的綜合性機(jī)構(gòu),專門負(fù)責(zé)協(xié)作事務(wù),通過這一機(jī)構(gòu)建立統(tǒng)一的標(biāo)準(zhǔn)(如數(shù)字化標(biāo)準(zhǔn)、著錄標(biāo)準(zhǔn)、統(tǒng)一門戶網(wǎng)站、用戶身份認(rèn)證等),從而實(shí)現(xiàn)跨行業(yè)的協(xié)作。三是跨機(jī)構(gòu)的區(qū)域內(nèi)自發(fā)合作模式。該模式可以由某一機(jī)構(gòu)牽頭,出于對(duì)特定服務(wù)目標(biāo)的自覺追求或公眾的迫切需求,基于自愿和互利的原則,共同制定戰(zhàn)略規(guī)劃,分擔(dān)成本,該模式要求牽頭機(jī)構(gòu)在規(guī)模、用戶、人力、技術(shù)、資金、聲望等方面具有明顯優(yōu)勢(shì)。四是跨區(qū)域的項(xiàng)目聯(lián)盟。該模式需要來自不同區(qū)域的機(jī)構(gòu)組成一個(gè)臨時(shí)的聯(lián)盟,針對(duì)某一項(xiàng)目,在其生命周期內(nèi)開展合作,項(xiàng)目終止后,聯(lián)盟活動(dòng)也停止,也可以不斷增加新的項(xiàng)目以延長(zhǎng)聯(lián)盟持續(xù)時(shí)間,如“世界數(shù)字圖書館”和“世界記憶工程”項(xiàng)目。五是全面合并模式。把協(xié)作的相關(guān)機(jī)構(gòu)無(wú)縫整合為一個(gè)新的組織機(jī)構(gòu),統(tǒng)一管理和調(diào)配各種資源并整合相關(guān)的要素,該模式在目前的情況下難以實(shí)現(xiàn)[15]。
根據(jù)彝文古籍?dāng)?shù)字資源的特點(diǎn)和整合工作的指導(dǎo)思想與思路,綜合以上5種協(xié)作模式的優(yōu)缺點(diǎn),提出跨機(jī)構(gòu)的區(qū)域內(nèi)的綜合協(xié)作模式,如圖1所示。整個(gè)項(xiàng)目由地方政府統(tǒng)一領(lǐng)導(dǎo)和制定政策,提供人力物力和資金的支持,項(xiàng)目管理機(jī)構(gòu)由各彝文古籍保存機(jī)構(gòu)及其主管機(jī)構(gòu)的負(fù)責(zé)人組成,根據(jù)各行業(yè)機(jī)構(gòu)的意見建立各種標(biāo)準(zhǔn)并由行業(yè)機(jī)構(gòu)提供技術(shù)支持,由牽頭機(jī)構(gòu)具體負(fù)責(zé)實(shí)施資源整合,該工程可以劃分為多個(gè)階段,實(shí)施過程中政府可以適時(shí)引導(dǎo),資源整合區(qū)域內(nèi)的各彝文古籍保存單位作為協(xié)作成員參與,形成一個(gè)跨機(jī)構(gòu)的區(qū)域內(nèi)綜合協(xié)作項(xiàng)目。
在實(shí)施彝文古籍?dāng)?shù)字化整合工程的過程中,對(duì)于尚未數(shù)字化或者數(shù)字化不徹底的資源,需要先進(jìn)行數(shù)字化處理。其過程包括資源的數(shù)字化轉(zhuǎn)化與存儲(chǔ)以及數(shù)字資源的整理與著錄兩個(gè)階段,這一過程主要關(guān)注兩個(gè)問題,即主體與標(biāo)準(zhǔn)。工作主體方面,數(shù)字化相關(guān)工作都可以由古籍保存機(jī)構(gòu)、牽頭機(jī)構(gòu)或第三方來實(shí)施,但由于彝文古籍的特殊性,需要綜合考慮原件安全、數(shù)據(jù)安全、工作效率、數(shù)據(jù)質(zhì)量等要素。其中,安全問題尤為重要,因此,建議把數(shù)字化主體確定為牽頭機(jī)構(gòu),把彝文古籍和數(shù)據(jù)集中到牽頭機(jī)構(gòu)進(jìn)行數(shù)字化處理和保存,牽頭機(jī)構(gòu)可以再委托并監(jiān)管第三方實(shí)施該工程。
資源加工標(biāo)準(zhǔn)分為數(shù)字化轉(zhuǎn)換與存儲(chǔ)標(biāo)準(zhǔn)和標(biāo)引著錄標(biāo)準(zhǔn),前者規(guī)定了數(shù)字化設(shè)備和參數(shù)設(shè)置以及數(shù)字資源的屬性;后者規(guī)定了元數(shù)據(jù)著錄規(guī)范和要求,該標(biāo)準(zhǔn)由項(xiàng)目協(xié)調(diào)委員會(huì)負(fù)責(zé)制定。經(jīng)過長(zhǎng)期的研究和實(shí)踐,楚雄師范學(xué)院圖書館編制了符合自身要求的彝文古籍?dāng)?shù)字化標(biāo)準(zhǔn)。數(shù)字化轉(zhuǎn)換與存儲(chǔ)標(biāo)準(zhǔn)包括兩個(gè)方面。一是數(shù)字資源的屬性標(biāo)準(zhǔn)。彝文古籍涉及的數(shù)字資源格式包括圖片、PDF文檔、WORD文檔、文本文檔等,其中對(duì)圖片的拍攝尺寸、存儲(chǔ)格式、裁剪尺寸、留白邊距、分辨率、文檔格式、文件名稱等作了統(tǒng)一規(guī)定。二是軟硬件標(biāo)準(zhǔn)。軟件方面包括彝文輸入法、圖片和文字處理軟件、操作系統(tǒng)、資源整合平臺(tái)和后臺(tái)管理功能等。如彝文的輸入法統(tǒng)一采用收集了9 438個(gè)彝文文字的《楚雄彝文電腦字庫(kù)和輸入法》軟件,圖片資源后期批量處理使用軟件《光影魔術(shù)手》,資源數(shù)據(jù)庫(kù)采用MySQL,整合平臺(tái)用Java編制,Web服務(wù)器軟件用Apache Tomcat等。硬件方面則統(tǒng)一規(guī)定了拍攝相機(jī)的鏡頭焦距、ISO、光照條件、輔助工具、掃描儀DPI的參數(shù)要求。對(duì)于標(biāo)引著錄標(biāo)準(zhǔn),楚雄師范學(xué)院圖書館根據(jù)《國(guó)家圖書館古籍元數(shù)據(jù)規(guī)范與著錄規(guī)則》,考慮到與MARC格式互相映射和轉(zhuǎn)換,編制了由21個(gè)元素組成的彝文古籍元數(shù)據(jù)結(jié)構(gòu),分別是題名、內(nèi)容提要、關(guān)鍵詞、責(zé)任者、日期、版權(quán)所有者、相關(guān)資源、主題類型、年代、格式、來源、權(quán)限、附注、版本、載體形態(tài)、文物保護(hù)、館藏信息、收集地點(diǎn)、收集時(shí)間、頁(yè)碼、頁(yè)數(shù)。每個(gè)元素均規(guī)定了元素名稱、著錄要求和數(shù)據(jù)類型,著錄時(shí)分為必著項(xiàng)和選著項(xiàng)兩類,以平衡著錄的效率和質(zhì)量。詳細(xì)內(nèi)容可參照楚雄師范學(xué)院圖書館提出的彝文古籍?dāng)?shù)字化標(biāo)準(zhǔn)。所有彝文古籍都按照統(tǒng)一的標(biāo)準(zhǔn)進(jìn)行數(shù)字化處理,以保證數(shù)據(jù)的質(zhì)量,便于下一步的數(shù)據(jù)整合[16]。
圖1 彝文古籍?dāng)?shù)字資源整合跨機(jī)構(gòu)的區(qū)域內(nèi)綜合協(xié)作模式
(1)在協(xié)作機(jī)構(gòu)之間進(jìn)行的資源整合與共建模式。該模式適用于數(shù)據(jù)無(wú)法集中的存量資源或者新增資源分散存放于各個(gè)機(jī)構(gòu)且資源由于某些原因不能完全開放的情況,協(xié)作成員各自建立檢索平臺(tái),對(duì)彝文古籍進(jìn)行數(shù)字化并保存資源,牽頭機(jī)構(gòu)建立一個(gè)統(tǒng)一檢索平臺(tái),并掛接各協(xié)作單位的檢索系統(tǒng),從而實(shí)現(xiàn)資源的統(tǒng)一檢索,但資源獲取必須按照保存單位的設(shè)置權(quán)限從該單位鏈接獲取。其優(yōu)點(diǎn)是資源平臺(tái)和服務(wù)都掌握在各協(xié)作機(jī)構(gòu)手中,更新維護(hù)方便,一般不存在知識(shí)產(chǎn)權(quán)問題。缺點(diǎn)是由于受制于各單位的軟硬件條件,整合與開發(fā)利用效果不好。
(2)數(shù)據(jù)提供者和服務(wù)提供者分離的資源整合共建模式。協(xié)作機(jī)構(gòu)作為數(shù)據(jù)提供者,只負(fù)責(zé)按照統(tǒng)一的標(biāo)準(zhǔn)數(shù)字化處理本館的資源并及時(shí)更新,數(shù)據(jù)存儲(chǔ)在各自的服務(wù)器上,按要求開通數(shù)據(jù)訪問接口,后續(xù)事宜均由牽頭機(jī)構(gòu)處理。例如“歐洲數(shù)字圖書館”項(xiàng)目就采用了這種模式。牽頭機(jī)構(gòu)統(tǒng)一進(jìn)行平臺(tái)和資源體系建設(shè),根據(jù)“元數(shù)據(jù)收割協(xié)議OAI-PMH”從數(shù)據(jù)提供者的服務(wù)器中收割提供服務(wù)所需的數(shù)據(jù)并為用戶服務(wù)[17]。其優(yōu)點(diǎn)是服務(wù)提供者可以將獲取的元數(shù)據(jù)進(jìn)行加工處理和深層次開發(fā),拓展更多的服務(wù)類型,例如數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)和智能化服務(wù)等,服務(wù)更加專業(yè)化。其缺點(diǎn)是元數(shù)據(jù)需要進(jìn)行虛擬擴(kuò)展,對(duì)具有多元屬性的資源要進(jìn)行交叉著錄,更新較慢,獲取原文不方便。
(3)機(jī)構(gòu)相對(duì)獨(dú)立的資源整合模式。在該模式下,協(xié)作機(jī)構(gòu)提供原始的彝文古籍或者數(shù)字資源,由一個(gè)單獨(dú)的機(jī)構(gòu)統(tǒng)一進(jìn)行彝文古籍的數(shù)字化轉(zhuǎn)換、標(biāo)引著錄、編輯存儲(chǔ)、建立獨(dú)立的數(shù)字資源軟硬件平臺(tái),并為用戶提供服務(wù)。這一機(jī)構(gòu)可以是牽頭機(jī)構(gòu)或者第三方機(jī)構(gòu),其完全掌握資源的組織、技術(shù)實(shí)現(xiàn)、運(yùn)行和服務(wù)機(jī)制。這一模式的缺點(diǎn)是大量元數(shù)據(jù)都要重新制作,工程的實(shí)施需要消耗巨大的人力物力和時(shí)間,并且容易出現(xiàn)知識(shí)產(chǎn)權(quán)問題,短時(shí)間內(nèi)很難達(dá)到較大的數(shù)據(jù)規(guī)模。優(yōu)點(diǎn)是數(shù)據(jù)質(zhì)量和服務(wù)質(zhì)量比較高。例如世界數(shù)字圖書館項(xiàng)目整合了世界各國(guó)LAM的文化資源,為全球用戶提供了一站式信息資源集成服務(wù),但數(shù)據(jù)量較少。
(4)基于四大系統(tǒng)的資源整合模式。通過對(duì)保存機(jī)構(gòu)的分析,目前彝文古籍的保存和保護(hù)主體主要是圖書館、檔案館、博物館和民委古籍辦(含民族文化研究所)四大系統(tǒng),它們所保存的彝文古籍?dāng)?shù)量占了所有保存機(jī)構(gòu)的一半以上,在古籍資源的集中保護(hù)中發(fā)揮了主要作用。通過構(gòu)建以四大系統(tǒng)為主體的資源共建共享模式,可以解決古籍文獻(xiàn)信息資源整合問題。四大系統(tǒng)可以在各省區(qū)的省級(jí)機(jī)構(gòu)建立“古籍保護(hù)與資料信息中心”,建設(shè)各個(gè)系統(tǒng)的彝文古籍目錄和摘要數(shù)據(jù)庫(kù)及網(wǎng)站,開展古籍目錄資源的聯(lián)合檢索服務(wù);然后系統(tǒng)內(nèi)各機(jī)構(gòu)對(duì)各自的彝文古籍進(jìn)行全文數(shù)字化,并集中上傳到省級(jí)中心的網(wǎng)站;最后,在四大系統(tǒng)中實(shí)現(xiàn)數(shù)字彝文古籍的文獻(xiàn)傳遞。由于協(xié)作機(jī)構(gòu)只有4種,協(xié)調(diào)和執(zhí)行機(jī)構(gòu)等問題相對(duì)容易解決,這種模式的優(yōu)點(diǎn)是實(shí)施難度較低,成果見效快,資源整合效率和質(zhì)量較高。缺點(diǎn)是資源的整合范圍不夠全面。
綜上所述,考慮到已完成數(shù)字化的彝文古籍?dāng)?shù)量較少,數(shù)字化質(zhì)量普遍不高,紙質(zhì)古籍具有文物的特點(diǎn),破損較多,利用的目的主要以學(xué)術(shù)研究為主,很多參與機(jī)構(gòu)不具備數(shù)據(jù)保存條件。最佳的彝文古籍?dāng)?shù)字資源整合模式宜采用以牽頭機(jī)構(gòu)為主體的獨(dú)立資源整合共建模式,即協(xié)作機(jī)構(gòu)把已有的數(shù)字資源或者原始彝文古籍提供給牽頭機(jī)構(gòu),由牽頭機(jī)構(gòu)統(tǒng)一進(jìn)行異構(gòu)數(shù)據(jù)的整合與重構(gòu),對(duì)未數(shù)字化的彝文古籍統(tǒng)一進(jìn)行修復(fù)和數(shù)字化處理并確保原件安全,最后由牽頭機(jī)構(gòu)建立資源檢索平臺(tái)并提供服務(wù)。在這一模中適合作為牽頭機(jī)構(gòu)的最佳單位是圖書館,因?yàn)橹挥袌D書館才能同時(shí)具備古籍修復(fù)條件、建設(shè)軟硬件平臺(tái)的人力物力條件、確保原件和數(shù)據(jù)安全的資源保存條件以及提供利用的條件。
隨著信息技術(shù)的發(fā)展,各文化機(jī)構(gòu)保存的各種信息資源的整合已成為一種趨勢(shì),也是文化機(jī)構(gòu)面臨的一個(gè)機(jī)遇與挑戰(zhàn),在維護(hù)民族文化完整性、增強(qiáng)文化自信的背景下,筆者對(duì)機(jī)構(gòu)保存的彝文古籍的區(qū)域性數(shù)字化整合模式進(jìn)行了理論探索、協(xié)作框架構(gòu)建和整合模式的探討,提出了資源整合的構(gòu)想,但對(duì)于整合過程中的具體措施還有待于進(jìn)一步研究,將來還可以從具體實(shí)踐的層面進(jìn)行細(xì)化。希望能通過對(duì)相關(guān)問題的研究和呼吁,引起有關(guān)部門對(duì)彝文古籍的數(shù)字化整合這一問題的重視,盡快在一定區(qū)域內(nèi)進(jìn)行實(shí)踐,然后逐步推向全國(guó),最終實(shí)現(xiàn)我國(guó)彝文古籍資源的全國(guó)性整合。