• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      博物館藏品數(shù)字資源的長期保存系統(tǒng)建設(shè)

      2019-04-19 01:09:48劉芳謝靖
      數(shù)字圖書館論壇 2019年3期
      關(guān)鍵詞:藏品數(shù)字資源

      劉芳 謝靖

      (1.中國國家博物館,北京 100006;2.中國科學(xué)院文獻(xiàn)情報(bào)中心,北京 100190)

      博物館是保護(hù)與傳承人類歷史物質(zhì)文化遺產(chǎn)的重要場(chǎng)所。在近年來的信息化發(fā)展過程中,博物館做了大量的相關(guān)工作,逐步實(shí)現(xiàn)了藏品資源的數(shù)字化建設(shè),但仍然存在資源格式多樣、存儲(chǔ)位置分散、存儲(chǔ)介質(zhì)不統(tǒng)一、檢索及獲取困難等問題,不利于實(shí)現(xiàn)數(shù)字資源的高度共享,同時(shí)容易造成資源丟失。在未來,如何實(shí)現(xiàn)相關(guān)數(shù)字資源的統(tǒng)一保存和長期應(yīng)用,具有積極的研究意義。20世紀(jì)90年代起,數(shù)字資源長期保存逐漸發(fā)展為一個(gè)研究領(lǐng)域。近年來,國內(nèi)外相關(guān)的研究和建設(shè)項(xiàng)目已具備一定規(guī)模并建立了完善的標(biāo)準(zhǔn)體系,如荷蘭的數(shù)字保存聯(lián)盟(the Netherlands Coalition for Digital Preservation)[1]和美國第三方保存系統(tǒng)Portico[2]等,形成以國家為核心的、多個(gè)機(jī)構(gòu)共享的技術(shù)架構(gòu)和網(wǎng)絡(luò)環(huán)境。在我國,國際敦煌項(xiàng)目(International Dunhuang Project)[3]、中國記憶[4]、國家數(shù)字科技文獻(xiàn)長期保存示范體系(National Digital Preservation Program)[5]等在歷史文化和科技文獻(xiàn)資源長期保存方面,取得了豐富的研究成果和實(shí)踐經(jīng)驗(yàn)。本文將在研究數(shù)字資源長期保存相關(guān)技術(shù)體系、策略及案例的基礎(chǔ)上,結(jié)合博物館藏品資源數(shù)字化建設(shè)的特點(diǎn),提出長期保存系統(tǒng)建設(shè)的初步設(shè)計(jì)思路。

      1 典型案例分析

      1.1 國際敦煌項(xiàng)目

      國際敦煌項(xiàng)目[3]成立于1994年,在英國、中國、俄羅斯、日本、德國、法國和韓國設(shè)有研究中心,共同開展敦煌西域和絲綢之路東段的文獻(xiàn)保護(hù)、編錄和數(shù)字化工作。資源類型包括繪畫、手工藝品、紡織品、手稿、歷史照片和地圖等。截至2018年9月19日,數(shù)據(jù)庫中的影像數(shù)量達(dá)到520 681件。

      (1)資源組織。作為國際合作項(xiàng)目,國際敦煌可在線提供英、中、俄、法、日、德、韓7種版本的數(shù)據(jù),涵蓋藏品的館藏號(hào)、出土地、收藏史、材質(zhì)、尺寸、裝幀、主體、文種、保存與修復(fù)情況等信息,其中近90%的數(shù)據(jù)提供檢索服務(wù),可在線瀏覽并下載藏品的高清影像,若用于商業(yè)出版則須獲得相應(yīng)館藏機(jī)構(gòu)授權(quán)。此外,項(xiàng)目接受資源貢獻(xiàn),收集整理了敦煌學(xué)、絲綢之路相關(guān)的文獻(xiàn)資源與藏品數(shù)據(jù)建立關(guān)聯(lián),便于學(xué)者進(jìn)行研究。

      (2)技術(shù)特點(diǎn)。首先,項(xiàng)目建立了統(tǒng)一的元數(shù)據(jù)及圖像命名標(biāo)準(zhǔn)。選擇國際通用的元數(shù)據(jù)作為標(biāo)準(zhǔn)集,對(duì)文字和影像格式做了嚴(yán)格的規(guī)范。使用XML語言和統(tǒng)一的DTD格式實(shí)現(xiàn)數(shù)據(jù)描述及交換,所有數(shù)據(jù)均以結(jié)構(gòu)化形式存儲(chǔ)在數(shù)據(jù)庫中。其次,項(xiàng)目創(chuàng)建了統(tǒng)一的業(yè)務(wù)操作流程。在全球所有的成員機(jī)構(gòu)設(shè)有藏品編目及數(shù)字化研究中心,對(duì)當(dāng)?shù)氐某蓡T機(jī)構(gòu)進(jìn)行業(yè)務(wù)培訓(xùn)。成員機(jī)構(gòu)須按照項(xiàng)目組制定的工作流程完成藏品的選擇與保護(hù)、數(shù)據(jù)創(chuàng)建、影像處理、質(zhì)量檢查等工作。最后,項(xiàng)目建立了數(shù)據(jù)管理規(guī)范及分布式數(shù)據(jù)庫系統(tǒng)。成員機(jī)構(gòu)的數(shù)據(jù)統(tǒng)一托管在本國研究中心的服務(wù)器上。每個(gè)成員機(jī)構(gòu)擁有對(duì)本機(jī)構(gòu)數(shù)據(jù)的讀寫權(quán)限及對(duì)其他機(jī)構(gòu)數(shù)據(jù)的只讀訪問權(quán)限。數(shù)據(jù)的更改和添加可同步到其他服務(wù)器上。

      1.2 歐洲數(shù)字文化遺產(chǎn)平臺(tái)

      歐洲數(shù)字文化遺產(chǎn)平臺(tái)[6]由EUROPEANA基金會(huì)于2008年組織在線開放,致力于將整個(gè)歐洲的博物館、畫廊、圖書館和檔案館的館藏進(jìn)行數(shù)字化處理并整合到平臺(tái)上,便于世界各地的學(xué)者交流學(xué)習(xí)。截至2018年9月26日,可在線檢索的歐洲藝術(shù)品、文物、書籍、視頻和聲音數(shù)據(jù)達(dá)58 246 083條,同時(shí)創(chuàng)建了5個(gè)主題館藏和30多個(gè)展覽,提供資源的機(jī)構(gòu)超過3 500家。

      (1)資源組織。歐洲數(shù)字文化遺產(chǎn)平臺(tái)在數(shù)字資源收集與展示方面具有更強(qiáng)的靈活性。首先,成員機(jī)構(gòu)無須修改已有的數(shù)據(jù)結(jié)構(gòu),即可將數(shù)據(jù)資源提交到平臺(tái)上共享。以德國為例,可將本國相關(guān)文化遺產(chǎn)機(jī)構(gòu)的數(shù)據(jù)轉(zhuǎn)化為LIDO格式并集成到德國數(shù)字圖書館平臺(tái)(Deutsche Digitale Bibliothek,DDB)上,再由DDB將其數(shù)據(jù)統(tǒng)一傳輸至歐洲數(shù)字文化遺產(chǎn)平臺(tái)。根據(jù)雙方確定的語義轉(zhuǎn)化規(guī)則,將展示元數(shù)據(jù)轉(zhuǎn)化為DDB-view格式,索引元數(shù)據(jù)轉(zhuǎn)化為EDM(Europeana Data Model)格式[7]。其次,能夠最大限度地在各種分散、異構(gòu)和跨領(lǐng)域資源間建立數(shù)據(jù)關(guān)聯(lián)關(guān)系。如正在開發(fā)的V4Design項(xiàng)目可實(shí)現(xiàn)建筑物的3D數(shù)據(jù)建模,并與描述性數(shù)據(jù)建立關(guān)聯(lián)。

      (2)技術(shù)特點(diǎn)。首先,歐洲數(shù)字文化遺產(chǎn)平臺(tái)在資源的數(shù)據(jù)結(jié)構(gòu)方面做了較大創(chuàng)新。采用自創(chuàng)的EDM作為數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)[6]。EDM模型參考了CIDCO的語義模型結(jié)構(gòu),定義了數(shù)據(jù)關(guān)聯(lián)規(guī)則用于識(shí)別資源之間隱藏的關(guān)聯(lián)關(guān)系,且與DC(Dublin Core,都柏林核心元數(shù)據(jù))、ORE(Object Reuse and Exchange,對(duì)象復(fù)用與交換)、RDF(Resource Description Framework,資源描述框架)、FOAF(Friend-of-a-Friend,RDF詞匯表)、SKOS(Simple Knowledge Organization System,簡單知識(shí)組織系統(tǒng))、OWL(Web Ontology Language,網(wǎng)絡(luò)本體語言)等數(shù)據(jù)結(jié)構(gòu)具有良好的兼容性和互通性。這使得項(xiàng)目能夠盡可能完善地保存資源數(shù)據(jù)的各種描述信息。其次,創(chuàng)建了較為精確的相似度算法,通過算法匹配在地理位置、時(shí)間序列、事件、主題內(nèi)容、形狀等情境中為資源建立關(guān)聯(lián),豐富藏品數(shù)據(jù)的情境信息。最后,創(chuàng)建了Europeana數(shù)據(jù)許可框架,提高與其他應(yīng)用程序和服務(wù)的數(shù)據(jù)互操作性,為分布式數(shù)據(jù)庫系統(tǒng)的建立創(chuàng)造了條件。

      1.3 中國記憶

      中國記憶項(xiàng)目由國家圖書館發(fā)起,以口述影像作為主要載體,照片、書信、日記、實(shí)物、文獻(xiàn)資料為輔助載體,記錄中國現(xiàn)代及當(dāng)代“記憶”的數(shù)字資源不完整[8]。項(xiàng)目資源以專題庫的形式進(jìn)行整合及展示,涉及的主題包括非物質(zhì)文化遺產(chǎn)、重大歷史事件和人物、圖書館記憶,數(shù)據(jù)總量在40TB以上。

      (1)資源組織。中國記憶項(xiàng)目收集并整理了大量的人物口述視頻,與其他描述性信息共同作為歷史資料劃分到不同的子專題下,實(shí)現(xiàn)關(guān)聯(lián)展示。以東北抗聯(lián)專題為例,在其下分為抗聯(lián)簡介、老戰(zhàn)士口述、歷史照片、文獻(xiàn)目錄等子專題,這些子專題按資源類型進(jìn)行分類。目前提供“我們的文字”“蠶絲織繡”“中國當(dāng)代音樂家”“中國年畫”等6個(gè)資源專題的在線展示和檢索[4]。未來,中國記憶項(xiàng)目會(huì)加強(qiáng)與地方的合作,利用已有的資源標(biāo)準(zhǔn)規(guī)范,收集并展示各地區(qū)、民族、行業(yè)的歷史文化和實(shí)踐經(jīng)驗(yàn)。

      (2)技術(shù)特點(diǎn)。首先,制定了多媒體資源的描述規(guī)范[9]。為提高視頻資源的檢索準(zhǔn)確性,除視頻編目標(biāo)準(zhǔn)、館藏和版權(quán)等描述信息外,同時(shí)將人物音頻轉(zhuǎn)換為文字,然后以文字為基礎(chǔ)實(shí)現(xiàn)對(duì)視頻的內(nèi)容描述和關(guān)鍵詞標(biāo)引(如口述事件發(fā)生的空間和時(shí)間范圍以及視頻內(nèi)容描述等),為實(shí)現(xiàn)基于文本的關(guān)鍵視頻片段精準(zhǔn)查找提供了條件。其次,在視頻資源與其他類型信息間建立數(shù)據(jù)關(guān)聯(lián)關(guān)系。在數(shù)據(jù)存儲(chǔ)時(shí)采用基于主題的層級(jí)結(jié)構(gòu),在每個(gè)子專題下又分別采用不同的資源組織形式并制定了嚴(yán)格的編碼規(guī)則。

      2 藏品數(shù)字資源長期保存系統(tǒng)建設(shè)

      2.1 藏品數(shù)字資源特征分析

      藏品數(shù)字資源具有5個(gè)特征:①以藏品的二維影像、三維影像、視頻等多媒體資源作為主要存儲(chǔ)類型,而傳統(tǒng)圖書館、檔案館以文獻(xiàn)記錄作為主要存儲(chǔ)類型;②不同類型的多媒體資源由于采集設(shè)備和來源渠道不同,從而存在多種編碼方式;③因長期保存需要,數(shù)字資源具有采集精度高、數(shù)據(jù)容量大、資源消耗多的特點(diǎn);④與知識(shí)描述緊密關(guān)聯(lián),需要對(duì)數(shù)字媒體與相關(guān)文本知識(shí)關(guān)聯(lián)標(biāo)注;⑤為適應(yīng)展廳、網(wǎng)站、手機(jī)終端等多種展示要求,數(shù)字資源須支持不同比例與分辨率的壓縮,滿足不同環(huán)境場(chǎng)景下的網(wǎng)絡(luò)傳輸與設(shè)備展示。根據(jù)藏品數(shù)字資源的5個(gè)特征,在長期保存系統(tǒng)的設(shè)計(jì)和規(guī)劃中,需要同時(shí)滿足博物館資源的長期保存職能和展覽職能。

      2.2 藏品數(shù)字資源保存系統(tǒng)的模型

      數(shù)字資源長期保存,可以定義為一系列對(duì)數(shù)字信息進(jìn)行持續(xù)管理和維護(hù)的活動(dòng),目標(biāo)是確保數(shù)字信息的長期存活,保證數(shù)字信息真實(shí)可信,能夠被未來的使用者所理解和應(yīng)用[10]。基于對(duì)國內(nèi)外主要數(shù)字資源長期保存體系的研究和分析,其架構(gòu)體系按照職能的不同,可以分為數(shù)據(jù)管理、數(shù)據(jù)攝入、數(shù)據(jù)保存、數(shù)據(jù)訪問和分布式數(shù)據(jù)存儲(chǔ)5部分。5個(gè)模塊的功能劃分和相互關(guān)系如圖1所示。

      圖1 數(shù)字長期保存系統(tǒng)的功能模型[10]

      數(shù)據(jù)管理功能模塊主要用于實(shí)現(xiàn)資源規(guī)劃、工作流程、技術(shù)策略、大規(guī)模數(shù)據(jù)遷移策略、數(shù)據(jù)存儲(chǔ)策略、數(shù)據(jù)獲取和訪問策略,以及知識(shí)產(chǎn)權(quán)保護(hù)策略等的制定和確認(rèn)工作,從技術(shù)和管理層面對(duì)整個(gè)系統(tǒng)的運(yùn)行做出設(shè)計(jì),并實(shí)時(shí)監(jiān)測(cè)系統(tǒng)的運(yùn)行狀態(tài)。數(shù)據(jù)長期保存主要面向多個(gè)機(jī)構(gòu)在某個(gè)行業(yè)、領(lǐng)域或?qū)n}的數(shù)據(jù),其目的在于實(shí)現(xiàn)對(duì)數(shù)據(jù)的整合、永久保存和共享,因此涉及大量的管理、規(guī)劃和安全保障工作,實(shí)現(xiàn)系統(tǒng)的可信賴性。

      數(shù)據(jù)結(jié)構(gòu)主要用于管理數(shù)字內(nèi)容、元數(shù)據(jù),及二者之間的相互關(guān)系,以便于實(shí)現(xiàn)對(duì)數(shù)據(jù)的導(dǎo)入、導(dǎo)出、查詢和訪問等功能。數(shù)據(jù)結(jié)構(gòu)包括描述信息和管理信息兩種資源類型,并需要滿足8項(xiàng)功能:①數(shù)據(jù)結(jié)構(gòu)須具有可擴(kuò)展性,可根據(jù)保存目標(biāo)及規(guī)模進(jìn)行調(diào)整;②能夠?yàn)閿?shù)字資源及其元數(shù)據(jù)提供唯一標(biāo)識(shí)符;③能夠抽取和創(chuàng)建元數(shù)據(jù)并進(jìn)行管理;④能夠?qū)①Y源呈現(xiàn)給用戶;⑤需要具備強(qiáng)大的數(shù)據(jù)索引及檢索功能;⑥對(duì)所用技術(shù)進(jìn)行監(jiān)測(cè),及時(shí)發(fā)現(xiàn)并替換過時(shí)的技術(shù);⑦能夠記錄所有元數(shù)據(jù)的歷史變更信息;⑧定期對(duì)數(shù)據(jù)進(jìn)行審計(jì)。

      數(shù)據(jù)獲取功能主要用于與資源第三方協(xié)商確定獲取數(shù)據(jù)的內(nèi)容、規(guī)范與版權(quán)條例后,應(yīng)用數(shù)據(jù)封裝、唯一標(biāo)識(shí)、完整性校驗(yàn)和格式轉(zhuǎn)換等技術(shù)手段將資源獲取到長期保存系統(tǒng)進(jìn)行存儲(chǔ)的過程。為降低該功能模塊的復(fù)雜性,一般會(huì)要求對(duì)同一機(jī)構(gòu)的同類型數(shù)據(jù)采用同一種數(shù)據(jù)結(jié)構(gòu)和規(guī)范進(jìn)行獲取。在數(shù)據(jù)進(jìn)入長期保存系統(tǒng)后,要對(duì)數(shù)據(jù)質(zhì)量進(jìn)行檢測(cè),包括數(shù)據(jù)完整性、格式統(tǒng)一性、數(shù)據(jù)有效性、數(shù)據(jù)可讀性和病毒檢測(cè)等;在檢測(cè)通過后,數(shù)據(jù)會(huì)進(jìn)入存儲(chǔ)模塊,同時(shí)向資源提供者發(fā)出確認(rèn)通知并生成系統(tǒng)日志。

      數(shù)據(jù)存儲(chǔ)功能主要用于解決數(shù)據(jù)的安全問題,通過數(shù)據(jù)存儲(chǔ)軟件與硬件技術(shù)相配合的方式,創(chuàng)建數(shù)據(jù)安全體系,增強(qiáng)系統(tǒng)對(duì)各種故障、意外事故和災(zāi)難的抵御能力。目前常用的數(shù)據(jù)存儲(chǔ)技術(shù)包括網(wǎng)絡(luò)存儲(chǔ)、分層存儲(chǔ)、虛擬化和云存儲(chǔ)等類型。對(duì)于重要的數(shù)據(jù)資源,應(yīng)實(shí)現(xiàn)遠(yuǎn)程備份。由于數(shù)據(jù)長期保存系統(tǒng)通常會(huì)涉及大體量的數(shù)據(jù)存儲(chǔ)問題,對(duì)存儲(chǔ)空間的容量、存儲(chǔ)安全性、錯(cuò)誤檢測(cè)和數(shù)據(jù)讀取速度具有較高要求,導(dǎo)致存儲(chǔ)設(shè)備的投入成本較高。

      數(shù)據(jù)訪問功能模塊主要用于接收用戶的資源訪問請(qǐng)求,然后根據(jù)用戶的資源訪問權(quán)限和數(shù)據(jù)管理控制要求,將生成的響應(yīng)數(shù)據(jù)傳遞給用戶的過程。其中,資源定位、用戶認(rèn)證授權(quán)和數(shù)據(jù)開放協(xié)議等技術(shù)是數(shù)據(jù)訪問模塊的核心問題。應(yīng)當(dāng)在保證數(shù)據(jù)和系統(tǒng)安全性的前提下,提高系統(tǒng)的易用性和可用性。

      2.3 藏品長期保存系統(tǒng)的應(yīng)用模式

      博物館藏品及數(shù)字資源長期分散保存于各博物館和研究院所中,這導(dǎo)致無論從時(shí)間、材質(zhì)、器物類別、出土地等任何一個(gè)分類維度都無法獲得完整的數(shù)據(jù),給歷史學(xué)、考古學(xué)、器物學(xué)的研究者和相關(guān)愛好者獲取有用信息帶來較大阻力。2012年,國務(wù)院啟動(dòng)第一次全國可移動(dòng)文物普查工作,以藏品名稱、藏品編號(hào)、文物類別等14個(gè)指標(biāo)項(xiàng)作為核心元素,收集和整理了全國相關(guān)單位的藏品信息[11]。但各研究機(jī)構(gòu)還有很多在長期工作中積累的藏品信息,因?yàn)楦鞣N原因沒有得到有效的收集和利用。這些問題可以通過建立分布式的藏品數(shù)字資源保存系統(tǒng)得到改善,應(yīng)用模式如圖2所示。

      圖2 長期保存系統(tǒng)的應(yīng)用模式[12]

      在該應(yīng)用模式中,各機(jī)構(gòu)共同制定統(tǒng)一的數(shù)據(jù)管理規(guī)劃,并按照規(guī)劃標(biāo)準(zhǔn)將整理過的本單位資源數(shù)據(jù)保存到系統(tǒng)中實(shí)現(xiàn)資源共享。資源共享包括兩種形式:對(duì)于資源體量較大、資金和人力較雄厚的機(jī)構(gòu)可在本單位建立數(shù)據(jù)環(huán)境,為其他機(jī)構(gòu)提供數(shù)據(jù)遠(yuǎn)程訪問接口;對(duì)于資源體量較小、資金和人力較匱乏的機(jī)構(gòu),可通過攝取客戶端將本單位數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)中心的服務(wù)器中。參與機(jī)構(gòu)和獲得授權(quán)的消費(fèi)者可共享并瀏覽長期保存系統(tǒng)中的藏品數(shù)字資源,并依據(jù)制度通過系統(tǒng)的版權(quán)保護(hù)模塊付費(fèi)獲得使用版權(quán),由中心系統(tǒng)管理者負(fù)責(zé)數(shù)據(jù)和系統(tǒng)的維護(hù)工作,并提供技術(shù)支持。在該應(yīng)用模式下,機(jī)構(gòu)依然擁有對(duì)各自數(shù)據(jù)的控制和管理權(quán),不會(huì)受到數(shù)據(jù)中心的強(qiáng)制性控制,同時(shí)可以最大限度地共享資源,提高資源的利用率。

      目前,國際上關(guān)于長期保存體系建設(shè)已經(jīng)形成一些較為成熟的標(biāo)準(zhǔn)體系和技術(shù)產(chǎn)品。2003年,美國空間數(shù)據(jù)系統(tǒng)咨詢委員會(huì)發(fā)布的OAIS(Open Archival Information System)[13]標(biāo)準(zhǔn),詳細(xì)描述了系統(tǒng)建設(shè)在技術(shù)模型、信息結(jié)構(gòu)、功能結(jié)構(gòu)和支撐環(huán)境等方面的要求。此外,基于LOCKSS[14]、DAITSS[15]、Fedora Repository[16]等技術(shù)開發(fā)的數(shù)字保存網(wǎng)絡(luò)也值得借鑒。

      3 現(xiàn)存問題及對(duì)策分析

      3.1 加強(qiáng)機(jī)構(gòu)、領(lǐng)域間的資源合作與共享

      數(shù)字資源的長期保存是一個(gè)綜合性的工程,目的是集合多個(gè)機(jī)構(gòu)的資源和研究成果,實(shí)現(xiàn)某個(gè)領(lǐng)域資源的合作與共享。此外,不同機(jī)構(gòu)存在各自的優(yōu)勢(shì)和不足。以綜合性博物館為例,涉及藏品資源類型豐富但并不全面,要建立整套數(shù)據(jù)標(biāo)準(zhǔn)存在較大難度且單一建立的標(biāo)準(zhǔn)難以實(shí)現(xiàn)未來藏品領(lǐng)域信息的整合。這意味著,在藏品資源長期保存建設(shè)中,應(yīng)深入實(shí)現(xiàn)各博物館之間的交流與合作,打破機(jī)構(gòu)、區(qū)域間的地理界限,共同制定數(shù)據(jù)長期保存策略。

      在制定策略時(shí),應(yīng)注意3個(gè)問題。①做好數(shù)字資源保存的規(guī)劃工作。應(yīng)根據(jù)藏品數(shù)字資源長期保存系統(tǒng)建設(shè)的目的,有針對(duì)性地選擇資源保存范圍并在機(jī)構(gòu)間達(dá)成共識(shí)。可采用“確定數(shù)據(jù)范圍及基本信息—選擇實(shí)驗(yàn)樣本—制定候選方案—分析評(píng)估結(jié)果—形成保存規(guī)劃”的方式制定方案。②建立全面的數(shù)據(jù)標(biāo)準(zhǔn)體系。長期保存的標(biāo)準(zhǔn)體系,從宏觀上可以劃分為資源描述信息和業(yè)務(wù)流程標(biāo)準(zhǔn)兩部分。其中,資源描述信息包括字符編碼標(biāo)準(zhǔn)、唯一標(biāo)識(shí)、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)封裝標(biāo)準(zhǔn)與格式等內(nèi)容;業(yè)務(wù)流程標(biāo)準(zhǔn)涵蓋數(shù)據(jù)獲取、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)訪問3個(gè)主要功能模塊的業(yè)務(wù)流程標(biāo)準(zhǔn)。③協(xié)商保存數(shù)字資源的知識(shí)產(chǎn)權(quán),確保數(shù)字資源的安全訪問控制。確定數(shù)字資源的所有者,依照相關(guān)知識(shí)產(chǎn)權(quán)的管理方法,明確版權(quán)所有者的數(shù)據(jù)提供和共享權(quán)益。

      3.2 應(yīng)對(duì)數(shù)字資源的復(fù)雜性

      復(fù)雜性和多樣性是博物館藏品的特點(diǎn)。除藏品的名稱、材質(zhì)、形狀、保存狀態(tài)、保存位置等基本描述信息外,還包括藏品的影像、參考文獻(xiàn)、修復(fù)情況、展出歷史等信息,涉及文本文件、二維影像、三維影像、音頻文件、視頻文件等多種資源類型,每種資源類型又包括多種資源格式。此外,博物館藏品涉及書畫、器物、古籍等多種類型,在顏色、質(zhì)地、體積、重量等方面存在較大差別,在數(shù)字化過程中難以統(tǒng)一標(biāo)準(zhǔn)。

      基于以上問題,在進(jìn)行藏品資源長期保存工作時(shí),可參照“標(biāo)準(zhǔn)制定—技術(shù)工具選擇—工作規(guī)范—規(guī)?;瘜?shí)現(xiàn)”的步驟和流程進(jìn)行建設(shè)[17]。①建立完善的數(shù)據(jù)格式標(biāo)準(zhǔn)??煽紤]基于藏品類型進(jìn)行分類,為每種類型的藏品建立統(tǒng)一的數(shù)據(jù)采集標(biāo)準(zhǔn)和數(shù)據(jù)檢驗(yàn)標(biāo)準(zhǔn),如事先確定圖像的色溫色調(diào)和分辨率、音頻和視頻資源的數(shù)碼格式等。在條件允許的情況下,可考慮在藏品的多媒體資源中嵌入描述性元數(shù)據(jù),并與藏品的描述性數(shù)據(jù)建立關(guān)聯(lián),提高數(shù)據(jù)的互操作性和可分析性。②技術(shù)工具選擇。盡可能做到使用同樣的數(shù)據(jù)采集工具和通用的、生命周期較長的資源格式,以簡化數(shù)據(jù)獲取、存儲(chǔ)和訪問的難度,延長數(shù)字資源生命周期。③確立工作規(guī)范。確定多媒體由制作、修飾、編錄、審核到上傳的工作規(guī)范,并編制文檔。④規(guī)?;瘜?shí)現(xiàn)。加大培訓(xùn)力度,并確保規(guī)范的全面執(zhí)行。

      3.3 提高數(shù)字資源的互操作性

      由于藏品資源系統(tǒng)的初始建設(shè)目的不同,在分類標(biāo)準(zhǔn)和著錄規(guī)則上存在的區(qū)別導(dǎo)致大量數(shù)據(jù)以異構(gòu)的形式存在。這使得數(shù)字資源在整合時(shí),可能出現(xiàn)結(jié)構(gòu)不匹配、內(nèi)容不一致等情況,成為構(gòu)建藏品數(shù)字資源長期保存系統(tǒng)的一個(gè)重要風(fēng)險(xiǎn)。重新制定數(shù)據(jù)標(biāo)準(zhǔn),雖然可以從根本上解決數(shù)據(jù)異構(gòu)問題,但是需要消耗極大的人力和物力成本,不是最優(yōu)的解決策略。

      在進(jìn)行數(shù)字資源長期保存建設(shè)時(shí),可根據(jù)需求,選擇以下4種方式提高數(shù)字資源的互操作性[18]。①建立頂層元數(shù)據(jù)應(yīng)用規(guī)范,兼容多種不同的元數(shù)據(jù)標(biāo)準(zhǔn),保證不同標(biāo)準(zhǔn)間有基本的通用結(jié)構(gòu)和元素。但這種方式難以繼承已有元數(shù)據(jù)標(biāo)準(zhǔn)的描述細(xì)節(jié)和深度。②在不同數(shù)據(jù)規(guī)范之間建立映射關(guān)系。以一種靈活性和兼容性較強(qiáng)的數(shù)據(jù)標(biāo)準(zhǔn)作為基準(zhǔn),在該標(biāo)準(zhǔn)和其他標(biāo)準(zhǔn)之間分別制定一對(duì)一的元數(shù)據(jù)映射規(guī)范。這種方式準(zhǔn)確性較高,在資源整合項(xiàng)目中應(yīng)用廣泛,但在數(shù)據(jù)結(jié)構(gòu)較為復(fù)雜的情況下會(huì)增加大量工作。③基于語義的數(shù)據(jù)復(fù)用與集成。語義模型采用三元組關(guān)系構(gòu)建樹形數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)資源描述,具有較強(qiáng)的延伸性和擴(kuò)展性,能夠有效整合多種數(shù)據(jù)標(biāo)準(zhǔn)。在數(shù)據(jù)規(guī)范確定的情況下,可以使用語義結(jié)構(gòu)實(shí)現(xiàn)不同標(biāo)準(zhǔn)間的互操作[19]。④在分布式數(shù)據(jù)長期保存環(huán)境中,可以通過制定數(shù)據(jù)互操作協(xié)議或使用API來實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫之間的跨庫檢索和資源調(diào)用,不過二者多關(guān)注于底層數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范和格式的互操作性。

      3.4 確保數(shù)字資源的安全性

      數(shù)字資源依賴數(shù)字化技術(shù)而存在,需要特定的軟件技術(shù)及硬件環(huán)境才能被存儲(chǔ)、交換和呈現(xiàn)。這些特質(zhì),決定數(shù)字資源具有脆弱性并容易受到外界的干擾和威脅。如人為的操作和篡改、信息技術(shù)的快速退化、物理載體的腐化、組織機(jī)構(gòu)的變化、經(jīng)濟(jì)的衰退和自然災(zāi)害的威脅等,都會(huì)給數(shù)字資源帶來無法恢復(fù)的損失。

      長期保存本質(zhì)上是實(shí)現(xiàn)對(duì)數(shù)字資源的持續(xù)管理和維護(hù),在工作中應(yīng)該注意5個(gè)問題[20]。①重視數(shù)字內(nèi)容格式的選擇。格式須具有較高的標(biāo)準(zhǔn)化程度,能夠在多種環(huán)境中正確地識(shí)別、理解和呈現(xiàn)資源內(nèi)容,具有廣泛的用戶支持度。②根據(jù)資源的重要性,分別確立信息等級(jí)安全保護(hù)標(biāo)準(zhǔn)、可信賴性認(rèn)證標(biāo)準(zhǔn)、審計(jì)與認(rèn)證標(biāo)準(zhǔn)、數(shù)據(jù)備份與恢復(fù)方案、應(yīng)急處理方案等。確保系統(tǒng)的安全性、技術(shù)的可靠性和軟硬件的可持續(xù)使用性。③應(yīng)用訪問控制技術(shù)、用戶認(rèn)證和授權(quán)技術(shù)等,在保證用戶獲得資源的真實(shí)性的同時(shí)防止非法用戶的網(wǎng)絡(luò)入侵。④加強(qiáng)物理訪問控制。相關(guān)人員須有相應(yīng)的職責(zé)和權(quán)限,建立門禁安保系統(tǒng),限制不相干人員接觸系統(tǒng)的物理設(shè)施。在出現(xiàn)緊急情況時(shí),須有相應(yīng)的災(zāi)難恢復(fù)機(jī)制。⑤建立長期的發(fā)展機(jī)制。保證項(xiàng)目經(jīng)費(fèi)的持續(xù)供給,確保每個(gè)業(yè)務(wù)流程都有制度可依,不會(huì)因?yàn)榻M織機(jī)構(gòu)及人員的變動(dòng)影響系統(tǒng)的正常運(yùn)行。

      4 結(jié)語

      本文著重研究了國際敦煌、歐洲數(shù)字文化遺產(chǎn)平臺(tái)和中國記憶3個(gè)數(shù)字資源長期保存項(xiàng)目的特點(diǎn)和應(yīng)用情況,基于已有研究成果設(shè)計(jì)了數(shù)字資源長期保存體系的功能模型和應(yīng)用模式。經(jīng)過以上研究和分析,筆者認(rèn)為,加強(qiáng)機(jī)構(gòu)領(lǐng)域間的資源合作與共享,應(yīng)對(duì)數(shù)字資源的復(fù)雜性,提高數(shù)據(jù)資源的互操作性,確保數(shù)據(jù)的安全性是博物館藏品數(shù)字資源長期保存的關(guān)鍵性問題。數(shù)字化技術(shù)的發(fā)展,對(duì)博物館傳統(tǒng)的工作方式造成較大的沖擊。在新的形勢(shì)下,數(shù)字化展示、文創(chuàng)產(chǎn)品研發(fā)、用戶數(shù)據(jù)分析等新型業(yè)務(wù)模式的發(fā)展都需要有強(qiáng)大的數(shù)據(jù)基礎(chǔ)出作為支撐。數(shù)字資源長期保存系統(tǒng)作為底層建筑的作用不容忽視,應(yīng)成為一項(xiàng)長期工作持續(xù)開展和完善。

      猜你喜歡
      藏品數(shù)字資源
      基礎(chǔ)教育資源展示
      抱樸齋藏品
      李杰森藏品
      譚禮藏品
      一樣的資源,不一樣的收獲
      資源回收
      答數(shù)字
      羅妍妍藏品欣賞
      寶藏(2017年11期)2018-01-03 06:46:09
      資源再生 歡迎訂閱
      資源再生(2017年3期)2017-06-01 12:20:59
      數(shù)字看G20
      博乐市| 临潭县| 怀远县| 渭南市| 乐山市| 普格县| 庆元县| 渭南市| 禄劝| 五河县| 兰溪市| 金堂县| 崇礼县| 江源县| 武宁县| 马关县| 澎湖县| 太原市| 龙口市| 汤阴县| 合山市| 磴口县| 北宁市| 虎林市| 五寨县| 武清区| 淮安市| 朝阳市| 和顺县| 阳曲县| 扎囊县| 遵义市| 阳朔县| 合川市| 襄城县| 桃江县| 名山县| 桦甸市| 阿勒泰市| 贞丰县| 灵山县|