陳雯 袁月 王俊淘 劉鈺 劉琦 王希
關(guān)鍵詞:城市軌道交通;電子文件;元數(shù)據(jù);電子檔案;歸檔;知識管理;數(shù)據(jù)實體;數(shù)據(jù)描述
1 背景
元數(shù)據(jù)是描述文件背景、內(nèi)容、結(jié)構(gòu)及其整個管理過程的數(shù)據(jù),文件元數(shù)據(jù)是能夠在領(lǐng)域內(nèi)和跨領(lǐng)域間促進文件生成、管理和長期利用的結(jié)構(gòu)化或半結(jié)構(gòu)化信息。①早在2009年,《中共中央辦公廳、國務(wù)院辦公廳印發(fā)〈電子文件管理暫行辦法〉的通知》中,就強調(diào)“電子文件及其元數(shù)據(jù)應(yīng)當同時歸檔”。之后,更是接連多條元數(shù)據(jù)管理相關(guān)的標準問世,包括住建部于2012年發(fā)布的《建設(shè)電子檔案元數(shù)據(jù)標準》(CJJ/T 187—2012)、2009年發(fā)布實施的國家行業(yè)標準《文書類電子文件元數(shù)據(jù)方案》(DA/T 46—2009)等。
近年來,檔案信息化的進程在各行各業(yè)縱深發(fā)展,電子檔案管理的重要性與日俱增,科學合理的電子文件管理流程已經(jīng)成為社會生產(chǎn)和經(jīng)濟發(fā)展的關(guān)鍵內(nèi)驅(qū)力。
在城市軌道交通行業(yè)迅猛發(fā)展的背景下,工程項目中產(chǎn)生了大量的電子文件。為了確保電子檔案管理和檔案信息化建設(shè)的順利進行,維護電子文件的真實性和憑證性,需要制定科學合理的元數(shù)據(jù)管理方案,推動電子文件的長期保存和科學管理,促進電子檔案的開發(fā)利用。
2 元數(shù)據(jù)科學歸檔的必要性
2.1 規(guī)范電子檔案管理流程。元數(shù)據(jù)是電子檔案的重要組成部分,直接體現(xiàn)了電子檔案系統(tǒng)的依賴性。從電子文件的產(chǎn)生到歸檔,元數(shù)據(jù)始終伴隨著其中。相比傳統(tǒng)檔案管理模式,元數(shù)據(jù)便于管理者更準確地把握檔案的內(nèi)容、結(jié)構(gòu)、背景信息。電子文件形成、運轉(zhuǎn)、處置、歸檔到后續(xù)電子檔案修改、傳輸、存儲過程中的各種痕跡和特征都由元數(shù)據(jù)反映出來。因此,元數(shù)據(jù)直接保障電子檔案的憑證性,構(gòu)成了電子檔案標準化管理的重要基礎(chǔ)。[1]充分捕獲與收集的元數(shù)據(jù),才能規(guī)范電子檔案的管理流程。
2.2 保障電子檔案質(zhì)量達標。元數(shù)據(jù)是在數(shù)字環(huán)境中伴生電子檔案的數(shù)據(jù)信息,通過其記錄的自身屬性、技術(shù)環(huán)境等信息,確保電子檔案四性檢測的順利開展。[2]2012年發(fā)布的《建設(shè)電子檔案元數(shù)據(jù)標準》(CJJ/T 187—2012),目的就是“加強建設(shè)電子檔案的全過程管理,建立真實、完整、有效的建設(shè)電子檔案,保障建設(shè)電子檔案的安全保管與有效開發(fā)利用”。②由此可見,做好元數(shù)據(jù)收集歸檔工作能有效確保電子文件歸檔的完整性和真實性,保障電子檔案的質(zhì)量達標。
2.3 輔助電子檔案知識管理。檔案數(shù)據(jù)管理時代,任何類型的檔案數(shù)據(jù)采集都離不開對元數(shù)據(jù)的關(guān)注。[3]元數(shù)據(jù)在電子檔案查詢與檢索中起到重要的輔助作用,多級著錄可以實現(xiàn)對檢索內(nèi)容的精準定位,提高查詢的準確性和效率。此外,還可以對電子檔案的屬性和內(nèi)容進行結(jié)構(gòu)化分析,有助于電子檔案的高效統(tǒng)計與編研工作。[4]元數(shù)據(jù)還構(gòu)成了電子文件內(nèi)容的關(guān)聯(lián)性,可以為不同背景和形態(tài)的電子文件與電子檔案提供描述方法和工具。從檔案資源開發(fā)角度,元數(shù)據(jù)能有效輔助電子檔案的知識管理,提高建設(shè)單位從檔案數(shù)據(jù)挖掘價值的能力。
3 城市軌道交通工程元數(shù)據(jù)歸檔現(xiàn)存問題與難點分析
通過對元數(shù)據(jù)相關(guān)法規(guī)標準的檢索和匯總,對元數(shù)據(jù)相關(guān)研究文獻進行總結(jié),以及對城市軌道交通工程單位檔案管理活動進行調(diào)研與分析,總結(jié)目前城市軌道交通工程項目中元數(shù)據(jù)歸檔存在的主要問題和難點為以下三點。
3.1 歸檔范圍不明確。元數(shù)據(jù)分為文件、業(yè)務(wù)、責任者和關(guān)系四類元數(shù)據(jù)實體,各個行業(yè)元數(shù)據(jù)的區(qū)別主要體現(xiàn)在業(yè)務(wù)層面,地鐵項目產(chǎn)生的元數(shù)據(jù)也會根據(jù)業(yè)務(wù)活動的不同呈現(xiàn)出其特殊性,比如城市軌道交通建設(shè)分為不同的標段和線路,這樣的信息就要體現(xiàn)在元數(shù)據(jù)之中;又比如電子文件的技術(shù)背景,在城軌工程中可能表現(xiàn)得更加復(fù)雜而多元。對于城市軌道交通工程電子檔案的元數(shù)據(jù)來說,還沒有一套專門的標準規(guī)范其管理流程,反映其業(yè)務(wù)特征。規(guī)范的缺失帶來的直接影響就是歸檔范圍的不明確,檔案人員難以厘清哪些元數(shù)據(jù)是真正需要收集的。許多地方出臺的元數(shù)據(jù)方案往往會出于全面收集不錯漏的目的,設(shè)置較大的元數(shù)據(jù)采集數(shù)量。[5]這種做法不僅加重了工作負擔,也導(dǎo)致實際工作中元數(shù)據(jù)歸檔范圍愈發(fā)模糊而難以統(tǒng)一。目前,大部分單位只能按照舊有的工程檔案元數(shù)據(jù)標準進行元數(shù)據(jù)的捕獲,有的單位遵照文書檔案元數(shù)據(jù)的管理規(guī)范,工作流程沒有考慮到城市軌道交通工程自身的特點,比如不同車輛段和軌道標段的標引,不同參建單位的元數(shù)據(jù)體現(xiàn)不明顯。綜上,目前元數(shù)據(jù)歸檔的難點之一即如何確定哪些類別元數(shù)據(jù)需要歸檔,以及如何劃分明確的、科學的元數(shù)據(jù)歸檔范圍。
3.2 歸檔技術(shù)不成熟。根據(jù)調(diào)研情況,目前信息技術(shù)在檔案管理領(lǐng)域應(yīng)用和發(fā)展的不足,會直接影響元數(shù)據(jù)歸檔的完整度。以電子文件形成過程為例,由于目前大部分系統(tǒng)功能的限制,導(dǎo)致原生性電子文件缺失,就會讓元數(shù)據(jù)的捕獲變得極為困難。如果歸檔的電子文件只有掃描后的PDF文件,那其附帶的元數(shù)據(jù)也只有針對PDF文件的元數(shù)據(jù),電子文件原生的數(shù)據(jù)環(huán)境就無法通過元數(shù)據(jù)進行體現(xiàn)。也正是因為目前原生性電子文件還無法成為檔案數(shù)字資源的主體,所以元數(shù)據(jù)的收集也需要將檔案數(shù)字化的工作流程納入其中進行考慮。對于城市軌道交通工程來說,復(fù)雜的信息系統(tǒng)帶來格式多樣的電子文件。比如BIM系統(tǒng)產(chǎn)生的大量描述工程模型的數(shù)據(jù)資料,這些數(shù)據(jù)具有很強的動態(tài)性,容易進行操作和修改,卻因為接口建設(shè)的不足無法作為元數(shù)據(jù)歸檔。此外,有學者也提到結(jié)構(gòu)化數(shù)據(jù)歸檔解決方案尚不成熟等問題,結(jié)構(gòu)更為復(fù)雜的數(shù)據(jù)集無法轉(zhuǎn)為非結(jié)構(gòu)化數(shù)據(jù)進行歸檔,[6]這些問題都對元數(shù)據(jù)歸檔工作帶來了艱巨的挑戰(zhàn)。
3.3 歸檔環(huán)境有風險。整合元數(shù)據(jù)相關(guān)的標準規(guī)范,可以發(fā)現(xiàn)國家出臺的大部分元數(shù)據(jù)標準,發(fā)行時間距今已經(jīng)超過十年,不能完全適應(yīng)當前工程電子文件元數(shù)據(jù)的管理要求。隨著電子檔案管理理念的不斷發(fā)展和“單套制”管理模式的試點推行,盡管許多單位已經(jīng)開始進行相應(yīng)的嘗試,但雙套歸檔與單套歸檔并存的局面仍將維持一段時間。相對于傳統(tǒng)的紙質(zhì)文件歸檔,電子文件歸檔的“雙套制”和“單套制”形式更為復(fù)雜且不斷變化,導(dǎo)致建設(shè)單位的業(yè)務(wù)部門和檔案管理部門難以及時、準確地理解并統(tǒng)一執(zhí)行“單套制”管理。[7]檔案部門難以插手前端業(yè)務(wù),或者缺乏相關(guān)意識,徒留元數(shù)據(jù)在系統(tǒng)中逐漸失去價值。同時,目前大部分的標準還忽視了檔案數(shù)字化相關(guān)工作流程等。[8]在電子文件存放位置不斷調(diào)整的城市軌道交通工程項目中,元數(shù)據(jù)存儲方式和位置的不確定性同樣帶來了風險。由于熟練度不足、系統(tǒng)對接困難等現(xiàn)實因素,一些業(yè)務(wù)系統(tǒng)難以進行物理歸檔,系統(tǒng)中元數(shù)據(jù)邏輯歸檔的位置和電子文件又難以實現(xiàn)統(tǒng)一。這都是元數(shù)據(jù)歸檔環(huán)境中風險的具體表現(xiàn)。
4 城市軌道交通工程元數(shù)據(jù)的歸檔優(yōu)化路徑
4.1 以標準為遵循,制定相關(guān)制度規(guī)范。新修訂的《中華人民共和國檔案法》中新增的“監(jiān)督檢查”專章規(guī)定電子文件管理要以“來源可靠、程序規(guī)范、要素合規(guī)”為根本遵循,這也提醒我們:元數(shù)據(jù)的歸檔優(yōu)化離不開以標準為遵循的制度規(guī)范。
基于城市軌道交通工程的特點,應(yīng)當建立規(guī)范,規(guī)定各個單位建設(shè)全過程電子檔案元數(shù)據(jù)設(shè)計、捕獲、著錄的一般要求。元數(shù)據(jù)的標準制定應(yīng)當重點圍繞收集和歸檔范圍的劃分來進行,規(guī)劃出科學合理并具有行業(yè)特色的元數(shù)據(jù)收集清單。在此過程中,不能逃避那些模糊而晦澀的問題,比如三維模型與二維電子文件的元數(shù)據(jù)是否一致、紙質(zhì)檔案數(shù)字化的各項屬性是否需要作為元數(shù)據(jù)保存等。專業(yè)人員還可以設(shè)計城市軌道交通工程中元數(shù)據(jù)的描述示例,用于展示清單內(nèi)元數(shù)據(jù)實體元素的描述方式。幫助大多數(shù)不了解元數(shù)據(jù)的檔案管理人員認知元數(shù)據(jù)具體的描述方式和管理活動。最后,標準的制定需要積極面向建設(shè)單位的需求,為提高檔案標準建設(shè)的質(zhì)量,避免條目沖突、重復(fù)立項等問題,可參考國家制定建設(shè)項目備案標準的過程中提供的基本邏輯框架。[9]
4.2 以技術(shù)為抓手,提高收集方案水平。電子文件管理的水平會直接影響元數(shù)據(jù)的收集和歸檔工作,而電子文件管理的技術(shù)方案目前還有很大的進步空間。在很早之前,就有學者基于ISO23081提出了聚焦于實體、實體級次及其相互關(guān)系確定的ERMS元數(shù)據(jù)方案設(shè)計,其中也強調(diào)了OA系統(tǒng)和檔案管理系統(tǒng)相集成的一體化管理系統(tǒng)的重要性。[10]城市軌道交通工程集團要針對接口建設(shè)不足、系統(tǒng)一體化程度不夠等問題,積極開展信息化建設(shè),解決元數(shù)據(jù)收集不完整、傳輸有障礙等問題,并逐步利用文本分析、圖像識別、語音識別等人工智能技術(shù),實現(xiàn)對電子文件中各項信息的自動化或半自動化的元數(shù)據(jù)捕獲,提高元數(shù)據(jù)收集的效率和準確性。以O(shè)FD標準的打包方案為例,通過容器式封裝組織形式實現(xiàn)電子檔案的“自包含”,保留大量原始記錄及伴生的元數(shù)據(jù),構(gòu)建檔案和元數(shù)據(jù)的強聯(lián)系,解決了電子檔案文件與元數(shù)據(jù)描述文件分離的問題。[11 ]此外,還可以建立并完善元數(shù)據(jù)管理系統(tǒng),對電子文件元數(shù)據(jù)進行存儲、檢索、更新、維護,保證元數(shù)據(jù)收集的完整性,實現(xiàn)對電子文件元數(shù)據(jù)的全程管理,保證元數(shù)據(jù)收集的質(zhì)量和可持續(xù)性。
4.3 以業(yè)務(wù)為核心,推動各方主體交流。科學的元數(shù)據(jù)歸檔方案離不開城市軌道交通工程各方主體的積極交流,更不能脫離業(yè)務(wù)活動空談理論。再怎么精細設(shè)計的元數(shù)據(jù)清單和描述方法,最終還是要落回到實際的工作中。各方參建單位應(yīng)當協(xié)同并進,保證在工程勘察、設(shè)計、施工以及維護等一系列活動中,規(guī)范、全面收集電子文件元數(shù)據(jù),各方負責人在確保程序合格的同時提高流轉(zhuǎn)效率,實現(xiàn)電子檔案元數(shù)據(jù)的全程管理。同時,各項標準規(guī)范所規(guī)定的元數(shù)據(jù)方案也需要不斷進行內(nèi)在的拓展和實時的更新。檔案人員在和業(yè)務(wù)部門對接的過程中,也要根據(jù)不同的工作節(jié)點、不同的使用目的,對元數(shù)據(jù)內(nèi)在的實體層級和實體元素進行拓展,不斷提高相關(guān)標準規(guī)范的適配程度,符合工程建設(shè)和檔案管理的需要。
5 元數(shù)據(jù)捕獲清單與歸檔方案構(gòu)建示例
綜合上文論述,可以看出元數(shù)據(jù)歸檔面臨的首要挑戰(zhàn)即如何確定需要收集的元數(shù)據(jù)的內(nèi)容,劃定其范圍?;诖?,本文提供部分示例,展現(xiàn)構(gòu)建元數(shù)據(jù)歸檔方案的過程,為城市軌道交通工程企業(yè)提供參考。
5.1 方案設(shè)計原則與參照。元數(shù)據(jù)捕獲清單與歸檔方案的設(shè)計應(yīng)遵循兩個基本原則。第一,元數(shù)據(jù)管理也是檔案管理的一部分,應(yīng)當遵循基本的檔案管理原則,尊重檔案的原始記錄性,保持元數(shù)據(jù)和電子檔案的內(nèi)容之間的有機聯(lián)系。第二,電子文件元數(shù)據(jù)應(yīng)充分考慮當前的數(shù)據(jù)格式和編碼規(guī)則,確保元數(shù)據(jù)管理的成果得以實現(xiàn)數(shù)據(jù)流通和信息共享,符合信息技術(shù)的基本邏輯,提高元數(shù)據(jù)管理的效率。
元數(shù)據(jù)方案的設(shè)計應(yīng)當積極參照現(xiàn)有法規(guī)標準和前沿理論,同時重視方案在實踐中的反饋和評估。重點需要參考的法規(guī)標準包括《電子文件歸檔與電子檔案管理規(guī)范》(GB/T 18894)、《建設(shè)電子檔案元數(shù)據(jù)標準》(CJJ/T187—2012)等標準,同時在專業(yè)類檔案的元數(shù)據(jù)管理上,還要參照與之對應(yīng)的標準。而城軌交通工程形成電子文件的元數(shù)據(jù),不僅包含文書、科技、工程、照片、錄音等多種類型的,還與公路建設(shè)、橋梁建設(shè)等橫向工程形成的元數(shù)據(jù)有共同之處,需要分析并把握共通點,學習元數(shù)據(jù)方案設(shè)計的內(nèi)容。
此外,許多地方部門已經(jīng)制定出適用于本地區(qū)的元數(shù)據(jù)管理規(guī)范,并在試點實施過程中取得了一定的實踐經(jīng)驗,這些規(guī)范和經(jīng)驗為電子檔案管理的標準化和規(guī)范化提供了有力支持,有助于提高元數(shù)據(jù)的質(zhì)量和準確性,為電子檔案的管理和利用提供了更好的基礎(chǔ)。比如《天津市文書類電子文件元數(shù)據(jù)規(guī)范》(DB12/T 692—2016),《蘇州市建設(shè)電子檔案元數(shù)據(jù)規(guī)范》(DB3205/T 1071—2023)。廣東省、江蘇省、浙江省、山東省、上海市和北京市等地的地方標準在不同程度上涉及電子文件元數(shù)據(jù)管理。其中,《天津市文書類電子文件元數(shù)據(jù)規(guī)范》詳細規(guī)定了電子文件全過程管理的元數(shù)據(jù)設(shè)計、捕獲和著錄,并涉及規(guī)范應(yīng)用的范圍、所引用的規(guī)范性文件、規(guī)范所要求的術(shù)語和定義以及電子文件元數(shù)據(jù)索引表。這些標準的制定和實施有助于提高電子文件管理的標準化和規(guī)范化水平,確保電子文件的真實性和長期保存。[12]
廣東省標準規(guī)范在元數(shù)據(jù)的定義方式上解釋了信息固化,描述了電子文件的歸檔工作中收集齊全的狀態(tài)。江蘇省最新的標準規(guī)范也強調(diào)了元數(shù)據(jù)采集與保存工作對于電子文件管理的重要性。對于地方標準的先進經(jīng)驗,地鐵集團也應(yīng)當積極學習。
最后,在制定元數(shù)據(jù)管理方案時,應(yīng)謹慎選擇參照方案,避免死板地模仿其他標準,而是根據(jù)自身情況進行適當?shù)姆治龊蛣?chuàng)新。例如,《建設(shè)電子檔案元數(shù)據(jù)標準》在標準中未包含檔號、全宗號、數(shù)字簽章等檔案信息化不可或缺的元數(shù)據(jù)元素。此外,目前的大部分標準忽視了檔案數(shù)字化相關(guān)工作流程,無法對非原生性電子檔案進行詳細描述,因此在方案中需要補充和完善這些內(nèi)容。
5.2 元數(shù)據(jù)實體及實體層級。元數(shù)據(jù)方案的頂層設(shè)計應(yīng)當圍繞四類元數(shù)據(jù)實體進行,即元數(shù)據(jù)實體的四種類別以及各個類型的元數(shù)據(jù)實體理論上應(yīng)當包含的內(nèi)容。可從不同維度將元數(shù)據(jù)實體劃分為文件實體、業(yè)務(wù)實體、責任者實體和關(guān)系實體。這樣的分類有助于更好地理解和組織元數(shù)據(jù),提高電子檔案管理的效率和準確性,如表1所示。
5.3 各項元數(shù)據(jù)實體的構(gòu)成。元數(shù)據(jù)實體構(gòu)成,即各項實體類型具體包含的元數(shù)據(jù),以文件元數(shù)據(jù)實體為例,展示一部分元數(shù)據(jù)清單,如表2所示。需要強調(diào)的是,清單需要著重體現(xiàn)城市軌道交通工程業(yè)務(wù)的特點,各建設(shè)項目根據(jù)實際可自行擴展需要的元數(shù)據(jù)。
5.4 元數(shù)據(jù)描述方式。元數(shù)據(jù)的描述方式,即運用標準化與結(jié)構(gòu)化的方法,對元數(shù)據(jù)各項進行描述,如表3所示。對于大部分檔案管理人員來說,元數(shù)據(jù)的概念較為生疏,為使檔案管理人員能夠更加清晰工程建設(shè)各節(jié)點及文件管理全過程中元數(shù)據(jù)歸檔工作內(nèi)容,元數(shù)據(jù)描述需要將模糊的元數(shù)據(jù)內(nèi)容清晰化。以表4為例,展示“分部工程”這一業(yè)務(wù)元數(shù)據(jù)實體元素的可能的描述方式。
5.5 元數(shù)據(jù)方案評估與維護。在提出的方案不斷推進的過程中,信息化的發(fā)展可能會使得工程電子檔案在內(nèi)容和形式上產(chǎn)生變化。建筑業(yè)與信息化不斷融合,就是建立在BIM技術(shù)應(yīng)用的基礎(chǔ)上,系統(tǒng)中的建設(shè)檔案數(shù)字資源膨脹式增長,各方對這些“元數(shù)據(jù)”的接受程度就很可能不一致。因此,各方主體需要積極圍繞業(yè)務(wù)活動展開交流,對各項元數(shù)據(jù)實體包含的元數(shù)據(jù)元素進行充分評估,不斷豐富元數(shù)據(jù)歸檔的方案細節(jié),保障元數(shù)據(jù)標準規(guī)范的彈性和生命力,也確保元數(shù)據(jù)收集和歸檔的步調(diào)在建設(shè)項目中保持一致。
6 總結(jié)
元數(shù)據(jù)的歸檔完成度,深刻影響了檔案人員能否在管理活動中保障電子文件和電子檔案真實性、完整性、一致性、關(guān)聯(lián)性和長期有效性。要順利完成元數(shù)據(jù)的歸檔活動,既要求檔案人員厘清元數(shù)據(jù)采集范圍和內(nèi)容,也要求制定科學的元數(shù)據(jù)采集框架,排除元數(shù)據(jù)歸檔環(huán)境中存在的風險。元數(shù)據(jù)可以幫助電子文件進行有效的集成管理和后續(xù)的服務(wù)利用,更是構(gòu)建數(shù)字檔案館信息資源庫必不可少的工具。元數(shù)據(jù)歸檔方案的設(shè)計與制定可以幫助建設(shè)電子檔案元數(shù)據(jù)科學化、規(guī)范化和標準化,本文基于元數(shù)據(jù)歸檔的難點,提出了三條歸檔優(yōu)化路徑,試圖幫助檔案人員提高管理效能,挖掘元數(shù)據(jù)潛在的價值,推動城市軌道交通行業(yè)電子檔案管理水平的提高。
(作者單位:1.南通軌道交通集團有限公司 陳雯,碩士館員,主管;袁月,助理館員;2.徐州地鐵集團有限公司 王俊淘,學士,助理館員;劉鈺,學士,館員;劉琦,學士,高級規(guī)劃師;3.常州地鐵集團有限公司 王希,學士,助理館員 來稿日期:2023-10-20)