王 強(qiáng)/中國石油檔案館、中國人民大學(xué)電子文件管理研究中心
高 強(qiáng)/中國石油檔案館
當(dāng)今,越來越多的組織機(jī)構(gòu)將數(shù)字化轉(zhuǎn)型視作重塑組織架構(gòu)、改善運(yùn)營模式、優(yōu)化資源配置等的重要途徑。數(shù)字化轉(zhuǎn)型過程中各類業(yè)務(wù)系統(tǒng)層出不窮,其特征是“包含動態(tài)數(shù)據(jù),不斷更新(實時)、能夠轉(zhuǎn)換(可操作)以及保留當(dāng)前數(shù)據(jù)(非冗余)”[1]。對于檔案部門而言,需要認(rèn)真思考如何將不同類型業(yè)務(wù)系統(tǒng)中辦理完畢且具有保存價值的數(shù)據(jù)收集歸檔。本文基于研究業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔概念及數(shù)據(jù)歸檔價值的視角,以中國石油(下簡稱“中石油”)業(yè)務(wù)系統(tǒng)歸檔實踐為個案,分析未來業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔應(yīng)著重解決的關(guān)鍵問題。
隨著數(shù)字化轉(zhuǎn)型的不斷深入,越來越多的業(yè)務(wù)系統(tǒng)開始呈現(xiàn)數(shù)據(jù)驅(qū)動特征,以數(shù)據(jù)庫文件、電子表格文件、數(shù)據(jù)體、數(shù)據(jù)集、模型等形式存在的數(shù)據(jù)態(tài)文檔日益增多。數(shù)據(jù)態(tài)文檔與以電子文件為主要表現(xiàn)形式的數(shù)字態(tài)文檔在語義連續(xù)性上存在較大差異,一般來說前者語義離散,后者語義連續(xù)[2]。因此,數(shù)據(jù)態(tài)文檔管理不能采用傳統(tǒng)歸檔的管理方式[3]。為了更為準(zhǔn)確地涵蓋業(yè)務(wù)系統(tǒng)中存在的各類數(shù)據(jù),本研究以“業(yè)務(wù)系統(tǒng)數(shù)據(jù)”指代“業(yè)務(wù)系統(tǒng)管理的所有機(jī)構(gòu)中的活動數(shù)據(jù)與證據(jù)”。業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔指將各類業(yè)務(wù)系統(tǒng)中產(chǎn)生的具有保存價值的數(shù)據(jù)進(jìn)行內(nèi)容和技術(shù)鑒定、確定保存內(nèi)容和方式、實施分類整理、建立語義關(guān)聯(lián),使之固化、可理解后收集保管。歸檔后的業(yè)務(wù)系統(tǒng)數(shù)據(jù)成為具備原始性、權(quán)威性等檔案屬性的數(shù)據(jù),可不依賴原有系統(tǒng)環(huán)境,且不可更改,可見沒有改變其作為業(yè)務(wù)活動的記錄和憑證的特性。此外,由概念可知,業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔強(qiáng)調(diào)數(shù)據(jù)保管權(quán)限的移交以及一系列使數(shù)據(jù)及其證明信息實現(xiàn)檔案化管理的手段。因此,業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔不能片面地等同于電子文件歸檔,更不能同于數(shù)據(jù)備份。
第一,數(shù)據(jù)歸檔是企業(yè)進(jìn)行依法合規(guī)管理的內(nèi)在要求。法規(guī)遵從是企業(yè)管理的基本要求,而企業(yè)合規(guī)管理能力是體現(xiàn)企業(yè)國際競爭力的重要方面。數(shù)據(jù)歸檔后成為電子檔案,是數(shù)據(jù)發(fā)揮憑證作用的前提和基礎(chǔ),也能使企業(yè)進(jìn)一步提高數(shù)據(jù)內(nèi)控能力,有效避免數(shù)據(jù)被惡意篡改、惡意損毀等違法行為的發(fā)生。通過歸檔固化業(yè)務(wù)數(shù)據(jù),不僅能有效防止業(yè)務(wù)數(shù)據(jù)被非法利用,還能使數(shù)據(jù)在不依賴業(yè)務(wù)系統(tǒng)環(huán)境下被長期保存與妥善利用,發(fā)揮其應(yīng)有的憑證價值和信息價值。
第二,數(shù)據(jù)歸檔是企業(yè)加強(qiáng)數(shù)據(jù)治理的重要舉措。從發(fā)展趨勢看,數(shù)據(jù)利用正從業(yè)務(wù)管控轉(zhuǎn)變?yōu)闃I(yè)務(wù)驅(qū)動,數(shù)據(jù)逐漸成為能直接創(chuàng)造價值的企業(yè)無形資產(chǎn)。而針對數(shù)據(jù)不完整、不一致、不準(zhǔn)確、共享難的問題,國內(nèi)外很多企業(yè)啟動了數(shù)據(jù)質(zhì)量提升與數(shù)據(jù)治理項目,用以提升決策支持效率、統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)、明確數(shù)據(jù)認(rèn)責(zé)以及構(gòu)建全面的數(shù)據(jù)管理能力。通過數(shù)據(jù)歸檔,數(shù)據(jù)的質(zhì)量得到有效控制,特別是將歸檔要求前置,與前端業(yè)務(wù)流程和系統(tǒng)運(yùn)行進(jìn)行充分融合,在源頭上和過程中規(guī)范了數(shù)據(jù)質(zhì)量。
第三,數(shù)據(jù)歸檔是企業(yè)發(fā)揮數(shù)據(jù)價值的重要手段。數(shù)據(jù)歸檔將不同業(yè)務(wù)系統(tǒng)的數(shù)據(jù)匯集起來,為大數(shù)據(jù)、人工智能等信息技術(shù)進(jìn)一步實現(xiàn)突破奠定了龐大的數(shù)據(jù)基礎(chǔ),充分發(fā)揮了數(shù)據(jù)價值。此外,歸檔后的數(shù)據(jù)還能減輕業(yè)務(wù)系統(tǒng)負(fù)擔(dān),提高業(yè)務(wù)系統(tǒng)運(yùn)行效率進(jìn)而最大程度實現(xiàn)數(shù)據(jù)集成共享,同時為跨業(yè)務(wù)數(shù)據(jù)的分析應(yīng)用和數(shù)據(jù)聚合效應(yīng)的發(fā)揮提供數(shù)據(jù)基礎(chǔ)。數(shù)據(jù)歸檔后,其不僅被賦予了過程、來源、結(jié)構(gòu)信息,并且還經(jīng)過了可視化封裝,因而不再僅是簡單的數(shù)字,還同時具備了豐富的研究價值。不僅如此,由于此時的數(shù)據(jù)可完全脫離其產(chǎn)生環(huán)境獨立存在,利用者無需再與其來源系統(tǒng)進(jìn)行數(shù)據(jù)接口開發(fā)就可被授權(quán)使用該數(shù)據(jù),極大降低了使用該數(shù)據(jù)的難度,也豐富了其可被利用或引用的場景。
中石油信息化建設(shè)按照“共享中國石油”目標(biāo),確定了“統(tǒng)一規(guī)劃、統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一設(shè)計、統(tǒng)一投資、統(tǒng)一建設(shè)、統(tǒng)一管理”的“六統(tǒng)一”原則,采取建設(shè)集成信息系統(tǒng)的工作模式。目前建成了包括投資、財務(wù)、人力資源、物資采購等9條業(yè)務(wù)主線的企業(yè)資源計劃(ERP)集成應(yīng)用平臺,以油氣生產(chǎn)物聯(lián)網(wǎng)、工程技術(shù)物聯(lián)網(wǎng)為代表的物聯(lián)網(wǎng)系統(tǒng)平臺,建設(shè)了集中存儲的云計算中心和移動應(yīng)用平臺,統(tǒng)建業(yè)務(wù)系統(tǒng)共87個,覆蓋企業(yè)勘探開發(fā)、煉油化工、管道建設(shè)、油品銷售、金融貿(mào)易、經(jīng)營管理、基礎(chǔ)設(shè)施等多個領(lǐng)域。
需要指出的是,當(dāng)前業(yè)務(wù)系統(tǒng)劃分主要按照業(yè)務(wù)主線標(biāo)準(zhǔn)與信息化戰(zhàn)略規(guī)劃。這一劃分方式雖然有利于業(yè)務(wù)梳理與集團(tuán)公司整體的信息化建設(shè),卻不能很好地匹配業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔需求。本研究從歸檔實踐出發(fā),結(jié)合業(yè)務(wù)系統(tǒng)數(shù)據(jù)形成特點與數(shù)據(jù)歸檔需求,將業(yè)務(wù)系統(tǒng)劃分為四大類。
一是以油氣水井生產(chǎn)數(shù)據(jù)系統(tǒng)、管道生產(chǎn)管理系統(tǒng)、工程生產(chǎn)管理系統(tǒng)等為代表的生產(chǎn)運(yùn)行類系統(tǒng)。該類系統(tǒng)主要是對日常生產(chǎn)運(yùn)行所產(chǎn)生的數(shù)據(jù)進(jìn)行收集、匯總、審核、上報、綜合統(tǒng)計查詢,系統(tǒng)內(nèi)的數(shù)據(jù)會在固定周期內(nèi)穩(wěn)定、持續(xù)地產(chǎn)生。這類數(shù)據(jù)主要用于歷史分析,大多保存在關(guān)系型數(shù)據(jù)庫中,數(shù)據(jù)量整體增幅不高且平穩(wěn)。如管道生產(chǎn)管理系統(tǒng),形成的數(shù)據(jù)以長輸管網(wǎng)主要節(jié)點所產(chǎn)生的溫度、壓力、流量等抽樣數(shù)據(jù)和各級生產(chǎn)與銷售部門填報的管輸與銷售數(shù)據(jù)為主。而數(shù)據(jù)利用形式多以報表、圖形展示為主,以當(dāng)期或近期數(shù)據(jù)來進(jìn)行對比或?qū)ξ磥頂?shù)據(jù)走向與發(fā)展趨勢進(jìn)行分析。
二是以管道完整性管理系統(tǒng)、油氣生產(chǎn)物聯(lián)網(wǎng)系統(tǒng)、工程技術(shù)物聯(lián)網(wǎng)系統(tǒng)等為代表的連續(xù)監(jiān)測類系統(tǒng)。該類系統(tǒng)通過相關(guān)設(shè)備對實體環(huán)境和系統(tǒng)進(jìn)行實時監(jiān)控,數(shù)據(jù)形成特點是快速、實時、大量、連續(xù)、動態(tài)。一般情況下,該類系統(tǒng)數(shù)據(jù)或存儲在實時數(shù)據(jù)庫中,或經(jīng)過抽樣保存在關(guān)系型歷史數(shù)據(jù)庫中,可視作隨時間延續(xù)而無限增長的動態(tài)數(shù)據(jù)集合。其中單個數(shù)據(jù)所體現(xiàn)的信息量較小,一般需要通過人工或機(jī)器進(jìn)行解讀后方可使用,而數(shù)據(jù)集合的數(shù)據(jù)量又很大,無法進(jìn)行長期保存。因此,一般設(shè)置時間窗口,超過時間窗口的數(shù)據(jù)就不再保存,或抽樣后進(jìn)行定期的數(shù)據(jù)庫備份及線下保存。連續(xù)監(jiān)測類系統(tǒng)的數(shù)據(jù)利用形式以現(xiàn)場監(jiān)控和后期趨勢分析為主。
三是以物資采購管理系統(tǒng)、人力資源ERP系統(tǒng)、銷售ERP系統(tǒng)等為代表的經(jīng)營管理類系統(tǒng)。該類系統(tǒng)數(shù)據(jù)形成特點是產(chǎn)生周期長、在業(yè)務(wù)系統(tǒng)中進(jìn)行加工處理,其中結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)都占有一定比例,描述某項業(yè)務(wù)活動時經(jīng)常需要結(jié)合兩類數(shù)據(jù)。在數(shù)據(jù)保存方面一般采用結(jié)構(gòu)化數(shù)據(jù)庫方式,以數(shù)據(jù)備份形式對數(shù)據(jù)進(jìn)行長期保存。系統(tǒng)內(nèi)的業(yè)務(wù)數(shù)據(jù)通常需要同時依靠數(shù)據(jù)結(jié)構(gòu)和系統(tǒng)展示邏輯方可使用,脫離業(yè)務(wù)系統(tǒng)進(jìn)行使用較為困難,此外跨系統(tǒng)應(yīng)用一般需要進(jìn)行二次開發(fā)。
四是以電子公文系統(tǒng)、合同管理系統(tǒng)、投資管理系統(tǒng)、工程項目管理系統(tǒng)、科研管理系統(tǒng)等為代表的綜合管理類系統(tǒng)。該類系統(tǒng)數(shù)據(jù)形成特點是依據(jù)業(yè)務(wù)流程、規(guī)則產(chǎn)生,數(shù)據(jù)周期與業(yè)務(wù)周期相同,其中非結(jié)構(gòu)化數(shù)據(jù)占比較大,主要包括企業(yè)的各種文檔、報表、賬單、網(wǎng)頁、圖片、掃描件,以及大量的音視頻文件等。
在業(yè)務(wù)系統(tǒng)數(shù)據(jù)分類歸檔理念指導(dǎo)下,中石油積極推進(jìn)業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔實踐工作,并歸納出了數(shù)據(jù)歸檔應(yīng)遵循憑證歸檔原則、業(yè)務(wù)導(dǎo)向原則、系統(tǒng)穩(wěn)定原則、條件成熟原則和分批集成原則,初步探索出了一條合理、高效的業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔路徑。中石油業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔的主要工作及成果包括如下方面。
第一,穩(wěn)步推進(jìn)業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔工作。目前中石油業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔工作重點在綜合管理類系統(tǒng)和經(jīng)營管理類系統(tǒng)的數(shù)據(jù)歸檔上,已經(jīng)完成了電子公文系統(tǒng)(OA)、財務(wù)ERP和財務(wù)管理系統(tǒng)(FMIS)、合同管理系統(tǒng)和招投標(biāo)系統(tǒng)的數(shù)據(jù)歸檔工作。此外,電子采購系統(tǒng)、辦公管理系統(tǒng)(審計)、勘探與生產(chǎn)技術(shù)數(shù)據(jù)管理系統(tǒng)以及工程項目管理系統(tǒng)有較為明確、迫切的數(shù)據(jù)歸檔需求,下一階段將著重對這些系統(tǒng)的數(shù)據(jù)進(jìn)行歸檔。
第二,明晰業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔基本流程?;跇I(yè)務(wù)系統(tǒng)數(shù)據(jù)分類歸檔理念,利用綜合管理型系統(tǒng)的數(shù)據(jù)進(jìn)行歸檔實踐,中石油總結(jié)出了綜合管理型系統(tǒng)數(shù)據(jù)歸檔的基本實施流程,并制定出不同業(yè)務(wù)系統(tǒng)歸檔范圍、歸檔元數(shù)據(jù)規(guī)范和集成接口技術(shù)規(guī)范,未來將進(jìn)一步探索其他類型業(yè)務(wù)系統(tǒng)歸檔流程。
第三,明確業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔需求。為梳理業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔現(xiàn)狀,中石油制定“十四五”期間企業(yè)數(shù)據(jù)歸檔工作計劃,對87個統(tǒng)建業(yè)務(wù)系統(tǒng)進(jìn)行問卷調(diào)查,結(jié)果顯示將近70%的業(yè)務(wù)系統(tǒng)具有明確的數(shù)據(jù)歸檔需求,這為后續(xù)數(shù)據(jù)歸檔工作計劃制定提供了可靠依據(jù)。
第四,統(tǒng)一業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔格式。為保證歸檔數(shù)據(jù)長期可讀、可用、可理解,必須對歸檔數(shù)據(jù)格式進(jìn)行統(tǒng)一規(guī)定。通過制定歸檔格式規(guī)范,業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔格式可基本實現(xiàn)統(tǒng)一。
業(yè)務(wù)主管部門和檔案部門能否對數(shù)據(jù)歸檔概念達(dá)成共識是實施業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔需要解決的首要問題。統(tǒng)建業(yè)務(wù)系統(tǒng)的問卷調(diào)查結(jié)果顯示,60個業(yè)務(wù)系統(tǒng)主管部門(占統(tǒng)建系統(tǒng)的68.9%)表示數(shù)據(jù)應(yīng)當(dāng)進(jìn)行歸檔,但多數(shù)認(rèn)為將數(shù)據(jù)備份或離線保存就是歸檔??梢钥闯?,多數(shù)業(yè)務(wù)部門將數(shù)據(jù)歸檔視為一種保障數(shù)據(jù)安全的數(shù)據(jù)恢復(fù)策略,并非是檔案工作領(lǐng)域歸檔的通常意義[4]。這會導(dǎo)致業(yè)務(wù)主管部門對檔案工作產(chǎn)生誤解,繼而僅從自身業(yè)務(wù)管理和需求實施業(yè)務(wù)數(shù)據(jù)管理,不考慮數(shù)據(jù)歸檔的基本規(guī)范,不利于業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔。
數(shù)據(jù)歸檔價值認(rèn)知決定了業(yè)務(wù)主管部門參與到數(shù)據(jù)歸檔活動中的主動性,因此,如何確保業(yè)務(wù)主管部門形成正確的數(shù)據(jù)歸檔價值認(rèn)知是實現(xiàn)業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔需要解決的重要問題。業(yè)務(wù)主管部門常常出于安全保密、數(shù)據(jù)所有權(quán)的歸屬、能力權(quán)限范圍等因素考慮,認(rèn)為數(shù)據(jù)歸檔對業(yè)務(wù)活動支撐的作用有限。如部分業(yè)務(wù)主管部門認(rèn)為業(yè)務(wù)數(shù)據(jù)應(yīng)該由業(yè)務(wù)系統(tǒng)自行保管,不愿意共享給其他系統(tǒng)與用戶;部分業(yè)務(wù)主管部門認(rèn)為數(shù)據(jù)歸檔后檔案管理系統(tǒng)不能提供面向?qū)I(yè)的細(xì)分應(yīng)用和資源服務(wù)而不配合數(shù)據(jù)歸檔活動等等。這種狹隘的認(rèn)知不僅會加劇組織機(jī)構(gòu)各個業(yè)務(wù)系統(tǒng)之間的數(shù)據(jù)壁壘,導(dǎo)致業(yè)務(wù)系統(tǒng)數(shù)據(jù)共享難度加大,還會大大加重業(yè)務(wù)系統(tǒng)的負(fù)擔(dān),降低業(yè)務(wù)系統(tǒng)運(yùn)行效率。并且,如果在業(yè)務(wù)發(fā)生變化或者系統(tǒng)發(fā)生改造時產(chǎn)生數(shù)據(jù)丟失或損失關(guān)聯(lián)信息的情況,將對企業(yè)數(shù)據(jù)資產(chǎn)造成極為嚴(yán)重的影響。
界定數(shù)據(jù)歸檔責(zé)任主體,厘清相關(guān)責(zé)任主體的權(quán)責(zé)范圍是有效開展數(shù)據(jù)歸檔的前提。沒有清晰的權(quán)責(zé)劃分可能導(dǎo)致多主體管理混亂,繼而影響數(shù)據(jù)歸檔的成本與效益。數(shù)字化轉(zhuǎn)型背景下,檔案部門將不是唯一的組織機(jī)構(gòu)數(shù)據(jù)資產(chǎn)保管單位,數(shù)據(jù)管理中心、數(shù)據(jù)資產(chǎn)部門等的設(shè)置可能會形成新的業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔的權(quán)責(zé)劃分格局。如,為統(tǒng)籌公司數(shù)據(jù)管理和大數(shù)據(jù)應(yīng)用,今年中石油成立了專門的數(shù)據(jù)管理中心,主要工作任務(wù)包括構(gòu)建數(shù)據(jù)治理體系、規(guī)劃數(shù)據(jù)共享創(chuàng)造價值路徑、優(yōu)化基礎(chǔ)設(shè)施等數(shù)據(jù)生態(tài)環(huán)境、開展數(shù)據(jù)挖掘和分析、提供專業(yè)的大數(shù)據(jù)應(yīng)用技術(shù)服務(wù)。從職能角度來看,數(shù)據(jù)管理中心與檔案管理部門并不沖突,兩者無法相互取代。在這樣的情況下,如何劃定業(yè)務(wù)主管部門、數(shù)據(jù)管理中心和檔案管理部門的工作范疇及職責(zé),成為未來數(shù)據(jù)歸檔過程中不可避免的問題,將直接關(guān)系到檔案機(jī)構(gòu)在未來數(shù)據(jù)歸檔活動、數(shù)字資源體系建設(shè)及知識服務(wù)等相關(guān)工作中的定位。
數(shù)據(jù)歸檔的對象并非面向所有業(yè)務(wù)系統(tǒng)數(shù)據(jù),它只是確保具有保存價值的業(yè)務(wù)數(shù)據(jù)長期可讀、可用、可理解,因此劃定數(shù)據(jù)歸檔范圍是數(shù)據(jù)歸檔要解決的基本問題。目前我國企業(yè)各類文件歸檔范圍劃定主要參照《企業(yè)文件材料歸檔范圍和檔案保管期限規(guī)定》(國家檔案局第10號令)和《電子文件歸檔與電子檔案管理規(guī)范》(GB/T 18894-2016),它們主要面向傳統(tǒng)載體環(huán)境和電子文件歸檔,但是在當(dāng)前的數(shù)據(jù)環(huán)境下,這些規(guī)章制度的現(xiàn)實指導(dǎo)意義不強(qiáng),如中石油統(tǒng)建業(yè)務(wù)系統(tǒng)生產(chǎn)數(shù)據(jù)達(dá)到近12PB,數(shù)據(jù)量大且數(shù)據(jù)類型復(fù)雜多樣。如何制定與時俱進(jìn)的歸檔范圍和面向數(shù)據(jù)的檔案資源目錄體系,將成為新的研究與實踐課題。
歸納出“數(shù)據(jù)歸檔是什么”“為什么要進(jìn)行數(shù)據(jù)歸檔”“由誰來進(jìn)行數(shù)據(jù)歸檔”“數(shù)據(jù)歸檔歸什么”的關(guān)鍵問題后,“如何進(jìn)行數(shù)據(jù)歸檔”的核心問題自然呈現(xiàn)出來。業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔具有復(fù)雜性,主要表現(xiàn)在:第一,業(yè)務(wù)系統(tǒng)類型不同,數(shù)據(jù)歸檔需要考慮的側(cè)重點不同。如,綜合管理型系統(tǒng)一般可以事件為中心進(jìn)行處理,但是經(jīng)營管理型系統(tǒng)就需要利用結(jié)構(gòu)化數(shù)據(jù)庫形式進(jìn)行處理。第二,業(yè)務(wù)系統(tǒng)中文件存在的數(shù)據(jù)形式不同,數(shù)據(jù)歸檔需要考慮的管理手段不同。如,結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)歸檔應(yīng)該采用不同的歸檔方式。第三,以數(shù)據(jù)驅(qū)動為特征的業(yè)務(wù)系統(tǒng)歸檔將更為復(fù)雜。對于此類系統(tǒng),中石油當(dāng)前均是采用“降維”的方式,即將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行歸檔。如電子會計歸檔是將系統(tǒng)中的結(jié)構(gòu)化數(shù)據(jù),按照規(guī)范要求,配置生成固定模板的版式會計憑證、賬簿和報表文件(pdf格式),將流程信息以XML形式封裝。這種方式雖然在解決系統(tǒng)平臺依賴性、提高可理解性方面有一定的優(yōu)勢,但在維護(hù)數(shù)據(jù)的完整性及大數(shù)據(jù)分析利用等方面存在劣勢。因此,面對復(fù)雜的業(yè)務(wù)系統(tǒng)數(shù)據(jù)歸檔需求,如何研究出體系化的歸檔解決方案與策略,應(yīng)當(dāng)成為未來數(shù)據(jù)歸檔著重研究的問題。