周楓 呂東偉 鄧晶京 黃麗萍 駱建珍
摘? 要:OFD格式是我國自主可控的電子文件版式文檔格式。文章從版式文檔存在的問題著手,對(duì)OFD格式產(chǎn)生背景進(jìn)行分析;結(jié)合OFD格式的特征,對(duì)OFD格式在檔案領(lǐng)域應(yīng)用場(chǎng)景進(jìn)行探討;采用SWOT分析法,對(duì)OFD格式在檔案領(lǐng)域應(yīng)用前景進(jìn)行分析,并指出應(yīng)用策略。
關(guān)鍵詞:OFD;版式文檔;格式;檔案;SWOT分析法
Abstract: OFD is the self-controlled fixed layout documents format of electronic files. Firstly, the paper analyze the creation background of OFD by summarizing the problem of other fixed layout documents. Secondly, the paper discussing the application scenario of OFD format in archives by integrating the feature of OFD format. At last, the paper analyze the application prospect and point out the application strategy of OFD format in archives by using SWOT analytical method.
Keywords:? OFD;? fixed layout documents;? format;? archives;? SWOT
版式文檔是指版面呈現(xiàn)效果固定的電子文檔。版式文檔通過將文字、圖像、圖表等數(shù)字內(nèi)容對(duì)象按一定規(guī)則進(jìn)行版面固化呈現(xiàn),呈現(xiàn)效果不因軟硬件環(huán)境、操作者的變化而變化,版面固定、不跑版、所見即所得,可以視為計(jì)算機(jī)時(shí)代的“數(shù)字紙張”。版式文檔的特點(diǎn)使它成為電子文檔發(fā)布、數(shù)字化信息傳播和存檔的理想文檔格式。2017年5月,國家標(biāo)準(zhǔn)《電子文件存儲(chǔ)與交換格式版式文檔》(GB/T 33190-2016)正式實(shí)施,該標(biāo)準(zhǔn)規(guī)定了國家版式文檔格式規(guī)范,簡(jiǎn)稱OFD(Open Fixed-Layout Document)。然而,作為一項(xiàng)文檔格式的國家標(biāo)準(zhǔn),對(duì)于OFD格式的研究主要仍局限于產(chǎn)品本身,因此非常有必要加強(qiáng)OFD格式在檔案領(lǐng)域的研究,從而更好地推進(jìn)OFD格式在檔案工作中的進(jìn)一步應(yīng)用。
1.1 存檔格式多樣,造成信息孤島。在OFD格式產(chǎn)生之前,電子文件存檔格式并沒有統(tǒng)一的國家或行業(yè)標(biāo)準(zhǔn),檔案工作中普遍采用DOC、WPS、PPTX等流式文件格式。由于其存在內(nèi)容易更改、遷移過程易變異和損失等不足,因此并不符合電子文件長(zhǎng)期保存要求。同時(shí),部分文檔以PDF、XPS、SEP、CEBX等版式格式存檔,但不同版式文件依賴某個(gè)具體軟硬件平臺(tái)且格式技術(shù)未能完全打通,導(dǎo)致格式之間不能互通、傳遞不暢,文檔信息傳播利用受限。
1.2 格式應(yīng)用受限,信息失存失信。由于沒有統(tǒng)一標(biāo)準(zhǔn),當(dāng)前文檔格式大多不易擴(kuò)展,導(dǎo)致各領(lǐng)域的應(yīng)用受限。有些版式文檔不能嵌入元數(shù)據(jù)信息,從前端業(yè)務(wù)系統(tǒng)形成的電子文件自帶的信息量太少,導(dǎo)致電子文件所包含的元數(shù)據(jù)信息大量減少;部分版式文檔格式不能很好地支持?jǐn)?shù)字簽名、電子印章等技術(shù)認(rèn)證機(jī)制,無法滿足電子文件長(zhǎng)久保存的要求。在對(duì)不符合長(zhǎng)期保存要求的格式進(jìn)行格式轉(zhuǎn)換時(shí),容易出現(xiàn)新的問題:業(yè)務(wù)系統(tǒng)中的流轉(zhuǎn)、簽批等信息在轉(zhuǎn)換為歸檔格式后可能會(huì)丟失;格式轉(zhuǎn)化過程的數(shù)字簽名、印章等認(rèn)證信息丟失;不同格式之間的數(shù)字簽名不能互通,不能互簽互用;大批量文件進(jìn)行格式轉(zhuǎn)換用時(shí)長(zhǎng),轉(zhuǎn)化過程不穩(wěn)定,容易出錯(cuò)。
1.3 現(xiàn)有格式壟斷,存在安全風(fēng)險(xiǎn)。一些格式依賴非自主可控技術(shù),無法在全自主可控平臺(tái)下運(yùn)行,格式的使用和服務(wù)受限于外部廠商和技術(shù),對(duì)于文檔的發(fā)展應(yīng)用始終處于跟隨狀態(tài),而當(dāng)需要對(duì)文檔格式進(jìn)行擴(kuò)展時(shí),又容易受制于相關(guān)廠商。格式標(biāo)準(zhǔn)不公開,私有版式文檔的格式解析、標(biāo)準(zhǔn)解釋掌握在國外企業(yè)手中,文檔信息資源容易遭到“劫持”,也無法保證對(duì)數(shù)據(jù)解析的長(zhǎng)期技術(shù)支持。同時(shí),國外軟件廠商的文檔格式不支持國產(chǎn)加密算法應(yīng)用,無法通過國密算法保證電子文檔的安全。
2009年,中央辦公廳頒布《電子文件管理暫行辦法》,明確提出“應(yīng)采用符合國家標(biāo)準(zhǔn)的文件存儲(chǔ)格式,確保能夠長(zhǎng)期有效可讀”。2010年5月,全國檔案工作標(biāo)準(zhǔn)化技術(shù)委員會(huì)第十八次年會(huì)提出,與工業(yè)和信息化部一同暫緩采用以美國ADOBE公司技術(shù)為基礎(chǔ)的《長(zhǎng)期保存的電子文檔文件格式第1部分:PDF1.4(PDF/A-1)的使用》作為國家標(biāo)準(zhǔn)在我國的實(shí)施,并最終與國家標(biāo)準(zhǔn)委達(dá)成協(xié)議,將該標(biāo)準(zhǔn)的使用范圍限定在“涉密文檔以及作為檔案保存的文檔”[1]以外,因此,制定適合我國電子文件長(zhǎng)期存儲(chǔ)和交換的國家自主可控版式文檔應(yīng)運(yùn)而生。
2.1電子文件歸檔格式。對(duì)于電子文件歸檔而言,采用“原生”格式歸檔,不僅可以更好地保證電子文件的“四性”,還有利于電子檔案的長(zhǎng)期保存和有效利用。因此,在前端即采用OFD格式生成并以O(shè)FD格式歸檔,可以視為電子文件歸檔格式的前端控制,如浙江省檔案局印發(fā)《浙江省省直單位電子公文歸檔與電子檔案管理暫行辦法》,提出電子公文采用OFD格式歸檔。
2.2 元數(shù)據(jù)采集。OFD具有很強(qiáng)的結(jié)構(gòu)化描述能力,外部系統(tǒng)或用戶可以通過標(biāo)引的方式添加自定義的標(biāo)記和信息,為在文檔中嵌入更多應(yīng)用相關(guān)的結(jié)構(gòu)化語義信息提供支持,同時(shí),OFD支持語義導(dǎo)覽并可將內(nèi)嵌語義導(dǎo)出為數(shù)據(jù),從而達(dá)到與其他系統(tǒng)、數(shù)據(jù)交互的目的并擴(kuò)展應(yīng)用,而這也是OFD吸取其他格式方案發(fā)展應(yīng)用中的經(jīng)驗(yàn)教訓(xùn)而形成的獨(dú)特優(yōu)勢(shì)。對(duì)于電子檔案而言,在電子公文階段利用自定義標(biāo)引定義電子公文所需的元數(shù)據(jù),構(gòu)建電子公文語義樹;進(jìn)入檔案部門后,可繼承電子公文中原有的前端元數(shù)據(jù),并根據(jù)檔案管理的需要補(bǔ)充擴(kuò)展相關(guān)檔案管理元數(shù)據(jù),從而更好地保證電子文件全生命周期過程的“四性”。
2.3 電子文件格式轉(zhuǎn)換。采用OFD進(jìn)行格式轉(zhuǎn)換有兩種情況:一是歸檔時(shí)將各種主流格式的文件統(tǒng)一轉(zhuǎn)換為OFD格式,實(shí)現(xiàn)“多頭流入,單一保存”。例如,在OFD格式頒布前的試點(diǎn)過程中,國土資源部將文書檔案、業(yè)務(wù)檔案、網(wǎng)頁等進(jìn)行了OFD格式電子文件歸檔,審計(jì)署對(duì)其行政及審計(jì)公文進(jìn)行了轉(zhuǎn)版應(yīng)用。二是由于原先格式即將被淘汰、原格式不符合國家標(biāo)準(zhǔn)、格式多樣管理不便等原因,對(duì)電子檔案的格式進(jìn)行統(tǒng)一轉(zhuǎn)換。
2.4 電子檔案長(zhǎng)期保存?!栋媸诫娮游募L(zhǎng)期保存格式需求》(DA/T 47-2009)中對(duì)長(zhǎng)期保存格式需求進(jìn)行了定義:長(zhǎng)期保存是用一種可靠的、科學(xué)合理的方式長(zhǎng)期維護(hù)電子文件真實(shí)、完整、有效的行為。同時(shí),DA/T 47給出了版式電子文件長(zhǎng)期保存格式11項(xiàng)需求,可以作為電子文件長(zhǎng)期保存格式選擇的依據(jù):格式開放、不綁定軟硬件、文件自包含、格式自描述、顯示一致性、持續(xù)可解釋、穩(wěn)健、利于存儲(chǔ)、支持技術(shù)認(rèn)證機(jī)制、易于利用。通過將OFD版式文件的內(nèi)容、特性與DA/T 47要求進(jìn)行對(duì)比,其完全符合電子檔案長(zhǎng)期保存文件格式要求,是作為電子檔案文件格式的理想選擇。
2.5 電子檔案數(shù)據(jù)交換。為了維護(hù)電子檔案的完整性,數(shù)據(jù)交換一般而言并不會(huì)以單個(gè)電子文件的方式進(jìn)行交換,而是以信息包的方式進(jìn)行交換,包括 ASIP、TSIP、AIP、DIP等。信息包以一定的目標(biāo)結(jié)構(gòu)方式組織,為了交換方便的需要也會(huì)封裝成ZIP壓縮包、EEP封裝包、電子書等形式。OFD作為電子文件存儲(chǔ)和交換格式,采用Zip壓縮,支持以數(shù)字簽名的方式進(jìn)行數(shù)據(jù)交換過程中的安全認(rèn)證,可有效實(shí)現(xiàn)電子檔案的數(shù)據(jù)轉(zhuǎn)換。
2.6 電子檔案開放利用。隨著無紙化進(jìn)程的推進(jìn),越來越多的文件利用以電子形式進(jìn)行,如何確保在不同的環(huán)境下文件利用的安全和便利,并始終保持所利用文件的權(quán)威性和憑證作用,是開放利用中不得不考慮的一個(gè)問題。作為一種版式文檔,OFD能夠?qū)崿F(xiàn)存檔格式和利用格式合一,提供給用戶相同的用戶體驗(yàn),提供全面、安全、高效的文檔呈現(xiàn)、交換和再利用,同時(shí)結(jié)合用戶操作習(xí)慣,提供視圖、注釋、工具等功能,滿足利用過程中的文檔處理需要。OFD版式文件基于層次文本+壓縮打包的技術(shù)機(jī)制,比同樣內(nèi)容的DOC、PDF等格式文件體積更小,在線閱讀時(shí)文件加載、打開速度更快,同時(shí)用戶終端不留存副本,安全性好。此外,OFD還可根據(jù)需要實(shí)現(xiàn)多文檔的分類合并,更好地滿足業(yè)務(wù)需求。
2.7 自主可控檔案系統(tǒng)。在部分安全保密要求級(jí)別較高的系統(tǒng)中,OFD應(yīng)該是唯一的版式文件格式,不管是保存、交換還是利用。OFD對(duì)于全國產(chǎn)環(huán)境(基于國產(chǎn) CPU/OS的數(shù)字檔案信息系統(tǒng))的支持相對(duì)于PDF格式也有明顯的優(yōu)勢(shì)。OFD格式得到國產(chǎn)廠商的廣泛支持,其與CA認(rèn)證、國產(chǎn)加密算法、電子印章等安全防護(hù)措施的結(jié)合比PDF更有優(yōu)勢(shì)。因此,在自主可控檔案系統(tǒng)中,OFD格式無疑是自主可控檔案系統(tǒng)的最好選擇。
3.1 優(yōu)勢(shì)(Strengths)分析
3.1.1 格式自主可控。隨著信息及網(wǎng)絡(luò)安全國家戰(zhàn)略的推進(jìn),相關(guān)軟硬件的國產(chǎn)化快速推進(jìn)。從服務(wù)器到芯片,從操作系統(tǒng)到應(yīng)用工具,OFD的推出正是這股浪潮的重要體現(xiàn)。OFD格式的出現(xiàn),使我國第一次擁有了國家級(jí)的自主版式格式。OFD作為PDF的國內(nèi)替代格式,標(biāo)準(zhǔn)自主可控,不受控于外部廠商,可階段性地實(shí)現(xiàn)“將自己的雞蛋籃子掛在自己樹上”的戰(zhàn)略需求,這也是創(chuàng)立自主可控的版式格式最重要的初衷之一。
3.1.2 較強(qiáng)技術(shù)優(yōu)勢(shì)。在版式文檔格式方面,除目前國際通用的PDF外,還有其他的很多文檔格式如CEB、SEP、CAJ等在使用。相比于其他格式,OFD格式有一系列技術(shù)優(yōu)勢(shì)。第一,OFD基于XML技術(shù)來描述文檔數(shù)據(jù),格式開放,利于理解,長(zhǎng)期可讀可用;第二,OFD支持根據(jù)各領(lǐng)域需要進(jìn)行語義標(biāo)引擴(kuò)展,這已經(jīng)超出了單純版式格式的功能,更加貼合應(yīng)用需求;第三,OFD支持國產(chǎn)密碼算法,是文件具有法律效力的基本條件。總的而言,OFD具有開放性高、兼容性好、真實(shí)性好、集成性高、保存性好、成本低等特點(diǎn),是一種理想的長(zhǎng)期保存格式。
3.2 劣勢(shì)(Weaknesses)分析
3.2.1更換成本較大。經(jīng)過二十多年的標(biāo)準(zhǔn)化與國際化,PDF在使用和溝通上的成本已經(jīng)非常低,良好的用戶體驗(yàn)已經(jīng)培養(yǎng)了一群忠實(shí)的用戶群體,從實(shí)際情況看,PDF已在檔案部門大量使用。此外,OFD的閱讀需要專門的閱讀軟件,不同于PDF閱讀軟件的開源,OFD軟件由不同的企業(yè)開發(fā),自然涉及不菲的成本。據(jù)調(diào)研,目前一套專業(yè)的OFD閱讀軟件將近20萬元?!癘FD將不可避免地面臨與PDF直接的成本競(jìng)爭(zhēng),這種成本由使用成本、溝通成本、管理成本和風(fēng)險(xiǎn)成本共同組成,同時(shí)也包括其他用戶的轉(zhuǎn)嫁成本?!盵2]短期來看,出于降低技術(shù)風(fēng)險(xiǎn)和成本投入的考慮,檔案部門沒有拋棄PDF而采用OFD的強(qiáng)烈意愿。
3.2.2 理論研究不足。作為一個(gè)嶄新格式,目前對(duì)OFD的格式研究更多地還停留在格式介紹及其與PDF的格式對(duì)比層面,對(duì)OFD格式本身的技術(shù)方案、特性分析及其應(yīng)用場(chǎng)景研究相對(duì)欠缺,而在檔案行業(yè)的應(yīng)用研究更是鳳毛麟角。理論研究的不足使得人們對(duì)其認(rèn)識(shí)還停留在“PDF的替代格式”這種概念層次,無法形成對(duì)OFD應(yīng)用拓展的深度支撐。
3.3 機(jī)會(huì)(Opportunities)分析
3.3.1 實(shí)踐需求強(qiáng)烈。隨著數(shù)字技術(shù)的快速發(fā)展,數(shù)字信息資源的可存取性卻變得極為脆弱。由于文檔格式不統(tǒng)一、不開放、不可控,造成文檔交換有障礙、應(yīng)用擴(kuò)展有困難。更為重要的是,在長(zhǎng)期、安全保存中存在著極大的風(fēng)險(xiǎn)。調(diào)查顯示,1990年北京亞運(yùn)會(huì)的部分電子文件已經(jīng)無法讀取,22%的中央機(jī)關(guān)存在讀不出來的電子文件。針對(duì)該問題,一般采取三種方法:一是不斷將文件轉(zhuǎn)化為當(dāng)前通用的新文件格式;二是采用獨(dú)立于任何計(jì)算機(jī)系統(tǒng)的開放格式存儲(chǔ)文件;三是將該文件與其軟硬件系統(tǒng)一同保存。從現(xiàn)實(shí)情況來看,大多數(shù)單位選擇了第二種辦法。
3.3.2 政策推動(dòng)有力。早在2009年,中辦《電子文件管理暫行辦法》就明確提出“應(yīng)采用符合國家標(biāo)準(zhǔn)的文件存儲(chǔ)格式,確保能夠長(zhǎng)期有效讀取”;2016年11月,《國家電子文件管理“十三五”規(guī)劃》提出“鼓勵(lì)黨政機(jī)關(guān)等重點(diǎn)行業(yè)領(lǐng)域使用具有自主產(chǎn)權(quán)、安全可控的電子文件管理產(chǎn)品”[3]。2016年12月,在國標(biāo)委發(fā)布的《黨政機(jī)關(guān)電子公文系列標(biāo)準(zhǔn)規(guī)范》(GB/T 33476~33483-2016)中,明確要求“電子公文的承載格式為OFD”。國家電子政務(wù)綜合試點(diǎn)方案提出“試點(diǎn)地區(qū)要推進(jìn)OFD版式標(biāo)準(zhǔn)的應(yīng)用,規(guī)范黨政機(jī)關(guān)電子文件管理、電子公文標(biāo)準(zhǔn)化應(yīng)用”[4]。此外,電子文件管理行業(yè)也采取了切實(shí)的措施來推動(dòng)OFD格式的發(fā)展。2016年11月,在國家電子文件管理部際聯(lián)席會(huì)議、工業(yè)和信息化部、國家標(biāo)準(zhǔn)委的指導(dǎo)下,由電子文件管理領(lǐng)域相關(guān)企業(yè)、院校、科研機(jī)構(gòu)及用戶等組成的電子文件管理推進(jìn)聯(lián)盟成立,聯(lián)盟章程第五條明確提出“推動(dòng)GB/T 33190-2016《電子文件存儲(chǔ)與交換格式版式文檔》等標(biāo)準(zhǔn)在辦公、證照、檔案和票據(jù)等各領(lǐng)域的推廣應(yīng)用”。
3.4 威脅(Threats)分析
3.4.1 競(jìng)爭(zhēng)激烈,生態(tài)脆弱。經(jīng)過20多年的發(fā)展,PDF已從Adobe公司的一款產(chǎn)品上升為ISO 32000國際標(biāo)準(zhǔn),而PDF/Archive(PDF/A)更是被視為電子檔案保存的最佳解決方案而成為ISO/DIS19005-1國際標(biāo)準(zhǔn)。無論是Office、WPS抑或眾多瀏覽器、應(yīng)用系統(tǒng),均支持PDF的應(yīng)用,從而形成了一個(gè)良性的生態(tài)環(huán)境。OFD則顯得“勢(shì)單力薄”,目前能夠?qū)FD閱讀具有支撐作用的軟硬件環(huán)境屈指可數(shù),更別提與各種環(huán)境的“無縫對(duì)接”。因此,總的來看,OFD發(fā)展的生態(tài)環(huán)境目前還比較脆弱,若沒有強(qiáng)有力的支持,有可能被扼殺在幼兒期。
3.4.2 政策變更風(fēng)險(xiǎn)。當(dāng)前,OFD格式主要由不具強(qiáng)制力的行業(yè)聯(lián)盟來進(jìn)行“自上而下”的推廣,執(zhí)行力度較難保障。一旦推廣效果不達(dá)預(yù)期,有可能導(dǎo)致政策的重大轉(zhuǎn)變,進(jìn)而影響OFD格式的應(yīng)用。
雖然OFD格式在檔案領(lǐng)域的應(yīng)用正處于起步階段,更多的是個(gè)別單位的零星試點(diǎn),但基于上述SWOT分析,OFD在檔案領(lǐng)域的應(yīng)用“優(yōu)勢(shì)大于劣勢(shì),機(jī)遇多于挑戰(zhàn)”。從長(zhǎng)期來看,由于OFD格式自身的優(yōu)越屬性,加之國家推動(dòng)自主可控格式的決心,OFD格式在檔案領(lǐng)域有著光明的應(yīng)用前景;從短期來看,由于用戶習(xí)慣短期內(nèi)較難改變,OFD在檔案領(lǐng)域的全面應(yīng)用還有待時(shí)日,但作為集中統(tǒng)一地進(jìn)行長(zhǎng)久保存的機(jī)構(gòu),檔案部門可先行采用OFD作為備份和利用的主要格式,從而以點(diǎn)帶面地推動(dòng)OFD格式的全面應(yīng)用。
[1]國家檔案局、中央檔案館關(guān)于印發(fā)《全國檔案工作標(biāo)準(zhǔn)化技術(shù)委員會(huì)第十八次年會(huì)會(huì)議紀(jì)要》的通知[EB/OL].(2010-06-12)[2017-12-20]. http://cpc.people.com.cn/GB/64114/83904/83906/12155917.html.
[2]梁凱.檔案部門應(yīng)用OFD格式的若干思考[J].浙江檔案,2017(1):64.
[3]中共中央辦公廳 國務(wù)院辦公廳關(guān)于印發(fā)《國家電子文件管理“十三五”規(guī)劃》的通知.廳字〔2016〕37號(hào).
[4]國家多部門聯(lián)合開展國家電子政務(wù)綜合試點(diǎn)[EB/OL].(2017-12-29)[2018-02-20]. http://www.miit.gov.cn/newweb/n1146285/n1146352/n3054355/n3057656/n3057660/c5995240/content.html.