馬夢(mèng)華+牛慶瑋+萬啟存
摘 要:存量檔案數(shù)字化是保護(hù)紙質(zhì)檔案、提高服務(wù)質(zhì)量的重要措施,也是建設(shè)數(shù)字檔案館和智慧檔案館的必由之路,在檔案數(shù)字化過程中如何解決由于原有組卷信息元數(shù)據(jù)不足而存在的各種問題,是檔案工作者要進(jìn)行思考和研究的一項(xiàng)命題,本文從具體工作實(shí)踐出發(fā)提出了檔案數(shù)字化建設(shè)過程中的精細(xì)化分類方案。
關(guān)鍵詞:紙質(zhì)檔案;字跡;保護(hù)材料;耐久性
中共中央辦公廳、國(guó)務(wù)院辦公廳聯(lián)合印發(fā)的《關(guān)于加強(qiáng)和改進(jìn)新形勢(shì)下檔案工作的意見》明確提出要建立健全覆蓋人民群眾的檔案資源體系、方便人民群眾的檔案利用體系和確保檔案安全保密的檔案安全體系。其中在檔案利用體系建設(shè)上指出:各檔案館(室)要大力開展傳統(tǒng)載體檔案數(shù)字化工作,及時(shí)以數(shù)字化檔案代替原件提供利用。[1]檔案數(shù)字化工作不僅僅限于紙質(zhì)檔案的掃描,更為重要的是檔案內(nèi)含元數(shù)據(jù)的形成和包括招生信息庫(kù)、學(xué)位信息庫(kù)等在內(nèi)的各類數(shù)據(jù)庫(kù)的建立。在數(shù)字化進(jìn)程中如何對(duì)原有檔案進(jìn)行細(xì)分以及對(duì)檔案中的各類數(shù)據(jù)進(jìn)行梳理和建立,是檔案工作者必須解決的一個(gè)問題。中國(guó)石油大學(xué)(華東)檔案館自2013年開始數(shù)字化建設(shè)以來對(duì)檔案精細(xì)化分類進(jìn)行了有益的探索和實(shí)踐,形成了一套適用于高校檔案館的數(shù)字化細(xì)分方案。本文對(duì)分類方案進(jìn)行了詳細(xì)闡述,希望能對(duì)高校檔案同仁有些許幫助。
1 檔案精細(xì)化分類問題的提出
以“卷”為單位進(jìn)行檔案管理的檔案管理機(jī)構(gòu),通常是將某一事件的相關(guān)文件組成一卷,然后擬定案卷標(biāo)題、錄入卷內(nèi)目錄等相關(guān)信息。同一門類的案卷,其卷內(nèi)目錄錄入信息基本一致,無外乎是檔號(hào)、題名、責(zé)任者、保管期限、頁(yè)碼等通用信息,正是這些過于泛化的通用信息造成了同一門類下不同子類檔案的特有數(shù)據(jù)信息不足。以教學(xué)檔案為例,其一般分為教學(xué)綜合、學(xué)科與實(shí)驗(yàn)室建設(shè)、招生、學(xué)籍管理、課堂教學(xué)與教學(xué)實(shí)踐、學(xué)位、畢業(yè)生、教材等八個(gè)子類。其中招生、學(xué)籍管理、學(xué)位和畢業(yè)生屬于學(xué)生相關(guān)類高頻利用檔案,中國(guó)石油大學(xué)(華東)檔案利用統(tǒng)計(jì)系統(tǒng)的數(shù)據(jù)顯示,僅高考錄取名冊(cè)從2016年9月18日至12月18日就有265人次利用需求。與高頻利用性相悖而言的是其卷內(nèi)信息過于泛化,招生類卷內(nèi)目錄設(shè)置通常是一個(gè)省份一條目錄信息,其余三類一個(gè)學(xué)院一條目錄信息,并注明起始頁(yè)碼。應(yīng)對(duì)其高頻利用,為提供優(yōu)質(zhì)服務(wù),我們需要的是借助于檔案管理信息系統(tǒng)直接定位到人,而不是定位到省份、院系,然后再翻閱檔案逐頁(yè)查找。鑒于此類查找繁瑣的實(shí)際問題,我們?cè)跀?shù)字化建設(shè)過程中提出了檔案精細(xì)化分類方案,細(xì)化卷內(nèi)目錄到每個(gè)學(xué)生,并根據(jù)不同子類的特性,設(shè)計(jì)不同的元數(shù)據(jù)和著錄模板,如招生子類的錄取省份、入學(xué)成績(jī)信息,畢業(yè)子類的畢業(yè)證號(hào)、學(xué)位證號(hào)信息,這樣就可以根據(jù)利用需求直接定位到人,快速提供檔案服務(wù)。需要說明的是,細(xì)化卷內(nèi)目錄并不是將原來的卷內(nèi)目錄棄而不用,而是另行建表進(jìn)行細(xì)化信息的錄入和掃描文件的掛接,它是對(duì)原有組卷方式的有益補(bǔ)充,也是電子檔案資源的承載方式。
2 原有組卷方式存在的問題和不足
2.1 目錄設(shè)置不盡合理。中國(guó)石油大學(xué)(華東)檔案館采用的是“南大之星”檔案管理信息系統(tǒng),該系統(tǒng)對(duì)檔案資源進(jìn)行目錄式管理,最多支持三級(jí)目錄。原有目錄設(shè)置是以年份作為一級(jí)目錄,檔案類目為二級(jí)目錄。同樣以教學(xué)為例,2015年度教學(xué)綜合檔案一級(jí)目錄設(shè)置為2015,二級(jí)目錄為JX11,一般不設(shè)三級(jí)目錄。此類目錄設(shè)置適用于大多數(shù)檔案門類,但對(duì)于有些門類卻有著更為優(yōu)化的目錄設(shè)置方案。以黨政公文類檔案為例,其歸屬于黨群綜合或行政綜合,二級(jí)目錄為DQ11或XZ11,同一類型發(fā)文組成一卷。從系統(tǒng)而言黨政公文和其他黨群行政類綜合文件存放一起,而實(shí)體存放黨政公文是裝盒單獨(dú)存放。如果將黨政公文從綜合類檔案剝離單獨(dú)建表,保持其檔號(hào)和一級(jí)目錄不變,二級(jí)目錄改為發(fā)文類型(中石大東黨、中石大東發(fā)、中石大東學(xué)等)就更為合理易查。
2.2 元數(shù)據(jù)信息不足。元數(shù)據(jù)主要是描述數(shù)據(jù)屬性的信息,用來支持如指示存儲(chǔ)位置、歷史數(shù)據(jù)、資源查找、文件記錄等功能,元數(shù)據(jù)一般不可再分割。不同檔案門類有著不同的元數(shù)據(jù)。招生錄取類檔案元數(shù)據(jù)可以有學(xué)生姓名、性別、所在省份、畢業(yè)院校等。畢業(yè)類檔案元數(shù)據(jù)可以有畢業(yè)證號(hào)、學(xué)位證號(hào)等。如文章第一部分所言的案卷卷內(nèi)目錄設(shè)置過于泛化,導(dǎo)致各門類元數(shù)據(jù)無從體現(xiàn),元數(shù)據(jù)的缺少和不足,查詢和統(tǒng)計(jì)就無法實(shí)現(xiàn)。
2.3 檔案利用過程繁瑣。由于缺乏相應(yīng)元數(shù)據(jù)信息,許多檢索條件不能通過檔案管理信息系統(tǒng)進(jìn)行查詢。以查找某個(gè)學(xué)生的畢業(yè)證書發(fā)放登記表為例,數(shù)字化掃描之前最常見的情形就是詢問利用者姓名、畢業(yè)年份、學(xué)院、專業(yè)等相關(guān)信息,然后查找目錄翻出相應(yīng)案卷,逐頁(yè)查找直至找到該利用者信息對(duì)應(yīng)頁(yè),進(jìn)行復(fù)印、蓋章工作。這樣整個(gè)流程下來費(fèi)時(shí)較長(zhǎng),而且不利于紙質(zhì)檔案的保護(hù),數(shù)字化掃描雖然可以省去翻閱紙質(zhì)檔案這一環(huán)節(jié),但同樣需要逐頁(yè)查找,在檔案利用高峰時(shí)期,利用服務(wù)窗口經(jīng)常出現(xiàn)排長(zhǎng)隊(duì)現(xiàn)象。
2.4 數(shù)據(jù)統(tǒng)計(jì)無法提供。元數(shù)據(jù)的缺失和近乎一致的著錄信息,使學(xué)校辦學(xué)歷史上歷年基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì)工作很難進(jìn)行。例如統(tǒng)計(jì)每年招收人數(shù)、畢業(yè)人數(shù)、某個(gè)導(dǎo)師所帶的研究生名單、某個(gè)學(xué)院或?qū)I(yè)的畢業(yè)生名單等等,在原有組卷方式基礎(chǔ)上,要統(tǒng)計(jì)這些信息借助于檔案管理信息系統(tǒng)是無法實(shí)現(xiàn)的。要想進(jìn)行某項(xiàng)基礎(chǔ)數(shù)據(jù)的統(tǒng)計(jì),只能是全館動(dòng)員,深入庫(kù)房逐卷“數(shù)數(shù)式”統(tǒng)計(jì),其工作量可想而知,最后統(tǒng)計(jì)結(jié)果也不盡準(zhǔn)確。
2.5 檔案編研工作較難推進(jìn)。檔案編研需要大量的材料和數(shù)據(jù)支撐,難以提供數(shù)據(jù)造成了檔案編研工作的低效和緩慢。數(shù)字化之前,檔案館曾做的學(xué)校二級(jí)干部任免文件匯編,就翻閱了全部黨政公文,并挑選任免文件進(jìn)行復(fù)印,整個(gè)工作推進(jìn)下來耗時(shí)將近一個(gè)學(xué)期。這種“全庫(kù)搜索式”編研方式推進(jìn)難度之大也可以想象了。
3 檔案精細(xì)化分類方案設(shè)計(jì)
鑒于原有組卷方式存在的以上問題,為提供優(yōu)質(zhì)服務(wù)質(zhì)量,為學(xué)校事業(yè)發(fā)展提供基礎(chǔ)數(shù)據(jù)支撐,更大程度發(fā)揮檔案價(jià)值,把“死檔案”變成“活信息”,把“檔案館”變成“智慧館”,我們?cè)跀?shù)字化建設(shè)過程中對(duì)檔案門類進(jìn)行詳細(xì)的細(xì)分和設(shè)計(jì),通過確定目錄設(shè)置方案、全新組卷方式、元數(shù)據(jù)著錄信息及文件掛接方式等,形成了一套詳盡的檔案精細(xì)化分類方案,在此提出并就教于廣大檔案工作同仁。
受數(shù)字化建設(shè)經(jīng)費(fèi)限制,秉持高頻利用性和保護(hù)性原則,我們只對(duì)部分檔案進(jìn)行了數(shù)字化掃描和信息著錄,主要包括歷屆學(xué)生成績(jī)單、學(xué)生入學(xué)卡片、新生錄取名冊(cè)、學(xué)歷學(xué)位證書發(fā)放登記表、畢業(yè)工作調(diào)配表、碩士學(xué)位審批材料、學(xué)校黨政公文。本文主要對(duì)以上門類檔案的精細(xì)化分類方案進(jìn)行闡述。
3.1 成績(jī)單和學(xué)籍卡片分類方案設(shè)計(jì)。學(xué)生成績(jī)單和學(xué)籍卡片都是高校利用頻率最高的檔案材料。成績(jī)單服務(wù)于學(xué)生的求職就業(yè)、升學(xué)升遷等諸多環(huán)節(jié);學(xué)籍卡片對(duì)于學(xué)校開展校友會(huì)工作、校友返校等有著重要的實(shí)際作用,兩者分類方案一致,分別建表存儲(chǔ)即可。遵循清晰明了易查的目錄設(shè)置原則,成績(jī)單和學(xué)籍卡片設(shè)一級(jí)目錄為畢業(yè)年份,二級(jí)目錄為所在院系,三級(jí)目錄為所學(xué)專業(yè)。在組卷上改變?cè)瓉斫M卷方式,以每個(gè)專業(yè)學(xué)生成績(jī)單組成一卷,案卷題名擬為××××屆××學(xué)院(系)××專業(yè)學(xué)生成績(jī)單。卷內(nèi)目錄設(shè)計(jì)為每個(gè)學(xué)生信息,學(xué)生信息著錄元數(shù)據(jù)項(xiàng)及數(shù)據(jù)格式如下表所示:
文件掛接方式上,學(xué)生和成績(jī)單或?qū)W籍卡關(guān)系為一對(duì)多關(guān)系,即每個(gè)學(xué)生都至少有一頁(yè)成績(jī)單和學(xué)籍卡,掃表后的成績(jī)單合成PDF后直接掛接在所對(duì)應(yīng)的卷內(nèi)目錄信息學(xué)生條目的全文即可,這樣通過系統(tǒng)定位到學(xué)生信息后直接點(diǎn)擊其對(duì)應(yīng)的全文附件即可查看、打印學(xué)生成績(jī)單或?qū)W籍卡。
3.2 新生錄取名冊(cè)分類方案設(shè)計(jì)。新生錄取名冊(cè)也屬于高頻利用檔案,特別是在畢業(yè)生求職季查詢量比較大。新生錄取名冊(cè)屬于教學(xué)類檔案招生子類(JX13)。數(shù)字化后目錄設(shè)置在原有目錄基礎(chǔ)上增加三級(jí)目錄,設(shè)為案卷序號(hào),即一級(jí)目錄錄取年份,二級(jí)目錄JX13,三級(jí)目錄案卷序號(hào)。組卷方式保持原有案卷不變,卷內(nèi)改為每個(gè)錄取學(xué)生信息,錄取信息著錄元數(shù)據(jù)項(xiàng)及數(shù)據(jù)格式如下表所示:
區(qū)別于學(xué)生成績(jī)單或?qū)W籍卡片的一對(duì)多對(duì)應(yīng)關(guān)系,新生錄取名冊(cè)為多對(duì)一關(guān)系,即每一頁(yè)文件上往往記載多名學(xué)生錄取信息,南大之星檔案管理信息系統(tǒng)不支持多條目錄掛接同一份掃描文件,如果每個(gè)學(xué)生都掛載其對(duì)應(yīng)的錄取頁(yè)掃描件,這就造成了十幾倍的數(shù)據(jù)冗余和重復(fù)。因此在面對(duì)此類多對(duì)一對(duì)應(yīng)關(guān)系的證明材料時(shí),掃描圖片全部掛接在案卷目錄上,并為卷內(nèi)目錄的每個(gè)學(xué)生錄取信息設(shè)計(jì)“所在頁(yè)”和“頁(yè)內(nèi)碼”兩個(gè)字段,用以表明該學(xué)生錄取信息所在案卷的頁(yè)數(shù)和頁(yè)內(nèi)順序。查詢時(shí)搜索出學(xué)生信息,定位到所在案卷,找到對(duì)應(yīng)頁(yè)碼的掃描文件即可。
3.3 學(xué)歷學(xué)位證書發(fā)放登記表分類方案設(shè)計(jì)。學(xué)歷學(xué)位證書發(fā)放登記表同樣屬于高頻利用檔案,它是開具學(xué)歷證明所必需的文件材料之一,能夠有效證明校友教育履歷。學(xué)歷學(xué)位證書發(fā)放登記表屬于教學(xué)類檔案學(xué)位(JX16)和畢業(yè)生(JX17)子類,現(xiàn)在一般都存放在畢業(yè)生子類下。學(xué)歷學(xué)位證書發(fā)放登記表分類方案設(shè)計(jì)和新生錄取名冊(cè)設(shè)計(jì)一致,同樣是增加三級(jí)目錄,掛接方式和組卷也都參照新生錄取名冊(cè),在此只列出卷內(nèi)著錄項(xiàng)如下表:
其中學(xué)位類型是指獲得學(xué)位的類型,如,工學(xué)學(xué)位、理學(xué)學(xué)位、文學(xué)學(xué)位等。
3.4 畢業(yè)工作調(diào)配表分類方案設(shè)計(jì)。畢業(yè)工作調(diào)配表主要證明學(xué)校歷屆學(xué)生的求職去向,對(duì)于早期統(tǒng)一分配高等教育體制年代意義較大,是證明校友工作履歷有效文件材料。畢業(yè)工作調(diào)配表屬于教學(xué)類檔案畢業(yè)生(JX17)子類,其方案設(shè)計(jì)和學(xué)歷學(xué)位證書發(fā)放登記表完全一致,卷內(nèi)著錄項(xiàng)如下表:
3.5 研究生學(xué)位審批材料分類方案設(shè)計(jì)。研究生學(xué)位審批材料記錄了學(xué)生畢業(yè)答辯整個(gè)過程完整信息,主要服務(wù)于學(xué)生的求學(xué)和評(píng)優(yōu)工作。研究生學(xué)位審批材料屬于教學(xué)類檔案學(xué)位(JX16)子類,其原有組卷方式是按學(xué)生分批組卷,數(shù)字化后目錄設(shè)置和組卷方式均保持不變,細(xì)化卷內(nèi)目錄,增加元數(shù)據(jù)項(xiàng),卷內(nèi)著錄項(xiàng)如下表所示:
掛接方式選擇上,學(xué)位審批材料是一對(duì)多對(duì)應(yīng)關(guān)系,將掃描后的圖片合成PDF后直接掛接到卷內(nèi)對(duì)應(yīng)學(xué)生信息條目即可,方便易查。
3.6 學(xué)校黨政公文分類方案設(shè)計(jì)。學(xué)校黨政公文記錄了學(xué)校的發(fā)展、改革和辦學(xué)歷程,是今世可知古,后世可知今的重要文件材料之一。黨政公文屬于黨群綜合(DQ11)和行政綜合(XZ11),一般一個(gè)文件門類組成一卷,卷內(nèi)為每個(gè)文件信息。數(shù)字化后需要做的是改變其目錄設(shè)置,一級(jí)目錄不變,二級(jí)目錄改為發(fā)文類型(中石大東黨、中石大東發(fā)、中石大東學(xué)等),組卷方式無需改變,卷內(nèi)著錄項(xiàng)如下表所示:
其中關(guān)鍵詞是指按文件內(nèi)容進(jìn)行提取,如任免類文件、職稱評(píng)審文件所涉及的人員姓名等。掛接方式是將每個(gè)發(fā)文掃描文件合成PDF后掛接到其對(duì)應(yīng)卷內(nèi)目錄。
4 精細(xì)化分類后取得收益
數(shù)字化后的檔案精細(xì)化分類基本解決了原有紙質(zhì)檔案時(shí)代組卷方式所存在的問題和不足,取得了較好的收益,具體有以下幾點(diǎn):
4.1 檔案服務(wù)質(zhì)量顯著提升。對(duì)于這些高頻利用檔案的數(shù)字化掃描和精細(xì)化分類,由于設(shè)計(jì)了相對(duì)比較完整的元數(shù)據(jù),使得提供檔案服務(wù)變得極為方便,對(duì)于檔案利用者的利用需求能夠通過檔案管理信息系統(tǒng)快速檢索、查看、打印,無需再進(jìn)庫(kù)房翻閱、復(fù)印,大大縮短了服務(wù)流程,避免了檔案利用接待窗口排隊(duì)現(xiàn)象,明顯提高了檔案服務(wù)質(zhì)量,贏得了較好口碑。
4.2 學(xué)校基礎(chǔ)數(shù)據(jù)準(zhǔn)確易得。檔案數(shù)字化完成之后,很多學(xué)校辦學(xué)數(shù)據(jù)能夠很容易得到,例如每年學(xué)校招生人數(shù)、畢業(yè)人數(shù),各個(gè)學(xué)院歷年畢業(yè)人數(shù)、某位導(dǎo)師所培養(yǎng)的研究生名單等,都可以通過檢索快速得到,避免了深入庫(kù)房“數(shù)數(shù)式”的數(shù)據(jù)統(tǒng)計(jì)工作,提高了工作效率,也解放了人力資源。
4.3 檔案編研工作輕松開展?;A(chǔ)數(shù)據(jù)的支撐為檔案編研工作提供了最大便利條件,同時(shí)借助數(shù)字化的檔案資源,基礎(chǔ)檔案編研所要做的就是檢索條目、提取數(shù)據(jù)、匯編成冊(cè),這使得檔案編研工作不必再全館動(dòng)員齊上陣,只需少量工作人員即可完成。
5 后記
本文從檔案數(shù)字化實(shí)踐角度出發(fā),提出了檔案精細(xì)化分類方案。存量檔案的數(shù)字化,對(duì)于各個(gè)檔案門類進(jìn)行細(xì)分和設(shè)計(jì)能夠最大限度發(fā)揮檔案價(jià)值。然而對(duì)于新增檔案,大都有業(yè)務(wù)系統(tǒng)支持,如果再只是存入紙質(zhì)檔案,然后再進(jìn)行數(shù)字化掃描和錄入,就造成了人財(cái)物的浪費(fèi)。我們需要做的就是打通檔案管理系統(tǒng)和各業(yè)務(wù)系統(tǒng)的底層數(shù)據(jù),進(jìn)行系統(tǒng)對(duì)接,獲取各項(xiàng)元數(shù)據(jù)甚至全文信息,使檔案館成為學(xué)校的數(shù)據(jù)中心。
參考文獻(xiàn):
[1]關(guān)于加強(qiáng)和改進(jìn)新形勢(shì)下檔案工作的意見.中國(guó)檔案報(bào).