張琬渝
摘 要:在政府實(shí)施信息公開制度之后,檔案信息的開放利用程度也越來越大,對(duì)于傳統(tǒng)的檔案信息管理和應(yīng)用形式來說,已經(jīng)不能很好地滿足人們對(duì)檔案信息應(yīng)用的需求。在網(wǎng)絡(luò)信息普及發(fā)展過程中,紙質(zhì)檔案也逐漸被電子檔案以及電子文檔所替代,數(shù)字信息技術(shù)以及網(wǎng)絡(luò)技術(shù)在檔案信息中已經(jīng)逐漸被應(yīng)用,讓檔案信息管理工作還有開放利用的效率都有所提高,也讓檔案信息管理工作更加容易。本文主要對(duì)數(shù)字模型應(yīng)用于檔案信息的開放利用進(jìn)行簡(jiǎn)單分析,以供借鑒。
關(guān)鍵詞:數(shù)字模型;檔案信息;應(yīng)用;開放
檔案信息主要是記錄了人們?cè)谏鐣?huì)中各項(xiàng)活動(dòng)的一種文檔,能夠?qū)⑷藗冊(cè)谏鐣?huì)中的各種表現(xiàn)都反映出來,現(xiàn)在檔案信息越來越被人們所看重,在開發(fā)利用上也加大了力度?,F(xiàn)在的檔案利用需求要明顯高于以前,且檔案館藏?cái)?shù)量增加也相當(dāng)迅速,這就明顯突出來檔案數(shù)化能力比較弱,所以在檔案信息開放利用上也要加大力度,爭(zhēng)取讓檔案信息實(shí)現(xiàn)數(shù)字化,而將數(shù)字模型應(yīng)用于檔案信息開放利用中,能更加直觀和理性地將檔案間的規(guī)律都表達(dá)出來,更適合當(dāng)代數(shù)字檔案信息的發(fā)展趨勢(shì)。
1 引用方法
1.1 MomeCarlo方法
這種方法也可以叫做計(jì)算機(jī)隨機(jī)模擬方法,其主要是美國在研制原子彈計(jì)劃中產(chǎn)生的。近些年,計(jì)算機(jī)技術(shù)發(fā)展比較迅速,所以這種方法也成為解決計(jì)算機(jī)數(shù)字技術(shù)問題的主要方法之一。
1.2 TOPSIS法
這種方法屬于多目標(biāo)決策分支中的重要方法,主要的原理就是依據(jù)檢測(cè)評(píng)價(jià)對(duì)象的優(yōu)劣距離做出排序,要是評(píng)價(jià)的對(duì)象是優(yōu)解的,也是最遠(yuǎn)離裂解的,那么就是最好的,反之則是最差的。優(yōu)解的各項(xiàng)指標(biāo)值都必須達(dá)到最優(yōu),而最裂解的指標(biāo)則是最差值的指標(biāo)。
1.3 術(shù)語說明
其一是全宗——年代單元,主要是將檔案依照年代和全宗來分類,從而得到的檔案類別就是全宗——年代單元。其二是全宗——年代單元編號(hào),就是同一年的檔案都將被統(tǒng)一編成一個(gè)編號(hào)。其三是全宗——年代單元檔案卷數(shù),這是主要是同一年檔案在該單元中所有的搭檔總卷數(shù),表示檔案的數(shù)量。其四是全宗——年代單元利用卷數(shù),這主要是同一單元中檔案信息總的利用卷數(shù)是多少。其五是檔案價(jià)值權(quán)重,這只要是指在這個(gè)全宗中,檔案的價(jià)值所占有的比重是多少。其六是成功率,主要是指用戶所訪問的檔案信息達(dá)到了數(shù)字化的比重和概率。
2 準(zhǔn)備工作
2.1 檔案利用情況數(shù)據(jù)
在檔案信息利用數(shù)據(jù)上,可以分解為兩點(diǎn)。首先是檔案的利用總數(shù)是多少,其次是檔案利用的數(shù)據(jù)在全宗--年代單元中的分布情況。第一點(diǎn)主要是利用的線性最小數(shù),并預(yù)測(cè)未來檔案利用的總數(shù)是多少,然后再利用直線方程來得出檔案利用總數(shù)情況。第二點(diǎn)主要是利用今年檔案的利用總數(shù),看在不同全宗年代單元分布下,是否對(duì)其他的全宗年代單元分布有什么影響。
2.2 檔案掃描量和資源的投入
受到地區(qū)差異的影響,不同地方物價(jià)也有所不同,所以在數(shù)字化檔案信息上投入的資金也就有所不同,其中也存在一些可變的因素,但總體來看,其掃描量和投入的資金是成正比關(guān)系的。而比例系數(shù),主要就是取前些年的總掃描卷數(shù)還有總的投入資金比例就可以了。
3 數(shù)字模型的建立
3.1 選擇模型
首先是目標(biāo),檔案數(shù)字化開放利用需要遵循的原則主要有幾點(diǎn),即實(shí)用性原則、價(jià)值型原則、開放性原則、時(shí)效性原則以及搶救性原則。但是在實(shí)踐中,檔案利用的主體已經(jīng)逐漸變成工種,所以首先要考慮的就是實(shí)用性,所以數(shù)字模型建立的主要目標(biāo)也就是數(shù)字化檔案訪問的成功率是多少。其次是指標(biāo):檔案利用數(shù)據(jù)代表了檔案的利用率,為了最大化成功率,就得以檔案利用數(shù)據(jù)為指標(biāo)。最后是分析:由于檔案利用數(shù)據(jù)存在明顯的扎堆現(xiàn)象——“二八現(xiàn)象”,即20%全宗的利用卷數(shù)之和可能占了總數(shù)的80%,20%年份的利用卷數(shù)之和可能占了總數(shù)的80%。如果盲目或粗放式的制定數(shù)字化順序,那么產(chǎn)生“要用的檔案未數(shù)字化,已數(shù)字化的檔案卻沒有用”現(xiàn)象也就不足為怪了。
3.2 直觀選擇模型
本模型主要想法是用局部最優(yōu)來體現(xiàn)整體最優(yōu),即選擇總利用卷數(shù)最高的全宗與總利用卷數(shù)最高的年份的組合。步驟如下:求出每個(gè)全宗的總利用卷數(shù)(所有年份利用卷數(shù)之和),按從大到小次序,根據(jù)實(shí)際情況選取排在前面的部分全宗。求出每個(gè)年份的總利用卷數(shù)(所有全宗利用卷數(shù)之和),按從大到小次序,根據(jù)實(shí)際情況選取排在前面的部分全宗。按照以上兩步所選的全宗與年份組合的全宗——年代單元即為應(yīng)該先數(shù)字化的全宗——年代單元。
3.3 MonteCarlo選擇模型
使用MonteCarlo方法來進(jìn)行優(yōu)化。其基本思想是每次試驗(yàn)選取一種全宗與年份組合并求出該組合總的利用卷數(shù),從大量的試驗(yàn)中找出總卷數(shù)最大的組合。由于涉及組合問題,所有的情況太多,所需進(jìn)行的試驗(yàn)的卷數(shù)必須非常非常大才能夠得到較理想的結(jié)果。在長(zhǎng)春市檔案館的計(jì)算中,在不加改進(jìn)的情況下進(jìn)行試驗(yàn),發(fā)現(xiàn)即使進(jìn)行1億次試驗(yàn),所得到的結(jié)果也不如直觀選擇模型來得好。這里主要的思想是減少組合的數(shù)量,考慮到利用卷數(shù)是典型的稀疏矩陣,其中有很多全宗和年份其實(shí)是可以先被排除的,結(jié)合直觀選擇模型的方法,我們采用的方法是,先將利用卷數(shù)矩陣按照“行和”與“列和”大小從大到小進(jìn)行排列,根據(jù)實(shí)際情況選擇排在前面所占比例比較大的行和列,然后再利用下面的流程進(jìn)行計(jì)算。
3.4 仿真分析應(yīng)用
按照仿真分析要求,輸入數(shù)據(jù):檔案卷數(shù)矩陣,利用卷數(shù)矩陣,全宗--年代單元的排序以及每天平均數(shù)字化檔案卷數(shù)。按照流程,利用MATLAB編程,帶入相應(yīng)數(shù)據(jù),即可預(yù)測(cè)三個(gè)模型的數(shù)字化方案所帶來的成功率變換。
3.5 應(yīng)用推廣
這里具有很強(qiáng)很廣的應(yīng)用性,對(duì)于不同的需求可以使用不同的模型來滿足。對(duì)操作的簡(jiǎn)易性要求比較高的用戶,這里建議采用直觀選擇模型,該模型簡(jiǎn)單實(shí)用,僅需簡(jiǎn)單操作即可實(shí)現(xiàn)較好的結(jié)果。
結(jié)束語
現(xiàn)在人們?cè)跈n案信息的應(yīng)用和開發(fā)上有著更高的需求,傳統(tǒng)的檔案信息管理以及檔案信息利用模式已經(jīng)不再適用,對(duì)檔案管理軟件統(tǒng)計(jì)功能進(jìn)行升級(jí)和完善是亟需解決的。應(yīng)用數(shù)字模型讓檔案利用統(tǒng)計(jì)自動(dòng)化水平得以提高,也同樣是檔案管理軟件開發(fā)以及應(yīng)用未來的發(fā)展趨勢(shì)。在檔案利用情況中有效采用自動(dòng)統(tǒng)計(jì)系統(tǒng),最終將檔案利用情況表現(xiàn)成全宗、年代、卷。同時(shí),應(yīng)用數(shù)字模型還可以設(shè)計(jì)檔案數(shù)字化模式,讓檔案利用和開發(fā)更加方便,更在檔案數(shù)字化成果檢驗(yàn)過程中起到了重要作用,所以在檔案信息開發(fā)利用上有效應(yīng)用數(shù)字模型是值得推廣應(yīng)用的。
參考文獻(xiàn)
[1]周彩英.高校檔案信息利用服務(wù)綜合評(píng)價(jià)探究[J].浙江檔案,2011(03).
[2]陳艷紅.30年來檔案信息資源開發(fā)利用研究述評(píng)——基于《檔案學(xué)研究》、《檔案學(xué)通訊》的論文分析[J].檔案學(xué)研究,2010(02).
[3]米士剛,劉盈利,劉艷麗.檔案館建設(shè)如何踐行“低碳”理念[J].中國檔案,2010(07).
[4]張寧.思維的“逆行”——電子文件風(fēng)險(xiǎn)管理解析[J].中國檔案,2010(07).
[5]孫洪魯,劉虎.數(shù)字化加工檔案原件與信息安全的管理[J].中國檔案,2010(08).