• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      關(guān)于檔案數(shù)字化的編制及其保存方法

      2010-04-11 11:52:06秦海萍
      河南圖書(shū)館學(xué)刊 2010年6期
      關(guān)鍵詞:圖像文件存儲(chǔ)設(shè)備離線

      秦海萍

      (江蘇省蘇微微生物研究有限公司,江蘇 無(wú)錫 214063)

      1 檔案數(shù)字化的編制

      1.1 檔案整理

      紙質(zhì)檔案數(shù)字化的流程:(1)目錄數(shù)據(jù)準(zhǔn)備。按照《檔案著錄規(guī)則》等的要求,規(guī)范檔案中的目錄內(nèi)容。包括確定檔案目錄的著錄項(xiàng)、字段長(zhǎng)度和內(nèi)容要求。對(duì)錯(cuò)誤或不規(guī)范進(jìn)行修改。(2)拆除裝訂。(3)區(qū)分掃描件和非掃描件:無(wú)關(guān)和重份的文件要剔除,有正式件的文件不掃描原稿。(4)頁(yè)面修整。破損嚴(yán)重、無(wú)法直接掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù),折皺不平影響掃描質(zhì)量的原件先進(jìn)行相應(yīng)處理 (壓平或熨平等)。(5)檔案整理登記。制作并填寫(xiě)數(shù)字化加工過(guò)程交接登記表單,詳細(xì)記錄檔案整理后每份文件的起始頁(yè)號(hào)和頁(yè)數(shù)。(6)裝訂——掃描后的工序。掃描完成后恢復(fù)裝訂,應(yīng)注意保持檔案的排列順序不變,做到準(zhǔn)確、無(wú)遺漏。

      1.2 檔案掃描

      (1)確定掃描方式。根據(jù)檔案幅面大小選擇相應(yīng)規(guī)格的掃描儀。紙張狀況較差,紙張間粘貼較緊,不易分開(kāi),過(guò)薄、過(guò)軟或超厚的檔案,不宜使用自動(dòng)進(jìn)紙掃描,必須改用平板掃描方式。大幅面檔案可采用大幅面掃描儀掃描、數(shù)碼平臺(tái)拍攝,也可以采用小幅面掃描后的圖像拼接方式處理。(2)掃描色彩模式。掃描色彩模式一般有黑白二值、灰度、彩色三種。頁(yè)面為黑白兩色,并且字跡清晰、不帶插圖的檔案,采用黑白模式掃描;頁(yè)面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁(yè)面為多色文字的檔案,可采用灰度模式掃描;頁(yè)面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式掃描。(3)掃描分辨率。掃描分辨率參數(shù)大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準(zhǔn)。采用黑白二值、灰度、彩色模式對(duì)檔案進(jìn)行掃描時(shí),其分辨率一般均建議選擇大于或等于100dpi,特殊情況下,如文字偏小、密集、清晰度較差等,可適當(dāng)提高分辨率。需要進(jìn)行OCR漢字識(shí)別的檔案,掃描分辨率建議選擇大于或等于200dpi。(4)掃描登記。登記掃描的頁(yè)數(shù),核對(duì)每份文件的實(shí)際掃描頁(yè)數(shù)與檔案整理時(shí)填寫(xiě)的文件頁(yè)數(shù)是否一致,不一致時(shí)應(yīng)注明具體原因和處理方法。

      1.3 圖像處理

      (1)圖像數(shù)據(jù)質(zhì)量檢查。對(duì)圖像偏斜度、清晰度、失真度等進(jìn)行檢查。發(fā)現(xiàn)不符合圖像質(zhì)量要求時(shí),重新進(jìn)行圖像的處理。由于操作不當(dāng),造成掃描的圖像文件不完整或無(wú)法清晰識(shí)別時(shí),應(yīng)重新掃描。發(fā)現(xiàn)文件漏掃時(shí),及時(shí)補(bǔ)掃并正確插入圖像。發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時(shí),及時(shí)進(jìn)行調(diào)整。(2)糾偏。對(duì)方向不正確的圖像進(jìn)行旋轉(zhuǎn)還原,以符合閱讀習(xí)慣。對(duì)出現(xiàn)偏斜的圖像進(jìn)行糾偏處理,以達(dá)到視覺(jué)上基本不感覺(jué)偏斜為準(zhǔn)。(3)去污。對(duì)圖像頁(yè)面中出現(xiàn)的影響圖像質(zhì)量的雜質(zhì),如黑點(diǎn)、黑線、黑框、黑邊等進(jìn)行去污處理。(4)圖像拼接。對(duì)大幅面檔案進(jìn)行分區(qū)掃描形成的多幅圖像進(jìn)行拼接處理,合并為一個(gè)完整的圖像,以保證檔案數(shù)字化圖像的整體性。(5)裁邊處理。采用彩色模式掃描的圖像應(yīng)進(jìn)行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節(jié)省存儲(chǔ)空間。

      2 檔案數(shù)字化的保存

      2.1 明確電子文件的歸檔內(nèi)容

      電子文件的歸檔內(nèi)容包括電子文件的名稱、路徑名和盤(pán)號(hào),與文件內(nèi)容相同的其它載體文件的檔號(hào),編制該電子文件的軟硬件名稱、型號(hào)、系列和版本等技術(shù)環(huán)境條件。歸檔部門(mén),歸檔日期,檔案數(shù)字化的有效管理涉及到電子文件的技術(shù)環(huán)境條件,存貯介質(zhì)的質(zhì)量、壽命等問(wèn)題,因此電子文件的歸檔時(shí)間可視具體情況而定,一般有年度歸檔、階段歸檔等。且歸檔時(shí)間一般不超過(guò)2~3個(gè)月為宜。

      2.2 存儲(chǔ)要求

      2.2.1 選擇存儲(chǔ)格式。采用黑白二值模式掃描的圖像文件,一般采用TIFF(G4)格式存儲(chǔ)。采用灰度模式和彩色模式掃描的文件,一般采用JPEG格式存儲(chǔ)。存儲(chǔ)時(shí)壓縮率的選擇,應(yīng)以保證掃描的圖像清晰可讀的前提下,盡量減小存儲(chǔ)容量為準(zhǔn)則。提供網(wǎng)絡(luò)查詢的掃描圖像,也可存儲(chǔ)為CEB、PDF或其他格式。(2)命名圖像文件。紙質(zhì)檔案目錄數(shù)據(jù)庫(kù)中的每一份文件,都有一個(gè)與之相對(duì)應(yīng)的唯一檔號(hào),以該檔號(hào)為這份文件掃描后的圖像文件命名。多頁(yè)文件采用該檔號(hào)建立相應(yīng)文件夾,按頁(yè)碼順序?qū)D像文件命名。

      2.2.2 分級(jí)存儲(chǔ)。所謂分級(jí)存儲(chǔ)是根據(jù)檔案數(shù)字化信息數(shù)據(jù)不同的訪問(wèn)頻率、價(jià)值重要性等指標(biāo),在不同級(jí)別的存儲(chǔ)設(shè)備中存放數(shù)據(jù)客體,實(shí)現(xiàn)數(shù)據(jù)分級(jí)存儲(chǔ)。并針對(duì)數(shù)據(jù)訪問(wèn)的局部性,利用分級(jí)存儲(chǔ)管理軟件,實(shí)現(xiàn)系統(tǒng)將不經(jīng)常訪問(wèn)的數(shù)據(jù)自動(dòng)移到存儲(chǔ)層次中較低的層次的自動(dòng)數(shù)據(jù)遷移,釋放出較高成本的存儲(chǔ)空間給更頻繁訪問(wèn)的數(shù)據(jù),從而獲得更好的總體性價(jià)比。

      (1)分級(jí)存儲(chǔ)的操作方式。分級(jí)存儲(chǔ)操作方式主要有兩種,即“數(shù)據(jù)遷移”和“數(shù)據(jù)回遷”。數(shù)據(jù)遷移方式是根據(jù)檔案管理軟件或由專(zhuān)門(mén)的分級(jí)存儲(chǔ)管理軟件指定的策略或規(guī)則(如按照各級(jí)存儲(chǔ)定義的數(shù)據(jù)標(biāo)準(zhǔn)),把大量不經(jīng)常訪問(wèn)的數(shù)據(jù)放置在離線或近線設(shè)備,自動(dòng)遷移到下一級(jí)存儲(chǔ)設(shè)備上,提高存儲(chǔ)資源利用率,同時(shí)也大大降低設(shè)備和管理成本。數(shù)據(jù)回遷是數(shù)據(jù)遷移的一個(gè)反向操作過(guò)程,是將下一級(jí)存儲(chǔ)設(shè)備中的數(shù)據(jù),從離線到近線、從近線到在線按照管理軟件指定的策略或規(guī)則自動(dòng)調(diào)回上一級(jí)存儲(chǔ)設(shè)備中。滿足了用戶的利用需求,提高數(shù)據(jù)的訪問(wèn)速度和利用率。

      (2)分級(jí)存儲(chǔ)的存儲(chǔ)方式。分級(jí)存儲(chǔ)的存儲(chǔ)方式有在線存儲(chǔ)、近線存儲(chǔ)、離線存儲(chǔ)。在線存儲(chǔ)多采用高端存儲(chǔ)系統(tǒng)和技術(shù),如SAN、點(diǎn)對(duì)點(diǎn)直連技術(shù)和高速在線磁盤(pán)陣列等存儲(chǔ)設(shè)備,存取速度快。這種存儲(chǔ)方式以服務(wù)器為存儲(chǔ)設(shè)備中心,將數(shù)據(jù)信息直接放在服務(wù)器的存儲(chǔ)設(shè)備中,實(shí)現(xiàn)數(shù)據(jù)的輸入、保存、輸出及應(yīng)用程序的安全快速運(yùn)行。近線存儲(chǔ)是將不是經(jīng)常用到,或者說(shuō)數(shù)據(jù)的訪問(wèn)量并不大的數(shù)據(jù)存放在性能較低的存儲(chǔ)設(shè)備上。其外延相對(duì)較廣泛,主要定位于客戶在線存儲(chǔ)和離線存儲(chǔ)之間的應(yīng)用,對(duì)這些的設(shè)備要求是尋址迅速、傳輸率高。同時(shí)多數(shù)情況下由于不常用的數(shù)據(jù)要占總數(shù)據(jù)量的比較大的比重,這也就要求近線存儲(chǔ)設(shè)備在需要容量相對(duì)較大。可跟據(jù)客戶存儲(chǔ)需求的不同,我們也會(huì)把低端的磁盤(pán)陣列 (例如DS4100)或高端的磁帶設(shè)備(例如3592)作為近線存儲(chǔ)應(yīng)用設(shè)備。離線存儲(chǔ)一般采用磁帶作為存儲(chǔ)介質(zhì),其訪問(wèn)速度低,但能實(shí)現(xiàn)海量存儲(chǔ),同時(shí)價(jià)格低廉。離線存儲(chǔ)介質(zhì)上的數(shù)據(jù)在讀寫(xiě)時(shí)是順序進(jìn)行的。當(dāng)需要讀取數(shù)據(jù)時(shí),需要把帶子卷到頭,再進(jìn)行定位。當(dāng)需要對(duì)已寫(xiě)入的數(shù)據(jù)進(jìn)行修改時(shí),很多情況下數(shù)據(jù)都需要全部進(jìn)行改寫(xiě)。因此,離線存儲(chǔ)主要用于數(shù)據(jù)的備份和恢復(fù)。

      3 檔案數(shù)字化保存的維護(hù)

      3.1 建立檔案館(室)網(wǎng)站

      為實(shí)現(xiàn)檔案數(shù)字化信息資源共享,檔案信息服務(wù)網(wǎng)絡(luò)化、檔案管理工作自動(dòng)化、檔案信息管理法制化,檔案工作者應(yīng)進(jìn)一步加快檔案信息資源數(shù)據(jù)庫(kù)建設(shè),以網(wǎng)站為基礎(chǔ),在網(wǎng)站上實(shí)現(xiàn)電子文件的實(shí)時(shí)管理與利用,實(shí)現(xiàn)信息資源電子化。

      3.2 確保檔案數(shù)字化載體物理上的安全

      通常情況下,檔案數(shù)字化是以脫機(jī)方式存儲(chǔ)在磁、光介質(zhì)上,因此,檔案數(shù)字化的保存要建立一個(gè)適合于磁、光介質(zhì)保存的環(huán)境。要控制保持環(huán)境的溫濕度和滿足檔案載體的避光、防塵及變形要求,同時(shí),載體排放要直立,要遠(yuǎn)離有害氣體和磁場(chǎng)。

      3.3 保證檔案數(shù)字化的原始性

      檔案數(shù)字化的內(nèi)容是以數(shù)碼形式存儲(chǔ)于各種載體上的,在利用檔案數(shù)字化過(guò)程中必須依靠電子計(jì)算機(jī)軟硬件平臺(tái),將檔案數(shù)字化的內(nèi)容還原成直接閱讀格式。然而,檔案數(shù)字化通常是在不同的載體上形成的,其內(nèi)容的格式編排上存在差異,這必然導(dǎo)致檔案數(shù)字化還原時(shí)所采用的技術(shù)與方法的不同,可能導(dǎo)致檔案信息的完整性。因此,在保存檔案數(shù)字化的同時(shí),要將與檔案數(shù)字化相關(guān)的軟件及整個(gè)應(yīng)用系統(tǒng)一并保存,并與檔案數(shù)字化存儲(chǔ)在一起,確保檔案數(shù)字化的永久可用。

      [1]孫凱.淺議檔案電子化及檔案數(shù)字化的整理與保護(hù)[J].太原城市職業(yè)技術(shù)學(xué)院學(xué)報(bào),2008(7).

      [2]葉群芳.淺議檔案信息電子化的建設(shè)與服務(wù)[J].才智,2008(21).

      [3]靳海峰.檔案信息電子化現(xiàn)狀分析[J].河南科技,2009(6).

      [4]劉穎.淺談檔案數(shù)字化的保存與維護(hù)[J].新疆廣播電視大學(xué)學(xué)報(bào),2003(4).

      猜你喜歡
      圖像文件存儲(chǔ)設(shè)備離線
      異步電機(jī)離線參數(shù)辨識(shí)方法
      呼吸閥離線檢驗(yàn)工藝與評(píng)定探討
      淺談ATC離線基礎(chǔ)數(shù)據(jù)的準(zhǔn)備
      離線富集-HPLC法同時(shí)測(cè)定氨咖黃敏膠囊中5種合成色素
      中成藥(2018年2期)2018-05-09 07:20:09
      圖像電子文件的歸檔格式及其轉(zhuǎn)換研究
      檔案管理(2017年1期)2017-01-17 19:15:57
      Windows 7下USB存儲(chǔ)設(shè)備接入痕跡的證據(jù)提取
      基于Flash芯片的新型存儲(chǔ)設(shè)備數(shù)據(jù)恢復(fù)技術(shù)研究
      用批處理管理計(jì)算機(jī)USB設(shè)備的使用
      在TC界面以縮略圖查看圖像文件
      電腦迷(2012年22期)2012-04-29 20:30:54
      《圖像文件探尋之旅——圖像文件概述》教學(xué)設(shè)計(jì)及反思
      自治县| 宁远县| 鲜城| 松潘县| 达孜县| 溆浦县| 封丘县| 鹤庆县| 临夏县| 贵港市| 柳河县| 曲麻莱县| 石狮市| 南漳县| 长治市| 洪湖市| 衡东县| 朔州市| 安吉县| 龙岩市| 梅州市| 若尔盖县| 永泰县| 涿州市| 江川县| 融水| 张北县| 体育| 马关县| 永新县| 江孜县| 弥勒县| 抚顺市| 顺义区| 淳安县| 台北市| 岳阳县| 上高县| 本溪| 山阳县| 长春市|