• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      檔案數(shù)字化圖像自動檢測技術的研究與應用

      2018-11-29 22:15:29賴雯
      科技與創(chuàng)新 2018年12期
      關鍵詞:文件夾紙質(zhì)分辨率

      賴雯

      (廣東外語外貿(mào)大學檔案館,廣東 廣州 510420)

      1 項目背景

      檔案數(shù)字化自20世紀80年代提出后,隨著檔案工作的發(fā)展,檔案數(shù)字化也進入全面發(fā)展時期。檔案數(shù)字化的早期形式是將紙質(zhì)目錄轉化成電子目錄,并通過使用檔案系統(tǒng)對檔案文件進行電子化管理。隨著檔案利用需求的增多,僅僅對檔案進行目錄索引是遠遠不夠的,所以,各級政府機關、企事業(yè)單位都在開展存量紙質(zhì)檔案的數(shù)字化工作。通過對紙質(zhì)檔案進行掃描和核對,再將文件進行目錄掛接到檔案系統(tǒng)。一方面,可以提高檔案信息檢索的效率,實現(xiàn)檔案全文信息檢索;另一方面,檔案利用時可優(yōu)先查看檔案系統(tǒng),減少對實體檔案的借閱,有利于保護檔案。而在紙質(zhì)檔案數(shù)字化的過程中,需要進行嚴格的流程管理和質(zhì)量控制,以保證電子檔案的真實性和有效性。

      根據(jù)國家檔案局2017-12-14發(fā)布、2018-01-01實施的最新《紙質(zhì)檔案數(shù)字化技術規(guī)范》要求:掃描分辨率應不小于200 dpi;比如文字偏小、密集、清晰度較差時,建議掃描分辨率不小于300 dpi。掃描分辨率的選擇,應保證掃描后圖像清晰、完整,并綜合考慮數(shù)字圖像后期利用方式等因素。如果有COM 輸出、仿真復制、印刷出版等其他用途時,則可根據(jù)需要調(diào)整掃描分辨率。

      需要進行COM 輸出的檔案,掃描分辨率建議不小于300 dpi;需要進行高精度仿真復制的檔案,掃描分辨率建議不小于600 dpi;需要進行印刷出版的檔案,可結合檔案幅面、印刷出版幅面、印刷精度要求等選擇合適的分辨率。此外,紙質(zhì)檔案數(shù)字圖像長期保存格式為TIFF、JPEG或JPEG2000等通用格式,圖像壓縮率的選擇可根據(jù)實際應用的需求而定。

      《紙質(zhì)檔案數(shù)字化技術規(guī)范》明確規(guī)定,在進行數(shù)字化成果驗收時,應采用計算機自動檢驗與人工檢驗相結合的方式對紙質(zhì)檔案數(shù)字化成果進行驗收檢驗。對數(shù)字圖像進行驗收,主要包括數(shù)字化參數(shù)、存儲路徑、命名的準確性、圖像的完整性、排列順序的準確性、圖像質(zhì)量等。

      實際工作中,對于圖像質(zhì)量的檢測,由于圖像數(shù)量大,如果采用人工檢驗的方式,則需要耗費大量的人力、物力逐一檢查,因此,對于數(shù)字化驗收部門而言,需要根據(jù)需求開發(fā)一套自動化圖像質(zhì)量檢測工具。

      2 項目原理

      2.1 圖像分辨率

      圖像分辨率指的是圖像中儲存的信息量,常用計算方法是每2.54 cm(每英寸)的像素數(shù),單位為ppi,它決定了圖像細節(jié)的精細程度,分辨率越高,包含的像素點越多,圖像越清晰,能表現(xiàn)更豐富的細節(jié),印刷質(zhì)量更好。但分辨率更高的文件更大,需要耗用更多的存儲資源。如果保持圖像尺寸不變,將其圖像分辨率提高一倍,則其文件大小增大為原來的4倍。所以,圖像形成時,要根據(jù)圖像最終的用途決定正確的分辨率。

      2.2 圖像類型和準確率

      圖像壓縮是指以較少的比特有損或無損地表示原來的像素矩陣的技術,也稱圖像編碼。JPEG是最常用的圖像文件格式,是一種有損壓縮格式。如果使用過高的壓縮比例,將使最終解壓縮后恢復的圖像質(zhì)量明顯降低。在實際使用中,我們通過測試發(fā)現(xiàn),準確率在90%以上時,圖像質(zhì)量高且占用空間小,因此,將壓縮率(準確率)90%作為檢測圖片質(zhì)量的標準。

      3 項目實現(xiàn)

      3.1 平臺及工具

      圖像的垂直分辨率和水平分辨率屬性可以在Window 7系統(tǒng)中直接查看,但手動查看需要耗費大量的時間。而圖像的壓縮率/準確率則無法通過系統(tǒng)自帶的屬性查看,需要專門的圖像處理工具收集信息。

      ImageMagick圖片處理是一套功能強大、穩(wěn)定、免費開源的工具集和開發(fā)包,可以用來讀、寫和處理超過90種的圖片文件,包括流行的TIFF、JPEG、GIF、PNG、PDF以及PhotoCD等格式。

      本文通過下載并安裝開源的Imagemagick開發(fā)包,在VS.NET平臺上,開發(fā)應用程序,實現(xiàn)對文件夾下所有讀片的信息讀取,并將結果輸出到CSV文件中。

      3.2 算法實現(xiàn)

      算法的主要思想是對輸入的文件路徑,遍歷搜索該路徑下所有的文件(含子文件夾),并對結果文件進行篩選,將圖片文件存儲到數(shù)據(jù)集中,再對數(shù)據(jù)集中的所有文件讀取圖像屬性信息,并寫入CSV文件。具體如表1所示。

      4 實驗結果

      通過使用開發(fā)的小工具,可以大批量讀取待檢測圖像文件的信息,進行自動化檢測。打開結果文件,即可進行質(zhì)量檢測及幅面大小統(tǒng)計。

      以黨群數(shù)據(jù)集為例,共有40 363張圖片,38.1 G。如果人工打開一個個文件去查看圖像分辨率,假設一個文件夾含10個文件,查看一個文件夾并切換到其他文件夾平均需30 s,對于圖像總數(shù)量為40 363張圖片的項目,手動查看它們的分辨率需耗34 h,且無法準確記錄分辨率不符合要求的圖像。在普通電腦上測試發(fā)現(xiàn),對于同樣的數(shù)據(jù)集,小工具將全部結果寫入CSV文件需要67 min,結果顯示通過編程,讓程序自動檢測,可節(jié)約大量的人工成本。

      實際應用中,大學檔案館每年數(shù)字化掃描的工作量達1 000 000頁及以上,通過使用小工具,一方面可以提高項目驗收的準確度,一方面可以提高驗收效率。

      [1]王學平.淺議我國檔案數(shù)字化建設實踐與發(fā)展策略[J].檔案學通訊,2011(06):54-57.

      [2]李學廣.檔案數(shù)字化方案研究[J].中國檔案,2007(06):52-53.

      猜你喜歡
      文件夾紙質(zhì)分辨率
      磁力文件夾
      EM算法的參數(shù)分辨率
      原生VS最大那些混淆視聽的“分辨率”概念
      調(diào)動右鍵 解決文件夾管理三大難題
      基于深度特征學習的圖像超分辨率重建
      自動化學報(2017年5期)2017-05-14 06:20:52
      一種改進的基于邊緣加強超分辨率算法
      紙質(zhì)書與《北京是個好地方》
      紙質(zhì)讀物的困境與出路
      文學教育(2016年27期)2016-02-28 02:35:24
      獨立書店浪漫的紙質(zhì)生活
      Coco薇(2016年1期)2016-01-11 03:00:59
      TC一鍵直達常用文件夾
      電腦迷(2015年1期)2015-04-29 21:24:13
      华安县| 淳化县| 石泉县| 新乡县| 鸡泽县| 九龙城区| 莱芜市| 改则县| 大渡口区| 临澧县| 崇礼县| 南宁市| 兴城市| 芷江| 浮梁县| 布尔津县| 合川市| 永川市| 唐海县| 镶黄旗| 福泉市| 桃江县| 盐源县| 青冈县| 富民县| 宁国市| 房山区| 兴化市| 黄浦区| 蒲江县| 余江县| 金门县| 德格县| 新巴尔虎左旗| 福海县| 新昌县| 西充县| 泾川县| 六盘水市| 靖西县| 连州市|