• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      葫蘆島市檔案局國(guó)有企業(yè)退休人員人事檔案數(shù)字化驗(yàn)收方法

      2021-12-28 06:56:47葫蘆島市檔案局李泓博葫蘆島市檔案館
      蘭臺(tái)世界 2021年6期
      關(guān)鍵詞:頁(yè)數(shù)全文數(shù)據(jù)庫(kù)

      □ 葫蘆島市檔案局 李泓博 葫蘆島市檔案館 陶 冶

      一、退休人事檔案數(shù)據(jù)普遍存在的問(wèn)題

      1.紙質(zhì)人事檔案不規(guī)范。紙質(zhì)檔案是檔案數(shù)字化的基礎(chǔ),如果紙質(zhì)檔案在收集整理過(guò)程中出現(xiàn)問(wèn)題,那么數(shù)字化形成的數(shù)據(jù)必然是不合格的。以人事檔案為例,經(jīng)過(guò)數(shù)字化的人事檔案信息錄入電腦后,雖然人事檔案文件題名、編號(hào)、成文日期等信息變得一目了然,但是無(wú)法通過(guò)這些信息來(lái)確認(rèn)分類(lèi)、頁(yè)碼是否正確以及檔案資料是否收集齊全,仍然需要人工核對(duì),才能確保實(shí)體檔案的齊全、完整。因此,紙質(zhì)檔案不規(guī)范是威脅檔案數(shù)字化的首要問(wèn)題,然而紙質(zhì)檔案的問(wèn)題僅能通過(guò)檔案數(shù)字化工作得到一定程度修復(fù)或者補(bǔ)充,并不能通過(guò)檔案數(shù)字化徹底根除紙質(zhì)檔案存在的問(wèn)題。

      2.人事檔案目錄信息錄入不完備。檔案目錄信息錄入是人事檔案數(shù)字化工作的重要組成部分,而且直接關(guān)系著人事檔案檢索利用的效果。如何在數(shù)十萬(wàn)甚至上百萬(wàn)的人員信息數(shù)據(jù)中檢索出所需要的人事檔案,主要依靠人事檔案目錄數(shù)據(jù)庫(kù)的建設(shè)是否完備。根據(jù)《遼寧省國(guó)有企業(yè)退休人員人事檔案規(guī)范化整理和數(shù)字化工作實(shí)施細(xì)則》(以下簡(jiǎn)稱(chēng)《實(shí)施細(xì)則》)的要求,人事檔案數(shù)字化目錄錄入項(xiàng)目一般都包括材料名稱(chēng)、材料形成時(shí)間、文件頁(yè)數(shù)、姓名、身份證號(hào)碼等十幾項(xiàng)內(nèi)容。實(shí)際工作中常見(jiàn)的問(wèn)題主要有身份證號(hào)錄入有誤、檔案記載出生年月與身份證不一致、性別錄入錯(cuò)誤等,這些信息的準(zhǔn)確與否直接關(guān)系著人事檔案的安全保管和信息檢索。

      3.人事檔案全文數(shù)據(jù)庫(kù)不合格。全文數(shù)據(jù)庫(kù)的問(wèn)題主要體現(xiàn)在兩個(gè)方面。一方面,全文數(shù)據(jù)庫(kù)文件數(shù)量不合格。在掃描的過(guò)程中,由于人員疏忽或系統(tǒng)錯(cuò)誤,經(jīng)常造成掃描形成的圖像數(shù)量與紙質(zhì)檔案數(shù)量不一致的狀況。以2020年葫蘆島市國(guó)有企業(yè)退休人員人事檔案驗(yàn)收情況為例,除經(jīng)過(guò)專(zhuān)門(mén)檢測(cè)軟件檢驗(yàn)過(guò)的檔案數(shù)據(jù),全市100余家國(guó)有企業(yè)退休職工人事檔案數(shù)字化驗(yàn)收一審合格率為0%。掃描過(guò)程中極易出現(xiàn)漏掃、多掃的情況,造成掃描頁(yè)數(shù)與檔案目錄記載的頁(yè)數(shù)不一致,這樣輕則造成數(shù)據(jù)重復(fù)冗余,重則造成檔案信息無(wú)法查詢(xún)。如果掃描圖片數(shù)量不清,一旦在數(shù)據(jù)傳輸或管理時(shí)發(fā)生數(shù)據(jù)丟失,則無(wú)法明確交接雙方責(zé)任,為移交工作埋下隱患。另一方面,全文數(shù)據(jù)庫(kù)文件質(zhì)量不合格。在掃描過(guò)程中,由于設(shè)備不同、實(shí)體檔案的類(lèi)型和狀態(tài)不同會(huì)造成掃描形成的圖像質(zhì)量參差不齊,主要體現(xiàn)在掃描圖像的色彩、分辨率、偏斜度等方面。另外,原始圖像上的雜質(zhì)、折痕以及背透等問(wèn)題都影響著圖像的掃描效果,進(jìn)而影響光學(xué)字符識(shí)別(OCR)的效果。

      4.目錄和全文數(shù)據(jù)庫(kù)關(guān)聯(lián)失效。按照《實(shí)施細(xì)則》的要求,目錄數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù)的指針為掛接索引。掛接索引是關(guān)聯(lián)兩個(gè)數(shù)據(jù)庫(kù)的唯一通道,因此掛接索引的準(zhǔn)確率是確保兩個(gè)數(shù)據(jù)相互關(guān)聯(lián)的前提。然而人事檔案掛接索引比一般檔案復(fù)雜,且掛接索引必須100%準(zhǔn)確才能保證數(shù)據(jù)關(guān)聯(lián)。掛接索引形成過(guò)程中,英漢符號(hào)的差別、全角半角輸入的差別以及數(shù)位補(bǔ)零之間的差別都會(huì)影響最終的結(jié)果,導(dǎo)致檔案目錄數(shù)據(jù)與檔案圖像無(wú)法有效關(guān)聯(lián)。例如,目錄數(shù)據(jù)庫(kù)全宗號(hào)字段在錄入數(shù)據(jù)前多敲入一個(gè)空格鍵,這樣的錯(cuò)誤很難通過(guò)肉眼觀察發(fā)現(xiàn),但是會(huì)造成全部數(shù)據(jù)無(wú)法實(shí)現(xiàn)鏈接,而且不知從何下手修改數(shù)據(jù)。

      以上四類(lèi)問(wèn)題是人事檔案數(shù)字化驗(yàn)收過(guò)程中普遍存在的,想要提高退管人事檔案數(shù)字化的質(zhì)量,僅靠嚴(yán)謹(jǐn)?shù)墓ぷ鲬B(tài)度,而沒(méi)有一套行之有效的驗(yàn)收方法,很可能導(dǎo)致檔案數(shù)字化工作事倍功半,人事檔案的驗(yàn)收無(wú)法給予檔案數(shù)據(jù)以合理保證。

      二、國(guó)企退休人員人事檔案數(shù)字化驗(yàn)收方法

      隨著海量的人事檔案數(shù)字化信息不斷生成,檢測(cè)糾錯(cuò)的難度是成幾何倍數(shù)增長(zhǎng)的,即便理論上存在驗(yàn)收方法可以保證檔案數(shù)據(jù)萬(wàn)無(wú)一失,實(shí)踐中在經(jīng)濟(jì)條件和技術(shù)條件的制約下也僅是紙上談兵。因此,通過(guò)人事檔案數(shù)字化驗(yàn)收的檔案,驗(yàn)收單位無(wú)法對(duì)檔案數(shù)據(jù)給予絕對(duì)保證,而是按照《實(shí)施細(xì)則》的相關(guān)要求,結(jié)合現(xiàn)有檔案工作實(shí)際情況,通過(guò)一定的信息技術(shù)檢測(cè)后,給予高標(biāo)準(zhǔn)的合理保證。以下結(jié)合葫蘆島市退管人事檔案數(shù)字化驗(yàn)收工作實(shí)際,按照技術(shù)實(shí)現(xiàn)的難易程度或投入資金量列出四種驗(yàn)收方法,供各位檔案同仁參考。本文所討論的人事檔案數(shù)字化驗(yàn)收方法,僅限于對(duì)人事檔案數(shù)字化數(shù)據(jù)的檢驗(yàn),對(duì)于紙質(zhì)檔案已經(jīng)整理完畢,但既沒(méi)有錄入目錄信息又沒(méi)有掃描成為圖像的紙質(zhì)檔案無(wú)法進(jìn)行檢測(cè),不在本文討論范圍之內(nèi)。

      1.方案一:格式審查+數(shù)量關(guān)系試算+數(shù)據(jù)抽檢。格式審查是指對(duì)國(guó)有企業(yè)退休人員人事檔案數(shù)字化形成的檔案數(shù)據(jù)的格式對(duì)照《實(shí)施細(xì)則》相關(guān)要求進(jìn)行形式上的審查,即審查目錄數(shù)據(jù)庫(kù)中必錄字段是否齊全完整、非空字段有無(wú)缺失信息、掛接索引格式是否正確、全文數(shù)據(jù)庫(kù)中圖片存儲(chǔ)格式以及圖片命名格式是否正確。數(shù)量關(guān)系試算是指通過(guò)計(jì)算案卷目錄總頁(yè)數(shù)、份目錄頁(yè)數(shù)以及掃描圖片數(shù)三者相等的數(shù)量關(guān)系,去檢驗(yàn)案卷目錄總頁(yè)數(shù)與份目錄總頁(yè)數(shù)之間、目錄總頁(yè)數(shù)與掃描圖片數(shù)之間是否相等,從而判斷兩個(gè)數(shù)據(jù)庫(kù)有關(guān)數(shù)據(jù)是否準(zhǔn)確。數(shù)據(jù)抽查是對(duì)目錄數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù)進(jìn)行抽檢,檢測(cè)目錄與圖像的關(guān)聯(lián)是否準(zhǔn)確、圖像掃描質(zhì)量是否達(dá)標(biāo)。通過(guò)以上操作,能在一定程度上保證人事檔案數(shù)據(jù)的準(zhǔn)確性,雖然這套方案幾乎不需要投入任何經(jīng)費(fèi),且不依賴(lài)檢測(cè)系統(tǒng),但這套簡(jiǎn)易驗(yàn)收方法基本上是依靠驗(yàn)收人員的觀察來(lái)判斷合格與否,因此保證程度不高,即便是通過(guò)驗(yàn)收的數(shù)據(jù),未來(lái)檔案利用過(guò)程中發(fā)現(xiàn)錯(cuò)誤的概率也很高。

      2.方案二:?jiǎn)蜗蛳到y(tǒng)檢測(cè)+數(shù)量關(guān)系試算。單向系統(tǒng)檢測(cè)是指通過(guò)檔案檢測(cè)系統(tǒng),從目錄數(shù)據(jù)庫(kù)出發(fā),自動(dòng)進(jìn)行格式審查、非空校驗(yàn)、身份證號(hào)檢測(cè)以及掛接索引有效性等檢測(cè)。目錄數(shù)據(jù)庫(kù)合格后,檢測(cè)系統(tǒng)根據(jù)掛接索引去關(guān)聯(lián)圖像,并檢測(cè)圖像分辨率、色彩以及存儲(chǔ)格式,保證與目錄數(shù)據(jù)庫(kù)成功掛接的全文數(shù)據(jù)庫(kù)圖像質(zhì)量,再對(duì)兩個(gè)數(shù)據(jù)庫(kù)內(nèi)的數(shù)量關(guān)系進(jìn)行試算。這套方案需要借助專(zhuān)業(yè)的檔案信息管理或檢測(cè)系統(tǒng),目前市場(chǎng)上常見(jiàn)的檔案管理軟件稍作修改后,基本可以實(shí)現(xiàn)單向檢測(cè)的功能,但單向檢測(cè)是以全部目錄數(shù)據(jù)庫(kù)中的數(shù)據(jù)為基準(zhǔn),去測(cè)試全文數(shù)據(jù)庫(kù)數(shù)據(jù)的有效性和準(zhǔn)確性,并不能反向從全文數(shù)據(jù)庫(kù)向目錄數(shù)據(jù)庫(kù)發(fā)起測(cè)試。這就難免造成一些數(shù)據(jù)錯(cuò)誤無(wú)法檢測(cè)出來(lái),例如全文數(shù)據(jù)庫(kù)中存在掃描圖片,但是目錄數(shù)據(jù)庫(kù)中并未輸入對(duì)應(yīng)的目錄信息,這樣的錯(cuò)誤單向檢測(cè)系統(tǒng)是無(wú)法發(fā)現(xiàn)的。通過(guò)數(shù)量關(guān)系試算可以有效彌補(bǔ)單向檢測(cè)系統(tǒng)的不足,通過(guò)兩步檢測(cè)可以在合理的置信區(qū)間內(nèi)推定通過(guò)數(shù)字化驗(yàn)收的數(shù)據(jù)是準(zhǔn)確無(wú)誤的。但這套方案的弊端就是定位較為困難,通過(guò)數(shù)量關(guān)系測(cè)算發(fā)現(xiàn)的問(wèn)題,無(wú)法精準(zhǔn)定位,需檢測(cè)人員具備較強(qiáng)的檔案業(yè)務(wù)和計(jì)算機(jī)操作能力,逐步嘗試以縮小范圍。在實(shí)際工作中,經(jīng)常是在幾萬(wàn)條目錄和幾十萬(wàn)張圖片中尋找錯(cuò)誤,費(fèi)時(shí)耗力,效率很低。雖然這套方案存在著不足之處,但是相比于其他方法并綜合考慮資金和人力成本,此方案的性?xún)r(jià)比最高,且實(shí)用性、兼容性較好。因此,現(xiàn)實(shí)工作中葫蘆島市檔案局采用了該套方案。

      3.方案三:雙向系統(tǒng)檢測(cè)。雙向系統(tǒng)檢測(cè)是指實(shí)現(xiàn)檔案數(shù)字化目錄數(shù)據(jù)庫(kù)與全文數(shù)據(jù)庫(kù)雙向檢測(cè),既包括從每一條目錄信息檢測(cè)對(duì)應(yīng)的每一張圖片,也包括從每一張圖片反向檢測(cè)對(duì)應(yīng)的目錄信息。這樣單靠一套檢測(cè)系統(tǒng)就能確保兩個(gè)數(shù)據(jù)庫(kù)內(nèi)所有的數(shù)據(jù)都經(jīng)過(guò)檢驗(yàn),同時(shí)都與對(duì)應(yīng)數(shù)據(jù)庫(kù)的信息建立了關(guān)聯(lián),全面實(shí)現(xiàn)自動(dòng)檢測(cè)和精準(zhǔn)報(bào)錯(cuò),大大提高數(shù)據(jù)糾錯(cuò)以及數(shù)字化驗(yàn)收的效率,并且通過(guò)驗(yàn)收檢測(cè)的數(shù)據(jù)比較接近絕對(duì)準(zhǔn)確,完全達(dá)到合理保證的要求。然而這套系統(tǒng)存在著兩項(xiàng)不足,一方面,目前此類(lèi)軟件需要定向開(kāi)發(fā),且開(kāi)發(fā)費(fèi)用較高,同時(shí)雙向檢測(cè)對(duì)計(jì)算機(jī)運(yùn)算能力要求較高,當(dāng)檢測(cè)數(shù)據(jù)量較大時(shí),配置較低的電腦很可能無(wú)法流暢運(yùn)行該系統(tǒng)甚至導(dǎo)致系統(tǒng)崩潰;另一方面,這套系統(tǒng)雖然可以保證數(shù)字化掃描圖片與目錄正確關(guān)聯(lián)掛接索引正確,但圖片實(shí)際內(nèi)容與目錄記載信息仍有可能不一致。相比于方案二,方案三有更高的效率,大大節(jié)省人力和時(shí)間,但對(duì)于檔案數(shù)據(jù)準(zhǔn)確性的提升不大,方案的整體性?xún)r(jià)比并不高,比較適用于設(shè)備較為先進(jìn)且檔案數(shù)量龐大的檔案館。

      4.方案四:雙向系統(tǒng)檢測(cè)+OCR檢驗(yàn)。OCR檢驗(yàn)是通過(guò)光學(xué)字符識(shí)別(OCR)技術(shù),將圖像中的字符識(shí)別成為計(jì)算機(jī)可處理的字符,并將識(shí)別出的信息與目錄數(shù)據(jù)庫(kù)內(nèi)的信息進(jìn)行對(duì)比,從根本上確保圖片內(nèi)的信息與目錄對(duì)應(yīng)字段信息保持一致。能通過(guò)雙向系統(tǒng)檢測(cè)+OCR檢驗(yàn)驗(yàn)收合格的數(shù)據(jù),無(wú)限接近于零差錯(cuò),只是由于目錄數(shù)據(jù)庫(kù)記載信息有限,無(wú)法全面反映文件全部?jī)?nèi)容,所以理論上目錄數(shù)據(jù)沒(méi)有記載的信息部分仍然存在錯(cuò)誤的可能性。方案四對(duì)驗(yàn)收軟硬件設(shè)備要求極高,部分技術(shù)尚在研究階段,尚不具備大規(guī)模推廣應(yīng)用條件,但是此類(lèi)解決方案代表未來(lái)檔案數(shù)字化發(fā)展的方向,目前屬于學(xué)科前沿。

      猜你喜歡
      頁(yè)數(shù)全文數(shù)據(jù)庫(kù)
      全文中文摘要
      《語(yǔ)文建設(shè)》(下半月)2020年1—12月總目錄
      全文中文摘要
      應(yīng)該從第幾頁(yè)看起
      青年再造
      數(shù)據(jù)庫(kù)
      嘟嘟真會(huì)想
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      安顺市| 石首市| 象山县| 天柱县| 阿巴嘎旗| 湖南省| 安庆市| 嘉黎县| 九江县| 湘潭县| 洛宁县| 永康市| 江源县| 兰溪市| 昌乐县| 延安市| 裕民县| 昌江| 大石桥市| 忻城县| 翼城县| 浮山县| 炎陵县| 安岳县| 当阳市| 万宁市| 永城市| 电白县| 元谋县| 东台市| 施甸县| 赣榆县| 海晏县| 庐江县| 且末县| 南部县| 台北市| 宝丰县| 贵南县| 杭锦后旗| 巨野县|