• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于深度學習的圖像篡改檢測技術(shù)在數(shù)字檔案中的應用研究

      2019-09-10 07:22:44王璐玥
      新教育論壇 2019年12期
      關(guān)鍵詞:真實性檔案館神經(jīng)網(wǎng)絡

      數(shù)字檔案館作為智慧城市建設的重要環(huán)節(jié),作為檔案永久保存的電子載體,在信息技術(shù)手段日益復雜多變的環(huán)境下,人工智能的浪潮給數(shù)字檔案館帶來了機遇的同時也給檔案工作者帶來了巨大的挑戰(zhàn)。不論是掃描類文檔,照片還是聲像視頻類數(shù)字檔案,圖像都是數(shù)字檔案資源的主要載體,如何保障圖像真實性在新時代仍然是檔案學者們關(guān)注的重點問題。在“互聯(lián)網(wǎng)+人工智能”發(fā)展的大背景下,中國的人工智能已被提升至國家戰(zhàn)略高度,深度學習作為人工智能的重要組成部分,其在檔案學領(lǐng)域的應用研究相比于其他領(lǐng)域相對較少,因此必須結(jié)合新時代的新技術(shù)特點加強對數(shù)字檔案真實性保護研究,確保數(shù)字檔案的真實性。

      一、深度學習在保障數(shù)字檔案真實性的應用可行性

      (1)技術(shù)可行。進入21世紀,我國人工智能技術(shù)進入蓬勃發(fā)展時期。更多的人工智能與智能系統(tǒng)研究課題獲得了各種國家基金計劃支持,并與中國國民經(jīng)濟和科技發(fā)展的重大需求相結(jié)合,力求為國家科技發(fā)展做出更大貢獻。近兩年來,中國的人工智能已發(fā)展成為國家戰(zhàn)略。國家最高領(lǐng)導人習近平、李克強多次發(fā)表重要講話,表示對發(fā)展中國人工智能和機器人學給予高屋建瓴的指示與支持。結(jié)合深度學習的人工智能在計算機視覺領(lǐng)域更是得到了長足的發(fā)展,因此,利用深度學習結(jié)合計算機視覺相關(guān)領(lǐng)域技術(shù)為圖像類數(shù)字檔案篡改檢測提供了技術(shù)保障。

      (2)實踐可行。我國人工智能技術(shù)攻關(guān)和產(chǎn)業(yè)應用近年來發(fā)展勢頭迅猛,已經(jīng)涉及到國民經(jīng)濟39個行業(yè)的大類,目前已被廣泛應用于語音識別、計算機視覺、機器人、語言處理等領(lǐng)域,并且我國目前技術(shù)創(chuàng)新能力不斷增強[1]。此外,我國數(shù)字檔案館建設經(jīng)過近十年的發(fā)展,大部分檔案館信息化基礎(chǔ)設施完備,專業(yè)技術(shù)人力資源充足,國家政策上也給予了一定的支持,相繼出臺了國家級別的標準GB/T18894-2002《電子文件歸檔與管理規(guī)范》,行業(yè)標準DA/T15-1995《磁性載體檔案管理與保護規(guī)范》等我國數(shù)字檔案資源安全標準[2],這些都為結(jié)合深度學習技術(shù)保障圖像類數(shù)字檔案真實性提供了實踐可行性。

      (3)經(jīng)濟可行。2012年以來,我國的信息化發(fā)展進入新階段,云計算,物聯(lián)網(wǎng),大數(shù)據(jù),人工智能等各項技術(shù)蓬勃發(fā)展,國家特別是中央政府各部門按照國家電子政務相關(guān)規(guī)劃的要求,逐步實施了“一站,兩網(wǎng),四庫,十二金”等重點工程[3]。這些國家重點項目的啟動為實施深度學習技術(shù)在檔案領(lǐng)域的應用提供了經(jīng)濟上的支持。

      二、深度學習在保障數(shù)字檔案真實性的應用必要性

      (1)圖像篡改威脅數(shù)字檔案真實性。原始憑證性是檔案的基本屬性[4],檔案一旦失去了真實性的保障,不論從何種角度來說,都會給社會造成難以估量的損失和影響。在互聯(lián)網(wǎng)即將進入5G時代的背景下,信息傳播速度快、規(guī)模大、影響范圍廣泛,一旦發(fā)生數(shù)字檔案信息安全問題,相關(guān)信息會借助互聯(lián)網(wǎng)快速擴散出去,勢必會引發(fā)“蝴蝶效應”[5],這嚴重阻礙了數(shù)字檔案資源建設工作,也使得檔案的公信力得不到保障。

      (2)對圖像類檔案管理理論提供支持。圖像類檔案真實性保障作為數(shù)字檔案管理的重要環(huán)節(jié),數(shù)字檔案信息安全保障是檔案事業(yè)現(xiàn)代化、信息化進程中不可避免的問題,也是數(shù)字檔案館建設工作中必不可少的環(huán)節(jié)。數(shù)字檔案信息安全保障的初衷是為了保證數(shù)字檔案信息的安全、系統(tǒng)、可用,這是一項復雜而系統(tǒng)的任務,因為數(shù)字檔案館建設的每一環(huán)節(jié)都或多或少存在安全隱患,所以要求數(shù)字檔案館建設過程中的每項工作都要小心謹慎、認真仔細。結(jié)合深度學習的圖像類數(shù)字檔案篡改檢測技術(shù)可以作為一項輔助手段,對圖像類檔案管理提供支持。

      (3)多種技術(shù)保障圖像類檔案真實性檢測效果。對圖像類檔案真實性檢測的技術(shù)補充。目前多數(shù)的圖像像檔案真實性檢測都采取依靠數(shù)字水印,數(shù)字簽名等技術(shù)的主動取證技術(shù),該類技術(shù)有長達幾十年相對成熟的發(fā)展基礎(chǔ),但其缺點在于必須事前知曉原始水印或者原始簽名信息才能進行圖像類檔案的篡改檢測。利用神經(jīng)網(wǎng)絡對圖像類檔案進行真實性檢測屬于被動取證技術(shù),不需要提前知曉原始圖像信息,僅根據(jù)圖像本身的紋理特征,結(jié)構(gòu)特點等判斷圖像類數(shù)字檔案是否被篡改。

      (4)對數(shù)字檔案館知識產(chǎn)權(quán)的保護?!盎ヂ?lián)網(wǎng)+”使得數(shù)字檔案資源的利用范圍更加廣泛,面臨的風險更大。如,數(shù)字檔案資源知識產(chǎn)權(quán)風險,在網(wǎng)絡環(huán)境下未經(jīng)允許擅自復制數(shù)字檔案信息資源的問題較為普遍,這些問題容易引發(fā)知識產(chǎn)權(quán)糾紛;信息篡改風險,數(shù)字檔案資源在“互聯(lián)網(wǎng)+”時代容易被越權(quán)非法篡改,影響數(shù)字檔案的真實性[6]?!盎ヂ?lián)網(wǎng)+”時代給數(shù)字檔案資源安全帶來了更大挑戰(zhàn),引入圖像類檔案檢測技術(shù),可以助力數(shù)字檔案安全工作開展,以“互聯(lián)網(wǎng)+”理念做好數(shù)字檔案資源建設工作,并為這項工作構(gòu)建一個安全、平衡的秩序。

      三、深度學習在保障數(shù)字檔案真實性的應用

      深度學習(Deep Learning)是一類算法集合,是機器學習的一個分支。它嘗試為數(shù)據(jù)的高層次摘要進行建模。深度學習是一種機器學習架構(gòu),所有的個體單元以權(quán)重的方式連接在一起,且這些權(quán)重是通過網(wǎng)絡來訓練的,那么它就可以稱之為神經(jīng)網(wǎng)絡算法。神經(jīng)網(wǎng)絡算法的思想來源于模仿人類大腦思考的方式。人類大腦是通過神經(jīng)系統(tǒng)得到輸入信號再作出相應反映的,而接受外部刺激的方式是用神經(jīng)元接受神經(jīng)末梢轉(zhuǎn)換的電信號。深度學習算法通過采用層的方式組織神經(jīng)元,層與層之間可以互相連接來模擬大腦的思考。

      (1)應用背景

      對于圖像類數(shù)字檔案,為了達到隱藏某些信息的目的,主要有復制和粘貼篡改和拼接篡改兩種篡改手段[7]。在復制粘貼篡改方法中,篡改者往往會把本圖像中的某一個區(qū)域復制粘貼到本圖像的另一個區(qū)域。在拼接篡改中,篡改者為了達到某種目的,把圖像A的一部分拼接到圖像B上。為了使篡改不被發(fā)現(xiàn),篡改者往往還會對所要復制的區(qū)域進行變換,如旋轉(zhuǎn)和縮放,然后將所變換的區(qū)域粘貼到其他區(qū)域,并對這個粘貼后的區(qū)域進行加噪和模糊等后續(xù)處理。這些處理即使在圖像表面拼接肉眼無法識別出與真實圖像的區(qū)別,但在圖像的一些低級特征和統(tǒng)計學特征上,不可避免的留下篡改痕跡。這類篡改與真實圖像之間區(qū)別性的特征可以作為神經(jīng)網(wǎng)絡的輸入,利用深度神經(jīng)網(wǎng)絡學習的能力,判別圖像的真?zhèn)?。以圖像的邊緣為例,篡改圖像的粘貼區(qū)域,會引起邊緣灰度的劇烈變化。如下圖所示,在數(shù)據(jù)庫MICC-F2000 中:圖a,b為真實為篡改圖像,圖c,d為復制粘貼篡改圖像(紅色邊框內(nèi)為篡改粘貼區(qū)域),圖像a,c經(jīng)過邊緣提取得到圖片b,d,從圖b,d的對比中可以看出,篡改粘貼區(qū)域面源明顯灰度變化明顯。

      (2)應用流程

      在完整的篡改檢測流程中,主要分為以下三個部分:特征提取,訓練網(wǎng)絡和驗證與測試。針對圖像篡改檢測任務的深度神經(jīng)網(wǎng)絡可以看作完成二分類問題的分類器,輸出結(jié)果為1或0,即篡改或真實。在特征提取模塊,主要是利用數(shù)據(jù)庫訓練集里真實圖像與篡改圖像之間的區(qū)別性特征,作為深度神經(jīng)網(wǎng)絡的輸入來不斷訓練網(wǎng)絡形成新的參數(shù)。在訓練網(wǎng)絡模塊,利用驗證集驗證訓練好的網(wǎng)絡是否具備一定的泛化性,如驗證集效果不如人意,則需要重新調(diào)整神經(jīng)的參數(shù)重復訓練過程。在驗證集的結(jié)果達到一定精度要求后,利用測試集測試網(wǎng)絡性能。最終測試集輸出的結(jié)果即為深度神經(jīng)網(wǎng)絡判別結(jié)果。

      (3)應用難點分析

      國內(nèi)外已經(jīng)有開源的針對不同格式圖像的篡改檢測數(shù)據(jù)庫供研究者訓練和測試神經(jīng)網(wǎng)絡,但是在數(shù)字檔案領(lǐng)域,目前還沒有統(tǒng)一的數(shù)據(jù)庫來驗證一個算法的好壞。對于研究者來說,第一步是需要建立適用于圖像類數(shù)字檔案領(lǐng)域的篡改數(shù)據(jù)庫。由于訓練深度神經(jīng)網(wǎng)絡需要大量的正負樣本,因而在采集源數(shù)據(jù),制作篡改樣本這兩項工作上要耗費大量的時間和精力。

      從硬件上來說,訓練深度神經(jīng)網(wǎng)絡需要高性能的GPU 進行并行計算,我國目前的數(shù)檔案館建設工作雖然推進多年,在檔案館硬件資源上也投入了大批資金,但是在計算機硬件這方面,重視程度還不及檔案館其他硬件設施投入。因此,要引入深度學習技術(shù)仍需領(lǐng)導決策層面的重視與支持。

      從人力資源配備來說,我國目前的數(shù)字檔案館從業(yè)人員以檔案專業(yè)的工作者為主,計算機,統(tǒng)計學等理工科專業(yè)人員為輔。將深度學習的方法靈活運用到數(shù)字檔案領(lǐng)域需要技術(shù)人員具有先進的計算機專業(yè)知識和深厚的數(shù)學功底,這對于數(shù)字檔案館從業(yè)人員的也是一項新的挑戰(zhàn)。

      四、總結(jié)與展望

      現(xiàn)如今科學技術(shù)發(fā)展日新月異,圖像篡改手段日益多樣化,篡改圖像在表面上看來雖然掩人耳目,但是在檢測與篡改的博弈中,只要充分利用現(xiàn)有的技術(shù)手段,定能為圖像類數(shù)字檔案真實性保駕護航。作為檔案工作者,在夯實自身檔案專業(yè)素質(zhì)的同時,也要緊跟技術(shù)潮流,及時了解最新技術(shù),探索檔案管理新技術(shù)。

      參考文獻:

      [1]國務院. 國務院關(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知.國發(fā)〔2017〕35號:http://www.gov.cn/zhengce/ content/2017-07/20/content_5211996.htm,2017-07-20.

      [2]張勇. 數(shù)字檔案信息資源安全保障體系研究[D]. 蘇州 : 蘇州大學, 2007:17-19.

      [3]中國電子政務網(wǎng).我國電子政務工程的頂層設“兩網(wǎng)一站四庫十二金”.http://www.e-gov.org.cn/egov/web/ article_detail.php?id=151138, 2014-07-29.

      [4]徐峰. 試論檔案在依法治縣中的作為[J]. 檔案記憶, 2015(7):23-23.

      [5]聶云霞, 張加欣, 甘敏. “互聯(lián)網(wǎng)+”背景下數(shù)字檔案資源安全研究[J]. 浙江檔案, 2016(6):22-25.

      [6]許鵬. “互聯(lián)網(wǎng)+”時代數(shù)字檔案信息資源建設探討[J]. 城建檔案, 2017(10):30-31.

      [7]李子健. 圖像盲篡改檢測算法研究[D]. 北京:北京交通大學,2017:11-13.

      注釋:

      ①復制粘貼篡改圖像數(shù)據(jù)庫MICC-F2000,源網(wǎng)址:http://lci.micc.unifi.it/labd/2015/01/copy-move-forgery-detection-and-localization/

      作者簡介:王璐玥,女,1994年12月,民族:漢,江蘇鹽城人,碩士學位,上海大學,研究方向:數(shù)字檔案館。

      猜你喜歡
      真實性檔案館神經(jīng)網(wǎng)絡
      神經(jīng)網(wǎng)絡抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      廣告的真實性
      關(guān)于縣級檔案館館藏檔案開發(fā)利用的思考
      全省部分檔案館新館掠影
      浙江檔案(2017年10期)2017-03-31 06:27:31
      基于神經(jīng)網(wǎng)絡的拉矯機控制模型建立
      重型機械(2016年1期)2016-03-01 03:42:04
      復數(shù)神經(jīng)網(wǎng)絡在基于WiFi的室內(nèi)LBS應用
      從懸疑報道談新聞的真實性
      新聞傳播(2015年9期)2015-07-18 11:04:13
      堅持新聞的真實性
      新聞傳播(2015年22期)2015-07-18 11:04:06
      when與while檔案館
      基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡的PID整定
      溧水县| 扎囊县| 灵石县| 四子王旗| 湛江市| 娄烦县| 长汀县| 新邵县| 黄石市| 郴州市| 新邵县| 保定市| 沧源| 克什克腾旗| 濮阳市| 旺苍县| 平谷区| 南投市| 定兴县| 肇庆市| 手游| 当雄县| 海伦市| 盖州市| 荆州市| 广安市| 安塞县| 齐河县| 东城区| 永济市| 平湖市| 秭归县| 罗源县| 广德县| 怀集县| 兴仁县| 肥东县| 仙居县| 金湖县| 如皋市| 平山县|