管延軍+柳晶+時津
摘 要 電子文檔的數(shù)據(jù)通信傳輸和存儲過程中容易導致泄密,提出對應的電子文檔加密算法,實現(xiàn)電子文檔的保密通信和存儲。提出了基于SF-MAX-Log-MAP并行譯碼算法,實現(xiàn)對電子文檔的信息加密和泄密風險評估。構建電子文檔的數(shù)據(jù)特征分析模型,采用檢錯碼數(shù)據(jù)結構分析方法進行相似度特征提取,SF-MAX-Log-MAP并行譯碼,實現(xiàn)對電子文檔的泄密風險評估和預測算法改進。仿真結果表明,采用該模型能有效實現(xiàn)對電子文檔的加密傳輸和存儲,預測準確度較高,檢測概率高,展示了較好的性能。
關鍵詞 電子文檔 加密 信息安全 泄密風險
中圖分類號:TP309.2 文獻標識碼:A ? DOI:10.16400/j.cnki.kjdkx.2015.11.030
Study and Simulation on Risk Estimation Model of Electronic Documents
GUAN YanJun[1][2], LIU Jing[1][2], SHI Jin[1][2]
([1]Beijing HaiTaiFangyuan High Technology Co Ltd, Beijing 100193;
[2]Laboratory of Electronic Records Authenticity Identification and Preservation, Beijing 100193)
Abstract Electronic document data communication can easily lead to leak during the process of transmission and storage, put forward the corresponding electronic document encryption algorithm, realization of electronic documents secret communication and storage. Is proposed based on SF - MAX - Log - MAP decoding algorithm, the parallel implementation of the electronic document information encryption and leak risk assessment. Build a data analysis model of electronic document, using data check wrong words.if structure analysis method for feature extraction, similarity of SF - MAX - Log - MAP parallel decoding, realize the electronic document leak risk assessment and prediction algorithm is improved. The simulation results show that this model can effectively implement encryption transmission and storage of electronic documents, prediction accuracy is higher, high detection probability, shows the better performance.
Key words electronic documents; encryption; information security; risk of leakage
0 引言
隨著信息化對抗與反對抗技術的發(fā)展,電子文檔的安全性受到人們關注。電子穩(wěn)定的數(shù)據(jù)通信傳輸和存儲過程中容易導致泄密,研究電子文檔泄密風險估計模型,提出對應的電子文檔加密算法,實現(xiàn)電子文檔的保密通信和存儲及相關的算法研究受到人們的重視。
傳統(tǒng)方法中,對電子文檔的泄密風險估計和電子文檔的加密傳輸方法主要有Turbo碼編碼算法,傳統(tǒng)的Turbo碼通常采用串行譯碼算法,一方面,若信息幀較大,會帶來較大時延,不利于未來移動通信中信息的有效性傳輸,另一方面,該算法也存在計算復雜度與Turbo碼性能不可兼顧的缺點,文獻[3]提出了Turbo碼的并行譯碼方式,即將接收碼字分成M個子塊,各子塊進行并行譯碼。如若交織器設計不當,會造成兩個或多個子譯碼器同時訪問同一個內(nèi)存,此時便需要設計比較復雜的硬件以解決內(nèi)存爭用問題。針對上述問題,本文提出了基于SF-MAX-Log-MAP并行譯碼算法,提高電子文檔Turbo碼的糾錯性能,降低誤碼率。首先構建電子文檔的數(shù)據(jù)特征分析模型,進行并行譯碼,實現(xiàn)對電子文檔的泄密風險評估和預測算法改進,仿真實驗證明,改進算法在提高電子文檔的泄密風險預測性能和文檔數(shù)據(jù)加密性能方面的實用價值。
1 電子文檔信息特征提取和編碼設計
首先進行了電子文檔信息特征提取。本文此采用Turbo碼的進行電子文檔加密,主要來源于兩部分:一是譯碼等待時延,串行譯碼器要等到整個數(shù)據(jù)塊結束后方可譯碼,二是譯碼計算時延,計算量越大,時延越大。得到電子文檔的泄密概率密度特征為:
= [, ], ?= 2,3,…, ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(1)endprint
上述為每個電子文檔算法編碼碼元的分布概率,在相空間中得到算術編碼的Turbo碼,通過參數(shù)來得到編碼序列的特征函數(shù)為:
= () ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)
根據(jù)經(jīng)典信息傳遞的量子理論,測量的結果可能為四種可能結果中的一個,概率為1/4。因此,一般情況下,Jam可以通過經(jīng)典通道將他的探測結果告Jack,也可以選擇其他的量子通道,從而實現(xiàn)對電子文檔的編碼設計。
2 電子文檔的信息加密和泄密風險估計算法
在上述進行電子文檔信息特征提取和編碼設計的基礎上,提出了基于SF-MAX-Log-MAP并行譯碼算法,實現(xiàn)對電子文檔的信息加密和泄密風險估計。本文采用量子編碼理論,有以下兩個方面的優(yōu)點:
(1)量子力學的測不準原理,測不準,也就無法實現(xiàn)破解解密了;
(2)量子不可克隆定理,無法克隆就保證了量子不被二次使用,所以保密性能大大提高。
傳統(tǒng)方案中采用基于門限的訪問控制策略,把電子文檔數(shù)據(jù)加密算法首先置頂與用戶端,本文基于CSBDLP公鑰加密協(xié)議的多元線性回歸隱私保護,現(xiàn)取明文空間矩陣和,經(jīng)CSBDLP加密協(xié)議加密后得混疊譜跨層補償規(guī)則為: () = ( + )·及 () = ( + )·。
得到電子文檔的信息加密多維向量模型為:
= {,,,…,} ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)
通過反編譯結果中特定變量的反向數(shù)據(jù)關聯(lián)集,在時頻空間中的同在一條直線上的兩點(,)和(,)都滿足直線方程式,把Tri-training迭代訓練過程中和共同標記為(),得到相關函數(shù)為:
= {,,…,}{,,…,} ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(4)
通過上述設計,實現(xiàn)了電子文檔的信息加密和泄密風險估計的優(yōu)化模型構建。
3 仿真實驗
為了測試本文設計的電子文檔泄密風險估計的性能,進行仿真實驗。構建辦公自動化中的電子文檔文本信息絡分布式組合設備。利用TAG算法建立信息加密和泄密分析估計路徑。采用垂直分層策略對文件格式進行CDC劃分,其中SC定長分塊大小為16 KB,平均大小為8 KB (最小長度為 2 KB,最大長度為 16 KB)。得到電子文檔的信息特征加密編碼輸出結果如圖1所示。從圖可見,采用本算法能有效實現(xiàn)對電子文檔的信息加密,編碼輸出具有規(guī)律性特征,避免了泄密風險。
為了對比算法在實現(xiàn)泄密風險估計的性能,計算不同算法下的電子文檔的泄密數(shù)據(jù)檢測命中率對比結果如圖2所示。從圖2可見,采用本文算法有效實現(xiàn)了對電子文檔的數(shù)據(jù)風險評估和泄密數(shù)據(jù)的檢測,提高了電子文檔的安全性能。
4 結論
本文提出了基于SF-MAX-Log-MAP并行譯碼算法,提高電子文檔Turbo碼的糾錯性能,降低誤碼率。首先構建電子文檔的數(shù)據(jù)特征分析模型,采用檢錯碼數(shù)據(jù)結構分析方法進行電子文檔的語義相似度特征提取,
進行SF-MAX-Log-MAP并行譯碼,實現(xiàn)對電子文檔的泄密風險評估和預測算法改進,仿真結果表明,采用本文算法能有效提高對電子文檔的泄密風險預測性能,對泄密數(shù)據(jù)的檢測概率較高,優(yōu)化了泄密風險評估。
參考文獻
[1] 黃佳慶,陶少國,熊志強等.網(wǎng)絡編碼關鍵理論問題研究[J].計算機應用研究,2008.25(8):2260-2264.
[2] 陳立山.網(wǎng)絡編碼的安全性分析與研究[D].西安:西安電子科技大學,2010.
[3] 尹恒,吳陳.混沌偽隨機序列的產(chǎn)生及在網(wǎng)絡安全中的應用[J].江蘇船舶,2003.20(1):32-34.
[4] 付曉.防竊聽和抗污染的低能耗安全網(wǎng)絡編碼方案研究[D].葫蘆島:遼寧工程技術大學,2012.
[5] 劉瓊,潘進,劉炯.基于信息論安全的防竊聽網(wǎng)絡編碼方案[J].計算機工程,2012.38(22):107-110.
[6] 張雁,呂丹桔,吳保國. 基于Tri-Training半監(jiān)督分類算法的研究[J].計算機技術與發(fā)展, 2013.23(7):77-79.endprint