• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      文本信息隱藏技術(shù)分析與綜述

      2022-08-25 09:57:10徐明杰楊婉霞周蓓蓓李妙棋王巧珍
      軟件導(dǎo)刊 2022年8期
      關(guān)鍵詞:載體領(lǐng)域文獻(xiàn)

      徐明杰,楊婉霞,周蓓蓓,李妙棋,劉 燕,王巧珍

      (甘肅農(nóng)業(yè)大學(xué)機(jī)電工程學(xué)院,甘肅蘭州 730070)

      0 引言

      信息隱藏是保證信息安全的重要技術(shù)手段之一,與經(jīng)典的加密技術(shù)相得益彰、互為補(bǔ)充,共同守護(hù)網(wǎng)絡(luò)信息安全。然而,加密技術(shù)注重內(nèi)容安全,行為上的暴露會(huì)激發(fā)攻擊者的熱情。信息隱藏通過(guò)公開(kāi)載體傳遞機(jī)密信息,追求的是內(nèi)容和行為兩者的不可感知性和不易察覺(jué)性,即隱蔽性??梢?jiàn),信息隱藏的目的是將私密信息融入載體,使其很自然地成為載體不可分離的一部分。

      實(shí)施信息隱藏的前提是選擇已有載體或構(gòu)造載體,因此可按照載體的時(shí)代特征將信息隱藏劃分為傳統(tǒng)形式隱寫和現(xiàn)代信息隱寫兩種。傳統(tǒng)隱寫主要基于物理媒介、化學(xué)物質(zhì)和擴(kuò)頻通信等載體[1];而現(xiàn)代信息隱寫是隨著計(jì)算機(jī)、互聯(lián)網(wǎng)等技術(shù)發(fā)展,出現(xiàn)了文本、圖像、音頻等數(shù)字載體而開(kāi)啟的,使得信息隱藏手段發(fā)生了前所未有的變化,其比基于傳統(tǒng)隱寫技術(shù)發(fā)展更快速,應(yīng)用更廣泛??梢哉f(shuō),信息隱藏的發(fā)展史是尋求載體并與載體和諧共處的奮斗史,詳見(jiàn)圖1。在眾多數(shù)字載體中,文本是最常用、最普遍的載體,基于文本的信息隱藏技術(shù)必然受到研究界的極大關(guān)注。從圖2 可以看出,基于文本載體的信息隱藏研究關(guān)注度及發(fā)表文獻(xiàn)數(shù)量位居第二(知網(wǎng)和WOS 檢索量),圖像位居之一是由于其冗余度大。因此,本文以文本信息隱藏技術(shù)為研究對(duì)象,詳細(xì)分析其研究現(xiàn)狀、熱點(diǎn)和發(fā)展趨勢(shì)以及存在的問(wèn)題。

      Fig.1 Timeline of the development of modern information hiding with the change of the carrier圖1 現(xiàn)代信息隱藏隨載體變化而發(fā)展的時(shí)間軸

      Fig.2 Comparison of the number of Chinese and English literatures in different carriers圖2 不同載體中英文文獻(xiàn)數(shù)量比較

      1 文本信息隱藏技術(shù)分類及研究現(xiàn)狀

      目前文本信息隱藏技術(shù)主要分為三大類。第一大類為修改式文本信息隱藏,主要包括:①基于文本格式的信息隱藏。該類算法的特點(diǎn)為微調(diào)已有文本的格式實(shí)現(xiàn)隱寫,不會(huì)改變文本內(nèi)容,例如通過(guò)微調(diào)文本間距[2-4]、改變字符編碼[5-7]和文件格式[8-10]實(shí)現(xiàn)信息隱藏;②基于文本內(nèi)容的信息隱藏。該類方法不改變文本語(yǔ)義,在不同粒度情況下修改文本內(nèi)容時(shí)實(shí)現(xiàn)信息隱藏,修改對(duì)象集中在詞匯層和語(yǔ)句層,例如通過(guò)替換相似字符[11-13]、增刪句子中的助詞[14]、改變句子長(zhǎng)度等實(shí)現(xiàn)信息隱藏[15]。第二大類為搜索式無(wú)載體文本信息隱藏。該類方法不對(duì)原有載體作任何修改,而是以大數(shù)據(jù)為基礎(chǔ),在大量自然載體中搜索含密載體進(jìn)行傳輸,重點(diǎn)解決如何準(zhǔn)確定位私密信息的問(wèn)題。目前常用方法包括利用漢字?jǐn)?shù)學(xué)表達(dá)式生成定位標(biāo)簽[16-17],基于漢語(yǔ)拼音組合特征[18]、漢字的聲調(diào)特征[19]、字符編碼特征[20]和詞階圖[21]等設(shè)計(jì)的無(wú)載體信息隱藏方法。該類方法的特點(diǎn)是抗檢測(cè)性極強(qiáng),但受標(biāo)簽+關(guān)鍵詞搜索載密文本的模式所限,需要大量文本數(shù)據(jù)方可穩(wěn)定實(shí)施,且算法復(fù)雜,隱藏容量十分有限。第三大類為生成式文本信息隱藏方法,其借助概率統(tǒng)計(jì)理論及自然語(yǔ)言生成技術(shù),設(shè)計(jì)符合語(yǔ)法規(guī)則的句法模板,通過(guò)構(gòu)建字典資源將私密信息編碼為自然語(yǔ)言的文本內(nèi)容。例如Simova 等[22]針對(duì)基于同義詞替換策略生成文本的隱寫軟件Nicetext 生成的文本語(yǔ)義生硬等問(wèn)題改進(jìn)模型,充分考慮英文句法規(guī)則,提高了生成文本質(zhì)量;余振山等[23]結(jié)合字詞編碼實(shí)現(xiàn)自動(dòng)生成宋詞的信息隱藏,嵌入率高,但算法選詞的隨機(jī)性強(qiáng),生成的宋詞欣賞性不佳,隱蔽性降低;Yang 等[24]采用大數(shù)據(jù)驅(qū)動(dòng)的循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建文本生成和隱寫模型,隱藏容量和隱蔽性均有所提升;Kang 等[25]基于關(guān)鍵詞并引入注意力機(jī)制建立的語(yǔ)言模型能更深層次地學(xué)習(xí)語(yǔ)義信息,提高了生成載密文本的抗檢性;Yang等[26]采用知識(shí)圖譜約束文本自動(dòng)生成過(guò)程的語(yǔ)義,保證了較好的文本生成質(zhì)量;其還探索了面向唐詩(shī)和宋詞生成的多種信息隱藏方法[27-28],促進(jìn)了文本生成式信息隱藏研究的進(jìn)一步發(fā)展。

      為了更清晰地展現(xiàn)已有算法的原理和特點(diǎn),本文對(duì)現(xiàn)有文本信息隱藏方法進(jìn)行簡(jiǎn)要概括與比較,詳見(jiàn)表1??梢钥闯?,修改式文本信息隱藏方法因其固有的缺點(diǎn)難以抵抗統(tǒng)計(jì)隱藏檢測(cè)。搜索式無(wú)載體文本信息隱藏方法的搜索和存儲(chǔ)代價(jià)大,隱藏容量普遍較低,且隱藏成功率會(huì)受到算法和數(shù)據(jù)影響。而基于文本自動(dòng)生成的信息隱藏方法可以很好地協(xié)調(diào)隱藏容量和隱蔽性,也無(wú)需大量文本數(shù)據(jù)。然而目前文本生成模型生成的文本自然度欠佳,主題和情感等可控性不完善。綜合分析可知,當(dāng)前研究主要集中在面向文本自動(dòng)生成的信息隱藏技術(shù),以及將搜索式思想與文本自動(dòng)生成相結(jié)合的隱藏方法方面。以下將通過(guò)對(duì)相關(guān)文獻(xiàn)進(jìn)行分析,進(jìn)一步挖掘文本信息隱藏的研究熱點(diǎn)和發(fā)展趨勢(shì)。

      Table 1 Comparison of text information hiding methods表1 文本信息隱藏方法比較

      2 研究方法

      2.1 數(shù)據(jù)來(lái)源

      本文分析數(shù)據(jù)來(lái)源于Web of Science 數(shù)據(jù)庫(kù),主題詞設(shè)置為“text”and“information hiding or steganagraphy”,源期刊限定Web of Science 的核心合集數(shù)據(jù)庫(kù),設(shè)定年限為2010-2021 年,剔除與研究主題不相關(guān)的條目,最終得到有效英文文獻(xiàn)200篇。

      2.2 研究工具

      利用科學(xué)引文文獻(xiàn)數(shù)據(jù)挖掘和可視化分析工具Cite SpaceⅣ[29-30]對(duì)樣本文獻(xiàn)中蘊(yùn)含的潛在知識(shí)信息及其相互關(guān)系進(jìn)行科學(xué)計(jì)量與深度分析,得到高被引文獻(xiàn)以及作者、研究機(jī)構(gòu)、國(guó)家/地區(qū)的合作共現(xiàn)情況等,形成文本信息隱藏領(lǐng)域研究作者及機(jī)構(gòu)的知識(shí)圖譜,進(jìn)而探究文本信息隱藏學(xué)科結(jié)構(gòu)的發(fā)展概況。

      2.3 分析方法

      首先對(duì)文獻(xiàn)共被引進(jìn)行聚類分析,挖掘相似文獻(xiàn)的共同主題,得到研究主題的知識(shí)基礎(chǔ),形成并體現(xiàn)引文網(wǎng)絡(luò)中的學(xué)科點(diǎn);然后對(duì)文獻(xiàn)中的關(guān)鍵詞進(jìn)行共現(xiàn)分析,以揭示文獻(xiàn)所代表學(xué)科與各主題之間的關(guān)系,同時(shí)結(jié)合結(jié)構(gòu)變異性分析,即通過(guò)關(guān)鍵詞和高被引作者的突變檢測(cè),反映和辨識(shí)新興學(xué)科和研究前沿的轉(zhuǎn)變。

      3 研究結(jié)果分析

      3.1 年度文獻(xiàn)量統(tǒng)計(jì)分析

      圖3 為1990-2021 年期間文本信息隱藏領(lǐng)域的年度文獻(xiàn)統(tǒng)計(jì)。可以看出,自1995 年起,文本信息隱藏研究開(kāi)啟了迅速發(fā)展的階段,并在2016 年后迎來(lái)爆發(fā)式增長(zhǎng)。分析其原因:1996 年5 月,第1 屆國(guó)際信息隱藏學(xué)術(shù)研討會(huì)(The First International Workshop on Information Hiding)在英國(guó)劍橋大學(xué)召開(kāi),標(biāo)志著信息隱藏學(xué)的正式誕生。2017年,Transformer 模型被提出,在自然語(yǔ)言處理(Natural Language Processing,NLP)領(lǐng)域掀起了新的發(fā)展浪潮,促進(jìn)了基于文本自動(dòng)生成的無(wú)載體信息隱藏技術(shù)蓬勃發(fā)展。在我國(guó),信息隱藏技術(shù)研究正式開(kāi)始于1999 年。2000 年1月,國(guó)家自然科學(xué)基金委員會(huì)將信息隱藏技術(shù)確定為優(yōu)先領(lǐng)域,不僅開(kāi)啟了信息隱藏學(xué)科這一新的發(fā)展方向,也為該領(lǐng)域的研究與發(fā)展提供了重要的資金來(lái)源。文本是通用載體,基于文本的信息隱藏技術(shù)自然隨之快速發(fā)展。

      Fig.3 Annual statistics of literatures of text information hiding during 1990-2021圖3 1990-2021年期間文本信息隱藏領(lǐng)域年度文獻(xiàn)統(tǒng)計(jì)

      3.2 作者國(guó)家與研究機(jī)構(gòu)分布

      對(duì)200篇文獻(xiàn)作者所在的國(guó)家和研究機(jī)構(gòu)進(jìn)行統(tǒng)計(jì)可揭示文本信息隱藏領(lǐng)域中堅(jiān)研究力量的分布情況。選擇節(jié)點(diǎn)類型為研究機(jī)構(gòu),Top N=25,形成了文本信息隱藏研究機(jī)構(gòu)分布的可視化圖譜,見(jiàn)圖4。圖中的網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)量為205 個(gè),連線數(shù)量(Links)165 條,網(wǎng)絡(luò)密度(Density)為0.007 9。其中,節(jié)點(diǎn)及字體大小代表機(jī)構(gòu)出現(xiàn)頻次高低,連線密度和粗細(xì)度表示機(jī)構(gòu)之間的合作密切程度??梢钥闯觯擃I(lǐng)域的研究主要集中在中國(guó),發(fā)文量為78 篇,占總量的39%,遙遙領(lǐng)先其他國(guó)家;發(fā)文量排名第二的為印度,占22%;其次是美國(guó)(占13%)和沙特(占8%)。研究機(jī)構(gòu)主要為國(guó)內(nèi)外的各類高校,專業(yè)部門和研究中心亦有參與,但各機(jī)構(gòu)的合作不太緊密。研究機(jī)構(gòu)中,南京信息工程大學(xué)的貢獻(xiàn)率最突出,其次是清華大學(xué)和湖南大學(xué)。此外,為了追蹤國(guó)際上各研究機(jī)構(gòu)不同時(shí)間段在信息隱藏領(lǐng)域的研究貢獻(xiàn),制作了研究機(jī)構(gòu)的突變圖,如圖5 所示。

      Fig.4 Visualization graph of research institutions圖4 研究機(jī)構(gòu)可視化圖譜

      Fig.5 Research institutional mutation map圖5 研究機(jī)構(gòu)突變圖

      可以看出,早些時(shí)候,英國(guó)的薩塞克斯大學(xué)(2011-2013 年)、土耳其的塞爾庫(kù)克大學(xué)(2012-2014 年)和馬來(lái)西亞的馬來(lái)亞大學(xué)(2012-2015 年)在該領(lǐng)域有持續(xù)研究且影響顯著。在國(guó)內(nèi),較早涉獵該領(lǐng)域的為大連理工大學(xué)(2014-2016 年)。然而,自2017 年后,南京信息工程大學(xué)在該領(lǐng)域的研究占主導(dǎo)地位,影響強(qiáng)度最大,主要研究方向?yàn)樗阉魇轿谋緹o(wú)載體信息隱寫;其次為清華大學(xué),影響力僅次于南京信息工程大學(xué),其研究方向主要為生成式無(wú)載體文本信息隱寫。在此期間,印度技術(shù)學(xué)院等也是該領(lǐng)域的主力研究機(jī)構(gòu)之一。

      3.3 高被引作者及合作情況分析

      以文本信息隱藏為主題檢索得到的文獻(xiàn)中,被引量排名前6 位的作者及文獻(xiàn)信息見(jiàn)表2。其中被引頻次最高的為南京信息工程大學(xué)Chen 等[20]于2017 年發(fā)表的名為Coverless Information Hiding Method Based on the Chinese Character Encoding的文獻(xiàn),該文創(chuàng)新性地提出一種基于漢字編碼技術(shù)的無(wú)載體信息隱藏方法,設(shè)計(jì)了在二進(jìn)制數(shù)與漢字間變換的標(biāo)簽實(shí)現(xiàn)對(duì)秘密信息的定位。該標(biāo)簽滿足隨機(jī)性和通用性要求,采用標(biāo)簽+關(guān)鍵詞的形式在大量文本中搜索載密體,提高了隱蔽通信的安全性和魯棒性。被引頻次排名第2 位的為馬來(lái)亞大學(xué)Por Lip Yee 等[31]于2012 年發(fā)表的文獻(xiàn),其實(shí)現(xiàn)了一種采用不同編碼將Unicode 空格字符插入到文中不同位置以實(shí)現(xiàn)信息隱藏的可逆性方法,不僅提高了嵌入效率和嵌入信息的不可見(jiàn)性,還可以刪除嵌入信息,完全重建原始文檔。被引頻次排名第3 位的文獻(xiàn)[24]首次采用循環(huán)神經(jīng)網(wǎng)絡(luò)自動(dòng)生成含密載體,創(chuàng)造了生成式文本無(wú)載體信息隱藏方法。被引頻次排名第4 和第6位的文獻(xiàn)[32][33]為同一作者,其核心思想是采用壓縮編碼方法將私密信息隱藏在由自然文本組成的文本庫(kù)中,構(gòu)造并使用隱藏密鑰以提高安全性。被引頻次排名第5 位的文獻(xiàn)[34]創(chuàng)新性地將敏感的醫(yī)療診斷信息隱藏在自由文本中,以加強(qiáng)對(duì)個(gè)人隱私的保護(hù)。上述文獻(xiàn)之所以高被引,主要原因是每篇文獻(xiàn)都從信息隱藏的核心技術(shù)和主要應(yīng)用出發(fā),從不同角度創(chuàng)新了隱藏思路,各自代表一種新的文本信息隱藏研究與應(yīng)用方向,對(duì)文本無(wú)載體信息隱藏方法的發(fā)展起到了引領(lǐng)作用。

      對(duì)該領(lǐng)域作者進(jìn)行共現(xiàn)分析得到如圖6 所示的合作網(wǎng)絡(luò)圖譜,圖中共包含201 個(gè)網(wǎng)絡(luò)節(jié)點(diǎn),345 條連線,網(wǎng)絡(luò)密度為0.008 8,說(shuō)明作者的整體分布比較分散。其中,中心性強(qiáng)且合作關(guān)系較為緊密的包括以黃永峰、楊忠良為中心組成的研究團(tuán)隊(duì),孫星明、吳玉磊等組成的研究團(tuán)隊(duì),李千目和Milad Taleby Ahvanooey 組成的研究團(tuán)隊(duì),他們?cè)谠擃I(lǐng)域的研究成果較多,學(xué)術(shù)影響力也較大,貢獻(xiàn)突出。

      Table 2 Highly cited article information表2 高被引文獻(xiàn)信息

      4 熱點(diǎn)與前沿分析

      4.1 研究熱點(diǎn)分析

      關(guān)鍵詞是對(duì)文獻(xiàn)主題的高度概括,反映了主要研究?jī)?nèi)容和觀點(diǎn),對(duì)一定時(shí)間內(nèi)相似文獻(xiàn)的關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析,可體現(xiàn)該段時(shí)間內(nèi)相關(guān)領(lǐng)域的研究熱點(diǎn)。圖7 為對(duì)200 篇文本信息隱藏主題文獻(xiàn)的295 個(gè)關(guān)鍵詞進(jìn)行共現(xiàn)分析的結(jié)果,其網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)為292,連線數(shù)量為680,網(wǎng)絡(luò)密度為0.016,說(shuō)明聚類效果較好。表3 為以關(guān)鍵詞出現(xiàn)的頻次和中心度為依據(jù)對(duì)其進(jìn)行排名的結(jié)果(取前8位)。

      分析圖7 和表3 可知,在所有關(guān)鍵詞中,無(wú)載體信息隱藏(Coverless Information Hiding)的突現(xiàn)性最強(qiáng),遠(yuǎn)超出其他主題詞,這說(shuō)明它將成為今后信息隱藏領(lǐng)域的主要研究方向。顯著性最高的關(guān)鍵詞為隱馬爾科夫模型(Hidden Markov Model),原因是該模型主要用于時(shí)序數(shù)據(jù)建模,能夠反映自然語(yǔ)言前后字符之間的相關(guān)性,是語(yǔ)音識(shí)別和自然語(yǔ)言處理的主要技術(shù)之一,自然成為文本信息隱藏方法的重要基礎(chǔ)。其次是水?。╓atermarking)和隱寫術(shù)(Steganography),二者屬于信息隱藏的兩大平行分支,它們的主要用途不同,目前水印多應(yīng)用于版權(quán)保護(hù),但技術(shù)方法相似、目的相同。

      Fig.6 Author co-occurrence diagram圖6 作者共現(xiàn)圖

      Fig.7 Keyword co-occurrence analysis圖7 關(guān)鍵詞共現(xiàn)分析

      Table 3 Keyword frequency,centrality表3 關(guān)鍵詞頻次、中心度

      4.2 研究前沿分析

      關(guān)鍵詞突現(xiàn)分析可反映兩方面內(nèi)容,一是通過(guò)某段時(shí)間內(nèi)突現(xiàn)的某一關(guān)鍵詞探測(cè)和了解該段時(shí)間內(nèi)的研究前沿,二是通過(guò)各時(shí)間段內(nèi)不同關(guān)鍵詞的突現(xiàn)揭示研究前沿的演變過(guò)程。圖8 為通過(guò)Citespace Ⅴ探測(cè)的2010-2021 年期間,以文本信息隱藏為主題突現(xiàn)的前17 位關(guān)鍵詞及其影響力大小,按出現(xiàn)時(shí)間排序??梢钥闯?,信息隱藏(Information Hiding)突現(xiàn)時(shí)間較早(2011-2015 年),持續(xù)時(shí)間最長(zhǎng)。其反面技術(shù)分類(Classification)突現(xiàn)時(shí)間晚于正面技術(shù)隱藏,但持續(xù)時(shí)間也較長(zhǎng)(2016-2019 年),這是由于有隱寫技術(shù)就必然會(huì)有應(yīng)對(duì)措施;其次是隱馬爾可夫模型(Hidden Markov Model)在信息隱藏算法中的應(yīng)用,突現(xiàn)時(shí)間為2015-2017 年,強(qiáng)度較大,為1.83。突現(xiàn)強(qiáng)度最大的關(guān)鍵詞為無(wú)載體信息隱藏(Coverless Information Hiding),為2.88,持續(xù)時(shí)間為2017-2019 年,其余依次為無(wú)載體文本信息隱藏(Coverless Text Steganography)、隱寫分析(Text Steganalysis)、隱寫容量(Capacity),突現(xiàn)時(shí)間均為2019-2021年,可見(jiàn)這3 個(gè)分支是信息隱藏領(lǐng)域的重點(diǎn)研究?jī)?nèi)容,也代表了近年來(lái)該領(lǐng)域的研究前沿。

      Fig.8 Keyword emergent graph圖8 關(guān)鍵詞突現(xiàn)圖

      5 研究結(jié)論與分析

      本文借助科學(xué)文獻(xiàn)計(jì)量可視化軟件Citespace 科學(xué)系統(tǒng)地呈現(xiàn)了近年來(lái)文本信息隱藏領(lǐng)域的研究概況、前沿和發(fā)展動(dòng)態(tài),加強(qiáng)并拓展了對(duì)文本信息隱藏技術(shù)的認(rèn)識(shí),得出以下結(jié)論并進(jìn)行分析討論:

      (1)自信息隱藏學(xué)正式誕生后,相關(guān)文獻(xiàn)發(fā)表數(shù)量穩(wěn)定增長(zhǎng),研究機(jī)構(gòu)主要分布在中國(guó)、美國(guó)、英國(guó)和印度,且集中在高校及專業(yè)部門,研究成果和文獻(xiàn)質(zhì)量不斷提升。在2011-2015 年期間,英國(guó)的劍橋大學(xué)等高校在信息隱藏領(lǐng)域的研究成果頗多。然而,自2015 年后,中國(guó)在無(wú)載體信息隱藏研究方面遙遙領(lǐng)先于其他國(guó)家且貢獻(xiàn)突出。以中國(guó)高校為中心培養(yǎng)的研究人員及合作關(guān)系已分布于全球多數(shù)國(guó)家,特別是為亞洲的一些高校培養(yǎng)了中堅(jiān)研究力量,加快了這些國(guó)家在該領(lǐng)域的研究步伐。

      (2)研究前沿代表一個(gè)領(lǐng)域的研究方向,知識(shí)基礎(chǔ)可以進(jìn)一步明晰研究前沿的變革方向。知識(shí)基礎(chǔ)在很大程度上是由科學(xué)文獻(xiàn)的知識(shí)流動(dòng)匯聚而來(lái),通過(guò)對(duì)文本信息隱藏領(lǐng)域的文獻(xiàn)進(jìn)行分析,獲得該領(lǐng)域參考文獻(xiàn)的共被引網(wǎng)絡(luò),進(jìn)而得到該領(lǐng)域的知識(shí)基礎(chǔ)。通過(guò)深度挖掘和分析,本文研究文獻(xiàn)共被引網(wǎng)絡(luò)中典型節(jié)點(diǎn)的主要思想體現(xiàn)在兩個(gè)方面:其一是通過(guò)挖掘構(gòu)成文本的字、詞、句子特征,提煉不同載體實(shí)現(xiàn)隱寫的思想,結(jié)合構(gòu)成文本要素的特征,將已成功應(yīng)用于其他載體的隱藏算法思想遷移到文本載體的信息隱寫上,最大化利用原始文本的冗余隱藏私密信息;其二是利用神經(jīng)網(wǎng)絡(luò)直接構(gòu)建文本生成式隱寫模型,同時(shí)設(shè)計(jì)適合的編碼機(jī)制,高效地將私密信息嵌入在生成的文本中。目前,文本信息隱藏的知識(shí)基礎(chǔ)主要涉及自然語(yǔ)言處理技術(shù)、編碼技術(shù)、基于語(yǔ)言相關(guān)性的生成模型等方面。

      (3)信息隱藏即充分利用載體的冗余度嵌入私密信息,使得嵌入信息與載體渾然一體,掩蓋隱藏的內(nèi)容和行為。因此,文本信息隱藏的關(guān)鍵為解決隱藏信息與自然文本的融合度問(wèn)題,即隱蔽性和安全性問(wèn)題。在滿足安全性的前提下,應(yīng)盡可能提高隱藏容量,這是所有隱藏方法追求的共同目標(biāo)。傳統(tǒng)的修改式文本信息隱藏方法會(huì)或多或少地改變文本自身的屬性和結(jié)構(gòu)而留有痕跡,難以抵抗變換和統(tǒng)計(jì)檢測(cè)。因此,后來(lái)的研究思路轉(zhuǎn)變?yōu)闊o(wú)需修改載體的無(wú)載體信息隱藏,即以私密信息為導(dǎo)向,將私密信息加上隱秘標(biāo)簽,在大量文本數(shù)據(jù)庫(kù)中匹配相應(yīng)的文本或生成含密文本,不對(duì)原有文本進(jìn)行修改。搜索式文本隱藏技術(shù)的關(guān)鍵在于隱秘標(biāo)簽選取和高質(zhì)量標(biāo)簽+私密信息索引庫(kù)構(gòu)建,目的是提高隱藏容量和算法效率。而生成式文本隱藏主要通過(guò)隱藏信息的編碼或映射轉(zhuǎn)換規(guī)則的設(shè)定,以及采用深度學(xué)習(xí)和知識(shí)圖譜技術(shù)構(gòu)建文本生成模型,以生成自然流暢、語(yǔ)義連貫和富有情感的高質(zhì)量文本。

      6 存在的問(wèn)題與解決方法

      (1)隱藏容量低。相較于圖像、視頻等載體,文本的冗余空間很小,可提供的隱藏空間也小。對(duì)于修改式文本信息隱藏,如果對(duì)文本的格式或內(nèi)容進(jìn)行大量修改以提高隱藏容量,那么隱蔽性便會(huì)降低??尚械慕鉀Q辦法是采用壓縮編碼的方式對(duì)嵌入的信息進(jìn)行壓縮處理,在減小嵌入信息空間的同時(shí)保持一定的隱藏容量。對(duì)于搜索式無(wú)載體文本信息隱藏,由于受定位標(biāo)簽協(xié)議和詞轉(zhuǎn)換協(xié)議的影響,隱藏容量十分受限,其未來(lái)研究重點(diǎn)為定位標(biāo)簽協(xié)議和詞轉(zhuǎn)換協(xié)議的精細(xì)化、簡(jiǎn)約化和隨機(jī)化,在提高隱藏容量的同時(shí)保證安全性。生成式文本信息隱藏的嵌入率受生成文本質(zhì)量的約束,換句話說(shuō),嵌入率的提高會(huì)降低文本生成的質(zhì)量,可能的改進(jìn)方向是優(yōu)化深度學(xué)習(xí)的文本生成語(yǔ)言模型,自適應(yīng)調(diào)整信息嵌入,使生成的文本情感和主題可控。

      (2)魯棒性低。由于文本格式的脆弱性,基于文本格式的信息隱藏均難以抵抗謄寫、重抄、縮放等攻擊手段。其他形式的文本信息隱藏亦容易受到增加、刪除、替換和篡改等攻擊,進(jìn)而導(dǎo)致信息無(wú)法正確提取。對(duì)于受局部攻擊造成信息缺失的問(wèn)題,可以采用數(shù)據(jù)編碼檢驗(yàn)的方法;對(duì)于整體受攻擊引起的信息無(wú)法正確傳輸問(wèn)題,應(yīng)考慮提高隱蔽通信系統(tǒng)的安全性。

      (3)算法通用性不強(qiáng)。目前大多數(shù)文本信息隱藏方法是針對(duì)某些語(yǔ)言的字詞特征或某種文本格式的特征設(shè)計(jì)的專用算法,很難有一個(gè)適用于多種語(yǔ)言、多種格式的隱藏算法,可移植性較低。今后的研究應(yīng)盡可能地融合多種算法的優(yōu)勢(shì),或?qū)⒉煌d體的算法有機(jī)結(jié)合,例如將適用于文本與圖像載體的算法有機(jī)結(jié)合,以提高算法的穩(wěn)健性,使得針對(duì)文本隱藏的攻擊方法失效;亦可將搜索式算法與生成式算法相結(jié)合,提高生成文本的自然度。在隱藏算法通用性方面的突破必然會(huì)促進(jìn)文本信息隱藏領(lǐng)域的快速發(fā)展。

      7 結(jié)語(yǔ)

      本文以文本信息隱藏領(lǐng)域相關(guān)文獻(xiàn)為基礎(chǔ),從其發(fā)文量、作者國(guó)家及研究機(jī)構(gòu)分布、關(guān)鍵詞共現(xiàn)和文獻(xiàn)共被引等方面分析了該領(lǐng)域的知識(shí)基礎(chǔ)、發(fā)展概況、研究熱點(diǎn)變遷和存在的問(wèn)題。研究結(jié)果顯示,近年來(lái),雖然該領(lǐng)域文獻(xiàn)數(shù)量快速增長(zhǎng),但其研究機(jī)構(gòu)仍然集中在高等院校,且機(jī)構(gòu)間合作較少。同時(shí),其研究重點(diǎn)正逐步轉(zhuǎn)向無(wú)載體文本信息隱藏以及對(duì)應(yīng)的隱寫分析技術(shù)。該研究結(jié)果旨在為文本信息隱藏領(lǐng)域的科研工作者提供可借鑒信息,以促進(jìn)文本信息隱藏技術(shù)更好更快發(fā)展。

      猜你喜歡
      載體領(lǐng)域文獻(xiàn)
      創(chuàng)新舉措強(qiáng)載體 為僑服務(wù)加速跑
      Hostile takeovers in China and Japan
      速讀·下旬(2021年11期)2021-10-12 01:10:43
      堅(jiān)持以活動(dòng)為載體有效拓展港澳臺(tái)海外統(tǒng)戰(zhàn)工作
      Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
      大東方(2019年12期)2019-10-20 13:12:49
      領(lǐng)域·對(duì)峙
      青年生活(2019年23期)2019-09-10 12:55:43
      The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
      The Role and Significant of Professional Ethics in Accounting and Auditing
      商情(2017年1期)2017-03-22 16:56:36
      TiO_2包覆Al_2O_3載體的制備及表征
      新常態(tài)下推動(dòng)多層次多領(lǐng)域依法治理初探
      肯定與質(zhì)疑:“慕課”在基礎(chǔ)教育領(lǐng)域的應(yīng)用
      九寨沟县| 枝江市| 金秀| 梅州市| 金华市| 秦安县| 衡山县| 彰武县| 和田市| 连城县| 普格县| 吴忠市| 南通市| 阿拉尔市| 泾川县| 崇信县| 信丰县| 嘉兴市| 鄂州市| 措美县| 鹿泉市| 永嘉县| 明星| 康保县| 浙江省| 连云港市| 临清市| 寻乌县| 华安县| 得荣县| 安福县| 启东市| 泰和县| 鄂伦春自治旗| 阿拉尔市| 鲁山县| 丹江口市| 伊通| 定州市| 巧家县| 丁青县|