• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種基于樸素貝葉斯的Honeywords區(qū)分攻擊方法

      2022-07-26 03:04:54陳玉雪
      關(guān)鍵詞:口令樸素區(qū)分

      ◆陳玉雪

      一種基于樸素貝葉斯的Honeywords區(qū)分攻擊方法

      ◆陳玉雪

      (四川大學(xué)網(wǎng)絡(luò)空間安全學(xué)院 四川 610225)

      Honeywords是保護(hù)用戶口令、檢測口令文件是否泄露的有效方法,而Honeywords區(qū)分攻擊能準(zhǔn)確評估Honeywords的安全性。現(xiàn)有Honeywords區(qū)分攻擊方法未完全利用口令中的語義信息、攻擊成功率不夠高,針對這兩方面的不足,本文提出基于樸素貝葉斯的Honeywords攻擊方法,記為Bayes-PW:通過改進(jìn)PCFG結(jié)構(gòu),增加拼音、單詞等語義字段,采用樸素貝葉斯分類器進(jìn)行區(qū)分攻擊,為防止分類器過擬合,對數(shù)據(jù)使用“+1”平滑方法。實(shí)驗(yàn)證明,Bayes-PW僅一次猜測的攻擊成功率最高達(dá)到47%,遠(yuǎn)高于Top-PW攻擊和基于PCFG的攻擊,特別是訓(xùn)練集數(shù)據(jù)量較小的情況下,Bayes-PW比Top-PW多猜中測試集15%的真實(shí)口令,比PCFG多猜中11%。

      樸素貝葉斯;Honeywords;Honeywords區(qū)分攻擊;PCFG

      Honeywords是由Juels和Rivest[1]在CCS13上提出的,是一個(gè)簡單的、無需對客戶端服務(wù)器進(jìn)行重大更改的檢測口令文件泄露的方法。Honeywords方案延展蜜罐賬戶思想到所有用戶,口令文件不再僅僅存儲一個(gè)口令,而是存儲由真實(shí)口令和多個(gè)誘餌口令組成的口令列表。即使攻擊者破解出用戶的口令明文,也難以區(qū)分誘餌口令和用戶的真實(shí)口令。如果攻擊者使用誘餌口令嘗試登錄,系統(tǒng)可以感知口令文件泄露,并發(fā)布警報(bào)。

      Honeywords區(qū)分攻擊是一種從用戶候選口令列表中正確選中真實(shí)口令的猜測攻擊[2]。它的基本原理是:選擇用戶最有可能的密碼,構(gòu)建猜測字典,依次進(jìn)行登錄嘗試。Honeywords區(qū)分攻擊能評估Honeywords生成方法的有效性,驗(yàn)證Honeywords能提供多大強(qiáng)度的抵抗力[2]。

      1 相關(guān)工作

      目前Honeywords有以下攻擊方法:Weir等人[3]提出了基于概率上下文無關(guān)文法(PCFG)的口令猜測方法,PCFG將口令劃分為字符組件,統(tǒng)計(jì)字符組件和口令模式的概率分布,但忽略了口令中的語義信息;Narayanan[4]提出了基于Markov鏈模型的口令猜測方法,Markov對口令字符前后關(guān)系進(jìn)行建模,同樣忽略了口令中的語義信息而且會(huì)出現(xiàn)過擬合問題;Wang[2]首次將PCFG和Markov運(yùn)用到Honeywords區(qū)分攻擊中,并提出Top-PW攻擊[2],這是一種簡單的、基于用戶密碼遵循Zipf定律的攻擊方法。Top-PW的基本原理是考慮口令集中概率值最大的Honeyword是最受歡迎的密碼,并猜測它為正確的密碼。Top-PW通過計(jì)算每個(gè)Honeyword在其他真實(shí)密碼數(shù)據(jù)集中的概率分布,根據(jù)概率遞減的順序依次嘗試這些Honeyword,但Top-PW考慮的是口令整體結(jié)構(gòu),忽略了字符組件的前后關(guān)系,同時(shí)攻擊成功率還有待提高。

      針對以上文獻(xiàn)所提方法存在的未利用語義信息以及攻擊成功率不夠高兩方面的不足,本文提出一種基于樸素貝葉斯的Honeywords區(qū)分攻擊方法,該方法將口令中的語音信息擴(kuò)展到PCFG結(jié)構(gòu)中,利用真實(shí)口令集訓(xùn)練樸素貝葉斯分類器,提升攻擊成功率。

      2 基于樸素貝葉斯的Honeywords區(qū)分攻擊方法

      本文提出的區(qū)分攻擊方法主要分為三個(gè)模塊:口令結(jié)構(gòu)劃分模塊、樸素貝葉斯分類算法模塊和區(qū)分攻擊模塊。

      2.1 口令結(jié)構(gòu)劃分模塊

      圖1 口令結(jié)構(gòu)劃分過程示例

      口令集中存在大量語義信息如漢語拼音、英語單詞[6]。為提高Honeywords區(qū)分攻擊的命中率,本文擴(kuò)展PCFG方法,在字母段(L),特殊字符段(S)和數(shù)字段(D)的基礎(chǔ)上,修改字母段(L)的定義,添加拼音段(P)、單詞段(W)。在劃分口令結(jié)構(gòu)時(shí),假設(shè)L,P,W,S和D相互獨(dú)立,針對字母段L,首先匹配是否為拼音或單詞,匹配成功則標(biāo)記為P段或W段,如果匹配不成功,將標(biāo)記為L段。如“chenHello111”被切分為P4:chen,W5:Hello和D3:123,口令模式為P4W5D3。

      訓(xùn)練階段,對每一個(gè)口令進(jìn)行結(jié)構(gòu)劃分,將口令模式加入口令模式表頻率表Σ1,字符組件加入字符組件頻率表Σ2。訓(xùn)練過程如圖1所示。

      2.2 樸素貝葉斯分類算法模塊

      樸素貝葉斯分類算法是基于貝葉斯決策理論的分類方法,無需額外的知識體系,具有分類準(zhǔn)確、速度快,可處理大規(guī)模數(shù)據(jù)等特點(diǎn)[5]。

      Bayes-PW首先對每一個(gè)候選口令sw進(jìn)行口令結(jié)構(gòu)劃分,得到口令模式和字符組件,定義為維口令特征={1,2,…,c},假設(shè)1,2,…,c互斥且構(gòu)成一個(gè)完全事件,它們的概率為(c),=1,2,…,。口令的類別有真實(shí)口令和誘餌口令,表示為={1,2},與1,2,…,c相伴隨出現(xiàn)。sw的分類方法如下所示:

      其中,(T|c)是給定sw屬于類別T的概率,(c|T)是類別T中含有給定口令特征c的概率。

      其中,t是屬于類別T的口令頻數(shù),是口令特征c出現(xiàn)在類別T中的數(shù)量。

      計(jì)算時(shí),有多個(gè)(c|T)相乘,由于因子很小,乘積可能會(huì)下溢出。為解決這一問題,本文采用對乘積取自然對數(shù)的方法:ln(×)=ln()+ln(),即:

      此外,在求解(c|T)時(shí),可能c并沒有在訓(xùn)練集中出現(xiàn)過,但這并不代表測試集中(c|T)=0。因此本文采用“+1”平滑技術(shù):

      2.3 區(qū)分攻擊模塊

      Bayes-PW區(qū)分攻擊的核心思想是依次計(jì)算用戶每個(gè)候選口令(sw)的優(yōu)先權(quán)值Pv,按照Pv遞減的順序依次嘗試這些sw。

      針對單個(gè)用戶的Bayes-PW區(qū)分攻擊算法如算法1所示,輸入為測試集Sweetwords Set,輸出為V,V存儲的是分別進(jìn)行k次區(qū)分攻擊的成功次數(shù)。步驟2-16表示遍歷單個(gè)用戶候選口令列表(Sweetwords)中的口令。步驟3中g(shù)為猜測次數(shù),每猜測一次計(jì)數(shù)加一。步驟4-6表示計(jì)算sw的Pv值,并將其加入數(shù)組PvList中。步驟8表示抽取最大優(yōu)先權(quán)值C。步驟9表示根據(jù)C找到對應(yīng)的sw。步驟11表示使用用戶名IDi和口令sw嘗試登錄。步驟12表示如果登錄成功,成功次數(shù)s加一,然后攻擊下一個(gè)用戶的Sweetwords。

      算法1 區(qū)分攻擊算法

      3 實(shí)驗(yàn)與分析

      3.1 數(shù)據(jù)源

      本文使用六個(gè)泄露的真實(shí)口令集驗(yàn)證攻擊成功率,如表1所示。這些數(shù)據(jù)集可以在網(wǎng)上公開下載,并曾作為許多口令研究的實(shí)驗(yàn)數(shù)據(jù)[6]。為保護(hù)用戶隱私,數(shù)據(jù)集在使用之前,去除用戶名、郵箱等用戶信息。根據(jù)當(dāng)前網(wǎng)站口令規(guī)則,移除包含非ASCII碼字符或空格,以及長度小于6或大于20位的口令。

      表1 口令集基本信息

      數(shù)據(jù)集網(wǎng)站類型語言口令數(shù)量 CSDNProgrammer forumChinese6,380,107 DodonewGaming & E-commerceChinese15,818,288 TianyaSocial forumChinese29,591,213 FaithwritersChristian writingEnglish9,585 MuslimMatchDating SiteEnglish228,479 PhpbbProgrammer forumEnglish230,766

      3.2 實(shí)驗(yàn)方法

      系統(tǒng)為每個(gè)用戶生成個(gè)Honeywords,取Juels和Rivest[1]建議的20。然后,真實(shí)口令和對應(yīng)的Honeywords重新隨機(jī)排列,形成候選口令列表Sweetwords。這些口令以散列形式保存到相應(yīng)用戶的賬戶中。在這個(gè)過程中,假設(shè)攻擊者已成功獲取密碼數(shù)據(jù)并將其全部轉(zhuǎn)換為明文。系統(tǒng)使用的Honeywords生成技術(shù)為“chaffing-by-tail-tweaking”,設(shè)置尾部修改三個(gè)字符,例如當(dāng)真實(shí)口令為,那么產(chǎn)生的Honeywords可以是:.....

      由于Markov方法與PCFG方法攻擊成功率相似,本實(shí)驗(yàn)對比方法為Top-PW和PCFG方法。為了更好地模擬漫步攻擊者并驗(yàn)證語義在不同語言口令集的效果,本文實(shí)驗(yàn)的訓(xùn)練集和測試集選自不同的口令集,并且包含不同語言。本文設(shè)置了6個(gè)攻擊場景,如表2所示,tianya → Dodonew表示訓(xùn)練集為tianya,測試集為Dodonew。

      表2 攻擊場景

      場景口令集 場景1tianya Dodonew 場景2tianya CSDN 場景3tianya muslimMatch 場景4phpbb muslimMatch 場景5phpbb Faithwriters 場景6phpbb CSDN

      3.3 實(shí)驗(yàn)結(jié)果

      本文采用ε-flat和Flatness圖評價(jià)指標(biāo)。

      (2)Wang[2]提出的Flatness圖評價(jià)指標(biāo),旨在測量分辨出真口令的概率隨每個(gè)用戶嘗試登錄次數(shù)的變化趨勢。如圖3所示,曲線上的點(diǎn)(x,y)表示攻擊者在前x次猜測中,猜中的概率為y,且x≤k。

      3.3 1ε-flat

      ε-flat表現(xiàn)的是僅允許對每個(gè)用戶進(jìn)行一次嘗試登錄時(shí),猜中真實(shí)口令的成功率。實(shí)驗(yàn)結(jié)果如圖2所示,Bayes-PW的攻擊成功率總是優(yōu)于Top-PW和PCFG,最高達(dá)到47%。當(dāng)訓(xùn)練集和測試集來自相同的語言時(shí)(場景1,2,4,5),Bayes-PW達(dá)到41%~47%(平均45%)。當(dāng)訓(xùn)練集和測試集來自兩個(gè)不同的語言(場景3,場景6),Bayes-PW也能達(dá)到45%和33%的攻擊成功率,遠(yuǎn)高于其他方法。Bayes-PW在數(shù)據(jù)量較小的情況下仍然有效,在phpbb → CSDN場景下,盡管phpbb訓(xùn)練集數(shù)量非常小,但Bayes-PW的攻擊成功率遠(yuǎn)遠(yuǎn)高于Top-PW的18%和PCFG的22%,達(dá)到33%。

      圖2 -flat實(shí)驗(yàn)結(jié)果

      3.4 Flatness圖

      圖3 tianya → Dodonew

      圖4 tianya → muslimMatch

      圖5 phpbb → muslimMatch

      圖6 phpbb → CSDN

      4 結(jié)束語

      本文利用口令中的語義信息,提出了一種基于樸素貝葉斯的Honeywords攻擊方法,該方法將拼音和單詞擴(kuò)展到PCFG結(jié)構(gòu)中,利用真實(shí)口令集訓(xùn)練貝葉斯分類器,區(qū)分攻擊時(shí)計(jì)算每一個(gè)口令的優(yōu)先權(quán)值,按優(yōu)先權(quán)值降序進(jìn)行區(qū)分攻擊。實(shí)驗(yàn)表明,本文提出的Bayes-PW方法的攻擊成功率優(yōu)于其他方法,特別是當(dāng)訓(xùn)練集和測試集的分布差異較大時(shí),Bayes-PW與Top-PW和PCFG相比具有一定的優(yōu)勢。

      [1]Juels A,Rivest R L.Honeywords:making password-cracking detectable[C]// Acm Sigsac Conference on Computer& Communications Security. ACM,2013.

      [2]Ding W,Cheng H,Ping W,et al. A Security Analysis of Honeywords[C]// NDSS 2018. 2017.

      [3]Weir M,Aggarwal S,De Medeiros B,et al. Password Cracking Using Probabilistic Context-Free Grammars[C]// DBLP. DBLP,2009.

      [4]Narayanan A,Shmatikov V. Fast Dictionary Attacks on Passwords Using Time-Space Tradeoff[C]//Proceedings ofthe 12th ACM Conference on Computer and CommunicationsSecurity,CCS 2005,Alexandria,VA,USA,November 7-11,2005. ACM,2005.

      [5]朱軍,胡文波. 貝葉斯機(jī)器學(xué)習(xí)前沿進(jìn)展綜述[J]. 計(jì)算機(jī)研究與發(fā)展,2015,52(1):16-26.

      [6]王平,汪定,黃欣沂.口令安全研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2016,53(10):2173-2188.

      猜你喜歡
      口令樸素區(qū)分
      區(qū)分“旁”“榜”“傍”
      你能區(qū)分平衡力與相互作用力嗎
      隔離樸素
      樸素的安慰(組詩)
      他是那樣“笨拙”和樸素——30多年后,我們?yōu)槭裁催€需要讀路遙?
      高矮胖瘦
      最神奇最樸素的兩本書
      口 令
      教你區(qū)分功和功率
      好玩的“反口令”游戲
      奉节县| 留坝县| 赤水市| 大庆市| 新民市| 咸丰县| 胶南市| 万州区| 桐梓县| 民权县| 紫金县| 屯昌县| 峨眉山市| 若羌县| 富蕴县| 特克斯县| 高雄市| 抚宁县| 南开区| 城市| 密云县| 二手房| 柏乡县| 宜兰县| 改则县| 纳雍县| 郸城县| 集贤县| 马公市| 聂荣县| 宁南县| 商河县| 游戏| 龙陵县| 团风县| 汾阳市| 康马县| 怀远县| 镇原县| 大田县| 仁布县|