• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于深度學(xué)習(xí)的跨站腳本攻擊檢測

      2022-03-24 08:29:28丁雪川張偉峰方菽蘭鄭黎黎
      技術(shù)與市場 2022年3期
      關(guān)鍵詞:解碼器腳本編碼

      丁雪川,張偉峰,方菽蘭,鄭黎黎

      (1.成都市公安局,四川 成都 610000;2.成都賽博思安科技有限公司,四川 成都 610000)

      0 引言

      由于腳本語言具有靈活多變的特性以及不同瀏覽器之間存在的差異性,導(dǎo)致XSS攻擊的利用方式復(fù)雜多變,傳統(tǒng)的基于規(guī)則匹配的檢測方法難以有效地進(jìn)行XSS攻擊檢測和防御。隨著機(jī)器學(xué)習(xí)的不斷發(fā)展,已經(jīng)有很多研究團(tuán)隊(duì)將機(jī)器學(xué)習(xí)算法引入XSS攻擊檢測中[1-4]。然而傳統(tǒng)的機(jī)器學(xué)習(xí)算法很大程度上依賴于特征的選擇提取,由于人工提取特征具有不可避免的局限性,基于傳統(tǒng)機(jī)器學(xué)習(xí)的檢測方法難以有效地滿足具有混淆、復(fù)雜、多變等特征的XSS攻擊檢測需求。

      深度學(xué)習(xí)算法可以自動化提取攻擊載荷特征,從而避免人為提取特征所不可避免的局限性問題,因此將深度學(xué)習(xí)算法應(yīng)用于Web攻擊檢測必然成為研究的趨勢。針對編碼混淆的XSS攻擊難以檢測的問題,本文構(gòu)建了一個基于深度學(xué)習(xí)的跨站腳本攻擊檢測模型,有效提高XSS攻擊檢測的準(zhǔn)確率。

      1)提出一種基于深度學(xué)習(xí)的跨站腳本攻擊檢測模型。該模型基于Word2Vec提取輸入數(shù)據(jù)保留語義特征的詞向量,并基于LSTM深度神經(jīng)網(wǎng)絡(luò)算法自動提取XSS攻擊的深層次特征,有效地檢測跨站腳本攻擊。此外,針對經(jīng)過編碼混淆的XSS檢測困難的問題,提出循環(huán)解碼器還原其原始形態(tài),進(jìn)一步提升檢測效果。

      2)搭建實(shí)驗(yàn)環(huán)境測試檢測模型,在真實(shí)數(shù)據(jù)集上,通過與傳統(tǒng)機(jī)器學(xué)習(xí)算法和常見安全防護(hù)軟件進(jìn)行對比,實(shí)驗(yàn)結(jié)果驗(yàn)證了檢測模型的有效性。

      1 基于深度學(xué)習(xí)的跨站腳本攻擊檢測方法

      針對編碼混淆的XSS攻擊難以檢測的問題,本文構(gòu)建了一個基于深度學(xué)習(xí)的跨站腳本攻擊檢測模型。首先,根據(jù)XSS常見的編碼混淆技術(shù),提出基于循環(huán)解碼器的數(shù)據(jù)清洗,將經(jīng)過復(fù)雜編碼混淆后的攻擊向量解碼還原其原始數(shù)據(jù)狀態(tài);其次,基于Word2Vec對預(yù)處理后的數(shù)據(jù)進(jìn)行詞向量提取,將輸入數(shù)據(jù)構(gòu)建為含有語義信息的詞向量序列表示;將跨站腳本攻擊檢測轉(zhuǎn)化為二分類,基于LSTM深度學(xué)習(xí)算法構(gòu)架分類模型,根據(jù)惡意樣本和正常樣本訓(xùn)練跨站腳本攻擊分類器作為攻擊檢測模型,實(shí)現(xiàn)跨站腳本檢測。

      1.1 基于循環(huán)解碼器的數(shù)據(jù)清洗

      跨站腳本攻擊常用的編碼混淆技術(shù)包括:URL編碼、HTML編碼、Base64編碼、UTF-7編碼、Unicode編碼等,提出一種循環(huán)解碼器,循環(huán)解碼器對編碼混淆的輸入數(shù)據(jù)進(jìn)行循環(huán)解碼處理,直到解碼后的結(jié)果不再變化為止,從而將經(jīng)過混淆的攻擊向量還原為其原始的數(shù)據(jù)形式。

      1.2 基于Word2Vector的詞向量提取

      深度學(xué)習(xí)檢測算法不能直接處理文本形式的輸入,需要將原始URL請求文本數(shù)據(jù)轉(zhuǎn)化為詞向量的輸入形式。圖1是將文本輸入轉(zhuǎn)換為詞向量的流程圖,主要包括循環(huán)解碼、范化、分詞和量化幾個步驟。

      圖1 詞向量提取流程

      其中,循環(huán)解碼處理過程基于上一小節(jié)中提出的循環(huán)解碼器;范化處理的目的是降低無意義信息對檢測結(jié)果的影響,并減少分詞數(shù)量,主要包括:將函數(shù)輸入?yún)?shù)替換為“param_string”,將URL鏈接替換為“http://website”,數(shù)字替換為“0”;基于跨站腳本攻擊的語法特征,設(shè)計(jì)相應(yīng)的正則表達(dá)式進(jìn)行分詞提取,分詞類別主要包括開始標(biāo)簽、結(jié)束標(biāo)簽、觸發(fā)事件、標(biāo)簽屬性、函數(shù)名稱、腳本類型以及特殊字符等,量化過程則是基于Word2Vec進(jìn)行詞向量表示,從而得到輸入文本的詞向量。

      2 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

      2.1 實(shí)驗(yàn)過程

      基于跨站腳本攻擊惡意樣本數(shù)據(jù)構(gòu)建攻擊詞典,將惡意樣本數(shù)據(jù)分詞后按照詞頻降序排序后取詞。隨著取詞數(shù)量的增長,樣本覆蓋率隨之增加,當(dāng)取詞頻率達(dá)到TOP10000后,對應(yīng)的樣本覆蓋率已經(jīng)達(dá)到93.1%,但隨著取詞數(shù)量的成倍增長,后續(xù)樣本覆蓋率僅少量提升。最終設(shè)定樣本取詞頻為TOP10000的惡意樣本,從而構(gòu)建跨站腳本攻擊的攻擊詞典。

      為了客觀地選擇最優(yōu)的Word2Vec訓(xùn)練參數(shù),對Size、Iter、Window、Nagative參數(shù)進(jìn)行調(diào)優(yōu)實(shí)驗(yàn)。通過控制變量法,每次僅修改一個參數(shù),并對比不同參數(shù)對LSTM檢測模型的召回率、精確率、準(zhǔn)確率和F1值的影響,從而確定Word2Vec訓(xùn)練參數(shù)。

      2.2 實(shí)驗(yàn)結(jié)果與分析

      為了客觀地評估論文提出的檢測模型,將檢測模型與WangRui[18]等人提出的基于AdTree和AdaBoost傳統(tǒng)機(jī)器學(xué)習(xí)算法檢測XSS進(jìn)行對比實(shí)驗(yàn),該方法采用了和本文相同的XSS惡意樣本數(shù)據(jù)集和正常樣本數(shù)據(jù)集,此外還選擇了網(wǎng)站安全狗[19](版本:Apache版V4.0)和XSSChop[20](版本:b6d98f6更新日期:2019-01-25)進(jìn)行對比實(shí)驗(yàn)。

      基于LSTM的跨站腳本攻擊檢測模型的準(zhǔn)確率為99.5%、召回率為97.9%和F1值為98.7%。在精確率、召回率和F1值三個方面的表現(xiàn)均優(yōu)于ADTree和AdaBoost傳統(tǒng)機(jī)器學(xué)習(xí)算法的檢測模型;論文提出的檢測模型在精確率方面雖然略低于網(wǎng)站安全狗和XSSChop,但三者的精確率均超過了99.5%;且論文提出的LSTM檢測模型在召回率和F1值方面都優(yōu)越于網(wǎng)站安全狗和XSSChop。

      綜上所述,論文提出的基于LSTM的檢測模型在精確率、召回率和F1值等方面具有明顯的優(yōu)勢,證明了該模型能夠有效地識別跨站腳本攻擊。

      3 結(jié)語

      針對編碼混淆的XSS攻擊難以檢測的問題,本文構(gòu)建了一個基于深度學(xué)習(xí)的跨站腳本攻擊檢測模型,并證明其有效性。但是該研究仍然存在著一些問題和步驟,進(jìn)一步研究和改進(jìn)內(nèi)容如下。

      1)將檢測模型封裝為應(yīng)用編程接口(API),提供可視化的Web檢測平臺。

      2)深度研究其他跨站腳本攻擊編碼混淆方式,進(jìn)一步豐富循環(huán)解碼器支持解碼的類型,優(yōu)化解碼效率。

      3)擴(kuò)展應(yīng)用場景,將基于深度學(xué)習(xí)的攻擊檢測模型應(yīng)用到其他網(wǎng)絡(luò)安全領(lǐng)域,如SQL注入攻擊檢測和DDOS攻擊檢測等。

      猜你喜歡
      解碼器腳本編碼
      酒駕
      科學(xué)解碼器(一)
      基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達(dá)圖像配準(zhǔn)
      科學(xué)解碼器(二)
      科學(xué)解碼器(三)
      安奇奇與小cool 龍(第二回)
      《全元詩》未編碼疑難字考辨十五則
      子帶編碼在圖像壓縮編碼中的應(yīng)用
      電子制作(2019年22期)2020-01-14 03:16:24
      線圣AudioQuest 發(fā)布第三代Dragonfly Cobalt藍(lán)蜻蜓解碼器
      Genome and healthcare
      沐川县| 怀柔区| 大关县| 东阳市| 克东县| 荣昌县| 礼泉县| 宽甸| 自治县| 江西省| 封开县| 会宁县| 东安县| 探索| 新建县| 怀集县| 临泉县| 揭阳市| 阿尔山市| 麻城市| 乐陵市| 札达县| 宜阳县| 临泽县| 巫溪县| 永靖县| 城固县| 慈利县| 久治县| 岐山县| 广宗县| 龙游县| 安丘市| 平武县| 洪洞县| 新田县| 商水县| 鄄城县| 泸州市| 湄潭县| 襄汾县|