Tri-BERT-SENet：融合多特征的惡意網(wǎng)頁(yè)識(shí)別

2023-04-19 05:19:02楊立圣羅文華

小型微型計(jì)算機(jī)系統(tǒng) 2023年4期

楊立圣,羅文華

(中國(guó)刑事警察學(xué)院公安信息技術(shù)與情報(bào)學(xué)院,沈陽(yáng) 110035) E-mail：luowenhua770404@126.com

1 引言

隨著互聯(lián)網(wǎng)的飛速發(fā)展以及網(wǎng)絡(luò)應(yīng)用的迅速普及,惡意網(wǎng)頁(yè)給人們的隱私和財(cái)產(chǎn)安全帶來(lái)了嚴(yán)重的威脅.如何準(zhǔn)確識(shí)別惡意網(wǎng)頁(yè),有效避免因惡意網(wǎng)頁(yè)引發(fā)的安全威脅,已成為信息安全領(lǐng)域的重要研究?jī)?nèi)容.經(jīng)典的惡意網(wǎng)站識(shí)別方法是采用黑名單技術(shù),但該技術(shù)具有較大的局限性和滯后性[1],只能識(shí)別已知的惡意網(wǎng)頁(yè),容易引起誤判.隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,基于機(jī)器學(xué)習(xí)的惡意網(wǎng)頁(yè)識(shí)別方法[2]進(jìn)一步被提出,該方法具有一定的泛化能力,比傳統(tǒng)的識(shí)別方法更加有效.但對(duì)于機(jī)器學(xué)習(xí)方法,選擇不同的網(wǎng)頁(yè)特征會(huì)對(duì)分類(lèi)結(jié)果造成較大影響[3],在特征工程階段中特征選取的工作量較大,效率較低,傳統(tǒng)機(jī)器學(xué)習(xí)無(wú)法感知惡意網(wǎng)頁(yè)中文本內(nèi)容的上下文關(guān)系,導(dǎo)致部分特征信息缺失.作為完整網(wǎng)頁(yè)的有機(jī)組成部分, HTML標(biāo)簽、URL地址、網(wǎng)頁(yè)文本在各自層面體現(xiàn)出一定的網(wǎng)頁(yè)特征.傳統(tǒng)惡意網(wǎng)頁(yè)識(shí)別缺乏全局性、系統(tǒng)性考量,沒(méi)有將網(wǎng)頁(yè)作為有機(jī)整體,而是獨(dú)立針對(duì)某一層面特征開(kāi)展研究[4],導(dǎo)致識(shí)別效率和準(zhǔn)確率較低.雖然已有學(xué)者意識(shí)到了割裂研究的不足,并提出的融合特征的思想,但依舊使用的是機(jī)器學(xué)習(xí)算法予以實(shí)現(xiàn),忽視了近年來(lái)深度學(xué)習(xí)的飛速發(fā)展及其優(yōu)越性能.在自然語(yǔ)言處理領(lǐng)域,BERT[5]預(yù)訓(xùn)練模型的出現(xiàn)刷新了眾多自然語(yǔ)言處理領(lǐng)域任務(wù)的性能記錄.BERT的自注意力機(jī)制和雙向Transformer結(jié)構(gòu)使得BERT模型具有上下文感知能力,而且BERT模型經(jīng)過(guò)簡(jiǎn)單微調(diào)就可以完成下游的分類(lèi)任務(wù).研究者們也開(kāi)始對(duì)BERT模型用于惡意網(wǎng)頁(yè)識(shí)別任務(wù)進(jìn)行了探索研究.在計(jì)算機(jī)視覺(jué)領(lǐng)域,SENet[6]贏得了最后一屆ImageNET的圖像識(shí)別冠軍.SENet可以學(xué)習(xí)通道之間的相關(guān)性,按照特征通道的重要程度對(duì)同道進(jìn)行加權(quán).同時(shí)SENet模塊易于實(shí)現(xiàn),很容易融合到現(xiàn)有的網(wǎng)絡(luò)模型中.為此,以BERT和SENet為基礎(chǔ),提出一種融合多特征的Tri-BERT-SENet模型,該模型融合URL特征、HTML特征以及網(wǎng)頁(yè)文本特征,結(jié)合BERT模型的上下文感知能力,將3個(gè)BERT模型的輸出作為3個(gè)通道,使用SENet對(duì)特征通道進(jìn)行加權(quán),最后實(shí)現(xiàn)惡意網(wǎng)頁(yè)識(shí)別任務(wù).

本文創(chuàng)新性地將深度學(xué)習(xí)技術(shù)與多特征融合的思路相結(jié)合,利用不同BERT模型分別處理不同維度特征,嘗試將計(jì)算機(jī)視覺(jué)領(lǐng)域的SENet模型與自然語(yǔ)言處理領(lǐng)域的BERT模型相結(jié)合,以完成特征融合,并實(shí)現(xiàn)惡意網(wǎng)頁(yè)識(shí)別.

2 相關(guān)工作

針對(duì)惡意網(wǎng)頁(yè)識(shí)別問(wèn)題,目前已經(jīng)有研究人員提出了多種惡意網(wǎng)站識(shí)別技術(shù)和方法.Ma J等人以IP信息、WHOIS信息、DNS信息以及URL特征,采用機(jī)器學(xué)習(xí)的方法對(duì)惡意URL進(jìn)行識(shí)別[7].Canali D等人根據(jù)HTML特征、URL和主機(jī)信息等特征,使用樸素貝葉斯、隨機(jī)森林、決策樹(shù)和邏輯回歸分類(lèi)器等機(jī)器學(xué)習(xí)模型進(jìn)行分類(lèi)[8].陳遠(yuǎn)等人采用主成分分析的方法對(duì)惡意網(wǎng)站進(jìn)行多為評(píng)估,并在此基礎(chǔ)上采用隨機(jī)森林對(duì)惡意網(wǎng)站進(jìn)行識(shí)別[9].這些采用傳統(tǒng)機(jī)器學(xué)習(xí)并以URL為主要特征的方法,在特征工程上工作量較大,而且沒(méi)有考慮到URL中的文本上下文關(guān)系,導(dǎo)致URL特征信息丟失.吳海濱使用Word2vec生成詞向量并使用卷積神經(jīng)網(wǎng)絡(luò)抽取特征信息實(shí)現(xiàn)惡意網(wǎng)頁(yè)識(shí)別.該方法考慮到了URL中的詞上下文關(guān)系,并使用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò),提升了根據(jù)URL進(jìn)行惡意網(wǎng)頁(yè)分類(lèi)效果[10],但該方法生成的詞向量是靜態(tài)詞向量,并不能解決一詞多義的問(wèn)題,不能充分地挖掘文本之間的深層次關(guān)系.隨著深度學(xué)習(xí)中自然語(yǔ)言處理技術(shù)的迅速發(fā)展,產(chǎn)生了注意力機(jī)制[11]和BERT預(yù)訓(xùn)練模型,這些新技術(shù)在自然語(yǔ)言處理任務(wù)中的效果相比以往采用Word2Vec靜態(tài)詞向量的模型有所提升.這些模型隨后也應(yīng)用到了以URL為特征的惡意網(wǎng)頁(yè)分類(lèi)任務(wù)中.梁飛提出了一種具有多分組注意力機(jī)制的深度學(xué)習(xí)模型[12],該模型可以更加準(zhǔn)確地表達(dá)URL文本的語(yǔ)義信息,更能準(zhǔn)確完成惡意網(wǎng)頁(yè)的識(shí)別任務(wù),但該方法以URL 作為文本數(shù)據(jù)分類(lèi)的問(wèn)題處理,對(duì)惡意網(wǎng)頁(yè)識(shí)別具有一定的片面性.Devlin J等人于2018年提出了基于大規(guī)模文本的Transformer預(yù)訓(xùn)練模型BERT,BERT模型刷新了11項(xiàng)自然語(yǔ)言任務(wù)的性能記錄.張鳳等人將BERT運(yùn)用在惡意域名檢測(cè)任務(wù)上[13],強(qiáng)化了字符對(duì)于模型的決策能力,提高了模型的檢測(cè)性能,但并未以網(wǎng)頁(yè)文本內(nèi)容為依據(jù)使用BERT模型對(duì)惡意網(wǎng)頁(yè)進(jìn)行識(shí)別.隨著惡意網(wǎng)站的隱蔽性、復(fù)雜性的提升,對(duì)惡意網(wǎng)頁(yè)的識(shí)別僅僅依據(jù)URL及其相關(guān)特征遠(yuǎn)遠(yuǎn)不能滿(mǎn)足現(xiàn)今對(duì)于惡意網(wǎng)頁(yè)識(shí)別的需求[14].魏旭等人提出了融合特征方法[15],但其依舊采用機(jī)器學(xué)習(xí)模型對(duì)惡意網(wǎng)頁(yè)進(jìn)行識(shí)別,難以捕捉特征的深層次信息.馮凱媛等人提出了以傳統(tǒng)網(wǎng)頁(yè)URL、HTML等特征基礎(chǔ)上,融合了網(wǎng)頁(yè)文本特征,以機(jī)器學(xué)習(xí)方法對(duì)惡意網(wǎng)頁(yè)進(jìn)行識(shí)別[16],但傳統(tǒng)機(jī)器學(xué)習(xí)的分類(lèi)方法對(duì)于文本特征方面的向量構(gòu)造,沒(méi)有考慮文本的上下文信息,不能體現(xiàn)出文本中一詞多義的深層次特征,存在一定的信息缺失.

綜合考慮上述問(wèn)題,本文提出了一種基于多特征融合的Tri-BERT-SENet模型對(duì)惡意網(wǎng)頁(yè)進(jìn)行檢測(cè)識(shí)別.

3 特征提取

特征提取主要是針對(duì)可以為識(shí)別惡意網(wǎng)頁(yè)提供依據(jù)的網(wǎng)頁(yè)相關(guān)構(gòu)成要素特征進(jìn)行提取的過(guò)程.可以作為識(shí)別惡意網(wǎng)頁(yè)的特征主要有以下幾種：網(wǎng)頁(yè)HTML特征、URL特征以及網(wǎng)頁(yè)文本內(nèi)容特征.

3.1 網(wǎng)頁(yè)HTML標(biāo)簽特征

HTML特征是基于原始頁(yè)面內(nèi)容的一種統(tǒng)計(jì)信息和HTML代碼解析后得到的結(jié)構(gòu)信息.網(wǎng)頁(yè)HTML中的眾多特征信息可作為判定惡意網(wǎng)頁(yè)的依據(jù),特征信息包括標(biāo)簽的數(shù)量、隱藏元素的數(shù)量、<script>的數(shù)量(包含內(nèi)嵌式與外鏈?zhǔn)?、<meta>標(biāo)簽是否出現(xiàn)、<embed>和<object>標(biāo)簽出現(xiàn)的次數(shù)等.HTML標(biāo)簽往往與惡意網(wǎng)頁(yè)的判定具有較大的相關(guān)性.如：<iframe>標(biāo)簽可以將其他的網(wǎng)頁(yè)內(nèi)嵌于當(dāng)前網(wǎng)頁(yè)中,此標(biāo)簽常用于加載攻擊者指定的惡意網(wǎng)頁(yè).<meta>標(biāo)簽可以實(shí)現(xiàn)也免得自動(dòng)刷新和跳轉(zhuǎn).<script>標(biāo)簽可以插入具有一定功能的腳本代碼.常見(jiàn)的惡意網(wǎng)頁(yè)特征與HTML標(biāo)簽的對(duì)應(yīng)關(guān)系情況如表1所示.</p><p><img src="https://cimg.fx361.com/images/2023/0914/5269ee796c06e53f500d0cb9326aa797712eb9cf.webp"/></p><p>表1 常見(jiàn)的惡意網(wǎng)頁(yè)特征與HTML標(biāo)簽的對(duì)應(yīng)關(guān)系Table 1 Correspondence between common malicious web page features and HTML tags</p><h3>3.2 URL特征</h3><p>統(tǒng)一資源定位符(URL)用于標(biāo)記網(wǎng)絡(luò)中的資源位置.URL的通用形式為：<協(xié)議>：//<主機(jī)>：<端口>/<路徑>.URL的結(jié)構(gòu)和字符串特征可以用來(lái)區(qū)分惡意網(wǎng)頁(yè)與正常網(wǎng)頁(yè),即可以基于URL的“直觀特征”識(shí)別惡意網(wǎng)頁(yè)[17].URL字符串格式與傳統(tǒng)的文本差異較大,傳統(tǒng)文本一般是由自然語(yǔ)言構(gòu)成,包含詞匯、語(yǔ)法以及標(biāo)點(diǎn)符號(hào).URL通常則是由英文字符、數(shù)字以及其他特殊字符組成,有些特殊字符則代表著特殊含義,如“/”代表路徑,“=”代表查詢(xún)的條件.惡意URL與正常URL存在較大差異,惡意 URL中出現(xiàn)特殊符號(hào)的種類(lèi)、數(shù)量及頻率高于正常URL中出現(xiàn)特殊符號(hào)的種類(lèi)、數(shù)量及頻率.可用于判別惡意網(wǎng)頁(yè)的URL句法特征主要有：域名長(zhǎng)度、與原URL是否相關(guān)、存在可疑域名、該URL的頂級(jí)域名、存在可疑的模板樣式、URL中出現(xiàn)的文件名長(zhǎng)度、存在可疑文件名、URL中存在IP地址、存在端口號(hào)等.</p><h3>3.3 網(wǎng)頁(yè)文本內(nèi)容特征</h3><p>網(wǎng)頁(yè)文本內(nèi)容是網(wǎng)頁(yè)的重要組成部分,它傳遞的是自然語(yǔ)言信息.針對(duì)本文所使用的數(shù)據(jù)集進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)惡意網(wǎng)頁(yè)所具有的高頻特征詞如表2所示.</p><p><img src="https://cimg.fx361.com/images/2023/0914/6fe335ca29e74d2525d8040eb0ee3b46a358e9ed.webp"/></p><p>表2 數(shù)據(jù)集中惡意網(wǎng)頁(yè)的高頻特征詞Table 2 High frequency feature words of malicious web pages in dataset</p><p>通過(guò)網(wǎng)頁(yè)文本包含惡意內(nèi)容來(lái)判斷網(wǎng)頁(yè),也是識(shí)別惡意網(wǎng)頁(yè)的一種重要方法.</p><h2>4 Tri-BERT-SENet惡意網(wǎng)頁(yè)識(shí)別模型</h2><p>本文構(gòu)建的Tri-BERT-SENet模型主要由兩部分組成,第1部分為T(mén)ri-BERT層,第2部分為SENet層.BERT是一種優(yōu)秀的自然語(yǔ)言處理模型,該模型考慮了上下文關(guān)系,且解決了一詞多義的向量表示問(wèn)題,可以獲取更深層次的文本特征,只需微調(diào)就能夠?qū)崿F(xiàn)文本分類(lèi),故Tri-BERT層使用3個(gè)相互獨(dú)立的BERT來(lái)實(shí)現(xiàn)分類(lèi)任務(wù),該層的輸出為3個(gè)通道的特征結(jié)果.考慮到HTML標(biāo)簽、URL及網(wǎng)頁(yè)文本內(nèi)容這3個(gè)特征對(duì)預(yù)測(cè)結(jié)果的重要程度是不同的,需要給這3個(gè)特征附加權(quán)重.而SENet可以獲取不同通道的重要程度,提升重要程度大的通道特征,抑制重要性不大的通道特征,滿(mǎn)足為3個(gè)特征自動(dòng)賦予權(quán)重的需求,故在第2部分選用SENet.Tri-BERT-SENet模型結(jié)構(gòu)如圖1所示.</p><p><img src="https://cimg.fx361.com/images/2023/0914/93ec7bbd64d3ecba819af61bfcaaa35b89189bc2.webp"/></p><p>圖1 Tri-BERT-SENet模型結(jié)構(gòu)圖Fig.1 Tri-BERT-SENet structure diagram</p><h3>4.1 Tri-BERT層</h3><p>BERT(Bidirectional Encoder Representation from Transformers)是一種基于雙向Transformers 編碼器的預(yù)訓(xùn)練語(yǔ)言模型.Transformer是BERT預(yù)訓(xùn)練模型的基礎(chǔ).Transformer 是一種序列到序列的模型,最早用于機(jī)器翻譯,Transformer 編碼器具有獨(dú)特的多頭自注意力機(jī)制,采用該機(jī)制可以捕獲上下文的文本依賴(lài)關(guān)系.Transformer 編碼器的結(jié)構(gòu)如圖2所示.</p><p><img src="https://cimg.fx361.com/images/2023/0914/9fe55854e418b74eca910ba563f326849466edbb.webp"/></p><p>圖2 Transformer 編碼器結(jié)構(gòu)圖Fig.2 Transformer encoder structure diagram</p><p>Transformer編碼器的核心部分為多頭自注意力機(jī)制,注意力機(jī)制可以計(jì)算出詞語(yǔ)之間的注意力程度和關(guān)聯(lián)程度.通過(guò)使用3個(gè)不同的權(quán)重矩陣Wq、Wk、Wv將輸入向量分別映射為查詢(xún)向量(Q)、鍵向量(K)和值向量(V),并通過(guò)式(1)計(jì)算出注意力輸出結(jié)果.再通過(guò)式(2)和式(3)拼接計(jì)算再次映射,生成一個(gè)最終的多頭注意力值.</p><p>(1)</p><p>MultiHead(Q,K,V)=Concat(head1,…,headh)Wo</p><p>(2)</p><p>其中：</p><p>(3)</p><p>單個(gè)BERT的結(jié)構(gòu)如圖3所示.單個(gè)BERT由12層編碼層組成,每層的隱藏狀態(tài)維度為768,有12個(gè)自注意力頭.每一層網(wǎng)絡(luò)的第1個(gè)標(biāo)記為[CLS],其對(duì)應(yīng)的輸出向量代表文本的類(lèi)別.Pooler層中的線(xiàn)性層和Tanh激活函數(shù)對(duì)[CLS]的隱藏狀態(tài)進(jìn)行計(jì)算,最后得到768維的輸出向量.</p><p><img src="https://cimg.fx361.com/images/2023/0914/34a32bc8b2bdd6b1a79d93c2163e499b7d78e73f.webp"/></p><p>圖3 BERT模型結(jié)構(gòu)圖Fig.3 BERT structure diagram</p><p>Tri-BERT層由3個(gè)相互獨(dú)立的BERT組成,這3個(gè)BERT分別實(shí)現(xiàn)依據(jù)網(wǎng)頁(yè)HTML標(biāo)簽特征分類(lèi)、依據(jù)URL特征分類(lèi)、依據(jù)網(wǎng)頁(yè)文本內(nèi)容特征分類(lèi).由于這3種特征的文本語(yǔ)言特征不同,采用的BERT預(yù)訓(xùn)練模型也不同.網(wǎng)頁(yè)HTML標(biāo)簽特征分類(lèi)、URL特征分類(lèi)的文本主要是以英文文本為主,這兩個(gè)任務(wù)選用的是BERT-base-cased的預(yù)訓(xùn)練模型,該模型是在龐大的英文語(yǔ)料庫(kù)下進(jìn)行訓(xùn)練的,對(duì)大小寫(xiě)敏感,即該模型認(rèn)為“english”和“English”是不同的.對(duì)以文本內(nèi)容主要為中文的網(wǎng)頁(yè)文本內(nèi)容采用的是Chinese-BERT-wwm[18]預(yù)訓(xùn)練模型,該模型是BERT在中文語(yǔ)言上的升級(jí)版本,更改了訓(xùn)練樣本的生成方式,提高了BERT預(yù)訓(xùn)練模型在中文自然語(yǔ)言處理任務(wù)中的效果.</p><p>在Tri-BERT層中可將這3個(gè)相互獨(dú)立的BERT得到的結(jié)果抽象3個(gè)通道,Tri-BERT層的輸出就是3個(gè)通道的分類(lèi)特征向量.</p><h3>4.2 SENet層</h3><p>SENet(Squeeze-and-Excitation Networks)源于深度學(xué)習(xí)中計(jì)算機(jī)視覺(jué)領(lǐng)域,該網(wǎng)絡(luò)的核心思想是考慮特征通道之間的關(guān)系來(lái)提升性能,即通過(guò)學(xué)習(xí)的方式來(lái)自動(dòng)獲取每個(gè)通道的重要程度,按照重要程度提升有用的特征,抑制對(duì)當(dāng)前任務(wù)用處不大的特征.SENet結(jié)構(gòu)如圖4所示.</p><p><img src="https://cimg.fx361.com/images/2023/0914/f0eb21869d106bba866bb96d84e223856b073f93.webp"/></p><p>圖4 SENet結(jié)構(gòu)圖Fig.4 SENet structure diagram</p><p><img src="https://cimg.fx361.com/images/2023/0914/3ff3823ecec02ff1093c8fa2470a0a989a69ed46.webp"/></p><p>SENet層以SE模塊為基礎(chǔ),將Tri-BERT層中的三通道分類(lèi)特征向量作為該層的輸入,以完成特征融合.SENet的主要步驟如下：</p><p>1)將Tri-BERT層得到的3個(gè)向量進(jìn)行拼接操作得到,如式(4)所示：</p><p>T=Concat(FBERT(i)(Xi))(i=1,2,3)</p><p>(4)</p><p>T為三維張量,是具有3個(gè)通道(C=3)的大小為H×W的特征圖.</p><p>2)T進(jìn)行Sequeeze操作,即對(duì)T中每個(gè)通道的向量進(jìn)行全局平均池化操作,獲得每個(gè)通道對(duì)應(yīng)的全局信息.</p><p>(5)</p><p>3)進(jìn)行Excitation操作,將上一步得到的z通過(guò)一個(gè)全連接層,即用W1乘以z,再將得到結(jié)果輸入到ReLU激活函數(shù)中,隨后在通過(guò)一個(gè)全連接層,即再乘以W2,最后再通過(guò)Sigmoid激活函數(shù).</p><p>s=Fex(z,W)=σ(g(z,W))=σ(W2δ(W1z))</p><p>(6)</p><p>其中δ代表ReLU激活函數(shù),σ代表Sigmoid激活函數(shù),W1的維度為(C×r)×C,W2的維度為C×(C×r),這里的r為縮放參數(shù),本模型中r取2.</p><p><img src="https://cimg.fx361.com/images/2023/0914/485929e8c8d0e7e39f8a4f91fccf7ca1ae98bd26.webp"/></p><p>(7)</p><p><img src="https://cimg.fx361.com/images/2023/0914/15671cfe83aba325de4425fc536c992c595ba1c1.webp"/></p><p>(8)</p><p>通過(guò)上述步驟,SENet將3個(gè)BERT對(duì)于HTML標(biāo)簽、URL及網(wǎng)頁(yè)文本內(nèi)容特征的輸出完成了權(quán)重賦值,將賦權(quán)重的特征再經(jīng)過(guò)全連接層和Softmax函數(shù)后得到網(wǎng)頁(yè)的識(shí)別結(jié)果.</p><h2>5 實(shí)驗(yàn)結(jié)果與分析</h2><h3>5.1 數(shù)據(jù)來(lái)源及處理</h3><p>實(shí)驗(yàn)數(shù)據(jù)集為2017中國(guó)網(wǎng)絡(luò)安全技術(shù)對(duì)抗賽《惡意網(wǎng)頁(yè)分析》賽題的樣本數(shù)據(jù)集,原始數(shù)據(jù)集中包含有正常網(wǎng)頁(yè)、仿冒網(wǎng)頁(yè)、被黑網(wǎng)頁(yè)和混淆網(wǎng)頁(yè)的源代碼.訓(xùn)練數(shù)據(jù)集、測(cè)試數(shù)據(jù)集以HTML源代碼方式提供,其中每個(gè)頁(yè)面保存為一個(gè)文件(txt格式),所有頁(yè)面數(shù)據(jù)放在file1文件夾中.</p><p>樣本數(shù)據(jù)集除提供源文件之外,還提供一個(gè)file_list.txt文件,該文件有兩個(gè)字段,以“,”分割.數(shù)據(jù)集字段名及描述如表3所示.</p><p><img src="https://cimg.fx361.com/images/2023/0914/fba11031677e6efa26651679e6df9572ee387473.webp"/></p><p>表3 數(shù)據(jù)集字段名及描述Table 3 Dataset field name and description</p><p>首先對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理.由于數(shù)據(jù)集中網(wǎng)頁(yè)的文本內(nèi)容的編碼格式不統(tǒng)一,除utf-8,GB2312外,還有ascii,ISO-8859-9,Windows-1254等其它編碼格式.為了保證頁(yè)面內(nèi)容讀取成功,先對(duì)網(wǎng)頁(yè)頁(yè)面的編碼統(tǒng)一轉(zhuǎn)換成utf-8編碼.經(jīng)統(tǒng)計(jì)分析,該數(shù)據(jù)集為不平衡的數(shù)據(jù)集,數(shù)據(jù)集中正常頁(yè)面、被黑頁(yè)面、釣魚(yú)頁(yè)面的數(shù)量如表4所示.</p><p><img src="https://cimg.fx361.com/images/2023/0914/b7fe70b8a5a4b59268615fbcff37b743b94bdb86.webp"/></p><p>表4 數(shù)據(jù)集中正常頁(yè)面、被黑頁(yè)面、釣魚(yú)頁(yè)面的數(shù)量Table 4 Number of normal pages,hacked pages and phishing pages in the dataset</p><p>由于樣本不均衡,采用下采樣對(duì)數(shù)據(jù)進(jìn)行處理,并劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集.當(dāng)網(wǎng)頁(yè)文件名與file_list.txt文件中所記錄的文件名相同時(shí),提取網(wǎng)頁(yè)文件中的文本內(nèi)容(本文取后100個(gè)文本字符)、HTML標(biāo)簽內(nèi)容,并將file_list.txt文件中所記錄的URL及FLAG寫(xiě)入文本文件中.</p><h3>5.2 實(shí)驗(yàn)環(huán)境及參數(shù)設(shè)置</h3><p>本文實(shí)驗(yàn)采用物理主機(jī)連接云服務(wù)器的方式,使用云服務(wù)器運(yùn)行Python腳本.物理主機(jī)使用的集成開(kāi)發(fā)環(huán)境為Pycharm,云服務(wù)器的環(huán)境配置如下：處理器為AMD EPYC 7601 256G 64核,實(shí)際分配8核CPU,顯卡為NVIDIA GeForce RTX 3090,顯存大小為24GB,代碼基于Python3.8,深度學(xué)習(xí)框架主要使用PyTorch 1.12.0+CUDA 11.3版本,運(yùn)行內(nèi)存為256GB,實(shí)際分配64GB.</p><p>本模型分為兩大部分,第1大部分為T(mén)ri-BERT層,將清洗好的數(shù)據(jù)按照網(wǎng)頁(yè)HTML標(biāo)簽特征、URL特征、網(wǎng)頁(yè)文本特征分別輸入3個(gè)BERT模型中,其中網(wǎng)頁(yè)HTML標(biāo)簽特征、URL特征分別輸入到兩個(gè)BERT-base-cased的預(yù)訓(xùn)練模型,網(wǎng)頁(yè)文本特征輸入到Chinese-BERT-wwm預(yù)訓(xùn)練模型.Chinese-BERT-wwm預(yù)訓(xùn)練模型包含12層,768個(gè)隱單元,12個(gè)注意力頭,110M參數(shù),vocab大小為28996.BERT-base-cased預(yù)訓(xùn)練模型包含12層,768個(gè)隱單元,12個(gè)注意力頭,110M參數(shù),vocab大小為21128.BERT模型最大輸入長(zhǎng)度設(shè)為256,超過(guò)這個(gè)長(zhǎng)度的序列會(huì)截?cái)?不足這個(gè)長(zhǎng)度的序列會(huì)填充.在訓(xùn)練過(guò)程中,將BERT模型中的梯度回傳設(shè)置為T(mén)RUE,允許其更新參數(shù),BERT模型中的參數(shù)在原來(lái)參數(shù)的基礎(chǔ)上進(jìn)一步進(jìn)行訓(xùn)練.</p><p>第2大部分為SENet層,經(jīng)全局平局池化后,第1個(gè)全連接層的輸入維度為3,輸出維度為6,后接ReLU激活函數(shù).第2個(gè)全連接層的輸入維度為6,輸出維度為3,后接Sigmoid激活函數(shù).最后再接一個(gè)全連接層,輸入為768×3,輸出維度為2,最后再經(jīng)過(guò)Softmax激活函數(shù).整個(gè)模型中全連接層的權(quán)重采用均值為0,標(biāo)準(zhǔn)差為0.01的正態(tài)分布進(jìn)行初始化.模型訓(xùn)練的優(yōu)化器選用AdamW[19].學(xué)習(xí)率lr設(shè)為2e-5,eps設(shè)為1e-8.損失函數(shù)使用交叉熵?fù)p失函數(shù),batch_size設(shè)置為32.為了使模型具有較好的泛化性能,本實(shí)驗(yàn)使用早停(Early Stopping)技術(shù),即當(dāng)訓(xùn)練的模型在驗(yàn)證集上的表現(xiàn)上升時(shí)保存訓(xùn)練中的模型,否則不保存模型.將早停的patience值設(shè)置為50,即當(dāng)訓(xùn)練的模型在驗(yàn)證集上的表現(xiàn)一直沒(méi)有上升累計(jì)達(dá)50輪次時(shí),結(jié)束訓(xùn)練.</p><h3>5.3 模型評(píng)價(jià)標(biāo)準(zhǔn)</h3><p>模型評(píng)價(jià)指標(biāo)采用4種常用的指標(biāo)：準(zhǔn)確率、精確率、召回率、F1.4種指標(biāo)的計(jì)算方法為：</p><p>(9)</p><p>(10)</p><p>(11)</p><p>(12)</p><h3>5.4 模型效果評(píng)估</h3><p>為了評(píng)估Tri-BERT-SENet模型效果,本文先選擇了不同機(jī)器學(xué)習(xí)算法與BERT模型的效果進(jìn)行對(duì)比[20].在使用機(jī)器學(xué)習(xí)模型的數(shù)據(jù)預(yù)處理方面,對(duì)URL特征以“.”和“-”為依據(jù)對(duì)URL進(jìn)行拆分,去掉了不是關(guān)鍵影響因素的com、cn域名,將拆分后的結(jié)果進(jìn)行詞頻的向量化處理;對(duì)網(wǎng)頁(yè)標(biāo)簽特征去除了HTML語(yǔ)言中標(biāo)簽的“<>”符號(hào),再對(duì)剩下的標(biāo)簽進(jìn)行去重,最后進(jìn)行詞頻向量化處理;對(duì)網(wǎng)頁(yè)文本內(nèi)容特征采用jieba庫(kù)進(jìn)行分詞后進(jìn)行詞頻向量化處理,通過(guò)上述步驟生成了用于訓(xùn)練的向量.</p><p>使用不同機(jī)器學(xué)習(xí)算法與BERT的效果如表5所示.在對(duì)網(wǎng)頁(yè)標(biāo)簽進(jìn)行分類(lèi)及網(wǎng)頁(yè)文本內(nèi)容進(jìn)行分類(lèi)時(shí),BERT模型優(yōu)于其他機(jī)器學(xué)習(xí)算法,但是在對(duì)URL特征進(jìn)行分類(lèi)時(shí),BERT的效果不如決策樹(shù).由于BERT是建立在Transformer基礎(chǔ)上的模型,具有較強(qiáng)的語(yǔ)言表征能力和特征提取能力.在對(duì)于網(wǎng)頁(yè)文本內(nèi)容分類(lèi)時(shí),BERT模型發(fā)揮其在自然語(yǔ)言處理領(lǐng)域的優(yōu)勢(shì),生成的詞向量?jī)?yōu)于傳統(tǒng)方法生成的詞向量.但對(duì)URL及網(wǎng)頁(yè)標(biāo)簽這些與人類(lèi)語(yǔ)言差距較大的特征,BERT模型總體上講也可以取得不錯(cuò)的效果.但是針對(duì)惡意網(wǎng)頁(yè)的判定,僅依據(jù)一個(gè)維度的特征判定有較大可能誤判,還需特征融合進(jìn)行進(jìn)一步判斷.</p><p><img src="https://cimg.fx361.com/images/2023/0914/baf4ba12bfd1404861e1dba243d7112a829e7cf0.webp"/></p><p>表5 不同機(jī)器學(xué)習(xí)算法與BERT的實(shí)驗(yàn)效果Table 5 Experimental effects of different machine learning algorithms and BERT</p><p>使用BERT對(duì)網(wǎng)頁(yè)標(biāo)簽特征分類(lèi)、對(duì)URL特征分類(lèi)、對(duì)網(wǎng)頁(yè)文本內(nèi)容特征分類(lèi),以及使用多特征融合的Tri-BERT-SENet對(duì)網(wǎng)頁(yè)分類(lèi)實(shí)驗(yàn)結(jié)果見(jiàn)表6.</p><p><img src="https://cimg.fx361.com/images/2023/0914/1b0e6af7f2fa80b443211e5ef970d0bcf20873d3.webp"/></p><p>表6 單特征BERT與Tri-BERT-SENet網(wǎng)頁(yè)分類(lèi)實(shí)驗(yàn)結(jié)果Table 6 Experimental results of single feature BERT and Tri-BERT-SENet web page classification</p><p>從表6中可知,使用網(wǎng)頁(yè)標(biāo)簽特征、URL特征進(jìn)行分類(lèi)時(shí),BERT模型對(duì)正常網(wǎng)頁(yè)的識(shí)別準(zhǔn)確率較高,但對(duì)惡意網(wǎng)頁(yè)的識(shí)別準(zhǔn)確率較低.使用網(wǎng)頁(yè)文本特征時(shí)對(duì)惡意網(wǎng)頁(yè)識(shí)別的準(zhǔn)確率較高,但是對(duì)正常網(wǎng)頁(yè)識(shí)別的準(zhǔn)確率略低于使用網(wǎng)頁(yè)標(biāo)簽特征、URL特征進(jìn)行分類(lèi)時(shí)的準(zhǔn)確率.Tri-BERT-SENet對(duì)3個(gè)通道的特征進(jìn)行了加權(quán),對(duì)于判斷惡意網(wǎng)頁(yè)和正常網(wǎng)頁(yè)的準(zhǔn)確率來(lái)說(shuō)差距不大.從整體的準(zhǔn)確率來(lái)看,BERT對(duì)網(wǎng)頁(yè)標(biāo)簽特征分類(lèi)準(zhǔn)確率、對(duì)URL特征分類(lèi)準(zhǔn)確率、對(duì)網(wǎng)頁(yè)文本內(nèi)容特征分類(lèi)準(zhǔn)確率分別為0.822、0.903、0.887.融合了網(wǎng)頁(yè)標(biāo)簽特征、網(wǎng)頁(yè)標(biāo)簽特征、網(wǎng)頁(yè)文本內(nèi)容特征的Tri-BERT-SENet模型的分類(lèi)準(zhǔn)確率為0.951,優(yōu)于BERT模型單獨(dú)以網(wǎng)頁(yè)標(biāo)簽特征、網(wǎng)頁(yè)標(biāo)簽特征、網(wǎng)頁(yè)文本內(nèi)容特征作為分類(lèi)依據(jù)的分類(lèi)效果.</p><h2>6 結(jié)束語(yǔ)</h2><p>本文提出了一種基于多特征融合Tri-BERT-SENet的網(wǎng)絡(luò)模型,在對(duì)惡意網(wǎng)頁(yè)識(shí)別上可以得到更高的準(zhǔn)確率.該模型結(jié)合了BERT預(yù)訓(xùn)練模型在自然語(yǔ)言處理上的巨大優(yōu)勢(shì)以及SENet獲取不同特征通道的重要程度,并按照重要程度對(duì)特征通道進(jìn)行分配權(quán)重的特點(diǎn),融合了網(wǎng)頁(yè)標(biāo)簽特征、URL特征、網(wǎng)頁(yè)文本內(nèi)容特征3種特征作為惡意網(wǎng)站分類(lèi)的依據(jù),使得識(shí)別更加有效率.但BERT是一種深層神經(jīng)網(wǎng)絡(luò),最后一層的輸出會(huì)有一部分信息缺失[21].本文提出的模型是對(duì)BERT的最后一層輸出結(jié)果利用SENet進(jìn)行特征融合,沒(méi)有考慮BERT隱藏層中各特征之間的聯(lián)系,下一步計(jì)劃在BERT隱藏層使用SENet進(jìn)行特征融合,發(fā)掘特征之間的更深層次聯(lián)系,以獲取更高的檢測(cè)效率和準(zhǔn)確性.</p></p> <div id="j5i0abt0b" class="article_love"> <div id="j5i0abt0b" class="title">猜你喜歡</div> <div id="j5i0abt0b" class="article_love_keyword"><span><a href="/tags/1/a/13632242e768056d/1.html" target="_blank">網(wǎng)頁(yè)</a></span><span><a href="/tags/1/d/2f66aa86e2aa1c1e/1.html" target="_blank">標(biāo)簽</a></span><span><a href="/tags/3/7/b98d7aec3213da88/1.html" target="_blank">準(zhǔn)確率</a></span></div> <div id="j5i0abt0b" class="article_love_news"><dd><a class="txt_title" href="/page/2021/0523/10329305.shtml" target="_blank" title="乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析">乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析</a><div id="j5i0abt0b" class="rsorc"><a href="/bk/jkzj/202119.html" class="ly" title="健康之家(2021年19期)">健康之家(2021年19期)</a><span id="j5i0abt0b" class="txt">2021-05-23 11:17:39</span></div></dd><dd><a class="txt_title" href="/page/2021/0513/10309250.shtml" target="_blank" title="不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討">不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討</a><div id="j5i0abt0b" class="rsorc"><a href="/bk/yxslyjk/202127.html" class="ly" title="醫(yī)學(xué)食療與健康(2021年27期)">醫(yī)學(xué)食療與健康(2021年27期)</a><span id="j5i0abt0b" class="txt">2021-05-13 18:46:23</span></div></dd><dd><a class="txt_title" href="/page/2021/0327/12453026.shtml" target="_blank" title="2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析">2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析</a><div id="j5i0abt0b" class="rsorc"><a href="/bk/nykjyxx/20212.html" class="ly" title="農(nóng)業(yè)科技與信息(2021年2期)">農(nóng)業(yè)科技與信息(2021年2期)</a><span id="j5i0abt0b" class="txt">2021-03-27 07:27:38</span></div></dd><dd><a class="txt_title" href="/page/2018/0830/12546974.shtml" target="_blank" title="無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP">無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP</a><div id="j5i0abt0b" class="rsorc"><a href="/bk/chemi/201811.html" class="ly" title="車(chē)迷(2018年11期)">車(chē)迷(2018年11期)</a><span id="j5i0abt0b" class="txt">2018-08-30 03:20:32</span></div></dd><dd><a class="txt_title" href="/page/2018/0821/15176856.shtml" target="_blank" title="高速公路車(chē)牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法">高速公路車(chē)牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法</a><div id="j5i0abt0b" class="rsorc"><a href="/bk/zgjtxxh/20185.html" class="ly" title="中國(guó)交通信息化(2018年5期)">中國(guó)交通信息化(2018年5期)</a><span id="j5i0abt0b" class="txt">2018-08-21 03:37:40</span></div></dd><dd><a class="txt_title" href="/page/2018/0804/13411520.shtml" target="_blank" title="基于CSS的網(wǎng)頁(yè)導(dǎo)航欄的設(shè)計(jì)">基于CSS的網(wǎng)頁(yè)導(dǎo)航欄的設(shè)計(jì)</a><div id="j5i0abt0b" class="rsorc"><a href="/bk/dzzz/201810.html" class="ly" title="電子制作(2018年10期)">電子制作(2018年10期)</a><span id="j5i0abt0b" class="txt">2018-08-04 03:24:38</span></div></dd><dd><a class="txt_title" href="/page/2018/0509/11166406.shtml" target="_blank" title="不害怕撕掉標(biāo)簽的人，都活出了真正的漂亮">不害怕撕掉標(biāo)簽的人，都活出了真正的漂亮</a><div id="j5i0abt0b" class="rsorc"><a href="/bk/hxjm/20183.html" class="ly" title="海峽姐妹(2018年3期)">海峽姐妹(2018年3期)</a><span id="j5i0abt0b" class="txt">2018-05-09 08:21:02</span></div></dd><dd><a class="txt_title" href="/page/2017/0517/13868138.shtml" target="_blank" title="基于URL和網(wǎng)頁(yè)類(lèi)型的網(wǎng)頁(yè)信息采集研究">基于URL和網(wǎng)頁(yè)類(lèi)型的網(wǎng)頁(yè)信息采集研究</a><div id="j5i0abt0b" class="rsorc"><a href="/bk/dzzz/20172.html" class="ly" title="電子制作(2017年2期)">電子制作(2017年2期)</a><span id="j5i0abt0b" class="txt">2017-05-17 03:54:56</span></div></dd><dd><a class="txt_title" href="/page/2016/0517/18778952.shtml" target="_blank" title="標(biāo)簽化傷害了誰(shuí)">標(biāo)簽化傷害了誰(shuí)</a><div id="j5i0abt0b" class="rsorc"><a href="/bk/gmyfz/201610.html" class="ly" title="公民與法治(2016年10期)">公民與法治(2016年10期)</a><span id="j5i0abt0b" class="txt">2016-05-17 04:12:58</span></div></dd><dd><a class="txt_title" href="/page/2016/0114/19469913.shtml" target="_blank" title="網(wǎng)頁(yè)制作在英語(yǔ)教學(xué)中的應(yīng)用">網(wǎng)頁(yè)制作在英語(yǔ)教學(xué)中的應(yīng)用</a><div id="j5i0abt0b" class="rsorc"><a href="/bk/dzcs/201518.html" class="ly" title="電子測(cè)試(2015年18期)">電子測(cè)試(2015年18期)</a><span id="j5i0abt0b" class="txt">2016-01-14 01:22:58</span></div></dd></div> </div><div id="j5i0abt0b" class="other_pel mt80"> <p class="fl"><a href="/bk/xxwxjsjxt/20234.html" target="_blank"><img src="https://cimg.fx361.com/images/2023/0914/662bff3f22c53d8df1b1ad8b844bfb99e438dc42.webp" alt=""></a><span id="j5i0abt0b" class="p1"><a href="/bk/xxwxjsjxt/" target="_blank">小型微型計(jì)算機(jī)系統(tǒng)</a></span><span id="j5i0abt0b" class="p2"><a href="/bk/xxwxjsjxt/20234.html" target="_blank">2023年4期</a></span></p> <dl class="fl"><dt>小型微型計(jì)算機(jī)系統(tǒng)的其它文章</dt><dd><a href="/page/2023/0914/22563457.shtml" title="本刊檢索與收錄">本刊檢索與收錄</a></dd><dd><a href="/page/2023/0914/22542302.shtml" title="《小型微型計(jì)算機(jī)系統(tǒng)》編輯部聯(lián)系方式">《小型微型計(jì)算機(jī)系統(tǒng)》編輯部聯(lián)系方式</a></dd><dd><a href="/page/2023/0914/22542299.shtml" title="《小型微型計(jì)算機(jī)系統(tǒng)》征訂啟事">《小型微型計(jì)算機(jī)系統(tǒng)》征訂啟事</a></dd><dd><a href="/page/2023/0914/22541831.shtml" title="《小型微型計(jì)算機(jī)系統(tǒng)》期刊簡(jiǎn)介">《小型微型計(jì)算機(jī)系統(tǒng)》期刊簡(jiǎn)介</a></dd><dd><a href="/page/2023/0914/22541827.shtml" title="《小型微型計(jì)算機(jī)系統(tǒng)》關(guān)于學(xué)術(shù)不端稿件的認(rèn)定標(biāo)準(zhǔn)和處理辦法(修訂稿)">《小型微型計(jì)算機(jī)系統(tǒng)》關(guān)于學(xué)術(shù)不端稿件的認(rèn)定標(biāo)準(zhǔn)和處理辦法(修訂稿)</a></dd><dd><a href="/page/2023/0914/22541822.shtml" title="征稿簡(jiǎn) 則">征稿簡(jiǎn) 則</a></dd></dl> </div></div> </div> </div> <div id="j5i0abt0b" class="sidebarR">  <div id="j5i0abt0b" class="tab01 mb20"><div id="j5i0abt0b" class="tabArrow"></div><div id="j5i0abt0b" class="tabItem"><div id="j5i0abt0b" class="tabTit"><a href="#">雜志排行</a></div> <div id="j5i0abt0b" class="tabCont"><ol><li><p class="row01"><span id="j5i0abt0b" class="topNum">1</span><a href="/bk/sdjy/202410.html" class="row01a">《師道·教研》</a><span id="j5i0abt0b" class="row01_fr"><a href="/bk/sdjy/202410.html">2024年10期</a></span></p></li><li><p class="row01"><span id="j5i0abt0b" class="topNum">2</span><a href="/bk/swyzhsby/202411.html" class="row01a">《思維與智慧·上半月》</a><span id="j5i0abt0b" class="row01_fr"><a href="/bk/swyzhsby/202411.html">2024年11期</a></span></p></li><li><p class="row01"><span id="j5i0abt0b" class="topNum">3</span><a href="/bk/xdgyjjhxxh/20242.html" class="row01a">《現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化》</a><span id="j5i0abt0b" class="row01_fr"><a href="/bk/xdgyjjhxxh/20242.html">2024年2期</a></span></p></li><li><p class="row01"><span id="j5i0abt0b" class="topNum">4</span><a href="/bk/wxxsyb/202410.html" class="row01a">《微型小說(shuō)月報(bào)》</a><span id="j5i0abt0b" class="row01_fr"><a href="/bk/wxxsyb/202410.html">2024年10期</a></span></p></li><li><p class="row01"><span id="j5i0abt0b" class="topNum">5</span><a href="/bk/gywsw/20241.html" class="row01a">《工業(yè)微生物》</a><span id="j5i0abt0b" class="row01_fr"><a href="/bk/gywsw/20241.html">2024年1期</a></span></p></li><li><p class="row01"><span id="j5i0abt0b" class="topNum">6</span><a href="/bk/xl/20249.html" class="row01a">《雪蓮》</a><span id="j5i0abt0b" class="row01_fr"><a href="/bk/xl/20249.html">2024年9期</a></span></p></li><li><p class="row01"><span id="j5i0abt0b" class="topNum">7</span><a href="/bk/sjbl/202421.html" class="row01a">《世界博覽》</a><span id="j5i0abt0b" class="row01_fr"><a href="/bk/sjbl/202421.html">2024年21期</a></span></p></li><li><p class="row01"><span id="j5i0abt0b" class="topNum">8</span><a href="/bk/zxqyglykj/20246.html" class="row01a">《中小企業(yè)管理與科技》</a><span id="j5i0abt0b" class="row01_fr"><a href="/bk/zxqyglykj/20246.html">2024年6期</a></span></p></li><li><p class="row01"><span id="j5i0abt0b" class="topNum">9</span><a href="/bk/xdsp/20244.html" class="row01a">《現(xiàn)代食品》</a><span id="j5i0abt0b" class="row01_fr"><a href="/bk/xdsp/20244.html">2024年4期</a></span></p></li><li><p class="row01"><span id="j5i0abt0b" class="topNum">10</span><a href="/bk/wszyjy/202410.html" class="row01a">《衛(wèi)生職業(yè)教育》</a><span id="j5i0abt0b" class="row01_fr"><a href="/bk/wszyjy/202410.html">2024年10期</a></span></p></li></ol> </div></div> </div> </div> <div id="j5i0abt0b" class="clr"></div> </div> </div>  <div id="j5i0abt0b" class="footer"> <p><a href="/aboutus/index.html">關(guān)于參考網(wǎng)</a></p> </div> <script> if ('serviceWorker' in navigator) { window.onload = function () { navigator.serviceWorker.register('/sw.js'); }; } </script> <script type="text/javascript" src="https://s1.pstatp.com/cdn/expire-1-M/jquery/3.4.0/jquery.min.js"></script> <script type="text/javascript" src="https://s1.pstatp.com/cdn/expire-1-M/sticky-kit/1.1.3/sticky-kit.min.js"></script> <script type="text/javascript"> document.write('<script src="https://js.fx361.com/index.js"><\/script>'); </script> <footer> <div class="friendship-link"> <p>感谢您访问我们的网站，您可能还对以下资源感兴趣：</p> <a href="http://jizihe.com/">久久 中文 有码 字幕</a> <a href="/sitemap.xml">网站地图</a> <div style="position:fixed;left:-9000px;top:-9000px;"><menuitem id="xr9n5"></menuitem><li id="xr9n5"><th id="xr9n5"><nobr id="xr9n5"><pre id="xr9n5"></pre></nobr></th></li><optgroup id="xr9n5"></optgroup><progress id="xr9n5"><meter id="xr9n5"><source id="xr9n5"><wbr id="xr9n5"></wbr></source></meter></progress><menu id="xr9n5"></menu><address id="xr9n5"><code id="xr9n5"></code></address><source id="xr9n5"></source><mark id="xr9n5"><dd id="xr9n5"><dfn id="xr9n5"><tr id="xr9n5"></tr></dfn></dd></mark><progress id="xr9n5"><wbr id="xr9n5"><optgroup id="xr9n5"></optgroup></wbr></progress><strong id="xr9n5"></strong><source id="xr9n5"><wbr id="xr9n5"><strong id="xr9n5"><strike id="xr9n5"></strike></strong></wbr></source><sub id="xr9n5"></sub><abbr id="xr9n5"><rp id="xr9n5"><dfn id="xr9n5"><small id="xr9n5"></small></dfn></rp></abbr><table id="xr9n5"><video id="xr9n5"></video></table><code id="xr9n5"><menu id="xr9n5"></menu></code><span id="xr9n5"><pre id="xr9n5"><fieldset id="xr9n5"><s id="xr9n5"></s></fieldset></pre></span><strong id="xr9n5"></strong><rp id="xr9n5"><blockquote id="xr9n5"><small id="xr9n5"><sup id="xr9n5"></sup></small></blockquote></rp><fieldset id="xr9n5"><strong id="xr9n5"></strong></fieldset><small id="xr9n5"></small><acronym id="xr9n5"><ul id="xr9n5"><address id="xr9n5"><ul id="xr9n5"></ul></address></ul></acronym><wbr id="xr9n5"></wbr><dfn id="xr9n5"><thead id="xr9n5"><legend id="xr9n5"></legend></thead></dfn><ruby id="xr9n5"><rp id="xr9n5"><blockquote id="xr9n5"><samp id="xr9n5"></samp></blockquote></rp></ruby><strong id="xr9n5"></strong><delect id="xr9n5"></delect><var id="xr9n5"><abbr id="xr9n5"></abbr></var><kbd id="xr9n5"></kbd><menu id="xr9n5"><strong id="xr9n5"></strong></menu><pre id="xr9n5"></pre><tbody id="xr9n5"><small id="xr9n5"></small></tbody><button id="xr9n5"><tr id="xr9n5"><em id="xr9n5"></em></tr></button><listing id="xr9n5"><abbr id="xr9n5"><tr id="xr9n5"><em id="xr9n5"></em></tr></abbr></listing><dl id="xr9n5"><pre id="xr9n5"><style id="xr9n5"></style></pre></dl><blockquote id="xr9n5"></blockquote><pre id="xr9n5"></pre><dd id="xr9n5"></dd><pre id="xr9n5"></pre><th id="xr9n5"><style id="xr9n5"><pre id="xr9n5"></pre></style></th><pre id="xr9n5"></pre><ruby id="xr9n5"><rp id="xr9n5"><blockquote id="xr9n5"><center id="xr9n5"></center></blockquote></rp></ruby><dd id="xr9n5"></dd><legend id="xr9n5"></legend><output id="xr9n5"></output><em id="xr9n5"></em><pre id="xr9n5"></pre><ins id="xr9n5"></ins><strike id="xr9n5"><i id="xr9n5"></i></strike><label id="xr9n5"><strong id="xr9n5"><tbody id="xr9n5"><noscript id="xr9n5"></noscript></tbody></strong></label><listing id="xr9n5"><abbr id="xr9n5"><tr id="xr9n5"><noframes id="xr9n5"></noframes></tr></abbr></listing> <i id="xr9n5"><optgroup id="xr9n5"><bdo id="xr9n5"></bdo></optgroup></i><dl id="xr9n5"></dl><progress id="xr9n5"></progress><u id="xr9n5"><acronym id="xr9n5"><ul id="xr9n5"><label id="xr9n5"></label></ul></acronym></u><tbody id="xr9n5"><tr id="xr9n5"><strike id="xr9n5"><p id="xr9n5"></p></strike></tr></tbody><b id="xr9n5"></b><abbr id="xr9n5"></abbr><strong id="xr9n5"></strong><code id="xr9n5"></code><meter id="xr9n5"><progress id="xr9n5"></progress></meter><rt id="xr9n5"><strong id="xr9n5"><style id="xr9n5"></style></strong></rt><form id="xr9n5"></form><legend id="xr9n5"></legend><ul id="xr9n5"></ul><div id="xr9n5"><legend id="xr9n5"><s id="xr9n5"><object id="xr9n5"></object></s></legend></div><dfn id="xr9n5"><thead id="xr9n5"><pre id="xr9n5"></pre></thead></dfn><source id="xr9n5"></source><nobr id="xr9n5"><listing id="xr9n5"><label id="xr9n5"></label></listing></nobr><option id="xr9n5"><ins id="xr9n5"><tt id="xr9n5"><em id="xr9n5"></em></tt></ins></option><nobr id="xr9n5"></nobr><optgroup id="xr9n5"></optgroup><form id="xr9n5"><pre id="xr9n5"></pre></form><em id="xr9n5"></em><meter id="xr9n5"><tbody id="xr9n5"><dfn id="xr9n5"></dfn></tbody></meter><label id="xr9n5"></label><listing id="xr9n5"><abbr id="xr9n5"><tr id="xr9n5"><em id="xr9n5"></em></tr></abbr></listing><strong id="xr9n5"></strong><tbody id="xr9n5"></tbody><ins id="xr9n5"><xmp id="xr9n5"></xmp></ins><sup id="xr9n5"></sup><pre id="xr9n5"></pre><form id="xr9n5"><big id="xr9n5"><source id="xr9n5"></source></big></form><optgroup id="xr9n5"><track id="xr9n5"><video id="xr9n5"></video></track></optgroup><code id="xr9n5"><optgroup id="xr9n5"></optgroup></code><blockquote id="xr9n5"><acronym id="xr9n5"><pre id="xr9n5"></pre></acronym></blockquote><strike id="xr9n5"><i id="xr9n5"></i></strike><tbody id="xr9n5"></tbody><pre id="xr9n5"><button id="xr9n5"></button></pre><sup id="xr9n5"></sup><track id="xr9n5"><ul id="xr9n5"><del id="xr9n5"><ul id="xr9n5"></ul></del></ul></track><form id="xr9n5"><listing id="xr9n5"><kbd id="xr9n5"></kbd></listing></form><em id="xr9n5"><ins id="xr9n5"><output id="xr9n5"></output></ins></em><strike id="xr9n5"></strike><strong id="xr9n5"></strong><table id="xr9n5"></table><source id="xr9n5"></source><optgroup id="xr9n5"></optgroup><ins id="xr9n5"><xmp id="xr9n5"></xmp></ins><sup id="xr9n5"><bdo id="xr9n5"><small id="xr9n5"></small></bdo></sup><pre id="xr9n5"></pre> <style id="xr9n5"><i id="xr9n5"><abbr id="xr9n5"><tbody id="xr9n5"></tbody></abbr></i></style><thead id="xr9n5"></thead><em id="xr9n5"><noframes id="xr9n5"></noframes></em><nobr id="xr9n5"></nobr><s id="xr9n5"><rt id="xr9n5"></rt></s><output id="xr9n5"></output><u id="xr9n5"></u><label id="xr9n5"><strong id="xr9n5"><tbody id="xr9n5"><table id="xr9n5"></table></tbody></strong></label><p id="xr9n5"></p><address id="xr9n5"><strike id="xr9n5"><th id="xr9n5"><td id="xr9n5"></td></th></strike></address><option id="xr9n5"></option><listing id="xr9n5"></listing><strong id="xr9n5"><label id="xr9n5"><noscript id="xr9n5"><optgroup id="xr9n5"></optgroup></noscript></label></strong><input id="xr9n5"></input><th id="xr9n5"><style id="xr9n5"><wbr id="xr9n5"><td id="xr9n5"></td></wbr></style></th><optgroup id="xr9n5"></optgroup><pre id="xr9n5"><blockquote id="xr9n5"><span id="xr9n5"><pre id="xr9n5"></pre></span></blockquote></pre><optgroup id="xr9n5"></optgroup><object id="xr9n5"><input id="xr9n5"><listing id="xr9n5"></listing></input></object><nobr id="xr9n5"><tr id="xr9n5"><kbd id="xr9n5"></kbd></tr></nobr><menu id="xr9n5"><input id="xr9n5"></input></menu><strong id="xr9n5"></strong><noframes id="xr9n5"></noframes><dd id="xr9n5"><ol id="xr9n5"></ol></dd><b id="xr9n5"><video id="xr9n5"></video></b><dd id="xr9n5"></dd><tbody id="xr9n5"></tbody><dfn id="xr9n5"></dfn><optgroup id="xr9n5"><wbr id="xr9n5"></wbr></optgroup><dl id="xr9n5"><ol id="xr9n5"><code id="xr9n5"><menu id="xr9n5"></menu></code></ol></dl><dl id="xr9n5"><th id="xr9n5"><source id="xr9n5"></source></th></dl><b id="xr9n5"><dfn id="xr9n5"></dfn></b><th id="xr9n5"></th><ul id="xr9n5"></ul><source id="xr9n5"></source><dd id="xr9n5"><ol id="xr9n5"><dl id="xr9n5"><bdo id="xr9n5"></bdo></dl></ol></dd><wbr id="xr9n5"><strong id="xr9n5"></strong></wbr><small id="xr9n5"></small><nobr id="xr9n5"><ul id="xr9n5"><option id="xr9n5"></option></ul></nobr><listing id="xr9n5"></listing><dd id="xr9n5"></dd><sup id="xr9n5"></sup><video id="xr9n5"></video><rt id="xr9n5"><strong id="xr9n5"><style id="xr9n5"></style></strong></rt><rp id="xr9n5"><blockquote id="xr9n5"><samp id="xr9n5"><pre id="xr9n5"></pre></samp></blockquote></rp><track id="xr9n5"></track><object id="xr9n5"><nobr id="xr9n5"><strong id="xr9n5"></strong></nobr></object><address id="xr9n5"></address><u id="xr9n5"><dfn id="xr9n5"><center id="xr9n5"></center></dfn></u><sup id="xr9n5"></sup></div> <div class="friend-links"> <a href="http://www.shang588.com/">亚洲国产香蕉在线播放</a> <a href="http://www.fslekai.com/">黄色大片一级黄色大片</a> <a href="http://ntkfqjly.com/">在线观看国产精品第一区免费</a> </div> </div> </footer> <a href="http://m.whw666.com" target="_blank">沁水县</a>| <a href="http://hfrong.com" target="_blank">花垣县</a>| <a href="http://www.liukejia.net" target="_blank">赤壁市</a>| <a href="http://shshimu.com" target="_blank">尼木县</a>| <a href="http://m.huayushe.net" target="_blank">平遥县</a>| <a href="http://m.iotyb.com" target="_blank">文成县</a>| <a href="http://tjjwgc.com" target="_blank">玉山县</a>| <a href="http://www.gufengshang.com" target="_blank">河间市</a>| <a href="http://fourtwoone.com" target="_blank">诸城市</a>| <a href="http://www.hnfyfood.com" target="_blank">当雄县</a>| <a href="http://m.scwant.com" target="_blank">疏勒县</a>| <a href="http://m.ydline.com" target="_blank">西平县</a>| <a href="http://yihai77.com" target="_blank">大悟县</a>| <a href="http://jizihe.com" target="_blank">安多县</a>| <a href="http://www.bxg800.com" target="_blank">四川省</a>| <a href="http://www.qhzzjc.com" target="_blank">绥化市</a>| <a href="http://3to18.com" target="_blank">鹿泉市</a>| <a href="http://m.51vet.com" target="_blank">盐津县</a>| <a href="http://lydsk.com" target="_blank">香港</a>| <a href="http://m.sddrgs.com" target="_blank">琼结县</a>| <a href="http://m.ahnjh.com" target="_blank">若羌县</a>| <a href="http://tgmgs.com" target="_blank">靖江市</a>| <a href="http://www.lumia520.com" target="_blank">武定县</a>| <a href="http://www.ysdyl.com" target="_blank">湘阴县</a>| <a href="http://m.ybhongyu.com" target="_blank">阳泉市</a>| <a href="http://m.zilaohu.com" target="_blank">米脂县</a>| <a href="http://m.zmd10.com" target="_blank">兰溪市</a>| <a href="http://m.jxxyx.com" target="_blank">南投县</a>| <a href="http://sxxczl.com" target="_blank">临湘市</a>| <a href="http://m.qhfk123.com" target="_blank">株洲县</a>| <a href="http://brandortea.com" target="_blank">济源市</a>| <a href="http://jiubaokeji.com" target="_blank">龙游县</a>| <a href="http://www.cclib.net" target="_blank">高密市</a>| <a href="http://www.jizihe.com" target="_blank">渝中区</a>| <a href="http://www.lsgyw.com" target="_blank">乌拉特中旗</a>| <a href="http://zhuangzhijie.com" target="_blank">昭平县</a>| <a href="http://jinnana.com" target="_blank">香河县</a>| <a href="http://aq178.com" target="_blank">临泽县</a>| <a href="http://m.zzlinnuo.com" target="_blank">昌都县</a>| <a href="http://ntkfqjly.com" target="_blank">同德县</a>| <a href="http://www.ahhehao.com" target="_blank">金沙县</a>| <script> (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })(); </script> </body><div id="04yyy" class="pl_css_ganrao" style="display: none;"><del id="04yyy"></del><cite id="04yyy"></cite><pre id="04yyy"></pre><kbd id="04yyy"></kbd><button id="04yyy"><tr id="04yyy"><noframes id="04yyy"></noframes></tr></button><acronym id="04yyy"></acronym><tbody id="04yyy"><nav id="04yyy"><sup id="04yyy"></sup></nav></tbody><rt id="04yyy"></rt><menu id="04yyy"></menu><abbr id="04yyy"></abbr><menu id="04yyy"><fieldset id="04yyy"><kbd id="04yyy"></kbd></fieldset></menu><li id="04yyy"></li><button id="04yyy"><tr id="04yyy"><wbr id="04yyy"></wbr></tr></button><td id="04yyy"><tbody id="04yyy"><tbody id="04yyy"></tbody></tbody></td><th id="04yyy"></th><abbr id="04yyy"></abbr><wbr id="04yyy"><noscript id="04yyy"><dd id="04yyy"></dd></noscript></wbr><li id="04yyy"></li><kbd id="04yyy"></kbd><button id="04yyy"></button><nav id="04yyy"></nav><em id="04yyy"><tbody id="04yyy"><tbody id="04yyy"></tbody></tbody></em><samp id="04yyy"></samp><strong id="04yyy"><del id="04yyy"><button id="04yyy"></button></del></strong><table id="04yyy"><code id="04yyy"><pre id="04yyy"></pre></code></table><noscript id="04yyy"></noscript><samp id="04yyy"><dl id="04yyy"><wbr id="04yyy"></wbr></dl></samp><kbd id="04yyy"></kbd><abbr id="04yyy"><abbr id="04yyy"><tbody id="04yyy"></tbody></abbr></abbr><li id="04yyy"></li><menu id="04yyy"><fieldset id="04yyy"><kbd id="04yyy"></kbd></fieldset></menu><rt id="04yyy"></rt><pre id="04yyy"><strong id="04yyy"><s id="04yyy"></s></strong></pre><dl id="04yyy"></dl><nav id="04yyy"></nav><rt id="04yyy"></rt><noscript id="04yyy"></noscript><pre id="04yyy"><strong id="04yyy"><button id="04yyy"></button></strong></pre><xmp id="04yyy"></xmp><bdo id="04yyy"></bdo><option id="04yyy"><noscript id="04yyy"><dd id="04yyy"></dd></noscript></option><center id="04yyy"><fieldset id="04yyy"><source id="04yyy"></source></fieldset></center><li id="04yyy"><table id="04yyy"><tr id="04yyy"></tr></table></li><option id="04yyy"></option><tr id="04yyy"></tr><menu id="04yyy"></menu><source id="04yyy"></source><cite id="04yyy"></cite><pre id="04yyy"></pre><strong id="04yyy"></strong></div> </html>

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

Tri-BERT-SENet：融合多特征的惡意網(wǎng)頁(yè)識(shí)別

1 引 言

2 相關(guān)工作

3 特征提取

3.1 網(wǎng)頁(yè)HTML標(biāo)簽特征

1 引言