鄧裕立 王軼駿 薛 質(zhì)
(上海交通大學(xué)電子信息與電氣工程學(xué)院 上海 200240)
歐洲網(wǎng)絡(luò)資源協(xié)調(diào)中心(RIPE NCC)于2019年11月25日宣布最后的IPv4地址空間儲備耗盡[1]。一方面是IPv4地址資源的枯竭,另一方面是國內(nèi)外對IPv6部署的大力推進(jìn)?!吨袊鳬Pv6發(fā)展?fàn)顩r》白皮書顯示,截至2019年6月,國內(nèi)的IPv6活躍用戶數(shù)已達(dá)1.30億,基礎(chǔ)電信企業(yè)已分配IPv6地址的用戶數(shù)達(dá)12.07億[2]。根據(jù)Cisco全球IPv6部署統(tǒng)計(jì)數(shù)據(jù)[3],不少國家的IPv6網(wǎng)絡(luò)用戶比例在最近幾年穩(wěn)步上升。
隨著互聯(lián)網(wǎng)向著IPv6逐步過渡,IPv6環(huán)境下的網(wǎng)絡(luò)測繪引起了一些研究者的關(guān)注。然而,長度為128位的IPv6地址相比32位的IPv4地址擁有更加龐大的地址空間,這導(dǎo)致活躍IP地址在網(wǎng)絡(luò)中的分布顯得十分稀疏。如果沿用以往在IPv4網(wǎng)絡(luò)測繪時(shí)所采用的地址空間遍歷掃描方法,不僅無法在可接受的時(shí)間內(nèi)完成掃描工作,還難以發(fā)現(xiàn)活躍的IPv6地址。因此,IPv6環(huán)境下需要合理地選擇掃描的目標(biāo)地址,針對這一問題研究者們提出了多種解決方案:(1) 從各種包含IPv6地址的數(shù)據(jù)集中采集目標(biāo)地址[4-5];(2) 借助DNS特性遍歷DNS反向域從中收集注冊的IPv6地址[6-7];(3) 通過啟發(fā)式算法挖掘IPv6地址集合中可能存在的模式并生成符合相應(yīng)模式的目標(biāo)地址[8-11]。與前兩種方法相比,方法3更加靈活,能夠發(fā)現(xiàn)未被現(xiàn)有數(shù)據(jù)集記錄和不在DNS反向域中的新地址。不過,文獻(xiàn)[12]指出這些啟發(fā)式算法缺乏處理隨機(jī)化地址集合的能力。當(dāng)?shù)刂芳现邪溯^多的沒有明顯模式特征的隨機(jī)地址時(shí),地址集合在整體上將呈現(xiàn)出高隨機(jī)性,算法會受到這類地址的干擾,很難甚至無法發(fā)現(xiàn)集合中其他地址存在的模式。
針對上述問題,本文提出一種從呈現(xiàn)高隨機(jī)化特點(diǎn)的IPv6地址集合中過濾具有潛在模式地址的方法,減少地址集合的隨機(jī)化程度,方便啟發(fā)式算法對地址集合進(jìn)行處理。該方法通過比較地址集合與子集合的信息熵,利用熵值差異發(fā)現(xiàn)涉及地址模式的比特位和相應(yīng)取值,然后根據(jù)這些信息從地址集合中過濾出符合條件的地址。
1.1.1IPv6地址類型
IPv6地址類型可以分為3類:
(1) 單播地址。用來唯一標(biāo)識一個(gè)接口,單播地址具體類別如表1所示。
表1 IPv6單播地址類型
(2) 組播地址。用來標(biāo)識一組接口,發(fā)送到組播地址的數(shù)據(jù)報(bào)文會到達(dá)此地址對應(yīng)所有接口。
(3) 任播地址。用來標(biāo)識一組接口,發(fā)送到任播地址的數(shù)據(jù)報(bào)文會到達(dá)此地址對應(yīng)的某個(gè)接口,該接口是由相應(yīng)路由協(xié)議計(jì)算出的距離源節(jié)點(diǎn)最近的一個(gè)接口。
在IPv6網(wǎng)絡(luò)測繪中,主要關(guān)注IPv6單播地址中的全球單播地址。根據(jù)文檔RFC3587[13],全球單播地址由全球路由前綴、子網(wǎng)ID和接口ID三部分組成。全球路由前綴與子網(wǎng)ID通常由地址前64位表示,用于標(biāo)識一個(gè)網(wǎng)段,接口ID由后64位表示,用于標(biāo)識網(wǎng)段中的一個(gè)設(shè)備。
1.1.2IPv6地址分配策略
這部分介紹IPv6地址分配策略,主要關(guān)注單播地址后64位,即接口ID部分的分配方式。接口ID的分配并沒有統(tǒng)一固定的方式。有些分配方式具有規(guī)律性,能體現(xiàn)出地址模式特征,而另一些分配方式意圖消除模式特征,分配的接口ID呈現(xiàn)很高的隨機(jī)性。
RFC7707[14]總結(jié)了一些具有規(guī)律的接口ID分配方式,如表2所示。Modified EUI-64形式的接口ID分配方式是早期IPv6無狀態(tài)地址自動配置 (SLAAC) 采用的方案,后面幾類接口分配方式屬于人工配置IPv6地址的手段。表2列出的地址模式特征只是一部分,事實(shí)上,正因?yàn)榻涌贗D分配沒有統(tǒng)一的標(biāo)準(zhǔn),網(wǎng)絡(luò)管理員可以靈活地選擇分配方式,因此必然存在許多未公開的地址模式。文獻(xiàn)[11]的實(shí)驗(yàn)也表明網(wǎng)絡(luò)中有大量不在表2之中的地址模式。大部分地址模式的共同點(diǎn)就是地址中某些比特位的值是恒定不變的,這也是目前的啟發(fā)式算法能夠挖掘的主要地址模式。
表2 一些具有規(guī)律的接口ID分配方式
出于安全和隱私保護(hù)方面的考慮,一些不體現(xiàn)任何地址模式特征的接口ID分配方式被提出,它們包括:
(1) 臨時(shí)地址。針對Modified EUI-64分配方法存在的MAC信息泄露、IP追蹤等安全問題,RFC4941[15]對SLAAC進(jìn)行了擴(kuò)展,該方案下SLAAC產(chǎn)生的地址接口ID為隨機(jī)生成,并且會隨著時(shí)間改變。
(2) 恒定且語義模糊的接口ID。Windows系統(tǒng)對RFC4941的一種實(shí)現(xiàn),接口ID隨機(jī)生成,但不會隨著時(shí)間改變,并且該接口ID像Modified EUI-64產(chǎn)生的接口ID一樣,在設(shè)備遷移至另一個(gè)網(wǎng)段時(shí)不會發(fā)生改變。
(3) 穩(wěn)定且語義模糊的接口ID。IETF在RFC 7217[16]中提出的另一種SLAAC方案,接口ID隨機(jī)生成,但不會隨著時(shí)間發(fā)生改變,但當(dāng)設(shè)備遷移至另一個(gè)網(wǎng)段時(shí),接口ID會發(fā)生變化。
(4) DHCPv6隨機(jī)生成。一些DHCPv6服務(wù)器從地址分配范圍內(nèi)按順序分配IPv6地址,導(dǎo)致IPv6地址的生成容易被預(yù)測,因此RFC5157[17]建議DHCPv6服務(wù)器從一個(gè)很大的地址池中隨機(jī)選取地址進(jìn)行分配。
這些隨機(jī)分配接口ID的方式本身就是為防止地址掃描而設(shè)計(jì),即使掌握由這些方式生成的接口ID,也難以從中發(fā)現(xiàn)地址規(guī)律。因此隨機(jī)生成的接口ID對啟發(fā)式算法幾乎不起作用,并且還會對啟發(fā)式算法挖掘地址模式造成干擾,影響算法效果。
熵是對信息不確定度的一種度量,一些研究者借助信息熵來研究IPv6地址結(jié)構(gòu),包括挖掘地址模式[9]、對IPv6網(wǎng)段進(jìn)行分類[7]以及預(yù)測活躍網(wǎng)絡(luò)前綴[18]。對離散隨機(jī)變量X而言,如果X所有可能取值為{x1,x2,…,xn},每種取值出現(xiàn)概率為p(xi)(1≤i≤n) ,那么X的信息熵H(X)為:
(1)
如果將IPv6地址按照m比特為一個(gè)單元進(jìn)行劃分,每個(gè)單元的取值就是[0,2m-1]范圍內(nèi)的整數(shù)。在地址集合中,某一個(gè)單元的熵值Hm(X)計(jì)算方式如下:用各個(gè)取值在地址集中出現(xiàn)頻率f(xi)(1≤i≤2m)替代式(1)中的概率p(xi),并進(jìn)行歸一化處理,如式(2)所示。顯然,熵值Hm(X)的取值范圍為[0,1]。
(2)
這部分介紹過濾方法涉及的一些基本假設(shè):
(1) 地址集合。假設(shè)地址集合中的地址同屬于一個(gè)/64網(wǎng)段。因?yàn)榈刂返哪J教卣骱碗S機(jī)性均體現(xiàn)在接口ID的后64位,所以后文主要關(guān)注地址的接口ID部分。
(2) 地址模式。這里的地址模式僅指地址在某些位取值恒定不變的接口ID分配方式,并且恒定不變的比特位數(shù)目超過一定數(shù)量。根據(jù)地址模式生成的地址可以在非恒定地址位上任意取值。
(3) 隨機(jī)地址。隨機(jī)地址的設(shè)計(jì)初衷是為了消除地址呈現(xiàn)的語義特征,因此假設(shè)隨機(jī)地址的接口ID各個(gè)比特位之間為相互獨(dú)立關(guān)系,并且每個(gè)比特位取0和1的概率是相同的。
在介紹本文提出的過濾方法之前,先就隨機(jī)生成的IPv6地址對地址集合整體隨機(jī)性的影響進(jìn)行說明。假設(shè)地址集合中一部分為具有某一共同地址模式的地址,其余的均是隨機(jī)生成的地址。將地址集合中地址的接口ID部分按照半字節(jié) (即4比特) 進(jìn)行劃分,從左至右依次編號為1,2,…,16。如果地址模式在編號為i(1≤i≤16)的半字節(jié)上保持恒定,那么地址集合在該半字節(jié)上的熵值Hm與隨機(jī)地址所占比例的關(guān)系如圖1所示,熵值通過式(2)計(jì)算得到。
圖1 不同隨機(jī)地址比例下的熵值
由圖1可以看出,隨機(jī)地址對地址集合整體表現(xiàn)出的隨機(jī)性影響十分明顯,當(dāng)隨機(jī)地址比例達(dá)到60%時(shí),半字節(jié)上的熵值Hm就已經(jīng)達(dá)到了0.8,地址集合表現(xiàn)出很高的隨機(jī)性,目前的挖掘地址模式的啟發(fā)式算法面對這種情況很難發(fā)揮出效果。
本文提出的過濾方法基于地址集合與子集合的熵值差異,識別地址模式可能涉及的地址比特位以及比特位的取值,進(jìn)而從地址集合中過濾出符合相應(yīng)模式的地址。下面將從地址集合中只有一種地址模式和有多種地址模式兩種情況進(jìn)行說明。
2.3.1單地址模式
首先將接口ID按照若干個(gè)比特位為一個(gè)單元進(jìn)行劃分,并對劃分后形成的單元從左至右進(jìn)行編號。為方便說明,這里以半字節(jié)進(jìn)行劃分。地址模式表現(xiàn)為在若干個(gè)半字節(jié)上取值恒定,地址集合中一部分地址由某個(gè)地址模式生成,其余均為隨機(jī)生成的地址。將地址集合根據(jù)某個(gè)半字節(jié)上的取值不同劃分為多個(gè)子集合,每個(gè)子集合中的地址在劃分的半字節(jié)上取值相同,得到的子集合有3種類型:(1) 劃分的半字節(jié)不屬于地址模式;(2) 劃分的半字節(jié)屬于地址模式但取值不匹配;(3) 劃分的半字節(jié)屬于地址模式且取值匹配。
地址集合各個(gè)半字節(jié)的熵值根據(jù)式(2)計(jì)算得到。設(shè)地址模式對應(yīng)地址在原始集合所占比例為p,地址集合在與地址模式無關(guān)的半字節(jié)上熵值為HN,與地址模式相關(guān)的半字節(jié)上熵值為HR。原始集合與不同類型的子集合的HN和HR隨比例p的變化曲線分別如圖2、圖3所示,其中origin表示原始集合,type1-type3分別表示3種類型的子集合??梢钥闯?,不同類型的子集合與原始集合的HN差異都不大,熵值差異主要體現(xiàn)HR上。
圖2 與地址模式無關(guān)的半字節(jié)熵值HN隨比例p變化曲線
圖3 與地址模式相關(guān)的半字節(jié)熵值HR隨比例p變化曲線
3種子集合的HR熵值特征分別為:
(1) 劃分的半字節(jié)不屬于地址模式。子集合HR熵值與原始集合的HR熵值幾乎一致,因?yàn)閯澐肿蛹系陌胱止?jié)與地址模式無關(guān),所以子集合中包含地址模式的地址比例相比原始集合不會發(fā)生明顯變化。
(2) 劃分的半字節(jié)屬于地址模式但取值不匹配。子集合的HR熵值始終處于較高水平,因?yàn)樵技铣艘环N地址模式生成的地址外,其余均為隨機(jī)地址。如果劃分子集合的半字節(jié)屬于地址模式,但子集合在該半字節(jié)上的取值與地址模式取值不匹配,就意味著子集合中幾乎全是隨機(jī)地址,因此會表現(xiàn)出較高的熵值。
(3) 劃分的半字節(jié)屬于地址模式且取值匹配。子集合的HR熵值明顯比原始集合的HR熵值小,因?yàn)檫@類子集合包含了所有通過地址模式生成的地址,隨機(jī)地址只在其中占很小一部分,造成HR熵值相比原始集合出現(xiàn)明顯下降。這類子集合與原始集合HR熵值之差與比例p的關(guān)系如圖4所示。由圖4可知,當(dāng)比例p在4%~88%之間時(shí),熵值差均不低于0.2。
圖4 第3類子集合HR熵值差隨比例p變化曲線
綜上,3種子集合與原始集合之間的不同熵值差異特征可以用來判別地址中哪些比特位可能屬于地址模式,并且可以進(jìn)一步確定地址模式在相應(yīng)位置上的取值。
2.3.2多地址模式
如果地址集合中包含多種地址模式,這些地址模式按照當(dāng)前劃分子集合的半字節(jié)可以分為兩類:一類是與劃分子集合的半字節(jié)相關(guān)的地址模式,記為P1型模式;另一類是無關(guān)的地址模式,記為P2型模式。劃分的半字節(jié)不同,分類得到的P1型模式和P2型模式也不同。通過劃分得到的子集合會有以下4種類型:
(1) 劃分的半字節(jié)不屬于任何地址模式。這種情況與單字節(jié)模式的子集合類型(1)類似,由于劃分的半字節(jié)不屬于任何地址模式,子集合中各種地址模式所占比例不會出現(xiàn)明顯變化,從而表現(xiàn)為子集合與原始集合的熵值沒有明顯差異。
(2) 劃分的半字節(jié)屬于地址模式但取值與所有P1型模式都不匹配。該情況與單字節(jié)模式的子集合類型(2)類似。P1型模式地址都不會出現(xiàn)在子集合中,子集合中只有P2型模式地址和隨機(jī)地址,會導(dǎo)致子集合的熵值相比原始集合的熵值更大。
(3) 劃分的半字節(jié)屬于地址模式且取值僅與1個(gè)P1型模式匹配。該情況與單字節(jié)模式的子集合類型(3)類似。匹配的P1型模式地址會全部出現(xiàn)在子集合中,使得子集合中P2型模式地址和隨機(jī)地址的比例減小,造成與所匹配的P1型模式相關(guān)的半字節(jié)上熵值降低。
(4) 劃分的半字節(jié)屬于地址模式且取值與多個(gè)P1型模式匹配。子集合中會包含匹配的多種P1型模式地址,因?yàn)檫@些P1型模式各自相關(guān)的半字節(jié)和半字節(jié)上取值不全相同,可能會導(dǎo)致子集合在各個(gè)與模式相關(guān)的半字節(jié)上熵值減少量降低,特別是當(dāng)這些匹配的P1型模式在集合中所占比例相近的時(shí)候,熵值減少程度會變得十分微小。不過這類子集合不會對地址模式過濾產(chǎn)生明顯影響,因?yàn)橐粋€(gè)地址模式往往會關(guān)聯(lián)地址中多個(gè)半字節(jié),只要不是所有半字節(jié)上都存在(4)這種情況,就可以區(qū)分出該地址模式。
通過以上分析可以認(rèn)為地址模式過濾方法不僅適用于單地址模式的地址集合,也能應(yīng)用于多地址模式的地址集合。
假設(shè)每個(gè)地址的接口ID部分按m比特劃分后形成的單元共有n個(gè),從左至右依次編號為1,2,…,n。過濾方法中涉及3個(gè)臨界值,分別為:
(1) 子集合最小大小min_size。如果劃分得到的子集合大小小于min_size,則跳過該子集合與原始集合的熵值比較。當(dāng)子集合過小時(shí),各個(gè)取值的頻率很難反映出實(shí)際出現(xiàn)的概率,式(2)不再適用。
(2) 地址模式的最小熵值差D。如果原始集合與子集合在某個(gè)地址單元上的熵值之差不小于D,則認(rèn)為該地址單元可能與地址模式相關(guān)。否則認(rèn)為原集合與子集合在該地址單元上熵值差異不大。
(3) 一個(gè)地址模式中包含的最少地址單元數(shù)N。假設(shè)在子集合中,除劃分得到該子集合的地址單元外,有k個(gè)熵值差不小于D的地址單元。只有當(dāng)k+1≥N時(shí),才認(rèn)為這k個(gè)地址單元加上劃分單元可能構(gòu)成一個(gè)地址模式。
過濾方法的流程如圖5所示。
圖5 過濾方法流程
詳細(xì)步驟如下:
(1) 首先計(jì)算原始地址集合在各地址單元上的熵值,然后按照左至右的順序選取劃分的地址單元,根據(jù)每個(gè)地址在該地址單元上的不同取值將原始地址集合劃分為若干個(gè)子集合。
(2) 每次劃分后,對于所有大小不小于min_size的子集合,計(jì)算各自在非劃分地址單元上的熵值,并依次比較每個(gè)子集合與原始集合在非劃分地址單元上的熵值差異。對于一個(gè)子集合,如果熵值差超過D的非劃分地址單元數(shù)目不小于(N-1),則可以構(gòu)建出一個(gè)可能的地址模式。構(gòu)建方法為,在劃分單元上取子集合對應(yīng)的值,在熵值差超過D的非劃分地址單元上取子集合中出現(xiàn)頻率最高的值。一次劃分后,可能有不止一個(gè)子集合構(gòu)建出地址模式。
(3) 如果一次劃分后得到至少一個(gè)可能的地址模式,則對這些地址模式進(jìn)行驗(yàn)證,否則進(jìn)入下一步。驗(yàn)證方法為在原始地址集中查找是否有符合相應(yīng)模式的地址,如果存在就認(rèn)為該地址模式有效。如果所有地址模式均無效,則進(jìn)入下一步;如果至少有一個(gè)地址模式有效,則從原始集合中過濾出所有符合有效地址模式的地址,剩下的地址組成新一輪的原始地址,回到步驟1,尋找地址集合中可能存在的其他地址模式。
(4) 判斷進(jìn)行劃分的地址單元序號是否為n,如果是則過濾過程結(jié)束,否則選擇下一個(gè)地址單元進(jìn)行下一輪劃分,回到步驟(2)。
測試實(shí)驗(yàn)采用模擬方法,包含以下3步:
(1) 地址集合生成。通過模擬程序生成測試的地址集合,由于集合中的地址同屬一個(gè)/64網(wǎng)段,因此只用生成后64位的接口ID部分。集合包含一個(gè)或多個(gè)隨機(jī)選擇的地址模式,除由地址模式生成的地址外,其他地址均是隨機(jī)地址。由地址模式生成的地址在地址模式相關(guān)地址單元上取值恒定,其他地址單元取值隨機(jī),而隨機(jī)地址的每個(gè)地址單元上的取值都是隨機(jī)的。
(2) 地址模式過濾。用過濾方法從生成的地址集合中過濾出可能具有地址模式的地址。
(3) 過濾結(jié)果驗(yàn)證。用生成階段選擇的地址模式對過濾結(jié)果進(jìn)行驗(yàn)證,分別記錄過濾結(jié)果中與生成時(shí)所用模式匹配的地址數(shù)Tm,和不匹配的地址數(shù)Tu。如果生成的地址集合中根據(jù)地址模式生成的地址數(shù)為Tg,則評價(jià)過濾結(jié)果的指標(biāo)為:漏報(bào)數(shù)(Tg-Tm)、漏報(bào)率(Tg-Tm)/Tg、誤報(bào)數(shù)Tu、誤報(bào)率Tu/(Tm+Tu)。
測試情形分為3種:單地址模式、多地址模式且各地址模式比例相同、多地址模式且各地址模式比例不同。每次測試時(shí),生成的地址集合中地址總數(shù)為10 000,劃分的地址單元為半字節(jié),地址模式隨機(jī)確定。過濾方法的3個(gè)臨界值分別設(shè)為如下值:子集合最小大小min_size為30,熵值差閾值D為0.2,模式中最小地址單元數(shù)N為4。
生成地址集合時(shí),地址模式對應(yīng)地址在集合中所占比例p為1%~95%,變化梯度為1%。每種比例下各進(jìn)行3次測試,每次測試隨機(jī)選擇一種地址模式,每個(gè)地址模式涉及的地址單元數(shù)4~10不等。
測試結(jié)果發(fā)現(xiàn),當(dāng)比例p在4%~89%之間時(shí),過濾方法能成功過濾出所有具有模式的地址,漏報(bào)數(shù)和誤報(bào)數(shù)均為0;當(dāng)比例p小于4%或者大于89%時(shí),過濾出地址數(shù)量為0,漏報(bào)率為100%,這個(gè)現(xiàn)象符合圖4曲線,因?yàn)楸壤谶@個(gè)范圍內(nèi)引起的熵值差小于0.2。
將熵值差閾值D降低為0.15,檢出的比例范圍在4%~92%之間,表示對于隨機(jī)化程度極高的地址集合而言進(jìn)一步減少D提升的過濾效果并不顯著,因此可以認(rèn)為0.2是一個(gè)比較合適的熵值差閾值,在單地址模式情形下能夠從大部分高隨機(jī)化地址集合中過濾出與地址模式相關(guān)的地址。
在該項(xiàng)測試中,每次測試隨機(jī)選擇的地址模式數(shù)量為2~10不等,地址模式的總比例在5%與90%之間隨機(jī)選取,各個(gè)地址模式所占比例相同,測試共進(jìn)行200輪。
在200輪測試中,有164輪成功過濾出所有具有模式的地址,其余36輪大部分過濾出的地址數(shù)量為0,少部分能過濾出一部分地址。在這些出現(xiàn)漏報(bào)的輪次中每個(gè)地址模式所占比例均小于4%。200輪測試?yán)锍霈F(xiàn)誤報(bào)的次數(shù)僅有3次,且誤報(bào)數(shù)均為1。因此對于比例相同的多地址模式這一情形,過濾方法的效果和單地址模式情形下一致。
以上兩種測試設(shè)定的條件都比較理想,實(shí)際上多種地址模式所占的比例一般是不同的,因此該項(xiàng)測試在測試2的基礎(chǔ)上,將各個(gè)地址模式所占比例更改為隨機(jī)確定,測試共進(jìn)行200輪。測試結(jié)果的漏報(bào)率統(tǒng)計(jì)如表3所示。
表3 測試結(jié)果漏報(bào)率統(tǒng)計(jì)
在所有出現(xiàn)漏報(bào)的測試輪次中,漏報(bào)的地址模式在地址集合中所占比例基本上小于4%,比例在4%以上的漏報(bào)地址模式僅有3個(gè),它們對應(yīng)的漏報(bào)數(shù)量均在2以下。同時(shí),200輪隨機(jī)測試中,出現(xiàn)誤報(bào)的測試輪次僅有2次,且誤報(bào)數(shù)均為1。所以可以認(rèn)為在多地址模式情形下,該過濾方法能夠準(zhǔn)確過濾出高隨機(jī)化地址集合中所占比例不低于4%的地址模式。
本文提出一種基于熵的從高隨機(jī)化IPv6地址集合中過濾地址模式相關(guān)地址的方法,該方法通過將地址集合劃分為子集合,比較原始集合與子集合的熵值,從而根據(jù)熵值差異識別出地址中可能與模式相關(guān)的部分以及相應(yīng)取值,并以此為條件過濾出相關(guān)地址,達(dá)到降低地址集合隨機(jī)化程度的目的,方便啟發(fā)式算法進(jìn)行具體的地址模式挖掘工作。實(shí)驗(yàn)表明,該方法能夠從大部分高隨機(jī)化地址集合中過濾出與模式相關(guān)的地址,并且?guī)缀醪粫暨x出集合中的隨機(jī)地址,可見該方法具有良好的地址模式過濾能力。