王 建,馮偉森,邱興超,劉 繼,盧 林
WANG Jian1,2,FENG Weisen1,QIU Xingchao1,LIU Ji1,LU Lin1
1.四川大學(xué) 計(jì)算機(jī)學(xué)院,成都 610041
2.四川大學(xué) 錦城學(xué)院 計(jì)算機(jī)科學(xué)與軟件工程系,成都 611731
◎網(wǎng)絡(luò)、通信、安全◎
基于BP模型的KAD網(wǎng)絡(luò)核心節(jié)點(diǎn)識(shí)別算法研究
王 建1,2,馮偉森1,邱興超1,劉 繼1,盧 林1
WANG Jian1,2,FENG Weisen1,QIU Xingchao1,LIU Ji1,LU Lin1
1.四川大學(xué) 計(jì)算機(jī)學(xué)院,成都 610041
2.四川大學(xué) 錦城學(xué)院 計(jì)算機(jī)科學(xué)與軟件工程系,成都 611731
針對在KAD網(wǎng)絡(luò)中核心節(jié)點(diǎn)的識(shí)別問題,提出了一種基于BP模型對節(jié)點(diǎn)重要程度進(jìn)行實(shí)時(shí)判定的方法。結(jié)合KAD網(wǎng)絡(luò)測量的結(jié)果,對網(wǎng)絡(luò)中核心節(jié)點(diǎn)的屬性特征進(jìn)行提取和歸一化處理,獲得了一組可分離度較高特征集合。采用MatLab設(shè)計(jì)相應(yīng)的學(xué)習(xí)算法對BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使結(jié)果收斂于預(yù)定誤差區(qū)間。將完成訓(xùn)練的BP網(wǎng)絡(luò)模型應(yīng)用于對測試節(jié)點(diǎn)的判定,實(shí)驗(yàn)結(jié)果表明該方法可以實(shí)時(shí)地完成核心節(jié)點(diǎn)的判定,并且識(shí)別準(zhǔn)確率可達(dá)到約70%。
反向傳播算法;KAD網(wǎng)絡(luò);核心節(jié)點(diǎn);識(shí)別
網(wǎng)絡(luò)節(jié)點(diǎn)的排序問題是復(fù)雜網(wǎng)絡(luò)中的一個(gè)基本和重要問題,被廣泛應(yīng)用于數(shù)據(jù)挖掘、網(wǎng)絡(luò)分析、網(wǎng)絡(luò)預(yù)測、網(wǎng)絡(luò)安全與控制等領(lǐng)域。隨著復(fù)雜網(wǎng)絡(luò)研究的深入發(fā)現(xiàn),大量真實(shí)的網(wǎng)絡(luò)既不是規(guī)則的,也非完全隨機(jī)的。因此,有效地評估和度量網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性,不但是網(wǎng)絡(luò)數(shù)據(jù)挖掘的首要問題,也是復(fù)雜網(wǎng)絡(luò)、社會(huì)關(guān)系網(wǎng)和互聯(lián)網(wǎng)搜索、系統(tǒng)科學(xué)的研究重點(diǎn)[1]。KAD是P2P技術(shù)歷經(jīng)10年發(fā)展后的新一代DHT網(wǎng)絡(luò)[2],其去中心化、可測量、易擴(kuò)展、高容錯(cuò)性等優(yōu)點(diǎn)使它迅速滲透到文件共享、即時(shí)通訊、分布式存儲(chǔ)、云存儲(chǔ)等領(lǐng)域。這種無中心服務(wù)器的設(shè)計(jì)使得各個(gè)節(jié)點(diǎn)相對平等,既是服務(wù)的提供者,又是服務(wù)的請求者。KAD網(wǎng)絡(luò)的發(fā)展使其并發(fā)用戶已達(dá)到數(shù)百萬級,海量的用戶使得對于網(wǎng)絡(luò)的控制和監(jiān)管變得十分困難。大量網(wǎng)絡(luò)測量實(shí)驗(yàn)表明,DHT網(wǎng)絡(luò)中節(jié)點(diǎn)負(fù)載非均衡性廣泛存在[3-5]??梢詫⒛切┰贙AD網(wǎng)絡(luò)中為其他節(jié)點(diǎn)提供了更多路由服務(wù)或下載服務(wù)的節(jié)點(diǎn)稱為核心(重要或關(guān)鍵)節(jié)點(diǎn)。如果能利用這種非均衡性,發(fā)現(xiàn)和識(shí)別網(wǎng)絡(luò)中發(fā)揮了核心作用的節(jié)點(diǎn),則是對KAD網(wǎng)絡(luò)的監(jiān)督將有著重要的作用。
基于鏈接的節(jié)點(diǎn)排序是網(wǎng)絡(luò)分析中的一個(gè)核心任務(wù),它通過圖中節(jié)點(diǎn)之間鏈接表現(xiàn)出的重要性不同對節(jié)點(diǎn)進(jìn)行排序。目前國內(nèi)外研究者對節(jié)點(diǎn)排序方法有四種典型的方式[6]:一是基于純粹網(wǎng)絡(luò)靜態(tài)參數(shù)指標(biāo)來進(jìn)行衡量節(jié)點(diǎn)的關(guān)鍵程度,常用評價(jià)指標(biāo)有點(diǎn)中心度、凝聚中心度、子圖中心度、網(wǎng)絡(luò)流中心度等等?;趥鹘y(tǒng)的靜態(tài)社會(huì)分析方法有著明顯的缺點(diǎn),它忽略引起網(wǎng)絡(luò)狀態(tài)變化的重要因素[7],從而造成信息缺失問題。例如,不注重個(gè)體之間的連接關(guān)系、相關(guān)個(gè)體之間的相互影響以及隨時(shí)間變化趨勢[8]。二是借鑒圖分割方法中標(biāo)準(zhǔn)來進(jìn)行衡量,即找出圖中的割點(diǎn)作為核心節(jié)點(diǎn),因?yàn)閯h除該節(jié)點(diǎn)后可以將圖割裂為多個(gè)子圖[9]。三是使用搜索引擎中節(jié)點(diǎn)排序的思想來進(jìn)行核心節(jié)點(diǎn)發(fā)現(xiàn)排序,其主要的思想是基于隨機(jī)行走模型[10]。四是使用基于統(tǒng)計(jì)方法或數(shù)據(jù)挖掘的算法,如頻繁項(xiàng)集[11-12]、隱空間模型[13]、兩階聚類等經(jīng)典模型。數(shù)據(jù)挖掘算法中以使用頻繁項(xiàng)集的方法最為典型,但目前這些方法存在著節(jié)點(diǎn)判斷的滯后性這個(gè)明顯的缺點(diǎn),即對于節(jié)點(diǎn)的重要程度的差別需要較大的時(shí)間和空間復(fù)雜度為代價(jià)才能得到,而無法實(shí)時(shí)地對一個(gè)未知節(jié)點(diǎn)進(jìn)行判定。這在一些實(shí)時(shí)性要求較高的應(yīng)用場景下將有著較大的限制。
在KAD網(wǎng)絡(luò)中,核心節(jié)點(diǎn)是指那些對網(wǎng)絡(luò)的基本服務(wù)起著重要作用的節(jié)點(diǎn),它們實(shí)際提供了更多其他節(jié)點(diǎn)的訪問、路由工作,其定義表示如下[14]:
定義2(關(guān)鍵字熱點(diǎn))在任一區(qū)域Zx中,假設(shè)該區(qū)域中節(jié)點(diǎn)的索引Ia,若每個(gè)節(jié)點(diǎn)接受的訪問數(shù)量為Ca。給定一個(gè)關(guān)鍵字訪問次數(shù)閥值c,若Ca>c則稱Ia為一個(gè)關(guān)鍵字熱點(diǎn)。當(dāng)其共有n個(gè)索引時(shí),該節(jié)點(diǎn)的訪問次數(shù)為其所有索引被訪問次數(shù)之和:
定義3(核心節(jié)點(diǎn))在任一區(qū)域Zx中,若節(jié)點(diǎn)A是一個(gè)路由熱點(diǎn),或節(jié)點(diǎn)A是一個(gè)關(guān)鍵字節(jié)點(diǎn),若在給定的時(shí)間T內(nèi),A收到的訪問次數(shù)R大于給定的閥值c,則A為一個(gè)核心節(jié)點(diǎn)。
神經(jīng)網(wǎng)絡(luò)是一個(gè)多學(xué)科交叉領(lǐng)域,它通過模仿人的大腦思維來挖掘海量數(shù)據(jù)背面的潛在規(guī)律,已在各個(gè)領(lǐng)域中得到了廣泛應(yīng)用,并取得了很多重要的成果。采用BP網(wǎng)絡(luò)對當(dāng)前已獲取到的樣本節(jié)點(diǎn)進(jìn)行學(xué)習(xí),期望挖掘出有價(jià)值的規(guī)律,以便對未知節(jié)點(diǎn)進(jìn)行更加實(shí)時(shí)準(zhǔn)確的判定。圖1顯示了使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試的整個(gè)流程,其中關(guān)鍵的環(huán)節(jié)在于樣本特征提取和處理及網(wǎng)絡(luò)訓(xùn)練兩個(gè)步驟。
圖1 樣本數(shù)據(jù)訓(xùn)練流程圖
圖1中特征提取是指根據(jù)訓(xùn)練目標(biāo),從一組特征集合中選取一組最好的子集。為了處理方便,還需對特征數(shù)據(jù)進(jìn)行歸一化預(yù)處理,使其值均在[0,1]區(qū)間內(nèi)變化。下面對KAD中可用的特征屬性進(jìn)行歸納和改進(jìn)。
(1)R′c:返回節(jié)點(diǎn)的有效率
KAD每一次查詢中,若該點(diǎn)不為目標(biāo)節(jié)點(diǎn)時(shí),會(huì)為請求者返回α個(gè)路由表中更靠近的節(jié)點(diǎn)。從KAD路由選擇算法中可看出,當(dāng)鄰居節(jié)點(diǎn)收到請求后,先從對應(yīng)K桶中選出指定數(shù)量的節(jié)點(diǎn),當(dāng)該桶中節(jié)點(diǎn)數(shù)量小于指定數(shù)量時(shí),則從鄰近的K桶中進(jìn)行選取。那么,只要路由表中的節(jié)點(diǎn)總量不小于指定返回的節(jié)點(diǎn)數(shù)量,就一定會(huì)返回指定數(shù)量的節(jié)點(diǎn)。當(dāng)各個(gè)鄰居節(jié)點(diǎn)若在線,每次提供的下一跳路由節(jié)點(diǎn)的數(shù)量均相等。因此,采用數(shù)量計(jì)算并不能使其具有較好地可分離性,這里使用返回節(jié)點(diǎn)的有效率來進(jìn)行衡量,計(jì)算公式如下所示:
其中,Bn表示節(jié)點(diǎn)I返回的下一跳的路由節(jié)點(diǎn)總數(shù),Ln則為當(dāng)前仍在線的節(jié)點(diǎn)數(shù)量。對于Ln值的獲取,可以在鄰居節(jié)點(diǎn)返回信息后,使用Ping操作探測其中仍在線節(jié)點(diǎn)數(shù)量。該值反映了一個(gè)鄰居節(jié)點(diǎn)返回的路由信息中,仍然有效的節(jié)點(diǎn)占所有返回總量的比例。
人像蠶一樣拼命織關(guān)系的網(wǎng),但織成之后,卻又千方百計(jì)逃之夭夭。范堅(jiān)強(qiáng)給了一杭一個(gè)逃離的機(jī)會(huì),可以放下一切,每日枕著書香入眠。一杭成為這間石屋實(shí)質(zhì)上的主人以后,范堅(jiān)強(qiáng)給他送來了書,讓他在漫長的白天與黑夜,不至于孤獨(dú)。但單純的生活結(jié)束了,石屋的門終于打開來。
(2)S′c:平均異或距離
在KAD中以跳數(shù)作為度量依據(jù),并不能準(zhǔn)確地表明節(jié)點(diǎn)之間的距離,這里采用平均異或距離進(jìn)行度量。此值描述了對一個(gè)節(jié)點(diǎn)進(jìn)行詢問后,返回結(jié)果能更接近目標(biāo)節(jié)點(diǎn)的程度,反映了該點(diǎn)在一次查詢過程中所起到的作用。若節(jié)點(diǎn)I共返回n個(gè)路由節(jié)點(diǎn),則節(jié)點(diǎn)I的平均距離值由下列公式計(jì)算得到:
式中,ri代表I的一個(gè)返回節(jié)點(diǎn),s與d分別代表請求節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)。從上式容易看出,當(dāng)返回的距離越大,則表明通過節(jié)點(diǎn)I的查詢后,與目標(biāo)節(jié)點(diǎn)的位置將更接近。
(3)T′t:處理查詢返回時(shí)間
該值越大表明了被查詢節(jié)點(diǎn)處理性能更高。通常將發(fā)出消息和接收消息的時(shí)間間隔作為其往返時(shí)間。為了處理的方便,設(shè)定一個(gè)固定的TTL基數(shù)作為參照物,若小于此值則也近似地認(rèn)為與此值相等,這里將TTL設(shè)定為2 000 ms。則該值由以下公式?jīng)Q定,其中Mt為返回時(shí)間中最大的一個(gè)值,也可設(shè)置一個(gè)固定的較大數(shù)值:
(4)R′i:節(jié)點(diǎn)返回查詢數(shù)量比
該值反映了一個(gè)目標(biāo)節(jié)點(diǎn)返回的文件數(shù)量占所有返回結(jié)果數(shù)量中的比例。采用如下公式進(jìn)行計(jì)算:
其中,Rc表明本次查詢所有節(jié)點(diǎn)返回的文件總和,但該值僅針對有返回結(jié)果的節(jié)點(diǎn)才可適用。由于不能保證測試的節(jié)點(diǎn)均為有存儲(chǔ)結(jié)果返回的節(jié)點(diǎn),因此,需要對經(jīng)過多個(gè)節(jié)點(diǎn)路由轉(zhuǎn)發(fā)得到的R′i進(jìn)處理,確定每個(gè)節(jié)點(diǎn)的R′i值的大小。這里的基本思想是按各點(diǎn)的S′c的大小來按比例分配,S′c反映了節(jié)點(diǎn)推薦的路由節(jié)點(diǎn)接近目標(biāo)的程度。即節(jié)點(diǎn)I推薦節(jié)點(diǎn)的距離越大,使得請求節(jié)點(diǎn)能更接近目標(biāo),則I所分到的R′i值則越多。其值的計(jì)算公式如下:
(5)F′d:節(jié)點(diǎn)返回查詢質(zhì)量比
該值反映了某點(diǎn)對查詢返回結(jié)果文件名與查詢詞的平均匹配程度,它的計(jì)算公式如下:
Fi代表了一個(gè)返回文件與查詢關(guān)鍵字的匹配程度;n代表某點(diǎn)所有返回的文件數(shù)量;c為不同節(jié)點(diǎn)返回的文件索引數(shù)量的總和。其值越大,表明本次查詢所返回的值更好地匹配了關(guān)鍵字查詢要求。
由于該值也僅適合于計(jì)算有返回結(jié)果的情況,因此,參照上一特征值處理過程,對其值使用以下公式進(jìn)行轉(zhuǎn)化:
通過以上的處理過程,可以得到一個(gè)歸一化后的特征集合<R′c,S′c,N′m,R′i,F(xiàn)′d>。該集合中所有取值都已限定在[0,1]范圍中變化。
為了進(jìn)行訓(xùn)練,需要收集正反例樣本進(jìn)行學(xué)習(xí)與測試。訓(xùn)練樣本的采集工具使用了自設(shè)計(jì)的軟件KFetch[14]對網(wǎng)絡(luò)拓?fù)淇煺者M(jìn)行獲取,采用社會(huì)網(wǎng)絡(luò)中凝聚中心度指標(biāo)和隨機(jī)行走算法對節(jié)點(diǎn)進(jìn)行評價(jià),將兩種算法共同評價(jià)為核心和非核心的節(jié)點(diǎn)選出。測試的時(shí)間開始于2012年2 月4日20:00,采樣時(shí)間持續(xù)40 min。這里選取了已有的核心節(jié)點(diǎn)作為正例樣本,選擇其中60%的節(jié)點(diǎn)作為訓(xùn)練樣本,將余下的節(jié)點(diǎn)作為測試樣本,產(chǎn)生了所需的訓(xùn)練樣本和測試樣本集。
針對不同的目的,可以在上述特征集中選取適合的子集進(jìn)行訓(xùn)練。從KAD的消息類型可知,其主要有四種基本的RPC(Remote Process Command,RPC)。與查詢相關(guān)的包括節(jié)點(diǎn)查詢和關(guān)鍵字查詢操作。由于兩種消息用于不同的場景,因此其特征值子集也不相同。將兩種消息命令與上面的特征集合進(jìn)行一個(gè)映射后,選取適合的特征屬性建立對應(yīng)的特征子集。
將與Find_Node相關(guān)的特征集合標(biāo)記為Cn,選取與其對應(yīng)的特征有<R′c,S′c,N′m>。因?yàn)樵谝怨?jié)點(diǎn)為目標(biāo)的查詢中,其返回的結(jié)果只有兩種可能性,即能命中或不能目標(biāo)。因此,對于返回結(jié)果的處理相對簡單,則記為C′n=<R′c,S′c,N′m>。選擇與Find_Value相關(guān)的特征集合標(biāo)記為Vn,則與其對應(yīng)的特征有<R′c,S′c,N′m,R′i,F(xiàn)′d>。該特征集合中含有查詢結(jié)果索引及索引結(jié)果質(zhì)量,這樣可以更全面地考核用戶查詢后結(jié)果的命中情況,記為Vn= <R′c,S′c,N′m,R′i,F(xiàn)′d>。
使用Find_Node采集節(jié)點(diǎn)的特征屬性。先將該區(qū)域劃分為?個(gè)部分,在各部分中隨機(jī)挑選一個(gè)節(jié)點(diǎn)ID作為待查詢目標(biāo)ID。這樣做的目的是更有效地考察某點(diǎn)到各個(gè)距離位置的情況。?個(gè)測試服務(wù)器分別選定一個(gè)ID的鄰居來生成客戶端ID。開始測試時(shí)需保證一定的節(jié)點(diǎn)已將?個(gè)節(jié)點(diǎn)的加入自己的路由表中。實(shí)驗(yàn)中參數(shù)?設(shè)定為8,先對通過前面選的核心節(jié)點(diǎn)進(jìn)行特征采集,測試時(shí)間持續(xù)25 min,完成所有待訓(xùn)練和測試節(jié)點(diǎn)的樣本所需特征值的獲取。
將得到的歸一化處理后的樣本數(shù)據(jù)組成為學(xué)習(xí)和訓(xùn)練樣本,格式為:L=T=<R′c,S′c,N′m,E>。E為該節(jié)點(diǎn)的對應(yīng)期望取值,即該節(jié)點(diǎn)為核心節(jié)點(diǎn)的概率。由于希望輸出結(jié)果為一個(gè)概率值,因此在進(jìn)行重要程度排序的時(shí)候,不能將一個(gè)最重要的節(jié)點(diǎn)與一般重要節(jié)點(diǎn)進(jìn)行等同,這樣將降低結(jié)果的精度。因此,需要將上述兩種算法得到的核心節(jié)點(diǎn)進(jìn)行相應(yīng)變換操作。其方法是取兩種方式所共同選中的核心節(jié)點(diǎn),按重要程度排序后,對應(yīng)指定結(jié)果的概率范圍為[0.6,1]。即將所有核心節(jié)點(diǎn)進(jìn)行5等分,每一部分區(qū)域中的節(jié)點(diǎn)給定一個(gè)對應(yīng)的概率期望值,對反例樣本的處理也是按此方法進(jìn)行。將這樣組成后的訓(xùn)練樣本送入網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí),這里的實(shí)驗(yàn)中對學(xué)習(xí)誤差設(shè)置為0.001。隱層神經(jīng)元個(gè)數(shù)取輸入層的1.4倍,即設(shè)置為5個(gè),輸入層的傳遞函數(shù)設(shè)置S型正切函數(shù)tansig,輸出層的傳遞函數(shù)S型對數(shù)函數(shù)logsin,采用負(fù)梯度權(quán)值修正方法。為了降低編碼的難度,其學(xué)習(xí)和測試過程均使用了MatLab[15]工具箱中的神經(jīng)元組件進(jìn)行實(shí)驗(yàn),程序清單如下所示,其中輸入數(shù)據(jù)整理為矢量形式,其值對應(yīng)變量P,輸出的期望值也按矢量方式賦值于變量T。
上面代碼中minmax(P)是指以輸入數(shù)據(jù)中的最大和最小值為訓(xùn)練數(shù)據(jù)的變化范圍,net_1為訓(xùn)練后得到的輸出網(wǎng)絡(luò)。
通過多步的網(wǎng)絡(luò)訓(xùn)練可得到了滿足誤差要求的樣本數(shù)據(jù)擬合情況,實(shí)驗(yàn)結(jié)果如圖2所示。
圖2 Find_Node特征學(xué)習(xí)擬合效果圖
由圖2可以看出,當(dāng)學(xué)習(xí)的次數(shù)到達(dá)889時(shí),則誤差已經(jīng)控制在指定的范圍了。將該訓(xùn)練完成的網(wǎng)絡(luò)輸出結(jié)果概率與期望值進(jìn)行對比,將誤差范圍在0.2之內(nèi)的均認(rèn)為成功。那么,其中正例樣本識(shí)別達(dá)到78.3%,反例樣本的識(shí)別率達(dá)到了67.1%。將訓(xùn)練好的網(wǎng)絡(luò)模型在實(shí)際的KAD中進(jìn)行了驗(yàn)證,采用KFetch工具對節(jié)點(diǎn)關(guān)系進(jìn)行獲取后,抽取出在線節(jié)點(diǎn)的對應(yīng)屬性集送入模型中進(jìn)行判定。每次實(shí)驗(yàn)時(shí)間持續(xù)30 min,實(shí)驗(yàn)共重復(fù)5次,對實(shí)驗(yàn)結(jié)果進(jìn)行統(tǒng)計(jì)和分析。同時(shí),將識(shí)別結(jié)果與使用凝聚中心度與隨機(jī)行走算法所篩選出的核心節(jié)點(diǎn)進(jìn)行對比,結(jié)果顯示采用BP模型的核心節(jié)點(diǎn)識(shí)別率平均為63.8%。雖然實(shí)際網(wǎng)絡(luò)中識(shí)別率略低于訓(xùn)練結(jié)果,但仍可證明該方法具有一定的可行性和實(shí)用性。
本文通過利用測量實(shí)驗(yàn)收集KAD節(jié)點(diǎn)的屬性特征,并根據(jù)查詢命令選取了對應(yīng)的特征子集進(jìn)行實(shí)驗(yàn)。從實(shí)驗(yàn)結(jié)果可以看出,由于網(wǎng)絡(luò)中節(jié)點(diǎn)的動(dòng)態(tài)性命使得識(shí)別效率仍有待提高,但這種實(shí)時(shí)的判定方法可有效地解決判定的滯后性,具有更廣闊的應(yīng)用前景。為了改進(jìn)識(shí)別的準(zhǔn)確性,今后,將重點(diǎn)對節(jié)點(diǎn)的屬性進(jìn)行更為深入的研究。從上可知,BP網(wǎng)絡(luò)性能的高低主要取決于兩個(gè)因素:抽取的節(jié)點(diǎn)屬性特征數(shù)量和選擇的屬性特征質(zhì)量。尋找有效的節(jié)點(diǎn)屬性特征需要更深入地對KAD網(wǎng)絡(luò)中節(jié)點(diǎn)進(jìn)行分析,抽取出節(jié)點(diǎn)有效屬性特征來豐富屬性集合。其次,嘗試采用其他模式識(shí)別的方法,如模擬退火算法、Tabu搜索算法和遺傳算法等[16],可以對現(xiàn)有的特征屬性進(jìn)行適當(dāng)?shù)刈冃?、?jì)算和提取,以得到更佳的具有可分屬特征值,從而有效地提升核心節(jié)點(diǎn)識(shí)別的準(zhǔn)確率。
[1]何建軍,李仁發(fā).改進(jìn)的隨機(jī)游走模型節(jié)點(diǎn)排序方法[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(12):87-89.
[2]Maymounkov P,Mazieres D.Kademlia:a peer-to-peer informaticssystem based on theXOR metric[C]//Proceedings of the 1th International Workshop on P2P Systems,2002:53-65.
[3]蔣君,鄧倩妮.eMule系統(tǒng)中的非均勻性分布[J].微電子學(xué)與計(jì)算機(jī),2007,24(10):153-156.
[4]熊偉,謝冬青,焦炳旺,等.一種結(jié)構(gòu)化P2P的自適應(yīng)負(fù)載均衡方法[J].軟件學(xué)報(bào),2009,20(3):661-663.
[5]李振宇,謝高崗.基于DHT的P2P負(fù)載均衡算法[J].計(jì)算機(jī)研究與發(fā)展,2006,43(9):1579-1580.
[6]周春光,曲鵬程,王曦,等.DSNE:一個(gè)新的動(dòng)態(tài)社會(huì)網(wǎng)絡(luò)分析算法[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2008,38(2):408-411.
[7]Cai Hua,Zhou Chunguang,Wang Zhe,et al.Algorithm research on community mining from dynamic social network[J].Journal of Jinlin University,2008,26(4):380-382.
[8]Berger-Wolf T Y,Saia J.A framework for analysis of dynamic social networks[C]//Proceeding of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2006,12:523-528.
[9]赫南,李德毅,淦文燕,等.復(fù)雜網(wǎng)絡(luò)中重要性節(jié)點(diǎn)發(fā)掘綜述[J].計(jì)算機(jī)科學(xué),2007,34(12):1-4.
[10]郭軍,李明輝,董社勤,等.隨機(jī)行走的電路分析應(yīng)用及并行化改進(jìn)[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(18):199-201.
[11]鄧忠軍,宋威,鄭雪峰,等.P2P網(wǎng)絡(luò)中最大頻繁項(xiàng)集挖掘算法研究[J].計(jì)算機(jī)應(yīng)用研究,2010,27(9):3490-3492.
[12]宋文軍,劉紅星,王崇駿,等.以圖頻繁集為基礎(chǔ)的核心節(jié)點(diǎn)發(fā)現(xiàn)[J].計(jì)算機(jī)科學(xué)與探索,2010,4(1):82-85.
[13]Sarkar P.Dynamic social network analysis using latent space models[C]//ProceedingsoftheACM SIGKDD Explorations Newsletter,2005:31-35.
[14]王建.基于KAD網(wǎng)絡(luò)監(jiān)督的關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D].成都:四川大學(xué),2012.
[15]飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)理論與MATLAB7實(shí)現(xiàn)[M]// MATLAB應(yīng)用技術(shù).北京:電子工業(yè)出版社,2005:4-90.
[16]邊肇祺,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,2006:176-208.
1.College of Computer,Sichuan University,Chengdu 610041,China
2.Department of Computer Science and Software Engineering,Jincheng College of Sichuan University,Chengdu 611731,China
In view of the core node recognition in the KAD(Kademlia),a model based on BP is presented to determine whether a node is core node in real time.According to the result of the measurement for KAD,some attribute characteristics extraction and normalization processing is implemented to obtain an attribute set with higher separable degree.An algorithm in MatLab is designed to train the BP network until the results limit in a predetermined error range.In addition,the trained BP model is adapt to test prepared data,the results of the experiment show that the method can judge a node degrees of importance,and the recognition accuracy rate is up to about 70%.
Back-Prorogation(BP);KAD network;core node;recognition
A
TP393
10.3778/j.issn.1002-8331.1210-0276
WANG Jian,FENG Weisen,QIU Xingchao,et al.Study of recognition algorithm for core node in kad network based on BP model.Computer Engineering and Applications,2013,49(7):72-75.
王建(1979—),男,博士,講師,研究領(lǐng)域?yàn)榫W(wǎng)絡(luò)安全與應(yīng)用;馮偉森(1962—),男,副教授,研究方向?yàn)榫W(wǎng)絡(luò)信息系統(tǒng)。E-mail:wj_98@163.com
2012-10-26
2012-12-28
1002-8331(2013)07-0072-04