李震宇
摘 要:隨著無(wú)線傳感器網(wǎng)絡(luò)在各領(lǐng)域得到廣泛的應(yīng)用,對(duì)網(wǎng)絡(luò)異常檢測(cè)的效率和可靠性提出了更高的要求。本文分析了無(wú)線傳感器網(wǎng)絡(luò)異常檢測(cè)的現(xiàn)狀,提出基于直方圖的傳感器數(shù)據(jù)預(yù)處理方法,給出了由節(jié)點(diǎn)內(nèi)異常檢測(cè)和相鄰節(jié)點(diǎn)協(xié)作投票決策構(gòu)成的網(wǎng)絡(luò)異常檢測(cè)方法。
關(guān)鍵詞: 無(wú)線傳感器網(wǎng)絡(luò);異常數(shù)據(jù)檢測(cè);數(shù)據(jù)預(yù)處理
【中圖分類號(hào)】 F224.33 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2236-1879(2017)05-0279-01
一、無(wú)線傳感器網(wǎng)絡(luò)異常檢測(cè)現(xiàn)狀
無(wú)線傳感器網(wǎng)絡(luò)應(yīng)用的一般形式為:收集應(yīng)用環(huán)境中傳感器感應(yīng)數(shù)據(jù)并進(jìn)行傳輸;對(duì)收集的數(shù)據(jù)進(jìn)行處理,去除過(guò)度抖動(dòng)和冗余數(shù)據(jù),得到所需的有效數(shù)據(jù);將數(shù)據(jù)通過(guò)特定的邏輯處理,從而實(shí)現(xiàn)特定應(yīng)用領(lǐng)域軟件系統(tǒng)的功能。無(wú)線傳感器網(wǎng)絡(luò)異常檢測(cè)分析系統(tǒng)是在各種類型傳感器收集數(shù)據(jù)的基礎(chǔ)之上,識(shí)別出特殊情況下的異常數(shù)據(jù),通過(guò)異常數(shù)據(jù)模型進(jìn)行分析,及時(shí)分析判斷異常類別并進(jìn)行異常處理。基于無(wú)線傳感器網(wǎng)絡(luò)系統(tǒng)的一般工作過(guò)程,無(wú)線傳感器網(wǎng)絡(luò)異常檢測(cè)分析系統(tǒng)應(yīng)該由以下三個(gè)部分構(gòu)成:傳感器數(shù)據(jù)采集及預(yù)處理、網(wǎng)絡(luò)異常數(shù)據(jù)檢測(cè)、異常分析及結(jié)果呈現(xiàn)。
二、傳感器數(shù)據(jù)采集及預(yù)處理
1、傳感器節(jié)點(diǎn)時(shí)間同步
單一的數(shù)據(jù)往往不能反映整個(gè)環(huán)境的狀態(tài),在很多無(wú)線傳感器網(wǎng)絡(luò)的實(shí)際應(yīng)用中,傳感器檢測(cè)到環(huán)境數(shù)據(jù)后,會(huì)向鄰居傳感器節(jié)點(diǎn)發(fā)送請(qǐng)求將同一時(shí)刻環(huán)境數(shù)據(jù)發(fā)往主機(jī)系統(tǒng),作為數(shù)據(jù)異常檢測(cè)的最終決策依據(jù)。按照實(shí)現(xiàn)機(jī)制,無(wú)線傳感器網(wǎng)絡(luò)時(shí)間同步算法主要有三類:基于pair-wise的同步算法、基于receiver-receiver的同步算法、基于sender-receiver的單向同步算法。這三類算法均具有各自典型的協(xié)議?;趐air-wise的主要有TPSN協(xié)議和LTS協(xié)議,TPSN協(xié)議具有較高的時(shí)間同步準(zhǔn)確性,但是該協(xié)議邏輯計(jì)算復(fù)雜,時(shí)間復(fù)雜度高,且受數(shù)據(jù)包傳輸時(shí)間的影響較為明顯,LTS協(xié)議與TSPN協(xié)議類似,其以適當(dāng)時(shí)間同步準(zhǔn)確性為代價(jià),在一定程度上降低了邏輯運(yùn)算和時(shí)間的復(fù)雜度?;趓eceiver-receiver的主要有RBS協(xié)議,該協(xié)議去除了傳感器節(jié)點(diǎn)間發(fā)送時(shí)間同步的影響,以及發(fā)送方構(gòu)建數(shù)據(jù)信息包和等待信道對(duì)時(shí)間同步的影響,但是其運(yùn)算復(fù)雜度很高?;趕ender-receiver的DMTS協(xié)議和FSTP協(xié)議,DTMS協(xié)議從能耗上更加適合無(wú)線傳感器網(wǎng)絡(luò),但是精度很低,不利于后期數(shù)據(jù)處理,并不適合進(jìn)行異常檢測(cè)。FSTP協(xié)議在DTMS協(xié)議基礎(chǔ)之上進(jìn)行了優(yōu)化,具有DTMS的低能耗特點(diǎn)的同時(shí)比DTMS具有更高的時(shí)間精度,比較適合在無(wú)線傳感器網(wǎng)絡(luò)異常檢測(cè)系統(tǒng)中使用。FSTP的主要思路是發(fā)送方傳感器在發(fā)送同步數(shù)據(jù)信息時(shí)將本地時(shí)間一同發(fā)出,接收方收到同步數(shù)據(jù)信息后,根據(jù)發(fā)送方時(shí)間信息調(diào)整自身時(shí)間與發(fā)送方保持一致。發(fā)送方以網(wǎng)絡(luò)廣播的形式發(fā)出信息,如果接收方為鄰居傳感器節(jié)點(diǎn)則進(jìn)行時(shí)間調(diào)整,以便進(jìn)行相關(guān)決策。該協(xié)議在實(shí)現(xiàn)時(shí)間同步的同時(shí),還要將本地時(shí)間放入到鄰居傳感器的請(qǐng)求報(bào)文數(shù)據(jù)中,以此達(dá)到數(shù)據(jù)同步的目的。
2、數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理的主要作用是去除所收集到大量數(shù)據(jù)中的干擾數(shù)據(jù),這些干擾數(shù)據(jù)往往是由于傳感器不穩(wěn)定引起的噪聲數(shù)據(jù),在預(yù)處理階段將這些干擾數(shù)據(jù)去除,可以有效提高整個(gè)應(yīng)用系統(tǒng)的效率以及異常檢測(cè)分析的有效性。
數(shù)據(jù)的預(yù)處理有多種實(shí)現(xiàn)方法,其主要區(qū)別是用于代表整組數(shù)據(jù)的估值數(shù)據(jù)的計(jì)算方式,傳統(tǒng)的方式是基于平均值數(shù)據(jù)的預(yù)處理方式和基于中位數(shù)的與處理方式?;谄骄档姆绞筋櫭剂x是取一組傳感器數(shù)據(jù)的平均值作為中心數(shù)據(jù)來(lái)代表該組數(shù)據(jù),但是當(dāng)環(huán)境劇烈變化出現(xiàn)極端偏離數(shù)據(jù)時(shí),其平均值也會(huì)產(chǎn)生較大偏離,從而造成數(shù)據(jù)失真,影響應(yīng)用系統(tǒng)的準(zhǔn)確性?;谥形粩?shù)的方式,是將一組傳感器數(shù)據(jù)先進(jìn)行排序,取中間數(shù)據(jù)作為該組數(shù)據(jù)的代表數(shù)據(jù),其避免了極端數(shù)據(jù)造成的數(shù)據(jù)偏差,但是這種方式只適用于均勻分布的數(shù)據(jù),受限于傳感器工作環(huán)境的惡劣,中位數(shù)方式在很多實(shí)際應(yīng)用中是不可取的。
基于以上平均值和中位數(shù)兩種方式的不足,我們可以采用直方圖的感應(yīng)數(shù)據(jù)預(yù)處理方法。在特定環(huán)境下部署的傳感器,其采集到的數(shù)據(jù)一般具有一定的規(guī)律,當(dāng)環(huán)境發(fā)生變化時(shí),數(shù)據(jù)也是循序漸進(jìn)發(fā)生變化,且數(shù)據(jù)應(yīng)當(dāng)是連續(xù)的。而干擾數(shù)據(jù)大多具有隨機(jī)性和小概率出現(xiàn)等特征,在進(jìn)行數(shù)據(jù)預(yù)處理時(shí),將一定時(shí)間內(nèi)采集的環(huán)境數(shù)據(jù)傳輸?shù)骄彌_區(qū)中,然后分析整組數(shù)據(jù)的概率分布情況,以此建立該組數(shù)據(jù)的概率直方圖,在緩沖區(qū)中依據(jù)不同傳感器產(chǎn)生噪聲數(shù)據(jù)的概率對(duì)小概率噪聲數(shù)據(jù)進(jìn)行清除,之后對(duì)余下的有效數(shù)據(jù)進(jìn)行計(jì)算平均值,使用該均值作為中心數(shù)據(jù)代表該組數(shù)據(jù)。這種直方圖的數(shù)據(jù)預(yù)處理方式能夠更好的得到感應(yīng)數(shù)據(jù)的趨勢(shì)。
三、異常數(shù)據(jù)檢測(cè)模型
異常數(shù)據(jù)模型的建立是事件監(jiān)測(cè)和異常數(shù)據(jù)分析的基礎(chǔ),是保證異常事件判斷準(zhǔn)確性的基本前提。異常數(shù)據(jù)關(guān)系模型還要能夠找到并體現(xiàn)出傳感器網(wǎng)絡(luò)中數(shù)據(jù)的傳輸方向和數(shù)據(jù)之間的關(guān)系,這是找到異常源頭的重要依據(jù)。很多研究和應(yīng)用證明圖模型具有能夠描述復(fù)雜的情境,在圖模型之中除了能夠表現(xiàn)出監(jiān)測(cè)數(shù)據(jù)的時(shí)空關(guān)系,還能夠融入地理信息和網(wǎng)絡(luò)拓?fù)湫畔?,這些信息的融合能夠更加充分的展現(xiàn)出異常的特征。常見的圖模型有等值線圖、基于數(shù)據(jù)快照的圖模式等。異常檢測(cè)主要有兩個(gè)部分來(lái)構(gòu)成:一是傳感器節(jié)點(diǎn)內(nèi)部的數(shù)據(jù)異常檢測(cè),二是在主機(jī)中,對(duì)之前判定的疑似異常進(jìn)行節(jié)點(diǎn)間投票決策,得出最終的異常集合以及異常范圍和邊界。
四、總結(jié)
本文給出了基于直方圖的無(wú)線傳感器網(wǎng)絡(luò)數(shù)據(jù)預(yù)處理方法,能夠有效提高異常檢測(cè)的效率,提出的由節(jié)點(diǎn)內(nèi)異常檢測(cè)和相鄰節(jié)點(diǎn)協(xié)作投票決策構(gòu)成的網(wǎng)絡(luò)異常檢測(cè)方法,能夠較為準(zhǔn)確有效地檢測(cè)出無(wú)線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)的工作狀態(tài)、異常狀況以及在異常區(qū)域中的位置。
參考文獻(xiàn)
[1] 翟小超.基于可變閾值的無(wú)線傳感網(wǎng)絡(luò)異常值檢測(cè)[J].電子科技,2015(2)
[2] 趙章界,劉海峰.無(wú)線傳感網(wǎng)中的安全問(wèn)題[J].計(jì)算機(jī)安全,2010(6)