張宇, 劉珊
(國網(wǎng)山西省電力公司電力科學(xué)研究院, 山西 太原 030001)
相對于其他通信技術(shù),光通信技術(shù)的速度更快,環(huán)境的適應(yīng)能力強(qiáng),而且抗干擾能力更優(yōu)[1]。隨著光通信技術(shù)的不斷發(fā)展和成熟,光通信技術(shù)在許多領(lǐng)域得到了廣泛的應(yīng)用,如信息采集、醫(yī)院、軍事等[2-4]。由于光通信在自然環(huán)境中,因?yàn)槠渌蛩馗蓴_,如非法入侵、信號不穩(wěn)定、信號干擾等,光通信狀態(tài)會發(fā)生改變,當(dāng)干擾超過一定的程度,使得光通信狀態(tài)異常,異常狀態(tài)會影響光通信系統(tǒng)的數(shù)據(jù)傳輸,如數(shù)據(jù)重傳次數(shù)增加,數(shù)據(jù)傳輸時間變長,以及數(shù)據(jù)傳輸成功率下降等,因此需要對光通信狀態(tài)進(jìn)行高精度識別,根據(jù)光通信狀態(tài)變化制定相應(yīng)的措施,提高光通信系統(tǒng)的性能具有十分重要的研究價值[5-7]。
光通信狀態(tài)識別是一種模式識別的多分類問題,為了保證光通信狀態(tài)長期處于正常狀態(tài),許多學(xué)者引入了各種技術(shù)對其進(jìn)行了研究,提出了一些光通信狀態(tài)識別方法。最初人們通過一些專門設(shè)備對光通信狀態(tài)進(jìn)行檢測和識別,由于是一種人工方法,使得光通信狀態(tài)識別可靠性差,光通信狀態(tài)識別過程繁瑣,光通信狀態(tài)識別效率低,而且光通信狀態(tài)識別結(jié)果與光通信狀態(tài)實(shí)際結(jié)果有時完全不一樣,無法滿足現(xiàn)代光通信技術(shù)的發(fā)展要求[8-10]。隨后人們提出基于K近鄰方法的光通信狀態(tài)識別技術(shù),通過提取光通信狀態(tài)識別特征,采用K近鄰方法建立光通信狀態(tài)識別的分類器,識別效果要優(yōu)于人工方法,但是該方法假設(shè)光通信狀態(tài)和特征之間是一種固定的線性變化關(guān)系,這與實(shí)際情況不相符,使得光通信狀態(tài)識別誤差較大[11]。最近由于人工神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,出現(xiàn)了基于各種人工神經(jīng)網(wǎng)絡(luò)的光通信狀態(tài)識別方法,如BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)等,光通信狀態(tài)識別結(jié)果要好于K近鄰方法,但是由于人工神經(jīng)網(wǎng)絡(luò)要求光通信狀態(tài)信號數(shù)據(jù)比較大,如果不滿足該條件,那么光通信狀態(tài)識別效果差,而且人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)時間長,影響光通信狀態(tài)識別效率[12-13]。
為了解決當(dāng)前光通信狀態(tài)識別存在的問題,有效降低光通信狀態(tài)識別誤差,設(shè)計(jì)了基于云計(jì)算平臺的光通信狀態(tài)識別方法。采集光通信狀態(tài)信號,從信號中提取識別特征,然后通過云計(jì)算平臺將多個節(jié)點(diǎn)合在一起,每一個節(jié)點(diǎn)采用支持向量機(jī)擬合特征和光通信狀態(tài)類別之間的變化關(guān)系,實(shí)現(xiàn)光通信狀態(tài)識別。測試結(jié)果表明,本文方法是一種速度快、正確率高的光通信狀態(tài)識別方法,驗(yàn)證了基于云計(jì)算平臺的光通信狀態(tài)識別方法的優(yōu)越性。
隨著每天數(shù)據(jù)不斷上升,有的領(lǐng)域的數(shù)據(jù)呈指數(shù)速度上升,進(jìn)入了大數(shù)據(jù)時代。傳統(tǒng)數(shù)據(jù)處理技術(shù)采用單機(jī)方法,單機(jī)的中央處理器(CPU)由于制作工藝以及電子器件尺寸的影響,單機(jī)處理速度已經(jīng)達(dá)到了瓶頸,無法大幅度進(jìn)行提升,這樣難以滿足大數(shù)據(jù)處理的要求。在大數(shù)據(jù)背景下,出現(xiàn)了云計(jì)算平臺,云計(jì)算平臺將多個分散在不同地理位置的節(jié)點(diǎn)組合在一起,采用分布式管理技術(shù),得到一個性能優(yōu)異的大系統(tǒng),加快數(shù)據(jù)處理能力。當(dāng)前云計(jì)算平臺主要采用MapReduce進(jìn)行工作,將一個大任務(wù)劃分成不同的片段,采用不同節(jié)點(diǎn)同時對不同片段進(jìn)行處理,減少了大任務(wù)的處理時間[14-15],其工作原理如圖1所示。
圖1 云計(jì)算平臺的工作原理
本文引入云計(jì)算平臺,使多個點(diǎn)同時進(jìn)行光通信狀態(tài)識別,加快光通信狀態(tài)識別速度。
提取光通信狀態(tài)信號識別的特征步驟如下。
Step1: 采用專門工具采集光通信狀態(tài)信號。
Step2:采用小波變換對光通信狀態(tài)信號進(jìn)行多尺度分解,得到不同幅度的光通信狀態(tài)信號,然后提取第k個幅度的光通信狀態(tài)信號的能量值Ek,如式(1)。
(1)
式中,L為分解尺度數(shù);xkm為信號的幅值。
Step3:對能量特征進(jìn)行歸一化,建立光通信狀態(tài)信號擾動信號特征向量t,具體為式(2)。
(2)
支持向量機(jī)和最小二乘支持向量機(jī)均屬于數(shù)據(jù)挖掘技術(shù)中的機(jī)器學(xué)習(xí)算法,最小二乘支持向量機(jī)的學(xué)習(xí)速度快,但是其學(xué)習(xí)精度很低,難以建立高精度的光通信狀態(tài)識別分類器,因此本文選擇支持向量機(jī)進(jìn)行光通信狀態(tài)識別研究。支持向量機(jī)的形式可以描述為式(3)。
yk=ωTφ(xk)+b
(3)
式中,xk表示第k個光通信狀態(tài)特征;φ(·)表示擬合函數(shù);b表示偏置向量。
根據(jù)支持向量機(jī)的學(xué)習(xí)過程對式(3)進(jìn)行相應(yīng)的變換,得到它的等價形式,即式(4)。
(4)
式中,e表示支持向量機(jī)的誤差。
為了進(jìn)一步簡化學(xué)習(xí)過程,采用拉格朗日乘子αk構(gòu)建相應(yīng)的拉格朗日函數(shù),具體為式(5)。
(5)
根據(jù)結(jié)構(gòu)風(fēng)險最小化,根據(jù)式(6)—式(9)得到偏置向量b的值。
(6)
(7)
(8)
(9)
由于光通信狀態(tài)與特征之間具有一定的非線性,因此引入核函數(shù)得到支持向量機(jī)的光通信狀態(tài)識別結(jié)果為式(10)。
(10)
支持向量機(jī)引入拉格朗日函數(shù),提高了支持向量機(jī)學(xué)習(xí)效率,為構(gòu)建光通信狀態(tài)識別分類器提供支撐。云計(jì)算平臺的光通信狀態(tài)識別步驟如下。
Step1:采集光通信狀態(tài)識別信號,去掉其中的噪聲。
Step2:對去噪后的光通信狀態(tài)信號進(jìn)行多尺度分解,提取光通信狀態(tài)信號特征。
Step3:將光通信狀態(tài)信號特征作為支持向量機(jī)的輸入,光通信狀態(tài)類型作為輸出,通過支持向量機(jī)學(xué)習(xí),建立光通信狀態(tài)信號分類器。
要進(jìn)行測試實(shí)驗(yàn),需要搭建云計(jì)算平臺,本文搭建云計(jì)算平臺包括多個節(jié)點(diǎn),一個為中心節(jié)點(diǎn),其他為工作節(jié)點(diǎn),中心節(jié)點(diǎn)的任務(wù)是管理這些工作節(jié)點(diǎn),使這些工作節(jié)點(diǎn)能夠協(xié)調(diào)工作,不沖突,保證每一個節(jié)點(diǎn)的任務(wù)均衡,使節(jié)點(diǎn)資源得到充分利用,具體描述如表1所示。
表1 云計(jì)算平臺節(jié)點(diǎn)的相關(guān)參數(shù)
為了測試云計(jì)算平臺的光通信狀態(tài)識別有效性和優(yōu)越性,選擇最常用的光通信狀態(tài)識別方法:BP神經(jīng)網(wǎng)絡(luò)和K近鄰方法在相同的平臺進(jìn)行對比測試,分別統(tǒng)計(jì)光通信狀態(tài)識別的正確率,拒識率和誤識率。采集大量的光通信狀態(tài)信號作為測試目標(biāo),光通信狀態(tài)信號可以劃分為多類,正常光通信狀態(tài)為一大類,異常的光通信狀態(tài)為一大類,異常光通信狀態(tài)信號劃細(xì)化為4類,具體為:非法入侵狀態(tài),信號中斷狀態(tài),干擾狀態(tài),非法攻擊狀態(tài)。其中正常狀態(tài)編號為1,4種異常狀態(tài)編號為:2—5。不同光通信狀態(tài)信號的樣本數(shù)量如表2所示。
表2 不同光通信狀態(tài)信號的樣本數(shù)量分布
3種方法的光通信狀態(tài)效果,如圖2所示。
對圖2的實(shí)驗(yàn)結(jié)果進(jìn)行分析,可知。
圖2 不同方法的光通信狀態(tài)識別效果比較
(1)K近鄰算法的實(shí)驗(yàn)結(jié)果最差,無法準(zhǔn)確區(qū)別各種光通信狀態(tài),光通信狀態(tài)識別結(jié)果與實(shí)際值偏差大,無法描述光通信狀態(tài)之間的區(qū)別,局限性十分明顯,不能應(yīng)用于實(shí)際的光通信狀態(tài)管理中。
(2) BP神經(jīng)網(wǎng)絡(luò)的光通信狀態(tài)識別效果要優(yōu)于K近鄰方法,提高了識別正確率,光通信狀態(tài)的識別誤差明顯減少,但是光通信狀態(tài)識別結(jié)果與實(shí)際應(yīng)用要求有一定的差距。
(3) 在所有方法中,云計(jì)算平臺的光通信狀態(tài)識別效果最佳,較好地克服了當(dāng)前光通信狀態(tài)識別方法存在誤差大的難題,可以高精度識別各種光通信狀態(tài),光通信狀態(tài)識別正確率高。
為了測試云計(jì)算平臺和傳統(tǒng)單機(jī)平臺的光通信狀態(tài)識別效率,分別計(jì)算兩種平臺的光通信狀態(tài)識別時間(ms),其中云計(jì)算平臺的節(jié)點(diǎn)數(shù)為10,結(jié)果如圖3所示。
圖3 云計(jì)算平臺與傳統(tǒng)平臺的識別時間對比
對光通信狀態(tài)識別時間進(jìn)行對比分析可以知道,云平臺的光通信狀態(tài)識別時間的平均值為5.10 ms,單機(jī)平臺的光通信狀態(tài)識別時間的平均值為28.20 ms,云計(jì)算平臺大幅度縮短了的光通信狀態(tài)識別時間,提高了光通信狀態(tài)識別效率,可以滿足大規(guī)模光通信狀態(tài)信號的建模與識別研究,實(shí)際應(yīng)用價值得到了有效的提升。
光通信狀態(tài)識別是當(dāng)前研究的熱點(diǎn),傳統(tǒng)方法存在光通信狀態(tài)識別誤差大,速度慢等難題,為了提升光通信狀態(tài)識別效果,設(shè)計(jì)了基于云計(jì)算平臺的光通信狀態(tài)識別方法。測試結(jié)果表明,相比較于單機(jī)平臺,云計(jì)算平臺可以有效縮短光通信狀態(tài)識別時間,加快光通信狀態(tài)識別速度,能夠高精度識別各種光通信狀態(tài),光通信狀態(tài)識別的拒識率和誤識率低于對比方法,具有十分廣泛的應(yīng)用前景。