施艷昭
(安徽電子信息職業(yè)技術(shù)學(xué)院 經(jīng)濟管理系,安徽 蚌埠 233000)
近年來,社會各界對于BP神經(jīng)網(wǎng)絡(luò)組合模型十分關(guān)注,對此開展了很多研究和分析[1].為了能夠更好地挖掘與分析BP神經(jīng)網(wǎng)絡(luò)組合模型,對于解析計算機網(wǎng)絡(luò)上傳數(shù)據(jù)算法有了更高的要求[2].針對有限空間的環(huán)境下,結(jié)合分治思想構(gòu)建了STREAM算法.這種算法并未對數(shù)據(jù)變化進行充分的反映[3].構(gòu)建的CLUSTREAM算法可以利用BP神經(jīng)網(wǎng)絡(luò)組合模型,在計算機網(wǎng)絡(luò)上傳數(shù)據(jù)劃分為兩個階段:第一個階段是微計算機網(wǎng)絡(luò)上傳數(shù)據(jù),第二階段為自適應(yīng)宏計算機網(wǎng)絡(luò)上傳數(shù)據(jù),以實現(xiàn)計算機網(wǎng)絡(luò)上傳數(shù)據(jù)[4].針對BP神經(jīng)網(wǎng)絡(luò)組合模型的雙重特征,提出了可以通過投影計算機網(wǎng)絡(luò)上傳數(shù)據(jù)實現(xiàn)有效的解決[5].在上述幾種算法中,其依據(jù)的根本思想都是k-means計算機網(wǎng)絡(luò)上傳數(shù)據(jù)思想,這種思想的主要不足是無法實現(xiàn)對任意形式分布的計算機網(wǎng)絡(luò)上傳數(shù)據(jù)[6].
本文提出一種融合雙重BP神經(jīng)網(wǎng)絡(luò)組合模型的Python解析計算機網(wǎng)絡(luò)上傳數(shù)據(jù)算法.整個算法的主要構(gòu)成部分為:在線網(wǎng)格單元數(shù)據(jù)統(tǒng)計部分和自適應(yīng)聚類演化部分.將數(shù)據(jù)空間進行網(wǎng)絡(luò)化處理,隨后對于在線部分對應(yīng)的網(wǎng)格單元信息可通過近似技術(shù)來進行合理的統(tǒng)計與分析.而且,能夠依據(jù)改進之后的金字塔時間結(jié)構(gòu)將潛在密集網(wǎng)格單元進行存儲,采取的是快照形式.進入到Python解析階段,則是利用深度優(yōu)先搜索方式來實施計算機網(wǎng)絡(luò)上傳數(shù)據(jù),而且借助實驗對算法可行性進行了有效的分析.
以A={A1,A2,…,Ak}代表歐氏空間下對應(yīng)的屬性集合,可將其k維數(shù)據(jù)空間表示為S=A1×A2×…×Ak,那么此時在某時刻t,在S上的BP神經(jīng)網(wǎng)絡(luò)組合即可表示為X=
定義1 給定一個BP神經(jīng)網(wǎng)絡(luò)組合模型X上的時間段[t-h,t],稱density(u)=count(u)/(|N|)為單元u的密度.其中:|N|為BP神經(jīng)網(wǎng)絡(luò)組合總量,count(u)代表的則是在單元u中具有的數(shù)據(jù)點個數(shù).
定義2 假定[t-h,t]表示的是在X上的某個時間段,其密度閾值為τ,ε表示其誤差因子,假如滿足density(u)≥τ-ε,那么可以證明此時該單元u為密集的;若density(u)>ε,則網(wǎng)格單元u是潛在密集的;若density(u)≤ε,則網(wǎng)格單元u是非密集的.
假如從開始至今所經(jīng)過的總時間表示為Tc,那么此時在第0層具有的最小時間粒度則可表示為Tmin.如下所述即為改進金字塔的時間結(jié)構(gòu)定義:①其最大層數(shù)表示為logα(Tc/Tmin),α一般的取值為2,4,8;②如果滿足條件((Tc/Tmin)modαi)=0and((Tc/Tmin)modαi+1)≠0,那此時將取i為時刻Tc時,對應(yīng)的存儲快照層次;③在每層所可存儲的快照僅為最近的β個,其中β取值為大于α的正整數(shù);④Tminαi表示的則是第i層對應(yīng)的時間跨度.
對比未改進之前的金字塔時間結(jié)構(gòu),將其進行改進之后,對于參數(shù)存儲快照是可以結(jié)合用戶的精度需求來進行設(shè)置的,包括Tmin等參數(shù),而且使得快照是不會出現(xiàn)冗余問題的,也不用進行刪除處理.
性質(zhì)1 在改進后的金字塔時間結(jié)構(gòu)下,假如將當(dāng)前時間點以Tc表示,用戶指定時間跨度則以h表示,那么要求在Ts時刻,存在快照滿足Tc-Ts≤2h.
依據(jù)改進金字塔結(jié)構(gòu),能夠得到在第r個時刻產(chǎn)生的時間序列可表示為tr,t0代表的則是起始時刻點,那么X=Nt1∪Nt2∪…∪Nti∪…,表示的是BP神經(jīng)網(wǎng)絡(luò)組合模型,其中:Nti為從時刻ti-1到ti的BP神經(jīng)網(wǎng)絡(luò)分段.
因此,在對LGE進行刪除之前,對應(yīng)的非密集單元具有的誤差水平應(yīng)當(dāng)能夠控制在ε以下,而且不會由于刪除而使得密集單元輸出的正確性受到影響.因此,當(dāng)ε為給定的前提下,要求對潛在密集網(wǎng)格單元進行存儲,以此來實現(xiàn)對空間復(fù)雜度的有效降低.
為了更好地驗證本文算法的性能,對文中計算機網(wǎng)絡(luò)上傳數(shù)據(jù)精度進行了界定.如圖1、圖2所示,分別表示的是在真實數(shù)據(jù)集KDD-CUP-99,以及仿真數(shù)據(jù)集B300kC5D30S6的情況下,CMDBPNN以及CluStream具有的精度水平.由于Python解析計算機網(wǎng)絡(luò)上傳數(shù)據(jù)算法采用子空間計算機網(wǎng)絡(luò)上傳數(shù)據(jù),面對雙重數(shù)據(jù)也能夠進行有效的處理,而且對于任意形式分布計算機網(wǎng)絡(luò)上傳數(shù)據(jù)的效果也是很好的.因此,對比CluStream,本文算法具有更好的精度水平,相關(guān)參數(shù)設(shè)置為τ=0.002,ε=0.05τ,h=10,l=5.
圖1 基于KDD-CUP-99的精度比較(數(shù)據(jù)流100組/秒)
圖2 基于仿真數(shù)據(jù)集的精度比較(數(shù)據(jù)流500組/秒)
利用真實數(shù)據(jù)集KDD-CUP-99,對算法具有的執(zhí)行效率進行分析,將CMDBPNN算法和CluStream展開對比,而且要求進行周期性的快照存貯,進行實驗時,則以快照存儲于內(nèi)存中.結(jié)合圖3,盡管CMDBPNN算法的子空間計算機網(wǎng)絡(luò)上傳數(shù)據(jù)需要一定的時間耗費,然而,是不需要CluStream進行頻繁的聚合、增刪等操作的.因此,能夠得出,CMDBPNN與CluStream具有基本相同的執(zhí)行效率,相關(guān)參數(shù)設(shè)置為τ=0.005,ε=0.1τ,h=10,l=5.
實驗中還生成了B300kC5D30S6仿真數(shù)據(jù)集,以對算法內(nèi)存占用情況進行有效的分析,在內(nèi)存中主要是對數(shù)據(jù)結(jié)構(gòu)SET進行存儲,而在硬盤中則進行快照存儲.結(jié)合圖4,能夠得出,該算法中所需的內(nèi)存空間并不大,而且如果CMDBPNN呈現(xiàn)出了相對穩(wěn)定的分布,那么此時對應(yīng)的內(nèi)存狀態(tài)也是比較穩(wěn)定的.而且如果具有的密度閾值較大,那么此時其中的潛在密集網(wǎng)格也僅有少部分需要維護,因此內(nèi)存占用較少,在實驗中相關(guān)參數(shù)設(shè)置如下:ε=0.05τ,h=10,l=5.
將得到的B300kC5D30S6數(shù)據(jù)集分別取不同的維數(shù),15,20,25,30,35得到對應(yīng)的仿真數(shù)據(jù)集,以分析BP神經(jīng)網(wǎng)絡(luò)組合模型空間維度對算法的影響,參數(shù)設(shè)置為:τ=0.005,ε=0.1τ,h=10,l=6.
為測試CMDBPNN所含計算機網(wǎng)絡(luò)上傳數(shù)據(jù)維數(shù)的伸縮性,生成B300kC5D30S6,取其在4,5,6,7和8維數(shù)下的仿真數(shù)據(jù)集,并且分析τ=0.005,ε=0.1τ,h=10的情況下,當(dāng)維數(shù)為4,5時,l=4,6,7;當(dāng)維數(shù)為8時l=6的情況,結(jié)合圖3及圖4,能夠得出不管是空間維數(shù)還是計算機網(wǎng)絡(luò)上傳數(shù)據(jù)維數(shù)都具有較好的伸縮性.
圖3 對數(shù)據(jù)空間維數(shù)的伸縮性
圖4 對所含計算機網(wǎng)絡(luò)上傳數(shù)據(jù)維數(shù)的伸縮性
針對計算機網(wǎng)絡(luò)上傳數(shù)據(jù)問題,提出了融合雙重BP神經(jīng)網(wǎng)絡(luò)組合模型的Python解析計算機網(wǎng)絡(luò)上傳數(shù)據(jù)算法.該算法對于雙重BP神經(jīng)網(wǎng)絡(luò)組合模型的數(shù)據(jù)上傳問題能夠有效解決,任何形態(tài)分布的計算機網(wǎng)絡(luò)上傳數(shù)據(jù)都能夠?qū)崿F(xiàn).而且,對優(yōu)化之后的金字塔時間結(jié)構(gòu),對其中潛藏的網(wǎng)格單元來實施有效的存儲.最終結(jié)果表明:本文算法能夠使得計算機網(wǎng)絡(luò)上傳數(shù)據(jù)具有較高的實現(xiàn)效率.