李品磊 胡日鵬 葛馨遠(yuǎn) 陳劍 王照
摘要:隨著低壓配電網(wǎng)的應(yīng)用和拓展,這使得配電網(wǎng)臺區(qū)識別服務(wù)平臺的壓力不斷提升,而傳統(tǒng)的配電網(wǎng)臺區(qū)識別服務(wù)平臺存在運算和匹配速度過慢的問題,因此提出基于多模式匹配的配電網(wǎng)臺區(qū)識別服務(wù)平臺研究。通過多模式匹配算法對數(shù)據(jù)進行預(yù)處理,經(jīng)由配電網(wǎng)臺區(qū)數(shù)組識別匹配,建立識別服務(wù)平臺的搜索樹算法。通過實驗驗證,傳統(tǒng)的識別方法與此識別方法在運算速度上的差異。證明了多模式匹配算法,具有效率高的特點,滿足識別服務(wù)平臺的需求
關(guān)鍵詞:運算;識別;準(zhǔn)確性;運算效率
中圖分類號;TM72文獻(xiàn)標(biāo)識碼:A
0引言
低壓配電網(wǎng)是連接著大部分的普通用電戶的方法,而為了方便管理者進行管理,建立起了配電網(wǎng)臺區(qū)識別服務(wù)平臺[1]。目前的配電網(wǎng)服務(wù)平臺所采用的算法多為AC算法或者WM算法。不過目前用戶不斷增加,傳統(tǒng)的運算方法難以滿足用戶需求。多模式匹配一次匹配過程中就可以完成對于多種模式下的匹配,可以滿足配電網(wǎng)臺區(qū)識別服務(wù)平臺的要求。配電網(wǎng)臺區(qū)識別服務(wù)平臺可以幫助低壓配電網(wǎng)管理中促進主動搶修和推進故障,可以遠(yuǎn)程對用戶的異常用電進行檢測,也避免了竊電現(xiàn)象的出現(xiàn)。
1多模式匹配識別服務(wù)平臺
1.1用戶數(shù)據(jù)預(yù)處理
多模式匹配技術(shù)是依靠樹狀的數(shù)據(jù)鏈,并將其構(gòu)成一個搜索樹狀圖,在此平臺的運算過程中,樹的高度取決于模式串的數(shù)量,在擁有大量數(shù)據(jù)集的情況下,算法的效率會變得低下[2]。對此情況,對于數(shù)據(jù)集首先進行排列,并將其排序成字典性的模式串,使用Leaf-Attaching算法對模式串使用變量記錄進行壓縮,可以使得多余的內(nèi)存空間得到釋放。重復(fù)該過程直到使全部的模式串完成識別和遍歷。在預(yù)處理運算中,會生成一個有限狀態(tài)自動機FSM,可以表示為:
1.2配電網(wǎng)臺區(qū)數(shù)組識別匹配
對于識別方法的改進,建立一個完全二叉搜索樹算法。用運算的數(shù)組搜索來實現(xiàn)搜索數(shù)組的目的[3]。使用完全二叉搜索樹算法,可以讓搜索運行中所占用的內(nèi)存得到降低。因為有緩存數(shù)據(jù),也可以讓運算變得更快。搜索過程中,使用哈策分組法預(yù)處理階段將一棵較大的完全二叉搜索樹按照模式串前k個字符的哈希值拆分成不同的組。在模式匹配階段,每次進行精確匹配時,先計算文本串中待匹配子串的前k個字符的哈希值,再根據(jù)哈希值遍歷對應(yīng)分組中的完全二叉搜索樹實現(xiàn)模式串匹配過程[4]。使用完全二叉搜索樹算法讓平臺對于配電臺數(shù)組進行識別匹配。
1.3識別用戶詞頻及意見
在多模式匹配的場景下,將數(shù)組實現(xiàn)的完全二叉搜索樹算法運用于 ELSM 算法構(gòu)造完全二叉搜索樹的過程中[5]。該算法在使用中需要考慮到在多模式匹配算法中由于的模式串信息在進行模式匹配的同時,對該存儲的地址容器就已經(jīng)進行識別,在完全二叉搜索樹中,對于特定的數(shù)組實現(xiàn)其數(shù)組的完全二叉搜索樹,該情況是對于數(shù)組中存儲的不同模式串搜索容器中的不同數(shù)值以及其索引值,并且在該數(shù)組的下標(biāo)范圍為到
,這里的
表示著二叉樹中節(jié)點的數(shù)量。假設(shè)目前節(jié)點在數(shù)組中的下標(biāo)為
,則當(dāng)前節(jié)點的左孩子節(jié)點的下標(biāo)為
,當(dāng)前節(jié)點的右孩子節(jié)點下標(biāo)為
。
此算法在使用遞歸的運算結(jié)構(gòu)的同時又在構(gòu)造上融合二叉搜索樹,并且該算法具有如下特性:在該算法進行運算時,對一個二叉搜索樹進行中序遍歷,則輸出的是一個有序序列,而且有序序列的第一個元素一定是二叉搜索樹最左孩子節(jié)點,當(dāng)?shù)谝辉卮_認(rèn)為最左孩子節(jié)點時,則第二個元素肯定是最左孩子節(jié)點的父節(jié)點,因此可以在對數(shù)組形式的樹進行中序遍歷的過程中將元素添加到數(shù)組中。同時為了方便使用者收集用戶的意見,系統(tǒng)將會提供相關(guān)的對于收集詞頻的方法,即(2)
2 實驗設(shè)計分析
2.1實驗準(zhǔn)備
設(shè)計實驗,對比本文設(shè)計的識別方法和傳統(tǒng)常見的AC算法識別平臺以及WM算法的識別服務(wù)平臺的情況,測試在多模式匹配算法與傳統(tǒng)算法的性能關(guān)系。實驗的設(shè)備條件為,單核 Xeon 2.2Ghz 處理器,4GB 內(nèi)存,Ubuntu 14.04 64 位操作系統(tǒng)環(huán)境下,使用C++編程語言實現(xiàn)。設(shè)計程序隨機生成模式集,使用這三種識別算法對模擬集進行識別,并且根據(jù)識別速度,來評估這三個識別系統(tǒng)的優(yōu)劣性。
2.2實驗結(jié)果分析
實驗結(jié)果表1所示。
如圖1所示,AC算法在運算超過的模擬集時,因為運算時占用的內(nèi)存過高,使得實驗設(shè)備無法支撐,后續(xù)的實驗運算無法支撐。同時也說明了AC算法在運算中占用內(nèi)存過高的情況,而本文算法的運算速度均優(yōu)于AC和WM識別方法。并且本算法步驟清晰,較為簡潔,能夠很好的滿足高效性和準(zhǔn)確性,能夠很好的完成服務(wù)發(fā)現(xiàn)與識別的功能需求。本算法為基礎(chǔ)實現(xiàn)的服務(wù)發(fā)現(xiàn)與識別模塊,能夠為配電網(wǎng)臺區(qū)識別服務(wù)平臺,提供穩(wěn)定且準(zhǔn)確的識別服務(wù)來源,可以為后續(xù)服務(wù)接入與用戶捜索提供支持。
3結(jié)束語
本文對基于多模式匹配的配電網(wǎng)臺區(qū)識別服務(wù)平臺的算法進行重新改良,針對多模式匹配算法預(yù)處理階段的模式串的壓縮進行改良,對于配電網(wǎng)臺區(qū)數(shù)組的識別匹配建立二叉搜索樹算法,改善識別服務(wù)平臺的搜索樹算法,設(shè)計實驗進行分析,實驗結(jié)果顯示,本文所改良的方法在運算速度上優(yōu)于傳統(tǒng)方法。
參考文獻(xiàn)
[1]?伊力亞爾·達(dá)吾提.維吾爾文本處理中多模式匹配的應(yīng)用[J].電腦知識與技術(shù),2019,15(16):210-211.
[2]?曹為政,葛蒙蒙.多模式匹配算法研究和優(yōu)化[J].智能計算機與應(yīng)用,2018,8(02):129-133.
[3]?王守相,張衛(wèi)濤,葛磊蛟.智能配電網(wǎng)統(tǒng)一模型云與應(yīng)用服務(wù)技術(shù)系統(tǒng)[J].電力自動化設(shè)備,2015,35(02):49-54.?[4]?宣菊琴.配電網(wǎng)全過程網(wǎng)格化管理實踐研究[J].中國管理信息化,2019,22(24):73-75.
[5]?陳洪濤,王法玉,靳彩園,等.多模式匹配算法的應(yīng)用與改進[J].中國科技信息,2019(23):78-80.
第一作者簡介:李品磊(Li PinLei),1989年6月5日,男,漢族,湖南邵陽,研究生,中級工程師,電力信息系統(tǒng)研究