王文煥,郭鵬,詹榮榮,楊國(guó)生,李妍霏,李俊恒
(電網(wǎng)安全與節(jié)能?chē)?guó)家重點(diǎn)實(shí)驗(yàn)室(中國(guó)電力科學(xué)研究院有限公司),北京 100192)
繼電保護(hù)專(zhuān)業(yè)管理包括保護(hù)裝置狀態(tài)評(píng)價(jià)、動(dòng)作分析,涵蓋消缺、檢修、反措、技改、巡檢巡視的全壽命周期管理,分布在繼電保護(hù)統(tǒng)計(jì)分析及運(yùn)行管理、繼電保護(hù)狀態(tài)評(píng)價(jià)及狀態(tài)檢修、繼電保護(hù)及故障信息系統(tǒng)、故障錄波聯(lián)網(wǎng)系統(tǒng)、在線監(jiān)視與智能診斷系統(tǒng)、變電站配置描述(substation configuration description,SCD)文件管控系統(tǒng)等多個(gè)繼電保護(hù)專(zhuān)業(yè)軟件系統(tǒng)中。繼電保護(hù)專(zhuān)業(yè)信息獲取手段日趨豐富,信息完整性不斷提升,然而,不同信息系統(tǒng)相對(duì)獨(dú)立、數(shù)據(jù)交互受限,難以為繼電保護(hù)專(zhuān)業(yè)管理提供全局應(yīng)用支撐。以交直流混聯(lián)大電網(wǎng)運(yùn)行對(duì)繼電保護(hù)的更高要求為目標(biāo),并伴隨著大數(shù)據(jù)與人工智能技術(shù)的快速發(fā)展,繼電保護(hù)專(zhuān)業(yè)管理正在經(jīng)歷不同繼電保護(hù)專(zhuān)業(yè)系統(tǒng)數(shù)據(jù)融合、深化繼電保護(hù)全局應(yīng)用的專(zhuān)業(yè)發(fā)展過(guò)程。目前繼電保護(hù)數(shù)據(jù)模型是以數(shù)據(jù)對(duì)象間的基本關(guān)聯(lián)關(guān)系為依據(jù),通過(guò)業(yè)務(wù)過(guò)程將數(shù)據(jù)對(duì)象間關(guān)聯(lián)關(guān)系組織起來(lái)的。但是,各種類(lèi)型繼電保護(hù)裝置眾多,不同類(lèi)別、不同特性保護(hù)裝置包含的數(shù)據(jù)對(duì)象豐富,不同數(shù)據(jù)對(duì)象的特性、數(shù)據(jù)量、訪問(wèn)流量有相當(dāng)差異,例如臺(tái)賬數(shù)據(jù)約150萬(wàn)條,告警數(shù)據(jù)約2億條,缺陷數(shù)據(jù)約100萬(wàn)條,數(shù)據(jù)對(duì)象間的關(guān)聯(lián)特性不同,包括一對(duì)一、一對(duì)多、多對(duì)一、多對(duì)多關(guān)系等,數(shù)據(jù)模型結(jié)構(gòu)合理性對(duì)繼電保護(hù)業(yè)務(wù)應(yīng)用訪問(wèn)數(shù)據(jù)的效率產(chǎn)生直接的影響,有必要考慮不同數(shù)據(jù)對(duì)象特性、數(shù)據(jù)量、訪問(wèn)流量的差異性,以及不同數(shù)據(jù)對(duì)象間的關(guān)聯(lián)關(guān)系,對(duì)繼電保護(hù)專(zhuān)業(yè)模型結(jié)構(gòu)和數(shù)據(jù)訪問(wèn)路徑進(jìn)行優(yōu)化,提升專(zhuān)業(yè)應(yīng)用對(duì)海量異構(gòu)數(shù)據(jù)的訪問(wèn)效率。
繼電保護(hù)數(shù)據(jù)結(jié)構(gòu)主要包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),業(yè)務(wù)應(yīng)用端通常采用結(jié)構(gòu)化數(shù)據(jù)建模,相比其他2種數(shù)據(jù)模型結(jié)構(gòu),在數(shù)據(jù)檢索效率上具備明顯優(yōu)勢(shì)。但隨著繼電保護(hù)專(zhuān)業(yè)數(shù)據(jù)體量的增加,繼電保護(hù)專(zhuān)業(yè)軟件系統(tǒng)普遍面臨數(shù)據(jù)查詢(xún)效率下降的問(wèn)題,數(shù)據(jù)模型結(jié)構(gòu)優(yōu)化程度不足是其中的主要原因。在繼電保護(hù)數(shù)據(jù)模型結(jié)構(gòu)優(yōu)化方面,文獻(xiàn)[1]研究了基于IEC 61850的智能電子設(shè)備(intelligent electronic device,IED)數(shù)據(jù)結(jié)構(gòu)優(yōu)化設(shè)計(jì)方法,文獻(xiàn)[2]提出了基于統(tǒng)一建模語(yǔ)言(unified modeling language,UML)和可擴(kuò)展標(biāo)記語(yǔ)言(extensible markup language,XML)的數(shù)據(jù)結(jié)構(gòu)模型優(yōu)化方法,文獻(xiàn)[3]提出了適用于非結(jié)構(gòu)化數(shù)據(jù)(如錄波、定值單等)及半結(jié)構(gòu)化數(shù)據(jù)(如SCD、SPCD等XML格式數(shù)據(jù))的數(shù)據(jù)模型結(jié)構(gòu)優(yōu)化方法,文獻(xiàn)[4]提出了基于Petri網(wǎng)的UML形式化結(jié)構(gòu)建模方法。上述研究對(duì)繼電保護(hù)數(shù)據(jù)模型結(jié)構(gòu)優(yōu)化方面起到一定作用,但仍缺少數(shù)據(jù)模型結(jié)構(gòu)優(yōu)化程度指標(biāo)、主站端結(jié)構(gòu)化數(shù)據(jù)的模型結(jié)構(gòu)優(yōu)化方法的研究。
考慮繼電保護(hù)數(shù)據(jù)對(duì)象間相互關(guān)聯(lián),將數(shù)據(jù)對(duì)象抽象為網(wǎng)絡(luò)節(jié)點(diǎn),數(shù)據(jù)對(duì)象間關(guān)聯(lián)關(guān)系抽象為網(wǎng)絡(luò)通路,繼電保護(hù)數(shù)據(jù)模型可以使用網(wǎng)絡(luò)形式予以表征。通過(guò)該模型網(wǎng)絡(luò)訪問(wèn)繼電保護(hù)數(shù)據(jù)的便利程度可應(yīng)用復(fù)雜網(wǎng)絡(luò)理論[5]進(jìn)行分析。復(fù)雜網(wǎng)絡(luò)理論作為一種網(wǎng)絡(luò)分析方法,在電力系統(tǒng)連鎖故障預(yù)測(cè)領(lǐng)域取得一定的應(yīng)用[6]。雖然復(fù)雜網(wǎng)絡(luò)方法無(wú)論是在理論和實(shí)際應(yīng)用中都存在很多問(wèn)題需要解決[7],但它提供了通過(guò)網(wǎng)絡(luò)的宏觀參數(shù)來(lái)研究網(wǎng)絡(luò)結(jié)構(gòu)特性的視角,對(duì)于繼電保護(hù)數(shù)據(jù)模型網(wǎng)絡(luò)性能的評(píng)估具備一定的指導(dǎo)意義。
繼電保護(hù)數(shù)據(jù)模型搜索優(yōu)化可以轉(zhuǎn)化成搜索復(fù)雜網(wǎng)絡(luò)的最優(yōu)路徑。最短路徑算法是圖論中具有網(wǎng)絡(luò)特色和突出效果的理論分支,兼具悠久的研究歷史和現(xiàn)代應(yīng)用價(jià)值,典型的最短路徑算法包括Dijkstra算法[8]、弗洛伊德(Floyd)算法[9]、Bellman-Ford算法[10]、單源最短路(shortest path faster algorithm,SPFA)算法[11]等。最短路徑算法在大數(shù)據(jù)技術(shù)查詢(xún)算法中也有應(yīng)用,文獻(xiàn)[12]提出了適用于Hadoop平臺(tái)的最短路徑算法圖搜索算法,包括對(duì)分布式文件系統(tǒng)(hadoop distributed file system,HDFS)中大規(guī)模圖的分割,以及基于MapReduce的子圖內(nèi)查詢(xún)和子圖間查詢(xún),提高了大規(guī)模圖最短路徑查詢(xún)的效率。文獻(xiàn)[13]基于雙向最短路徑算法對(duì)單詞和文本的相似性進(jìn)行評(píng)估,建立知識(shí)庫(kù)中顆粒度比詞條更密的節(jié)點(diǎn)之間的超鏈接關(guān)系,實(shí)現(xiàn)單次和文本語(yǔ)義的相似性評(píng)估。
本文以提高繼電保護(hù)一體化數(shù)據(jù)模型的數(shù)據(jù)訪問(wèn)效率為目標(biāo),分析繼電保護(hù)專(zhuān)業(yè)管理對(duì)一體化數(shù)據(jù)建模的需求,提出繼電保護(hù)數(shù)據(jù)模型結(jié)構(gòu)優(yōu)化指標(biāo)及優(yōu)化方法;考慮業(yè)務(wù)應(yīng)用對(duì)數(shù)據(jù)對(duì)象訪問(wèn)順序,依據(jù)數(shù)據(jù)對(duì)象間的關(guān)聯(lián)關(guān)系建立有向圖,將數(shù)據(jù)表映射為節(jié)點(diǎn),將數(shù)據(jù)訪問(wèn)順序映射為路徑,將數(shù)據(jù)表的查詢(xún)耗時(shí)映射為路徑長(zhǎng)度,通過(guò)最短路徑算法對(duì)數(shù)據(jù)模型結(jié)構(gòu)和訪問(wèn)順序進(jìn)行優(yōu)化,提升專(zhuān)業(yè)應(yīng)用對(duì)海量異構(gòu)數(shù)據(jù)的訪問(wèn)效率。
繼電保護(hù)的不同業(yè)務(wù)應(yīng)用均是繼電保護(hù)專(zhuān)業(yè)管理的組成部分,不同業(yè)務(wù)應(yīng)用的協(xié)同關(guān)聯(lián)是實(shí)現(xiàn)繼電保護(hù)專(zhuān)業(yè)管理的基本途徑,繼電保護(hù)專(zhuān)業(yè)數(shù)據(jù)發(fā)揮了不同業(yè)務(wù)應(yīng)用間關(guān)聯(lián)紐帶的作用。圖1繪制了繼電保護(hù)基本業(yè)務(wù)的邏輯關(guān)系圖,以及繼電保護(hù)專(zhuān)業(yè)數(shù)據(jù)在業(yè)務(wù)應(yīng)用間的流轉(zhuǎn)情況。
圖1所示的繼電保護(hù)專(zhuān)業(yè)數(shù)據(jù)中,直接上報(bào)或人工現(xiàn)場(chǎng)采集錄入的信息為基礎(chǔ)信息,包括1~10,以及20巡檢巡視結(jié)果中人工現(xiàn)場(chǎng)錄入部分。
圖1 繼電保護(hù)業(yè)務(wù)應(yīng)用數(shù)據(jù)流簡(jiǎn)圖
圖1中基礎(chǔ)信息外的其他信息是繼電保護(hù)專(zhuān)業(yè)應(yīng)用對(duì)基礎(chǔ)信息進(jìn)行處理和分析后,生成的分析結(jié)果,可以提供給其他專(zhuān)業(yè)應(yīng)用或者用于信息展示?;A(chǔ)信息的含義及數(shù)據(jù)量如表1所示。
表1 繼電保護(hù)基礎(chǔ)信息概覽表
繼電保護(hù)專(zhuān)業(yè)數(shù)據(jù)是支撐繼電保護(hù)業(yè)務(wù)實(shí)施的“血液”,而繼電保護(hù)數(shù)據(jù)模型是繼電保護(hù)業(yè)務(wù)應(yīng)用訪問(wèn)、處理專(zhuān)業(yè)數(shù)據(jù)的媒介。繼電保護(hù)數(shù)據(jù)模型一方面將取自不同數(shù)據(jù)源、分散獨(dú)立的專(zhuān)業(yè)數(shù)據(jù)組織起來(lái),另一方面為支撐專(zhuān)業(yè)應(yīng)用開(kāi)展融合了基礎(chǔ)信息、中間變量和分析結(jié)論等類(lèi)別信息。繼電保護(hù)數(shù)據(jù)模型具體涵蓋了:
1)物理實(shí)體的描述信息、配置信息,例如:繼電保護(hù)裝置等二次裝置,斷路器等一次設(shè)備,業(yè)務(wù)應(yīng)用系統(tǒng)服務(wù)器、工控機(jī)、通訊裝置等實(shí)體設(shè)備的屬性描述信息;
2)信息對(duì)象的配置信息,包括繼電保護(hù)裝置等實(shí)體裝置涵蓋的信息對(duì)象的配置信息,例如,告警、動(dòng)作、定值等信息節(jié)點(diǎn)的配置信息,工作電壓、光口強(qiáng)度等的配置信息等;
3)物理實(shí)體或信息對(duì)象間的關(guān)聯(lián)關(guān)系,例如,二次設(shè)備與一次設(shè)備的關(guān)聯(lián)關(guān)系,物理光纖與兩端的插件、端口的關(guān)聯(lián)關(guān)系,保護(hù)功能狀態(tài)與保護(hù)功能閉鎖的關(guān)聯(lián)關(guān)系等;
4)支撐業(yè)務(wù)應(yīng)用的中間變量及變量關(guān)聯(lián)配置信息,例如,狀態(tài)評(píng)價(jià)算法的配置,算法的抽象變量,從歷史數(shù)據(jù)中提煉的對(duì)照標(biāo)度,對(duì)抽象變量以及對(duì)照標(biāo)度進(jìn)行數(shù)學(xué)計(jì)算所得結(jié)果,算法的控制參數(shù)如迭代次數(shù)、收斂判據(jù)等;
5)大量的實(shí)體信息,即圖1中除一次設(shè)備信息、保護(hù)臺(tái)賬等物理實(shí)體配置信息外的保護(hù)設(shè)備功能配置及定值、運(yùn)行狀況、運(yùn)維記錄以及業(yè)務(wù)應(yīng)用分析結(jié)論等實(shí)體信息。
繼電保護(hù)數(shù)據(jù)查詢(xún)效率取決于繼電保護(hù)數(shù)據(jù)模型結(jié)構(gòu)、級(jí)聯(lián)數(shù)據(jù)表訪問(wèn)次序,以及數(shù)據(jù)庫(kù)層面的措施。這3個(gè)因素中,前兩個(gè)是從是否滿足繼電保護(hù)業(yè)務(wù)應(yīng)用需求的角度確定的,第3個(gè)因素是從實(shí)現(xiàn)層面提出的,例如文獻(xiàn)[14]指出的索引、分區(qū)、結(jié)構(gòu)化查詢(xún)語(yǔ)言(structured query language,SQL)語(yǔ)句優(yōu)化等。本節(jié)主要考慮前2個(gè)因素。
2.1.1 繼電保護(hù)數(shù)據(jù)模型網(wǎng)絡(luò)
繼電保護(hù)數(shù)據(jù)模型是將反映不同業(yè)務(wù)過(guò)程的數(shù)據(jù)表進(jìn)行邏輯關(guān)聯(lián)和屬性組合的有機(jī)體系,將數(shù)據(jù)表抽象成節(jié)點(diǎn),將數(shù)據(jù)表間的引用、級(jí)聯(lián)等關(guān)聯(lián)關(guān)系抽象成連線,繼電保護(hù)數(shù)據(jù)模型實(shí)質(zhì)上構(gòu)成了數(shù)據(jù)模型網(wǎng)絡(luò)。數(shù)據(jù)模型中任意一個(gè)數(shù)據(jù)對(duì)象屬性信息的變化或與其他數(shù)據(jù)對(duì)象關(guān)聯(lián)方式的變化均會(huì)改變數(shù)據(jù)模型網(wǎng)絡(luò)的結(jié)構(gòu)。查詢(xún)數(shù)據(jù)時(shí),通常需要從給定條件所在的源數(shù)據(jù)表出發(fā),進(jìn)行一步搜索,得到滿足給定條件的數(shù)據(jù)及屬性信息;通過(guò)數(shù)據(jù)模型網(wǎng)絡(luò)的連線確定一張中間數(shù)據(jù)表,進(jìn)行一步搜索,得到符合剛搜索到的屬性信息的數(shù)據(jù),并獲取新的屬性信息,再通過(guò)數(shù)據(jù)模型網(wǎng)絡(luò)的連線確定下一張數(shù)據(jù)表,搜索新的數(shù)據(jù)和屬性信息,直至目標(biāo)數(shù)據(jù)表,依據(jù)上一張數(shù)據(jù)表的數(shù)據(jù)和屬性信息搜索到目標(biāo)數(shù)據(jù)。數(shù)據(jù)搜索共涉及到包含源數(shù)據(jù)表、中間數(shù)據(jù)表、目標(biāo)數(shù)據(jù)表在內(nèi)的級(jí)聯(lián)數(shù)據(jù)表。例如,在統(tǒng)計(jì)不同型號(hào)保護(hù)裝置告警信息的業(yè)務(wù)中,需要查詢(xún)某條告警數(shù)據(jù)對(duì)應(yīng)的保護(hù)裝置型號(hào)。數(shù)據(jù)搜索過(guò)程如圖2所示。以某告警數(shù)據(jù)為起點(diǎn),通過(guò)該告警數(shù)據(jù)的告警配置Id屬性信息,在保護(hù)告警配置表搜索到符合該告警配置Id的數(shù)據(jù)以及數(shù)據(jù)集Id屬性信息,再在數(shù)據(jù)集表中搜索到符合該數(shù)據(jù)集Id的數(shù)據(jù)以及IED Id屬性信息,以此類(lèi)推,最后,在保護(hù)裝置型號(hào)表中搜索符合保護(hù)裝置表搜索到的數(shù)據(jù)及裝置型號(hào)Id屬性信息的保護(hù)裝置型號(hào)目標(biāo)數(shù)據(jù)。
圖2 數(shù)據(jù)搜索示例
數(shù)據(jù)模型網(wǎng)絡(luò)是以數(shù)據(jù)表關(guān)系為基礎(chǔ),以繼電保護(hù)信息對(duì)象轉(zhuǎn)化成的數(shù)據(jù)表為單元,構(gòu)成的網(wǎng)絡(luò)化的抽象結(jié)構(gòu)。繼電保護(hù)數(shù)據(jù)模型網(wǎng)絡(luò)可抽象為一張有向圖,根據(jù)數(shù)據(jù)表的關(guān)聯(lián)特性能夠確定有向圖中連線的方向,主要包括如下4種情形:
1)外鍵關(guān)聯(lián)。數(shù)據(jù)表通過(guò)外鍵引用其他數(shù)據(jù)表主鍵,查詢(xún)方向?yàn)閺囊脭?shù)據(jù)表指向被引用數(shù)據(jù)表,例如圖2中保護(hù)裝置表通過(guò)外鍵引用保護(hù)裝置型號(hào)表的主鍵—裝置型號(hào)Id,數(shù)據(jù)查詢(xún)方向如圖中標(biāo)識(shí)所示;
2)唯一性字段關(guān)聯(lián)。數(shù)據(jù)表間通過(guò)唯一不重復(fù)的屬性字段建立關(guān)聯(lián),查詢(xún)方向通常為雙向。例如圖2中保護(hù)裝置表與IED裝置表可通過(guò)具備唯一性的設(shè)備識(shí)別代碼屬性字段建立關(guān)聯(lián),既可以從保護(hù)裝置表查詢(xún)到IED裝置表,也可以從IED裝置表查詢(xún)到保護(hù)裝置表,圖中僅示出了其中一個(gè)方向;
3)輔助表關(guān)聯(lián)。針對(duì)需要引用被引用數(shù)據(jù)表多條數(shù)據(jù)的應(yīng)用場(chǎng)景,建立一張輔助表,通過(guò)外鍵分別指向兩張?jiān)紨?shù)據(jù)表。輔助表能夠靈活地表達(dá)原始表間多對(duì)一、多對(duì)多關(guān)系。由于輔助表僅用于配置原始數(shù)據(jù)表的關(guān)聯(lián)關(guān)系,在有向圖中可簡(jiǎn)化為一條由原始引用表指向原始被引用表的連線。例如,母線保護(hù)裝置與線路、變壓器等多個(gè)一次設(shè)備有關(guān),通過(guò)保護(hù)裝置與一次設(shè)備關(guān)系輔助表,能夠靈活地將母線保護(hù)裝置指向數(shù)量不確定的一次設(shè)備;
4)映射關(guān)聯(lián)。是應(yīng)用經(jīng)模糊匹配或總結(jié)人工經(jīng)驗(yàn)生成的匹配算法,或人工匹配的方式,對(duì)數(shù)據(jù)表中數(shù)據(jù)的屬性信息進(jìn)行自動(dòng)匹配分析,建立起的與其他數(shù)據(jù)表的關(guān)聯(lián)關(guān)系。這是一種間接的關(guān)聯(lián)方式,起因是2個(gè)數(shù)據(jù)表間客觀存在的關(guān)聯(lián)不易獲取,但通常是分析應(yīng)用所需掌握的。映射關(guān)聯(lián)的方向常為外鍵關(guān)聯(lián)的逆向。例如,依據(jù)繼電保護(hù)裝置告警信息,來(lái)判斷裝置告警位置,需要依據(jù)告警信息的語(yǔ)義,以及保護(hù)裝置表中保護(hù)裝置Id,從板卡、回路數(shù)據(jù)表中搜索滿足保護(hù)裝置Id并且符合該告警信息語(yǔ)義的板卡數(shù)據(jù)或回路數(shù)據(jù)。為了后續(xù)應(yīng)用的方便,在獲取到2個(gè)數(shù)據(jù)表中數(shù)據(jù)的關(guān)聯(lián)關(guān)系后,常建立一張映射表。
2.1.2 反映數(shù)據(jù)模型結(jié)構(gòu)優(yōu)化程度的指標(biāo)
一個(gè)優(yōu)異的、便于用戶查詢(xún)數(shù)據(jù)的數(shù)據(jù)模型結(jié)構(gòu)必然具備這樣一些特征,例如,數(shù)據(jù)表關(guān)聯(lián)關(guān)系被充分挖掘,數(shù)據(jù)模型網(wǎng)絡(luò)連接豐富,用戶搜索數(shù)據(jù)所需訪問(wèn)的數(shù)據(jù)表的數(shù)目減少;關(guān)鍵節(jié)點(diǎn)常用于連接不同類(lèi)別應(yīng)用的數(shù)據(jù)表,數(shù)據(jù)模型中心節(jié)點(diǎn)或關(guān)鍵節(jié)點(diǎn)輕量化,搜索不同業(yè)務(wù)數(shù)據(jù)期間訪問(wèn)樞紐數(shù)據(jù)表的耗時(shí)少,提升查詢(xún)的效率。這些特征可以應(yīng)用復(fù)雜網(wǎng)絡(luò)理論[15]中的若干指標(biāo)體現(xiàn)。
1)平均路長(zhǎng)L。定義網(wǎng)絡(luò)中2個(gè)節(jié)點(diǎn)之間的距離dij為由一個(gè)節(jié)點(diǎn)(起始數(shù)據(jù)表)查詢(xún)到另一個(gè)節(jié)點(diǎn)(目標(biāo)數(shù)據(jù)表)的最短路徑對(duì)應(yīng)的距離,而2個(gè)相連節(jié)點(diǎn)(數(shù)據(jù)表)的距離為根據(jù)被引用數(shù)據(jù)表所含數(shù)據(jù)量折算成的查詢(xún)時(shí)間。在一個(gè)網(wǎng)絡(luò)中,平均路長(zhǎng)L是指所有節(jié)點(diǎn)對(duì)之間距離的平均值,即
(1)
如果數(shù)據(jù)模型網(wǎng)絡(luò)豐富,通常能夠減少節(jié)點(diǎn)間最短路徑包含的連線數(shù),減小dij及L;優(yōu)選關(guān)鍵節(jié)點(diǎn)能夠減少跨業(yè)務(wù)應(yīng)用數(shù)據(jù)查詢(xún)?cè)L問(wèn)到該關(guān)鍵數(shù)據(jù)表所耗費(fèi)的時(shí)間,并且最短路徑涵蓋關(guān)鍵節(jié)點(diǎn)的數(shù)據(jù)查詢(xún)項(xiàng)目數(shù)多,減小dij及L。
2)集群系數(shù)C。集群系數(shù)是一個(gè)衡量網(wǎng)絡(luò)節(jié)點(diǎn)集聚程度的概念。對(duì)網(wǎng)絡(luò)中的某一個(gè)節(jié)點(diǎn)i設(shè)有ki個(gè)節(jié)點(diǎn)和其相連,則ki個(gè)節(jié)點(diǎn)之間最多有ki(ki-1)/2條邊,設(shè)ki個(gè)節(jié)點(diǎn)之間現(xiàn)存ti條邊,則定義Ci為
(2)
然后對(duì)所有的Ci取平均值就可得到聚類(lèi)系數(shù)C。
如果數(shù)學(xué)模型網(wǎng)絡(luò)豐富,網(wǎng)絡(luò)節(jié)點(diǎn)集聚程度高,Ci及C增加。
如果數(shù)據(jù)模型網(wǎng)絡(luò)豐富,節(jié)點(diǎn)間的連線數(shù)目增多,平均度數(shù)增加;關(guān)鍵節(jié)點(diǎn)通常有較大的度數(shù),優(yōu)選關(guān)鍵節(jié)點(diǎn)后,訪問(wèn)樞紐數(shù)據(jù)表的耗時(shí)減少,高度數(shù)節(jié)點(diǎn)的權(quán)重增加,平均度數(shù)增加。
在一套繼電保護(hù)數(shù)據(jù)模型網(wǎng)絡(luò)中,隨著模型網(wǎng)絡(luò)結(jié)構(gòu)的豐富,由給定信息所處的數(shù)據(jù)表出發(fā),通過(guò)不同的訪問(wèn)路徑,查詢(xún)到目標(biāo)數(shù)據(jù)所需的查詢(xún)時(shí)間不同。文獻(xiàn)[16]擬合出典型的數(shù)據(jù)存儲(chǔ)架構(gòu)下,查詢(xún)一張數(shù)據(jù)表的平均事務(wù)響應(yīng)時(shí)間為
(3)
式中:C1是查詢(xún)應(yīng)用部署的服務(wù)器數(shù)目;k1是路由系數(shù),在集群環(huán)境下為常數(shù),典型值為65;R1是單次查詢(xún)的路由尋址次數(shù)。例如在Hadoop Database(HBase)架構(gòu)[17]下,R1取2(HBase0.94以下版本)或3(HBase0.96以上版本)[18];k2是數(shù)據(jù)查詢(xún)系數(shù),與查詢(xún)數(shù)據(jù)表所含數(shù)據(jù)量正相關(guān),典型值為600;λ1表示查詢(xún)應(yīng)用的優(yōu)化度,若完全執(zhí)行文獻(xiàn)[16]所述的數(shù)據(jù)庫(kù)查詢(xún)底層優(yōu)化措施數(shù)據(jù)庫(kù)查詢(xún)底層優(yōu)化措施,λ1可取0.1。
由式(3)可知,查詢(xún)單張數(shù)據(jù)表所耗費(fèi)的時(shí)間主要取決于數(shù)據(jù)表所含數(shù)據(jù)量。通過(guò)一個(gè)數(shù)據(jù)模型網(wǎng)絡(luò)選取一條數(shù)據(jù)查詢(xún)路徑,包括初始查詢(xún)條件所在的源數(shù)據(jù)表、目標(biāo)數(shù)據(jù)表以及中間數(shù)據(jù)表,對(duì)應(yīng)的數(shù)據(jù)查詢(xún)效率既取決于該路徑途經(jīng)數(shù)據(jù)表的數(shù)目,又取決于該路徑上每張數(shù)據(jù)表的數(shù)據(jù)量。另外,上文數(shù)據(jù)表關(guān)聯(lián)的4種形式中,通過(guò)外鍵關(guān)聯(lián)、唯一性字段關(guān)聯(lián)兩種方式查詢(xún)數(shù)據(jù)僅需訪問(wèn)被引用數(shù)據(jù)表一張表,通過(guò)輔助表關(guān)聯(lián)、映射關(guān)聯(lián)兩種方式查詢(xún)數(shù)據(jù)需要訪問(wèn)輔助表(或映射表)和原始被引用表兩張表。
3.1.1 數(shù)據(jù)模型結(jié)構(gòu)分層優(yōu)化
3.1.2 增加數(shù)據(jù)表間的引用關(guān)聯(lián)
對(duì)于滿足上述條件的兩張數(shù)據(jù)表,有兩種增加數(shù)據(jù)關(guān)聯(lián)的情形:
1)直接增補(bǔ)。目前數(shù)據(jù)模型網(wǎng)絡(luò)架構(gòu)不存在u1至v1的路徑P1(u1,v1),即Ω(u1,v1)=φ,則建立u1至v1關(guān)聯(lián),關(guān)聯(lián)形式可能是外鍵關(guān)聯(lián)、唯一性字段關(guān)聯(lián)、輔助表關(guān)聯(lián)和映射關(guān)聯(lián);
2)遞推增補(bǔ)。目前數(shù)據(jù)模型網(wǎng)絡(luò)架構(gòu)已至少存在一條u1至v1路徑P2(u1,v1),即Ω(u1,v1)≠φ,則u1中任一條數(shù)據(jù)均能通過(guò)數(shù)據(jù)查詢(xún)的方式與v1中的數(shù)據(jù)建立關(guān)聯(lián),根據(jù)路徑P2(u1,v1)上表關(guān)聯(lián)的具體形式,u1至v1的關(guān)聯(lián)可能是外鍵關(guān)聯(lián)、唯一性字段關(guān)聯(lián)、輔助表關(guān)聯(lián)和映射關(guān)聯(lián)。
s.t.g[R(u,v)·Ω0(u,v)]≠0。
式中:k1、k2、k3為權(quán)重系數(shù),若數(shù)據(jù)模型節(jié)點(diǎn)u與v間建立直接的關(guān)聯(lián)引用關(guān)系,則R(u,v)=1,否則,R(u,v)=0;Ω0(u,v)指在模型增補(bǔ)后,u至v是否存在搜索路徑,若存在Ω0(u,v)=1,否則Ω0(u,v)=0;g(a)為自定義函數(shù),指向量a各元素的累乘。約束條件的物理意義是指經(jīng)直接增補(bǔ)或遞推增補(bǔ)后,不存在任一孤立的數(shù)據(jù)模型節(jié)點(diǎn)。
如圖2所示,數(shù)據(jù)查詢(xún)是按照一定次序依次執(zhí)行數(shù)據(jù)表查詢(xún),從已知的條件信息逐步獲得所期望結(jié)果的過(guò)程,包括源數(shù)據(jù)表查詢(xún)、中間數(shù)據(jù)表查詢(xún)和目標(biāo)數(shù)據(jù)表查詢(xún)。采用不同的查詢(xún)步驟其效率可能會(huì)差別很大。所以,繼電保護(hù)數(shù)據(jù)搜索優(yōu)化可轉(zhuǎn)化為一個(gè)最短路徑問(wèn)題。
現(xiàn)將數(shù)據(jù)搜索優(yōu)化問(wèn)題轉(zhuǎn)化為圖論中的最短路徑問(wèn)題。以數(shù)據(jù)模型網(wǎng)絡(luò)為基礎(chǔ),構(gòu)建有向圖G,將數(shù)據(jù)模型網(wǎng)絡(luò)的數(shù)據(jù)對(duì)象N’映射為G的節(jié)點(diǎn)N,數(shù)據(jù)表間的引用關(guān)聯(lián)R映射為G的邊E。對(duì)于邊e=(p,q)∈E,若可從p查詢(xún)到q,邊e的距離ω(e)為由p查詢(xún)數(shù)據(jù)表q所耗費(fèi)的時(shí)間,如式(3)所示;對(duì)于邊e1=(q,p)∈E,若不可從q查詢(xún)到p,邊e1的距離ω(e1)為一個(gè)大數(shù)M。
設(shè)Ω(u,v)是G中以u(píng),v為端點(diǎn)的路徑集合,W(P(u,v))表示路徑P(u,v)上邊距離之和,繼電保護(hù)數(shù)據(jù)模型優(yōu)化問(wèn)題可表示為在圖G中求Ω(u,v)中的一條路徑P0(u,v),使得
(4)
典型的最短路徑算法包括Dijkstra算法、Floyd算法、Bellman-Ford算法、SPFA算法等,不同算法的比較如表2所示。表中,ξ、ε分別表示圖的頂數(shù)與邊數(shù)。
表2 不同最短路徑算法的比較
級(jí)聯(lián)數(shù)據(jù)表訪問(wèn)次序優(yōu)化屬于單源最短路徑算法,不存在邊的權(quán)重為負(fù)的特殊情況,并且,為滿足繼電保護(hù)業(yè)務(wù)應(yīng)用的需要,繼電保護(hù)數(shù)據(jù)模型網(wǎng)絡(luò)的邊數(shù)ε并非遠(yuǎn)小于ξ2,表2的4種算法中,Dijkstra算法是滿足級(jí)聯(lián)數(shù)據(jù)表訪問(wèn)次序優(yōu)化需求且具有最小時(shí)間復(fù)雜度的算法,所以本文選擇Dijkstra算法進(jìn)行級(jí)聯(lián)數(shù)據(jù)表訪問(wèn)次序優(yōu)化。
Dijkstra算法[19]在電力系統(tǒng)領(lǐng)域已應(yīng)用于最優(yōu)解列斷面搜索[20]、配電網(wǎng)孤島劃分[21]、黑啟動(dòng)策略?xún)?yōu)化[22]、電網(wǎng)故障定位[23]等方面。其基本步驟是:
1)u、v不相鄰時(shí),取ω(u,v)=∞;
2)令w(u0)=0;w(v)=∞,v≠u(mài)0;S0={u0},i=0;
3)對(duì)每個(gè)vSi,用min{w(v),w(ui)+ω(ui,v)}替代w(v);設(shè)ui+1是使w(v)取最小值的V(G)-Si中的頂,令Si+1=Si∪{ui+1};
4)若i=ξ-1,停止;若i<ξ-1,用i+1替代i,轉(zhuǎn)3)。
應(yīng)用Dijkstra算法,在Θ(v,ε)=Ο(ξ2)步數(shù)內(nèi),可計(jì)算出u到v的最短路徑P0(u,v)以及對(duì)應(yīng)的檢索時(shí)間duv,從而實(shí)現(xiàn)繼電保護(hù)數(shù)據(jù)模型搜索優(yōu)化。
為滿足繼電保護(hù)不同業(yè)務(wù)應(yīng)用的需求,采用本文第3章的方法,建立圖1中繼電保護(hù)專(zhuān)業(yè)數(shù)據(jù)的數(shù)據(jù)模型,繼電保護(hù)數(shù)據(jù)模型結(jié)構(gòu)的局部如圖3所示。圖中列出了數(shù)據(jù)表的主鍵英文名、目前數(shù)據(jù)量及若干關(guān)鍵屬性字段。
建立圖3所示的繼電保護(hù)數(shù)據(jù)模型時(shí),考慮到不同實(shí)體間的層次關(guān)系,即
保護(hù)型號(hào)是一批保護(hù)裝置共有的概念,以保護(hù)型號(hào)數(shù)據(jù)表為樞紐,能夠?qū)?yīng)用于同型號(hào)保護(hù)裝置綜合分析的相關(guān)數(shù)據(jù)表(圖3中未示出)關(guān)聯(lián)起來(lái),滿足保護(hù)裝置群體性分析應(yīng)用的需要。保護(hù)裝置是具備獨(dú)立功能的物理實(shí)體,以保護(hù)裝置數(shù)據(jù)表為樞紐,能夠?qū)?yīng)用于保護(hù)裝置全壽命周期管理類(lèi)應(yīng)用的相關(guān)數(shù)據(jù)表(例如圖3中的缺陷管理及檢修檢驗(yàn)管理數(shù)據(jù)表)關(guān)聯(lián)起來(lái),滿足保護(hù)裝置個(gè)體分析、評(píng)價(jià)及管理應(yīng)用的需要。保護(hù)裝置部件是保護(hù)裝置的細(xì)分,如圖3中板卡所示,以保護(hù)裝置部件數(shù)據(jù)表為樞紐,能夠?qū)⒓?xì)化到保護(hù)裝置部件的分析應(yīng)用相關(guān)數(shù)據(jù)表(圖3中未示出)關(guān)聯(lián)起來(lái),使得對(duì)保護(hù)裝置的分析、管理細(xì)化到裝置部件。保護(hù)事件、告警、遙信、模擬量、定值、定值區(qū)、軟壓板等配置信息是保護(hù)裝置的最小信息對(duì)象[24~26],以配置信息數(shù)據(jù)表為樞紐,將保護(hù)裝置在線信息(例如描述告警配置數(shù)據(jù)表中告警點(diǎn)發(fā)生時(shí)間、數(shù)據(jù)值等的告警信息)與配置信息有機(jī)組織起來(lái),為建立與IEC 61850等模型的接口,以及在線信息的深化應(yīng)用奠定良好條件(本節(jié)算例僅舉告警信息一例)。可見(jiàn),通過(guò)將數(shù)據(jù)模型對(duì)象按照其所描述實(shí)體的層次關(guān)系分層布局,實(shí)現(xiàn)了關(guān)鍵節(jié)點(diǎn)數(shù)據(jù)量的輕量化,提升繼電保護(hù)專(zhuān)業(yè)數(shù)據(jù)的訪問(wèn)效率。
圖3 繼電保護(hù)數(shù)據(jù)模型架構(gòu)示意圖
增加數(shù)據(jù)表間的引用關(guān)聯(lián)能夠優(yōu)化繼電保護(hù)數(shù)據(jù)模型結(jié)構(gòu),以數(shù)據(jù)檢索路徑“告警信息→告警配置→數(shù)據(jù)集→IED裝置→保護(hù)裝置→板卡信息”為例,應(yīng)用3.1.2節(jié)的方法構(gòu)造計(jì)算模型,以增加模型間的引用關(guān)聯(lián)與否R(u,v)作為變量,取k1=0.5,k2=0.3,k3=0.2。該檢索路徑上已有的關(guān)聯(lián)關(guān)系如表3中“■”所示,可增加的引用關(guān)聯(lián)如“□”所示。其中,“保護(hù)裝置→板卡信息”可依據(jù)裝置告警或異常現(xiàn)象,建立映射關(guān)聯(lián)。模型中的變量R(u,v)的含義如表4所示。
在國(guó)產(chǎn)達(dá)夢(mèng)數(shù)據(jù)庫(kù)中搭建了仿真計(jì)算環(huán)境,按照?qǐng)D3數(shù)據(jù)模型引用關(guān)系及數(shù)據(jù)體量在數(shù)據(jù)庫(kù)中生成了測(cè)試數(shù)據(jù)。由于本算例規(guī)模小,采用枚舉法計(jì)算,得到優(yōu)化的數(shù)據(jù)模型增補(bǔ)結(jié)果,如表3及表4的最后一列所示。
表3 實(shí)例中關(guān)聯(lián)增補(bǔ)相關(guān)的數(shù)據(jù)模型列表
表4 模型增補(bǔ)變量詳情
表5 模型關(guān)聯(lián)增補(bǔ)后數(shù)據(jù)表的查詢(xún)耗時(shí)
可見(jiàn),上述路徑僅具備增加“告警配置→IED裝置”以及“告警配置→板卡信息”關(guān)聯(lián)的必要,增加其他關(guān)聯(lián)并不利于提高數(shù)據(jù)檢索效率。為了說(shuō)明本方法的有效性,以“告警配置”到“板卡信息”的關(guān)聯(lián)為例。通過(guò)“告警配置→數(shù)據(jù)集→IED裝置→保護(hù)裝置→板卡信息”的遞推序列,能夠建立“告警配置”數(shù)據(jù)表中功能位置(POS_FUNCTION)屬性項(xiàng)與“板卡信息”數(shù)據(jù)表中主鍵DEVBOARD_ID的關(guān)聯(lián),減少了數(shù)據(jù)查詢(xún)遍歷的數(shù)據(jù)表的數(shù)目,也便于實(shí)際應(yīng)用中直接根據(jù)告警配置信息確定隱患板卡。增補(bǔ)結(jié)果如圖3中虛線所示。
圖3中由單裝置軟件版本檢索保護(hù)型號(hào)數(shù)據(jù)時(shí),存在兩條路徑:“單裝置軟件版本→同型號(hào)保護(hù)軟件版本→保護(hù)型號(hào)”和“單裝置軟件版本→保護(hù)裝置→保護(hù)型號(hào)”兩條路徑。由單裝置軟件版本查詢(xún)同型號(hào)軟件版本、保護(hù)裝置的耗時(shí)分別為0.032、0.031 s,由同型號(hào)軟件版本查詢(xún)保護(hù)型號(hào)的耗時(shí)為0.009 s,由保護(hù)裝置查詢(xún)保護(hù)型號(hào)的耗時(shí)為0.262 s,第一條路徑總耗時(shí)0.031 s,第二條路徑總耗時(shí)0.038 s,應(yīng)用Dijkstra算法可得最優(yōu)路徑為“單裝置軟件版本→同型號(hào)軟件版本→保護(hù)型號(hào)”。
由告警信息檢索板卡信息數(shù)據(jù)時(shí),存在3條路徑“告警信息→告警配置→數(shù)據(jù)集→IED裝置→保護(hù)裝置→板卡信息”(路徑a)、“告警信息→告警配置→IED裝置→保護(hù)裝置→板卡信息”(路徑b)和“告警信息→告警配置→板卡信息”(路徑c),3條路徑上相鄰數(shù)據(jù)模型間查詢(xún)耗時(shí)如表5所示,應(yīng)用Dijkstra算法可得最優(yōu)路徑為路徑c。該路徑直接將告警配置信息關(guān)聯(lián)到終節(jié)點(diǎn)板卡信息表,省去了對(duì)數(shù)據(jù)集表、IED裝置表、保護(hù)裝置表的訪問(wèn),訪問(wèn)數(shù)據(jù)表的數(shù)目最小。事實(shí)上,3個(gè)路徑的耗時(shí)分別為:5.212、4.992、4.874 s,應(yīng)用Dijkstra算法確定的數(shù)據(jù)最優(yōu)訪問(wèn)路徑與實(shí)際相符。
本文分析了繼電保護(hù)專(zhuān)業(yè)管理對(duì)一體化數(shù)據(jù)建模的需求,從繼電保護(hù)數(shù)據(jù)模型結(jié)構(gòu)和級(jí)聯(lián)數(shù)據(jù)表訪問(wèn)次序兩方面提出了繼電保護(hù)數(shù)據(jù)查詢(xún)效率的影響因素,考慮業(yè)務(wù)應(yīng)用對(duì)數(shù)據(jù)對(duì)象訪問(wèn)順序,依據(jù)數(shù)據(jù)對(duì)象間的關(guān)聯(lián)關(guān)系建立有向圖,將數(shù)據(jù)表映射為節(jié)點(diǎn),將數(shù)據(jù)訪問(wèn)順序映射為路徑,將數(shù)據(jù)表的數(shù)據(jù)量映射為路徑長(zhǎng)度,通過(guò)Dijkstra算法對(duì)數(shù)據(jù)訪問(wèn)順序進(jìn)行了優(yōu)化,提升了專(zhuān)業(yè)應(yīng)用對(duì)海量異構(gòu)數(shù)據(jù)的訪問(wèn)效率。結(jié)論如下:
2)以提高數(shù)據(jù)模型訪問(wèn)效率為目標(biāo),應(yīng)用Dijkstra算法提出了繼電保護(hù)數(shù)據(jù)模型結(jié)構(gòu)優(yōu)化方法,包括增加數(shù)據(jù)表間的引用關(guān)聯(lián)和數(shù)據(jù)模型結(jié)構(gòu)分層優(yōu)化,以及繼電保護(hù)數(shù)據(jù)查詢(xún)次序優(yōu)化方法;
3)依據(jù)保護(hù)型號(hào)、保護(hù)裝置、保護(hù)裝置、配置信息等不同實(shí)體,建立了繼電保護(hù)分層數(shù)據(jù)模型,增加了“告警配置→板卡信息”等數(shù)據(jù)表間的引用關(guān)聯(lián),優(yōu)化了繼電保護(hù)數(shù)據(jù)模型結(jié)構(gòu);應(yīng)用Dijkstra算法對(duì)案例中具備多條數(shù)據(jù)訪問(wèn)路徑的數(shù)據(jù)表訪問(wèn)次序進(jìn)行了優(yōu)化,提升了繼電保護(hù)數(shù)據(jù)的查詢(xún)效率。