• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于數(shù)據(jù)挖掘的電力自動(dòng)化系統(tǒng)運(yùn)行數(shù)據(jù)中臺(tái)資源檢索技術(shù)研究

      2023-06-14 02:07:48張旭東謝民黃建平王政
      關(guān)鍵詞:仿真實(shí)驗(yàn)互信息決策樹

      張旭東 謝民 黃建平 王政

      摘要:目前,電網(wǎng)包含了大量多源信息數(shù)據(jù)。想要對(duì)其數(shù)據(jù)信息進(jìn)行高效、準(zhǔn)確的檢索并非易事。為了解決這一問(wèn)題,經(jīng)過(guò)查閱文獻(xiàn)資料,分析實(shí)際電力運(yùn)行系統(tǒng)的數(shù)據(jù)特點(diǎn)及多源數(shù)據(jù)庫(kù)樣本,引入了基于互信息和并行計(jì)算理論的優(yōu)化式?jīng)Q策樹算法,并在此基礎(chǔ)上構(gòu)建了決策樹模型,最后設(shè)置仿真實(shí)驗(yàn)以各種系統(tǒng)數(shù)據(jù)庫(kù)為樣例對(duì)模型進(jìn)行模擬驗(yàn)證。結(jié)果發(fā)現(xiàn)基于互信息和并行計(jì)算的優(yōu)化式?jīng)Q策樹算法對(duì)于大型數(shù)據(jù)庫(kù)可以實(shí)現(xiàn)迅速、精確、有效的多源數(shù)據(jù)檢索目的,同時(shí)還可以完成對(duì)實(shí)時(shí)數(shù)據(jù)的有效處理。該算法按照代表性特征集合直接對(duì)數(shù)據(jù)庫(kù)的原始數(shù)據(jù)進(jìn)行挖掘,并根據(jù)索引信息量大小進(jìn)行排序。以改進(jìn)的決策樹算法為核心技術(shù)的數(shù)據(jù)挖掘方法具有較高的精度,對(duì)于電網(wǎng)的多源數(shù)據(jù)信息能夠較好的實(shí)現(xiàn)挖掘,不但能避免數(shù)據(jù)重復(fù)現(xiàn)象,而且可以滿足工程的決策要求,為提高電網(wǎng)數(shù)據(jù)的高效挖掘提供了可靠的技術(shù)支撐。

      關(guān)鍵詞:數(shù)據(jù)挖掘;電力運(yùn)行系統(tǒng);互信息;決策樹;仿真實(shí)驗(yàn)

      中圖分類號(hào):S816.2文獻(xiàn)標(biāo)志碼:A文章編號(hào):1001-2443(2023)02-0119-07

      引言

      目前,隨著智能電網(wǎng)的持續(xù)開(kāi)發(fā),電網(wǎng)運(yùn)維產(chǎn)生的數(shù)據(jù)量呈指數(shù)級(jí)擴(kuò)大,電力行業(yè)開(kāi)始進(jìn)入大數(shù)據(jù)時(shí)代[1]。電力大數(shù)據(jù)不僅包含了大數(shù)據(jù)的廣義特征,即數(shù)據(jù)量大、數(shù)據(jù)類別多、數(shù)據(jù)發(fā)展速度快、數(shù)據(jù)價(jià)值密度低,還承載著能源行業(yè)的獨(dú)特標(biāo)志,包括大量多維時(shí)空數(shù)據(jù)、相關(guān)數(shù)據(jù)和實(shí)時(shí)響應(yīng)數(shù)據(jù)[2]。另外,這些電力數(shù)據(jù)分別集成在貫通調(diào)度管理系統(tǒng)、生產(chǎn)管理系統(tǒng)、地理信息系統(tǒng)、用電信息管理系統(tǒng)等不同的信息管理系統(tǒng)中。并且,不同的管理平臺(tái)之間的數(shù)據(jù)互不兼容,它們之間包括很多重疊數(shù)據(jù)[3]。另一方面,這些多源數(shù)據(jù)也具有互補(bǔ)關(guān)系,包括多種多樣的電力運(yùn)行信息。因此,如何利用現(xiàn)有信息管理系統(tǒng)的信息,迅速、精確地檢索所需信息,是構(gòu)建配電網(wǎng)多維數(shù)據(jù)融合管理系統(tǒng)的基礎(chǔ)和關(guān)鍵[4]。

      現(xiàn)階段,電力物聯(lián)網(wǎng)發(fā)展正處于泛化的特殊時(shí)期,因此,對(duì)于電網(wǎng)多源數(shù)據(jù)的檢索就需要更加準(zhǔn)確、高效以及采用獨(dú)特的開(kāi)發(fā)方法。也就是說(shuō),現(xiàn)有的信息檢索方法大多與電網(wǎng)數(shù)據(jù)特征不相匹配,所以找到適應(yīng)電網(wǎng)數(shù)據(jù)特點(diǎn)的信息檢索方法就顯得尤為關(guān)鍵[5]。例如,基于電網(wǎng)事故信息并且采取分類以及回歸算法的檢索方式的提出[6];以電力數(shù)據(jù)維數(shù)特征為背景,給出以流形排序?yàn)榛A(chǔ)的電網(wǎng)數(shù)據(jù)信息檢索方式[7];針對(duì)電網(wǎng)數(shù)據(jù)組成結(jié)構(gòu)繁雜的特點(diǎn),提出的一種以B+樹和倒排索引相結(jié)合的多模塊索引結(jié)構(gòu)[8];根據(jù)海量電網(wǎng)狀態(tài)監(jiān)測(cè)數(shù)據(jù)管理平臺(tái)的架構(gòu)體系和作用,設(shè)計(jì)的一種基于Map Reduce的海量數(shù)據(jù)檢索方式[9];利用模糊特征聚類方法對(duì)電力數(shù)據(jù)實(shí)施劃分,提取特征向量,然后采取云計(jì)算手段完成分布式檢索[10]。然而,決策樹算法作為一種適用于數(shù)據(jù)分類和檢索的手段,不僅可以提高檢索的精準(zhǔn)度,也能實(shí)現(xiàn)信息檢索速度的加快?,F(xiàn)階段,常用的決策樹核心算法為ID3(Iterative Dichotomiser 3)算法,該算法利用信息熵來(lái)對(duì)分類進(jìn)行判斷,并且對(duì)系統(tǒng)的有序程度進(jìn)行衡量,以此來(lái)完成區(qū)分任務(wù)。ID3算法不但能夠在樣本劃分時(shí)以信息最大屬性為選取依據(jù),而且還可以對(duì)算法的速度以及精度進(jìn)一步加強(qiáng)[11]。另外,除了ID3算法,其它常用的決策樹算法還包括C4.5(Classification 4.5)、Sprint、PUBLIC(Pruning and Building Integrated in Classification)等算法[12],這些算法都是以ID3算法為基礎(chǔ)優(yōu)化形成的,所以對(duì)于更多的實(shí)際問(wèn)題都能夠進(jìn)行針對(duì)性的處理。

      現(xiàn)有的電力系統(tǒng)數(shù)據(jù)檢索技術(shù)大部分是通過(guò)對(duì)海量數(shù)據(jù)庫(kù)的直接檢索來(lái)完成用戶的查詢要求,這種方式顯然存在花費(fèi)時(shí)間長(zhǎng)且準(zhǔn)確度較低等問(wèn)題。另外,大部分檢索方法的適用范圍較局限,比如只適用于文本數(shù)據(jù)和Web數(shù)據(jù),但對(duì)存在多源數(shù)據(jù)的電力系統(tǒng)數(shù)據(jù)庫(kù)進(jìn)行檢索時(shí),就顯得不太適用。因此,為了解決上述問(wèn)題,首先將決策樹算法引入到電力運(yùn)行系統(tǒng)中,其次利用互信息理論對(duì)決策樹算法進(jìn)行優(yōu)化,以此設(shè)計(jì)出電力系統(tǒng)檢索模型,最后設(shè)置仿真實(shí)驗(yàn)對(duì)算法以及檢索模型效果進(jìn)行驗(yàn)證。希望此方法能夠提高電力系統(tǒng)的信息檢索能力,從而方便相關(guān)工程人員使用。

      1 材料與方法

      1.1 改進(jìn)的決策樹信息檢索算法

      1.1.1 決策樹算法 決策樹算法是一種逼近離散函數(shù)值的方法。它是一種典型的分類方法,首先對(duì)數(shù)據(jù)進(jìn)行處理,利用歸納算法生成可讀的規(guī)則和決策樹,然后使用決策對(duì)新數(shù)據(jù)進(jìn)行分析。本質(zhì)上決策樹算法是通過(guò)一系列規(guī)則對(duì)數(shù)據(jù)進(jìn)行分類的過(guò)程[13]。

      因?yàn)闆Q策樹算法是通過(guò)構(gòu)造決策樹來(lái)發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)涵的分類規(guī)則,所以,如何構(gòu)造精度高、規(guī)模小的決策樹就是決策樹算法的核心內(nèi)容。決策樹構(gòu)造可以分兩步進(jìn)行。第一步,決策樹的生成:由訓(xùn)練樣本集生成決策樹的過(guò)程。一般情況下,訓(xùn)練樣本數(shù)據(jù)集是有一定綜合程度的,用于數(shù)據(jù)分析處理的數(shù)據(jù)集。第二步,決策樹的剪枝:決策樹的剪枝是對(duì)上一階段生成的決策樹進(jìn)行檢驗(yàn)、校正的過(guò)程,主要是用新的樣本數(shù)據(jù)集(稱為測(cè)試數(shù)據(jù)集)中的數(shù)據(jù)校驗(yàn)決策樹生成過(guò)程中產(chǎn)生的初步規(guī)則,將那些影響準(zhǔn)確性的分枝剪除。

      1.1.2 基于互信息的決策樹算法 互信息是計(jì)算語(yǔ)言學(xué)模型分析的常用方法,它度量?jī)蓚€(gè)對(duì)象之間的相互性。在過(guò)濾問(wèn)題中用于度量特征對(duì)于主題的區(qū)分度?;バ畔⒌亩x與交叉熵近似。互信息本來(lái)是信息論中的一個(gè)概念,用于表示信息之間的關(guān)系,是兩個(gè)隨機(jī)變量統(tǒng)計(jì)相關(guān)性的測(cè)度,使用互信息理論進(jìn)行特征抽取是基于如下假設(shè):在某個(gè)特定類別出現(xiàn)頻率高,但在其它類別出現(xiàn)頻率比較低的詞條與該類的互信息比較大。通常用互信息作為特征詞和類別之間的測(cè)度,如果特征詞屬于該類的話,它們的互信息量最大。由于該方法不需要對(duì)特征詞和類別之間關(guān)系的性質(zhì)作任何假設(shè),因此非常適合于文本分類的特征和類別的配準(zhǔn)工作[14]。

      互信息可定義為:

      通過(guò)基于互信息的決策樹算法能夠完成數(shù)據(jù)分類和數(shù)據(jù)過(guò)濾,數(shù)據(jù)過(guò)濾算法流程的具體步驟如圖1所示。

      圖1表明,利用基于互信息的決策樹算法對(duì)數(shù)據(jù)進(jìn)行檢索時(shí),數(shù)據(jù)的互信息和過(guò)濾多余數(shù)據(jù)的可能性成正向增長(zhǎng)關(guān)系。即互信息值越大,過(guò)濾的無(wú)用數(shù)據(jù)就越多,查詢到所需數(shù)據(jù)的概率就越大。在這個(gè)過(guò)程中,不但大幅度過(guò)濾了非相關(guān)信息,減少了檢索時(shí)間,而且還能夠提高檢索的精度[15]。

      1.1.3 基于并行計(jì)算的決策樹算法 電力系統(tǒng)所產(chǎn)生的數(shù)據(jù)可以區(qū)分為靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù),其中在較大時(shí)間尺度中數(shù)據(jù)不發(fā)生變化時(shí),可以認(rèn)為是靜態(tài)數(shù)據(jù)。除此之外,在小時(shí)間尺度中不斷更新或者累積的數(shù)據(jù)稱為動(dòng)態(tài)數(shù)據(jù)。電力系統(tǒng)中數(shù)據(jù)龐大,尤其是對(duì)于動(dòng)態(tài)數(shù)據(jù)上千節(jié)點(diǎn)的數(shù)據(jù)采集會(huì)造成巨大的數(shù)據(jù)累積。動(dòng)態(tài)數(shù)據(jù)的處理對(duì)于能否有效挖掘關(guān)鍵數(shù)據(jù)至關(guān)重要,但許多算法直接在一定時(shí)間內(nèi)忽略最新的動(dòng)態(tài)數(shù)據(jù),而采用歷史數(shù)據(jù),這對(duì)于實(shí)時(shí)變化的電力系統(tǒng)來(lái)說(shuō)可能會(huì)影響巨大。因此需要通過(guò)技術(shù)處理實(shí)時(shí)更新數(shù)據(jù)以實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)的挖掘。此外,不同的關(guān)鍵詞檢索也將對(duì)靜態(tài)數(shù)據(jù)的數(shù)據(jù)處理產(chǎn)生不同的要求。這些對(duì)于計(jì)算機(jī)的要求將大大增加。

      因此,為了對(duì)電力系統(tǒng)數(shù)據(jù)進(jìn)行更加精確的挖掘,在此還將創(chuàng)建基于Spark Map Reduce的并行決策樹算法。該算法是由多個(gè)map (映射)以及 reduce (歸約) 函數(shù)組組成,并支持轉(zhuǎn)換 (transformations) 和行動(dòng)(actions),它們的實(shí)現(xiàn)基于RDD。多個(gè)數(shù)據(jù)行組成一個(gè)RDD,數(shù)據(jù)行的內(nèi)容可以是數(shù)字、數(shù)組或者是混合類型的數(shù)據(jù)。Spark Map Reduce將計(jì)算資源分為一個(gè)master 節(jié)點(diǎn)和多個(gè)worker節(jié)點(diǎn),master向空閑的worker 分配工作。該算法可以通過(guò)對(duì)各個(gè)數(shù)據(jù)庫(kù)分類并行的進(jìn)行數(shù)據(jù)獲取和解析并通過(guò)決策樹進(jìn)行數(shù)據(jù)挖掘,可以大大的提高數(shù)據(jù)處理效率并降低計(jì)算時(shí)間。

      1.2 決策樹算法在電力自動(dòng)化系統(tǒng)信息檢索中的應(yīng)用

      1.2.1 基于決策樹算法的電力系統(tǒng)信息檢索應(yīng)用模型設(shè)計(jì) 通過(guò)研究基于互信息的決策樹算法發(fā)現(xiàn),該算法不僅能夠?qū)Σ煌瑢傩院筒煌瑪?shù)據(jù)庫(kù)之間的關(guān)系實(shí)現(xiàn)高效的衡量,而且還能完成屬性對(duì)分類重要程度的區(qū)分。此外,引入權(quán)因子后,該算法可以在實(shí)際應(yīng)用中通過(guò)增加權(quán)重來(lái)提高檢索速度以及精度。按照電力系統(tǒng)的實(shí)際要求,現(xiàn)對(duì)基于決策樹算法的電網(wǎng)輔助決策系統(tǒng)應(yīng)用模型進(jìn)行構(gòu)建。模型具體框架如圖2所示。

      圖2表明,該模型能夠通過(guò)用戶提供的關(guān)鍵詞條完成數(shù)據(jù)的迅速檢索,并通過(guò)反復(fù)檢查后將信息回饋給用戶,若用戶對(duì)結(jié)果有疑問(wèn),則可以進(jìn)行再次檢索或調(diào)整關(guān)鍵詞條,從而完成電網(wǎng)的輔助決策。另外,當(dāng)電網(wǎng)發(fā)生故障時(shí),該模型還可以得到更多關(guān)于系統(tǒng)的其它數(shù)據(jù),從而完成多源數(shù)據(jù)共享。模型的運(yùn)行功能如圖3所示。

      (1) 數(shù)據(jù)處理:通過(guò)處理缺失數(shù)據(jù)和問(wèn)題數(shù)據(jù)來(lái)達(dá)到提高數(shù)據(jù)質(zhì)量的目的。此外,在數(shù)據(jù)處理的過(guò)程中,數(shù)據(jù)集成會(huì)把多源數(shù)據(jù)組合為整體數(shù)據(jù)集,數(shù)據(jù)的轉(zhuǎn)變能夠?qū)?shù)據(jù)進(jìn)行規(guī)范化處理以此得到更貼切實(shí)際的呈現(xiàn)方式。

      (2) 數(shù)據(jù)挖掘:數(shù)據(jù)挖掘工作包含實(shí)時(shí)性和精確度等重要特點(diǎn)。而針對(duì)數(shù)據(jù)的實(shí)時(shí)性,可利用Boosting手段,通過(guò)把新數(shù)據(jù)引入到?jīng)Q策樹中,以此產(chǎn)生決策樹集合,從而加大數(shù)據(jù)挖掘的深度。

      (3) 模式評(píng)估:針對(duì)挖掘的數(shù)據(jù)是否有效,需要對(duì)其進(jìn)行驗(yàn)證以及評(píng)價(jià)。第一步是將數(shù)據(jù)與數(shù)據(jù)庫(kù)不斷對(duì)比,以此確定數(shù)據(jù)的精度。

      (4) 用戶交互:在此功能下,用戶能夠自主進(jìn)行數(shù)據(jù)檢索,建立數(shù)據(jù)要求。

      (5) 系統(tǒng)主動(dòng)問(wèn)詢:在該系統(tǒng)中,用戶不但可以自主查詢數(shù)據(jù),并且系統(tǒng)還設(shè)置了系統(tǒng)接口。

      1.2.2 仿真實(shí)驗(yàn) 為了驗(yàn)證基于互信息和并行計(jì)算的決策樹算法的模型的實(shí)用性,首先利用實(shí)驗(yàn)室環(huán)境來(lái)搭建仿真平臺(tái),其次通過(guò)提出的檢索模型對(duì)生產(chǎn)管理系統(tǒng)數(shù)據(jù)庫(kù)Oracle、地理信息系統(tǒng)數(shù)據(jù)庫(kù)ArcSDE(Spatial Database Engine)以及監(jiān)控和數(shù)據(jù)采集系統(tǒng)數(shù)據(jù)庫(kù)SCADA(Supervisory Control And Data Acquisition)進(jìn)行數(shù)據(jù)檢索,最后記錄檢索所花費(fèi)的時(shí)間以及分類結(jié)果。

      2 結(jié)果與分析

      2.1 改進(jìn)決策樹算法的性能

      2.1.1 改進(jìn)前后的決策樹算法的信息檢索性能 將改進(jìn)的決策樹算法與傳統(tǒng)的ID3算法進(jìn)行比較后得到的結(jié)果如圖4所示。

      圖4表明,改進(jìn)的決策樹算法和傳統(tǒng)的ID3算法在對(duì)不同數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘時(shí),其算法的性能存在差異。對(duì)于生產(chǎn)管理系統(tǒng)數(shù)據(jù)集,ID3算法下的數(shù)據(jù)挖掘精度為99.59%,改進(jìn)決策樹算法在人工常量設(shè)置為1和靈活值時(shí)的數(shù)據(jù)挖掘精度分別為99.67%和99.72%;對(duì)于地理信息系統(tǒng)數(shù)據(jù)集,ID3算法下的數(shù)據(jù)挖掘精度為90.02%,改進(jìn)決策樹算法在人工常量設(shè)置為1和靈活值時(shí)的數(shù)據(jù)挖掘精度分別為93.92%和94.27%;對(duì)于監(jiān)控和數(shù)據(jù)采集系統(tǒng)數(shù)據(jù)集,ID3算法下的數(shù)據(jù)挖掘精度為94.61%,改進(jìn)決策樹算法在人工常量設(shè)置為1和靈活值時(shí)的數(shù)據(jù)挖掘精度分別為95.85%和96.12%。由此說(shuō)明,改進(jìn)的決策樹算法對(duì)于數(shù)據(jù)集的數(shù)據(jù)挖掘更加精確。

      2.1.2 基于決策樹算法的信息檢索方法的實(shí)際應(yīng)用效果 為進(jìn)一步驗(yàn)證基于決策樹算法的信息檢索性能,選取 500 kV 變電站作為測(cè)試試點(diǎn),實(shí)驗(yàn)數(shù)據(jù)共 96.2 MB。其中包含一次設(shè)備信息6萬(wàn)余條,天氣數(shù)據(jù)20 MB。通過(guò)準(zhǔn)確率和召回率證明變電站設(shè)備信息決策樹算法的檢索效果,并同時(shí)與傳統(tǒng)的關(guān)鍵詞檢索方法進(jìn)行比較,得到的結(jié)果如表1所示。

      表1表明,基于互信息和并行計(jì)算的決策樹檢索方法在準(zhǔn)確率和召回率兩個(gè)指標(biāo)上整體高于傳統(tǒng)的關(guān)鍵詞檢索方法。在信息檢索條件為3時(shí),指標(biāo)相差最大。以上數(shù)據(jù)表明,基于互信息和并行計(jì)算的決策樹檢索系統(tǒng)能夠滿足日常檢索需求,它可以快速有效的檢索設(shè)備信息,能減少錯(cuò)誤操作,提高智能變電站的安全性。

      2.2 電力系統(tǒng)信息檢索應(yīng)用模型效果

      2.2.1 生產(chǎn)管理系統(tǒng)數(shù)據(jù)庫(kù)檢索分類結(jié)果 利用基于改進(jìn)決策樹算法的電力系統(tǒng)信息檢索應(yīng)用模型對(duì)生產(chǎn)管理系統(tǒng)數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行檢索分類,得到的結(jié)果如圖5所示。

      圖5表明,利用該檢索模型對(duì)生產(chǎn)管理系統(tǒng)數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)分類,當(dāng)分類器中數(shù)據(jù)量為20、15、12、10、3時(shí),模型挖掘出的可用數(shù)據(jù)量分別為1、3、5、5、2。以上說(shuō)明該檢索模型對(duì)于數(shù)據(jù)集的挖掘分類具有一定效果。

      2.2.2 不同數(shù)據(jù)庫(kù)數(shù)據(jù)檢索所花費(fèi)的時(shí)間 利用提出的檢索模型對(duì)生產(chǎn)管理、地理信息以及監(jiān)控和數(shù)據(jù)采集三種系統(tǒng)數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行檢索,并不斷提高數(shù)據(jù)量級(jí)別,檢索花費(fèi)時(shí)間如圖6所示。

      圖6表明,對(duì)于不同的檢索條數(shù),該模型檢索所花費(fèi)的時(shí)間不同。當(dāng)檢索條數(shù)分別為0.8萬(wàn)、1.6萬(wàn)、12萬(wàn)、32萬(wàn)、63萬(wàn)、130萬(wàn)時(shí),該模型檢索所花費(fèi)的時(shí)間分別為0.04s、0.07s、0.61s、2.12s、4.17s、7.82s。以上結(jié)果表明,隨著檢索條數(shù)的不斷增加,該模型檢索所花費(fèi)的平均時(shí)間越來(lái)越小。這充分說(shuō)明了基于互信息決策樹的分類方法的適用性。

      3 結(jié)論與討論

      目前,將電力系統(tǒng)中的海量數(shù)據(jù)進(jìn)行高效提取從而更好的輔助工程人員決策是一項(xiàng)關(guān)鍵問(wèn)題。通過(guò)研究發(fā)現(xiàn),現(xiàn)階段的信息檢索技術(shù)存在單一性、數(shù)據(jù)不完整性等諸多局限性。針對(duì)數(shù)據(jù)庫(kù)信息的特點(diǎn),研究所做工作以及得到的結(jié)論如下:(1) 設(shè)計(jì)了一種基于互信息的決策樹算法,利用互信息對(duì)索引信息量進(jìn)行判斷,從而對(duì)多源數(shù)據(jù)關(guān)鍵詞實(shí)現(xiàn)快速檢索,并嘗試將并行計(jì)算加入到?jīng)Q策樹算法當(dāng)中,實(shí)現(xiàn)多種電網(wǎng)系統(tǒng)數(shù)據(jù)的精確挖掘;(2) 以基于互信息的決策樹算法為基礎(chǔ),對(duì)電力系統(tǒng)應(yīng)用的電網(wǎng)輔助決策系統(tǒng)模型進(jìn)行了搭建,此模型可以實(shí)現(xiàn)對(duì)當(dāng)前電網(wǎng)信息的快速檢索以輔助用戶決策;(3) 基于互信息和并行計(jì)算的決策樹檢索方法在準(zhǔn)確率和召回率兩個(gè)指標(biāo)上整體高于傳統(tǒng)的關(guān)鍵詞檢索方法。

      不足之處在于設(shè)計(jì)的信息檢索方法在實(shí)際的電力系統(tǒng)中的應(yīng)用較少,后續(xù)將針對(duì)實(shí)際應(yīng)用進(jìn)行研究,旨在進(jìn)一步提高電網(wǎng)數(shù)據(jù)的挖掘能力和效果。

      參考文獻(xiàn)

      [1] 趙海波. 電力行業(yè)大數(shù)據(jù)研究綜述[J]. 電工電能新技術(shù), 2020, 39(12):11.

      [2] 吳雷. 能源互聯(lián)網(wǎng)下電力大數(shù)據(jù)的特征及應(yīng)用分析[J]. 科技創(chuàng)新導(dǎo)報(bào), 2021, 18(8):3.

      [3] 彭冰月, 張宸, 于翔,等. 基于數(shù)據(jù)系統(tǒng)的電力桿塔共享運(yùn)營(yíng)策略探析[J]. 機(jī)電信息, 2021(23):2.

      [4] ZHANG Y, CONG W, LI G, et al. Single-ended MMC-MTDC line protection based on dual-frequency amplitude ratio of traveling wave[J]. Electric Power Systems Research, 2020, 189(3):106808.

      [5] DING Z, WANG J, CHENG Y. A long short-term memory network-based intrusion detection method for power grid middle platform[J]. Journal of Physics: Conference Series, 2021, 1815(1):012007.

      [6] 費(fèi)宏運(yùn), 楊陽(yáng). 基于保信系統(tǒng)的電網(wǎng)事故智能分析與決策[J]. 光源與照明, 2021(12):2.

      [7] SHI Z, SUN T, WU D, et al. Research on the integration technology of power engineering design materials based on fuzzy retrieval[J]. IOP Conference Series: Earth and Environmental Science, 2021, 632(4):042030.

      [8] GAO L C, YAO L M, YANG Z W, et al. Research on hybrid index method of double-layer B+ tree for power big data considering knowledge graph[J]. Journal of Physics: Conference Series, 2021, 1771(1):012004.

      [9] 宋辰萱, 孔祥文. MongoDB與Hadoop MapReduce的海量非結(jié)構(gòu)化數(shù)據(jù)處理方案[J]. 電子技術(shù)與軟件工程, 2021(2):2.

      [10] FADELELMOULA A A. Exploiting cloud computing and web services to achieve data consistency, availability, and partition tolerance in the large-scale pervasive systems[J]. International Journal of Interactive Mobile Technologies (iJIM), 2021, 15(15):74.

      [11] QIANG G, SUN L, HUANG Q. ID3 algorithm and its improved algorithm in agricultural planting decision[J]. IOP Conference Series Earth and Environmental Science, 2020, 474:032025.

      [12] LIU Q, XIA X. Construction of classification model of academic library websites in Jiangsu based on decision? tree? algorithm and? link analysis? method[J]. Open Access Library Journal, 2022, 9(1):9.

      [13] 韓成成, 增思濤, 林強(qiáng),等. 基于決策樹的流數(shù)據(jù)分類算法綜述[J]. 西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版), 2020, 41(2):11.

      [14] 王雅輝, 錢宇華, 劉郭慶. 基于模糊優(yōu)勢(shì)互補(bǔ)互信息的有序決策樹算法[J]. 計(jì)算機(jī)應(yīng)用, 2021, 41(10):8.

      [15] ZHAO Y. Research on personal credit evaluation of internet finance based on blockchain and decision tree algorithm[J]. EURASIP Journal on Wireless Communications and Networking, 2020, 2020(1):1-12.

      Research on Station Resource Retrieval Technology in Operation Data of Power Automation System Based on Data Mining

      ZHANG Xu-dong, XIE Min, HUANG Jian-ping, WANG Zheng

      (State Grid Zhejiang Electric Power CO.,LTD. , Hangzhou 310007,China)

      Abstract: At present, the power grid contains a large number of multi-source information data. It is not easy to retrieve its data information efficiently and accurately. In order to solve this problem, after consulting the literature, analyzing the data characteristics of the actual power operation system and multi-source database samples, an optimized decision tree algorithm based on mutual information and parallel computing theory is introduced, and a decision tree model is built on this basis. Finally, simulation experiments are set to verify the model with various system databases as examples. The results show that the optimized decision tree algorithm based on mutual information and parallel computing can achieve fast, accurate and effective multi-source data retrieval for large databases, and can also effectively process real-time data. The algorithm directly mines the original data of the database according to the representative feature set, and sorts according to the size of the index information. The data mining method with the improved decision tree algorithm as the core technology has a high precision. It can better realize the mining of the multi-source data information of the power grid. It can not only avoid data duplication, but also meet the decision-making requirements of the project, providing a reliable technical support for improving the efficient mining of power grid data.

      Key words: data mining; power operation system; mutual information; decision tree; simulation experiment

      (責(zé)任編輯:馬乃玉)

      猜你喜歡
      仿真實(shí)驗(yàn)互信息決策樹
      一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      開(kāi)展體驗(yàn)式教學(xué)創(chuàng)新研究 提高化學(xué)課堂有效性
      基于多重視閾下的《電子控制技術(shù)》課程的教學(xué)探討
      考試周刊(2016年64期)2016-09-22 18:20:00
      基于決策樹的出租車乘客出行目的識(shí)別
      基于ETAP的電氣設(shè)計(jì)仿真實(shí)驗(yàn)
      基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
      聯(lián)合互信息水下目標(biāo)特征選擇算法
      計(jì)算數(shù)據(jù)中心的動(dòng)態(tài)數(shù)據(jù)聚集算法研究
      改進(jìn)的互信息最小化非線性盲源分離算法
      鄄城县| 随州市| 庄浪县| 罗江县| 兴山县| 揭西县| 普宁市| 望谟县| 谷城县| 鹿泉市| 宜兰市| 旺苍县| 祁门县| 都兰县| 民权县| 蓬溪县| 嘉义县| 沈阳市| 常山县| 鹤峰县| 紫阳县| 盘山县| 青海省| 济南市| 涞水县| 柞水县| 张家界市| 青岛市| 容城县| 敖汉旗| 天等县| 广元市| 吴川市| 安化县| 武定县| 英吉沙县| 冀州市| 城口县| 合肥市| 兴城市| 彭水|