• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      淺析電力數(shù)據(jù)中的知識(shí)提取算法及應(yīng)用

      2020-11-17 00:11:18郝景昌
      裝備維修技術(shù) 2020年37期
      關(guān)鍵詞:電力大數(shù)據(jù)知識(shí)圖譜

      郝景昌

      摘 ?要:隨著計(jì)算機(jī)技術(shù)及互聯(lián)網(wǎng)產(chǎn)業(yè)的發(fā)展,電力行業(yè)越來(lái)越多的數(shù)據(jù)進(jìn)入網(wǎng)絡(luò)。海量的數(shù)據(jù)給電力行業(yè)中的數(shù)據(jù)存儲(chǔ)、處理、分析帶來(lái)較大的開(kāi)銷(xiāo)。知識(shí)圖譜、屬性約簡(jiǎn)、智能決策等技術(shù)為電力大數(shù)據(jù)的處理提供了較好的解決方案。然而在多維度、全方位的電力大數(shù)據(jù)中,針對(duì)知識(shí)本身的提取及表示的相關(guān)研究仍有所不足。電力大數(shù)據(jù)中的知識(shí)在多個(gè)維度的歸一化、知識(shí)表達(dá)的標(biāo)準(zhǔn)化方面仍有所不足?;谠颇P捅旧淼亩ㄐ远坎淮_定性轉(zhuǎn)換能力,對(duì)多維云模型增加歸一化改進(jìn),進(jìn)而提出一種面向電力大數(shù)據(jù)的知識(shí)提取算法。

      關(guān)鍵詞:電力大數(shù)據(jù);知識(shí)圖譜;數(shù)據(jù)約簡(jiǎn);知識(shí)提取

      1引言

      隨著國(guó)家新電改方案的實(shí)施與推進(jìn),“互聯(lián)網(wǎng)+電力”思維逐漸開(kāi)始引領(lǐng)電力企業(yè),成為一種主要的經(jīng)營(yíng)思路之一。隨著電力企業(yè)市場(chǎng)化的推進(jìn),電力企業(yè)逐漸告別壟斷,開(kāi)始走向營(yíng)銷(xiāo)服務(wù)的時(shí)代。另一方面,隨著工業(yè)互聯(lián)網(wǎng),能源互聯(lián)網(wǎng)的發(fā)展,電力行業(yè)的各個(gè)環(huán)節(jié),從發(fā)電到電力公司的運(yùn)營(yíng),均開(kāi)始向信息化、自動(dòng)化、智能化方向發(fā)展。

      在“互聯(lián)網(wǎng)+電力”的發(fā)展過(guò)程中,越來(lái)越多的電力數(shù)據(jù)進(jìn)入互聯(lián)網(wǎng)。這些數(shù)據(jù)涵蓋電力行業(yè)的全過(guò)程,包含多個(gè)場(chǎng)景、多種環(huán)節(jié)。電力行業(yè)也在逐步邁入大數(shù)據(jù)時(shí)代。

      當(dāng)前電力大數(shù)據(jù)領(lǐng)域的研究均在數(shù)據(jù)的處理與分析基礎(chǔ)上進(jìn)行。其中,電力知識(shí)的構(gòu)建是其核心過(guò)程。然而,當(dāng)前研究中,對(duì)于電力知識(shí)的構(gòu)建過(guò)程仍有進(jìn)一步提升的空間。在多維數(shù)據(jù)的處理中,如何有效挖掘不同維度數(shù)據(jù)中的信息,如何能夠既避免噪聲的干擾,又不忽略實(shí)際具有價(jià)值的信息,是當(dāng)前知識(shí)構(gòu)建中的主要難題。

      本文圍繞電力大數(shù)據(jù)中的知識(shí)構(gòu)建展開(kāi)研究,在云模型的基礎(chǔ)上,提出了一種改進(jìn)的多維云模型。該模型能夠?qū)Χ嗑S屬性進(jìn)行歸一化處理,處理后構(gòu)建多維云。在改進(jìn)的多維云模型基礎(chǔ)上,本文提出一種電力大數(shù)據(jù)中的知識(shí)提取算法,該算法能夠有效提取核心屬性信息,并基于核心屬性信息,構(gòu)建知識(shí)的抽象表示。所提取的知識(shí)還具備重構(gòu)數(shù)據(jù)的能力。仿真實(shí)驗(yàn)表明了本文所提出的算法在數(shù)據(jù)重構(gòu)以及知識(shí)準(zhǔn)確提取方面均具有較強(qiáng)的性能。

      2改進(jìn)的多維云模型

      2.1多維空間知識(shí)

      物理世界中的現(xiàn)象映射至互聯(lián)網(wǎng)空間時(shí),數(shù)據(jù)往往包括多種維度的屬性。此時(shí)的知識(shí)包含多個(gè)維度下,數(shù)值接近的數(shù)據(jù)點(diǎn)。數(shù)據(jù)點(diǎn)的集合形成多維空間知識(shí)?,F(xiàn)給出多維空間知識(shí)的定義及表示方法。

      定義1 多維空間知識(shí). 設(shè)U是N維空間中數(shù)值表示的定量論域,K是U上一類(lèi)數(shù)據(jù)的集合,使用給定值 ,將X在論域上的分布稱(chēng)為多維空間知識(shí),記作K(X),每個(gè)X稱(chēng)為知識(shí)的一次實(shí)現(xiàn),其表示為N維空間中的一個(gè)數(shù)據(jù)點(diǎn): 。

      多維空間中的知識(shí)提取,是將觀(guān)察到的知識(shí)的若干次實(shí)現(xiàn)提取為知識(shí)的抽象表示的過(guò)程。為此,我們引入改進(jìn)的多維云模型。

      2.1改進(jìn)的多維云模型

      李德毅院士在基于概論率、模糊數(shù)學(xué)的基礎(chǔ)上提出了云模型的概念,實(shí)現(xiàn)了包含不確定性的語(yǔ)言概念值與定量數(shù)值之間的相互轉(zhuǎn)換。云模型的數(shù)據(jù)特征用期望Ex ,熵En 和超熵He來(lái)表示,它們反映概念整體的定性特征。云模型既可以表示一維空間中的概念,也可以表示多維空間中的概念。當(dāng)使用云模型表示多維空間中的概念時(shí),三個(gè)特征值均為多維數(shù)據(jù)。然而,由于多維空間中的數(shù)據(jù)尺度變化較大,缺乏統(tǒng)一的度量,本文云模型基礎(chǔ)上引出了多維屬性的歸一化策略,提出一種改進(jìn)的多維云模型,用以表示多維空間中的知識(shí)。

      定義2 多維空間云模型. 設(shè)U是N維空間中數(shù)值表示的定量論域,K是U上的知識(shí),其中包含M次實(shí)現(xiàn)。多維空間云模型MC用以對(duì)K進(jìn)行抽象表示,包含兩部分信息:核與多維尺度因子。其數(shù)學(xué)表示如下: ?。其中, 表示核,是N維云的中心點(diǎn), ;A表示云在N個(gè)維度下的不確定性, ;I表示多維尺度因子,為一個(gè)N維向量 。

      在多維空間云模型中,核 是云的中心點(diǎn),是最能代表知識(shí)的點(diǎn),也是知識(shí)最典型的實(shí)現(xiàn),也可以表示知識(shí)的內(nèi)涵。不確定性A由知識(shí)的隨機(jī)性和模糊性共同決定,是多維屬性歸一化后的結(jié)果,表示與知識(shí)的內(nèi)涵、外延無(wú)關(guān)的,蘊(yùn)含在知識(shí)中的不確定性。多維尺度因子I表示知識(shí)在多個(gè)屬性下的標(biāo)尺,是多維屬性歸一化后提取出的結(jié)果,也可以用來(lái)表示知識(shí)在多個(gè)維度下的外延。

      2.2多維屬性的歸一化方法

      在知識(shí)的多維屬性中,不同維度的數(shù)值具有各自不同的量綱,不同維度下數(shù)值的分布會(huì)出現(xiàn)分布不均衡的現(xiàn)象。在提取知識(shí)時(shí),分布范圍較窄的屬性往往會(huì)被忽略,這將造成知識(shí)提取的不準(zhǔn)確。為此,本文提出一種多維屬性的歸一化方法。

      多維屬性的歸一化主要目標(biāo)是將多個(gè)維度的屬性數(shù)值進(jìn)行處理,使各個(gè)維度的云模型表示中熵值均等于1。此時(shí)各維度下所去除的標(biāo)尺即為多維尺度因子,此時(shí)的超熵值即為不確定度。使用K表示N維空間上的某一知識(shí): 。其中, ,多維屬性的歸一化可以從數(shù)據(jù)中提取抽象特征,得到多維空間的云模型。

      相比原始的逆向云模型算法,增加了歸一化處理的改進(jìn)的多維云模型能夠去除不同維度下屬性尺度的影響。在知識(shí)發(fā)現(xiàn)中,能夠有效防止忽略變化范圍小的數(shù)據(jù)。當(dāng)數(shù)據(jù)在多個(gè)維度分布時(shí),增加歸一化處理之后,一方面可以使多個(gè)維度下的尺度統(tǒng)一,另一方面在數(shù)據(jù)特征提取及數(shù)據(jù)生成時(shí),由于各個(gè)維度數(shù)據(jù)統(tǒng)一,可以通過(guò)特征的提取與疊加實(shí)現(xiàn)多維度下數(shù)據(jù)的統(tǒng)一快速處理。

      3面向電力大數(shù)據(jù)的知識(shí)提取算法

      在電力大數(shù)據(jù)中,數(shù)據(jù)涵蓋的范圍非常廣泛,主要包括電力行業(yè)基本信息數(shù)據(jù)、電力標(biāo)準(zhǔn)數(shù)據(jù)、電力基礎(chǔ)設(shè)施數(shù)據(jù)、電力業(yè)務(wù)數(shù)據(jù)、用電行為數(shù)據(jù)、運(yùn)維行為數(shù)據(jù)、商業(yè)運(yùn)營(yíng)數(shù)據(jù)等等。其中任何一個(gè)領(lǐng)域中的數(shù)據(jù)又包含多種維度,這些維度可能存在交叉,也可能具有高度的相關(guān)性。因此,在面對(duì)特定范圍內(nèi)電力數(shù)據(jù)的知識(shí)提取中,首先需要對(duì)多維數(shù)據(jù)進(jìn)行分析,去除噪聲,尋找屬性的相關(guān)性,獲取其核心屬性,進(jìn)而在核心屬性的基礎(chǔ)上,提取知識(shí)。

      3.1電力大數(shù)據(jù)的核心屬性發(fā)現(xiàn)算法

      針對(duì)某一范圍的電力數(shù)據(jù),其中往往含有多種屬性,在這些屬性中,有三類(lèi)屬性在知識(shí)發(fā)現(xiàn)中無(wú)需參與運(yùn)算,本文定義為“非核心屬性”。非核心屬性主要包含如下三類(lèi):

      (1)非數(shù)值型屬性。某些屬性的數(shù)據(jù)不具備數(shù)值特性,例如用戶(hù)ID,用戶(hù)手機(jī)號(hào)等。這些數(shù)據(jù)沒(méi)有數(shù)學(xué)意義,無(wú)法參與數(shù)學(xué)運(yùn)算,屬于離散的非數(shù)字屬性。這些屬性在知識(shí)發(fā)現(xiàn)中無(wú)法參與運(yùn)算,因而需要首先進(jìn)行排除。

      (2)噪聲屬性。某些屬性的數(shù)據(jù)雖然具備數(shù)值特定,然而這些數(shù)值始終相同或極為接近,基本不會(huì)發(fā)生變化,這些數(shù)據(jù)在知識(shí)發(fā)現(xiàn)中將沖淡核心屬性的價(jià)值,屬于噪聲數(shù)據(jù),也應(yīng)在知識(shí)發(fā)現(xiàn)中進(jìn)行排除。

      (3)從屬屬性。某些屬性的數(shù)據(jù)雖然具備數(shù)值特性也會(huì)變化,然而其變化受某種核心屬性的影響,隨某種核心屬性的變化而變化。這類(lèi)數(shù)據(jù)稱(chēng)之為核心數(shù)據(jù)的從屬數(shù)據(jù)。在知識(shí)發(fā)現(xiàn)中,基于核心屬性已經(jīng)足以進(jìn)行知識(shí)的發(fā)現(xiàn)。從屬數(shù)據(jù)將增大知識(shí)發(fā)現(xiàn)的計(jì)算量,對(duì)知識(shí)發(fā)現(xiàn)結(jié)果的影響較小,因而也需要進(jìn)行排除。

      3.2電力大數(shù)據(jù)的知識(shí)提取過(guò)程

      在電力大數(shù)據(jù)中,知識(shí)的提取是從多個(gè)定量數(shù)據(jù)轉(zhuǎn)化為抽象的數(shù)學(xué)表示的過(guò)程。假設(shè)當(dāng)前存在某種知識(shí)的多次實(shí)現(xiàn),使用多維數(shù)據(jù)集合K表示。電力大數(shù)據(jù)中的知識(shí)提取可表示為: 。具體步驟如下:

      (1)知識(shí)數(shù)據(jù)集獲取。從已有數(shù)據(jù)全集中,根據(jù)先驗(yàn)知識(shí),得出其中表示某種知識(shí)的數(shù)據(jù)集合K。

      (2)核心數(shù)據(jù)發(fā)現(xiàn)?;谒惴?,從數(shù)據(jù)全集中去除非核心屬性,保留核心屬性,形成數(shù)據(jù)集合K。

      (3)基于改進(jìn)云模型的知識(shí)提取。對(duì)現(xiàn)有數(shù)據(jù)集合K進(jìn)行歸一化處理,得出改進(jìn)的多維云模型 。

      (4)此時(shí),改進(jìn)的多維云模型 即為該知識(shí)的抽象表示。

      在改進(jìn)的多維云模型中,云模型的核 表示該知識(shí)的內(nèi)涵;表示多維尺度因子I表示該知識(shí)在多個(gè)屬性下的外延;云模型的不確定性A,代表該知識(shí)在多維維度下的不確定性。改進(jìn)的多維云模型一方面可以表示該知識(shí)的抽象特征,另一方面還可以根據(jù)該抽象特征生成該知識(shí)的實(shí)現(xiàn)。

      3.3基于知識(shí)的數(shù)據(jù)生成算法

      根據(jù)知識(shí)的抽象特性生成數(shù)據(jù),是多維云模型屬性歸一化的逆向過(guò)程。

      對(duì)于已經(jīng)得到的某種知識(shí)抽象特性,可以基于知識(shí)生成近似的數(shù)據(jù)。為知識(shí)提取提供了一種抽象概念到具體數(shù)據(jù)的轉(zhuǎn)換方法。對(duì)于模擬電力領(lǐng)域中的業(yè)務(wù),構(gòu)建電力領(lǐng)域知識(shí)圖譜都具有一定的應(yīng)用價(jià)值。

      4結(jié)論及未來(lái)工作展望

      針對(duì)當(dāng)前電力大數(shù)據(jù)領(lǐng)域中的知識(shí)表達(dá)能力缺乏標(biāo)準(zhǔn)、知識(shí)提取能力相對(duì)較弱等問(wèn)題展開(kāi)研究,針對(duì)云模型進(jìn)行了改進(jìn),并提出了一種面向電力大數(shù)據(jù)的知識(shí)提取算法。仿真實(shí)驗(yàn)驗(yàn)證了該算法在數(shù)據(jù)重構(gòu)、知識(shí)提取等方面均有較好的性能。該算法電力行業(yè)大數(shù)據(jù)分析,知識(shí)圖譜構(gòu)建具有一定的參考價(jià)值。

      參考文獻(xiàn)

      [1]盛魁.混合數(shù)據(jù)的鄰域區(qū)分度增量式屬性約簡(jiǎn)算法[J].電子學(xué)報(bào),2020,48(04):682-696.

      [2]周峰.泛在電力物聯(lián)網(wǎng)智能感知關(guān)鍵技術(shù)發(fā)展思路[J].中國(guó)電機(jī)工程學(xué)報(bào),2020,40(01):70-82+375.

      猜你喜歡
      電力大數(shù)據(jù)知識(shí)圖譜
      分布式技術(shù)在電力大數(shù)據(jù)高性能處理中的應(yīng)用
      電力大數(shù)據(jù)應(yīng)用研究與展望
      基于云計(jì)算技術(shù)的電力大數(shù)據(jù)預(yù)處理屬性約簡(jiǎn)方法
      面向電力大數(shù)據(jù)的數(shù)據(jù)管理工具對(duì)比
      國(guó)內(nèi)圖書(shū)館嵌入式服務(wù)研究主題分析
      國(guó)內(nèi)外政府信息公開(kāi)研究的脈絡(luò)、流派與趨勢(shì)
      近十五年我國(guó)小學(xué)英語(yǔ)教學(xué)研究的熱點(diǎn)、問(wèn)題及對(duì)策
      基于知識(shí)圖譜的產(chǎn)業(yè)集群創(chuàng)新績(jī)效可視化分析
      電力大數(shù)據(jù)可視化系統(tǒng)開(kāi)發(fā)關(guān)鍵技術(shù)研究及趨勢(shì)
      基于知識(shí)圖譜的智慧教育研究熱點(diǎn)與趨勢(shì)分析
      胶州市| 监利县| 长春市| 太和县| 遵义市| 千阳县| 闻喜县| 德州市| 民乐县| 长顺县| 海晏县| 吐鲁番市| 白河县| 二手房| 景谷| 隆林| 岗巴县| 莎车县| 嘉义县| 工布江达县| 阿坝| 云阳县| 平和县| 宁远县| 平阴县| 托克托县| 江西省| 泽州县| 华池县| 闸北区| 南宁市| 确山县| 奉化市| 西乡县| 桐城市| 呼图壁县| 榆树市| 缙云县| 综艺| 婺源县| 天等县|