• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于改進啟發(fā)式搜索算法的區(qū)域水資源時空變化特征挖掘方法

      2022-12-08 06:19:06劉招雄
      水力發(fā)電 2022年11期
      關(guān)鍵詞:數(shù)據(jù)倉庫時空聚類

      胡 鑫,劉招雄

      (云南省水文水資源局曲靖分局,云南 曲靖 655000)

      0 引 言

      區(qū)域水資源合理利用是水利工作的關(guān)鍵,一方面收集水利信息,能夠為防洪抗旱做準(zhǔn)備;另一方面,水利自身的建立也離不開相關(guān)信息的支持[1-3]。近些年,水利信息化建設(shè)逐漸完善,基本完成了基礎(chǔ)空間數(shù)據(jù)庫的建設(shè),其他區(qū)域水資源信息庫的建設(shè)也在不斷完善,水資源時空變化特征數(shù)據(jù)是水利信息化建設(shè)的重要組成部分[4-6]。隨著水資源數(shù)據(jù)量的日益增加,水資源時空變化特征也越來越復(fù)雜,其特征數(shù)據(jù)背后可能隱藏著更重要的信息[7]。因此,在對水資源時空變化特征研究上,需要進行更高層次、多樣化的處理和分析,以便更好地利用這些數(shù)據(jù)[8]。

      目前,比較成熟的數(shù)據(jù)分析方法就是數(shù)據(jù)挖掘技術(shù),通過數(shù)據(jù)挖掘技術(shù)即可從海量的水資源區(qū)域時空變化特征數(shù)據(jù)中獲得有價值的信息;但是,單一的挖掘方法缺少目的性,利用其他方法實現(xiàn)更高水平的特征挖掘是現(xiàn)階段國內(nèi)外專家、學(xué)者研究的重點[9-11]。在特征挖掘的研究上,比較常規(guī)的挖掘方法有文獻[12]提出的基于位置差的特征挖掘方法。該方法在挖掘特征信息前,對時空變化信息進行解析處理,獲得位置信息,以不同位置之間的差作為依據(jù),挖掘出特征信息。在實際工作中,這種方法在遠距離特征數(shù)據(jù)挖掘上,數(shù)據(jù)聚類效果不理想,數(shù)據(jù)損失較嚴(yán)重,抗干擾性能比較差。文獻[13]提到的基于GIS的挖掘方法存在類似的問題,GIS技術(shù)的使用也是需要利用位置信息來挖掘特征數(shù)據(jù),在使用上并沒有解決遠距離處理抗干擾性能差的問題。

      因此,本研究提出基于改進啟發(fā)式搜索算法的區(qū)域水資源時空變化特征挖掘方法,以解決上述常規(guī)的特征挖掘方法存在的問題。

      1 挖掘算法設(shè)計

      1.1 搜索時空變化特征

      區(qū)域水資源時空變化特征包含圖像特征和數(shù)據(jù)特征。這些特征信息隨著時間的變化不斷增加,往往在短時間內(nèi)就能累計大量特征信息,其中包含很多冗余信息、干擾信息等無用信息,嚴(yán)重影響特征挖掘的實際效果[14]。因此,采用改進啟發(fā)式搜索算法,搜索有價值的時空變化特征數(shù)據(jù),建立數(shù)據(jù)倉庫,在數(shù)據(jù)倉庫內(nèi)實現(xiàn)進一步的特征挖掘。

      改進啟發(fā)式算法開始時,讀取特征信息,經(jīng)過標(biāo)準(zhǔn)化處理后,設(shè)置閾值個數(shù)為D,初始化特征信息集合,在解空間內(nèi)隨機產(chǎn)生N個位置的初代聚點,遍歷每一個特征數(shù)據(jù),利用公式計算出各個初代聚點的適應(yīng)度值以及特征變化的強度和幅度[15]。即

      fi(TN)=α0α1(β0-β1)2+α0α2(β0-β2)2+…

      +αD-1αD(βD-1-βD)

      (1)

      式中,fi(TN)為第i個目標(biāo)的適應(yīng)度函數(shù)值;α和β分別為特征分布總體概率和平均概率。特征變化強度和幅度計算公式為

      (2)

      (3)

      式中,Ai為特征變化強度;Si為特征變化幅度;Ymin和Ymax分別為適應(yīng)度函數(shù)值的最小值和最大值;ε為校正值。在計算完成后,按照強度和幅度大小順序排序,選擇前20%的個體進行高斯變異處理并替換,在替換完成后,對超出解空間的次代個體做映射處理,具體處理過程如下

      (4)

      1.2 建立區(qū)域水資源特征數(shù)據(jù)倉庫

      區(qū)域水資源時空變化特征涉及到的數(shù)據(jù)類型非常廣泛。經(jīng)過改進啟發(fā)式搜索后,根據(jù)不同的使用目的建立主體數(shù)據(jù)倉庫,便于為特征挖掘工作提供方便有效的服務(wù)。

      數(shù)據(jù)倉庫不僅具有存儲作用,還能夠?qū)?shù)據(jù)進行重新整理,根據(jù)使用要求形成當(dāng)前的基本數(shù)據(jù)層,在特征隨著時間不斷變化過程中,數(shù)據(jù)倉庫內(nèi)的時間控制機制將基本數(shù)據(jù)層轉(zhuǎn)為歷史數(shù)據(jù)。

      數(shù)據(jù)倉庫包含源數(shù)據(jù)、數(shù)據(jù)倉庫、倉庫管理和分析工具4個部分。倉庫管理負(fù)責(zé)將通過抽取、轉(zhuǎn)換等手段處理數(shù)據(jù)源存入到數(shù)據(jù)倉庫中,分析工具用于分析數(shù)據(jù)、查詢處理數(shù)據(jù)。數(shù)據(jù)倉庫的內(nèi)部結(jié)構(gòu)如圖1所示。

      圖1 數(shù)據(jù)倉庫內(nèi)部結(jié)構(gòu)示意

      在圖1中顯示的數(shù)據(jù)倉庫結(jié)構(gòu)的基礎(chǔ)上,為其設(shè)計邏輯模型,采用關(guān)系模型作為主要模型,用于建立數(shù)據(jù)間關(guān)系。在數(shù)據(jù)倉庫建立完成后,從數(shù)據(jù)倉庫中挖掘水資源時空變化特征。

      1.3 挖掘目標(biāo)特征

      (5)

      (6)

      式中,r為最小化類內(nèi)散度;N為最大化類間散度;j為投影后類內(nèi)方差系數(shù);M為映射點集v的維度;center為中值。特征數(shù)據(jù)倉庫類間散度

      (7)

      (8)

      (9)

      Q=[q1,q2,…,qn]=b2/ωib1

      (10)

      式中,ωi為與b2/b1對應(yīng)的第i個特征值。特征挖掘求解公式為

      ru=r*Q

      (11)

      式中,ru為特征挖掘結(jié)果;r*為頻繁特征。式(11)求解出的結(jié)果是一組數(shù)據(jù)集,同時也是特征挖掘結(jié)果。至此,改進啟發(fā)式搜索算法的區(qū)域水資源時空變化特征挖掘方法設(shè)計完成。

      2 實驗研究

      2.1 數(shù)據(jù)準(zhǔn)備

      在區(qū)域水資源時空變化特征挖掘方法實驗中,以某區(qū)域的水資源狀況作為依據(jù),分析改進啟發(fā)式搜索算法的區(qū)域水資源時空變化特征挖掘方法的抗干擾能力??紤]到提出的挖掘方法在理論上和實際應(yīng)用上還沒有統(tǒng)一的論證,實驗采用對比研究的形式,以基于位置差的挖掘方法和基于GIS的挖掘方法作為參考,采用統(tǒng)一的實驗數(shù)據(jù),分析各個時空變化特征挖掘方法的性能。實驗中準(zhǔn)備的區(qū)域水資源狀況數(shù)據(jù)如圖2所示。

      圖2 某區(qū)域水資源狀況示意(萬m3)

      上述準(zhǔn)備的實驗數(shù)據(jù)空間分辨率為30 m,其中包含大量氣象數(shù)據(jù)。這些氣象數(shù)據(jù)來自站點,在實驗前,需要對觀測到的數(shù)據(jù)進行插值,才能獲得這個區(qū)域的完整信息。根據(jù)該區(qū)域的地理特征和自然特征,對站點的多項數(shù)據(jù)進行空間插值處理,確定一個模擬點,在模擬點附近找到多個參照點,以參照點與模擬點的距離作為判斷標(biāo)準(zhǔn)確定權(quán)重,為每一個參照點分配合適的權(quán)重,默認(rèn)最近的點與模擬點相關(guān)性最大。點與點之間的柵格值計算公式為

      (12)

      式中,n為參照點個數(shù),同時也是實測站點的個數(shù);S為待估計的要素柵格值;S(xi)為某個時間段第i個站點的觀測值;di為待估點到第i個實測站點的直線距離;w為與距離相關(guān)的權(quán)重系數(shù)。選擇合適參考點個數(shù)進行空間插值處理。

      在完成上述處理后,采用逐步自回歸模型模擬水位數(shù)據(jù),設(shè)計兩組對比實驗,均以特征數(shù)據(jù)作為目標(biāo),一組為特征數(shù)據(jù)聚類分布實驗,一組為特征數(shù)據(jù)聚類正確率實驗,通過上述兩組實驗結(jié)果,分析區(qū)域水資源時空變化特征挖掘方法的抗干擾性。

      2.2 特征數(shù)據(jù)聚類分布實驗結(jié)果及分析

      在特征數(shù)據(jù)聚類分布實驗中,將海量干擾數(shù)據(jù)作為區(qū)域水資源時空變化特征挖掘的干擾因素,將原始特征數(shù)據(jù)按照不同的特征挖掘方法進行聚類操作,設(shè)置初始聚類中心為1,得到特征數(shù)據(jù)聚類分布圖。各個特征挖掘方法實驗結(jié)果如圖3所示。

      對比觀察圖3顯示的實驗結(jié)果可知,3組實驗結(jié)果的特征數(shù)據(jù)以左下角坐標(biāo)為聚類中心,逐漸向外擴散。其中,基于位置差的特征挖掘方法和基于GIS的特征挖掘方法實驗結(jié)果顯示的數(shù)據(jù)聚類過于分散,數(shù)據(jù)向上、右上和右方向不斷擴散,聚類效果并不理想,說明很難抵抗數(shù)據(jù)干擾;而提出的特征挖掘方法實驗結(jié)果中,特征數(shù)據(jù)分布比較密集,聚類效果更加接近理想效果,說明該方法有效抵抗了數(shù)據(jù)干擾。綜上所述,提出的區(qū)域水資源時空變化特征挖掘方法能夠抵抗干擾,獲得聚類效果更好的特征數(shù)據(jù)。

      圖3 不同特征挖掘方法數(shù)據(jù)聚類分布實驗結(jié)果

      2.3 特征數(shù)據(jù)聚類正確率實驗結(jié)果及分析

      在工作過程中,數(shù)量的大小會影響數(shù)據(jù)聚類效果。為了進一步驗證特征數(shù)據(jù)聚類效果,在同樣的實驗環(huán)境中,布設(shè)間隔不同的參考點,獲得不同大小的數(shù)據(jù)集,布設(shè)方案見圖4。

      圖4 間隔不同的參考點布設(shè)方案示意

      使用不同的特征挖掘方法處理數(shù)據(jù)集,計算出特征數(shù)據(jù)聚類的正確率。實驗結(jié)果如表1所示。

      表1 干擾情況下3種不同特征挖掘方法的聚類正確率

      通過對表1的觀察可知,數(shù)據(jù)量大小的變化與聚類正確率相關(guān),隨著數(shù)據(jù)量的增加,聚類效果越好;反之,數(shù)據(jù)量過多,參考點分布較緊密,容易使聚類效果變差,進而降低聚類正確率。由此可見,在存在干擾的情況下,提出的特征挖掘方法數(shù)據(jù)聚類效果更好,并且聚類正確率更高。從抗干擾性能上分析可知,提出的改進啟發(fā)式搜索算法的區(qū)域水資源時空變化特征挖掘方法抗干擾能力更強,優(yōu)于常規(guī)的特征挖掘方法。

      3 結(jié) 語

      本文以區(qū)域水資源時空變化特征作為研究重點,將改進啟發(fā)式搜索算法用于特征挖掘,設(shè)計特征挖掘方法,根據(jù)啟發(fā)式算法的一般要求,與區(qū)域水資源特點,對于水資源時空變化特征數(shù)據(jù)準(zhǔn)備、挖掘等關(guān)鍵問題做出相關(guān)技術(shù)處理和論述,為特征挖掘提供更為細致的信息,使其具有更好的抗干擾性能,適合應(yīng)用于水資源規(guī)劃中。

      盡管本文研究的挖掘方法取得了不錯的成果,但是理論方法和實際應(yīng)用上還存在一些差距,數(shù)據(jù)自身的質(zhì)量也是判斷特征挖掘是否可靠的一個重要因素。在后續(xù)研究中,將從數(shù)據(jù)質(zhì)量出發(fā),進一步完善特征挖掘方法,為水資源時空變化特征挖掘提供良好的技術(shù)支持。

      猜你喜歡
      數(shù)據(jù)倉庫時空聚類
      跨越時空的相遇
      鏡中的時空穿梭
      基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
      玩一次時空大“穿越”
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      分布式存儲系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計
      電子制作(2016年15期)2017-01-15 13:39:15
      探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
      時空之門
      基于改進的遺傳算法的模糊聚類算法
      基于數(shù)據(jù)倉庫的數(shù)據(jù)分析探索與實踐
      喀喇沁旗| 青川县| 吉木乃县| 嘉善县| 五大连池市| 政和县| 昭苏县| 永顺县| 双江| 临江市| 滁州市| 宣化县| 腾冲县| 溧阳市| 逊克县| 平定县| 垣曲县| 汤阴县| 房产| 通州区| 淮阳县| 利津县| 分宜县| 黄石市| 西乡县| 林甸县| 交城县| 张家川| 陇西县| 商丘市| 新晃| 大姚县| 岑巩县| 民勤县| 金秀| 嘉峪关市| 洱源县| 林芝县| 鹿邑县| 准格尔旗| 石渠县|