• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于大數(shù)據(jù)武警數(shù)據(jù)平臺搭建方法論

      2019-11-14 01:27:00楊艷秋中國人民武裝警察部隊警官學院四川成都610000
      新生代 2019年18期
      關鍵詞:數(shù)據(jù)模型數(shù)據(jù)挖掘可視化

      楊艷秋 中國人民武裝警察部隊警官學院 四川成都 610000

      目前,在大數(shù)據(jù)領域每年都會出現(xiàn)新的技術,這些技術有效的推動了大數(shù)據(jù)的發(fā)展。數(shù)據(jù)挖掘能夠有效的在大規(guī)模的數(shù)據(jù)中分析出隱藏的數(shù)據(jù)價值。海量數(shù)據(jù)挖掘是可規(guī)劃的數(shù)據(jù)分析行為,在數(shù)據(jù)量大,數(shù)據(jù)結構不統(tǒng)一的情況下,建設基于大數(shù)據(jù)的武警信息平臺需要從搭建初期就要有數(shù)據(jù)思維。本文立足于數(shù)據(jù)平臺搭建的方法論。

      大數(shù)據(jù)的挖掘需要從生命周期做數(shù)據(jù)規(guī)劃,主本文從元數(shù)據(jù)規(guī)劃、數(shù)據(jù)質量分析及提升,數(shù)據(jù)標簽,數(shù)據(jù)建模,數(shù)據(jù)可視化五個步驟進行闡述。

      元數(shù)據(jù)規(guī)劃,主要是從運行數(shù)據(jù),經(jīng)營數(shù)據(jù),行為數(shù)據(jù),維護數(shù)據(jù)以及其他數(shù)據(jù)中來建立,其中經(jīng)營數(shù)據(jù)包含其他系統(tǒng)的數(shù)據(jù),如內部管理系統(tǒng),Web信息系統(tǒng),科研系統(tǒng)數(shù)據(jù)集 運行數(shù)據(jù)比如系統(tǒng)在運行中產(chǎn)生的告警,預警,事件等 行為數(shù)據(jù)如登錄事件,點擊次數(shù)、頻率,訪問頁面的地址,分享或者下載的文件等 維護數(shù)據(jù)如機房斷電緊急恢復,對于其他的數(shù)據(jù)如天氣情況,位置信息,環(huán)境信息等。通過對元數(shù)據(jù)的規(guī)劃,能夠有效的將異構的數(shù)據(jù)做集成處理,交給下一步做數(shù)據(jù)清洗。

      數(shù)據(jù)質量分析及提升也就是數(shù)據(jù)清洗,也可以叫數(shù)據(jù)預處理,我們收集到的元數(shù)據(jù)做進一步的處理如數(shù)據(jù)一致性,處理無效值和缺失值等。我們常用到的方法可以是:批量數(shù)據(jù)補全,對一些數(shù)據(jù)集中的數(shù)據(jù),采用求平均、求最值或者其他數(shù)學計算公式得到補全?;蛘哂闷睢⑨槍I(yè)務的異常值或可以是統(tǒng)計可以查看到的數(shù)據(jù)做數(shù)據(jù)清洗。

      數(shù)據(jù)標簽我們也可以叫做數(shù)據(jù)切片,也就是從不同的維度描述數(shù)據(jù),如基礎標簽:存儲,安全登記,怎么訪問 數(shù)據(jù)倉儲標簽:周期性,是全面/增量 具體的業(yè)務標簽,是管理系統(tǒng),是某個功能相關,為這些數(shù)據(jù)做標簽處理。

      數(shù)據(jù)建模是將我們的數(shù)據(jù)降維,做歸一化處理后,變成單個指標或一個數(shù)據(jù)模型,在這一個步驟中,我們可以細分為多個小方法,第一:需要針對具體的業(yè)務場景或針對已有的數(shù)學模型選擇 第二:需要訓練選定的數(shù)據(jù)模型,通常需要根據(jù)業(yè)務、具體使用情況調整模型的參數(shù)配置 第三:通過訓練模型,對比模型是否受用,與標準值的對比,通過一些數(shù)學指標如:平均誤差率,判定系數(shù)等評估模型的正確性、查全性、查全率。第四:評估出最優(yōu)模型檢驗模型在真實的業(yè)務場景中的效果,并進行優(yōu)化。通過以上的步驟,并通過聚類、關聯(lián)規(guī)則、EM、KNN等數(shù)據(jù)分析方法可以進行大規(guī)模的指標化,找出數(shù)據(jù)中的價值。

      數(shù)據(jù)可視化,為了能夠更直觀的看到數(shù)據(jù),它是關于數(shù)據(jù)視覺表現(xiàn)形式的科學技術研究,解決我們在視覺上,空間上的不足,常用的手段包括:圖形化,表格化等。

      本文就元數(shù)據(jù)規(guī)劃、數(shù)據(jù)質量分析及提升,數(shù)據(jù)標簽,數(shù)據(jù)建模,數(shù)據(jù)可視化五個步驟對基于大數(shù)據(jù)武警數(shù)據(jù)平臺搭建做了方法闡述。

      猜你喜歡
      數(shù)據(jù)模型數(shù)據(jù)挖掘可視化
      基于CiteSpace的足三里穴研究可視化分析
      基于Power BI的油田注水運行動態(tài)分析與可視化展示
      云南化工(2021年8期)2021-12-21 06:37:54
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于CGAL和OpenGL的海底地形三維可視化
      “融評”:黨媒評論的可視化創(chuàng)新
      傳媒評論(2019年4期)2019-07-13 05:49:14
      面板數(shù)據(jù)模型截面相關檢驗方法綜述
      加熱爐爐內跟蹤數(shù)據(jù)模型優(yōu)化
      電子測試(2017年12期)2017-12-18 06:35:36
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      洪洞县| 精河县| 天镇县| 江西省| 仪陇县| 多伦县| 高雄市| 监利县| 新河县| 双城市| 辽阳市| 扬中市| 上高县| 绥棱县| 盱眙县| 甘洛县| 阆中市| 庄浪县| 苍溪县| 石狮市| 彭泽县| 泰安市| 兰考县| 右玉县| 甘德县| 浦东新区| 时尚| 横峰县| 内黄县| 无为县| 太保市| 双辽市| 锡林浩特市| 阜平县| 古丈县| 柯坪县| 图木舒克市| 宣城市| 蓝山县| 冕宁县| 独山县|