• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于云計算數(shù)據(jù)庫的數(shù)據(jù)挖掘方法分析

      2017-12-30 11:15:53
      無線互聯(lián)科技 2017年14期
      關(guān)鍵詞:海量數(shù)據(jù)挖掘聚類

      陳 霄

      (廣州體育職業(yè)技術(shù)學(xué)院,廣東 廣州 510650)

      基于云計算數(shù)據(jù)庫的數(shù)據(jù)挖掘方法分析

      陳 霄

      (廣州體育職業(yè)技術(shù)學(xué)院,廣東 廣州 510650)

      隨著互聯(lián)網(wǎng)的不斷發(fā)展,云計算數(shù)據(jù)庫成為人們使用最多的一個平臺。云計算數(shù)據(jù)庫主要用于存儲海量數(shù)據(jù),為了保證云計算數(shù)據(jù)庫的穩(wěn)定性,需要對其進(jìn)行調(diào)節(jié)。人們在利用傳統(tǒng)方法對云計算數(shù)據(jù)庫進(jìn)行訪問時,常會出現(xiàn)數(shù)據(jù)挖掘性能差的情況,為了解決這一問題,需要建立全新的數(shù)據(jù)挖掘方法,比如建立云計算數(shù)據(jù)庫的多層自回歸矢量空間模型,分析數(shù)據(jù)的特點(diǎn)。文章主要闡述云計算的概念及特點(diǎn),分析云計算數(shù)據(jù)庫的數(shù)據(jù)挖掘方法,提出基于云計算數(shù)據(jù)庫的數(shù)據(jù)挖掘策略。

      云計算;數(shù)據(jù)庫;數(shù)據(jù)挖掘

      1 云計算的概念及特點(diǎn)

      1.1 云計算的概念

      對于云計算的定義有很多,其中最具有代表性的是:一些具有虛擬的資源的負(fù)載量是不一樣的,云計算可以把這些資源的不同量進(jìn)行新的配置,是一個具有大量虛擬資源的承載盤。云計算的用戶可以根據(jù)自己的需要去獲取資源,但是在使用的過程中由于對云計算的了解不夠全面,很容易出現(xiàn)一些問題導(dǎo)致計算機(jī)超載使整個系統(tǒng)崩潰。硬件設(shè)施都是固定的,為了解決這一問題就需要利用軟件來彌補(bǔ)這一不足。由于計算機(jī)的存儲空間是有限的,用戶可以通過云計算的自主檢測系統(tǒng)來提高存儲空間,保證計算機(jī)可以高效地運(yùn)轉(zhuǎn),給用戶帶來高質(zhì)量的服務(wù)。

      1.2 云計算的特點(diǎn)

      云計算系統(tǒng)具有以下幾個特點(diǎn):(1)透明化。云計算對用戶是透明的,用戶可以不需要過多地了解云計算,直接使用進(jìn)而得到自己想要的服務(wù)。(2)海量的數(shù)據(jù)處理功能。云計算能夠?qū)?shù)據(jù)進(jìn)行搜集,將這些數(shù)據(jù)進(jìn)行分析、匯總,讓用戶可以隨時隨地地使用。計算機(jī)本身具有很多數(shù)據(jù),隨著用戶需求量的增多,給計算機(jī)會帶來一定的負(fù)擔(dān),為了解決這一問題,就可以通過軟件替代的方式,把一些具有大數(shù)據(jù)的資源傳輸進(jìn)去,提高了計算機(jī)的存儲空間。(3)可用性較高。云計算具有排出失效節(jié)點(diǎn)的功能,在使用過程中不會影響到整個系統(tǒng)的運(yùn)行。通過高性能的計算能力搜集數(shù)據(jù),把這些數(shù)據(jù)進(jìn)行存儲,提高云計算的整體質(zhì)量。(4)用戶可以自行編寫程序。云計算本身的程序編寫不繁雜,用戶可以通過學(xué)習(xí)自己編寫程序,在完成之后可以在云系統(tǒng)上進(jìn)行使用,在一定程度上能夠給用戶提供個性化的服務(wù)。

      2 云計算數(shù)據(jù)庫的數(shù)據(jù)挖掘方法

      數(shù)據(jù)挖掘是通過對數(shù)量多、隨機(jī)出現(xiàn)、粗糙的歷史數(shù)據(jù)中找出一些具有潛在價值的不被人們所挖掘出規(guī)律的信息的過程。早在20世紀(jì)80年代,國際上就有人提出了對數(shù)據(jù)庫進(jìn)行知識發(fā)現(xiàn),用于解決數(shù)據(jù)庫空間不足知識貧乏的問題,要想挖掘數(shù)據(jù),就需要人們通過多階段的運(yùn)行找到云計算數(shù)據(jù)挖掘的方法。

      2.1 建立云計算數(shù)據(jù)庫的多層矢量空間模型

      要想分析云計算數(shù)據(jù)庫的數(shù)據(jù)挖掘方法,就需要建立預(yù)估模型,通過對模型的分類和預(yù)估,分析數(shù)據(jù)集合,找出數(shù)據(jù)中的一些規(guī)律和特點(diǎn)。對預(yù)估模型進(jìn)行分類,也就是把數(shù)據(jù)進(jìn)行有規(guī)律的排序,將一些分離出的數(shù)據(jù)進(jìn)行集合和記錄,并利用這些規(guī)律把對象放在定義的分類中,通過這一分類能夠預(yù)估出可能會發(fā)生的事情。預(yù)估就是通過建立預(yù)估模型把記錄數(shù)據(jù)相互聯(lián)系,對利潤和預(yù)估方式進(jìn)行分析。

      把數(shù)據(jù)庫作為基本的數(shù)據(jù)管理單元并入云計算環(huán)境,讓其能夠在云計算應(yīng)用程序中訪問調(diào)動,在這一過程中會產(chǎn)生海量的數(shù)據(jù),這些數(shù)據(jù)能夠通過數(shù)據(jù)信息映射到多層量自回歸空間中,為了實現(xiàn)海量數(shù)據(jù)目標(biāo)優(yōu)化探測和識別,就需要建立云計算數(shù)據(jù)庫多層矢量空間模型,在多層矢量空間模型中實現(xiàn)云計算數(shù)據(jù)庫中海量數(shù)據(jù)挖掘。這一模型能夠讓人們有效地認(rèn)識數(shù)據(jù)、分析數(shù)據(jù),找出使用數(shù)據(jù)的方法,通過對海量數(shù)據(jù)的挖掘進(jìn)而提高對云計算數(shù)據(jù)庫的訪問能力,以此達(dá)到對這些數(shù)據(jù)的提取。

      2.2 云計算數(shù)據(jù)庫的海量數(shù)據(jù)特征聚類

      云計算數(shù)據(jù)庫的聚類是指把一個較大的數(shù)據(jù)集分割成多個聚類,這些被分割的聚類內(nèi)部都有很多相同的特征。聚類實際上就是數(shù)據(jù)集中的一個組成部分,聚類的差異與數(shù)據(jù)集內(nèi)部相對比會發(fā)現(xiàn),聚類差異比較小。對聚類進(jìn)行分析能夠找出簇內(nèi)的相似度,同時每個簇之間的類似度比較低,所以簇只能是一個對象類,具有一定的屬性。在聚類的劃分上主要有3點(diǎn):(1)K均值聚類,這要求挖掘者要先確定聚類的數(shù)目K,然后明確K的中心點(diǎn),把聚類進(jìn)行分解,并把i個數(shù)據(jù)進(jìn)行歸類形成新的聚類,再根據(jù)個體到中心點(diǎn)的聚類對其進(jìn)行再次歸類;(2)統(tǒng)計學(xué)聚類,在這一聚類中主要是對一些具有分類變量的數(shù)據(jù)進(jìn)行分析,通過記錄和原數(shù)據(jù)挖掘出新的聚類,通過統(tǒng)計看記錄中的數(shù)據(jù)是否可以歸為一類,然后重復(fù)直到聚類不再發(fā)生變化;(3)神經(jīng)網(wǎng)絡(luò)聚類,主要是通過特征映射的方式,通過拓?fù)溆成涫蛊淇拷敵鰡卧?,這一聚類具有隨機(jī)性,在輸入時在鄰近處會出現(xiàn)減少的現(xiàn)象,最開始輸出單元不斷地更新,到后來更新的量就會減少,直至形成獲勝單元。

      為了實現(xiàn)云計算數(shù)據(jù)庫海量數(shù)據(jù)的高效挖掘,就需要在云計算數(shù)據(jù)庫的海量數(shù)據(jù)特征提取的基礎(chǔ)上,對這些需要處理的數(shù)據(jù)進(jìn)行聚類,在云計算數(shù)據(jù)庫信息流特征構(gòu)建的多層矢量自回歸空間中,可以采用多層空間模糊減法聚類,進(jìn)而實現(xiàn)數(shù)據(jù)的挖掘。主要的步驟如下:在提取的云計算數(shù)據(jù)庫的海量數(shù)據(jù)特征中,要先對海量數(shù)據(jù)特征進(jìn)行假設(shè),然后獲得空間坐標(biāo)模型,把數(shù)據(jù)帶入到相應(yīng)的公式中,利用模糊減法聚類算法獲取云計算數(shù)據(jù)庫海量數(shù)據(jù)特征聚類的目標(biāo)函數(shù)。根據(jù)聚類中心的變化,分析整個聚類不再更新的時間,然后利用公式獲得全新的海量數(shù)據(jù)聚類中心。

      2.3 異構(gòu)數(shù)據(jù)挖掘

      找出數(shù)據(jù)模板中通過合作具有異構(gòu)的,但是存在一定關(guān)聯(lián)的數(shù)據(jù)。比如,移動公司在對用戶的短信和彩信使用記錄進(jìn)行分析時,就可以通過該方式進(jìn)而得出用戶的消費(fèi)傾向,在制作套餐時就可以利用該數(shù)據(jù)進(jìn)行參考。把這些數(shù)據(jù)進(jìn)行集中處理,挖掘出全新的數(shù)據(jù)方法,能夠給人們提供便捷、高效的渠道。

      3 基于云計算數(shù)據(jù)庫的數(shù)據(jù)挖掘策略

      3.1 加強(qiáng)數(shù)據(jù)管理技術(shù)

      為了給用戶提供更加便捷的渠道,就需要快速地對數(shù)據(jù)進(jìn)行分析與處理。云計算系統(tǒng)雖然有了快速、高效的分析能力,但是在存儲數(shù)據(jù)上還需要進(jìn)一步加強(qiáng)。隨著網(wǎng)絡(luò)的發(fā)展,各種信息良莠不齊,用戶對于信息的需求也各不一樣。這就需要用戶可以利用現(xiàn)代技術(shù)學(xué)會管理自己的數(shù)據(jù),比如Big Table技術(shù),該技術(shù)具有管理數(shù)據(jù)的能力,能夠把這些數(shù)據(jù)進(jìn)行結(jié)構(gòu)化,還可以通過擴(kuò)展形成大規(guī)模的數(shù)據(jù),讓其能夠存儲在系統(tǒng)中。

      3.2 建立全面的存儲空間

      隨著網(wǎng)絡(luò)的發(fā)展,大量的數(shù)據(jù)出現(xiàn)給計算機(jī)帶來了一定的壓力。為了保證云計算系統(tǒng)能夠存儲大量的數(shù)據(jù),就需要利用云計算系統(tǒng)存儲的功能。通過分析可知,云計算系統(tǒng)在存儲方面具有一定的經(jīng)濟(jì)性、可靠性和實用性,采用冗余存儲的方式保證數(shù)據(jù)存儲的可靠性,但是由于一些硬件設(shè)備跟不上系統(tǒng)的步伐,就需要利用堅實可靠的軟件系統(tǒng)來完成。在數(shù)據(jù)的存儲方面,需要保證數(shù)據(jù)存儲技術(shù)要體現(xiàn)出傳輸率與吞吐率,通過這樣的方式云計算才能夠給用戶提供服務(wù),滿足大部分用戶的需求。

      3.3 利用Web進(jìn)行數(shù)據(jù)挖掘

      Web數(shù)據(jù)挖掘就是從云計算系統(tǒng)的存儲空間中,對在網(wǎng)絡(luò)中存在的文檔進(jìn)行分析與提取。利用網(wǎng)絡(luò)可以把計算機(jī)中大量的數(shù)據(jù)進(jìn)行收集,用戶可以通過連接服務(wù)器獲取自身需要的資源。在Web數(shù)據(jù)挖掘中主要分為以下幾個方面:(1)通過人為地在Web上對內(nèi)容進(jìn)行挖掘,用戶可以通過利用關(guān)鍵詞的方式查找數(shù)據(jù),然后分析該數(shù)據(jù)是否滿足其自身的需求;(2)可以通過挖掘網(wǎng)站中的相關(guān)數(shù)據(jù)和日志文件等發(fā)現(xiàn)網(wǎng)站中瀏覽者的行為,進(jìn)而分析獲得自己所需的數(shù)據(jù);(3)通過結(jié)構(gòu)挖掘,用戶可以通過人為行為在文檔中獲得有用的知識,通過這樣的方式能夠讓用戶在數(shù)據(jù)庫中高效地找到適合自己的信息,利用網(wǎng)絡(luò)的先進(jìn)性加強(qiáng)對云計算數(shù)據(jù)庫的處理。

      3.4 建立分層云計算數(shù)據(jù)庫

      隨著網(wǎng)絡(luò)大環(huán)境的發(fā)展,越來越多的數(shù)據(jù)存在于網(wǎng)絡(luò)中,為了更好地篩選云計算數(shù)據(jù)庫中的數(shù)據(jù),就需要網(wǎng)絡(luò)人員建立分層云計算數(shù)據(jù)庫。把其中絕大多數(shù)的數(shù)據(jù)通過分層的方式進(jìn)行整理歸類,這樣能夠便于用戶通過搜索關(guān)鍵詞來獲取數(shù)據(jù)。比如,用戶想要查找一些有關(guān)文學(xué)類的常識,云計算數(shù)據(jù)庫本身就對這些文學(xué)類知識進(jìn)行了一個總的劃分,然后再根據(jù)朝代、作者等細(xì)化的成分對其進(jìn)行歸類。用戶可以通過關(guān)鍵詞搜索得出自己想要的數(shù)據(jù),在一定程度上能夠更快速地找到信息,進(jìn)而完成數(shù)據(jù)的使用。

      4 結(jié)語

      在云計算數(shù)據(jù)庫的使用中,傳統(tǒng)的方法多是利用云計算數(shù)據(jù)庫來存儲海量的數(shù)據(jù),挖掘數(shù)據(jù)方法能夠提高云計算數(shù)據(jù)量的調(diào)節(jié)能力,利用傳統(tǒng)方法采用云計算數(shù)據(jù)庫訪問信道屬性權(quán)重分配方法進(jìn)行數(shù)據(jù)挖掘,在性能上比較差,這就需要人們通過建立全新的方法來對云計算數(shù)據(jù)庫進(jìn)行挖掘。通過加強(qiáng)數(shù)據(jù)管理技術(shù),建立全面的存儲空間,利用Web進(jìn)行數(shù)據(jù)挖掘,建立分層云計算數(shù)據(jù)庫等策略,不斷優(yōu)化海量數(shù)據(jù)庫,通過云計算數(shù)據(jù)庫進(jìn)行數(shù)據(jù)挖掘,提高數(shù)據(jù)的聚集性,排除一些不具有效力的數(shù)據(jù),改善和調(diào)節(jié)數(shù)據(jù)的能力。

      [1]張兵.一種用于云計算數(shù)據(jù)庫的數(shù)據(jù)挖掘方法研究[J].控制工程,2016(6):956-960.

      [2]吳永琢.用于云計算數(shù)據(jù)庫的數(shù)據(jù)挖掘方法分析[J].工程技術(shù)(全文版),2016(9):296.

      [3]李穎.基于云計算的非連續(xù)層次數(shù)據(jù)挖掘方法[J].西安工程大學(xué)學(xué)報,2016(4):498-503.

      [4]甘櫪元.基于云計算的數(shù)據(jù)挖掘算法的研究[J].電子技術(shù)與軟件工程,2015(7):195.

      [5]王彬菁,李明東.基于云計算的數(shù)據(jù)處理及數(shù)據(jù)挖掘方法[J].軟件導(dǎo)刊,2015(3):148-149.

      [6]王永.基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)及其關(guān)鍵技術(shù)探討[J].中國新通信,2015(10):69.

      Analysis of data mining methods based on cloud computing database

      Chen Xiao
      (Guangzhou Polytechnic of Sports, Guangzhou 510650, China)

      With the continuous development of the Internet, cloud computing database has become a platform for people to use. Most of the cloud computing database is mainly used to store large amounts of data, in order to ensure the stability of cloud computing database need to adjust it. People in the use of traditional methods of cloud computing access database, data mining often has poor performance.In order to solve this problem, we need to establish a new method for data mining, such as the establishment of cloud computing database multi-layer autoregressive vector space model, to analysis the data characteristics. This paper mainly expounds the concept and characteristics of cloud computing, analysis the data mining method of cloud computing database, and puts forward the data mining strategy based on cloud computing database.

      cloud computing; database; data mining

      廣東省高等學(xué)校優(yōu)秀青年教師培養(yǎng)計劃項目;項目編號:YQ2015204。

      陳霄(1980— ),女,廣東紫金,博士,講師;研究方向:領(lǐng)域為數(shù)據(jù)庫,數(shù)據(jù)挖掘。

      猜你喜歡
      海量數(shù)據(jù)挖掘聚類
      一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      海量快遞垃圾正在“圍城”——“綠色快遞”勢在必行
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      一個圖形所蘊(yùn)含的“海量”巧題
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
      自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
      黄冈市| 吉木乃县| 黑河市| 甘南县| 阿城市| 桂平市| 延安市| 华坪县| 八宿县| 绥宁县| 乡宁县| 浦江县| 乌苏市| 高雄市| 巴中市| 东莞市| 衡阳市| 湟源县| 光泽县| 凤翔县| 吉木萨尔县| 林芝县| 汝南县| 榆林市| 吴川市| 当雄县| 湟源县| 泰来县| 大方县| 康保县| 昭通市| 双牌县| 陆丰市| 普格县| 迁西县| 化德县| 长兴县| 重庆市| 柳江县| 临湘市| 龙海市|