陳海國
摘要:運用云計算技術(shù)處理大型數(shù)據(jù)是目前數(shù)據(jù)挖掘領(lǐng)域的前沿課題。在數(shù)據(jù)SLIQ算法中運用云計算技術(shù)可以對不同形式的數(shù)據(jù)進行處理,從而降低數(shù)據(jù)處理的難度,提高數(shù)據(jù)處理的工作效率,極具應(yīng)用價值。該文就云計算技術(shù)在數(shù)據(jù)suQ算法中的實踐進行探究,提出云計算技術(shù)在數(shù)據(jù)處理過程中的具體應(yīng)用策略及應(yīng)用效益。旨為計算機數(shù)據(jù)處理提供參考。
關(guān)鍵詞:云計算;數(shù)據(jù);SLIQ算法
隨著科學(xué)技術(shù)的不斷發(fā)展,計算機數(shù)據(jù)的采集和處理量不斷增加,計算機對數(shù)據(jù)處理的研究已經(jīng)成為科技發(fā)展的重要課題之一。經(jīng)過不斷的實踐探究,行之有效的方法是可以運用云計算技術(shù)處理大型數(shù)據(jù),對數(shù)據(jù)進行采集、分析和提煉挖掘。這樣大大降低了數(shù)據(jù)處理的難度,提升數(shù)據(jù)處理的效率。
1計算機的數(shù)據(jù)處理
計算機對數(shù)據(jù)處理的過程中可以利用云計算技術(shù)為客戶提供虛擬化的計算機數(shù)據(jù)處理平臺,并為客戶提供動態(tài)的資源池。云計算技術(shù)對數(shù)據(jù)的處理是在計算機對數(shù)據(jù)處理的基礎(chǔ)上對數(shù)據(jù)的二次開發(fā),并設(shè)計出不同類型的數(shù)據(jù)框架結(jié)構(gòu),這就是云計算在數(shù)據(jù)SLIQ中的算法。這種算法可以通過云計算平臺對數(shù)據(jù)進行處理。在這種計算中,云計算一直處于計算中的底層位置,這樣可以對上層中的數(shù)據(jù)計算實現(xiàn)透明化的處理。在云計算的技術(shù)中,還可以讓上層的計算模型通過中間的開放接口直接使用下層的數(shù)據(jù)。所以在SLIQ的算法中,可實現(xiàn)決策樹層和層與層之間的功能,并保證每一層計算都保持獨立性。
2數(shù)據(jù)處理中的SLIQ算法
SLIQ是一種快速可擴展的分類算法。數(shù)據(jù)SLIQ的算法中對數(shù)據(jù)進行處理時,首先要運用預(yù)排序的算法進行計算,這樣可以讓云計算技術(shù)決策樹上的每一個數(shù)據(jù)都進行有效的排序。根據(jù)每個數(shù)據(jù)不同的屬性進行取值,將數(shù)據(jù)進行從大到小進行排列,并為每一個數(shù)據(jù)都建立一個專有的屬性列表。運用這樣的順序進行決策樹的建立。在對決策樹運用的過程中,只要在一層的屬性列表進行掃描即可找出想要的數(shù)據(jù)。這樣的做法可以提高數(shù)據(jù)處理的工作效率,節(jié)省工作的時間。
在SLIQ的數(shù)據(jù)算法中包括類表和屬性表,每一個屬性都有一個屬于自己的屬性表。SLIQ的算法還包括內(nèi)部節(jié)點和樹節(jié)點等分類信息,每一個葉子節(jié)點都代表著每一種類型的數(shù)據(jù)和一種不同的數(shù)據(jù)類型。在每一個不同的節(jié)點中也都有一個直方圖,在處理數(shù)據(jù)的過程中可以通過直方圖來對數(shù)據(jù)進行分類。如圖1就是SLIO算法樹結(jié)構(gòu)中數(shù)值型的類直方圖,圖2就是SLIQ算法中樹結(jié)構(gòu)種類型的直方圖。
3云計算技術(shù)在SLIQ算法中的應(yīng)用
3.1創(chuàng)建云計算開發(fā)網(wǎng)絡(luò)平臺
在SLIQ的算法中加入云計算技術(shù)首先要做的就是開發(fā)云服務(wù)。云服務(wù)指的是在云計算的公共標準的基礎(chǔ)之上對云計算的網(wǎng)絡(luò)平臺進行開發(fā),目的是對計算機數(shù)據(jù)資源的進行合理的分類和管理,從而對計算機中的數(shù)據(jù)進行有效的利用,保障數(shù)據(jù)在云端的安全性,提升數(shù)據(jù)平臺開發(fā)的質(zhì)量。在SLIQ中運用云計算技術(shù)優(yōu)化數(shù)據(jù)的管理質(zhì)量,計算機對數(shù)據(jù)進行處理時,不但可以在不同的工作領(lǐng)域給數(shù)據(jù)處理帶來很多實際的應(yīng)用優(yōu)勢,還能夠為數(shù)據(jù)處理選擇出最合適的數(shù)據(jù)分析模型,并建立相應(yīng)的數(shù)據(jù)倉庫,和定期對數(shù)據(jù)進行數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)清除和數(shù)據(jù)消減等。所以在SLIQ的算法中運用云計算能夠提高數(shù)據(jù)處理的效率,提高數(shù)據(jù)管理的質(zhì)量。
3.2對云計算下的服務(wù)進行分層和細化
在SLIQ中運用云計算技術(shù),還要對云計算下的服務(wù)進行分層和細化。在軟件開發(fā)和管理的部門,開發(fā)人員通過對云計算技術(shù)的應(yīng)用,將計算機的系統(tǒng)、云端以及局域網(wǎng)進行組建,這樣就能夠能在一定的程度上提高計算機硬件開發(fā)的水平和質(zhì)量。對計算機硬件開發(fā)的過程中還能應(yīng)用到三層次的任務(wù),這樣通過移動設(shè)備或者通過云服務(wù)的功能就能對計算機數(shù)據(jù)處理的速度進行提升,這樣做能夠避免對計算機硬件的重復(fù)開發(fā)。對計算機的內(nèi)存進行管理的過程中,根據(jù)客戶的不同需求能提供出合適的存儲空間。對計算機軟件的設(shè)計過程中,可以對任務(wù)進行調(diào)度,并創(chuàng)建出新的任務(wù)功能。在計算機軟件的設(shè)計過程中還能設(shè)計出時鐘的程序,具備時間管理功能和中斷管理的功能,以滿足云計算數(shù)據(jù)處理的要求。
3.3實現(xiàn)云計算下的SLIQ算法的計算
在SLIQ算法中運用云計算的算法,首先可以依靠MDL的剪枝的定理對數(shù)據(jù)進行編碼,然后通過編碼生產(chǎn)初始樹。這樣的做法可以提高數(shù)據(jù)處理的效率,從而提升計算機的計算能力。但是在SLIQ的算法中還存在一些問題。例如,在云計算的過程中,會把列表存在計算機的內(nèi)存中,從而致使數(shù)據(jù)的大小和計算機的內(nèi)存受到限制。云計算在SLIQ中的應(yīng)用,采用的技術(shù)是預(yù)排序的技術(shù)。但是這種技術(shù)的算法非常的復(fù)雜,在實際的計算過程中會使數(shù)據(jù)的管理受到限制。
要想將數(shù)據(jù)庫中的數(shù)據(jù)進行轉(zhuǎn)換,要先了解數(shù)據(jù)所具有的參數(shù),還要定義數(shù)據(jù)統(tǒng)計的數(shù)據(jù)并確定統(tǒng)計的時間段。將數(shù)據(jù)進行排列,先要做的就是確定樹節(jié)點的信息和數(shù)據(jù)的結(jié)構(gòu)。類型字段直方圖如圖3,圖4所示。
3.4效益分析
對數(shù)據(jù)進行計算的過程中SLIQ的算法中可以運用云計算的技術(shù),這種做法改變了傳統(tǒng)的計算機管理模式。在傳統(tǒng)的計算機數(shù)據(jù)管理過程中,大多數(shù)運用的都是手動的人工管理。但是在現(xiàn)代化的計算機數(shù)據(jù)管理過程中則轉(zhuǎn)化成了網(wǎng)絡(luò)化的數(shù)據(jù)管理。這樣的轉(zhuǎn)變讓數(shù)據(jù)處理變得更有效率??s短了工作的時間,也提高了數(shù)據(jù)的安全性。在SLIQ計算中運用云計算技術(shù)還可以將計算機中的數(shù)據(jù)都儲存到一個云端之中,這樣各種的軟件資源與數(shù)據(jù)都實現(xiàn)能共享,從而減輕工作人員的工作量,提高工作人員的工作效率。
4結(jié)束語
綜上所述,在SLIQ算法中運用云計算技術(shù)能夠解決很多計算機數(shù)據(jù)處理時出現(xiàn)的問題。不僅能提高計算機數(shù)據(jù)處理的效率,還可以解決計算機數(shù)據(jù)存儲中節(jié)點失效的問題。這種做法可以促進計算機行業(yè)的發(fā)展,還可以加快客戶的查詢速度。加強對計算機數(shù)據(jù)的管理,從而提高數(shù)據(jù)計算的準確性。