肖鳳春
(貴州城市職業(yè)學(xué)院,貴州 貴陽 550025)
人們逐漸重視大數(shù)據(jù)分析的目的主要是想通過對海量的數(shù)據(jù)進(jìn)行分析之后發(fā)現(xiàn)一些實際的問題,同時通過數(shù)據(jù)分析找到一些解決這些問題的正確方法。對大數(shù)據(jù)的分析應(yīng)用絕不能僅僅停留在表面的重視。大數(shù)據(jù)平臺自身具有很多的優(yōu)勢和利用價值。例如大數(shù)據(jù)平臺內(nèi)部收集的數(shù)據(jù)量非常之大。同時其運(yùn)算速度超乎人們的想象。這些方面的特征使得大數(shù)據(jù)分析平臺在科研、經(jīng)濟(jì)發(fā)展等各個領(lǐng)域都得到了廣泛的應(yīng)用。
任何科技的研究及使用最終目的都是為了讓其更好的為我們?nèi)祟愒旄5?。大?shù)據(jù)平臺的應(yīng)用,市場潛力巨大。大數(shù)據(jù)分析平臺對不同類型數(shù)據(jù)的分析方法也是有一定區(qū)分的。對于復(fù)雜數(shù)據(jù)的統(tǒng)計分析對數(shù)據(jù)的分析方法也是要求更高一些。通過科學(xué)上的不斷研究探索,現(xiàn)在已經(jīng)將數(shù)據(jù)圖形、計算機(jī)自動化分析模式引用了進(jìn)來。使對各類數(shù)據(jù)的分析都具備了科學(xué)性和可靠性。通過我國科學(xué)家的不斷努力,現(xiàn)在我國大數(shù)據(jù)分析平臺已經(jīng)具備了其自身獨特的架構(gòu)模型和運(yùn)算程序。目前我國大數(shù)據(jù)分析平臺在實際應(yīng)用過程,還在進(jìn)行著其自身的發(fā)展完善。
我們有可能對大數(shù)據(jù)分析平臺對數(shù)據(jù)的存儲方面的需求不太清楚。其實大數(shù)據(jù)分析平臺對數(shù)據(jù)保存的空間需求巨大,是我們傳統(tǒng)所認(rèn)知的存儲設(shè)備所不能滿足的。在大數(shù)據(jù)分析平臺中的數(shù)據(jù)存儲是一種動態(tài)的數(shù)據(jù)存儲。這種動態(tài)的存儲要求具體的講就是數(shù)據(jù)的往復(fù)調(diào)取流轉(zhuǎn)。需要我們及時的建立一個能夠滿足實際需求的數(shù)據(jù)存儲倉庫。并且要滿足數(shù)據(jù)調(diào)度的各種實際工況。所以總的來說,對于如何改善數(shù)據(jù)存儲方面的不足問題,還有很多工作要做。
任何在科學(xué)領(lǐng)域的數(shù)據(jù)分析都離不開數(shù)據(jù)模型的建立。并且在數(shù)據(jù)分析中建立數(shù)據(jù)模型都是極為關(guān)鍵的一項工作[1]。我們需要對現(xiàn)有數(shù)據(jù)進(jìn)行系統(tǒng)的分析整合來作為數(shù)據(jù)模型建立的基礎(chǔ)架構(gòu)。大數(shù)據(jù)分析平臺在工作過程當(dāng)中每時每刻都面對著大量的數(shù)據(jù)篩查工作。所以憑借以往的數(shù)據(jù)模型是很難完成現(xiàn)有的工作任務(wù)的。需要我們建立科學(xué)的數(shù)據(jù)模型與之相匹配。
大數(shù)據(jù)當(dāng)中充滿著很多的不固定的因素。包括對實時數(shù)據(jù)的統(tǒng)計,就是一項很難量化的工作。并且數(shù)據(jù)分析平臺內(nèi)的數(shù)據(jù)還具有變動的屬性。這也為大數(shù)據(jù)分析平臺的建立制造了很多未知的情況。并且在大數(shù)據(jù)分析平臺的實際運(yùn)營過程中,人們總是希望平臺能提高工作的性價比。這些都導(dǎo)致了數(shù)據(jù)在選取過程中難度頗大的問題出現(xiàn)。
從客觀上來說,數(shù)據(jù)的存在都代表著客觀世界當(dāng)中的某種事物的軌跡。因此,各方面的數(shù)據(jù)是極其具有價值的東西。隨著科技的發(fā)展,我們今天開始逐步的認(rèn)識到了這些數(shù)據(jù)的重要意義。但是由于現(xiàn)有技術(shù)的不足,到目前為止我們還缺乏一種高度集成化的數(shù)據(jù)分析系統(tǒng)來與現(xiàn)實的數(shù)據(jù)分析平臺相匹配。
大數(shù)據(jù)平臺的建立是為了滿足人類社會發(fā)展的各種需求的。但是數(shù)據(jù)的原始狀態(tài)是非常復(fù)雜甚至是雜亂無章的。這也造成了數(shù)據(jù)在開發(fā)利用上的巨大阻礙。數(shù)據(jù)的篩選上的問題就會越來越明顯。數(shù)據(jù)的具體實用價值在現(xiàn)實中就會被大打折扣?,F(xiàn)如今世界各國對這方面的重視程度還遠(yuǎn)遠(yuǎn)不夠。在數(shù)據(jù)采集的準(zhǔn)確性、規(guī)范性、安全性等方面還有許多問題需要及時解決。
數(shù)據(jù)分析平臺是具備多種使用功能的。通過對原始數(shù)據(jù)的收集,實現(xiàn)對數(shù)據(jù)的整理、分析、發(fā)現(xiàn)數(shù)據(jù)內(nèi)部存在的客觀規(guī)律以及最終得出具體結(jié)論。大數(shù)據(jù)分析系統(tǒng)對于數(shù)據(jù)分析平臺的意義十分重大。因此一定要建立海量存儲空間的數(shù)據(jù)庫。并且將收集的數(shù)據(jù)進(jìn)行及時的整理分類。對于利用價值較大的數(shù)據(jù)進(jìn)行及時的編組存儲,而對于利用價值不大的數(shù)據(jù),為了節(jié)約存儲空間就要進(jìn)行及時的刪除處理。并且通過對有用的數(shù)據(jù)進(jìn)行梳理,最終找出這些數(shù)據(jù)中存在的具體規(guī)律。
大數(shù)據(jù)分析平臺所收集的各種數(shù)據(jù)的過程是具有一定的客觀規(guī)律的。這些數(shù)據(jù)的特點可以被整理出具有一定循環(huán)規(guī)律的數(shù)據(jù)類型。同時有些數(shù)據(jù)在被認(rèn)定為不具備這種具有循環(huán)規(guī)律的數(shù)據(jù)類型[2]。所以對數(shù)據(jù)的分類整理是十分有必要的。因為不同類型的數(shù)據(jù)都對應(yīng)著不同的調(diào)用方式和系統(tǒng)。在數(shù)據(jù)具體篩查過程中我們就要建立起不同的數(shù)據(jù)篩選機(jī)制。實現(xiàn)對數(shù)據(jù)選取過程的完美匹配。以滿足不同工況下的實際需求。
一般情況下我們通過對數(shù)據(jù)的分析,就能夠得到想要的數(shù)據(jù)分析結(jié)果。并將這些數(shù)據(jù)分析結(jié)果進(jìn)行必要的保存或者刪除。通常為了滿足實際的工作需要,數(shù)據(jù)分析平臺當(dāng)中都會存在著多組數(shù)據(jù)分析模型。這些個數(shù)據(jù)分析模型會在遇到不同的數(shù)據(jù)類型的時候被自動匹配使用。從實際的數(shù)據(jù)分析過程來看,要對復(fù)雜的海量數(shù)據(jù)進(jìn)行及時的調(diào)用篩選其實是一項非常艱巨的任務(wù)。因此為了滿足實際分析數(shù)據(jù)過程的需要,一定要對數(shù)據(jù)分析系統(tǒng)進(jìn)行不斷的改良完善。
結(jié)束語:大數(shù)據(jù)分析平臺的建設(shè)現(xiàn)在已經(jīng)引起了世界各國的廣泛關(guān)注。我國目前在大數(shù)據(jù)分析平臺的研發(fā)建設(shè)上相比較下還是具備一定優(yōu)勢的。當(dāng)然也存在文中敘述的種種不足的情況,筆者針對這些不足提出了幾點具體的優(yōu)化策略。希望能夠為我國大數(shù)據(jù)分析平臺的建設(shè)和應(yīng)用提供些許幫助。