任海燕
摘要:近年來信息技術(shù)不斷的被應(yīng)用到各個領(lǐng)域中,隨之而來的是人們獲取數(shù)據(jù)的能力不斷加強(qiáng)。隨著可視化技術(shù)的不斷完善,其所涵蓋的范疇也得到了發(fā)展,信息和科學(xué)領(lǐng)域也已實現(xiàn)了數(shù)據(jù)可視化技術(shù)。本文以數(shù)據(jù)可視化為角度,以數(shù)據(jù)挖掘為技術(shù),對數(shù)據(jù)挖掘在可視化領(lǐng)域的應(yīng)用及發(fā)展趨勢進(jìn)行探討與研究。
關(guān)鍵詞:數(shù)據(jù)可視化;數(shù)據(jù)挖掘;可視化;技術(shù)
中圖分類號:TP311.13 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2018)08-0225-01
互聯(lián)網(wǎng)時代的到來也意味數(shù)據(jù)時代的來臨,如今整體而言數(shù)據(jù)具備的最大特點就是多,甚至還可以用海量來形容,給各個行業(yè)帶來發(fā)展的同時也給它們帶來了處理處理難度的加大,這就要求各行各業(yè)對數(shù)據(jù)的處理分析能力以及效率不要不斷提升,才有可能應(yīng)對如今龐大的數(shù)據(jù)。在這種環(huán)境下,傳統(tǒng)數(shù)據(jù)技術(shù)存在的問題愈加的多,且缺陷也日益被暴露。將數(shù)據(jù)可視化的相關(guān)處理技術(shù)在這種背景下順勢而出。數(shù)據(jù)的可視化的意義在于讓數(shù)據(jù)以多維的形式去進(jìn)行展現(xiàn),通過將其維度、屬性互相聯(lián)合,來達(dá)到將數(shù)據(jù)轉(zhuǎn)化為圖表來呈現(xiàn)給用戶的目的。相對過去的數(shù)據(jù)處理方式,數(shù)據(jù)可視化處理數(shù)據(jù)效、清晰明了,有利于提高用戶對數(shù)據(jù)的識別程度,具有很高的實用價值。數(shù)據(jù)挖掘技術(shù)對可視化的作用需要通過各種算法的支持下才能得已實現(xiàn)。鑒于目前所面臨的數(shù)據(jù)來源愈加的多,且傳統(tǒng)的算法功能存在限制。所以,很容易發(fā)生各類問題。用戶在可視化領(lǐng)域運用數(shù)據(jù)挖掘技術(shù)時,“黑箱”挖掘存在的幾率將會大大的降低,通過數(shù)據(jù)挖掘技術(shù)提高數(shù)據(jù)可視化形成圖表的可信度,提升用戶對數(shù)據(jù)規(guī)律掌握程度的準(zhǔn)確性,以此來提升各行各業(yè)的經(jīng)濟(jì)活動效率,具有重要的現(xiàn)實意義。
1 挖掘技術(shù)在可視化過程中的應(yīng)用
1.1 數(shù)據(jù)挖掘在可視化設(shè)計預(yù)處理階段的應(yīng)用
可視化設(shè)計預(yù)處理最重要的環(huán)節(jié)就是數(shù)據(jù)挖掘任務(wù)的進(jìn)行,在這個過程中對數(shù)據(jù)的基本處理包含有:規(guī)約過程,抽取過程,清洗過程、集成過程以及轉(zhuǎn)換過程等。這寫過程中涉及到的每個環(huán)節(jié)都是獨立進(jìn)行的,以相互之間的內(nèi)在聯(lián)系去共同完成所有的工作。對數(shù)據(jù)進(jìn)行預(yù)處理的主要要求有:一是通過選取合適的數(shù)據(jù)源來對目標(biāo)數(shù)據(jù)進(jìn)行有效的篩選。二是在集成環(huán)節(jié)需要按照類別的不同來進(jìn)行數(shù)據(jù)的粗劃分和儲存。三是檢查數(shù)據(jù)是否規(guī)范,是否存在數(shù)據(jù)沖突,有數(shù)據(jù)缺陷的地方要進(jìn)行精細(xì)加工,使得數(shù)據(jù)從為規(guī)范化,且按照相關(guān)標(biāo)準(zhǔn)的要求對數(shù)據(jù)進(jìn)行轉(zhuǎn)換、匯總、關(guān)聯(lián)以及萍姐。四是再次核對數(shù)據(jù),確認(rèn)沒有問題后,通過壓縮等方式完成數(shù)據(jù)挖掘在可視化設(shè)計中實現(xiàn)預(yù)處理。
1.2 數(shù)據(jù)挖掘算法在可視化設(shè)計中的應(yīng)用
數(shù)據(jù)挖掘算法在可視化設(shè)計中的應(yīng)用,主要分為三個結(jié)構(gòu):通過算法參數(shù)設(shè)定部件,通過中間環(huán)節(jié)顯示部件,三是界面與算法的映射層,具體內(nèi)容如下:
第一,通過算法參數(shù)來設(shè)定部件。由于參數(shù)是數(shù)據(jù)得以計算的基礎(chǔ),所以以可視化為目的對數(shù)據(jù)進(jìn)行挖掘之前,首要是對通過分析條件來確定與之相關(guān)的參數(shù),特別是參數(shù)值與數(shù)據(jù)集,在非特殊情況下可以可視化圖表中對參數(shù)值與數(shù)據(jù)值進(jìn)行動態(tài)的調(diào)整,以使得可視化圖表挖掘到的數(shù)據(jù)更多,且范圍更為廣泛。
第二、通過中間結(jié)果來顯示部件。由于顯示的部件能顯示中間的結(jié)果,所以數(shù)據(jù)挖掘技術(shù)在可視化領(lǐng)域的優(yōu)勢得到更為突出的體現(xiàn),用戶可以依據(jù)顯示在部件上的信息而了解到計算的情況以及輸出的過程。數(shù)據(jù)挖掘技術(shù)帶來的算法讓可以讓可視化圖表內(nèi)容更精準(zhǔn)。
第三,算法與界面的映射層。在可視化領(lǐng)域數(shù)據(jù)挖掘過程中界面與算法的映射層通過對拓展語言進(jìn)行以層面為單位的封裝,在不同的數(shù)據(jù)挖掘算法中顯示出來的可視化圖表的內(nèi)容不不盡相同,需要通過對用DMX拓展語言加以利用,并實現(xiàn)封裝,以此來完成階段性的計算,最終使計劃內(nèi)容服務(wù)于可視化圖表。
2 目前挖掘技術(shù)在可視化領(lǐng)域的問題
由于數(shù)據(jù)挖掘技術(shù)在計算的方式上存在著差異,但計算機(jī)計算的速度又十分的快,現(xiàn)有的數(shù)據(jù)挖掘技術(shù)只能實現(xiàn)可視化結(jié)果的現(xiàn)實,需要展示給用戶的模型在可視化模式下可被建立,但數(shù)據(jù)挖掘技術(shù)暫時還跟不上。再者整個鏈接是基于實現(xiàn)可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)的過程,由于信息科技領(lǐng)域中的集成技術(shù)目前還無法滿足在同一個中央處理器下這兩項技術(shù)的融合,所以這就導(dǎo)致了數(shù)據(jù)挖掘在可視化過程中連接不夠緊密。
3 數(shù)據(jù)挖掘在可視化領(lǐng)域的發(fā)展趨勢
數(shù)據(jù)挖掘工具將會實現(xiàn)挖掘過程可視化、可視化挖掘模型,可視化的質(zhì)量、程度以及人機(jī)交互將是數(shù)據(jù)挖掘技術(shù)得以更好的運用在可視化領(lǐng)域的主要指標(biāo)。不論是數(shù)據(jù)挖掘模型或者過程,在可視化方面發(fā)展受限主要有兩個原因:一是用戶對于結(jié)果的關(guān)注度遠(yuǎn)高于對模型以及過程的關(guān)注度。二是計算機(jī)在高速運算時具備簡單重復(fù)的特性,數(shù)據(jù)挖掘是否可視并無價值。其作為未來發(fā)展趨勢的重要性是基于人機(jī)交互的基礎(chǔ)之上的,綜合而言如果人機(jī)交互一定成為現(xiàn)實,那么可視化就可以將挖掘過程以及挖掘模型涵蓋進(jìn)去,同時挖掘過程和挖掘模型也是人機(jī)交互得已實現(xiàn)的基本要素。除此之外,數(shù)據(jù)挖掘的質(zhì)量、程度也將成為要素,并為在挖掘過程以及挖掘模型中實現(xiàn)可視化提供了充足的支持。
4 結(jié)語
本文通過對數(shù)據(jù)挖掘在可視化領(lǐng)域的應(yīng)用進(jìn)行了分析與研究,以此了解了與之相關(guān)的基本問題。就目前現(xiàn)狀而言,數(shù)據(jù)挖掘技術(shù)在可視化領(lǐng)域得到了一定的應(yīng)用,但很多的問題依舊存在,相關(guān)專家需要不斷的通過發(fā)現(xiàn)問題,而去完善問題,挖掘技術(shù)未來發(fā)展的重心就是要實現(xiàn)挖掘過程可視化、挖掘模型可視化以及人機(jī)交互這幾個方面。
參考文獻(xiàn)
[1]劉磊.可視化數(shù)據(jù)挖掘方法與技術(shù)探究[J].通訊世界,2017,(06):296.
[2]曾春先.可視化數(shù)據(jù)挖掘技術(shù)的研究[J].重慶電子工程職業(yè)學(xué)院學(xué)報,2014,23(05):148-150.
[3]米娜瓦爾·努拉合買提.淺談可視化數(shù)據(jù)挖掘方法與技術(shù)[J].計算機(jī)光盤軟件與應(yīng)用,2014,17(20):142+144.