• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      可視化驅(qū)動(dòng)的交互式數(shù)據(jù)挖掘方法研究

      2017-04-17 18:41:49朱亞瓊
      電腦知識(shí)與技術(shù) 2016年36期
      關(guān)鍵詞:交互式數(shù)據(jù)挖掘檢索

      朱亞瓊

      摘要:在當(dāng)下的“大數(shù)據(jù)”時(shí)代,每一分每一秒都有無數(shù)數(shù)據(jù)正在不斷產(chǎn)生,因此,如何挖掘數(shù)據(jù)蘊(yùn)含的真正有價(jià)值的信息,成為人們關(guān)注的熱點(diǎn)。數(shù)據(jù)挖掘這一學(xué)科的出現(xiàn),正在逐步解決這一難題,而可視化驅(qū)動(dòng)的交互式數(shù)據(jù)挖掘也不斷帶來新的發(fā)現(xiàn)。該文通過對(duì)可視化數(shù)據(jù)挖掘、交互式數(shù)據(jù)挖掘的簡(jiǎn)要概述入手,延伸到可視化與交互式數(shù)據(jù)挖掘的分類,并通過舉例說明,介紹了各種的典型代表與實(shí)際應(yīng)用。

      關(guān)鍵詞:可視化;交互式;數(shù)據(jù)挖掘;檢索;技術(shù)

      中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)36-0004-02

      互聯(lián)網(wǎng)的迅猛發(fā)展使我們正逐步步入“大數(shù)據(jù)”時(shí)代,當(dāng)下,我們正面臨著一個(gè)數(shù)據(jù)量空前龐大的世界。隨著硬件設(shè)備的進(jìn)步,我們的數(shù)據(jù)存儲(chǔ)能力正不斷提高。據(jù)英國(guó)伯克利大學(xué)統(tǒng)計(jì),當(dāng)下全球每年大概會(huì)產(chǎn)生1 Exa 字節(jié)的數(shù)據(jù),超過一半的數(shù)據(jù)是電子數(shù)據(jù)形態(tài),我們也可以由此估計(jì),未來幾年產(chǎn)生的數(shù)據(jù)甚至?xí)^原有的所有數(shù)據(jù)量。數(shù)據(jù)的產(chǎn)生無處不在,即使是我們?nèi)粘I钪械牟唤?jīng)意動(dòng)作,如通話,上網(wǎng)等等,都會(huì)產(chǎn)生大量的數(shù)據(jù)。由于人們相信數(shù)據(jù)中蘊(yùn)藏著大量有用信息,所以這些數(shù)據(jù)被人們保存下來,但是,人們卻面臨著一個(gè)艱難的問題:我們?nèi)绾螐暮A繑?shù)據(jù)中挖掘出真正有用的隱藏信息?如果我們不能從費(fèi)力收集保存的數(shù)據(jù)中獲得所需要的信息,那么這些數(shù)據(jù)將會(huì)失去自身價(jià)值,用于儲(chǔ)存數(shù)據(jù)的數(shù)據(jù)庫將會(huì)成為“垃圾站”。

      因此,面對(duì)眾多的數(shù)據(jù),如何進(jìn)行挖掘和檢索成為了一個(gè)棘手的問題。信息可視化技術(shù)的出現(xiàn)為我們解決此問題提供了很大幫助。計(jì)算機(jī)可視化技術(shù)借助計(jì)算機(jī)的儲(chǔ)存功能和計(jì)算功能,加入人的觀察力、創(chuàng)造性,使人能夠在很大程度上參與數(shù)據(jù)檢索,真正的實(shí)現(xiàn)人與計(jì)算機(jī)之間的交互。通過實(shí)踐證明,可視化技術(shù)的應(yīng)用在數(shù)據(jù)檢索挖掘中潛力巨大,有著很大發(fā)展空間。

      1 什么是可視化數(shù)據(jù)挖掘

      隨著人們對(duì)數(shù)據(jù)挖掘的逐漸了解與深入,可視化數(shù)據(jù)挖掘的重要性日益凸顯出來。簡(jiǎn)單來說,可視化數(shù)據(jù)挖掘是人們對(duì)數(shù)據(jù)進(jìn)行直觀的分析,并結(jié)合交互式算法進(jìn)行計(jì)算研究??梢暬瘮?shù)據(jù)挖掘需要充分利用可視化技術(shù),并把數(shù)據(jù)挖掘的結(jié)果直觀的表現(xiàn)出來,得出可視化的結(jié)果。由于我們?nèi)粘J占臄?shù)據(jù)自身帶有很高的價(jià)值,當(dāng)我們采用可視化的方式去處理數(shù)據(jù)時(shí),視覺是觀察數(shù)據(jù)的重要方式,這也幫助人們將視覺感官的作用不斷發(fā)揮出來??梢暬瘮?shù)據(jù)技術(shù)的基本作用就是將用戶需要處理的大量信息通過計(jì)算機(jī)的計(jì)算分析功能轉(zhuǎn)化為便于用戶用感官去觀察分析的數(shù)據(jù)。當(dāng)計(jì)算機(jī)將數(shù)據(jù)整理成常見的科學(xué)模型時(shí),用戶就可以進(jìn)一步的分析數(shù)據(jù),找到數(shù)據(jù)中所蘊(yùn)含的信息,從而找出問題的解決方法。

      2 什么是交互式數(shù)據(jù)挖掘

      交互式數(shù)據(jù)挖掘作為一種數(shù)據(jù)挖掘的算法,在實(shí)際應(yīng)用中有幾種標(biāo)準(zhǔn)的分類。主要的方法是+V型方法與+M型方法。+V型方法更加側(cè)重計(jì)算機(jī)的數(shù)據(jù)處理能力,用計(jì)算機(jī)來挖掘數(shù)據(jù)中的隱含信息,將+V型方法與可視化相結(jié)合,可以更好地使用戶提取信息。而+M型方法更加依賴與可視化技術(shù),可視化技術(shù)是這種方式中最主要的數(shù)據(jù)處理方式。

      3 可視化與交互式數(shù)據(jù)挖掘技術(shù)的分類

      3.1 可視化數(shù)據(jù)類型

      可視化的數(shù)據(jù)類型包括六類:一維數(shù)據(jù)、二維數(shù)據(jù)、多維數(shù)據(jù)、文本或超級(jí)文本、層次或圖表以及算法或軟件。

      3.1.1 一維數(shù)據(jù)

      一維數(shù)據(jù)的典型特點(diǎn)是密集,時(shí)間序列數(shù)據(jù)就是一維數(shù)據(jù)的典型代表,時(shí)間序列數(shù)據(jù)中,每一個(gè)時(shí)點(diǎn)上都有與之相對(duì)應(yīng)的一個(gè)或多個(gè)數(shù)據(jù),例如一段時(shí)間內(nèi)股票的價(jià)格等。

      3.1.2 二維數(shù)據(jù)

      從名稱上來看,二維數(shù)據(jù)即有兩個(gè)不同維度的數(shù)據(jù)。地理數(shù)據(jù)就是二維數(shù)據(jù)的典型代表,地理數(shù)據(jù)中有經(jīng)度和維度兩個(gè)不同的維度,并借助X-Y軸系圖表示出來。

      3.1.3 多維數(shù)據(jù)

      顧名思義,多維數(shù)據(jù)是有三個(gè)或三個(gè)以上的維度構(gòu)成的數(shù)據(jù),因此多維數(shù)據(jù)的可視化十分復(fù)雜。我們常用的數(shù)據(jù)庫中的表格是多維數(shù)據(jù)的典型代表,一個(gè)表格中可能會(huì)有幾十甚至上百列的屬性,因此很難用二維方式去分析和研究,只能借助可視化技術(shù)進(jìn)行處理。常用的技術(shù)包括平行坐標(biāo)可視化技術(shù),平行坐標(biāo)的建立可以用折現(xiàn)將多維數(shù)據(jù)表示出來,使復(fù)雜的數(shù)據(jù)更加直觀與可視化。

      3.1.4 文本和超級(jí)文本

      由于數(shù)據(jù)種類的多樣化,一部分?jǐn)?shù)據(jù)是不能通過維度表示出來的。隨著網(wǎng)絡(luò)與計(jì)算機(jī)技術(shù)的進(jìn)步,文本和超級(jí)文本成為了一種重要數(shù)據(jù)類型。對(duì)于此種數(shù)據(jù)類型,需要先將數(shù)據(jù)轉(zhuǎn)化成可以使用向量進(jìn)行描述的數(shù)據(jù),才能進(jìn)一步使用多維技術(shù)與可視化技術(shù)。

      3.1.5 層次與圖表

      圖表與數(shù)據(jù)記錄有著密切的關(guān)系,圖表的節(jié)點(diǎn)包含著被記錄的對(duì)象,邊界表示對(duì)象間的聯(lián)系。典型代表包括電子郵箱之間的信息發(fā)送與接收,網(wǎng)頁間的超級(jí)鏈接等等,針對(duì)這里一類數(shù)據(jù)有很多專門的可視化技術(shù)。

      3.1.6 算法與軟件

      算法與軟件是一種大型的軟件工程,這一類數(shù)據(jù)的處理也是一項(xiàng)很有難度的工程。在這種數(shù)據(jù)的處理上,可視化技術(shù)的宗旨是提高人們對(duì)算法的理解,從而更好地拓展軟件內(nèi)容。可視化技術(shù)在算法中的常見應(yīng)用有將軟件的源代碼圖表化,使程序能夠更加的直觀,方便編程人員與工程師對(duì)于代碼的調(diào)試。目前,很多技術(shù)已經(jīng)可以很好地實(shí)現(xiàn)算法與軟件的可視化。

      3.2 可視化技術(shù)類型

      可視化的主要技術(shù)包括五類:標(biāo)準(zhǔn)二維/三維顯示技術(shù)、幾何變換顯示技術(shù)、密集像素顯示技術(shù)、圖標(biāo)顯示技術(shù)和堆疊像素顯示技術(shù)。

      3.2.1 標(biāo)準(zhǔn)二維/三維顯示技術(shù)

      最為基礎(chǔ)的技術(shù)方法,可以很大程度的實(shí)現(xiàn)數(shù)據(jù)可視化。

      3.2.2 幾何變換顯示技術(shù)

      幾何變換顯示技術(shù)可以將多維數(shù)據(jù)中的變換顯示出來,常見的技術(shù)包括探索統(tǒng)計(jì)技術(shù)、前剖視圖、切片以及平行坐標(biāo)可視化技術(shù)。平行坐標(biāo)可視化技術(shù)是一種十分重要的幾何變換顯示技術(shù),這一技術(shù)可以在兩個(gè)維度中將K維空間表示出來。

      3.2.3 圖標(biāo)顯示技術(shù)

      圖標(biāo)顯示技術(shù)是指用特定的圖標(biāo)來記錄數(shù)據(jù)的屬性。例如,在顯示維中記錄二維數(shù)據(jù),利用不同角度、不同長(zhǎng)度的圖表記錄數(shù)據(jù)的其他內(nèi)容,如果出現(xiàn)顯示維的數(shù)據(jù)過度密集的情況時(shí),則可以依據(jù)可視化原理,使不同的數(shù)據(jù)呈現(xiàn)不同形狀,便于人們識(shí)別。

      3.2.4 密集像素顯示技術(shù)

      與上一技術(shù)的原理類似,密集像素顯示技術(shù)是用顏色像素來記錄每一維度的數(shù)據(jù)屬性,并將像素聚集和分類。一般情況下,一個(gè)顏色像素用來表示一個(gè)數(shù)據(jù)值,因此可以使大量的數(shù)據(jù)被可視化。當(dāng)像素在屏幕上根據(jù)不同的目的排列時(shí),會(huì)將結(jié)果十分直觀地顯示出來。常用的密集像素顯示技術(shù)包括遞歸模式技術(shù)和圓環(huán)段技術(shù)。

      3.2.5 堆疊顯示技術(shù)

      對(duì)于層次分布的數(shù)據(jù),一般采用堆疊顯示技術(shù),要根據(jù)不同情況靈活選用數(shù)據(jù)維和層次。堆疊顯示技術(shù)的典型代表是維度堆疊,簡(jiǎn)單來說就是將一個(gè)坐標(biāo)系嵌入另外一個(gè)坐標(biāo)系,通過坐標(biāo)系的不斷合并,將數(shù)據(jù)的屬性形成可視化的結(jié)果,在這一技術(shù)的應(yīng)用中,最關(guān)鍵的是最外部坐標(biāo)維度的選擇,應(yīng)該按照重要性優(yōu)先選擇外部坐標(biāo)系。

      3.3 交互性技術(shù)

      交互性技術(shù)的功能是促進(jìn)用戶與可視化界面的交互,主要有五類:交互式投影技術(shù)、交互式過濾技術(shù)、交互式變形技術(shù)、交互式變焦技術(shù)和交互式鏈接和涂刷技術(shù)。

      3.3.1 動(dòng)態(tài)投影技術(shù)

      動(dòng)態(tài)投影技術(shù)是指在進(jìn)行數(shù)據(jù)挖掘時(shí),改變數(shù)據(jù)的動(dòng)態(tài)投影,來進(jìn)行計(jì)算分析的技術(shù),但這種方法具有一定局限性,在進(jìn)行高維信息的處理上發(fā)展空間很小。

      3.3.2 交互式過濾技術(shù)

      當(dāng)人們?cè)诿鎸?duì)龐大的數(shù)據(jù)時(shí),數(shù)據(jù)的檢索與查詢必不可少,但是瀏覽數(shù)量十分大的數(shù)據(jù)是,仍是一件費(fèi)力的事。因此,交互過濾技術(shù)逐漸發(fā)展起來,這一技術(shù)的典型代表工具是“魔鏡”,這一工具的原型是生活中的放大鏡,可以在篩選數(shù)據(jù)時(shí)實(shí)現(xiàn)可視化并過濾,以更加直觀的方式顯示數(shù)據(jù)。

      3.3.3 交互式變焦技術(shù)

      交互式變焦有著十分廣泛的用途,是非常著名與重要的技術(shù)。這一技術(shù)可以將研究的數(shù)據(jù)進(jìn)行放大,也可以將數(shù)據(jù)的顯示方式進(jìn)行自動(dòng)調(diào)整,使數(shù)據(jù)的細(xì)節(jié)部分能夠更好地被研究。關(guān)于這一技術(shù)有很多著名的例子如PAD++、DataSpace等等。

      3.3.4 交互式變形技術(shù)

      交互式變性技術(shù)對(duì)于用戶檢索信息來說十分便利,可以在展示用戶需要檢索的數(shù)據(jù)的同時(shí),仍舊保留數(shù)據(jù)整體信息與概括信息。典型的交互式變形技術(shù)有雙曲線變形技術(shù)和球面變形技術(shù),在對(duì)于層次與圖表數(shù)據(jù)的挖掘中經(jīng)常被運(yùn)用。

      3.3.5 交互式鏈接和涂刷技術(shù)

      盡管可視化技術(shù)眾多,但是每一種技術(shù)都有著自身的優(yōu)先與局限性。而交互式鏈接和涂刷技術(shù)則可以在眾多的技術(shù)中取長(zhǎng)補(bǔ)短,不斷地將各種技術(shù)相結(jié)合。交互式的鏈接技術(shù)可以將不同項(xiàng)目的散點(diǎn)圖相結(jié)合,涂刷技術(shù)可以使部分在全部的可視化數(shù)據(jù)中更為突出,因此,鏈接和涂刷技術(shù)的結(jié)合,為用戶的可視化提供了更好體驗(yàn)。這一技術(shù)的典型代表包括散點(diǎn)圖、餅狀圖、地圖等等,適用于絕大多數(shù)的數(shù)據(jù)檢索系統(tǒng)。

      以上三種方法雖然是三個(gè)不同維度的分類方法,但是在實(shí)際應(yīng)用中,在任何類型的數(shù)據(jù)處理中都可以采用可視化與交互式技術(shù)的結(jié)合運(yùn)用。

      4 結(jié)束語

      在信息量不斷膨脹的今天,我們會(huì)面臨越來越多的數(shù)據(jù),如果運(yùn)用得當(dāng),數(shù)據(jù)會(huì)成為人們生活工作各方面的得力助手。面對(duì)“大數(shù)據(jù)”時(shí)代,可視化技術(shù)有著極大的潛力,在數(shù)據(jù)挖掘等許多領(lǐng)域有著重要作用。

      在未來,可視化數(shù)據(jù)挖掘研究的一個(gè)重要方向就是與傳統(tǒng)學(xué)科如統(tǒng)計(jì)學(xué)、運(yùn)籌學(xué)、計(jì)算機(jī)科學(xué)等學(xué)科的整合,通過技術(shù)與專業(yè)知識(shí)的結(jié)合、人的感官能力與計(jì)算機(jī)的數(shù)據(jù)挖掘功能的結(jié)合,將會(huì)使我們對(duì)信息的整合與挖掘有一個(gè)質(zhì)的飛躍。同時(shí),可視化數(shù)據(jù)挖掘的發(fā)展也離不開信息化系統(tǒng),要將可視化技術(shù)與數(shù)據(jù)庫等結(jié)構(gòu)化信息系統(tǒng)整合起來,形成一個(gè)更加龐大和全面快速的大型數(shù)據(jù)挖掘系統(tǒng),不斷擴(kuò)展這一技術(shù)的發(fā)展空間,更好地為人們的實(shí)際生活帶來便利。

      參考文獻(xiàn):

      [1] 馬昱欣,曹震東,陳為.可視化驅(qū)動(dòng)的交互式數(shù)據(jù)挖掘方法綜述[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2016(1).

      [2] 呂紹鑫.可視化驅(qū)動(dòng)的交互式數(shù)據(jù)挖掘方法研究[J].信息與電腦,2016(11).

      [3] 熊平,朱天清,王曉峰.差分隱私保護(hù)及其應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),2014(1).

      [4] 陳瑩,楊素錦.數(shù)據(jù)挖掘語言應(yīng)用現(xiàn)狀研究[J].煤炭技術(shù),2011(6).

      [5] 錢維揚(yáng),王俊義,仇洪冰.基于Hadoop的數(shù)據(jù)挖掘技術(shù)在測(cè)光紅移上的研究[J].電子技術(shù)應(yīng)用,2016(9).

      [6] 閆大衛(wèi),涂波,黃小磊.基于教育云的交互式音樂教學(xué)模式研究——以鋼琴教學(xué)為例[J].黃鐘—中國(guó)·武漢音樂學(xué)院學(xué)報(bào),2014(3).

      猜你喜歡
      交互式數(shù)據(jù)挖掘檢索
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      2019年第4-6期便捷檢索目錄
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      ASP技術(shù)在交互式網(wǎng)頁設(shè)計(jì)中的應(yīng)用
      人間(2016年30期)2016-12-03 23:06:54
      淺談交互式電子白板在中學(xué)英語課堂的有效應(yīng)用
      南北橋(2016年10期)2016-11-10 16:35:15
      試論“交互式”課堂模式在初中英語閱讀教學(xué)中的運(yùn)用
      考試周刊(2016年76期)2016-10-09 09:24:38
      交互式電子白板在歷史教學(xué)中的應(yīng)用研究
      成才之路(2016年25期)2016-10-08 10:38:17
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      克东县| 永善县| 晋江市| 新蔡县| 蓝田县| 综艺| 舒城县| 新竹市| 贵港市| 天等县| 洱源县| 全南县| 天全县| 洛阳市| 海南省| 确山县| 西峡县| 新河县| 樟树市| 保德县| 平罗县| 望都县| 宽甸| 太谷县| 彝良县| 五华县| 津市市| 奉贤区| 江都市| 甘洛县| 北辰区| 横峰县| 大连市| 潼关县| 明溪县| 新河县| 东乡| 邯郸市| 南投市| 聂荣县| 和平县|