王欣玉
摘要:Tableau是一款定位于數(shù)據(jù)可視化的智能展現(xiàn)工具,可以用來實現(xiàn)交互的、可視化的分析和儀表板應(yīng)用,從而幫助企業(yè)快速地認(rèn)識和理解數(shù)據(jù),以應(yīng)對不斷變化的市場環(huán)境與挑戰(zhàn)。簡便、快速地創(chuàng)建視圖和儀表板是Tableau最大的優(yōu)點之一,本文主要內(nèi)容為介紹Tableau的數(shù)據(jù)基礎(chǔ),學(xué)習(xí)實現(xiàn)利用Tableau快速創(chuàng)建基本的視圖,通過一個案例展示Tableau創(chuàng)建、設(shè)計、保存視圖和儀表板的基本方法,以此來供相關(guān)人士參考與交流。
關(guān)鍵詞:Tableau;商業(yè)數(shù)據(jù);可視化
引言
數(shù)據(jù)可視化于上個世紀(jì)五十年代左右出現(xiàn),最出名的代表是計算機創(chuàng)造出了圖形圖表,1987年,布魯斯·麥考梅克等撰寫的《科學(xué)計算可視化》加快了可視化技術(shù)的發(fā)展,第一次將科學(xué)計算中的可視化稱之為科學(xué)可視化。20世紀(jì)90年代初期,出現(xiàn)了信息可視化。目前將科學(xué)可視化與信息可視化都?xì)w為數(shù)據(jù)可視化。數(shù)據(jù)可視化是信息時代人們對于邏輯思維形象化需求的產(chǎn)物,在數(shù)據(jù)呈現(xiàn)爆炸增長,社會快速發(fā)展的潮流中,數(shù)據(jù)的處理是很重要的一個研究方向,其中數(shù)據(jù)可視化的研究是數(shù)據(jù)處理重要的一個方面,本文借助Tableau軟件,利用某商場的全球商業(yè)數(shù)據(jù)進(jìn)行可視化研究,為數(shù)據(jù)可視化的進(jìn)程增添了部分理論依據(jù)。
一、數(shù)據(jù)可視化的好處與優(yōu)點
數(shù)據(jù)可視化是數(shù)據(jù)領(lǐng)域一個重要的分支,目的是“讓數(shù)據(jù)說話”,展現(xiàn)數(shù)據(jù)之美。好的圖表會說話,好的圖表可以抓住用戶的心。信息時代讓人們的生活節(jié)奏加快,人們每一天都變得匆忙,時間被碎片化,甚至沒有多少時間完整看完一段文字。文字的力量是有限的。只有借助可視化,信息才能高效地傳播。數(shù)據(jù)可視化是數(shù)據(jù)領(lǐng)域一個重要的分支,目的是“讓數(shù)據(jù)說話”,展現(xiàn)數(shù)據(jù)之美。好的圖表會說話,好的圖表可以抓住用戶的心。在當(dāng)今信息時代,信息出現(xiàn)了“泛濫”與“過載”,人們每天都受到各種信息的“轟炸”。當(dāng)我們打開網(wǎng)頁或手機APP時,首先進(jìn)入我們視野的就是各種彈出的廣告信息。這些信息從內(nèi)容到形式,都經(jīng)過了精心設(shè)計。我們走在大街上,映入我們眼球的則是滿大街的廣告海報,還時常有人站在街邊向路人派發(fā)傳單。我們不僅僅只從書上看到了可視化的圖表,還從海報、信息圖、PPT、數(shù)據(jù)產(chǎn)品、大屏等獲取到了大量的可視化信息。能夠讓人們快速的得到所需要的數(shù)據(jù)信息[1]。
二、數(shù)據(jù)可視化的發(fā)展
數(shù)據(jù)圖表是最常用的可視化元素,除柱形圖、條形圖、餅圖、環(huán)形圖、線圖、散點圖、面積圖、雷達(dá)圖、K線圖、地圖等基本圖表外,現(xiàn)在也出現(xiàn)了更多新式的圖表,如山峰圖、雷達(dá)圖、氣泡圖、熱力圖、漏斗圖、樹圖、箱形圖、瀑布圖、河流圖、詞云圖、儀表盤、南丁格爾玫瑰圖、旭日圖、和弦圖、?;鶊D、3D圖,等等。另外,智慧的人們也常常創(chuàng)意性地將各種圖表混搭,例如地圖和餅圖、散點圖、柱形圖等搭配使用。由于技術(shù)的發(fā)展,實時數(shù)據(jù)采集、實時數(shù)據(jù)傳輸以及實時數(shù)據(jù)計算得以實現(xiàn),人們終于得以欣賞到數(shù)據(jù)的靈動之美。以前人們只能看到事后數(shù)據(jù)形成的分析結(jié)果,看到的是數(shù)據(jù)的過去式,領(lǐng)略的是數(shù)據(jù)的靜態(tài)之美。而現(xiàn)在,通過實時計算及數(shù)據(jù)可視化,人們可以知道“當(dāng)前時刻發(fā)生了什么”,看到了數(shù)據(jù)的變化,看到了數(shù)據(jù)的動態(tài)之美。數(shù)據(jù)可視化在設(shè)計上更注重用戶體驗了由“信息泛濫”引起“信息過載”,從而導(dǎo)致“信息焦慮”。無論是風(fēng)格、元素、配色、文字、交互上還是細(xì)節(jié)上,人們的可視化作品都越來越注重用戶的視覺體驗,希望能讓用戶一目了然,不多花一點兒時間去理解。在設(shè)計風(fēng)格上,從3D擬物化到簡潔扁平化再到擬物扁平化的發(fā)展變化,也在不斷地為用戶“做減法”[2]。
三、數(shù)據(jù)可視化的數(shù)據(jù)分析與來源
(一)數(shù)據(jù)來源
數(shù)據(jù)的來源是利用某商場的全球銷售的數(shù)據(jù),這部分?jǐn)?shù)據(jù)包含的字段多,數(shù)據(jù)量大,符合數(shù)據(jù)可視化研究的基本條件,因此選擇商業(yè)數(shù)據(jù)作為數(shù)據(jù)可視化研究的基礎(chǔ)數(shù)據(jù)[3]。
(二)數(shù)據(jù)處理與分析
Tableau軟件對數(shù)據(jù)的處理之前需要對數(shù)據(jù)進(jìn)行簡單的處理,綜合商業(yè)數(shù)據(jù)的數(shù)據(jù)特點,主要采用三種數(shù)據(jù)處理的方法,分別是數(shù)據(jù)插值、數(shù)據(jù)擬合和SOM算法。在進(jìn)行可視化分析的過程中,要注意數(shù)據(jù)擬合數(shù)據(jù)擬合是用連續(xù)曲線近似地刻畫或比擬平面上離散點組所表示的坐標(biāo)之間的函數(shù)關(guān)系的一種數(shù)據(jù)處理方法[5]。用連續(xù)的函數(shù)來分析離散的數(shù)據(jù)的一種常規(guī)的數(shù)據(jù)處理的方法,在科學(xué)研究或者實際生產(chǎn)過程中,可以把觀測或者實驗得到的數(shù)據(jù)對(xi,yi)(i=1,2,...,m),其中xi各不相同,對應(yīng)的yi也各不相同,人們希望有這樣一個函數(shù)能夠經(jīng)過實驗所得的這些點數(shù)據(jù),至少無限逼近這些點數(shù)據(jù),從而達(dá)到一種擬合的效果,我們把這個通過這些點或者無限逼近這些點的這個函數(shù)成為擬合函數(shù)。得到擬合函數(shù)以后,可以對數(shù)據(jù)中的異常值或者缺失值進(jìn)行剔除或者填充,這個數(shù)據(jù)處理的方法,在數(shù)據(jù)可視化的過程中顯得尤為重要。實現(xiàn)多維數(shù)據(jù)可視化的方法是把一個高維空間的數(shù)據(jù)信息通過降低維度的方法達(dá)到能夠可視化的目的,SOM算法主要是實現(xiàn)降低維度的運算,低維數(shù)據(jù)的空間可以分為若干個規(guī)格網(wǎng)格部分,規(guī)格網(wǎng)格要表示高維數(shù)據(jù)的信息,為了實現(xiàn)著這個目標(biāo),可以假設(shè)低維空間的網(wǎng)格由大約M個單元構(gòu)成,單元j都有一個與高維信息維數(shù)相同的原型矢量,該單元在網(wǎng)格中的位置rj是固定的。SOM的訓(xùn)練過程實際是調(diào)整原型矢量數(shù)據(jù)的過程,可以通過訓(xùn)練得到原型矢量對應(yīng)到低維空間,從而低維空間表示高維的信息。SOM算法是自組織神經(jīng)網(wǎng)絡(luò)的相關(guān)知識,在訓(xùn)練權(quán)值和閾值的過程中實現(xiàn)降維的對應(yīng)法則,為數(shù)據(jù)可視化的維度變化提供算法支持[4]。
四、結(jié)束語
數(shù)據(jù)可視化的研究在利用了Tableau作為軟件平臺,同時借助于數(shù)據(jù)插值算法,數(shù)據(jù)擬合算法,和SOM神經(jīng)網(wǎng)絡(luò)算法的基礎(chǔ)上對數(shù)據(jù)進(jìn)行可視化,可以從圖片的形象化視角來理解抽象的邏輯化視角數(shù)據(jù),用戶可以通過圖片、表格等直觀明了的角度看待數(shù)據(jù),及時為正確的決策提供有力的建議和指導(dǎo),在一定程度上促進(jìn)了經(jīng)濟(jì)的發(fā)展和社會的和諧穩(wěn)定。
參考文獻(xiàn):
[1] 陳明. 大數(shù)據(jù)可視化分析[J]. 計算機教育, 2015(5):94-97.
[2] 曾悠. 大數(shù)據(jù)時代背景下的數(shù)據(jù)可視化概念研究[D]. 浙江大學(xué), 2014.
[3] 任永功, 于戈. 數(shù)據(jù)可視化技術(shù)的研究與進(jìn)展[J]. 計算機科學(xué), 2004, 31(12):92-96.
[4] 吳健生, 王仰麟, 曾新平,等. 三維可視化環(huán)境下礦體空間數(shù)據(jù)插值[J]. 北京大學(xué)學(xué)報(自然科學(xué)版), 2004, 40(4):635-641.
(作者單位:天津理工大學(xué)信息安全)