門(mén)芳
時(shí)變型數(shù)據(jù)是一種隨著時(shí)間變化、帶有時(shí)間屬性的數(shù)據(jù)。在實(shí)際應(yīng)用中,時(shí)變型數(shù)據(jù)數(shù)量大、維度多、變量多,而且類(lèi)型豐富,分布范圍廣泛,特別是在各類(lèi)傳感器網(wǎng)絡(luò)、移動(dòng)互聯(lián)網(wǎng)應(yīng)用中,以流模式生成的流數(shù)據(jù)是一類(lèi)特殊的具有無(wú)限長(zhǎng)度時(shí)間軸的時(shí)變型數(shù)據(jù)。本文分析了時(shí)變型數(shù)據(jù)的內(nèi)容、特征及其可視化的種類(lèi),從三個(gè)方面對(duì)時(shí)變型數(shù)據(jù)的可視化方法進(jìn)行歸納和總結(jié)。
時(shí)間具有時(shí)間具有非常重要的緯和屬性。隨著時(shí)間變化、帶有時(shí)間屬性的數(shù)據(jù)時(shí)變型數(shù)據(jù)(Temporal Data)。從宏觀上看,時(shí)變型數(shù)據(jù)類(lèi)可分?jǐn)?shù)值型、有序性和類(lèi)別性三類(lèi)。其中,任意兩個(gè)有序型數(shù)據(jù)都具有某種順序關(guān)系,而數(shù)值型數(shù)據(jù)可看成某種有具體數(shù)值的有序型數(shù)據(jù)。據(jù)統(tǒng)計(jì)1974-1980年世界上的15種報(bào)紙和雜志上刊登的4000個(gè)圖像集合的75%都是以時(shí)間序列排序的。。
1.時(shí)間屬性的可視化
如果將時(shí)間屬性或順序性當(dāng)成軸變量,那么每個(gè)數(shù)據(jù)實(shí)例則視為軸上某個(gè)變量值對(duì)應(yīng)的單個(gè)事件,對(duì)時(shí)間屬性的刻畫(huà)有三種方式:
(1)線性時(shí)間和周期時(shí)間:線性時(shí)間假定一個(gè)出發(fā)點(diǎn)并定義為從過(guò)去到將來(lái)數(shù)據(jù)元素的線性時(shí)出發(fā)點(diǎn)并定義為從過(guò)去到將來(lái)數(shù)據(jù)元素的線性時(shí)域。
(2)時(shí)間點(diǎn)和時(shí)間間隔:離散時(shí)間點(diǎn)將時(shí)間描述為可與離散的空間歐拉點(diǎn)相對(duì)等的抽象概念。
(3)順序時(shí)間、分支時(shí)間和多角度時(shí)間:順序時(shí)間域考慮那些按先后發(fā)生的事件。對(duì)于分支時(shí)間、多股時(shí)間分支展開(kāi),這有利于描述和比較有選擇性的方案,這種類(lèi)型的時(shí)間支持做出只有一個(gè)選擇發(fā)生的決策過(guò)程多角度時(shí)間可以描述多于一個(gè)關(guān)于被觀察事實(shí)的觀點(diǎn)。
不同類(lèi)別的時(shí)變型數(shù)據(jù)需采用不同的可視方法不同類(lèi)別的時(shí)變型數(shù)據(jù)需采用不同的可視方法來(lái)表達(dá)。標(biāo)準(zhǔn)的顯示方法是將時(shí)間數(shù)據(jù)作為二維的線圖顯示,x 軸表示時(shí)間,y 軸表示其他的變量。這種方法善于表現(xiàn)數(shù)據(jù)元素在線性時(shí)間域中的變化,但是難以表達(dá)時(shí)間的周期性。時(shí)間序列也可以沿圓周排列,采用螺旋圖的方法布局時(shí)間軸,一個(gè)回路代表一個(gè)周期,選擇正確的排列周期可以展現(xiàn)數(shù)據(jù)集的周期性特征。此外,為了體現(xiàn)時(shí)變型數(shù)據(jù)的周期性結(jié)構(gòu)可以采用環(huán)狀表示某時(shí)間段內(nèi)的時(shí)間結(jié)構(gòu)。類(lèi)似于敘事型小說(shuō),時(shí)變型數(shù)據(jù)中蘊(yùn)涵的信息存在分支結(jié)構(gòu),對(duì)同一個(gè)事件也可能存在多個(gè)角度的刻畫(huà)。按照時(shí)間組織結(jié)構(gòu),這類(lèi)可視化可分為線性、流狀、樹(shù)狀、圖狀等類(lèi)型。
(4)線性多角度時(shí)間可視化:為了呈現(xiàn)一個(gè)完整的事件歷程和社會(huì)行為(如個(gè)人健康記錄、歷史事件等),可采用類(lèi)似于甘特圖(用條形圖表進(jìn)度的可視化標(biāo)志方法)的方式,使用多個(gè)條形圖線程表現(xiàn)時(shí)間的不同屬性隨時(shí)間變化的過(guò)程,線條的顏色和厚度都可以編碼不同的變量。
流狀分支時(shí)間主線可視化基于河流的可視隱喻可展現(xiàn)時(shí)序型事件隨時(shí)間產(chǎn)生流動(dòng)、合并、分叉和消失的效果,這種效果類(lèi)似于小說(shuō)和電影中的敘事主線。例如,軟件開(kāi)發(fā)中協(xié)作關(guān)系的演變類(lèi)似于電影中的人物關(guān)系。每個(gè)開(kāi)發(fā)人員在開(kāi)發(fā)過(guò)程中用一條線表示,當(dāng)兩個(gè)程序員同時(shí)開(kāi)發(fā)同一個(gè)模塊的時(shí)候,他們的線條合并。
2.多變量時(shí)變型數(shù)據(jù)可視化
多變量時(shí)變型數(shù)據(jù)是實(shí)際應(yīng)用中常見(jiàn)的數(shù)據(jù)集。由于存在多個(gè)變量,可視化需要兼顧數(shù)據(jù)本身屬性和數(shù)據(jù)集的順序性,結(jié)合數(shù)據(jù)分析的方法展現(xiàn)和挖掘順序性數(shù)據(jù)的規(guī)律。這個(gè)流程與可視化的基本流程—“全局摘 要;顯示重要部分—縮放和過(guò)濾;按要求顯示細(xì)節(jié),進(jìn)一步分析”相吻合,歸納為三類(lèi)基本方法,即數(shù)據(jù)抽象、數(shù)據(jù)聚類(lèi)和特征分析。
高維抽象的時(shí)變非空間數(shù)據(jù)通常蘊(yùn)涵宏觀的、結(jié)構(gòu)性的、隨時(shí)間變化的規(guī)律。將時(shí)變序列中的每個(gè)數(shù)據(jù)采樣點(diǎn)連接,原時(shí)變序列組成一條在高維空間的線,在低維空間可視化這條線可揭示高維空間的時(shí)間序列演化趨勢(shì)基于線表示的可視化有三個(gè)基本步驟。
第一步:高維曲線采樣,采樣的頻率由用戶交互指定。
第二步:將采樣后的高維曲線分段,便于刻畫(huà)每段曲線的特性,小段之間可以重疊。
第三步:用主元分析法將高維曲線投影到二維空間,顯示和研究曲線特征。
直接可視化大規(guī)模的時(shí)變型數(shù)據(jù)難以呈現(xiàn)其全部細(xì)節(jié),因此需要設(shè)計(jì)合適的交互方法表現(xiàn)重要的區(qū)域。
3.流數(shù)據(jù)可視化
流數(shù)據(jù)是一類(lèi)特殊的時(shí)變型數(shù)據(jù),輸入數(shù)據(jù)(全部或部分)并不存儲(chǔ)在可隨機(jī)訪問(wèn)的磁盤(pán)或內(nèi)存中,而是以一個(gè)或多個(gè)“連續(xù)數(shù)據(jù)流”的形式到達(dá)。常見(jiàn)的流數(shù)據(jù)有移動(dòng)通信日志、網(wǎng)絡(luò)數(shù)據(jù)(日志、傳輸 數(shù)據(jù)包警報(bào)等)、高性能集群平臺(tái)日志、傳感網(wǎng)絡(luò) 記錄、金融數(shù)據(jù)(如股票市場(chǎng))、社交數(shù)據(jù)等,處理流數(shù)據(jù)與傳統(tǒng)的數(shù)據(jù)池處理方法相比有以下特點(diǎn):
(1)數(shù)據(jù)流的潛在大小也許是無(wú)限的。
(2)數(shù)據(jù)元素在線到達(dá),需要實(shí)時(shí)處理,否則數(shù)據(jù)的價(jià)值隨時(shí)間的流逝可能降低。
(3)無(wú)法控制數(shù)據(jù)元素的到達(dá)順序和數(shù)量,每次流入的數(shù)據(jù)順序可能不一致數(shù)量時(shí)多時(shí)少。
(4)某個(gè)元素被處理后,要么被丟棄,要么被歸檔存儲(chǔ)。
對(duì)于流數(shù)據(jù)的查詢(xún)異常情況和相似類(lèi)型比較耗時(shí),人工檢測(cè)日志相當(dāng)乏味且易出錯(cuò)。
上文總結(jié)的時(shí)變型數(shù)據(jù)可視化方法主要采用靜態(tài)方式展示數(shù)據(jù)中記錄的內(nèi)容,不隨時(shí)間變化,但可采用多角度、數(shù)據(jù)比較等方法體現(xiàn)數(shù)據(jù)隨時(shí)間變化的趨勢(shì)。此外,時(shí)變型數(shù)據(jù)還有許多的具體分類(lèi),在對(duì)時(shí)變型數(shù)據(jù)進(jìn)行可視化時(shí),還必須考慮時(shí)變型數(shù)據(jù)進(jìn)行詳細(xì)的分析,使用最合適的可視化方法對(duì)其驚醒可視化。
(作者單位:大連工業(yè)大學(xué)設(shè)計(jì)學(xué)院)