聶俊嵐,陳賀敏,張繼凱,郭棟梁
(1.燕山大學 信息科學與工程學院,河北 秦皇島 066004;2.燕山大學 河北省計算機虛擬技術(shù)與系統(tǒng)集成重點實驗室,河北 秦皇島 066004)
隨著海洋探測手段的不斷進步,人類獲取的海洋數(shù)據(jù)規(guī)模正在呈指數(shù)級增長,數(shù)據(jù)復雜性也越來越高。探索海量多維相關(guān)數(shù)據(jù)的內(nèi)在聯(lián)系已成為知識發(fā)現(xiàn)、信息認知和信息決策過程的必要步驟。作為一種有效的抽象信息展現(xiàn)手段,多維數(shù)據(jù)可視化技術(shù)被廣泛應用到海洋可視化領(lǐng)域。并且,針對多維海洋數(shù)據(jù)的表達,探究多維要素之間的相互關(guān)系將成為今后的研究方向(劉健等,2014)。
近年來,在多維海洋數(shù)據(jù)可視化信息挖掘方面,國內(nèi)外學者進行了大量研究,主要集中在數(shù)據(jù)模型的提出(Liu et al,2010;Song et al,2010)與可視化系統(tǒng)的建立(覃如府等,2009;Zhang et al,2011;李新放等,2012)等方面。另一方面,Dennis 等(2005)采用數(shù)據(jù)特性映射的方式將多種數(shù)據(jù)屬性分別映射為不同的視覺特征(如色彩、亮度、大小等);類似地,陳超等(2012)采用多重紋理映射技術(shù)將海底底質(zhì)紋理映射到地形模型上。兩者均實現(xiàn)了多維數(shù)據(jù)元素以不同的形式同時展現(xiàn),便于從整體上把握各維數(shù)據(jù)的分布情況。更進一步,為了實現(xiàn)登島作戰(zhàn)中的登陸地域可行性評估,張立華等(2009)將海底的坡度、底質(zhì)以及海流海浪等地理要素進行綜合考慮,實現(xiàn)各要素數(shù)據(jù)的集成可視化,對數(shù)據(jù)信息進行更深層次的挖掘,從而為分析過程提供了可靠的理論依據(jù)。
在多維數(shù)據(jù)的集成可視化中,是否具有良好的交互手段往往是衡量一種可視化形式的重要標準。平行坐標(Inselberg et al,1990)可將高維數(shù)據(jù)集映射到平面的一系列平行坐標軸上,成為表現(xiàn)多維數(shù)據(jù)時最常用的一種可視化工具。近兩年,郭翰琦等(2011;2012)借助平行坐標,并將基于多維尺度的維度投射嵌入其中,完成多維傳遞函數(shù)的設(shè)計,實現(xiàn)了多種多變量體數(shù)據(jù)的可視化。在進行體可視化時,Kuhne(2012)在顏色混合過程中如何盡量保留基礎(chǔ)色調(diào)的問題上進行了深入研究,提出一種數(shù)據(jù)驅(qū)動的色調(diào)保留顏色混合算法,并將其應用到條帶式平行坐標中,使得顏色條帶的層次得到很好地保留與呈現(xiàn)。然而,在大多數(shù)基于平行坐標的實際應用中,比較看重的是各條帶所承載的數(shù)據(jù)信息的表達,而并不是條帶的展現(xiàn)層次。鑒于基于平行坐標的多維海洋數(shù)據(jù)集成可視化研究旨在數(shù)據(jù)信息的有效表征,所以承襲Kuhne 等人對條帶重疊部分進行顏色處理的思想,并對其方法進行簡化和擴充,選擇基于alpha 混合的迭代方式對重疊顏色進行混合,并引入數(shù)據(jù)集相似度的概念,通過重疊區(qū)域的顏色亮度改變實現(xiàn)其可視化,以細化信息展現(xiàn)層次,提高可視化結(jié)果的信息承載量。
從各維數(shù)據(jù)的交替顯示到依靠不同視覺編碼的疊加呈現(xiàn),再到按需進行的集成可視化,這一過程體現(xiàn)了針對多維海洋數(shù)據(jù)可視化研究的層層深入和數(shù)據(jù)信息挖掘的層層遞進。本文的研究則建立在集成可視化層次,以平行坐標作為數(shù)據(jù)集選擇工具,以不同的顏色條帶分別代表不同的選擇結(jié)果,并通過對重疊區(qū)域做顏色處理,利用得到的混合色表征該區(qū)域的實際數(shù)據(jù)含義。
平行坐標作為集成可視化過程的交互接口,用于感興趣數(shù)據(jù)集的選取與展現(xiàn)。由于其中的各個條帶都具有不同的坐標范圍,與之對應的實際空間數(shù)據(jù)也就有一定的實際含義。當兩條或多條條帶發(fā)生重疊時,該重疊部分可能具有更深層次的實際意義,例如代表兩個數(shù)據(jù)集的交集,即同時滿足兩組選擇條件的數(shù)據(jù)集。
但是,當重疊區(qū)域是由如圖1 所示的部分維度相交所產(chǎn)生時,該區(qū)域的意義就會產(chǎn)生二義性,既可表示數(shù)據(jù)集1 中前3 三個維度滿足數(shù)據(jù)集2 的部分數(shù)據(jù),還可表示與此相反的意思。因此,為了避免該二義性,本文對每個數(shù)據(jù)集賦予一個唯一的優(yōu)先級,令條帶重疊部分的數(shù)據(jù)集具有如下特點:(1)完全屬于相關(guān)集合中優(yōu)先級最高者;(2)只有部分屬性滿足其他集合。
圖1 平行坐標中條帶部分屬性重疊示意圖
在傳統(tǒng)的平行坐標中,各條帶間的顏色渲染是通過固定圖形管線進行處理,其生成的混合色總是與后繪制條帶的顏色比較相近,如圖2(a)所示,所以當條帶較多時很容易產(chǎn)生顏色混淆,無法實現(xiàn)不同數(shù)據(jù)集的有效區(qū)別表征。為了能從混合色中同時看出各基礎(chǔ)顏色,同時考慮優(yōu)先級順序,展現(xiàn)條帶疊加的層次性,本文提出基于式(1)的迭代混合方式:
迭代算法的具體實現(xiàn)偽代碼如下所示:
Function 計算某一像素點的顏色值
設(shè)顏色Cr=vec4(0.0,0.0,0.0,0.8);
For i=1 to n-1 (n=經(jīng)過該像素點的條帶數(shù))
(Ci和αi分別表示第i 條條帶的顏色值及不透明度)
End For
像素點的顏色為Cr
End Function
按照優(yōu)先級從高到低的次序,紅、藍、綠三基色經(jīng)過迭代式alpha 顏色混合處理后的效果如圖2(b)所示??梢钥闯觯捎帽疚姆椒ㄉ傻幕旌仙?,能與基礎(chǔ)色有效區(qū)分的同時還體現(xiàn)出數(shù)據(jù)集的優(yōu)先級別,即混合色總是偏向相交數(shù)據(jù)集中代表優(yōu)先級較高者的條帶顏色。如此,不僅能夠?qū)崿F(xiàn)不同數(shù)據(jù)信息的區(qū)別表征,并且還能很好地展現(xiàn)數(shù)據(jù)集之間的相互關(guān)系。
圖2 顏色混合結(jié)果
在數(shù)據(jù)的集成可視化中,多個數(shù)據(jù)集間可能出現(xiàn)重疊和相交,為了對這種關(guān)系進行量化和表征,引入數(shù)據(jù)相似度概念。數(shù)據(jù)集相似度在聚類問題中比較常見,并且通常將空間距離考慮其中,在一些文獻中也可以找到有關(guān)相似度的定義(謝明霞,2012;鄧冠男,2013)。通常,具有相似屬性的個體會存在較大的關(guān)聯(lián)。掌握了數(shù)據(jù)集的相似度,不僅能夠推測兩者的關(guān)聯(lián)程度,并且還能據(jù)此快速找到同時考慮各種情況下的最佳解決方案,從而幫助決策者從眾多信息中迅速找到感興趣的信息,并作出正確的決策。
本文的數(shù)據(jù)集相似度是從數(shù)值上進行考量的,僅與數(shù)據(jù)集間的相交維數(shù)以及每一維的相交比例有關(guān),且應具有如下規(guī)律:
(1)在相交區(qū)域比例不變的情況下,相交維數(shù)越高相似度越高。
(2)在相交維數(shù)不變的情況下,相交區(qū)域比例越大相似度越高。
(3)相交維數(shù)對相似度的影響因子大于相交比例。
按照以上規(guī)律,本文對數(shù)據(jù)集相似度做出如下定義:
定義1.定義SD 表示兩數(shù)據(jù)集的相似度,并且令
其中,N 表示數(shù)據(jù)維數(shù),xi3和xi4表示兩數(shù)據(jù)集在第i 個屬性上并集范圍的閾值,而xi1和xi2則表示兩數(shù)據(jù)集在該屬性值上交集范圍的閾值。
為實現(xiàn)多維數(shù)據(jù)集成可視化的同時體現(xiàn)出所選數(shù)據(jù)集的相似程度,通過多種亮度級別的一系列顏色對其進行表征,隨著條帶間相似度的增大,重疊部分的顏色亮度逐漸變低。以兩條相交條帶i 和j為例,表征其相似度所用顏色值的具體計算過程如下述偽代碼所示:
Function 計算用來表征數(shù)據(jù)集相似度的顏色值
設(shè)兩條帶經(jīng)過上述顏色處理后的混合色為Cij
For i=1 to N (N 為平行坐標中坐標軸的數(shù)目)
計算每維屬性的相似度
其中函數(shù)RGBtoHSL(r,g,b)表示將RGB空間的顏色值轉(zhuǎn)換為HSL 空間的顏色值,而HSLtoRGB(h, s, l) 則反之。通過顏色空間RGB 與HSL 之間的相互轉(zhuǎn)換,在保留混合色色相與飽和度的情況下,完成基于數(shù)據(jù)集相似度的顏色亮度改變,生成一系列不同亮度的混合顏色以實現(xiàn)相似度的表征,從而豐富了可視化結(jié)果,有效提高了其信息承載量??梢暬Ч鐖D3 所示。
圖3 數(shù)據(jù)集相似度的可視化效果
本文在Windows7 操作系統(tǒng)下使用OSG 三維圖形引擎以及GLSL 著色語言進行多維要素數(shù)據(jù)的交互式集成及其相似度表征。所用硬件環(huán)境為Intel i7-4770k 3.5GHz,16G RAM,顯卡為NVIDIA GTX780TI。本文選取全球海洋某一時刻的溫度、鹽度、溶解氧、表觀氧和飽和含氧量這五維作為實驗數(shù)據(jù),經(jīng)度范圍為180°W-180°E,緯度范圍為90°S-90°N,分辨率為3 600×1 800,實驗中的所有數(shù)據(jù)都被規(guī)范化至[0,1]。
在結(jié)果顯示方面,本文方法將各維海洋數(shù)據(jù)分別保存成二維紋理傳入GPU 中進行并行計算,并通過基于矩形網(wǎng)格的坐標變換實現(xiàn)可視化結(jié)果的球面顯示。而在交互方面,用戶通過鼠標拖動,既能改變坐標軸排列次序,又可以根據(jù)鼠標所在點實時顯示的屬性值確定各條帶的范圍,以實現(xiàn)各屬性區(qū)間的選擇。
采用迭代式alpha 顏色混合方法對平行坐標中條帶重疊區(qū)域的顏色進行處理后的效果如圖4(b)所示。圖4(a)并沒有對平行坐標中條帶重疊部分的顏色進行處理,只是由固定管線混合而成,沒有考慮其實際含義,在地理空間上也并未進行映射顯示。與其相比,本文方法除了能夠使用不同顏色條帶表示滿足不同標準的數(shù)據(jù)集,還能夠通過新生成的混合色表示同時滿足兩種標準的數(shù)據(jù)集,即兩顏色條帶的重疊部分所代表的含義,在有效提高可視化結(jié)果信息承載量的同時,還能夠輔助任務(wù)分析或決策人員在綜合考慮各種問題標準的情況下得到最佳的解決方案。
圖4 顏色混合前后的效果對比
為了細化信息展現(xiàn)層次,進一步提高可視化效果的信息承載量,本文引入數(shù)據(jù)集相似度的概念,并對其進行了表征,效果如圖5 所示。其所展示的是兩數(shù)據(jù)集在不同情況下的相似度大小及其表征。圖5(a)表示有兩個屬性相交時的相似度,圖5(b)表示相交屬性數(shù)增為4 的情況,而圖5(c)是在圖5(b)的基礎(chǔ)上改變數(shù)據(jù)集相交面積比例后的相似度??梢灾庇^看出,圖中從(a)到(c)相交區(qū)域的顏色亮度依次降低,這表示隨著相交維度的增加和相交面積所占比例的增大,數(shù)據(jù)集的相似度均會增大。如此,通過不同亮度的一系列顏色對數(shù)據(jù)集的相似度進行表征,能夠給用戶留下直觀的印象,方便其掌握所需數(shù)據(jù)集相似度情況,為相關(guān)工作的開展提供可靠的理論指導。
圖5 相似度表征結(jié)果對比
此案例研究的是溫度、鹽度、溶解氧和PH 值這四維地理因素對海洋生物分布的影響。中國對蝦、日本對蝦以及斑節(jié)對蝦這3 種生物對這四維要素的要求如表1 所示。而其集成可視化結(jié)果則如圖6 所示。其中,紅色(1)、藍色(2)、綠色(3)標識的空間分別表示適合中國對蝦(A)、日本對蝦(B)、斑節(jié)對蝦(C)生存的區(qū)域,而由紅色和藍色混合而成的4 號色表示適合A 和B 共同生存的區(qū)域,紅綠色混合而成的5 號色代表適合A 和C 共同生存的區(qū)域,紅藍綠混合而成的6 號色則表示3 種對蝦可以共同生存的地域。
表1 不同生物種類對相關(guān)因素的要求
可以看出,在只考慮溫度、鹽度、溶解氧和PH 值四種環(huán)境因子的情況下,中國對蝦除了中國沿海地區(qū),在南半球的大陸沿海地區(qū)也可以生存,并且中國東海和南海也分別有一定的區(qū)域范圍比較適合日本對蝦和斑節(jié)對蝦生活;日本南部海域的環(huán)境能基本滿足3 種對蝦共同生存條件;三者之中,中國對蝦與斑節(jié)對蝦的生活環(huán)境更為相似。
如同此案例的分析方式,在實際應用研究中,通過本文方法,可以將多維抽象數(shù)據(jù)以集成的方式直觀展現(xiàn),能充分挖掘出數(shù)據(jù)中的隱藏信息,并且隨著數(shù)據(jù)維度的增多,所呈現(xiàn)的區(qū)域信息會越來越準確,為實際問題的解決提供了一種快速、有效的分析手段。
本文在基于平行坐標的多維海洋數(shù)據(jù)集成可視化過程中,以顏色條帶的方式表示感興趣數(shù)據(jù)集,并對條帶重疊部分的顏色進行迭代式alpha 顏色混合處理,通過生成新的混合色將重疊部分所代表的特定含義表征出來,在擴展平行坐標展現(xiàn)信息能力的同時對數(shù)據(jù)中的隱藏信息進行了更深層次的挖掘。在此基礎(chǔ)上,為了細化信息展現(xiàn)層次,引入數(shù)據(jù)集相似度的概念,并同樣通過數(shù)據(jù)實時傳遞及信息映射實現(xiàn)其可視化,使得所展現(xiàn)的數(shù)據(jù)信息更加細致、全面,進一步提高了可視化結(jié)果的信息承載量。
圖6 海洋生物分布的集成可視化結(jié)果
本文方法只考慮了標量場數(shù)據(jù),適用范圍還存在一定的局限性。接下來,將引入風場、流場等矢量數(shù)據(jù)進行研究,擬將場強大小映射為平行坐標中的坐標軸,并將矢量場的流線可視化結(jié)果融入進來,通過平行坐標控制流線的顏色,實現(xiàn)多維標矢量場數(shù)據(jù)的交互式集成可視化,以擴展該方法的適用范圍。另外,該方法要求用戶具有一些關(guān)于顏色混合的先驗知識,未來將繼續(xù)探究更加直觀的顏色混合方法,盡量滿足更多用戶的需求。
Dennis B,Kocherlakota S, Amit S, et al, 2005. Designing a visualization framework for multidimensional data. Computer Graphics and Applications,IEEE,25(6):10-15.
Hanqi G,He X,Xiaoru Y,2011.Multi-dimensional transfer function design based on flexible dimension projection embedded in parallel coordinates.PacificVis,IEEE,19-26.
Hanqi G,He X,Xiaoru Y,2012.Scalable Multivariate Volume Visualization and Analysis Based on Dimension Projection and Parallel Coordinates.Visualization and Computer Graphics,IEEE Transactions on,18(9):1397-1410.
Inselberg A,Dimsdale B,1990.Parallel coordinates:a tool for visualizing multi-dimensional geometry.Visualization'90.,IEEE,361-378.
Kuhne L, Giesen J, Zhang Z, et al, 2012. A Data-Driven Approach to Hue-Preserving Color-Blending. IEEE Transactions on Visualization and Computer Graphics,18(12):2122-2129.
Liu J, Zhang X, Jian X, et al, 2010. Research on marine environmental data management in China digital ocean prototype system. IGARSS 2010,IEEE,2318-2321.
Song Y, Gong J, Zuo Z, et al, 2010. Data integration and visualization:Dealing with massive and multi-dimensional marine spatial data.CISP2010,4:1620-1623.
Zhang F,Li H,Liu J,et al,2011.Research and realization of visual digital ocean system.Marine Science Bulletin,(1):87-96.
陳超,王文珂,王懷暉,等,2012.一種海底地形與底質(zhì)的三維融合可視化方法.系統(tǒng)仿真學報,(9):1936-1939.
鄧冠男,2013. 聚類分析中的相似度研究. 東北電力大學學報,(Z1):156-161.
李新放,劉海行,周林,等,2012.基于OpenSceneGraph 的海洋環(huán)境三維可視化系統(tǒng)研究.海洋科學,(2):54-58.
劉健,姜曉軼,范湘濤,2014.海洋環(huán)境信息可視化研究進展.海洋通報,33(2):235-240.
覃如府,葉娜,許惠平,等,2009.GIS 系統(tǒng)中多維海洋數(shù)據(jù)可視化研究.同濟大學學報(自然科學版),(2):272-276.
謝明霞,郭建忠,張海波,等,2010.高維數(shù)據(jù)相似性度量方法研究.計算機工程與科學,(5):92-96.
張立華,劉雁春,朱慶,等,2009.基于多元要素集成的登陸地域可視化評估方法.火力與指揮控制,34(3):33-35.