楊文琦
(中國傳媒大學廣告學院)
數據可視化是一門邊緣性學科,它包含了統計學、設計學、認知心理學等多個領域。將浩瀚如海的數據中包含的信息進行可視化,把數據中所隱含的關系變化呈現出來,能夠幫助人們理解事物、傳播信息和解決問題,因此,數據可視化這一領域在近幾年不斷發(fā)展。數據的可視化需要經歷一個設計的過程,不同的個體或組織在設計過程中的思路和做法不盡相同。本文將不同的數據可視化的設計邏輯歸納總結,為數據可視化分門別類,闡明這些數據可視化的種類之間的差異和聯系,給不了解這個領域的人一些基礎性的解釋。
數據(data),是一個計算機術語,表示的是關于事物的事實,體現了事物的性質、狀態(tài)和該事物與其他事物的相互關系,是一種高度抽象的客觀存在。一個孤立的數據沒有特定的含義,將其進行特定的表達或者是排列組合才讓一個抽象的數字體現出事實?;ヂ摼W的發(fā)展使得人類社會生活中產生的數據,不僅是在量上大大增多,而且在種類上也更加豐富,呈現了高度的復雜性。如果想要利用數據的特性,發(fā)掘數據體現事實的功能并為人所用,就需要對其進行視覺化的加工。
可視化(visualization),是一種整合提煉信息的行為。很多事物的信息和含義難以被人們的視覺感官快速接受并理解,人們需要對其進行細致深刻的解讀,甚至有相關的研究背景才能領會其含義。而可視化能夠幫助人們理解事物,將事物包含的不可輕易獲得的信息,轉化為通過眼睛和大腦中一些具有普適性的思維邏輯就輕而易舉地理解的圖像。數據的可視化就是變抽象數據為具象視覺圖。幫助人們理解發(fā)生在社會生活范圍內的種種聯系、變化。
數據可視化的過程是一個設計的過程。進行這項工作的個體或組織在面對大量數據時,往往有著自己想傳達的內容或想要探究的方向,他們會依照自己的想法和思路,選用自己覺得合適并能達到自己的目的的視覺語言把數據轉化為圖像。這些思路以及對數據的處理,對視覺語言的選擇,體現的就是一種設計邏輯。世界上第一個使用數據可視化來傳遞信息的人威廉·普萊費爾,在他1786年出版的《商業(yè)與政治地圖冊》中,有一個表現18世紀英國經濟狀況的數據圖表,這是數據可視化最早的案例。到今天,各種表現形式的數據可視化層出不窮,這一領域隨著科學技術的發(fā)展在不斷地向前飛躍,在各行各業(yè)都發(fā)揮著難以言喻的影響和作用。著名的埃森哲咨詢公司于2018年對900多名財務專業(yè)人士(包括450多名CFO和會計主管)進行的一項調查發(fā)現,81%的受訪者認為用數據講故事是財務專業(yè)人士的一項必備技能,這凸顯了數據可視化的重要性。
因此,本文把數據可視化的設計邏輯定義為:人們在將數據轉化為更明白清晰的圖示時遵循的一種他(進行數據可視化的人)認為合理的流程。這個邏輯在不同的人或群體上各不相同,因為他們面對的數據不一樣,或者有著不同的技術背景,追求的或是可視化的清楚美觀以廣泛地傳播信息;或是數據的集中處理以達到一種視覺上的呈現方式,也可能是利用可視化幫助自己理解數據。因此,關于數據可視化的設計邏輯有很多種。
對于數據可視化的設計研究,首先在國外發(fā)展應用,并且逐漸火熱起來。一些關于數據可視化的入門級別書籍,如美國統計學家Nathan Yau的《鮮活的數據:數據可視化指南》、Mark Smiciklas的《視不可當:信息圖與可視化傳播》,還有Noah lliinsky和Julie Steele的《數據可視化之美》等等,介紹了數據可視化時,如何對數據進行處理,針對目標應該選擇什么可視化工具,選擇什么樣的視覺語言等一系列在數據可視化過程中可能會遇到的問題。在更深一層,國內外許多關于數據可視化的研究,很多是關于可視化數據的最新算法,也有很多是對數據可視化相關技術的探討。在數據可視化的現實應用方面,國內外的研究范圍都非常廣泛,包括醫(yī)學、商業(yè)、高科技相關的和新聞媒體領域甚至是政治領域,都有數據可視化的實現。
根據這些書籍和文獻資料,本文將數據可視化的設計邏輯進行分類。因為數據可視化工作是相對開放的,所以設計過程中側重點有很大的相異性。本文認為,這種重點的不同其實就是設計邏輯的不同。
數據本身就是一個計算機用語,數據可視化的研究也是在計算機互聯網快速發(fā)展的情況下繁榮起來的,因此,很多數據可視化的設計邏輯和技術有密切聯系。在這種情況下,可視化數據的過程更注重對數據本身的整理,往往經過數據預處理、數據規(guī)范化處理、映射和繪制(可視化核心步驟)、顯示這么幾個步驟。這種類型體現的一種運用相關軟件來顯示數據意義的流程,很多情況下這些數據可視化的目的是利用數據來找到一些事實,也就是說,在進行可視化之前,人們并不明確這個對數據的可視化處理能幫自己得到什么。例如武漢理工大學藝術與設計學院的學者周航,希望通過對高校網絡用戶行為的數據可視化來得到學校學生使用網絡的特征,進而為學校的網絡管理提供依據。
平常生活中我們能夠接觸的數據可視化,它的目的就是以展示為主。像是柱狀圖扇形圖等等,能夠直觀地幫助我們把統計得來的數據進行展示。在視覺設計上,主要是通過形狀的性質如大小、位置等來體現數據的意義。很多軟件都可以實現這種設計目的。普通人使用的辦公軟件,就可以將體量不大的數據轉化為可視圖形,包括柱狀圖,扇形圖等等。而專業(yè)的可視化圖形工具則包括Matplolib、Echarts 等,也可以繪制折線圖、柱狀圖、熱力圖以及散點圖等。這些專業(yè)工具不僅可以處理大量數據進行可視化,也可以通過建立模型來預測數據。
在展示家族信息方面,來自葡萄牙波爾圖大學恩根哈利亞學院的學者何塞·博爾赫斯,提出了家譜數據可視化的新方法——上下文家族樹,一個制作家譜的新工具,能夠克服其它家譜工具的在某些方面的局限和不足。作者介紹,開發(fā)這個工具的公司,出發(fā)點就是要讓家譜展示家族信息方面盡可能的完美,呈現的信息盡可能清晰。因此,用這個工具進行可視化家譜數據,也體現出了很強的側重展示的設計邏輯。來自德國奧格斯堡大學的兩位學者亞歷烏恩魯和阿納托爾薩金,介紹了一個名為“蒙德里安”的統計數據可視化軟件,這個軟件追求給專業(yè)的測量人員和研究人員提供幫助,顯然,性質和“上下文家族樹”相同,利用軟件,通過可視化的信息來清晰展示數據意義,理解數據本身。
展示型的數據可視化,會因為設計的信息的側重點的不同而產生不同的設計方式。例如中西方家譜的可視化設計,就很好地體現了這一點。前文提到來自葡萄牙波爾圖大學恩根哈利亞學院的學者何塞·博爾赫斯的“上下文家族樹”,就是在展示信息上強調清晰完美。西方重視個體的價值,在家譜設計上追求以個人角度出發(fā)的家族統計。而中國的家譜,非常重視祖先的地位和家庭親屬關系。中國的家譜保存至今的主要來自清朝和民國,所以體現出很強的傳統文化特色。北宋文學家歐陽修編撰的《歐陽氏譜圖》,就是一種比較古老的家譜設計方法,簡稱“歐式”,“歐式”家譜的特點是世代分格,由右向左排列,五世一表。每個世代人名左側可有一些生平記述,主要介紹該人的字、號、功名、官爵、生辰年月日、配偶、藏地、功績等。不同的文化背景,導致設計家譜的可視化有了展示信息重點的差別。
當進行數據可視化的個體或組織在得到數據之后,就對數據其中含義有了大致了解時,他們所進行的數據可視化工作,側重的是傳播信息,利用可視化之后的結果——信息圖所天然帶有的客觀性來表現一定的內容。在這種情況下,數據的客觀性被大大削弱,數據可視化得到的圖示帶有一定傳達工作(數據可視化)者意圖的主觀性。為了追求這個傳播效果,這種類型的傳播者就會不那么強調數據的處理,而是在尋找強有力的視覺語言上下功夫,尋求最合理的數據映射和最生動直觀的表達方式。例如北京印刷學院的幾位學者對中國瀕危物種動物中五種瀕危級別較高的動物的相關數據進行了可視化展示,最終目的是呼吁人們行動起來保護瀕危動物。為了達到這一目的,他們選擇了非常吸引人眼球的檸檬黃色和橙色閃點和光點,并且特別處理了文字的跳躍和對比,在這次的可視化數據過程中把很多精力都放在了對視覺語言的提煉和選擇上,追求傳播效果。另外還有廣東財經大學商學院的學者李宏,認為可以將敘事設計加入新冠肺炎疫情數據可視化設計之中,為的是減少民眾不必要的恐慌情緒,刻意地減輕人們對疫情信息所產生的心理負擔。在這種類型的可視化數據工作中,傳遞信息成為了重點。在這種情況下,數據可視化的設計者也就是信息的傳播者,這種傳播數據的行為就是針對信息的“編碼與解碼”。信息通過傳播者的編碼進入流通環(huán)節(jié),并由信道傳輸至受眾,受眾接收到編碼后,根據自身的情境進行解讀。數據可視化則通過對數據的可視化呈現,將編碼和解碼的環(huán)節(jié)直接打通,受眾直接獲取數據源,因而大大減輕了解碼過程中需要的能量損耗,觸及信息核心。
數據可視化隨著互聯網科技發(fā)展而發(fā)展,它不僅被應用在傳統的醫(yī)學、天氣、實驗等領域,而且隨著時間向前,和新興科技例如交互技術,AR、VR技術等等也聯系起來。在重視美學效果的數據可視化設計過程中,雖然和側重傳播的數據可視化設計邏輯一樣,會在視覺語言上花費功夫,也像展示型數據可視化設計一樣把技術當作重點,但其最終目的不僅在于數據的交流和理解,也在于利用數據可視化來進行一種美學上的創(chuàng)造。例如上海工程大學的學者LIQI,介紹了Paras Kaul創(chuàng)作的3D游戲,“工作思維花園”,腦電波的活動決定了旅程的進程,根據用戶的大腦頻率創(chuàng)造出游戲體驗。類似的還有北京郵電大學的學者李鐵萌介紹的Jason Salavon的作品《Shoes,Domestics Produc—tion》,是以美國1960年至1998年期間生產的31種鞋的生產為驅動所創(chuàng)作的數據可視化作品,它既像一個俯視的噴泉,又像宇宙物質的爆炸,有著獨特的美感。
數據可視化的美學設計邏輯,其實體現的是一種藝術家利用數據進行的創(chuàng)作。在當今時代,互聯網急速發(fā)展,數據也成為一種藝術表現的媒介。利用一些簡單容易操作的數據軟件,藝術家創(chuàng)作了數據藝術作品。這種數據藝術作品,雖然被冠上了“藝術”的稱呼,但是本質上仍然呈現數據,只不過是,這種作品比起一般的數據可視化更增加了美學意義。這就要求數據可視化的設計師有著良好的美學素養(yǎng),能夠在傳遞信息的基礎上,創(chuàng)造藝術的視覺感受。對于一些內容不過分吸引人的數據來說,藝術性能夠吸引人的目光,從而幫助數據信息的傳播;而對于難以理解的數據來說,審美性增加了這種數據可視化的可讀性,從而也更好地實現了數據傳遞信息的本質要求。
數據本身是一種理性客觀的存在,是一種沒有情感的事物,所以,并不具備吸引人的特點。而藝術美則能夠滿足人們的美學需求和情感需要,能夠吸引人們的目光,打動人們的內心。將冰冷的數據和藝術表現結合,能夠賦予枯燥的數據圖表生命力,使之真正地服務于人們的生活,可以被更多人理解和接受。所以藝術和數據的結合體現了一種互相補充的設計思路。從實用性角度來講,賦予數據以美學意義可能會顯得過分修飾,但是實際上,致力于打造一個具有美觀價值的數據可視化作品有著很大的實際意義。
數據可視化的設計邏輯因為這項工作的開放性,而產生了不同。不同的設計邏輯,體現的是數據可視化工作者對數據的解讀角度,利用方式和最終目標,他們的可視化工作雖然都經歷了對原始數據的加工,對映射和設計語言的選擇、表現這幾個步驟,但是在這項工作開展的過程中,他們作為設計者的思路,差異很大。當明確了利用數據的目的,就能更好地使數據發(fā)揮作用,運用合適的方式來展現數據的奧秘。
數據需要設計師的處理,才能清晰直觀,而在這個處理過程中,難免會產生一些問題。首先在于一些數據可視化的作品過分講究美感,而忽視數據信息的傳遞,舍本逐末,這樣做顯然就失去了數據的意義;還有一些數據可視化的作品沒有對數據進行整理,所呈現出來的信息過于豐富,產生了難以傳遞信息的問題。解決這些問題既需要對數據的深度掌握,也需要對視覺圖像有一定的表現能力。