周詠緡
摘要 數(shù)據(jù)新聞的可視化呈現(xiàn)形式——信息圖表(也稱圖表新聞)隨著“大數(shù)據(jù)”的發(fā)展也日益受到媒體人的重視。如何有效利用數(shù)據(jù),讓數(shù)據(jù)“說”的“話”更具可信性、客觀性和可讀性是信息圖表新聞賴以生存的關(guān)鍵,也是其未來持續(xù)發(fā)展的基礎(chǔ)。本文提出可以通過搭建信息圖表的宏觀數(shù)據(jù)庫和微觀數(shù)據(jù)庫,來提高圖表在數(shù)據(jù)新聞報道上的時效性和準確性,并建議將數(shù)據(jù)庫作為信息圖表業(yè)務(wù)的重要基礎(chǔ)性建設(shè)不斷“擴容”。
關(guān)鍵詞 大數(shù)據(jù);數(shù)據(jù);信息圖表;數(shù)據(jù)庫
中圖分類號G203 文獻標識碼A
2013年,被業(yè)界稱為大數(shù)據(jù)(Big Data)元年?!按髷?shù)據(jù)”是指無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合,其主要特點是海量、非結(jié)構(gòu)化和半結(jié)構(gòu)化、實時處理,業(yè)界將其歸納為4個“V”:Volume(數(shù)據(jù)量大),Variety(數(shù)據(jù)類型多樣),Velocity(處理速度快),Value(價值密度低)。作為大數(shù)據(jù)時代的核心資源,數(shù)據(jù)也日益受到媒體人的重視。如果說20年前記者對數(shù)據(jù)的處理還僅限于羅列數(shù)字或?qū)?shù)字集合于一張表格之中,那么現(xiàn)在我們生活在用0和1描述的各類數(shù)據(jù)世界中,而統(tǒng)計學意義上的數(shù)字也僅僅是數(shù)據(jù)中的一種,媒體人現(xiàn)在和未來都必須面對包含各種文件,文字、數(shù)字、圖形、符號、視頻和音頻等的海量數(shù)據(jù)。根據(jù)維基百科對數(shù)據(jù)的解釋,數(shù)據(jù)是指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關(guān)于事件之一組離散且客觀的事實描述,是構(gòu)成信息和知識的原始材料。數(shù)據(jù)可指計算機加工的“原料”,如圖形、聲音、文字、數(shù)、字符和符號等。
面對豐富多彩的數(shù)據(jù)世界,如何借“大數(shù)據(jù)”發(fā)展這個契機,順勢而為開拓新聞報道的新疆域是近年業(yè)界討論的熱點話題。一種以數(shù)據(jù)驅(qū)動為特點的跨學科、跨領(lǐng)域的新聞“新秀”——數(shù)據(jù)新聞學(Data Journalism)應(yīng)運而生,并逐漸受到媒體青睞。數(shù)據(jù)新聞的核心是數(shù)據(jù),從數(shù)據(jù)采集到分析再到展示,各項報道環(huán)節(jié)和技術(shù)無不圍繞數(shù)據(jù)展開,通過數(shù)據(jù)背后的關(guān)聯(lián)與模式來講述一個復(fù)雜的故事。具體而言,數(shù)據(jù)新聞在形式上以圖表、數(shù)據(jù)為主,輔之以必要的少量文字;在實際操作中,記者主要通過數(shù)據(jù)統(tǒng)計、數(shù)據(jù)分析、數(shù)據(jù)挖掘等技術(shù)手段或是從海量數(shù)據(jù)中發(fā)現(xiàn)新聞線索,或是抓取大量數(shù)據(jù)拓展既有新聞主題的廣度與深度,最后依靠可視化技術(shù)將經(jīng)過過濾后的數(shù)據(jù)進行融合,以形象化、藝術(shù)化的方式加以呈現(xiàn),致力于為讀者提供客觀、系統(tǒng)的報道以及良好的閱讀體驗。
在有市場需求的大環(huán)境下,作為數(shù)據(jù)新聞的可視化呈現(xiàn)形式——信息圖表(也稱圖表新聞),以其數(shù)據(jù)分析和數(shù)據(jù)闡釋見長的特點成為媒體應(yīng)用數(shù)據(jù)進行報道時的“寵兒”。信息圖表中的每一個數(shù)據(jù)都在為新聞服務(wù),為新聞“說話”,編輯通過對數(shù)據(jù)的搜集、整理、分析和挖掘等定量分析來提升報道的可信度和客觀性,使讀者在輕松的“數(shù)讀”過程中,多角度和多層面地了解新聞事實,接受信息,洞悉新聞事件的內(nèi)在聯(lián)系乃至本質(zhì),這也是信息圖表在國內(nèi)外媒體中扮演著越來越重要的角色的原因所在,也成為大眾傳媒在面對自媒體挑戰(zhàn)時,實現(xiàn)自我救贖的一種方式。新聞報道中不論文字、圖片,還是圖表和音視頻等都屬于數(shù)據(jù)范疇,既是數(shù)據(jù)的內(nèi)容,也是數(shù)據(jù)的呈現(xiàn)方式。相比其他類型,信息圖表可以集文、圖、符號、音視頻于一體的特點本身就是對各類數(shù)據(jù)的集成,這也正是數(shù)據(jù)新聞選擇信息圖表作為報道載體的原因。國內(nèi)“嗅覺”靈敏的各大門戶網(wǎng)站早已開設(shè)數(shù)據(jù)新聞專欄,如搜狐的“數(shù)字之道”、網(wǎng)易的“數(shù)讀”、新浪的“圖解天下”和騰訊的“新聞百科”等,國外以《衛(wèi)報》、《紐約時報》、《華盛頓郵報》、《金融時報》、BBC等為代表的傳統(tǒng)媒體也紛紛通過信息圖表這種形式展示數(shù)據(jù)新聞。
一、在信息圖表中運用數(shù)據(jù)的三個注意事項
應(yīng)該說,大數(shù)據(jù)時代為數(shù)據(jù)新聞提供了豐盛的“食材”,信息圖表的報道任務(wù)就是將這些食材烹飪出適合受眾口味的色香味俱全的大餐,為保證“美味”,在制作過程中需要特別留意以下三點:
(一)數(shù)據(jù)的權(quán)威性
要保證數(shù)據(jù)的權(quán)威性,首先要確保數(shù)據(jù)的來源可靠,有據(jù)可查。一般來說,政府部門和權(quán)威機構(gòu)發(fā)布的數(shù)據(jù)可信度較高,而民間組織、調(diào)查公司等發(fā)布的數(shù)據(jù)說服力相對弱一些,記者隨機采訪的數(shù)據(jù)僅供參考。作為可信度較高的大量數(shù)據(jù)擁有者,政府和權(quán)威機構(gòu)歷來是記者的采訪“重地”,以往需要記者提前聯(lián)系、深入采訪才能拿到的官方數(shù)據(jù),隨著近些年政務(wù)公開和信息透明化力度的不斷加大,一下變得唾手可得,大量公共數(shù)據(jù)被“釋放”出來,不但為媒體及時發(fā)布數(shù)據(jù)新聞提供了有力保證,更為信息圖表的發(fā)展提供了巨大機遇。
其次,在制作信息圖表的過程中,我們認為通過數(shù)據(jù)對比可以有效增強數(shù)據(jù)的權(quán)威性,加深受眾對新聞主題的理解。數(shù)據(jù)對比通常采用縱向比或橫向比,縱向比是指對同一類別的歷史數(shù)據(jù)進行比較,比如,報道國內(nèi)生產(chǎn)總值連續(xù)5年增長,就要有這5年每年的數(shù)據(jù)作為背景來說明這個新聞事實;橫向比是指將同一時段的不同類別進行比較,比如,報道中國城鄉(xiāng)收入比10年來最低,就要將10年來城鎮(zhèn)和農(nóng)村居民兩組收入數(shù)據(jù)進行對比來驗證新聞的真實性。
(二)數(shù)據(jù)的準確性
“準確”是貫穿數(shù)據(jù)新聞采編發(fā)始終的生命線。數(shù)據(jù)新聞中大至政治立場、輿論導向,小到具體數(shù)字、單位和譯名,都要做到準確無誤,這是對一名新聞工作者的基本要求。信息圖表制作過程中經(jīng)常要接觸到各種圖形和統(tǒng)計數(shù)據(jù)等,對準確性的要求尤為突出。例如在使用地圖時應(yīng)注意在涉及領(lǐng)土、國界線和國名標示等一系列重大敏感問題時,編輯必須慎之又慎,要與我國正式出版的地圖冊反復(fù)核對,有時甚至需要手工描摹。在制作財經(jīng)類、調(diào)查類信息圖表時,應(yīng)倍加關(guān)注數(shù)字的準確性,一個小數(shù)點的前移或后移、一個“0”的多或少,都能造成嚴重的新聞失實。此外,國際報道中的數(shù)據(jù)經(jīng)常會從外電、外刊和外國網(wǎng)站上取材,這就存在譯名和“單位”準確的問題。
信息圖表的特點之一就是數(shù)據(jù)量大,編輯要從茫茫數(shù)據(jù)洪流中摘出精華,表述完整而無歧義,色彩圖形標識符合題材屬性,字體格式構(gòu)圖規(guī)范統(tǒng)一,這些都對信息圖表的準確性提出了嚴峻的挑戰(zhàn)。面對挑戰(zhàn),應(yīng)在采編稿件的頭一個環(huán)節(jié)。即數(shù)據(jù)采集時就人手解決,不可留下隱患。例如在進行重大工程類報道時,新聞的采訪不能僅僅停留在表面上,必須深入徹底,不但要掌握權(quán)威的數(shù)據(jù)和準確的科學術(shù)語,更要能看明白、聽得懂、記得準,能把復(fù)雜的工程圖和內(nèi)部結(jié)構(gòu)搬到稿件上,變深奧的專家術(shù)語為老百姓看得懂的圖解圖示,而又不造成誤導或誤解,這才是信息圖表的數(shù)據(jù)生存之道。如果連自己都搞不清楚,又如何下手制作,更別提如何向受眾交代?數(shù)據(jù)的準確性也就更無從談起。此外,要保證信息圖表的數(shù)據(jù)準確還可以借助校對工作來加以鞏固。校對環(huán)節(jié)聽似輕巧,實則至關(guān)重要。標題、文字、地圖、數(shù)字、單位,甚至色彩選擇是否恰當都在校對的范圍之內(nèi),比如在報道天災(zāi)人禍等新聞時用紅黃等暖色作為背景色就不太合適。因此,無論在思想環(huán)節(jié)還是采編環(huán)節(jié)上都必須多加小心,力求稿件內(nèi)容精確,在準確無誤的基礎(chǔ)上再去追求形式上的更加完美,唯有如此才能在信息圖表報道中實現(xiàn)零差錯。
(三)數(shù)據(jù)的簡潔性
數(shù)據(jù)的簡潔性要求是基于對受眾時間的尊重。一幅好的信息圖表作品應(yīng)該是直觀易讀、重點突出、層次分明的稿件,在制作上需要懂得數(shù)據(jù)的取舍之道。這就相當于羅丹的石料去除術(shù),圖表編輯應(yīng)該明白哪些數(shù)據(jù)是有意義的應(yīng)該保留,就像雕像,哪些數(shù)據(jù)是沒有意義的應(yīng)該舍棄,就像石料。即從大量的數(shù)據(jù)中只摘選出最重要、最核心、受眾最關(guān)心的信息。正如耶魯大學的教授及統(tǒng)計圖表設(shè)計師愛德華·塔夫(Edward Tuff)認為,設(shè)計應(yīng)該為信息而存在。一份高質(zhì)量的信息圖表必須具備以下性質(zhì):
1)包含重要的交流信息。
2)以清晰、準確、有效的方法傳遞信息。
3)從來不要小視讀者的智商。
4)總是告訴事實。
根據(jù)塔夫的建議,編輯在制作圖表的過程中應(yīng)盡量避免花里胡哨、充滿裝飾的設(shè)計,因為過多的點綴和修飾往往會使重要信息淹沒其中,分散讀者對有用信息的注意力,進而降低讀者的閱讀速度,延長其閱讀時間,增加了理解的難度。
相比自媒體,大眾媒體的“官方”身份更要求對數(shù)據(jù)的使用不應(yīng)是散落的、隨機的和任意堆砌的,而需要在占有大量數(shù)據(jù)的基礎(chǔ)上,通過對數(shù)據(jù)去粗取精、去偽存真的科學篩選、分析和提煉,清除“病毒數(shù)據(jù)”(失實的、陳舊的、冗余的數(shù)據(jù))和人為誤差(如不恰當?shù)囊曈X設(shè)計等),將過濾后的關(guān)鍵數(shù)據(jù)而不是原始數(shù)據(jù),以更客觀、明晰地方式呈現(xiàn)給受眾。
雖然數(shù)據(jù)新聞靠數(shù)據(jù)說話,但不應(yīng)是簡單地堆砌和拼湊,而應(yīng)是通過突出關(guān)鍵數(shù)據(jù)來印證報道主題,表現(xiàn)形式上緊密圍繞一個視覺中心點展開,切莫為盲目追求稿件的信息量而是個數(shù)據(jù)就照單全收,致使核心數(shù)據(jù)被淹沒,進而令受眾眼花繚亂并產(chǎn)生抵觸情緒。此外,稿件制作過程中盡量避免使用專業(yè)性太強、太深奧的術(shù)語,若回避不掉,也要在稿件中注明并解釋清楚,使專業(yè)數(shù)據(jù)變得通俗易懂旨在為受眾提供輕松的閱讀體驗。
二、搭建信息圖表數(shù)據(jù)庫,提高報道時效性和準確性
俗話說:巧婦難為無米之炊。信息圖表報道是圍繞數(shù)據(jù)展開的,數(shù)據(jù)就是這個“米”,那么應(yīng)如何多快好省地獲取所需數(shù)據(jù),讓“米”及時下鍋呢?結(jié)合多年工作實踐,筆者認為,可以通過搭建信息圖表的宏觀數(shù)據(jù)庫和微觀數(shù)據(jù)庫,來提高圖表在數(shù)據(jù)新聞報道上的時效性和準確性。數(shù)據(jù)庫可以作為信息圖表業(yè)務(wù)的重要基礎(chǔ)性建設(shè),是一項需要不斷積累、修正、完善的長期性工作。建庫與實用是一種栽樹與乘涼的關(guān)系,有一勞永逸之功效,還可以利用媒體自身或合作機構(gòu)的數(shù)據(jù)庫,來及時發(fā)現(xiàn)重要的新聞線索。
宏觀數(shù)據(jù)庫可主要包括五大子數(shù)據(jù)庫:地圖數(shù)據(jù)庫、新聞背景數(shù)據(jù)庫、標識數(shù)據(jù)庫、各國政要名人數(shù)據(jù)庫和資料來源網(wǎng)址數(shù)據(jù)庫(表1)。微觀數(shù)據(jù)庫可分成兩大塊:一塊是圖形素材庫(包含矢量圖、創(chuàng)意圖、各種按鈕、圖形符號等),另一塊是指常識庫(各類專有名詞、術(shù)語等)。宏觀數(shù)據(jù)庫的建設(shè)是個系統(tǒng)工程,既需要依托媒體決策層和技術(shù)研發(fā)部門提供政策和技術(shù)支持,也需要媒體在認真分析信息圖表業(yè)務(wù)需求的前提下,與媒體內(nèi)外相關(guān)機構(gòu)展開積極的合作,實現(xiàn)數(shù)據(jù)共享,以期對數(shù)據(jù)庫進行實時更新、擴容和完善;微觀數(shù)據(jù)庫的建設(shè)相對簡單,更具個人風格,可根據(jù)編輯個人的實際需求和工作重點平日隨時積累。
建庫的好處主要體現(xiàn)在遇有新聞發(fā)生,可將所儲存的相應(yīng)數(shù)據(jù)即需即取,數(shù)倍地節(jié)省了因描繪地圖、制作圖形、查閱標識等必須的工作所耗掉的時間。例如,2008年汶川地震消息剛一發(fā)布,新華社圖表新聞編輯便從數(shù)據(jù)庫中提取了全國和四川省地圖,僅用30分鐘便準確快速播發(fā)了汶川地震的示意圖,媒體采用達到238家。
三、信息圖表中數(shù)據(jù)采編的主要難點
機遇與挑戰(zhàn)并存,應(yīng)該看到,大數(shù)據(jù)時代下信息圖表的數(shù)據(jù)采編也面臨著諸多難題,主要有以下三點:
第一,數(shù)據(jù)采集障礙。一方面由于我國部分被采訪機構(gòu)和個人對數(shù)據(jù)新聞這種信息圖表形式并不了解,不知道提供什么樣的數(shù)據(jù)可供信息圖表編輯使用,增加了數(shù)據(jù)新聞記者采訪難度和溝通成本,既挫傷了數(shù)據(jù)新聞記者采訪的積極性,又影響了報道質(zhì)量。另一方面是深度報道所需數(shù)據(jù)不易獲取,如科技工程類報道由于專業(yè)性太強,數(shù)據(jù)新聞記者的采訪質(zhì)量與自身對該項目的了解程度密切相關(guān),如果核心數(shù)據(jù)涉及保密范圍,則對新聞的“數(shù)讀”就只能淺嘗輒止。
第二,數(shù)據(jù)處理障礙。隨著信息碎片化的加劇,從撲面而來的海量數(shù)據(jù)中挑選出適宜信息圖表表現(xiàn)的數(shù)據(jù)難度越來越大,在“意圖迷誤”和“感受迷誤”彌漫其中的數(shù)據(jù)流中,如何識別垃圾數(shù)據(jù),清除數(shù)據(jù)“噪音”,都是制作信息圖表需要攻克的難題。
第三,數(shù)據(jù)分析障礙。大數(shù)據(jù)時代對新聞從業(yè)者提出了更高的要求,信息圖表編輯不僅要有新聞敏感性,還要有文字縮編能力,既需要具備數(shù)據(jù)采集、統(tǒng)計和分析能力,又要懂美術(shù)設(shè)計,并會操作多個計算機軟件等,可以說合格的信息圖表編輯必須有多種能力支撐,而目前我國開設(shè)信息圖表課程的大學并不多,以此為專業(yè)進行培養(yǎng)的更是少見,大多數(shù)的信息圖表編輯都是摸著石頭過河,畢業(yè)于“實踐大學”,而在制作信息圖表之前對數(shù)據(jù)進行深層挖掘的專業(yè)數(shù)據(jù)分析師更是緊缺,專業(yè)人才的匱乏勢必成為我國未來數(shù)據(jù)新聞發(fā)展的掣肘,特別是在深度報道領(lǐng)域凸顯了數(shù)據(jù)挖掘力度的孱弱,亟待新聞教育界引起重視。
參考文獻
[1]陳昌鳳.“大數(shù)據(jù)”時代如何做新聞[J].新聞與寫作,2013(1).
[2]文衛(wèi)華,李冰.大數(shù)據(jù)時代的數(shù)據(jù)新聞報道——以英國《衛(wèi)報》為例[J].現(xiàn)代傳播,2013(5).
[3]保羅M.萊斯特.視覺傳播——形象載動信息[M].中國傳媒大學出版社,2003:219.