馮志浩
摘 要:大數(shù)據(jù)開啟了一個全新的時代引發(fā)各行各業(yè)的巨變,新聞業(yè)也不例外。近幾年興起的數(shù)據(jù)新聞被新聞譽為新聞業(yè)的未來,在數(shù)據(jù)新聞尚在萌芽發(fā)展階段說清楚其內(nèi)涵外延是十分困難的,所以本文采用管中窺豹的方式著重從大數(shù)據(jù)時代新聞的新變化入手,思維方式、采編流程、呈現(xiàn)模式等幾方面進行探究
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)新聞;新變化
英國學者維克托·邁爾一舍恩伯格(V ictor M aver-Schonbezger)在《大數(shù)據(jù)時代:生活、工作思維的大變革》一書中提出,大數(shù)據(jù)將是人們獲得新知、創(chuàng)造新價值的源泉,也是改變市場與組織的結(jié)構(gòu)以及政府與公民關(guān)系的有效途徑。傳統(tǒng)新聞業(yè)也在緊跟時代浪潮加快數(shù)字化進程,并展開了大數(shù)據(jù)新聞的實踐。在傳統(tǒng)新聞業(yè)升級換代進軍數(shù)據(jù)新聞的過程中,呈現(xiàn)出了許多前所未有的新變化,筆者將從一下幾個方面探討。
一、新聞的思維方式
近年來大數(shù)據(jù)技術(shù)的快速發(fā)展深刻改變了我們的生活、工作和思維方式。大數(shù)據(jù)思維主要包括三個方面,即:總體樣本取代隨機樣本;對不精確的容忍度增加;相關(guān)關(guān)系取代因果關(guān)系[1]。在大數(shù)據(jù)的時代環(huán)境下,新聞思維模式也相應(yīng)的出現(xiàn)了新的變化。
一是與傳統(tǒng)新聞思維模式重視事件的因果關(guān)系相比,數(shù)據(jù)新聞更多的考慮事件背后的相關(guān)關(guān)系。數(shù)據(jù)新聞通過對眾多數(shù)據(jù)的分析,尋找不同數(shù)據(jù)間的相關(guān)性揭示兩組數(shù)據(jù)間的變化規(guī)律從而發(fā)現(xiàn)新的新聞報道點,而且根據(jù)數(shù)據(jù)的相關(guān)關(guān)系一組數(shù)據(jù)發(fā)生變化時可以對另一組數(shù)據(jù)做出預(yù)測性報道。二是技術(shù)的發(fā)展使得獲取總體樣本的數(shù)據(jù)成為可能,數(shù)據(jù)新聞因此更加強調(diào)信息的結(jié)構(gòu)化拋開故事中心,而傳統(tǒng)新聞一直追求的是故事化在數(shù)據(jù)時代就要做好思維轉(zhuǎn)化。三大數(shù)據(jù)對不精確性有更大的包容度,這與傳統(tǒng)新聞思維強調(diào)精確形成一隊矛盾。對不精確的容忍度增加,是因為統(tǒng)計全體樣本數(shù)據(jù)不得不接受數(shù)據(jù)的混雜性,但通過分析數(shù)據(jù)找出事物發(fā)展的規(guī)律才是目的,這一點與傳統(tǒng)新聞強調(diào)精確性是一致的,因此筆者認為在新聞實踐中不必糾結(jié)這對矛盾。
二、新聞采編流程
數(shù)據(jù)新聞也被稱為數(shù)據(jù)驅(qū)動新聞,是基于數(shù)據(jù)的抓取、挖掘、統(tǒng)計、分析和可視化呈現(xiàn)的新聞報道方式[2]。大數(shù)據(jù)時代不僅意味著海量的數(shù)據(jù)信息更是對于數(shù)據(jù)的收集、挖掘、分析等能力的提升提出了更高的要求,與傳統(tǒng)新聞的采寫相比數(shù)據(jù)新聞更注重數(shù)據(jù)的挖掘和處理。
數(shù)據(jù)挖掘。數(shù)據(jù)挖掘是數(shù)據(jù)新聞采編流程的第一步,邁好這一步至關(guān)重要它是后面流程的基礎(chǔ)直接影響到新聞報道的真實性。數(shù)據(jù)記者可以從政府、企業(yè)、社會機構(gòu)等公開的數(shù)據(jù)庫中獲取所需要的數(shù)據(jù),隨著全球數(shù)據(jù)開放意識的不斷發(fā)展記者獲取數(shù)據(jù)將會變得越來越順暢。數(shù)據(jù)記者也可以從互聯(lián)網(wǎng)上抓取數(shù)據(jù),互聯(lián)網(wǎng)上數(shù)據(jù)之豐富前所未有,采用專業(yè)的抓取軟件記者可以方便的獲得想要的數(shù)據(jù),同時數(shù)以億計的網(wǎng)民每天都會在互聯(lián)網(wǎng)留下信息痕跡包括所使用的社交平臺,雖然有零散、碎片的特征但認真加以整合便能挖到信息的金礦。記者還可引用專業(yè)數(shù)據(jù)庫公司的數(shù)據(jù)或者與生產(chǎn)數(shù)據(jù)的企業(yè)合作。
數(shù)據(jù)處理。在收集到足夠多的原始數(shù)據(jù)之后,需要對數(shù)據(jù)進行處理以便保證數(shù)據(jù)的真實準確。事實上數(shù)據(jù)符號是客觀的,但數(shù)據(jù)是如何產(chǎn)生的,采用哪種統(tǒng)計模型卻非天然中立。因此,不能直接使用收集的第一手數(shù)據(jù)而是要建立一套數(shù)據(jù)處理的客觀準則。
布拉德肖把數(shù)據(jù)處理環(huán)節(jié)概括為數(shù)據(jù)清洗、情境化和綜合等3個步驟。數(shù)據(jù)清洗一般采用兩種做法:一是檢查數(shù)據(jù)的一致性,二是處理無效值和缺失值等。記者要將獲取的數(shù)據(jù)轉(zhuǎn)化成統(tǒng)一的格式,對存在的重復(fù)條目、損壞條目、空白條目、錯誤格式、重復(fù)命名、數(shù)據(jù)丟失等問題借助Excel、Goole Docs、Goole Refine等軟件工具進行整理、清洗。
數(shù)據(jù)情境化就是將收集的數(shù)據(jù)放到具體的語境中去理解,而不為了分析數(shù)據(jù)而分析數(shù)據(jù)。數(shù)據(jù)情景化還要理順數(shù)據(jù)間的邏輯關(guān)系,根據(jù)事件的發(fā)展脈絡(luò)清理數(shù)據(jù),這樣做就不至于在數(shù)據(jù)搜集階段喪失焦點或錯過有趣的報道角度。這就要求記者對事件的發(fā)生背景有較深的了解,做到按圖索驥對遠離客觀事實的數(shù)據(jù)及時清除對關(guān)鍵環(huán)節(jié)缺失的數(shù)據(jù)及時補足。
數(shù)據(jù)綜合可以簡單的理解為數(shù)據(jù)的縱橫比較將不同的信息圖重復(fù)疊加到一起,即將一個數(shù)據(jù)庫中的信息合并到另一信息圖的數(shù)據(jù)之中,實時呈現(xiàn)事物的時空分布狀況,實現(xiàn)信息的整合與導(dǎo)航。數(shù)據(jù)地圖、時間線、交互性圖表已成為不同時間、不同來源的數(shù)據(jù)信息整合的框架:或?qū)Ρ?、肴加?shù)據(jù),挖掘“數(shù)據(jù)關(guān)系”;或延展時空跨度,揭不總體規(guī)律,或以超鏈接的形式,向用戶提供原始素材的來源。通過對不同維度的數(shù)據(jù)肴加、比較、相互關(guān)聯(lián),可看到每個數(shù)據(jù)更深層的含義,加深對新聞事實真相與意義的理解。
三、新聞的呈現(xiàn)方式
快節(jié)奏的生活里,冗長的文字表述常常會讓讀者望而生畏,而將信息進行可視化處理,可以比文字報道更直觀反映新聞事件的過程和發(fā)展趨勢,讓讀者更容易接受也更喜歡。而且如今的新聞可是化已不僅僅是餅圖、柱狀圖那么簡單,而是多采用如下幾種呈現(xiàn)方式。
信息圖。所謂信息圖,就是用圖像的形勢將數(shù)據(jù)、信息表述出來,信息圖通常是靜態(tài)的。信息圖通俗易懂、簡潔明了、趣味性強,是現(xiàn)在讀者新聞樂見的新聞呈現(xiàn)方式。制作信息圖主要分三個步驟,第一個步,明確主題收集與之相關(guān)的原始數(shù)據(jù),第二步,全面理解數(shù)據(jù)構(gòu)思邏輯框架;第三步,設(shè)計最適合表達主題的表現(xiàn)方式,或表格或圖表。
交互式圖表。交互式圖表是動態(tài)的表達形式,更具有靈活性和互動性。信息圖常用于紙媒,而交互式圖表更多適應(yīng)于網(wǎng)絡(luò)媒體也只有在網(wǎng)上才能更好的發(fā)揮其優(yōu)勢。但從外觀設(shè)計方面來看,交互式圖表和信息圖區(qū)別不大,都是由文字、圖表、圖形、列表等組合在一起形成的。
數(shù)據(jù)地圖簡單的說就是數(shù)據(jù)和地圖的結(jié)合,但它是兩者結(jié)合的質(zhì)變,承載著豐富的數(shù)據(jù)信息不僅讓數(shù)據(jù)的表現(xiàn)方式更加多樣還為簡單是的空間地圖帶來了生機,所產(chǎn)生的表達效果是以往文字報道不能比擬的。數(shù)據(jù)地圖作為新聞的呈現(xiàn)方式,尤其是涉及地域報道時不僅空間感強還能讓讀者對數(shù)據(jù)有更加全面立體的把握,將空間的大跨度與事件的多樣性濃縮到一張“地圖”使人一目了然?,F(xiàn)在,國外很多媒體經(jīng)常采用這一可視化方式進行報道,如英國《衛(wèi)報》關(guān)于伊拉克戰(zhàn)爭的報道就是用數(shù)據(jù)地圖來呈現(xiàn)的。
動態(tài)氣泡圖。氣泡圖是一個將點表示為氣泡(或圓圈)的散點圖,與XY散點圖類似,但可表現(xiàn)的數(shù)據(jù)信息量更多,最多可以表示五維(x位置、y位置、大小、顏色和時間),通過更改氣泡的大小和顏色,按時間變化將氣泡制成動畫視覺效果,能使數(shù)據(jù)探索更加方便。以2006年漢斯·羅斯林在TED的演講為例,漢斯·羅斯林用氣泡圖向人們展示了1962年以后全球各個國家家庭規(guī)模及壽命的變化軌跡,以此來判斷國家的經(jīng)濟發(fā)展水平。(作者單位:重慶工商大學-重慶市高校網(wǎng)絡(luò)輿情與思想動態(tài)研究資政中心)
參考文獻:
[1] [英]維克托·邁爾舍恩伯格、肯尼思·庫克耶著:《數(shù)據(jù)時代》,盛楊燕、周濤譯,浙江人民出版社,第27-96頁。
[2] 方潔、彥東,《全球視野下的數(shù)據(jù)新聞:理念與實踐》,《國際新聞界》,2012第6期,74頁。