郭云麒
(湖北大學(xué) 新聞傳播學(xué)院,湖北 武漢 430062)
維基百科對(duì)“大數(shù)據(jù)”的定義——“大數(shù)據(jù)”,或稱巨量數(shù)據(jù)、海量數(shù)據(jù),指的是所涉及的數(shù)據(jù)規(guī)模巨大到無法通過人工,在合理的時(shí)間內(nèi)達(dá)到截取、管理、處理、并整理成為人類所能解讀的信息。大數(shù)據(jù)一般具有數(shù)量巨大、處理速度快、類型多樣、價(jià)值密度低四個(gè)特點(diǎn)
從“大數(shù)據(jù)”的定義和特點(diǎn)中可以看出,大數(shù)據(jù)并非簡單意義上的數(shù)據(jù)總量巨大,其技術(shù)應(yīng)用的關(guān)鍵在于對(duì)海量數(shù)據(jù)的挖掘、分析、處理過程,只有通過準(zhǔn)確的挖掘分析,大數(shù)據(jù)才能發(fā)揮其真正作用。而其龐大的數(shù)據(jù)體量也使得有用數(shù)據(jù)的篩選和分析變成了大數(shù)據(jù)應(yīng)用的核心難點(diǎn)和決定性環(huán)節(jié)。
要研究基于“大數(shù)據(jù)”技術(shù)所生產(chǎn)出的數(shù)據(jù)新聞,就要將其與早已有之的“精確新聞”加以區(qū)分——精確新聞指記者在采訪調(diào)查新聞時(shí),運(yùn)用調(diào)查、試驗(yàn)和內(nèi)容分析等定量社會(huì)科學(xué)研究方法來收集資料、查證事實(shí),從而報(bào)道新聞。由此,精確新聞形成了與傳統(tǒng)新聞的一個(gè)重要區(qū)別,即它是把“事件、人物、行為或態(tài)度用數(shù)字來表示,然后進(jìn)行分析。[1]
數(shù)據(jù)新聞則是“大數(shù)據(jù)”時(shí)代興起的一種跨學(xué)科、跨領(lǐng)域的新聞生產(chǎn)方式,它與以往以文字?jǐn)⑹鰹橹鞯男侣剤?bào)道不同,是以數(shù)據(jù)為中心,利用互聯(lián)網(wǎng)和計(jì)算機(jī)技術(shù)對(duì)海量數(shù)據(jù)進(jìn)行抓取、分析,最后使用多媒體手段呈現(xiàn)出的新聞。
某種程度上,精確新聞可以看作是數(shù)據(jù)新聞的延伸和發(fā)展,但是其二者之間也存在顯著差別——首先,數(shù)據(jù)新聞分析和處理的數(shù)據(jù)量要遠(yuǎn)遠(yuǎn)大于精確新聞。其次,數(shù)據(jù)在精確新聞中多是作為背景材料,用于輔助文字,而數(shù)據(jù)新聞則是“數(shù)據(jù)驅(qū)動(dòng)新聞”,數(shù)據(jù)的分析是其最有新聞價(jià)值的部分,相比傳統(tǒng)的精確新聞,數(shù)據(jù)新聞的生產(chǎn)流程和思路都發(fā)生了根本變化。
我國目前還沒有專門從事利用機(jī)器進(jìn)行新聞撰寫的公司,僅有數(shù)據(jù)新聞寫作的初期嘗試。
最初的數(shù)據(jù)新聞探索要數(shù)2004年百度基于搜索技術(shù)和計(jì)算機(jī)算法將新聞?wù)贤瞥隽恕鞍俣刃侣劇本W(wǎng)頁頻道,而在2010迅速崛起的新浪微博利用詞頻統(tǒng)計(jì)技術(shù)生成的微博熱門話題模塊從廣義上看也是“大數(shù)據(jù)”技術(shù)的新聞應(yīng)用。
傳統(tǒng)媒體入央視和人民日?qǐng)?bào),也曾有過數(shù)據(jù)新聞的報(bào)道。例如,央視的“據(jù)說春運(yùn)”、“兩會(huì)大數(shù)據(jù)”、“據(jù)說兩會(huì)”等節(jié)目,但總體看,我國的數(shù)據(jù)新聞的實(shí)踐仍然相當(dāng)有限。
“大數(shù)據(jù)是一種資源和工具,其目的是告知,而非解釋;其意在促進(jìn)理解,但仍然會(huì)導(dǎo)致誤解——關(guān)鍵在于人們對(duì)它的掌握程度?!保?]由丘基爾的話可以看出,“大數(shù)據(jù)”的技術(shù)邏輯是通過數(shù)據(jù)直接給出“告知”的結(jié)果,是機(jī)器邏輯的分析,這與天然具有人文主義取向的新聞業(yè)在理念層面上大相徑庭,因?yàn)椤靶侣剺I(yè)是政治民主、言論自由、公共服務(wù)的代名詞”,[3]新聞報(bào)道側(cè)重的是對(duì)于新聞事實(shí)發(fā)生緣由、發(fā)生過程、最終結(jié)果以及所造成影響的具體分析,而非冰冷的數(shù)字結(jié)果。在我國的具體新聞實(shí)踐中,應(yīng)認(rèn)清“大數(shù)據(jù)”天生伴隨的技術(shù)邏輯,在應(yīng)用該技術(shù)進(jìn)行新聞報(bào)道寫作時(shí)不能僅僅“高唱技術(shù)贊歌”而完全拋棄新聞報(bào)道的基本理念。
大數(shù)據(jù)基于算法結(jié)論給出的結(jié)果會(huì)限制新聞報(bào)道的創(chuàng)造性——在新聞報(bào)道創(chuàng)作過程中,若僅從數(shù)據(jù)層面考察新聞事實(shí)邏輯和影響,會(huì)導(dǎo)致對(duì)其他維度的思維發(fā)散的可能。例如,對(duì)于春運(yùn)的報(bào)道,若僅從數(shù)據(jù)分析,只能得出春運(yùn)人流量的龐大等結(jié)論,而無法揭示春運(yùn)背后蘊(yùn)藏的文化背景和社會(huì)問題。
新聞最具魅力的地方是人的思維的寬度和廣度,若一味高唱技術(shù)贊歌,過分沉迷于“大數(shù)據(jù)”技術(shù)威力,從業(yè)者極有可能喪失對(duì)新聞價(jià)值的辨識(shí)能力,并在思想和行動(dòng)上產(chǎn)生惰性,在進(jìn)行新聞寫作時(shí)停留在表象就事論事,無法揭示事實(shí)本質(zhì)。
機(jī)器新聞,可以簡單定義為利用“大數(shù)據(jù)”由機(jī)器分析后直接生成的新聞。
有研究認(rèn)為,在大數(shù)據(jù)時(shí)代,計(jì)算機(jī)技術(shù)高度發(fā)達(dá),美國學(xué)者克里斯蒂安·哈蒙德表示,“未來機(jī)器生成的新聞將占到媒體新聞的90%?!逼渌麑?duì)機(jī)器新聞充滿熱情的研究者極力鼓吹機(jī)器新聞——“相對(duì)于較高成本的人工新聞來說,機(jī)器新聞要廉價(jià)得多?!保?]
但在筆者看來,其相對(duì)人工成本的縮減忽略了機(jī)器新聞的分析模型研發(fā)、數(shù)據(jù)的收集、存儲(chǔ)成本,以及分析數(shù)據(jù)所要使用的大型服務(wù)器的購置費(fèi)用和維護(hù)費(fèi)用,若將這些成本計(jì)算在內(nèi),機(jī)器新聞的生產(chǎn)遠(yuǎn)比人工成本生產(chǎn)新聞要昂貴的多。其次,在機(jī)器新聞所謂高效、“低廉”的背后,智能軟件寫的新聞還存在其與生俱來的局限性——機(jī)器創(chuàng)作的新聞大多都只能應(yīng)用于金融和體育領(lǐng)域,且只能生產(chǎn)出簡單的消息,無法進(jìn)行深度挖掘和報(bào)道。
我國的新聞媒體大多不具有直接生產(chǎn)數(shù)據(jù)新聞的數(shù)據(jù)存量和分析技術(shù),只能依托外部機(jī)構(gòu)(如百度、谷歌、新浪等網(wǎng)絡(luò)公司)提供的數(shù)據(jù)分析結(jié)果進(jìn)行新聞的寫作——很多數(shù)據(jù)新聞僅僅是簡單將數(shù)據(jù)進(jìn)行可視化直接呈獻(xiàn)給受眾,忽略對(duì)數(shù)據(jù)的分析和深入挖掘,無法揭示新聞事實(shí)的本質(zhì)。
“大數(shù)據(jù)”技術(shù)追求相關(guān)關(guān)系、忽略因果關(guān)系,這使得基于“大數(shù)據(jù)”技術(shù)生產(chǎn)出的數(shù)據(jù)新聞在報(bào)道上也過度側(cè)重于呈現(xiàn)新聞故事中的相互關(guān)系,無法回答新聞故事背后的因果邏輯?!罢缥覀兛吹降哪切?shù)據(jù)新聞那樣,它們主要用來簡單描述新聞事件中相關(guān)聯(lián)的人物;而背后的因果,依然需要深度報(bào)道這些傳統(tǒng)的新聞表現(xiàn)形態(tài)。”[5]
“大數(shù)據(jù)是一種資源、一種工具,他的目的是告知,而不是解釋。”[2]具體到大數(shù)據(jù)的新聞報(bào)道中,對(duì)新聞事實(shí)的“解釋”,就是新聞團(tuán)體實(shí)現(xiàn)自我價(jià)值最重要、最核心的一步。在數(shù)據(jù)新聞的采寫報(bào)道時(shí),應(yīng)從冰冷的數(shù)據(jù)中找到最有價(jià)值的角度、發(fā)掘事實(shí)的本質(zhì)意義。
面對(duì)巨大的數(shù)據(jù)量和低密度分布的數(shù)據(jù)價(jià)值,數(shù)據(jù)的篩選、數(shù)據(jù)來源合法性的判斷、數(shù)據(jù)分析的模型構(gòu)建、數(shù)據(jù)可視化處理的過程消耗了大量時(shí)間。其次,對(duì)某一特定報(bào)道主體的數(shù)據(jù)收集積累也需要一定過程,往往需要等到事件結(jié)束后才能得到結(jié)論,這樣的新聞生產(chǎn)流程將導(dǎo)致新聞時(shí)效的降低。
因此,大數(shù)據(jù)新聞的數(shù)據(jù)積累、分析模型建構(gòu)和數(shù)據(jù)可視化處理的過程與新聞追逐的時(shí)效性原則向左。
數(shù)據(jù)信息資源無限擴(kuò)大之后,網(wǎng)絡(luò)媒體、社交平臺(tái)上充斥大量錯(cuò)誤信息和大量垃圾數(shù)據(jù),且容易出現(xiàn)篡改、偽造風(fēng)險(xiǎn),即使是高科技的分析模型也難以完全排除所有有誤信息,而這樣基于“污染重”、“垃圾多”的數(shù)據(jù)產(chǎn)生出的數(shù)據(jù)新聞,有悖于新聞?wù)鎸?shí)性原則。
大數(shù)據(jù)時(shí)代數(shù)據(jù)信息存在著:要素不足、精度有誤、類型不一、動(dòng)態(tài)變化、詳略失當(dāng)、過時(shí)失效等特點(diǎn)。[6]基于這樣的數(shù)據(jù)產(chǎn)生的新聞,其真實(shí)性必然受到危害。其次,數(shù)字本身就是對(duì)事物的一種簡化——而一旦簡化就有失真的危險(xiǎn),對(duì)于社會(huì)現(xiàn)象規(guī)律的總結(jié)離開人的思考和思辨是無法想象的。
“大數(shù)據(jù)”技術(shù)的一大特點(diǎn)是注重?cái)?shù)據(jù)間相關(guān)關(guān)系的挖掘。這就存在著我們掌握的數(shù)據(jù)越多,通過數(shù)據(jù)挖掘出的相關(guān)關(guān)系就越來越多的困境,但事實(shí)上很多相關(guān)關(guān)系都是沒有意義的。新聞價(jià)值的判斷依舊需要依靠新聞直覺,如何使受眾在接受信息時(shí)用情緒賦予新聞人物、價(jià)值以新的價(jià)值,這都需要依靠記者編輯通過新聞直覺和新聞專業(yè)素養(yǎng)去捕捉,而不能僅僅依靠冰冷的機(jī)器分析。大數(shù)據(jù)技術(shù)可以提升我們對(duì)相關(guān)關(guān)系的發(fā)掘能力,但是只有人類的直覺和巧妙心思才能使新聞更符合受眾期待,更有“人情味兒”。
媒體應(yīng)對(duì)大數(shù)據(jù)還需要提高數(shù)據(jù)呈現(xiàn)和表達(dá)的能力。目前我國媒體數(shù)據(jù)新聞報(bào)道往往只是“大數(shù)據(jù)”的簡單可視化呈現(xiàn),往往無法讓受眾直觀的數(shù)據(jù)揭示出的事實(shí)本質(zhì)。
數(shù)據(jù)新聞以“以數(shù)據(jù)為中心”的面貌出現(xiàn),在一定程度上改變了傳統(tǒng)新聞報(bào)道中的傳統(tǒng)敘事。但不可僅僅耽溺于這種數(shù)據(jù)創(chuàng)造的可能性而忽視故事本身。因此,筆者認(rèn)為應(yīng)當(dāng)將“大數(shù)據(jù)”技術(shù)視為新聞報(bào)道的一種創(chuàng)作工具,而不應(yīng)是創(chuàng)作主體,應(yīng)利用這種技術(shù)手段為新聞報(bào)道中人們最關(guān)心的“故事”服務(wù)。尤其是在重大新聞選題中,應(yīng)將數(shù)據(jù)挖掘的可視化呈現(xiàn)與記者的故事化稿件相結(jié)合,從而豐富讀者對(duì)新聞事件的認(rèn)知。
如前文3.2中指出,“從業(yè)者過分沉迷于大數(shù)據(jù)的深坑,就難以展示自己個(gè)性化語言和獨(dú)特的風(fēng)格”。
這就要求媒體應(yīng)當(dāng)加強(qiáng)獨(dú)立思考的能力,應(yīng)謹(jǐn)記大數(shù)據(jù)技術(shù)作為一種技術(shù)手段,只能作為輔助記者找尋最新關(guān)注點(diǎn)的工具?;谶@個(gè)前提,數(shù)據(jù)新聞的制作者應(yīng)當(dāng)具備“呈現(xiàn)數(shù)據(jù)、展示趨勢(shì)、數(shù)據(jù)對(duì)比、提示要點(diǎn)、梳理流程、揭示關(guān)系組織、構(gòu)架分析解讀”的能力,高校新聞教育也應(yīng)順應(yīng)時(shí)代,開設(shè)相應(yīng)的技術(shù)培訓(xùn)課程,不能僅止步于采、寫、編、評(píng)的傳統(tǒng)新聞業(yè)務(wù)能力的教育。
“大數(shù)據(jù)”技術(shù)的確對(duì)當(dāng)今的新聞生產(chǎn)產(chǎn)生了巨大的影響,但是作為一種技術(shù)在積極應(yīng)用的同時(shí)也應(yīng)提高警惕,應(yīng)認(rèn)識(shí)到其可能對(duì)新聞生產(chǎn)產(chǎn)生的負(fù)面影響和其本身具有的局限性,不可一味地高唱技術(shù)贊歌,忽略新聞直覺和新聞素養(yǎng)的重要性。另一方面,新聞從業(yè)者只有提升自身的專業(yè)能力和對(duì)“大數(shù)據(jù)”技術(shù)的應(yīng)用能力,才能擺脫技術(shù)邏輯制約新聞理念的尷尬局面。最后,我國的新聞教育應(yīng)重視對(duì)高校學(xué)生的新技術(shù)應(yīng)用能力的培養(yǎng),更新新聞人才的培養(yǎng)視野。
[1]肖明,丁邁.精確新聞學(xué)[M].中國廣播電視出版社,2002:2.
[2]肯尼思·內(nèi)爾·丘基爾.大數(shù)據(jù)的挑戰(zhàn)和局限[J].哈佛商業(yè)評(píng)論.
[3]潘忠黨.新聞與傳播之別[J].國際新聞界,2006(4).
[4]畢良宇.大數(shù)據(jù)背景下的數(shù)據(jù)新聞的研究[D].研究生論文.
[5]劉義昆.大數(shù)據(jù)時(shí)代的數(shù)據(jù)新聞生產(chǎn)、現(xiàn)狀、影響與反思[J].現(xiàn)代傳播,2014(11).
[6]王樹良,丁剛毅,鐘鳴.大數(shù)據(jù)下的空間數(shù)據(jù)挖掘思考[J].中國電子科學(xué)研究院學(xué)報(bào),2013(1).
[7]劉建明.“大數(shù)據(jù)”的迷思與新聞媒體的應(yīng)對(duì)[J].中國廣播電視學(xué)刊,2013(7):6-8.
[8]陳敏.對(duì)精確新聞中的數(shù)據(jù)的冷思考[J].新聞知識(shí),2005(02).
[9]丁騁.大數(shù)據(jù)背景下數(shù)據(jù)新聞的生產(chǎn)和挑戰(zhàn)[J].新聞知識(shí),2014(6).
[10]方潔,顏冬.全球視野下的“數(shù)據(jù)新聞”:理念與實(shí)踐[J].國際新聞界,2013(6).