王瑤琦 任戌盈
【摘? ? 要】本文分析了2015年-2020年五年間Web of? Science數(shù)據(jù)庫中有關(guān)算法新聞的研究文獻(xiàn),運用Citespace軟件對其進(jìn)行可視化整理和分析,以知識圖譜的方式展示其發(fā)展脈絡(luò)。研究發(fā)現(xiàn),近五年算法新聞研究數(shù)量穩(wěn)定增長,并呈現(xiàn)出五個主要的研究聚類熱點;算法新聞研究可被概括為對其運行機制和原理的研究、對其引發(fā)的新聞實踐和新聞理念的討論與思考、關(guān)于受眾對算法新聞的感知與評價三階段。同時,本文還探討了該領(lǐng)域的奠基性文獻(xiàn)和關(guān)鍵節(jié)點文獻(xiàn)。
【關(guān)鍵詞】算法新聞;智媒時代;知識圖譜;趨勢
近五年來,國內(nèi)外新聞業(yè)界和學(xué)界都在熱議“算法新聞(algorithmic journalism)”“機器人新聞(robot journalism)”“自動化新聞(automated journalism)”“計算機生成內(nèi)容(computer-generated content)”。據(jù)預(yù)測,“計算機生成內(nèi)容(CGC)”很快將與“專業(yè)新聞記者生成內(nèi)容(PGC)”以及“用戶生成內(nèi)容(UGC)”一起構(gòu)成智媒時代數(shù)字化新聞和信息的三大主體。[1]
本文擬分析以下幾個問題:一是近五年來,算法新聞研究的熱度與區(qū)域分布特點;二是算法新聞研究的發(fā)展趨勢;三是算法新聞研究的奠基性文獻(xiàn)和關(guān)鍵節(jié)點文獻(xiàn)。通過以上三個方面,借用分析工具描繪出算法研究的知識圖譜。這將有助于把握當(dāng)前新聞業(yè)和新聞研究的發(fā)展趨勢,為智媒時代算法新聞的理論和實踐發(fā)展提供參考,為后來的研究者厘清脈絡(luò)。
一、研究方法與數(shù)據(jù)收集
科學(xué)知識圖譜是以科學(xué)知識為對象,顯示科學(xué)知識的發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一種圖形。[2]本文采用了科學(xué)知識圖譜的研究方法,利用Citespace軟件實現(xiàn)結(jié)果的可視化。在得出可視化結(jié)果后,輔以文本解讀對結(jié)果進(jìn)行進(jìn)一步的整理和闡釋,以求對近五年算法新聞的研究獲得更全面的了解和認(rèn)識。
本研究以“algorith* journalism”為檢索主題詞,將時間范圍設(shè)定在2015年至2020年期間,在Web of Science(WoS)核心合集的數(shù)據(jù)庫中進(jìn)行檢索。得到檢索結(jié)果后,按照文獻(xiàn)類型為“article”、研究領(lǐng)域為“social science”等進(jìn)行二次檢索,在篩選排除無關(guān)聯(lián)文獻(xiàn)后,得到175篇文獻(xiàn)的數(shù)據(jù)。數(shù)據(jù)內(nèi)容包含文獻(xiàn)基本屬性(出版年、出版物名稱、研究方向、被引頻次等)、摘要和參考文獻(xiàn)。此后,利用軟件Citespace對其進(jìn)行進(jìn)一步的可視化分析。
二、算法新聞研究整體描述
(一)話題熱度
從2015年開始,在Web of Science數(shù)據(jù)庫中,有關(guān)研究文獻(xiàn)發(fā)表量整體呈現(xiàn)逐年上升狀態(tài),尤其是在2019年,研究者對算法新聞的關(guān)注度顯著提高。從媒介融合到智能媒體,從無人機到算法新聞,從大數(shù)據(jù)到人工智能,從基于“互聯(lián)”為核心的Web1.0時代到現(xiàn)在的以“社交”為核心的Web2.0時代,[3]這可謂是重大轉(zhuǎn)變。隨之而來的是近五年算法新聞研究的數(shù)量持續(xù)增長,國內(nèi)外的研究者對算法新聞研究的關(guān)注度在不斷增加。
(二)發(fā)表區(qū)域
在Citespace中以“country”為分析對象,設(shè)定相應(yīng)參數(shù)并選擇探索關(guān)鍵路徑算法Pathfinder,來繪制算法新聞研究文獻(xiàn)地域分布圖。
WoS文獻(xiàn)數(shù)據(jù)顯示,國際上共有36個國家(地區(qū))的研究者對算法新聞研究做出貢獻(xiàn)。發(fā)文量前五名的依次為美國(49)、西班牙(13)、德國(10)、英國(10)、中國(8)。美國作為算法新聞研究發(fā)文量最高的國家,占文獻(xiàn)總量的33.8%;中國學(xué)者在算法新聞這一研究領(lǐng)域的活躍度也比較高,能夠產(chǎn)出一部分具有國際視野的學(xué)術(shù)成果。整體上呈現(xiàn)出以發(fā)達(dá)國家(地區(qū))為主,發(fā)展中國家(地區(qū))為輔的研究格局。但是,在該研究領(lǐng)域并未形成明顯的國際合作網(wǎng)絡(luò)。
(三)研究關(guān)鍵詞
在Citespace中以關(guān)鍵詞為分析對象,可以得出175篇文獻(xiàn)中所有關(guān)鍵詞的出現(xiàn)頻次及每個關(guān)鍵詞的中心性(centrality)。在算法新聞研究領(lǐng)域,研究者們多關(guān)注計算機新聞(computational journalism)、社交媒體(social media)、自動化新聞(automated journalism)、大數(shù)據(jù)(big data)、人工智能等話題(見表1)。
三、算法新聞研究熱點與趨勢
(一)研究主題聚類
通過對算法新聞研究文獻(xiàn)的關(guān)鍵詞詞頻的聚類分析,可以發(fā)現(xiàn),175篇文獻(xiàn)的關(guān)鍵詞被分為多個集群,通過結(jié)合詞頻,可以得到算法新聞研究的五個研究主題(見表2)。
大數(shù)據(jù)和過濾氣泡現(xiàn)象。過濾氣泡(Filter Bubble)是指媒體基于大數(shù)據(jù),針對用戶的使用習(xí)慣生成用戶畫像,并通過算法為之精準(zhǔn)推送符合其內(nèi)容消費習(xí)慣的個性化內(nèi)容。“過濾氣泡”使受眾接受到的信息內(nèi)容愈加窄化,新聞媒體通過專業(yè)的價值判斷進(jìn)行“議程設(shè)置”的職能也被不斷削弱。[4]
自動化新聞生產(chǎn)。當(dāng)新聞生產(chǎn)的主體從人向機器轉(zhuǎn)向,人工不再是新聞產(chǎn)品輸出的決定性環(huán)節(jié)。[5]一方面,學(xué)者關(guān)注自動化新聞的生產(chǎn)方式和流程;另一方面,研究者也關(guān)注機器人寫作對傳統(tǒng)新聞環(huán)境產(chǎn)生的重要影響。
算法與權(quán)力。喻國明認(rèn)為,技術(shù)不僅能夠賦能與賦權(quán),而且它自身就構(gòu)成一種權(quán)力的行使和對傳統(tǒng)權(quán)力模式的替代。目前,在新聞生產(chǎn)的各個階段,我們都可以窺見算法權(quán)力意志的體現(xiàn)。
算法與假新聞。不同于傳統(tǒng)媒體對新聞?wù)鎸嵭缘陌殃P(guān),社交媒體傳播假新聞的問題逐步顯現(xiàn),并在2016年美國大選中徹底暴露。在這樣的背景下,算法與假新聞之間產(chǎn)生了千絲萬縷的聯(lián)系。一方面,算法可以成為傳統(tǒng)新聞工作者識別真假新聞源的重要合作伙伴;另一方面,算法也在加速假新聞的泛濫。
人機關(guān)系背后的認(rèn)識論問題。這一類研究探討算法帶來的認(rèn)識論問題。有人神話技術(shù),強調(diào)技術(shù)的無所不能,認(rèn)為個人自主權(quán)可以完全在未來的新聞業(yè)中消失;也有人認(rèn)為技術(shù)是需要被馴化的,要讓價值理性駕馭工具理性。此外,算法的高門檻使很多研究者將其稱為“黑箱”,這在一定程度上也將人與機器置于了不平等的位置。
(二)研究發(fā)展趨勢
以Web of Science核心合集中2015年-2020年有關(guān)論文數(shù)據(jù)導(dǎo)入Citespace,時間切片選擇一年,利用Citespace軟件的最小生成樹(Minimum Spanning Tree)技術(shù)來修剪節(jié)點間連線,可以得到關(guān)鍵詞時區(qū)圖,從中可以總結(jié)出算法新聞研究的三個發(fā)展趨勢。第一階段,2015年是文獻(xiàn)收集的起始年份,“大數(shù)據(jù)(big data)”“數(shù)據(jù)新聞(data journalism)”“創(chuàng)新(innovation)”等主要關(guān)鍵詞在此時出現(xiàn),體現(xiàn)出研究者對算法新聞這一新事物運行機制與運行原理的關(guān)注。第二階段是2016年-2017年,算法新聞研究逐漸開始轉(zhuǎn)向?qū)π侣剛惱淼奶接懀P(guān)鍵詞“可信度(credibility)”“算法的透明度(algorithmic transparency)”“信任(trust)”出現(xiàn)在這一時期。第三階段則在2018年以后,伴隨著“感知(perception)”“私人化(personalization)”等敘述,受眾對于算法新聞的感知與評價開始進(jìn)入研究者的視野。
(三)關(guān)鍵文獻(xiàn)分析
在算法新聞研究中,早期奠基性文獻(xiàn)和高被引、高中心度的關(guān)鍵性節(jié)點文獻(xiàn)共同構(gòu)成了研究骨架。用Citespace軟件運行收集到的文獻(xiàn)數(shù)據(jù),節(jié)點類型選擇Cited Reference,然后以時區(qū)(timezone)視圖展示,得到算法新聞研究早期奠基性文獻(xiàn)知識圖譜。其顯示了發(fā)表于2012年-2014年間、被引率較高的7篇早期奠基性文獻(xiàn),詳細(xì)信息如表3所示。
通過閱讀這些奠基性文獻(xiàn),能夠看出有關(guān)算法新聞的早期研究呈現(xiàn)出的整體態(tài)勢??偟膩碚f,奠基性文獻(xiàn)主要包含兩種范式:一類是探討算法新聞對新聞記者產(chǎn)生的影響,一類是提綱挈領(lǐng)的方法論研究,為后來的研究者提供研究算法新聞的視角和參考維度。
第一類奠基性文獻(xiàn)如Arjen van Dalen在2012年發(fā)表的文章中就開始探討算法新聞對新聞記者產(chǎn)生的影響。他認(rèn)為新聞記者應(yīng)該著重培養(yǎng)自己的分析能力、創(chuàng)新能力和寫復(fù)雜句子的能力,因為客觀性、時效性、簡潔性等特質(zhì)將完全由計算機完成。記者會有更多的時間來進(jìn)行深度報道。
第二類奠基性文獻(xiàn)如Anderson在前人的基礎(chǔ)上提出研究算法新聞的六個視角:政治、經(jīng)濟、場景、組織、文化和技術(shù)。Philip M.Napoli提出要把算法新聞和現(xiàn)有的學(xué)術(shù)理論聯(lián)系起來,在學(xué)術(shù)視野下探討算法新聞在媒體內(nèi)容生產(chǎn)與消費中扮演的角色。
一項研究的理論基礎(chǔ),除了考察奠基性文獻(xiàn)之外,還應(yīng)關(guān)注到高被引、高中心度的關(guān)鍵性節(jié)點文獻(xiàn)。通常高頻被引文獻(xiàn)中的內(nèi)容在某一時期內(nèi)獲得了較多研究者的認(rèn)可,且研究者將以高頻被引文獻(xiàn)中的觀點、知識作為基礎(chǔ)來開展下一步的研究;高中心度的文獻(xiàn)則反映其在算法新聞研究脈絡(luò)中的樞紐作用。[6]經(jīng)統(tǒng)計,將被引頻次排前十位的重要文獻(xiàn)同時列出,如表4所示。
Matt Carlson認(rèn)為在新興的圍繞著數(shù)據(jù)開展的新聞實踐中,“自動化新聞(automated journalism)”是最具有顛覆性的一種。他認(rèn)為自動化新聞帶給新聞業(yè)及新聞從業(yè)者的影響是一把雙刃劍:一方面能夠提升新聞消息發(fā)布的效率,另一方面可能會導(dǎo)致新聞機構(gòu)裁員增加以及新聞寫作的商品化、程序化等問題。
Mark Coddington在研究中將計算機輔助下的報道(computer-assisted reporting)、數(shù)據(jù)新聞(data journalism)和計算機算法新聞(computational journalism)作為三種定量的新聞實踐形式進(jìn)行對比探討。他認(rèn)為這三種新聞形式互相關(guān)聯(lián)但是也各不相同,各有各的優(yōu)勢與缺陷,但對新聞業(yè)都有所助益。
Konstantin Nicholas D?rr從技術(shù)層面探討了自然語言生成(NLG)的算法是否能夠發(fā)揮專業(yè)新聞的功能,同時還延伸討論了自然語言生成算法在新聞業(yè)中蘊含的經(jīng)濟潛力。這篇文章為在大數(shù)據(jù)等技術(shù)的角度上分析新聞業(yè)將面臨的挑戰(zhàn)的研究奠定了基礎(chǔ)。
Nicholas Diakopoulos則關(guān)注到了算法與社會權(quán)力結(jié)構(gòu)之間的關(guān)系。他在文章中提出了“有關(guān)算法可說明性的報道(algorithmic accountability reporting)”這一概念。他認(rèn)為新聞記者有責(zé)任對算法行使監(jiān)督的權(quán)利,新聞報道應(yīng)當(dāng)觀照到算法內(nèi)部的權(quán)力結(jié)構(gòu),揭示算法中包含的缺陷和偏見。他的研究提醒人們對逐漸滲入社會生活方方面面的算法保持警惕之心,同時也為后來的研究者提供了應(yīng)對算法帶來的問題的研究范式。
Andreas Graefe運用實驗的方法來探測受試者對于計算機自動生成的新聞的態(tài)度和看法。研究發(fā)現(xiàn),無論實際來源是什么,受試者對聲稱是人工撰寫的文章總是有更高的評分。研究受眾對算法新聞的感知與評價的研究者多援引此文章,使之處于研究脈絡(luò)的樞紐地位。
結(jié)語
技術(shù)調(diào)節(jié)理論認(rèn)為人與技術(shù)是相互交織、不分彼此的。因此,對新聞業(yè)而言,無論是面臨算法還是其他新出現(xiàn)的技術(shù)物,都不應(yīng)忽視技術(shù)調(diào)節(jié)的框架下技術(shù)物對人所帶來的規(guī)范或引導(dǎo)作用。[7]從這個角度來說,算法新聞對新聞業(yè)及新聞從業(yè)者、研究者的沖擊與重塑是相伴而生的。與算法新聞相隨的新聞實踐的問題、暗藏在算法里的社會權(quán)力結(jié)構(gòu)變化的問題、由算法引發(fā)的新聞倫理問題,尚有待研究者們進(jìn)一步探索。
此外,可針對中文CNKI數(shù)據(jù)庫做類似的數(shù)據(jù)分析,對比探討中文研究者在算法新聞研究中與國際學(xué)者的差異,也可補足我國學(xué)者在算法新聞研究這一領(lǐng)域的盲點與不足。
注釋:
[1]鄧建國.機器人新聞:原理、風(fēng)險和影響[J].新聞記者,2016(09):10-17.
[2]劉則淵. 科學(xué)知識圖譜:方法與應(yīng)用[A]. 遼寧省哲學(xué)社會科學(xué)成果獎評審委員會辦公室,遼寧省哲學(xué)社會科學(xué)獲獎成果匯編[2007-2008年度][C].遼寧省社會科學(xué)界聯(lián)合會,2010:4.
[3]喻國明,楊瑩瑩,閆巧妹.算法即權(quán)力:算法范式在新聞傳播中的權(quán)力革命[J].編輯之友,2018(05):5-12.
[4]王斌,李宛真.如何戳破“過濾氣泡” 算法推送新聞中的認(rèn)知窄化及其規(guī)避[J].新聞與寫作,2018(09):20-26.
[5]許向東,郭萌萌.智媒時代的新聞生產(chǎn):自動化新聞的實踐與思考[J].國際新聞界,2017(05):29-41.
[6]孫寧,陳雅.WoS視域下國際網(wǎng)絡(luò)輿情研究知識圖譜分析[J].情報資料工作,2014(04):21-26.
[7]毛湛文,孫曌聞.從“算法神話”到“算法調(diào)節(jié)”:新聞透明性原則在算法分發(fā)平臺的實踐限度研究[J].國際新聞界,2020(07):6-25.
(作者:王瑤琦,中國傳媒大學(xué)電視學(xué)院碩士研究生;任戌盈,中國傳媒大學(xué)電視學(xué)院碩士研究生)
責(zé)編:周蕾