楊逸云
“機器新聞寫作”是目前人工智能技術(shù)在新聞傳播領(lǐng)域的一個現(xiàn)象級應用。2016年里約熱內(nèi)盧奧運會期間,寫作機器人Dreamwriter 總共撰寫了3000余篇賽事新聞;2017年,四川九寨溝發(fā)生地震,機器人僅用25秒就寫出了全球第一條地震速報;如今大眾在網(wǎng)頁上瀏覽的新聞,也極有可能是機器編寫的。技術(shù)的發(fā)展改變了新聞行業(yè)的傳統(tǒng)生產(chǎn)流程,提高了新聞生產(chǎn)效率。面對這樣一種新技術(shù),人類一方面希望掌控它為自己所用,讓機器新聞得到社會認可;另一方面又害怕技術(shù)失控帶來一系列問題。為了適應技術(shù)帶來的變化,國內(nèi)外高校陸續(xù)建立了計算機科學與新聞學聯(lián)合研究中心,例如美國哥倫比亞大學新聞學院Tow數(shù)字新聞中心、斯坦福大學計算新聞實驗室、暨南大學計算新聞傳播研究中心,它們都設立了計算機與新聞專業(yè)并開設了相關(guān)課程。除此之外,國外學界還舉辦了“計算+新聞”(Computation+Journalism)會議,以促進技術(shù)人員與新聞記者的深入交流。近年來,學界一直保持著對機器新聞寫作的關(guān)注,有關(guān)機器新聞寫作的論著不斷涌現(xiàn)。本文擬對國內(nèi)外機器新聞寫作的研究成果進行系統(tǒng)梳理,總結(jié)歸納機器新聞寫作研究的進程與熱點,以期推動相關(guān)研究深入發(fā)展。
機器新聞出現(xiàn)不過十余年,因此,機器新聞寫作研究的歷史并不長。2012 年,范達倫(Arjen van Dalen)發(fā)表關(guān)于機器新聞寫作的文章——《標題背后的算法:機器新聞是如何重新定義人類新聞工作者的核心技能的》,第一次在機器新聞發(fā)展背景下審視人類記者的工作。雖然有關(guān)機器新聞寫作“本身”的研究始于2012 年,但在此之前已經(jīng)出現(xiàn)了許多關(guān)于機器新聞寫作“前身”的研究。從時間上看,國內(nèi)外機器新聞寫作研究總共可分為三個時期。
第一時期:1950—2009 年,關(guān)于機器新聞寫作前身的研究。機器新聞是計算機技術(shù)與新聞業(yè)結(jié)合的產(chǎn)物,與計算機輔助報道、精確新聞、數(shù)據(jù)新聞等有著一定的延續(xù)關(guān)系。一般而言,新聞業(yè)使用計算機的歷史最早可以追溯到20世紀50年代的計算機輔助報道CAR(Computer-Assisted Reporting)。這一時期,計算機具備了解決復雜計算問題的能力,美國于1967年生效的《信息自由法》又保障了記者獲取數(shù)據(jù)的權(quán)利,這些都為計算機與新聞業(yè)的結(jié)合創(chuàng)造了條件。1973年,菲利普·邁耶出版了《精確新聞學》,總結(jié)、發(fā)展了計算機輔助報道的學理研究,他被認為是計算機輔助報道研究的“教父”。到了21世紀初期,媒體獲取數(shù)據(jù)的方式更加多樣,并能以可視化的新聞數(shù)據(jù)形式向公眾呈現(xiàn),數(shù)據(jù)新聞(Data Journalism)由此產(chǎn)生。隨著人工智能技術(shù)的進步,算法思維逐漸被運用到信息收集、意義構(gòu)建和信息呈現(xiàn)的新聞實踐中,國外學者一般將其稱為計算新聞(Computational Journalism)。一般認為,機器新聞(Robot Journalism)是計算新聞中的一種具體形式,又被稱為自動化新聞(Automated Journal?ism)、算法新聞(Algorithmic Journalism),是當今新聞生產(chǎn)領(lǐng)域的熱門話題。
但是,在機器新聞寫作出現(xiàn)之前,計算機與新聞業(yè)結(jié)合的現(xiàn)象并未在學界引起較大反響,相關(guān)研究只有少數(shù)的專著及論文,并且都以介紹性的內(nèi)容為主。國內(nèi)學者王波出版的《計算機輔助新聞學概論》與國外學者休斯頓(Brant Houston)出版的《計算機輔助報告:實用指南》均屬此類。雖然相關(guān)研究數(shù)量不多,但這一現(xiàn)象推動了高校新聞學院課程改革及人才培養(yǎng)的跨學科發(fā)展。1989年,美國密蘇里大學新聞學院與調(diào)查記者編輯協(xié)會聯(lián)合成立了國家計算機輔助報道學會(National Institute for Computer-Assisted Reporting),為新聞記者舉辦培訓班,探討如何使用計算機、數(shù)據(jù)庫和互聯(lián)網(wǎng)進行新聞報道。國內(nèi)學者卜衛(wèi)則呼吁要將新聞記者及在校大學生的計算機輔助報道教育提上日程。這些研究成果為機器新聞寫作研究奠定了基礎(chǔ),具有一定的借鑒和參考價值。
第二時期:2010—2015 年,機器新聞寫作研究的開端。機器新聞的出現(xiàn)使全球新聞業(yè)的發(fā)展進入了新階段。2010 年《洛杉磯時報》開始以自動化方式報道兇殺案,并推出了生成地震警報的工具。2014 年美聯(lián)社與Automated Insights 公司合作使用算法撰寫有關(guān)公司收益公告的文章,它每個季度能撰寫3000篇類似的新聞報道。2015年國內(nèi)媒體也開始嘗試使用寫作機器人生成財經(jīng)類文章。
機器新聞寫作的出現(xiàn)不僅震驚了媒體圈,而且也受到了學界的重點關(guān)注。由于全球主要媒體幾乎都在這一時期宣布使用機器寫作新聞,自2012年起有關(guān)機器新聞的研究成果穩(wěn)步增長。這一階段的研究總數(shù)不多,但基本上涵蓋了近些年來機器新聞研究涉及的所有話題。范達倫和美國學者卡爾森最早論述了機器新聞對新聞工作者的影響;瑞士學者克萊沃爾最早將機器寫作的內(nèi)容與人類寫作對比,通過實驗分析用戶對機器新聞的看法;郭娟和宋頌則最早從法律角度考察了機器新聞的著作權(quán)問題。這些論文在同類文章中均有較高的被引次數(shù),具有開創(chuàng)性意義。另外,這一時期,學界對數(shù)據(jù)新聞的研究進入高潮,這些研究同樣為后來的機器新聞研究做好了鋪墊。不過,學界對于機器新聞寫作的定位一直很模糊,常出現(xiàn)不同的說法。蘇宏元等認為機器新聞寫作屬于計算機輔助報道的最新發(fā)展形態(tài)——數(shù)據(jù)新聞;而柯丁頓認為機器新聞寫作屬于計算新聞,計算新聞、計算機輔助報道與數(shù)據(jù)新聞是新聞業(yè)“數(shù)量轉(zhuǎn)向”的不同類型,有著各自不同的特征。目前,大多數(shù)學者認可柯丁頓的觀點,將機器新聞歸類于計算新聞。這一階段機器新聞的論文主要被收錄于新聞與寫作類期刊中。國外期刊在2012 年組織了一期關(guān)于“新聞業(yè)的未來:發(fā)展與爭論”的專欄,最早收錄了相關(guān)論文。2015 年之后,也開始探討新聞學與計算機科學之間的跨學科現(xiàn)象。國內(nèi)方面,2014 年,《新聞與寫作》期刊最早發(fā)布了相關(guān)文章,隨后《青年記者》《新聞研究導刊》等期刊都對機器新聞寫作的研究進行了持久關(guān)注。
第三時期:2016 年至今,機器新聞寫作研究的發(fā)展。2016 年,AlphaGo 在圍棋人機大戰(zhàn)中獲得勝利,使得人們對人工智能的關(guān)注度迅速上升,這一年被公認為“人工智能元年”。在這一背景下,基于人工智能技術(shù)的機器新聞寫作也得到了快速發(fā)展,越來越多的國家開始使用機器寫作新聞。世界上最大的幾家新聞機構(gòu)如美聯(lián)社、路透社和法新社每個月都會通過算法制作數(shù)千篇報道,國內(nèi)的新聞媒體也紛紛開發(fā)使用自己的寫作機器人,如快筆小新(新華社)、小封(封面新聞)、張小明(今日頭條)等。
寫作機器人的快速增加再度提升了學界對機器新聞的關(guān)注度。據(jù)筆者統(tǒng)計,國內(nèi)外機器新聞寫作研究論文數(shù)量從2016 年后迅速增長,至2019—2020年達到最高峰。2020年之后,機器新聞熱度下降,研究數(shù)量隨之減少。由此可知,人文研究與技術(shù)實踐基本保持一致。當機器新聞寫作技術(shù)未取得突破時,與之相關(guān)的研究也同樣進入瓶頸期。這一時期,研究者的身份更加多元,除高校的科研人員外,計算機公司經(jīng)理、報紙工作人員、電視臺員工等都參與到研究當中。另外,研究者所在的地域也有所擴展,包括中國、美國、韓國、丹麥、芬蘭、巴西、加拿大等等。2016年之后,學界對機器新聞寫作的研究更加具體。學者不僅分析用戶對機器新聞的看法,還通過采訪等形式研究了專業(yè)記者、教師學生、部門經(jīng)理等不同身份的人對機器新聞的跨國、跨文化感知。多爾、楊保軍等人則開始注意到機器新聞的倫理挑戰(zhàn),包括機器新聞寫作主體及算法透明度等問題。土耳其、西班牙、尼日利亞等國家的學者分別在論文中介紹自己國家機器新聞寫作發(fā)展的現(xiàn)狀并預測未來的發(fā)展趨勢。記者與機器寫作的關(guān)系也被學界持續(xù)討論。國外計算新聞研究中心還出版了機器新聞的指南及專著。總之,這一階段的研究成果更加豐富、研究領(lǐng)域更加多元、研究者所在地區(qū)也更加廣泛。
各國機器新聞寫作的發(fā)展情況受國情、媒體預算、技術(shù)能力、語言等多方面因素的影響,進度并不一致,如中國、美國等較早應用機器寫作技術(shù)的國家,可供研究分析的案例較多,但在一些小語種國家,機器新聞寫作的發(fā)展和應用僅處于起步階段。不過,即使各國機器新聞寫作的發(fā)展進程不同,有關(guān)機器新聞寫作的研究仍集中在以下幾個熱點領(lǐng)域。
機器新聞的質(zhì)量備受關(guān)注,學界對機器新聞寫作質(zhì)量的評估主要通過以下兩種方式:一是考察用戶對機器新聞寫作質(zhì)量的感知,包括新聞的可信度、可讀性、專業(yè)知識等;二是分析具體的機器新聞寫作案例。當前,國外學者多傾向于從用戶感知入手展開研究,而國內(nèi)學者通常選擇案例分析的研究方式。
2014年,克萊沃爾最早探討了用戶對機器新聞和人類新聞的感知差異,他將一篇關(guān)于美式足球比賽的兩個版本(分別由機器和人類寫作)分別以匿名形式展示給本科學生,結(jié)果顯示學生對這兩種文本的看法沒有顯著差異。由此可見,當機器生成的新聞與記者寫作的內(nèi)容無法區(qū)分時,速度便是新聞行業(yè)采用新技術(shù)的一個重要因素??巳R沃爾第一次通過實驗方式考察了讀者對機器新聞內(nèi)容的看法,為后續(xù)的機器新聞質(zhì)量研究打下了良好的基礎(chǔ)。之后的多年間,學者們從多個不同的維度比較了人機新聞,更加細致地探討了機器新聞的質(zhì)量水平。(見表1)
表1 國內(nèi)外學者機器新聞寫作質(zhì)量研究實驗中的設計方法一覽
首先,在人機新聞質(zhì)量對比研究實驗中,最基本的比較維度即作者,如上文克萊沃爾所探討。韓國學者鄭在民等人發(fā)現(xiàn)署名的不同會影響讀者的最終判斷。在他的研究中,只要新聞署名為人類記者,最終的評分就會變低。德國學者格雷夫等人故意混淆署名情況,他為實驗設計了四種不同的新聞來源——正確署名的人類寫作的新聞、錯誤署名的人類寫作的新聞、正確署名的機器寫作的新聞、錯誤署名的機器寫作的新聞,結(jié)果顯示無論哪種署名情況,讀者都選擇更相信機器新聞。這一結(jié)論與韓國學者完全不同,說明新聞質(zhì)量感知還受到不同國家國情的影響。除了將人機新聞進行對比外,荷蘭學者沃爾克還在對比實驗中加入了人機合作新聞,結(jié)果顯示讀者同樣認為這種合作新聞的內(nèi)容也是可信的,與人類新聞相似。美國學者瓦德爾還考察了署名位置對可信度的影響,他認為當機器署名出現(xiàn)在文章開頭時,不如出現(xiàn)在末尾可信。其次,在人機作者對比的基礎(chǔ)上,學者又加入了新聞主題、新聞機構(gòu)、新聞類型等比較因素。美國學者劉炳杰和魏樂文分析了新聞組織和新聞類型對可信度的影響。他們認為對于更受信任的媒體組織來說,利用新聞寫作機器人可以增強新聞的客觀性。在編寫需要處理更多信息的新聞類型時,機器的可信度也更高。中國學者劉茜探討了正面新聞與負面新聞對讀者認知的影響,結(jié)果表明無論正面新聞還是負面新聞,讀者都認為機器新聞的可信度更高、專業(yè)性更強。最后,學者還從讀者身份的角度出發(fā),探討他們之間的感知差異。荷蘭學者范德卡等人最先展開了相關(guān)研究,試圖尋找記者和普通讀者對機器新聞質(zhì)量感知的異同,結(jié)果顯示普通讀者的看法無大差異,但記者的看法受到新聞署名的影響。美國學者鄭越和土耳其學者艾努爾都從跨文化角度展開用戶的質(zhì)量感知研究,但得出的結(jié)果完全不同。鄭越比較了中美讀者對實驗新聞報道的信任程度,發(fā)現(xiàn)并沒有較大的文化差異;而艾努爾是將高語境文化國家土耳其和低語境文化國家奧地利的讀者進行比較,結(jié)果顯示奧地利的讀者比土耳其新聞讀者更看好機器新聞。另外,韓國學者金大元探索了機器新聞質(zhì)量研究的原因,他認為機器新聞的可信度是報紙公司是否計劃引入寫作機器人的主要依據(jù)。但是沃爾克質(zhì)疑了這一觀點,他通過實驗證明不同新聞的可信度評估并不能預測讀者最終的消費偏好。機器新聞的質(zhì)量感知研究是機器新聞研究中的一個重要部分。由上結(jié)論可知,學者們研究的樣本越來越豐富,設置的實驗越來越細致,但無論從哪個角度進行評估,學界都得出了較為一致的觀點:與人類寫作的新聞相比,機器新聞寫作的可信度較高,但可讀性較差。
國內(nèi)學界對機器新聞寫作質(zhì)量的研究主要是從新聞的文本入手,比較其與人類寫作新聞的區(qū)別。2015年9月,騰訊財經(jīng)推出我國第一個由機器人Dreamwriter 寫作出來的新聞,同年11月,付松聚就發(fā)表了相關(guān)論文《從8 月CPI 報道看機器新聞與人工新聞差異何在》,該論文是我國第一篇對比人機新聞的文章,主要從新聞的標題、導語、主體、背景資料四個方面展開。付松聚認可了機器新聞在標題、導語擬定方面的優(yōu)勢,但認為在主體構(gòu)建和結(jié)構(gòu)邏輯安排方面,有明顯堆砌數(shù)據(jù)的感覺。隨后付曉光等和王江濤分別從邏輯和敘事角度詳細研究了機器新聞的特點,付曉光等認為機器新聞雖然能在大數(shù)據(jù)的基礎(chǔ)上阻斷邏輯謬誤,但缺乏與其他事件建立聯(lián)系的能力及研判和預測的能力;王江濤則提出了機器新聞的三個問題——段落結(jié)構(gòu)的連接性障礙、事實與觀點邏輯錯位、現(xiàn)實與歷史敘事拼貼式結(jié)合。雖然國內(nèi)學者對機器新聞質(zhì)量的研究方式各不相同,有些學者分析單篇新聞、有些學者分析單個寫作機器人的作品、還有些學者分析某一類型的新聞,但所得出的結(jié)論大同小異。他們基本上認為機器新聞生成速度快、成本低,但同時也存在著內(nèi)容同質(zhì)化嚴重、報道領(lǐng)域與類型有限等問題。
綜上,國內(nèi)外學者分別使用不同的方式研究了機器新聞質(zhì)量,結(jié)果均認為現(xiàn)階段機器新聞的可讀性不佳。當前的機器新聞仍處于發(fā)展狀態(tài),如果將人類寫作的新聞比做一個已全方位發(fā)展成熟的成年人,那么機器新聞只能算是一個具有特殊天賦的小朋友。作為一個小朋友,機器新聞確實還有許多成長空間。但不可否認的是,機器新聞已然給新聞行業(yè)帶來了較大的挑戰(zhàn)。
傳統(tǒng)的新聞行業(yè)本有自己的一套生產(chǎn)流程,但機器新聞寫作技術(shù)的引入打破了傳統(tǒng)的新聞生產(chǎn)格局。有學者認為,在新興的以數(shù)據(jù)為中心的新聞實踐中,沒有一種像“自動化新聞”(機器新聞)那樣具有破壞性。還有學者將機器新聞寫作稱為“一場沒有硝煙的戰(zhàn)爭”。機器新聞的快速發(fā)展使人們不得不反思現(xiàn)有的新聞生產(chǎn)機制,探索轉(zhuǎn)型之路。
面對機器新聞寫作給新聞行業(yè)帶來的挑戰(zhàn)及影響,相關(guān)英文文獻在標題中大量使用了以前綴re-(再、重新)開頭的詞語,包括redefinition(重新定義)、revolution(革新)、rethinking(重新思考)、recon?figured(重新配置)等,充分表明了學界對新聞行業(yè)“變革”的思索。具體而言,這種“變革”主要表現(xiàn)為新聞生產(chǎn)方式的改變和記者的改變。機器新聞的出現(xiàn)使新聞生產(chǎn)方式變成一定程度上的量化生產(chǎn)??柹J為機器新聞的出現(xiàn)暴露了新聞組成形式背后的公式化性質(zhì)。南瑞琴認為機器新聞使得新聞生產(chǎn)模式產(chǎn)生“價值位移”,從傳統(tǒng)的“獨家新聞”轉(zhuǎn)變?yōu)槿缃竦摹皹藴噬a(chǎn)”,而且機器新聞還能夠為單個用戶創(chuàng)建同一故事的多個定制版本,使得新聞生產(chǎn)的價值產(chǎn)出從內(nèi)容生產(chǎn)環(huán)節(jié)轉(zhuǎn)移到了用戶受眾環(huán)節(jié)。吳上元等人針對新聞業(yè)的變革開展了不同角度的研究,不僅探討了新聞生產(chǎn)本身的改變,還利用布爾迪厄場域理論從技術(shù)人員的角度調(diào)查機器新聞如何以劇烈的方式改變了新聞行業(yè)。他認為,新聞生產(chǎn)過程的改變可以從新聞生產(chǎn)的五個階段(新聞采集、新聞選擇、新聞寫作、新聞編輯、新聞發(fā)布)展開說明。例如在新聞采集階段,機器被用來檢索相關(guān)數(shù)據(jù),記者的職責則轉(zhuǎn)變?yōu)閹椭鷻C器搜索設置初始參數(shù),驗證機器檢索的信息是否準確;在新聞選擇階段,記者能運用機器的新聞判斷力,根據(jù)機器確定的重要性順序確定當天的故事排版;在新聞寫作階段,機器可以代替記者完成一些“低級報道”。
機器新聞的出現(xiàn)給人類記者帶來了最直接的沖擊。學界就記者是否會被取代這一問題產(chǎn)生了兩種不同的看法。加拿大學者米羅什尼琴科十分肯定地認為機器將會取代記者;匡文波則認為消息寫作最有可能實現(xiàn)人工智能化,但新聞特寫、新聞評論等體裁稿件的寫作仍離不開人類。大部分學者贊同后者的觀點,認為當前機器的新聞寫作水平還無法媲美人類,否認“記者消失論”。歐陽霞從心理上分析了機器無法代替記者的原因,她認為新聞寫作過程必然經(jīng)歷復雜的心理活動,而只有人類可以運用自己的思維去遵循新聞寫作的原則,機器寫作的內(nèi)容并不能與人產(chǎn)生情感上的互動。對于記者而言,人工智能確實正在以日益完備的功能吞噬著他們的生存空間,但只要記者們積極尋求自身改變,也未嘗不是一件好事。范達倫認為記者擁有創(chuàng)造力、強大的分析能力及編寫復雜句子的能力,這些都是記者在新聞行業(yè)生存的核心技能,而且記者應該將機器新聞看作使新聞更加人性化的機會。張林賀也認為記者必須要認清寫稿機器人的優(yōu)勢和弊端,明白自身的長處與短處,才能在機器人寫作浪潮中找準自己的位置,揚長避短,發(fā)揮自己應有的價值。姚建華從技能變遷的視角說明機器新聞對記者的重構(gòu),他認為記者先是被迫“去掉了一些技能”(去技能化),然后應該升級加強自己的專業(yè)技能(再技能化),最終向“多技能化”發(fā)展。關(guān)于機器和記者的關(guān)系,學者們普遍贊同人機協(xié)同的模式。劉文斌認為記者應該擁抱技術(shù),正確認識技術(shù)發(fā)明的初衷;同時又要疏離技術(shù),擺脫對技術(shù)的依賴,做好自身的規(guī)劃。姚建華提出了“人機聯(lián)姻”的概念,認為寫稿機器人和新聞記者要雙向理解,建立人機合作的“新聞把關(guān)”機制。在互聯(lián)網(wǎng)時代,對機器新聞給新聞行業(yè)帶來的變革進行研究,可以對新聞工作者將面臨的挑戰(zhàn)做出預判,幫助新聞工作者更好應對新技術(shù)帶來的沖擊,同時找到人機和諧共處的平衡點,充分發(fā)揮出人與機器相結(jié)合的最大作用。
機器新聞對法律倫理產(chǎn)生了兩種影響,它不僅突出了原本就存在的一些問題,而且還帶來了新的法律問題。具體而言,機器寫作的新聞能否被現(xiàn)行著作權(quán)法中“作品”的定義所包容,它是否構(gòu)成侵權(quán)或被侵權(quán)的行為,是機器新聞為現(xiàn)行著作權(quán)法帶來的新問題;機器寫作過程中出現(xiàn)的數(shù)據(jù)收集與個人隱私的矛盾、算法出現(xiàn)偏見等問題之前就已經(jīng)存在,屬于老問題。
國內(nèi)外關(guān)于機器新聞著作權(quán)問題的研究主要集中在法學領(lǐng)域,其中專門針對機器新聞著作權(quán)的研究數(shù)量較少,大多數(shù)學者將其放在“人工智能生成物”這一概念下進行討論。雖然全球各國著作權(quán)法不同,但學者的探討多圍繞著機器新聞是否受版權(quán)保護、機器新聞的版權(quán)歸屬等問題展開。首先,對于機器新聞是否受版權(quán)保護,學界出現(xiàn)了兩種相反的觀點。王遷等少數(shù)學者認為機器新聞“本質(zhì)上仍然屬于執(zhí)行既定流程和方法,并通過計算獲得確定的結(jié)果,與體現(xiàn)個性化的智力創(chuàng)作存在根本區(qū)別”,因而不能構(gòu)成“作品”。熊琦、易繼明、梁志文等大部分學者認為機器新聞應當與人類作品一樣得到版權(quán)法保護。雖然機器不是人,不能擁有著作權(quán)法中的自然人身份,但只要其作品符合一般版權(quán)法上創(chuàng)造性作品的條件就應當予以保護。機器的主體性資格是兩個相反學術(shù)陣營爭論的焦點。為了解決作者身份與機器身份的法理沖突,學者們提供了一系列解決方案。張俊發(fā)認為可將創(chuàng)作主體與權(quán)利主體區(qū)分開來,以作品受眾為標準,建立作品與創(chuàng)作者的關(guān)系;孫山建議采用擬制的技術(shù)將人工智能的所有人“視為”作者;赫里斯托夫則認為需要重新解釋美國版權(quán)法雇傭制原則中的“雇員”和“雇主”這兩個術(shù)語。具體來說,機器新聞能否受版權(quán)保護主要看它是否具有獨創(chuàng)性。喻國明等人認為要分情況判定,如果是基于內(nèi)部程序或算法的模板化機器人,所產(chǎn)生的成果就不應該受到著作權(quán)保護;如果是由軟件開發(fā)人員創(chuàng)作的非通用模板或程序,可以隨機生成不同風格的文字作品,則該軟件應享有著作權(quán)。張惠彬認為應當從機器新聞寫作文本中人類精神含量的高低來判定。西班牙學者諾奇建議只要記者在人工智能工作的某個步驟中存在人為干預,并且在發(fā)布之前提供指導及對新聞項目進行深入修訂,就應該承認其具有獨創(chuàng)性。其次,關(guān)于機器新聞的版權(quán)歸屬問題,學界多偏向于賦予機器新聞的所有者。與機器新聞相關(guān)的主體主要包括發(fā)明人、所有者(新聞單位)、參與者(記者或程序員)、第三方合作公司。國內(nèi)最早發(fā)表機器新聞寫作著作權(quán)論文的郭娟認為應以法人制度為基礎(chǔ),將版權(quán)歸屬于法人單位;張惠彬以騰訊公司機器新聞寫作為例,說明將所有者認定為作者,是目前較為妥當?shù)倪x擇。沈思言、劉建則主張具體的著作權(quán)益當在眾多參與創(chuàng)造者中根據(jù)新聞作品類型和參與創(chuàng)作者的貢獻度進行有機分派。目前,有關(guān)著作權(quán)法能否保護人工智能生成物的司法實踐已經(jīng)發(fā)生,而法律中還未有清晰的說明。為了促進立法機制的完善,提高立法質(zhì)量,國內(nèi)學者提供了多種參考方法,如對原有法律的細節(jié)進行修改,或是借鑒國外法律中適用的理論,參考已經(jīng)出現(xiàn)的司法案例等等。
機器新聞寫作對新聞倫理的沖擊基本都屬于老問題。在機器新聞寫作出現(xiàn)之前,學界就有人討論過大數(shù)據(jù)及算法倫理的問題,2011 年,克雷默發(fā)表了《有算法倫理嗎?》一文,較早對算法偏見進行了討論。算法新聞(機器新聞)出現(xiàn)之后,人們對大數(shù)據(jù)及算法的關(guān)注度再次上升,越來越多的學者對其展開研究。描述機器新聞寫作倫理失范的現(xiàn)象并提出對策是國內(nèi)外學界對此研究的大致路徑。許向東從數(shù)據(jù)的非法采集與濫用、算法偏見、算法透明度等角度展開說明機器新聞倫理存在的問題,多爾則從機器新聞的輸入、處理、生成三個過程分別指出其中的矛盾。另外,學者們分別從理論視角和實踐視角給出了如何應對機器新聞凸顯的倫理問題的建議。蔣曉、韓鴻從技術(shù)倫理學的角度出發(fā),從倫理基石、基本原則、政策框架、責任主體、道德規(guī)范、技術(shù)工具等方面提出中國人工智能新聞倫理的構(gòu)建路徑。吳獻舉主張從機制職業(yè)素養(yǎng)、技術(shù)的完善、法律法規(guī)建設等方面來理性推動機器新聞的發(fā)展。針對算法透明度的問題,迪亞科普洛斯通過實驗證明算法系統(tǒng)中有些部分是可以公開的,但要考慮到組織成本及道德規(guī)范實踐等因素;仇筠茜、陳昌鳳為增進算法透明度提出了三種具體的方式;陳昌鳳、張夢則主張使用“開放倫理”的理念。
總體上看,學界對機器新聞寫作帶來的法律問題研究較多,而對倫理問題研究較少。對機器新聞寫作法律倫理問題進行研究,可以對法律修訂工作起到咨政建言作用,有利于調(diào)整現(xiàn)有法律中過時的部分內(nèi)容,使之能與時俱進,具有必要性和現(xiàn)實意義。
機器新聞寫作是人工智能應用領(lǐng)域中的熱門話題,為全球?qū)W者共同關(guān)注。雖然國內(nèi)外學者對機器新聞的質(zhì)量、機器新聞帶來的挑戰(zhàn)及法律倫理問題進行了多樣化的研究,為機器新聞技術(shù)的發(fā)展提供了學術(shù)支撐,但也存在一些問題,機器新聞寫作研究仍有相當廣闊的拓展空間。
機器新聞寫作的人文研究與技術(shù)的發(fā)展密切相關(guān),從機器新聞研究進程看,國內(nèi)外機器新聞人文研究的熱度與技術(shù)的發(fā)展曲線基本保持一致。2010—2015 年,機器新聞寫作技術(shù)正處于上升期,人文研究的數(shù)量也隨之增加;2016—2020 年,國內(nèi)外各大媒體都開始使用寫作機器人,這一時期的人文研究也達到了高峰;2020 年之后,機器新聞寫作技術(shù)進入瓶頸期,人文研究數(shù)量也越來越少。事實上,機器新聞寫作是一門跨學科的研究,它固然需要計算機科學從技術(shù)上取得突破,但并不意味著人文研究也要亦步亦趨。人文研究完全可以領(lǐng)先于技術(shù)的發(fā)展,提前預測未來的多種可能,從不同角度判斷機器寫作帶來的種種變革及其對人類的影響。在今后的研究中,學者們應正確推進機器新聞寫作人文研究的進度,不必一味追隨技術(shù)熱點;同時也需注意,對機器新聞寫作的人文研究要在動態(tài)發(fā)展的人工智能技術(shù)背景下進行,機器新聞寫作的人文研究雖不以技術(shù)發(fā)展為標準,但也不能以完全靜止的眼光來看待??傊跈C器新聞寫作的人文研究中,我們要處理好技術(shù)與人文的關(guān)系,不能以靜態(tài)的目光看待問題,也不必完全被技術(shù)牽著走,而要將機器新聞視為新聞行業(yè)發(fā)展鏈條上無法回避的重要一環(huán),在動態(tài)變化的過程中考察新聞寫作的深層問題。
在機器新聞寫作的研究中,要注重多種研究方法的結(jié)合。綜觀學界對機器新聞質(zhì)量的研究,不難發(fā)現(xiàn)國內(nèi)外學者的研究方法大不相同。國外學者多采用實證研究來證明讀者對機器新聞的質(zhì)量感知差異,而國內(nèi)學者多采用規(guī)范研究的方式對文本展開分析。實證研究與規(guī)范研究各有優(yōu)劣,經(jīng)過假設、數(shù)據(jù)收集、模型設計、觀察結(jié)論等步驟的實證研究可以歸納出部分讀者對機器新聞的看法,具有較大的價值。但其也具有一定的局限性,例如實驗中對于讀者樣本及新聞材料選擇的不同,均有可能影響到最終結(jié)論;而且,學者們對機器新聞質(zhì)量研究的維度越來越多,不可能窮盡式地觀察完所有的假設。相對來說,規(guī)范研究更多體現(xiàn)出學者對機器新聞質(zhì)量的宏觀價值判斷,同時較容易加入個人主觀意見。在具體的研究當中,我們可以將兩種方法結(jié)合:一方面通過數(shù)據(jù)對規(guī)范研究進行補充,檢驗規(guī)范研究的結(jié)論;另一方面在實證的基礎(chǔ)上樹立合宜的價值判斷標準,通過理性思維規(guī)范實證研究,實現(xiàn)優(yōu)勢互補。另外,在使用其他研究方法如案例分析法時,國內(nèi)外學者可相互借鑒具體的研究模式。如國外學者擅長從機器新聞的問題切入,對案例本身及案例相關(guān)的記者、工作人員進行調(diào)查和采訪,回答預先提出的問題。而國內(nèi)學者多從案例的文本內(nèi)容入手,著重分析文本標題、敘事邏輯等方面,以此揭示機器新聞的現(xiàn)狀及問題。今后的研究中,如若能將上述案例分析的具體方法結(jié)合,必然能使研究更加充實可靠。
機器新聞寫作本身涉及多門學科,對機器新聞的研究須始終保持跨學科的視野。目前,新聞學、寫作學、哲學、法學等學科學者均開展了對機器新聞的研究。但無論從哪一學科切入,都要具備跨學科的精神。例如,關(guān)于機器新聞法律倫理問題的研究,學者不僅需要法學領(lǐng)域的知識儲備,還要切實了解不同新聞文體的特征。不同文體的新聞在法律中受到的保護不同,而在以往研究中,一些學者并沒有詳細區(qū)分機器寫作新聞的文體類型,對所有新聞的法律保護一概而論,這種態(tài)度是不可取的。除此之外,無論從哪一角度對機器新聞進行研究,都不可能避開機器主體性等哲學問題,這同樣需要我們運用跨學科的方法來解決。
研究者要多注意機器新聞寫作技術(shù)帶來的負面效應。人類為了追求新聞寫作的效率而不斷更新技術(shù),但技術(shù)的進步往往帶有不確定性。技術(shù)對社會的積極作用如減輕工作量、提升報道速度等會優(yōu)先展現(xiàn)在公眾面前,成為研究的課題,例如早期機器新聞寫作研究內(nèi)容多為機器新聞寫作質(zhì)量、機器新聞寫作給新聞行業(yè)帶來的變革等,之后才出現(xiàn)機器新聞寫作侵權(quán)行為的研究。因此,更加關(guān)注人工智能帶來的負面影響,才有利于更好掌握和使用技術(shù)并推動研究持續(xù)發(fā)展。
另外,要注意深化學理闡釋,挖掘現(xiàn)象背后的人文價值。目前,國內(nèi)的研究多從表層次對人機新聞進行對比分析繼而提出對策,這樣的研究過于空泛且重復性高。部分學者并不了解機器新聞寫作的發(fā)生過程和媒體記者的實際想法;還有部分學者對數(shù)據(jù)盲目信任,認為只要是機器在寫作過程中抓取的數(shù)據(jù)就更具有客觀性,但實際上機器抓取的數(shù)據(jù)也可能存在著不匹配及無效的情況。因此,學者在對機器新聞寫作內(nèi)容進行分析時,要認真了解機器新聞寫作技術(shù),核實每項技術(shù)的優(yōu)缺點,不能憑借主觀臆斷下結(jié)論。在對機器新聞寫作有了全面的認知后,還要注重理論層面的闡釋。學理性的闡釋并不等于機械套用理論,而是要真正深入機器新聞的各個方面發(fā)現(xiàn)其存在的問題。另外,對機器新聞進行學理性闡釋不僅限于新聞與寫作的理論,還可以用一些社會學等跨學科理論來解釋機器新聞引發(fā)的種種現(xiàn)象,以此充實機器新聞的研究,增加研究的多樣性。
當前,機器新聞寫作的熱度已有所消退,此時對機器新聞寫作研究進行系統(tǒng)梳理能使我們更加客觀、冷靜地看待這一現(xiàn)象。機器新聞寫作的質(zhì)量、新聞行業(yè)的變革、相關(guān)法律倫理問題等研究仍然具有重要的價值,它使我們更加了解技術(shù)發(fā)展背后的人文問題。由于機器新聞寫作的研究時間較短,以后的發(fā)展更是難以預測,因此在研究路徑和方法上仍有調(diào)整的空間。但無論如何,我們都要挖掘機器新聞寫作的人文價值,尤其注重中國傳統(tǒng)文化對技術(shù)的影響,如漢語語言文字在機器新聞寫作中的特殊性。與此同時,加緊對新聞寫作過程的本體研究,以期能反向推動機器新聞寫作技術(shù)的發(fā)展。