張 旦
(四川外國(guó)語(yǔ)大學(xué) 新聞傳播學(xué)院,重慶 400031)
近年來,隨著大數(shù)據(jù)和人工智能技術(shù)的發(fā)展,新聞業(yè)也積極探索應(yīng)用大數(shù)據(jù)挖掘和人工智能技術(shù)改進(jìn)新聞生產(chǎn)方式,新聞算法應(yīng)運(yùn)而生。新聞算法的出現(xiàn)改變了傳統(tǒng)的新聞生產(chǎn)方式,重塑了新聞生產(chǎn)與分發(fā)這兩個(gè)維度,使得數(shù)字新聞業(yè)經(jīng)歷“算法轉(zhuǎn)向”,即從人工編輯形式走向更為高級(jí)的智能算法階段,在業(yè)界、學(xué)界和社會(huì)各界都引起了很大震動(dòng)。本文通過梳理歐美新聞算法應(yīng)用的最新進(jìn)展和主要案例,以期為我國(guó)新聞算法的發(fā)展提出可能的研究方向和思路。
首先,歐美新聞算法應(yīng)用時(shí)間較早。早在2001年,谷歌就開始采用個(gè)性化新聞推薦,這是媒體首次將算法應(yīng)用到新聞生產(chǎn)之中。其次,應(yīng)用領(lǐng)域比較廣泛,在歐美地區(qū),新聞算法較多被互聯(lián)網(wǎng)巨頭、初創(chuàng)型科技公司以及傳統(tǒng)媒體等機(jī)構(gòu)采用。谷歌、臉譜網(wǎng)早已在新聞搜索、推薦、分發(fā)等系統(tǒng)服務(wù)中應(yīng)用算法技術(shù)。初創(chuàng)型技術(shù)企業(yè),如敘事科學(xué)和自動(dòng)化洞察等公司主要研發(fā)一些自動(dòng)化的寫作軟件,并通過這些軟件生成財(cái)經(jīng)資訊、體育資訊等類型報(bào)道。主流媒體和通訊社也嘗試通過采納算法來改造傳統(tǒng)的新聞生產(chǎn)和新聞分發(fā)過程。[1]
再次,算法技術(shù)比較成熟。新聞算法在前期的應(yīng)用中只推送用戶喜歡的信息,逐漸形成了“信息繭房”的窘境。人工智能針對(duì)算法的革命就在于對(duì)現(xiàn)有推薦系統(tǒng)的不斷優(yōu)化。一方面,考慮普遍相關(guān)性;另一方面,照顧個(gè)體差異,使用戶有機(jī)會(huì)接觸更多可能感興趣的內(nèi)容。比如,英國(guó)《泰晤士報(bào)》和《星期日泰晤士報(bào)》正在開發(fā)一個(gè)名為“詹姆斯”(James)的全新推薦系統(tǒng),它將針對(duì)用戶的個(gè)人偏好進(jìn)行學(xué)習(xí),不僅根據(jù)用戶經(jīng)常點(diǎn)擊的內(nèi)容進(jìn)行推薦,更重要的是堅(jiān)持新聞標(biāo)準(zhǔn)。對(duì)算法的改進(jìn)是當(dāng)前人工智能應(yīng)用于新聞業(yè)的主要技術(shù)路徑。
算法是指一系列非常復(fù)雜的數(shù)學(xué)規(guī)則,通過預(yù)先設(shè)定的步驟解決特定問題的計(jì)算機(jī)程序。[2]其最大的特征就是新聞生產(chǎn)的自動(dòng)化。以敘事科學(xué)公司的新聞算法為例,這個(gè)流程主要包括五個(gè)步驟:一是讀入大量結(jié)構(gòu)化和標(biāo)準(zhǔn)化的數(shù)據(jù);二是測(cè)量數(shù)據(jù)中的“新聞性”;三是找出合適的報(bào)道角度,如果有多個(gè)角度,則按照重要性排序;四是將報(bào)道角度與數(shù)據(jù)中的具體事實(shí)相匹配;五是生成報(bào)道文本。[3]通過以上的工作原理可以看出,當(dāng)前新聞算法在新聞報(bào)道中依然處于輔助地位,用于處理一些有清晰數(shù)據(jù)支撐、報(bào)道程式簡(jiǎn)單明確的新聞?lì)}材。
在歐美地區(qū),新聞算法較多地被應(yīng)用到新聞的寫作、選編、審核和分發(fā)等領(lǐng)域,本文結(jié)合歐美的具體應(yīng)用案例進(jìn)行討論。
1.算法選編:機(jī)器自動(dòng)對(duì)新聞排序。算法通過對(duì)用戶行為進(jìn)行分析后確定其內(nèi)容偏向,篩選出最具商業(yè)價(jià)值的新聞,然后根據(jù)這些標(biāo)準(zhǔn)推送讀者感興趣的內(nèi)容?!缎l(wèi)報(bào)》于2014年推出了一份名為“#Open001”的紙質(zhì)報(bào)紙,算法機(jī)器會(huì)自動(dòng)將社交網(wǎng)絡(luò)上的分享熱點(diǎn)進(jìn)行內(nèi)容篩選、編輯排版和印刷,最后生成一份報(bào)紙?!都~約時(shí)報(bào)》研發(fā)的機(jī)器人Blossom采用算法幫助編輯挑選出最適合推送的文章和內(nèi)容。路透社名為“Open Calais”的算法機(jī)器人和《紐約時(shí)報(bào)》推出的“R&D Editor”利用算法完成了算法排序、識(shí)別關(guān)鍵詞、找出熱門內(nèi)容、文章標(biāo)簽自動(dòng)化等工作。[4]總之,算法機(jī)器給新聞界帶來了更多的想象空間。
2.算法寫作:人機(jī)互動(dòng)的前瞻。2013年,美聯(lián)社采用人工智能算法,讓程序自動(dòng)撰寫體育報(bào)道類新聞稿件。基于美聯(lián)社預(yù)先編輯好的寫作結(jié)構(gòu),在幾秒鐘之內(nèi)生成1篇150~300字的新聞快訊。之后,越來越多的媒體開始采用算法機(jī)器寫稿?!堵迳即墪r(shí)報(bào)》推出了支持災(zāi)難報(bào)道和犯罪新聞報(bào)道的機(jī)器人;法國(guó)《世界報(bào)》通過和Syllabs公司合作,用機(jī)器人記者報(bào)道選舉活動(dòng);[4]《華盛頓郵報(bào)》在里約奧運(yùn)上派出了機(jī)器人Heliograf進(jìn)行賽事報(bào)道。利用算法機(jī)器寫稿,極大地節(jié)省了記者的時(shí)間,可以讓記者專注于深度采訪和高質(zhì)量的報(bào)道。
3.算法審查:自動(dòng)核實(shí)新聞內(nèi)容。早在2012年年末,《華盛頓郵報(bào)》就啟動(dòng)了名為“truth teller”(吐真者)的實(shí)時(shí)新聞核查項(xiàng)目。它能全程記錄新聞報(bào)道中的文字、語(yǔ)音等信息,隨后與“打假”數(shù)據(jù)庫(kù)進(jìn)行對(duì)比,一旦發(fā)現(xiàn)異常便會(huì)發(fā)出警報(bào)?!都~約時(shí)報(bào)》則應(yīng)用了一套能夠自動(dòng)審查過濾用戶評(píng)論的人工智能軟件,大大降低了人工審查的成本。Google也推出了人工智能新工具Perspective,它能夠通過機(jī)器學(xué)習(xí)來檢測(cè)網(wǎng)絡(luò)上的惡意或有害的評(píng)論,既可以有效地幫助各大媒體機(jī)構(gòu)進(jìn)行騷擾和負(fù)能量?jī)?nèi)容的處理,也可以幫助網(wǎng)民識(shí)別有害信息,凈化網(wǎng)絡(luò)空間。[4]
4.算法推送:信息私人定制的個(gè)性化推送。2001年,谷歌開始采用算法進(jìn)行個(gè)性化新聞推薦,即由算法決定給哪些用戶推送什么內(nèi)容。之后,F(xiàn)acebook采用了News Feeds算法的協(xié)同過濾機(jī)制,其目的是把用戶真正關(guān)心的內(nèi)容找出來。Twitter采用算法推薦機(jī)制,將推文推送給對(duì)內(nèi)容存在潛在興趣的用戶。這種機(jī)制的本質(zhì)是為用戶打造私人定制信息,即所謂的“個(gè)性化報(bào)紙”。[5]國(guó)外知名的個(gè)性化新聞推送應(yīng)用News Republic和Flipboard也是通過智能編輯、數(shù)據(jù)分析等手段向全球用戶提供最廣泛的個(gè)性化新聞內(nèi)容推薦。算法推送實(shí)現(xiàn)內(nèi)容的個(gè)性化推薦,有效強(qiáng)化了傳播效果。
國(guó)內(nèi)算法領(lǐng)域的主要嘗試者是技術(shù)型公司和傳統(tǒng)媒體,算法主要被這些公司用于新聞的生產(chǎn)與分發(fā)。在算法寫作領(lǐng)域,騰訊推出的Dream writter機(jī)器人利用算法能自動(dòng)生成稿件,并能在第一時(shí)間將重要資訊推薦給用戶。2015年9月,騰訊用它創(chuàng)作了一條財(cái)經(jīng)新聞《8月CPI同比上漲2% 創(chuàng)12個(gè)月新高》。還有新華社的“快筆小新”,阿里巴巴與第一財(cái)經(jīng)聯(lián)合推出的DT稿王,今日頭條的新聞寫作機(jī)器人“張小明”。
算法在個(gè)性化新聞推薦上的應(yīng)用早已為人熟知,《移動(dòng)互聯(lián)網(wǎng)2017春季報(bào)告》指出,網(wǎng)絡(luò)新聞活躍用戶數(shù)量排名前三的是騰訊新聞、今日頭條和一點(diǎn)資訊。縱觀當(dāng)下國(guó)內(nèi)資訊類APP市場(chǎng),算法似乎已經(jīng)成為資訊類APP的核心標(biāo)配。今日頭條、一點(diǎn)資訊、天天快報(bào)都將其作為平臺(tái)的核心配置。[6]目前,個(gè)性化新聞推送在我國(guó)新聞市場(chǎng)擁有極高的市場(chǎng)占有率,有用戶黏結(jié)性強(qiáng)、滲透率高等特點(diǎn)。
1.應(yīng)用領(lǐng)域有限。不同于國(guó)外,算法在國(guó)內(nèi)的起步時(shí)間較晚,技術(shù)發(fā)展也不太成熟,因此在新聞業(yè)的應(yīng)用領(lǐng)域也相對(duì)有限。國(guó)內(nèi)新聞算法領(lǐng)域的主要嘗試者是技術(shù)性公司,傳統(tǒng)媒體略有采納算法技術(shù),但應(yīng)用程度不高。[1]目前,算法在我國(guó)新聞業(yè)的應(yīng)用主要集中于機(jī)器寫作和智能分發(fā)兩個(gè)領(lǐng)域。相比國(guó)外媒體將算法應(yīng)用于分析、寫作、選編、審核、推送等整個(gè)新聞生產(chǎn)流程,我國(guó)新聞算法的應(yīng)用發(fā)展還有很長(zhǎng)的路要走。
2.算法寫作存在的局限性。算法寫作是基于既定的模板將收集好的數(shù)據(jù)信息嵌入生成的新聞稿件,在當(dāng)前國(guó)內(nèi)算法寫作的新聞實(shí)踐中,主要被用來撰寫財(cái)經(jīng)、體育、災(zāi)難事故等領(lǐng)域的新聞,應(yīng)用領(lǐng)域較少,還未進(jìn)行解釋性報(bào)道和深度報(bào)道。同時(shí),算法新聞的生產(chǎn)主要是通過自動(dòng)化模板和數(shù)據(jù)分析與挖掘技術(shù)實(shí)現(xiàn)的,因此雖然語(yǔ)句流暢,但缺乏思想深度和縝密的邏輯思維,單純依靠模板生成的內(nèi)容容易千篇一律,缺乏人文關(guān)懷、理性思考。
3.算法分發(fā)存在的倫理問題。國(guó)內(nèi)的新聞客戶端會(huì)利用算法技術(shù)對(duì)用戶的個(gè)人數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和處理,算法技術(shù)能夠精準(zhǔn)分析并解讀用戶的閱讀習(xí)慣和興趣,并以此刻畫出每一個(gè)用戶的“畫像”,從而為用戶提供量身定制的新聞產(chǎn)品,滿足了人們的個(gè)性化需求。但技術(shù)是一把雙刃劍,在帶來好處的同時(shí),也引發(fā)了“算法黑箱”“信息繭房”以及用戶隱私泄露、價(jià)值觀缺失等技術(shù)倫理等問題。
隨著算法技術(shù)對(duì)新聞業(yè)和社會(huì)的影響越來越大,我國(guó)很有必要進(jìn)一步重視新聞算法的研究與應(yīng)用。展望未來,我國(guó)的新聞算法應(yīng)用需要重點(diǎn)在以下幾方面拓展與深入。
在歐美國(guó)家,政府一直積極推動(dòng)人工智能新技術(shù)的發(fā)展,因而歐美的新聞算法起步時(shí)間較早,應(yīng)用領(lǐng)域也更為廣泛。目前,我國(guó)的算法技術(shù)還處于起步階段,新聞算法在應(yīng)用的過程中有很多不足,因此政府必須主動(dòng)承擔(dān)責(zé)任,而其承擔(dān)責(zé)任的主要形式就是提供長(zhǎng)期持續(xù)的資金支持和應(yīng)用鼓勵(lì)。首先,加大對(duì)新聞算法研究的資金投入和支持,當(dāng)前算法產(chǎn)生的一些倫理風(fēng)險(xiǎn)究其根本是技術(shù)的發(fā)展水平不夠高,因而要不斷優(yōu)化算法技術(shù),規(guī)避現(xiàn)階段造成的“信息繭房”等風(fēng)險(xiǎn);其次,率先進(jìn)行應(yīng)用推廣,目前算法只是在平臺(tái)型媒體中應(yīng)用,傳統(tǒng)媒體的應(yīng)用程度不高,未來可以鼓勵(lì)更多的傳統(tǒng)媒體機(jī)構(gòu)采納新聞算法,將其應(yīng)用到搜集信息、審核信息等領(lǐng)域。
新聞算法作為人工智能技術(shù)與新聞業(yè)融合的產(chǎn)物,在未來的發(fā)展過程中需要大量的人才資源。歐美國(guó)家為應(yīng)對(duì)人工智能的發(fā)展建立了相當(dāng)龐大的人才資源庫(kù),這一點(diǎn)對(duì)于我國(guó)具有極大的借鑒意義。人工智能的人才需要三個(gè)層面的體系化隊(duì)伍,一是在技術(shù)層面有精深的技術(shù)專家和相應(yīng)的人才隊(duì)伍;二是在社會(huì)層面,有對(duì)人工智能透徹理解的社會(huì)治理領(lǐng)域的應(yīng)用專家;三是有能夠把握技術(shù)趨勢(shì)和未來社會(huì)發(fā)展的未來學(xué)專家,從而構(gòu)建從技術(shù)到社會(huì)治理領(lǐng)域的有效溝通,不斷研判通向未來的道路。[7]而新聞算法研究涉及的領(lǐng)域包括基礎(chǔ)數(shù)學(xué)、信息科學(xué)、自動(dòng)化控制和新聞傳播學(xué)等。只有建立全方位的人才庫(kù),才能更好地應(yīng)對(duì)人工智能時(shí)代算法的發(fā)展需求。
在我國(guó),算法推送是后Web2.0時(shí)代的一個(gè)新事物,關(guān)于這一領(lǐng)域的規(guī)制研究基本上還是一片空白,尤其是針對(duì)用戶數(shù)據(jù)泄露、不良信息傳播等問題,缺乏相應(yīng)的法律法規(guī)。[8]歐美地區(qū)的法律體系和監(jiān)管體系相對(duì)完備,如歐盟于2016年推出了《一般數(shù)據(jù)保護(hù)條例》,對(duì)數(shù)據(jù)主體享有的權(quán)利進(jìn)行了細(xì)致劃分,規(guī)定數(shù)據(jù)主體享有對(duì)個(gè)人數(shù)據(jù)的“刪除權(quán)”或“被遺忘權(quán)”。因此,在算法時(shí)代制定新的倫理和法規(guī)很有必要。從宏觀層面而言,國(guó)家應(yīng)制定和完善嚴(yán)格的法律法規(guī),盡快將數(shù)據(jù)立法提上日程,明確互聯(lián)網(wǎng)條件下個(gè)人隱私的邊界;從中觀層面而言,企業(yè)自律非常重要,應(yīng)當(dāng)建立更加完善的分發(fā)機(jī)制,協(xié)調(diào)好工具理性和價(jià)值理性,主動(dòng)承擔(dān)社會(huì)責(zé)任,關(guān)注人的發(fā)展。
[1]章震,周嘉琳.新聞算法研究:議題綜述與本土化展望[J].新聞與寫作,2017(11):18-23.
[2]鄧建國(guó).機(jī)器人新聞:原理、風(fēng)險(xiǎn)和影響[J].新聞?dòng)浾撸?016(9):10-17.
[3]Kumar P B, Chhotray A, Parhi D R. Anatomical Characterization of a Humanoid Robot[A]. International Conference on Progressive Engineering, Technology & Science[C]. 2016:119-130.
[4]孫國(guó)新,汪小東.人工智能在報(bào)業(yè)的應(yīng)用前景分析[J].新聞戰(zhàn)線,2017(12):19-21.
[5]方師師.算法機(jī)制背后的新聞價(jià)值觀——圍繞“Facebook偏見門”事件的研究[J].新聞?dòng)浾撸?016(9):39-50.
[6]姜紅,魯曼. 重塑“媒介”:行動(dòng)者網(wǎng)絡(luò)中的新聞“算法”[J].新聞?dòng)浾撸?017(4):26-32.
[7]何哲.通向人工智能時(shí)代——兼論美國(guó)人工智能戰(zhàn)略方向及對(duì)中國(guó)人工智能戰(zhàn)略的借鑒[J].電子政務(wù),2016(12):2-10.
[8]郝雨,李林霞.算法推送:信息私人定制的“個(gè)性化”圈套[J].新聞?dòng)浾撸?017(2):35-39.