喻國明 韓婷
【摘要】算法型信息分發(fā)給傳播領(lǐng)域帶來巨大而深刻的革命性改變,必然是一種重塑傳播規(guī)則、改變?nèi)藗冋J知的全新規(guī)則與機制的建構(gòu)與改變。算法與傳媒業(yè)的深度融合,不斷形塑著傳媒業(yè)的實踐,給信息采集、制作、分發(fā)等流程帶來了全新機制與規(guī)則,同時也給傳播倫理造成了相當(dāng)大的影響。作為一種越來越主流的信息分發(fā)形式,其未來發(fā)展必須著力于解決現(xiàn)實發(fā)展中所存在的問題與隱憂,才能開辟其登堂入室的光明前景。
【關(guān)鍵詞】算法型信息分發(fā);場景適配;人機交互;規(guī)制創(chuàng)新
一、問題的提出:算法型信息分發(fā)的強勢崛起與社會質(zhì)疑
人類的信息分發(fā)模式迄今為止大體上經(jīng)歷了三個主要的發(fā)展類型:(1)倚重人工編輯的媒體型分發(fā);(2)依托社交鏈傳播的關(guān)系型分發(fā);(3)基于智能算法對于信息和人匹配的算法型分發(fā)。
這三種類型作為信息分發(fā)的主流模式依次出現(xiàn),各有其特色與擅長。譬如,媒體型倚重人工進行信息的專業(yè)化處理和加工,這種分發(fā)模式可以解決社會的共性需要,把那些對于全局、對于所有人具有普遍意義的信息篩選出來,并以點對面的方式傳播出去。它的價值在于解決了“頭部信息”的社會化分發(fā)。但是它無暇顧及人的分眾化、個性化及偶然性、體驗性及高場景度的信息需求。于是便出現(xiàn)了依托社交鏈傳播的關(guān)系型分發(fā)模式:你的朋友、你關(guān)注的人幫你推薦、過濾信息,他們的評論、轉(zhuǎn)發(fā)形成了一種信息篩選機制。社交分發(fā)模式最大的價值是在人類的傳播史上第一次激活了大眾傳播時代那些被忽略的極大量的“長尾信息”,形成了對于信息服務(wù)的“利基市場”,實現(xiàn)了信息分發(fā)的“千人千面”——不同的人通過不同的“朋友圈”有了個性化的信息世界。2010年Facebook主頁訪問量超過Google,可以看作是社交驅(qū)動的“關(guān)系型分發(fā)”在全球成為主流的“拐點”,所謂“無社交不傳播”即是對關(guān)系型分發(fā)的一種不無夸張的描述。
但“關(guān)系型分發(fā)”的問題在于無法解決用戶社交關(guān)系爆炸情況之下的內(nèi)容生產(chǎn)源的爆炸所帶來的“信息超載”以及基于社交關(guān)系的推薦質(zhì)量不斷降低的問題。經(jīng)驗表明,在微信朋友圈中養(yǎng)生、微商、曬娃曬吃類的無效信息越來越多;微博上則是大V和營銷類賬號占據(jù)了主體流量——有研究表明,在微博平臺上,90%以上的內(nèi)容是由3%左右的“大V”生產(chǎn)和分發(fā)的。在此背景下,算法型信息分發(fā)模式便應(yīng)運而生,漸成潮流:現(xiàn)在人們隨便打開一個網(wǎng)站或資訊APP,都會有《個性推薦》或《猜你喜歡》之類的欄目,系統(tǒng)會根據(jù)你的瀏覽記錄和閱讀愛好,自動為你推薦內(nèi)容。第三方監(jiān)測機構(gòu)易觀發(fā)布了一個具有標志性意義的數(shù)據(jù):早在2016年,在資訊信息分發(fā)市場上,算法推送的內(nèi)容已經(jīng)超過50%。它意味著,我們現(xiàn)在接觸到的信息,主要是由“智能算法”為我們搜索和推送的?!八惴ㄐ汀毙畔⒎职l(fā)之所以“流行”,有分析者認為是因為算法對流量的分配獨立于社交關(guān)系,不被“大號”壟斷;算法能夠處理的信息量幾乎沒有上限,能夠更好地激活、適配“汝之毒藥,我之甘飴”的長尾信息;算法能夠?qū)τ脩舻纳缃煌扑]機制進行二次過濾,優(yōu)化推薦結(jié)果。概言之,算法型實現(xiàn)了對于海量信息價值的重新評估和有效適配?!叭曛舅帲抑曙崱币馕吨阌X得不感興趣甚至是垃圾的信息,對于我可能極有價值。于是,信息價值不再有統(tǒng)一的標準,不再有重要性的絕對的高低之分。對剛生下寶寶的媽媽來說,PM值絕對比英國脫歐更重要。對旅游者來說,當(dāng)?shù)氐奶鞖庑畔⒔^對比當(dāng)?shù)氐姆績r更重要。在算法的驅(qū)動下,每個人都有了自己的頭條,這一點得以實現(xiàn)。整個信息世界大一統(tǒng)的秩序被打破。
但也正因為如此,算法型分發(fā)模式站在了風(fēng)口浪尖上。《人民日報》曾連續(xù)三天撰文從內(nèi)容生產(chǎn)、信息分發(fā)和社會創(chuàng)新等角度對某算法型信息分發(fā)平臺進行了全方位立體式的批判。公允地說,這些批判在現(xiàn)實狀況下不無道理。比如,在現(xiàn)在的算法還不足夠“聰明”的情況下,用機器智能去完全替代人的“把關(guān)”,這樣的資訊“守門人”是否可以完全信賴?再比如,由于算法型信息分發(fā)更多地建立在對于人們的直接興趣和“無意注意”的信息需求的挖掘上,它的直接后果是:對于人們必需的那些非直接興趣和需要“有意注意”所關(guān)注的信息的忽略所導(dǎo)致的“信息繭房”問題,等等。這些社會質(zhì)疑對于算法型信息分發(fā)是不能不面對與正視的。
更進一步說,信息的社會性分發(fā)歷來被視為是一種政治權(quán)力,一直以來這個權(quán)力都是牢牢地掌握在政治和商業(yè)巨頭手中的?,F(xiàn)在,在技術(shù)驅(qū)動和現(xiàn)實需求拉動的雙引擎下,基于大數(shù)據(jù)與人工智能的推薦算法系統(tǒng)的引入,對傳媒領(lǐng)域來講,實質(zhì)上是一種傳統(tǒng)的寡頭權(quán)力逐步讓位于技術(shù)邏輯主導(dǎo)的用戶權(quán)力的過程,這一技術(shù)邏輯與分發(fā)范式不斷形塑著傳媒業(yè)的實踐,也給信息的采集、制作、分發(fā)等流程帶來了全新的指導(dǎo)理念,同時也對信息的社會傳播效果及傳播規(guī)范與倫理造成了深刻的影響。這是一個我們不能不認真、嚴肅對待的重大課題。
二、算法型信息分發(fā)的技術(shù)原理:主流推薦算法的類型及系統(tǒng)架構(gòu)
隨著信息技術(shù)和互聯(lián)網(wǎng)尤其是移動互聯(lián)網(wǎng)的發(fā)展,人們迅速從信息匱乏的時代跨入了信息過載和泛濫的時代。在這個信息海量的時代,無論是信息消費者還是信息生產(chǎn)者都遇到很大的挑戰(zhàn):對于用戶而言,從大量信息中找到自己感興趣的信息是一件非常困難的事情;而對于信息生產(chǎn)者而言,讓自己的信息脫穎而出,受到廣大用戶的關(guān)注,也是一件非常困難的事情。推薦系統(tǒng)就是解決這一矛盾的重要工具。推薦系統(tǒng)的任務(wù)就是聯(lián)系用戶和信息,一方面幫助用戶發(fā)現(xiàn)對自己有價值的信息,另一方面讓信息能夠展現(xiàn)在對它感興趣的用戶面前,從而實現(xiàn)信息消費和信息生產(chǎn)者的雙贏[1]。換言之,推薦的精髓在于,我想要的你都有,你給我的都是我想要的。
目前,推薦系統(tǒng)有三大主要類型:
(一)協(xié)同過濾推薦(collaborative filtering recommendation)
它包含兩種主要的推薦技術(shù)——基于記憶的(Memory-based)協(xié)同過濾和基于模型的(Model-based)協(xié)同過濾。前者假設(shè)如果兩個用戶過去對產(chǎn)品有相似的喜好,那么他們現(xiàn)在對產(chǎn)品仍有相似的喜好,后者則假設(shè)如果某個用戶過去喜歡某種產(chǎn)品,那么該用戶現(xiàn)在仍喜歡與此產(chǎn)品相似的產(chǎn)品。[2]因此,前者利用用戶歷史數(shù)據(jù)在整個用戶數(shù)據(jù)庫中尋找相似的推薦項目進行推薦,后者通過用戶歷史數(shù)據(jù)構(gòu)造預(yù)測模型,再通過模型進行預(yù)測并推薦。[3]基于記憶的協(xié)同過濾可以有效挖掘用戶的潛在需求,個性化程度高,在眾多互聯(lián)網(wǎng)平臺得以應(yīng)用,比如亞馬遜、Netflix、Hulu、YouTube的推薦算法的基礎(chǔ)都是該算法。[4]研究數(shù)據(jù)表明,亞馬遜35%的銷售額與推薦系統(tǒng)有關(guān)。[5]但是基于記憶的協(xié)同過濾推薦依賴系統(tǒng)內(nèi)整個用戶歷史數(shù)據(jù)庫作為其推薦系統(tǒng)的原料,當(dāng)數(shù)據(jù)嚴重稀缺時,會存在冷啟動(這里所謂的冷啟動是指對于某APP的新用戶,算法系統(tǒng)缺少其歷史數(shù)據(jù),難以通過算法準確了解和把握其需求的狀況)差、推薦精準度下降等問題。而基于模型的推薦可以有效地解決這一問題,該算法根據(jù)訓(xùn)練集數(shù)據(jù)學(xué)習(xí)得出一個復(fù)雜的模型,來預(yù)測用戶感興趣的信息。[6]基于模型的推薦雖然提升了預(yù)測的準確度,但也存在建模復(fù)雜和冷啟動差的缺陷。[7]
(二)基于內(nèi)容的推薦(content-based recommendation)
基于內(nèi)容的推薦即根據(jù)用戶歷史項目進行文本信息特征抽取、過濾,生成模型,向用戶推薦與歷史項目內(nèi)容相似的信息。它的優(yōu)點之一就是解決了協(xié)同過濾中數(shù)據(jù)稀疏和冷啟動的問題。[8]但如果長期只根據(jù)用戶歷史數(shù)據(jù)推薦信息,會造成過度個性化和信息繭房的現(xiàn)象。另外,該算法更擅長文字信息特征的提取與分析,而在音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù)的分析能力上存在缺陷,因此它多用于網(wǎng)頁、文字新聞等文本類信息的推薦。
(三)關(guān)聯(lián)規(guī)則推薦
關(guān)聯(lián)規(guī)則推薦即基于用戶歷史數(shù)據(jù)挖掘用戶數(shù)據(jù)背后的相關(guān)關(guān)聯(lián),以分析用戶的潛在需求,向用戶推薦其可能感興趣的信息?;谠撍惴ǖ男畔⑼扑]流程主要分為兩個步驟:(1)根據(jù)當(dāng)前用戶閱讀過的感興趣的內(nèi)容,通過規(guī)則推導(dǎo)出用戶還沒有閱讀過的可能感興趣的內(nèi)容。(2)根據(jù)規(guī)則的支持度(或重要程度),對這些內(nèi)容排序并展現(xiàn)給用戶。[9]關(guān)聯(lián)規(guī)則推薦的推薦效果依賴規(guī)則的數(shù)量和質(zhì)量,但隨著規(guī)則數(shù)量的增多,系統(tǒng)也會越來越難以管理。[10]
隨著移動互聯(lián)網(wǎng)的興起以及包含內(nèi)容和關(guān)系的社交媒體(如Twitter、Facebook)的快速發(fā)展,某種單獨的推薦算法已難以滿足用戶推薦、內(nèi)容分類、話題挖掘等需要,因此,融合多種算法、關(guān)聯(lián)更大數(shù)據(jù)的組合推薦系統(tǒng)得到發(fā)展與完善。在推薦系統(tǒng)的實踐應(yīng)用中,經(jīng)常運用兩種或幾種推薦算法,以整合優(yōu)點,彌補缺點,實現(xiàn)精準預(yù)測和推薦(見表1)。
三、算法型信息分發(fā)的本質(zhì):用戶價值主導(dǎo)下的場景化適配
媒介的進化是一個技術(shù)與社會相互作用的結(jié)果。技術(shù)的崛起是目的性和工具性的復(fù)合體,它會引發(fā)社會制度、社會結(jié)構(gòu)與功能的改變,以構(gòu)建容納新技術(shù)的情境,從而導(dǎo)致人類社會結(jié)構(gòu)、交往方式、認知途徑的改變。作為一種“闖入”信息傳播實踐的新生產(chǎn)力量,算法型信息推薦(分發(fā))技術(shù)實現(xiàn)了信息生產(chǎn)與傳播范式的智能化轉(zhuǎn)向,同時帶來了用戶價值主導(dǎo)下的場景化適配。其發(fā)展與變化是一種重塑傳播規(guī)則、改變?nèi)藗冋J知的全新制度設(shè)計,它的影響主要體現(xiàn)在以下四個維度上:
(一)邏輯維度:構(gòu)建全局性的視角
在數(shù)理統(tǒng)計中,一個點的分布沒有規(guī)律可循,兩個點可以確定線性函數(shù)的規(guī)律,三個點可以勾勒二次函數(shù)的輪廓,無數(shù)的點就可以描摹出任何函數(shù)的圖像,呈現(xiàn)點與點的關(guān)聯(lián)和變化趨勢。與此類似,基于算法的內(nèi)容生產(chǎn)將不再依賴記者、編輯等單獨點的信息采集,而是通過對大數(shù)據(jù)庫的實時分析,構(gòu)建起跨語言、深層次、全局性的認識事物、表征和預(yù)測現(xiàn)實的模型,突破了以往人們“腦海真實”的片面性和局部性,從而仿真出無限逼近于客觀真實的“符號真實”。
算法型信息分發(fā)的核心算法模型是在不斷“學(xué)習(xí)”中逐漸成長、成熟,變得智能的。一套良好的推薦算法系統(tǒng)需要三種基本物料:算法、算據(jù)、算力。算法是不斷完善的系統(tǒng)化符號邏輯,最初被開發(fā)出來的時候,仿佛嬰幼兒時期人的大腦,只有“遺傳基因”存在。要想使他越來越聰明,需要通過一系列社交行為比如游戲、對話、接受學(xué)校教育等來讓他不斷與外界發(fā)生互動,互動的過程其實就是符號化外界事物的過程。算法系統(tǒng)同樣也是如此,需要不斷地與數(shù)據(jù)進行“互動”,通過算據(jù)的反復(fù)訓(xùn)練,達到智能化的效果,數(shù)據(jù)量越大,數(shù)據(jù)驅(qū)動方法的優(yōu)勢就越明顯,系統(tǒng)模型運行效果的精準度也會越高。這就需要算力的有力支持,隨著云計算技術(shù)的成熟以及計算機硬件系統(tǒng)的不斷更新,算力也不存在制約了。
由此可見,在大數(shù)據(jù)時代,隨著算法推薦系統(tǒng)的不斷成長,基于算法模型的內(nèi)容生產(chǎn)可以超越個體經(jīng)驗積累的片面性和局部性,從大數(shù)據(jù)中挖掘以事件為中心的多維關(guān)聯(lián)網(wǎng)絡(luò),對社會問題、社會現(xiàn)象等實現(xiàn)從局域到全域的剖析。這種剖析是跨越時空、突破語言限制的解析,給我們呈現(xiàn)出一種全局視角。
(二)主體維度:場景式傳播帶來受眾主體地位的彰顯
隨著算法與內(nèi)容產(chǎn)業(yè)的深度融合,場景傳播成為可能,信息傳播模式也實現(xiàn)了從一對多的大眾傳播模式到一對一的個性化傳播的轉(zhuǎn)變,受眾地位得以凸顯,用戶思維成為算法推薦中的關(guān)鍵性要素。算法推薦以用戶價值為中心,在用戶閱讀內(nèi)容和交互的過程中,運用算法分析用戶特征、閱讀偏好以及閱讀場景,構(gòu)建用戶畫像,從而為用戶提供場景適配的信息服務(wù)。
以今日頭條為例,其算法推薦系統(tǒng)主要有三個維度的變量:內(nèi)容維度、用戶維度以及場景維度。該系統(tǒng)的核心邏輯就是實現(xiàn)內(nèi)容、用戶與場景的匹配,以滿足用戶的個性化信息需求。[11]由此可見,受眾已經(jīng)由新聞信息的被動接受者變成了媒介產(chǎn)品的積極使用者,傳播邏輯由“傳者本位”轉(zhuǎn)向“受眾本位”?;谒惴ǖ膱鼍皞鞑タ梢栽诟顚哟紊蠈τ脩粜枨筮M行洞察、分析與推薦,以實現(xiàn)對用戶需求的全方位把握。同時,算法擴大了場景傳播的范圍。大眾傳播時代,受眾接受新聞信息主要在公共性與半公共性場景之中;移動互聯(lián)網(wǎng)時代,算法可以在移動場景和私密性場景中為用戶提供分眾化、個性化的信息服務(wù),用戶的需求從總體上得到了更大程度的“擴容”與滿足,用戶在傳播領(lǐng)域的主體性地位得到了根本性的提升。
(三)內(nèi)容維度:人機交互重新定義賽博空間中的自我
隨著大數(shù)據(jù)時代的到來,人們獲取信息、建立認知越來越依賴于數(shù)據(jù)及數(shù)據(jù)模型。同時,碎片化的表達正在逐漸改變著受眾的閱讀和思維習(xí)慣,經(jīng)典的敘事結(jié)構(gòu)被受眾所遺棄,具體表現(xiàn)為傳統(tǒng)媒體所生產(chǎn)的新聞內(nèi)容到達率不斷下降,新媒體語境下的、符合受眾閱讀思維的諸如蜂巢形敘事結(jié)構(gòu)①、菱形敘事結(jié)構(gòu)②成為新媒體語境下適應(yīng)市場、適合受眾的新常態(tài)敘事結(jié)構(gòu)。它們改變了長期以來“我說你聽”“以傳者為中心”的單向傳播模式,帶來了讀者參與度高、互動性好的新的內(nèi)容消費體驗。
以新聞為例,新聞本身便是一種典型的敘事,是一種基于客觀事實對5W基本要素進行重構(gòu)的文本。網(wǎng)絡(luò)社會的到來使人與機器之間的界限逐漸模糊。依托移動互聯(lián)網(wǎng)技術(shù),人們可以在任何時間、不同場景進行網(wǎng)絡(luò)連接,借助各種新媒體終端及時、快捷地發(fā)布信息、獲取信息。與此同時,網(wǎng)絡(luò)空間中的敘事主體也由專業(yè)化的媒體從業(yè)者轉(zhuǎn)向普通公眾。網(wǎng)絡(luò)空間大量的帶著豐富生動的情感因素、源自生活的數(shù)據(jù)素材組成的感性敘事更切合受眾的閱讀品位、貼近受眾的情感體驗。受眾進行內(nèi)容生產(chǎn)、消費的過程就是一個參與和互動的過程。通過這個自由創(chuàng)作與互動反思的過程,受眾建構(gòu)起由符號表征所延伸的自我,沉浸在現(xiàn)實場景和虛擬場景之間不斷轉(zhuǎn)換。真實的傳統(tǒng)疆界逐漸坍塌,虛擬也不斷內(nèi)爆成為生命體驗的現(xiàn)實部分。
(四)功能維度:表征與預(yù)測事件的最優(yōu)策略
算法型信息分發(fā)不僅是一種讓社會性操作無限接近客觀真實的符號表征形式,更是一種說明和預(yù)測經(jīng)驗背后知識的新方法和新范式。
人類社會的發(fā)展史就是一部認識客觀世界的歷史。從遠古時期的宗教神學(xué),到軸心時代開辟的哲學(xué),再到歐洲中世紀后期開創(chuàng)的自然科學(xué)。人類認識世界的方式經(jīng)過了神學(xué)階段、形而上學(xué)階段之后,現(xiàn)在已經(jīng)進入了科學(xué)階段或?qū)嵶C階段[12]。作為社會科學(xué)中的一個學(xué)科,新聞傳播學(xué)的發(fā)展也在經(jīng)歷類似的變遷:從早期的文學(xué)、政治學(xué)等發(fā)軔,到20世紀40年代社會學(xué)、社會心理學(xué)等理論的引入實現(xiàn)獨立,再到互聯(lián)網(wǎng)所開啟的數(shù)字化,學(xué)科研究逐漸由經(jīng)驗判斷轉(zhuǎn)向?qū)嵶C測量。數(shù)據(jù)化生存的時代已經(jīng)到來,它將開啟以數(shù)據(jù)信息為基礎(chǔ)、以算法為核心、以“相關(guān)關(guān)系”為關(guān)聯(lián)的表征物質(zhì)世界真實復(fù)雜關(guān)系的研究方法論。
建立在個人經(jīng)驗積累基礎(chǔ)上的主觀認識具有一定的局限性,會受到社會性因素(比如語言、抽象符號、智慧個人互動能力)的影響。推薦算法主導(dǎo)下的新聞傳播實踐則可避免這些干擾,通過構(gòu)建多層次、跨領(lǐng)域的表征現(xiàn)實模型,呈現(xiàn)客觀世界超越人類認知能力的深層次聯(lián)系。這種表征形式借助無損的數(shù)字介質(zhì)進行全息表達,并可以傳遞給具有同構(gòu)性的事物,解決了社會科學(xué)表征社會現(xiàn)實的效度問題,克服了新聞學(xué)中由權(quán)力主導(dǎo)下的新聞客觀性的問題,也建構(gòu)了人類認識客觀世界、改造客觀世界的全新系統(tǒng),這個系統(tǒng)的一大特性就在于預(yù)測。比如,對于流感傳播規(guī)模、強度與路徑的預(yù)測,對于社交媒體上未來某一時段熱點話題的預(yù)測,對于收視率、電影票房以及股市大盤的預(yù)測,等等。
四、算法型信息分發(fā)的未來發(fā)展:解決現(xiàn)實發(fā)展中的問題與隱憂
作為一種越來越主流的信息分發(fā)形式,其未來發(fā)展必須著力于解決現(xiàn)實發(fā)展中所存在的問題與隱憂,才能開辟其登堂入室的光明前景。那么,這些問題和隱憂是什么呢?從技術(shù)邏輯與社會邏輯相結(jié)合的角度看,它們集中在以下三個方面:
(一)更隱蔽的歧視
“數(shù)字系統(tǒng)以清晰的方式,和它們根植于其中的文化緊密地融合在一起”。[13]托馬斯·克倫普在其著作《數(shù)字人類學(xué)》中直截了當(dāng)?shù)刂赋?,人類建?gòu)的數(shù)字系統(tǒng)就是人的鏡像系統(tǒng)。不可否認,人類社會充滿著各種各樣的歧視,世俗社會的民族、宗教歧視,商業(yè)社會的金錢歧視,政治社會的權(quán)力歧視等,在利益交織的社會中不斷變種。
作為同構(gòu)現(xiàn)實的表征機制,算法新聞的設(shè)計是人主導(dǎo)的,不可避免地會受到價值干涉,盡管許多公司極力回避這個問題。以客觀、公正的科學(xué)名義設(shè)計出的算法難免會有“變種”的歧視,而這個歧視也將變得更加隱蔽。
(二)“信息繭房”效應(yīng):算法推薦在滿足用戶個性化需求的同時,也存在著“信息繭房”的局限
“信息繭房”是凱斯·桑斯坦在《信息烏托邦》一書中提出的概念,一般來講,用戶的閱讀興趣不可能涵蓋所有的知識領(lǐng)域,長期只接觸自己感興趣的信息,而缺乏對其他領(lǐng)域的接觸與認識,會限制用戶對社會的全面認知,將用戶禁錮在有限的領(lǐng)域內(nèi)。不可否認的是,“信息繭房”是兩種傳播思維相互碰撞的結(jié)果,傳統(tǒng)意義上大而全的傳播模式注重“面”上的拓展,而基于算法的個性化信息推薦則注重“點”上的深挖。因此,算法推薦在滿足用戶的特定需求時,不可避免地會限制用戶信息的接觸面。但在未來隨著算法不斷優(yōu)化與迭代,“信息繭房”的問題會得到弱化或解決。比如今日頭條通過不斷優(yōu)化算法模型,在向用戶推薦感興趣信息的同時,也逐漸向其推薦具有較強關(guān)聯(lián)領(lǐng)域的信息,以弱化“信息繭房”效應(yīng),在更為宏大的參照結(jié)構(gòu)中擴大用戶的認知范圍。
(三)倫理沖突:低俗內(nèi)容與虛假新聞
低俗內(nèi)容和標題黨現(xiàn)象也是算法推薦存在的顯著性問題,算法推薦最初在傳播倫理方面存在一定的缺陷。不同于人工編輯和人工篩選,只要用戶感興趣,基于技術(shù)理性的算法就容易將低俗內(nèi)容和標題黨新聞推薦給用戶。在未來,傳播者在算法規(guī)則設(shè)計中不僅要考慮到傳媒的商業(yè)價值,還應(yīng)考慮到傳媒的文化引領(lǐng)等社會價值。為減少標題黨新聞的推薦,一些算法型內(nèi)容分發(fā)的互聯(lián)網(wǎng)企業(yè)已經(jīng)做出了一些探索,如今日頭條建立了檢測“標題黨”的規(guī)則模型,以警示頭條號作者的“標題黨”行為。當(dāng)頭條號作者預(yù)發(fā)布文章的時候,如果標題中出現(xiàn)了“驚呆”“震驚”等內(nèi)容,會收到一個飄黃的窗口,提示其內(nèi)容涉及標題夸張,建議修改,如果作者繼續(xù)強行發(fā)布的話將會被限制推薦量。[14]
目前,多家科技公司也存在推薦假新聞的問題。比如在美國總統(tǒng)大選期間,谷歌的算法推薦系統(tǒng)向用戶推薦了一條特朗普贏得普選的假新聞,而實際上希拉里在選民最終票數(shù)方面高于特朗普,特朗普最終依靠選舉人票數(shù)贏得了此次大選。另外,F(xiàn)acebook在美國總統(tǒng)大選期間也出現(xiàn)了推薦假新聞的情況。Facebook和谷歌公司為了限制假新聞的傳播,一方面依靠用戶對假新聞打標簽的方式,對具有一定數(shù)量假新聞標簽的新聞進行降序處理;另一方面則運用算法對交叉新聞源進行分析,以辨別新聞的真實性,但實事求是地講,通過算法識別和制約假新聞依舊在路上艱難前行。當(dāng)然,在移動互聯(lián)網(wǎng)時代,面對海量信息,傳統(tǒng)媒體也頻頻爆出報道假新聞的消息,由此可見,治理假新聞現(xiàn)象不僅僅是算法推薦需要解決的問題,也是整個內(nèi)容產(chǎn)業(yè)需要面對的問題。
注釋:
①Paul Bradshaw于2007年提出,針對突發(fā)社會新聞報道,由于信源眾多,事件未知性大以及時效性的要求,新聞報道不能完全展示5W要素,只能針對單個要素進行主次報道。這種新聞報道方式類似蜜蜂筑巢時的積聚行為,如2014年3月國內(nèi)媒體針對馬航MH370失蹤事件的報道。
②Devin Harner于2011年提出,為適應(yīng)新聞傳播時效性的要求,增強與受眾的有效互動,新媒體語境下新聞敘事呈現(xiàn)菱形發(fā)展模式,即隨著事件的進展和社會關(guān)注度的提升,新聞報道展示的新聞要素逐漸增多,隨著事件的解決和受眾注意力的轉(zhuǎn)移,后期報道呈現(xiàn)減弱的趨勢,如2016年5月針對“雷洋”事件的報道。
參考文獻:
[1]http://www.woshipm.com/pd/818285.html.
[2]鄧曉懿,金淳,韓慶平,樋口良之.基于情境聚類和用戶評級的協(xié)同過濾推薦模型[J].系統(tǒng)工程理論與實踐,2013,33(11):2945-2953.
[3]John S.Breese,David Heckerman,Carl Kadie.Empirical Analysis of Predictive Algorithms for Collaborative Filtering[C].Process of the 14th Conference on Uncertainty in Artificial Intelligence,1998:43-52.
[4]項亮.推薦系統(tǒng)實踐[M].北京:人民郵電出版社,2012:51.
[5]洪亮,任秋圜,梁樹賢.國內(nèi)電子商務(wù)網(wǎng)站推薦系統(tǒng)信息服務(wù)質(zhì)量比較研究:以淘寶、京東、亞馬遜為例[J].圖書情報工作,2016(23).
[6]冷亞軍,陸青,梁昌勇.協(xié)同過濾推薦技術(shù)綜述[J].模式識別與人工智能,2014(8):720-734.
[7]陳潔敏,湯庸,李建國,蔡奕彬.個性化推薦算法研究[J].華南師范大學(xué)學(xué)報(自然科學(xué)版),2014(5).
[8]呂學(xué)強,王騰,李雪偉,董志安.基于內(nèi)容和興趣漂移模型的電影推薦算法研究[J].計算機應(yīng)用研究,2018(3).
[9]曾春,邢春曉,周立柱.個性化服務(wù)技術(shù)綜述[J].軟件學(xué)報,2002(10).
[10]李杰,徐勇,王云峰,朱昭賢.面向個性化推薦的強關(guān)聯(lián)規(guī)則挖掘[J].系統(tǒng)工程理論與實踐,2009,29(8).
[11]人民網(wǎng).今日頭條公開算法原理本質(zhì)[EB/OL].http://it.people.com.cn/n1/2018/0112/c196085-29762253.html.
[12]Auguste Comte.Cours de Philosophie Positive,Tome Premier. London George Bell & Sons.1896.p.2.
[13]托馬斯·克倫普.數(shù)字人類學(xué)[M].鄭元者,譯.北京:中央編譯出版社,2007:2.
[14]劉志毅.今日頭條如何用算法打擊“標題黨”[J].傳媒,2017(4).
(喻國明為教育部長江學(xué)者特聘教授,北京師范大學(xué)新聞傳播學(xué)院執(zhí)行院長,中國人民大學(xué)新聞與社會發(fā)展研究中心主任;韓婷為北京師范大學(xué)新聞傳播學(xué)院碩士生)
編校:鄭 艷