周祉含
[摘要]機器和算法已廣泛應(yīng)用于新聞傳播領(lǐng)域:在社會化媒體、搜索引擎、個性化新聞客戶端等新興媒體信息聚集與分發(fā)平臺內(nèi)部,正發(fā)生著把關(guān)權(quán)力從人工編輯向智能算法的讓度和轉(zhuǎn)移。首先對西方新聞傳播學(xué)相關(guān)文獻進行了梳理,勾勒出算法研究的核心命題和熱點議題以及可能出現(xiàn)的問題和風(fēng)險。算法的“黑箱”特性要求研究方法的創(chuàng)新,其次介紹了逆向工程研究法,通過對“輸入一輸出關(guān)系”的不斷檢驗,可以部分推導(dǎo)出算法的設(shè)計邏輯。
[關(guān)鍵詞]算法;大數(shù)據(jù);逆向工程;人工智能;批判算法研究
2017年2月,美國皮尤研究中心發(fā)布了題為《代碼依賴:算法時代的利與弊》的報告。報告邀請了1300余名科技專家學(xué)者、從業(yè)者、政府人員等對算法未來十年的潛在影響發(fā)表看法和意見,并在此基礎(chǔ)上歸納出算法時代的七大主題:一是算法的應(yīng)用范圍將繼續(xù)擴大;二是好事情就在前方;三是數(shù)據(jù)、預(yù)測模型至上將帶來人性、人類判斷的缺失;四是算法組織系統(tǒng)中存在偏見;五是算法分類加深分歧;六是失業(yè)率將上升;七是需要提高算法素養(yǎng)、透明性和監(jiān)管;算法也廣泛地應(yīng)用于新聞傳播領(lǐng)域,以上:七大主題凸顯了大數(shù)據(jù)背景下算法所發(fā)揮的越發(fā)重要的作用。
算法是一種編碼程序,通過特定的運算把輸入數(shù)據(jù)轉(zhuǎn)化為想要得到的輸出結(jié)果。從社會化媒體的熱門話題排行到搜索引擎的結(jié)果頁排名,從豆瓣的電影、書籍推薦再到新聞客戶端的個性化資訊推送,算法主導(dǎo)信息聚集和分發(fā),輔助甚至代替人工編輯進行信息的篩選和推薦。例如,個性化新聞客戶端今日頭條聲稱,它“沒有采編人員,不生產(chǎn)內(nèi)容,沒有立場和價值觀,運轉(zhuǎn)核心是一套由代碼搭建而成的算法”。
算法的滲透對于新聞生產(chǎn)、分發(fā)、消費乃至整個信息生態(tài)系統(tǒng)而言是全方位的、全環(huán)節(jié)的。算法——這一計算機科學(xué)領(lǐng)域的術(shù)語開始進入人文社會科學(xué)研究者的視野,一批從新聞傳播學(xué)視域展開的研究也開始嶄露頭角。
一、聚焦算法:學(xué)術(shù)視角與理論框架
英國著名文化研究專家斯科特·拉什近年來關(guān)注后霸權(quán)時代的權(quán)力,并觀察到權(quán)力運行方式從“外部施加”向“內(nèi)在生命化”的轉(zhuǎn)變。他指出,構(gòu)成性法則和調(diào)整性法則一直以來是構(gòu)建人類科學(xué)和人類社會的兩大法則;然而,在后霸權(quán)時代需要格外關(guān)注第三種法則,即算法法則或生成性法則。他強調(diào),“在一個媒體和代碼無處不在的社會,權(quán)力越來越存在于算法之中”。
大數(shù)據(jù)時代,龐大的數(shù)據(jù)將帶給算法龐大的權(quán)力,“算法權(quán)力”也成為學(xué)術(shù)界討論的核心命題。研究指出,算法權(quán)力來自于其發(fā)揮的四個作用:優(yōu)先、分類聯(lián)合以及過濾;來自于其對可見度的影響和對擬態(tài)環(huán)境的建構(gòu);來自于其“黑箱”特征:“能夠在審查他者的同時自己不受審查,是一種重要的權(quán)力形式?!边€有學(xué)者從法令規(guī)章、規(guī)范和文化一認(rèn)知三個層面分析由算法主導(dǎo)的媒介內(nèi)容生產(chǎn)與消費,認(rèn)為算法是一種制度,發(fā)揮著“構(gòu)造用戶行為,影響偏好形成以及引導(dǎo)消費”的功能。
“代碼即法律”,勞倫斯·萊斯格使用這一著名論述,指出那些控制信息網(wǎng)絡(luò)平臺的程序開始成為規(guī)范用戶行為的強大工具。四作為代碼決策部分的算法也發(fā)揮著界定用戶行為的功能。
西方的新聞傳播學(xué)院、研究機構(gòu)等圍繞算法開展了豐富的學(xué)術(shù)活動(見表1),包括學(xué)術(shù)會議、工作坊、研討會等。此外,包括《信息、傳播與社會》和《國際傳播雜志》在內(nèi)的國際權(quán)威學(xué)術(shù)期刊都做了有關(guān)算法的專題研討,題目分別是(算法的社會權(quán)力》以及《自動化算法和政治:政治傳播、計算機宣傳和自主行動者》。學(xué)者在不同理論之間的角力中探討新的分析路徑,相關(guān)研究在西方新聞傳播學(xué)界日漸豐厚。
與國外相比,國內(nèi)新聞與傳播學(xué)界的算法研究起步較晚,大致興起于2016年。學(xué)者較多采用“自動化新聞”“機器新聞”等概念來分析人工智能技術(shù)給新聞業(yè)(尤其是新聞生產(chǎn))帶來的機遇和挑戰(zhàn),而智能算法所承載的重要角色和意義直到近幾年才引起學(xué)界重視。目前,國內(nèi)學(xué)界已經(jīng)涌現(xiàn)出了一批有價值的研究,然而多數(shù)研究是有關(guān)宏觀趨勢(如智媒時代、人機共生)的討論,而較少進行中微觀考察。西方學(xué)界所進行的有關(guān)算法權(quán)力、算法與公共領(lǐng)域、算法的公眾認(rèn)知等研究,提供了一個研究大數(shù)據(jù)背景下中國信息環(huán)境的新視角;與此同時,也有助于我們對算法盛行背后的問題與風(fēng)險展開思考。
二、審視算法:問題與風(fēng)險
算法所具有的“黑箱”特性以及與此相伴隨而來的問題和風(fēng)險引發(fā)了學(xué)界的關(guān)注。學(xué)者郝雨和李林霞提出了算法推送帶來的四個弊端,包括用戶自主意識的喪失、隱私侵犯、信息繭房和價值迷失。本文嘗試做出補充和進一步討論。
正如學(xué)者所指出的,針對智媒體的“冷思考”并非是技術(shù)悲觀主義者對媒介技術(shù)簡單的否定,也不是重回“技術(shù)還原論”的窠臼,而是新媒體創(chuàng)新發(fā)展的必由之路。
(一)算法歧視與偏見
算法分發(fā)過程可能存在著方式更加隱蔽的偏見和歧視。和人類偏見所不同的是,內(nèi)嵌于算法設(shè)計之中的偏見像病毒一樣,能夠?qū)⑵娍焖?、大范圍地傳播出去。例如,假設(shè)某公司的一位人力資源經(jīng)理對未婚先孕女性存在偏見,可能會影響幾十人或上百人的就業(yè)機會;然而,如果對未婚先孕女性的偏見被內(nèi)嵌于一套算法系統(tǒng),那么,它影響的人數(shù)可能成千上萬,且往往難以被人們所察覺。
筆者采用相似方法,通過“百度圖片”搜索“教授”“醫(yī)生”“CEO”等詞匯,發(fā)現(xiàn)排在前列的搜索結(jié)果幾乎全部是男性的圖片,這暗含了有關(guān)職業(yè)分類的性別偏見。因此,搜索引擎并不是對現(xiàn)實世界鏡子式的“反映”和“再現(xiàn)”,它所采用的算法將影響人們對客觀世界的認(rèn)知。
除搜索引擎之外,個性化新聞客戶端運行過程中可能存在的算法歧視問題也值得關(guān)注。例如判斷農(nóng)村地區(qū)的貧窮青年不需要財經(jīng)新聞,從而減少甚至過濾掉相關(guān)的資訊推送。
(二)算法短視
臉書創(chuàng)始人馬克·扎克伯格曾說,比起非洲那些掙扎在死亡線上的人們,此刻你前院奄奄一息的一只松鼠可能與你的興趣更加“相關(guān)”。在這一理念的指導(dǎo)下,資訊的重要性讓位于相關(guān)性,而公共利益也常常讓位于個人興趣。研究指出,資訊客戶端對用戶興趣的一味迎合,打造的是一個舒適的不利于用戶進行深度思考的信息環(huán)境。算法分發(fā)重“迎合”輕“引導(dǎo)”,傾向于提供更多“用戶想看到的內(nèi)容”,而非“用戶應(yīng)該看的內(nèi)容”,這在某種程度上削弱了新聞業(yè)的公共服務(wù)屬性。
有學(xué)者指出,算法關(guān)注當(dāng)下掌握的數(shù)據(jù),而這些數(shù)據(jù)通常與短期結(jié)果相關(guān),這就造成了算法本身具有短視傾向。社交網(wǎng)站如果在設(shè)計算法時過于側(cè)重?fù)袅?,那么騙點擊量的內(nèi)容就會充斥網(wǎng)站。學(xué)者建議,在設(shè)計算法時除了考慮短期目標(biāo),還要把長遠(yuǎn)目標(biāo)(例如用戶滿意度、社會效益)納入考量。
搜索引擎、社會化媒體、聚合類新聞客戶端等平臺型媒體傾向于把流行度、易消費性作為優(yōu)先推薦資訊的指南。例如,臉書所采用的是“喜歡”按鈕,而不是“重要”或“具有啟發(fā)性”等設(shè)計。這種設(shè)計邏輯體現(xiàn)了公司的價值偏向?!度嗣袢請蟆?017年10月發(fā)表的社論《不能讓算法決定內(nèi)容》,對“一切圍著流量轉(zhuǎn),唯點擊量、轉(zhuǎn)發(fā)量馬首是瞻”進行了抨擊,呼吁將更多有價值的評價標(biāo)準(zhǔn)引入新聞分發(fā)過程。
以上研究指出了算法背后的設(shè)計邏輯和價值偏向問題。這里的設(shè)計邏輯并不是指具體的技術(shù)細(xì)節(jié),而是指算法所蘊含的設(shè)計價值及所遵循的原則。隨著把關(guān)權(quán)力日益從記者、人工編輯向機器智能算法讓渡,從傳統(tǒng)新聞機構(gòu)向科技公司讓渡,后者能夠承擔(dān)起約瑟夫·普利策所說的“船頭的嘹望者”的角色嗎?算法的設(shè)計者——算法工程師、程序員等,需要遵守新聞職業(yè)規(guī)范和新聞倫理嗎?算法若出現(xiàn)問題(例如上文提到的性別歧視),應(yīng)該由誰來承擔(dān)責(zé)任?這些問題都有待進一步考察。
(三)算法操縱
媒體操縱并不是一個新鮮話題,然而算法操縱之所以值得特別關(guān)注和討論,原因在于其運作方式更加隱蔽、影響范圍也更廣泛。伴隨著近幾年涌現(xiàn)出的案例,算法運作過程中的人工干預(yù)問題開始進入學(xué)者視野。例如,新英格蘭微軟研究院首席研究員塔爾頓·吉萊斯皮觀察發(fā)現(xiàn),占領(lǐng)華爾街運動雖然在美國各地都開展得如火如茶,然而相關(guān)話題卻自始至終都未登上推特?zé)衢T話題榜。吉萊斯皮推測,該話題很有可能是被刻意排除在了榜單之外,且“人們對算法的期待和它們真實呈現(xiàn)出來的結(jié)果發(fā)生了嚴(yán)重的偏離”。
吉萊斯皮的博文讓算法操縱問題開始進入公眾視野,而臉書所進行的一項“情緒感染”實驗則引發(fā)了更大范圍的爭議和討論:在未被告知的情況下,689003名臉書擁戶的信息流在為期一周的時間內(nèi)被心理學(xué)家操縱,首頁呈現(xiàn)具有特定情緒傾向(正面或者負(fù)面)的內(nèi)容。實驗結(jié)果表明,當(dāng)信息流中的正面信息減少時,用戶發(fā)布的正面信息也會減少,反之亦然。
大數(shù)據(jù)時代,用戶數(shù)據(jù)的使用權(quán)和控制權(quán)不斷讓渡給以社會化媒體為代表的第三方網(wǎng)站,新型信息聚集與分發(fā)機構(gòu)所掌握的關(guān)于用戶媒介消費習(xí)慣和偏好的數(shù)據(jù)不斷擴大。除基本信息以外,機構(gòu)所搜集的數(shù)據(jù)還包括用戶的心理特征和思想狀態(tài),其中,臉書所開展的爭議性實驗就驗證了情緒操縱的可行性??梢灶A(yù)見的是,未來有關(guān)算法運作機制不透明性的指責(zé)和爭議仍將繼續(xù),對算法所預(yù)設(shè)的參數(shù)或價值偏向進行檢驗變得必要且重要。
三、剖析算法:逆向工程研究法
由于算法的“黑箱”特性,學(xué)者尼古拉斯·迪爾科普洛斯提出,可以采用逆向工程研究法來剖析內(nèi)嵌于算法的設(shè)計邏輯和價值偏向。逆向工程是指“根據(jù)專業(yè)知識、觀察和推理來發(fā)掘系統(tǒng)運作機制的過程”。目前,該方法已被應(yīng)用于谷歌“自動完成搜索算法”分析、個性化信息搜索、調(diào)查性新聞報道等領(lǐng)域。
例如,已經(jīng)四次斬獲普利策新聞獎的美國非營利性新聞網(wǎng)站ProPublica在“逆向工程奧巴馬的信息機器”這則新聞報道中,調(diào)查分析了奧巴馬競選團隊如何通過微觀追蹤選民來調(diào)整其發(fā)送郵件的內(nèi)容和募捐要求。調(diào)查發(fā)現(xiàn),奧巴馬競選團隊至少針對不同選民發(fā)送了6個不同的郵件版本,募捐要求從3美元到25元不等。選民的募捐歷史是影響郵件內(nèi)容呈現(xiàn)和募捐要求的最主要因素。
如圖1所示,迪爾科普洛斯展現(xiàn)了兩種通過逆向工程推導(dǎo)算法運作機制的場景。場景A,算法的輸入及輸出都是可觀測的,主要通過應(yīng)用程序接口來獲得。然而在大多數(shù)情況下,研究者遇到的是場景B所描繪的情況:僅輸出可見輸入是不可見的。以個性化新聞客戶端為例,可見的是新聞推送的結(jié)果,而究竟哪些因素影響推送過程我們則不得而知。通過對“輸入—輸出關(guān)系”的不斷檢驗,研究者可以部分推導(dǎo)出算法的設(shè)計邏輯,這一過程常常需要依賴眾包來實現(xiàn)。
四、結(jié)論和討論
學(xué)者陳力丹等提出,以以聯(lián)網(wǎng)為代表的新媒體在新技術(shù)下已經(jīng)形成了以云計算、大數(shù)據(jù)、智能終端、多元傳播介質(zhì)為基礎(chǔ)的新傳播生態(tài)鏈。算法也是這一新傳播生態(tài)鏈的重要一環(huán)。通過介紹和梳理西方新聞傳播學(xué)界近年來的研究成果,本文厘清了有關(guān)算法研究的核心命題和熱點議題,并提供了一個思考當(dāng)前大數(shù)據(jù)背景下中國信息環(huán)境的新視角。本文還強調(diào),算法偏見與歧視、算法操縱、算法短視等問題值得學(xué)界和業(yè)界關(guān)注。
目前,微博的信息流廣告、熱門話題排行榜,新聞客戶端的個性化資訊推送、機器新聞寫作搜索引擎的結(jié)果頁排名、輸入框詞語聯(lián)想等均是通過機器和算法來實現(xiàn)的。在算法得以廣泛應(yīng)用和推廣的大勢所趨之下,有必要對其運作機制和潛在影響做進一步的審視和考察。美國皮尤研究中心“新聞卓越計劃”的報告顯示,數(shù)字化時代的媒體創(chuàng)新都是在新聞機構(gòu)以外的領(lǐng)域產(chǎn)生,以谷歌、蘋果臉書、亞馬遜為代表的高科技公司已經(jīng)在很大程度上掌握了新聞業(yè)的未來。而在中國,走在媒體創(chuàng)新前沿的高科技公司主要以百度、阿里巴巴、騰訊和后起之秀今日頭條等為代表。因此,未來研究在吸納借鑒西方新聞傳播學(xué)研究成果的同時,需要特別考慮中國的制度背景和現(xiàn)實。
[本文為教育部人文社會科學(xué)研究青年項目“智能算法驅(qū)動下的新聞分發(fā)變革研究”(項目編號:18YJC860031);河南省哲學(xué)社會科學(xué)規(guī)劃項目“平臺型媒體的算法推薦機制與治理研究”(項目編號:2018CXW017)的前期成果]
參考文獻:
[1]Lash,Scott.2007.“Power after Hegemony:Cultural Studies in Mutation?”Theory,Culture & Society24(3):55—78.
[2]Diakopoulos,Diakopoulos.2013.“Algorithmic Accountability Reporting:On the Investigation of Black Boxes,.”Tow Center for Digital Journalism A Tow/Knight Brief,1—33.Retrieved from
http://towvcenter.org/wp-content/uploads/2014/02/78524_Tow-Center-Report-WEB-1.pdf.
[3]Bucher,Taina.2012.“Want to Be on the Top?Algorithmic Powerand the Threat of Invisibility on Facebook.“New Media & Society 14(7):1164—1180.
[4]Just,Natascha,&Michael Latzer.2017.“Governance by Algorithms:Reality Construction by Algorithmic Selection on the Internet.”Media,Culture & Society39(2):238—258.
[5]Pasquale,F(xiàn)rank.2015.“The black Box society:The secret algorithms that contro money and information.”Cambridge,MA:Harvard University Press,p.76—77.
[6]Napoli,Philip M.2014.“Automated Media:An Institutional Theory Perspective on Algorithmic Media Production and Consumption.”Communication Theory24(3):340—360.
[7]Lessig,Lawrence.2006.Code and other laws of cyberspace2.0.New York,NY:Basic Books.
[8]郝雨,李林霞.算法推送:信息私人定制的“個性化”圈套[J].新聞記者,2017(2):35—39.
[9]劉千才,張淑華.從工具依賴到本能隱抑:智媒時代的“反向馴化”現(xiàn)象[J].新聞愛好者,2018(4):5—8.
[10]王茜.論個性化信息推薦系統(tǒng)的運作邏輯及影響[J].鄭州大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2017(1):46—49.
[11]Luca,Michael,Jon Kleinberg&Sendhil Mullainathan.2016.“Algorithms Need Managers,Too.”Harvard Business Review (January-February):3—7.
[12]Gillespie,Tarleton.2012.“Can an Algorithm be Wrong?.”Limn,2.retrieved from https://escholarship.org/uc/item/0jk9k4hj.
[13]Adam,Kramer,Jamie Guillory&Jeffrey Hancock.2014.“Experimental evidence of massivescale emotional contagion through social networks.”Proceedings of the National Academy of Sciences of the UnitedStates of America 111(24):8788—8790.
[14]Diakopoulos,Diakopoulos.2013.”Algorithmic Accountability Re-porting:On the Investigation of Black Boxes,.”Tow Center for Digital Journalism A Tow/Knight Brief,1—33.Retrieved from
http://towcenter.org/wp-content/uploads/2014/02/78524.Tow-Cen-ter-Report-WEB-1.pdf.
[15]陳力丹,丁文鳳,胡天圓.沉浸傳播:處處是中心無處是邊緣一對世界互聯(lián)網(wǎng)大會的總結(jié)與思考[J].新聞愛好者,2015(1):5—8.