• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      算法模型推薦對新聞?wù)鎸嵉南馀c建構(gòu)

      2023-08-07 23:14:34
      關(guān)鍵詞:算法模型

      段 鵬

      (中國傳媒大學(xué),北京 100020)

      一、 問題的提出

      算法是技術(shù)神話嗎?回答這一問題首先需辨明,算法是否是絕對中立且準確無誤的。算法是由人設(shè)計的,算法的決策系統(tǒng)也是如此,以網(wǎng)絡(luò)管理為例,算法需自動區(qū)分仇恨言論、虛假信息或恐怖主義宣傳與新聞等,所有這些系統(tǒng)都使用價值判斷來得出結(jié)果。因此為了執(zhí)行任務(wù),算法需要“知道”要區(qū)別對待哪些數(shù)據(jù)包。此類定義總是由人類設(shè)計者出于某些意圖制定,顯然此類定義并不能被限定為是中立的,同時基于它們的算法也不是中立的。算法要么直接由人類設(shè)計,如果是自學(xué),則在人類控制和設(shè)計過程的基礎(chǔ)上發(fā)展它們的邏輯。它們既不是“客觀的”也不是“中立的”,而是人類深思熟慮和權(quán)力斗爭的結(jié)果。之后,算法將所有輸入都置于同一組指令之下,對所有數(shù)據(jù)對象無差別運行,且沒有任何自己的意圖,因此對于其“神話”的解讀,僅能在數(shù)據(jù)采集、模型設(shè)計、價值判斷等內(nèi)容以外加以探討。

      2020年10月與2021年10月和12月,歐盟網(wǎng)絡(luò)與信息安全局(ENISA)分別發(fā)布了《人工智能網(wǎng)絡(luò)安全威脅圖譜》(ArtificialIntelligenceCybersecurityChallenges:ThreatLandscapeforArtificialIntelligence)、《ENISA威脅圖譜2021》(ENISAThreatLandscape2021)、《安全機器學(xué)習(xí)算法》(SecuringMachineLearningAlgorithms)等報告,這些報告以海量數(shù)據(jù)資料為依托,旨在提升歐盟在人工智能領(lǐng)域的網(wǎng)絡(luò)安全性。以人工智能、算法等技術(shù)為土壤的假新聞首次進入ENISA的威脅圖譜,虛假信息甚至在一些網(wǎng)站中成為了能夠攫取利潤的網(wǎng)絡(luò)服務(wù)模式(Disinformation as a service, Daas)。ENISA稱,數(shù)字技術(shù)和社交媒體使用頻次的不斷增加顛覆了人們一直以來獲取新聞資訊的方式。(1)ENISA Threat Landscape 2021, https://www.enisa.europa.eu/publications/enisa-threat-landscape-2021, May 27, 2022.社交平臺不同于傳統(tǒng)媒體形式,其“把關(guān)人”不再嚴苛,“過濾器”缺乏核查,任何一次虛假新聞的生產(chǎn)和傳播都可能引起重大輿論事件,而恰是以算法為代表的新興模式為此類現(xiàn)象提供了技術(shù)基礎(chǔ)。

      算法作為信息技術(shù)、數(shù)學(xué)模型、媒體后臺等交叉領(lǐng)域的“復(fù)合體”,一直以來存在于各類“運行”的內(nèi)在邏輯中。從本體論角度出發(fā),算法早已不能被簡單定義為基于數(shù)據(jù)經(jīng)驗的推導(dǎo)模型,其暗含的對現(xiàn)實社會的控制力、滲透力,使其成為“技術(shù)無意識”(Technological Unconscious)的構(gòu)成部分。社會的結(jié)構(gòu)在一定意義上被算法支持,而其運行邏輯往往僅被其設(shè)計者管窺,以技術(shù)黑箱形式存在。之所以說設(shè)計者也僅能夠“管窺”,是出于對機器學(xué)習(xí)內(nèi)容片面性的考量,文中也將對這一點加以詳述。當下,算法的運行不僅表達著代碼的數(shù)學(xué)語言,也嵌入了不同意識形態(tài)、國家力量、身份背景的博弈邏輯,甚至包含著設(shè)計者自身潛在的喜好和偏向。以算法為技術(shù)基礎(chǔ)的算法新聞不僅影響著傳統(tǒng)新聞生產(chǎn)機制,也在智能媒體傳播的宏觀大背景下對人與社會產(chǎn)生著潛移默化的影響。大至國際傳播領(lǐng)域,傳統(tǒng)意義上不同主體間的霸權(quán)與反霸權(quán)行為正在以算法的形式被改寫和重釋,這引發(fā)了不同國家和地區(qū)對算法及網(wǎng)絡(luò)安全問題的重視;小至日常生活,社交平臺算法錨定、迎合、形塑人們的“個性化喜好”。

      在媒介智能化及全球化大背景下,一些由算法虛假新聞引起的社交平臺輿論事件造成的影響極有可能從微小的IP地址所在地蔓延至全球,刨除由于客觀信息傳播誤差等原因造成的虛假新聞,惡意的數(shù)據(jù)收集、釣魚鏈接、信息誹謗等事件通過算法這一技術(shù)雙刃劍撼動著國際局勢,如在全球性事件新冠肺炎疫情發(fā)生前期,大量的海外網(wǎng)站以算法為驅(qū)動,在沒有事實根據(jù)的情況下捏造新聞消息,對中國加以污名化。再如俄烏沖突前后,以美國為代表的西方國家利用自身智能化媒體技術(shù)優(yōu)勢,在全球范圍內(nèi)借由社交媒體掀起的對俄譴責,無不將新聞傳播領(lǐng)域中的算法新聞問題推至選擇“左”還是“右”的倫理兩難境地,其中最為顯性的則是算法新聞的新聞?wù)鎸崋栴}。區(qū)別于傳統(tǒng)新聞生產(chǎn),算法的介入使得新聞產(chǎn)品在“技術(shù)價值無涉”的大觀點下似乎帶有天然的真實和客觀屬性,然而從現(xiàn)實來看,算法假新聞已成為不能回避的問題。算法新聞的勃興為何挑戰(zhàn)了新聞專業(yè)主義及新聞?wù)鎸崋栴}?本文對這一問題的回答將追溯至算法數(shù)學(xué)模型本身所具有的數(shù)學(xué)缺陷,試圖在算法新聞應(yīng)用之便以外剖析技術(shù)內(nèi)隱之惡。

      二、 算法新聞與新聞?wù)鎸?/h2>

      首先需對算法新聞概念加以溯源和澄清。算法新聞(Algorithm News)是運用智能算法工具自動生產(chǎn)新聞并實現(xiàn)運營的過程、方法或系統(tǒng),包括信息采集、儲存、寫作、編輯、展示、數(shù)據(jù)分析及營銷等的自動化實現(xiàn)。(2)於春: 《算法、權(quán)力與治理: 智能時代美國新聞自由與民主政治的反思》,《當代世界與社會主義》2022年第3期,第117—122頁。算法新聞不應(yīng)單單被理解為一項技術(shù)、一種類型或一個對象的指稱,相反,算法新聞是新聞領(lǐng)域內(nèi)以算法模型為內(nèi)核的系列技術(shù)程序。有研究者將算法新聞定義為利用算法在無人干預(yù)情況下自動生成(automatically generate)新聞消息的過程,側(cè)重于強調(diào)算法協(xié)助下新聞生產(chǎn)的自動化(automatically)。此類理解往往與生產(chǎn)概念緊密結(jié)合,同時對算法新聞范圍的認定根據(jù)不同主體和側(cè)重點包含了“機器(人)新聞”(Robot Journalism)、“自動化新聞”(Automated News)、“數(shù)據(jù)驅(qū)動新聞”(Data-Driven Journalism)、“計算新聞”(Computational Journalism)等模式,更聚焦在對算法新聞技術(shù)層面的探討。

      從社會空間生產(chǎn)角度出發(fā)解剖算法新聞,算法新聞的生產(chǎn)被認為包括了人工設(shè)計模型自動生產(chǎn)新聞的機器人算法新聞,傳統(tǒng)媒體新聞內(nèi)容產(chǎn)品及自媒體生成內(nèi)容,根據(jù)新聞要素、地理特征、人口學(xué)特征、個性化特征實現(xiàn)的新聞算法的分發(fā)。(3)郭潔: 《算法新聞的空間視角研究》,《青年記者》2021年第14期,第22—23頁。在此類認識視角下,算法新聞實際上將人、企業(yè)、社會在網(wǎng)絡(luò)社會空間的物質(zhì)或精神生產(chǎn)力納入了自身的生產(chǎn)機制,也包括了用戶接受新聞產(chǎn)品后對新聞產(chǎn)品的指導(dǎo)反饋過程。同時,也有學(xué)者從更廣義和全面的視角出發(fā),置算法新聞于社會的應(yīng)用和輻射層面,將其定義為“大數(shù)據(jù)、算法與社會科學(xué)的結(jié)合模型”,也同時強調(diào)了算法新聞模式下人力的“缺席”“在場”及新聞問責的重要性。新聞生產(chǎn)原本是一項完全“人為”的工作,而在算法新聞問世后,技術(shù)與人的勞動分工問題也在學(xué)界和業(yè)界范圍被廣泛討論,其中不乏對新聞生產(chǎn)自動化倫理問題的批判聲音。

      新聞?wù)鎸嵖梢苑Q作是新聞業(yè)的“元問題”(Meta-Question)之一,一直以來,新聞?wù)鎸嵄徽J為是新聞從業(yè)人員工作實踐的核心原則、要求、底線。就本質(zhì)而言,新聞?wù)鎸嵰笮侣剤蟮琅c客觀事實具有一致性。20世紀90年代,鄭保衛(wèi)認為新聞?wù)鎸嵭跃褪切侣剤蟮缹陀^發(fā)生的事實如實進行報道和反映,這一說法體現(xiàn)著傳統(tǒng)新聞生產(chǎn)領(lǐng)域中學(xué)界對于新聞?wù)鎸嵉拇篌w看法。對于事實和報道“一致性”的追求更多傾向于一種“結(jié)果真實”,新聞記者作為新聞信息的挖掘者和傳遞者也承擔了信息核查的責任,這也關(guān)乎新聞媒體權(quán)威性和相應(yīng)的公眾信任問題??梢哉f,從新聞?wù)鎸嵔^對論視角出發(fā),新聞?wù)鎸嵄徽J為是與所報道對象完全符合或存在同一性,但基于現(xiàn)實考量,“絕對真實”往往很難實現(xiàn),這也引發(fā)了學(xué)界對新聞?wù)鎸嵔^對論的詬病。從新聞?wù)鎸嵳J識論視角出發(fā),并不存在完全符合客觀情況的新聞?wù)鎸?新聞?wù)鎸崈H被認為是經(jīng)過新聞生產(chǎn)者主觀判斷后認定的事實。反觀當前數(shù)字技術(shù)背景下的新聞業(yè),以算法新聞為例,新聞實踐活動的核心主體不再僅是記者,它也被多樣化的技術(shù)主體從不同角度介入,因而對新聞?wù)鎸嵉囊蟪霈F(xiàn)了一定的“過程真實”轉(zhuǎn)向。新聞?wù)鎸嵾@一傳統(tǒng)媒體時代的道德要求與職業(yè)準則在數(shù)字時代又遇到了新問題,在迅速變化的媒介生態(tài)中,新聞的角色也正發(fā)生相應(yīng)的變動,“新聞?wù)鎸崱边@一合法性根基也受到動搖。(4)白紅義、王嘉怡: 《數(shù)字時代新聞?wù)鎸嵉南馀c觀念重構(gòu)》,《新聞與寫作》2022年第7期,第14—25頁。對于公眾而言,新聞報道中的“事實”大多時候與自己有著空間間隔,因而需要新聞記者前往現(xiàn)場并與事實直接接觸。從源頭挖掘、被加工和查證的信息體現(xiàn)了新聞的真實性,并且最后成為被公眾消化的新聞產(chǎn)品。而算法新聞的出現(xiàn)改寫著這一機制,一方面,生產(chǎn)主體從“人”轉(zhuǎn)向“機(由人設(shè)定的模型)”;另一方面,算法新聞的信源是載有海量信息的網(wǎng)絡(luò)數(shù)據(jù)庫。從一般邏輯出發(fā),這樣的轉(zhuǎn)變似乎能夠使得新聞以更加中立、客觀、真實的方式被呈現(xiàn)和傳播,然而事實并非如此。由此,本文從算法新聞的核心技術(shù)基礎(chǔ)算法出發(fā),剖析導(dǎo)致算法新聞?wù)鎸嵭源嬉傻牟糠直锥嗽搭^。

      三、 算法弊端探源

      誠然,算法作為“技術(shù)之技術(shù)”賦能社會生活的方方面面,在大多數(shù)情況下,其以數(shù)學(xué)模型為核心、以技術(shù)為手段為人類的發(fā)展提供了極大的便利。本文無意對其積極的能力架構(gòu)或技術(shù)功能進一步闡釋,也并非全然批判地對技術(shù)加以批駁抗拒,相反,本文試圖側(cè)重于通過解剖算法的架構(gòu)邏輯,把握其在數(shù)理層面的先天缺陷,并據(jù)此談及當前算法新聞在生產(chǎn)機制中所先天具有的缺陷。

      簡單化而言,算法實際上可以看作設(shè)計者計算機語言交流下的機器學(xué)習(xí)和基于學(xué)習(xí)的機器判斷,其本質(zhì)實為一種數(shù)學(xué)模型。模型的邏輯隱晦不明,或者說只有設(shè)計者掌握著其運行的大體路線,卻不能百分百確定不會有偶然性事件或數(shù)據(jù)歧視和謬誤發(fā)生,而諸如歧視、錯誤、有害事件的后果卻由“被運行”了算法的用戶承擔,更多時候這種有害后果是用戶甚至不曾察覺的隱性侵害。為了在非計算機專業(yè)背景下進一步闡明侵害發(fā)生的路徑,本文從較為直接的數(shù)學(xué)與常識視角出發(fā),對算法中最可能對客觀性造成侵害的三段流程加以解釋:

      (一) 數(shù)據(jù)搜集: 盲點處的謬誤及片面性強化

      算法的實質(zhì)即為模型,而模型的要義則是簡化一切事件與問題。以我國經(jīng)典體育運動乒乓球為例,熟練的球手在攻防過程中往往會預(yù)判對手的來球方向并以適當力度的反作用力將球擊回對方臺面,教練往往也會在制定策略時,通過觀看賽事回放的方式觀察對手的運球軌跡,并基于此作出己方在賽場上的戰(zhàn)術(shù)應(yīng)對。事實上,尋找對手賽事回放、大量觀察對手運球軌跡,可以類比為算法模型建立的前提——機器數(shù)據(jù)挖掘與機器數(shù)據(jù)學(xué)習(xí),而基于個人判斷擊球則類似于算法模型推導(dǎo)出建議并被接納。這一類比一定程度上有助于我們更清晰地勾勒算法本質(zhì)并為其祛魅,也正如段首所言: 算法模型是對一切事件和問題的簡化。然而,人類社會萬千事件皆具細微差別,模型是否能識別、定義一切事件,而不遺漏對社會細微方面的考量呢?

      《美國新聞》(U.S.News)(5)后更名為《美國新聞與世界報道》(U.S. News &World Report)。雜志在1983年開展了一個教育評估項目: 為全美1 800所大學(xué)及學(xué)院進行“優(yōu)秀度”排名,大學(xué)質(zhì)量的排名將為即將進入大學(xué)的年輕人提供數(shù)據(jù)參考。為了形成一個評估“優(yōu)秀度”的模型,《美國新聞》的編輯根據(jù)自己的直覺判斷向各個大學(xué)發(fā)送了評估問卷,然而編輯僅挑選了一些看似與大學(xué)“優(yōu)秀度”相關(guān)的變量,如高中生SAT成績、學(xué)校的師生比例、畢業(yè)校友捐款比例等,但諸如學(xué)生在學(xué)習(xí)過程中的獲得感、幸福度、終身學(xué)習(xí)能力、社交能力等評估因素均未得到考量,編輯們較為主觀的評估變量被數(shù)學(xué)模型包裝,共同推導(dǎo)出了1988年的全美大學(xué)優(yōu)秀度排名。盡管大多讀者對這一排名表示認可,然而雜志社仍然收到了海量的投訴和批駁,被指控評判因素有失客觀性。

      值得注意的是,未能考慮到細微方面的算法模型推導(dǎo)出了大學(xué)優(yōu)秀度排名,這一排名影響著年輕人的擇校選擇,排名靠后的大學(xué)少有人選擇,更不利于大學(xué)的數(shù)據(jù)表現(xiàn),從而造成了一定意義上的“惡性數(shù)據(jù)循環(huán)”。由此可見,由于設(shè)計者的數(shù)據(jù)盲點,算法有時會片面地證明自己的內(nèi)置邏輯和輸出結(jié)果是合理的,并不斷在運行過程中自我鞏固、自我發(fā)展,卻侵蝕了相關(guān)方的特定利益。

      (二) 數(shù)據(jù)歧視: 被技術(shù)包裝的偏見與博弈

      如果說《美國新聞》的編輯在制定評估因素時只是受到了個人社會生活背景、知識學(xué)歷等細微因素影響,其算法僅僅包裝了模型設(shè)計者的認知,那么對于如種族主義者、資本集團等有著鮮明結(jié)果導(dǎo)向和站位立場的設(shè)計者而言,算法則是包裝人類偏見與資本博弈的技術(shù)外衣。就個人層面而言,種族主義類似于存在于種族主義者認知中的算法模型,一切與不同種族人群相關(guān)的缺陷、片面、虛假數(shù)據(jù)都會被種族主義者納入認知,并推導(dǎo)出一個二元對立的種族認知結(jié)論。而一旦個人層面的這一認知模型被置于現(xiàn)實的算法技術(shù)中,被應(yīng)用于具體的社會方面,則必定會造成對部分人群的傷害。以種族主義為代表的算法模型實為最欠缺考量的模型,它被隨機的數(shù)據(jù)采集和假性相關(guān)所驅(qū)動,被制度不公平強化,又被證實性偏見進一步劣化。(6)凱西·奧尼爾: 《算法霸權(quán): 數(shù)學(xué)殺傷性武器的威脅》,馬青玲譯,北京: 中信出版社,2018年,第12頁。

      以利益為核心的資本博弈也被算法模型所包裝。依然以淺顯的日常生活案例為切入點,當有心人觀察到,商場門口的抓娃娃機每投幣n次就會出現(xiàn)故障,娃娃會比較容易掉落,那么一個簡單的獲利模型就生成了。金融工程師正是通過海量的數(shù)據(jù)建立算法模型以預(yù)測如“娃娃掉落”一般的反常式獲利,貨幣、債券、股票以及國際市場中數(shù)以萬億計的美元或黃金正是在算法模型的推演下進入了特定群體的賬戶。

      需要從另一個社會層面反思的是,進入資本家賬戶的資金并不僅僅是屏幕界面上的簡單數(shù)字,2008年金融危機爆發(fā)時華爾街的對沖基金投資人將其稱為“傻瓜基金”,指的就是那些來自“傻瓜”民眾的錢。民眾真如其所說一般是“傻瓜”嗎?事實上這一粗暴的形容,恰是對民眾將會被不透明算法模型欺騙的隱喻,由于不清楚黑箱的資本操作邏輯,民眾的血汗錢被卷入資本家、機構(gòu)等多主體的利益博弈中。

      (三) 模型弊端:“偶然”變量引發(fā)的意義坍塌

      關(guān)于算法的第三個先天缺陷,正如上文所舉的乒乓球軌跡數(shù)據(jù)學(xué)習(xí)案例,一般情況下教練和球手憑借認知中已有的模型判斷來球方向并基于經(jīng)驗加以應(yīng)對,然而在一些情況下,對手來球可能是前推、加轉(zhuǎn)、側(cè)轉(zhuǎn)的弧旋球,繼續(xù)沿用模型中的應(yīng)對模式反而會使球走向錯誤方向?qū)е率Х?這便是模型中的“偶然”變量。(7)在概率論和統(tǒng)計學(xué)中,偶然變量指的是“值取決于隨機現(xiàn)象的結(jié)果的非獨立變量”。更直接地說,算法模型在“房間出現(xiàn)大于n濃度的煙霧就觸發(fā)火警鈴聲”的單一變量邏輯中更為直接有效,而面對可能出現(xiàn)偶然變量的事件則可能出現(xiàn)意義的坍塌。

      除卻偶然性,人類本身所具有的個體差異性、成長性等特殊現(xiàn)象也并非算法模型能夠絕對概括的。正如如果缺少精密數(shù)據(jù)的實時更新,遠在外地的祖父祖母并不能在下一次見面時準確地掌握孫輩的飲食口味,而即使時刻掌握著實時反饋的個性化數(shù)據(jù),一位母親也并不能百分百確定精準地烹飪出滿足子女特定時刻味覺需求的美食。這也正是算法模型所具有的運行弊端,即變量考量的片面性以及變量自身的變動性可能導(dǎo)致結(jié)果出現(xiàn)誤差。

      四、 模型缺陷的延伸

      從上述三段可能出現(xiàn)錯誤或侵害的流程來看,算法數(shù)學(xué)模型其實在生成前(制作者的前期設(shè)計和數(shù)據(jù)搜集)、生成時(機器學(xué)習(xí)和模型判斷)、運行后(現(xiàn)實社會對算法的運用)皆存在一定程度上較難避免的先天缺陷。另一方面,在人類主觀認知的參與下算法模型難以保證自身是價值無涉的,這就意味著在數(shù)學(xué)模型的協(xié)助下,不同設(shè)計者的主觀認知從意識層面走向了現(xiàn)實世界,并在算法推導(dǎo)結(jié)果的作用下產(chǎn)生了實際的現(xiàn)實影響。對算法本身缺陷性的探討并非對技術(shù)本身的孤立批判,事實上,技術(shù)腳本中的缺陷基因在一定程度上延伸至了算法的應(yīng)用領(lǐng)域,新聞傳播實踐中算法的應(yīng)用也體現(xiàn)了上述三段流程的媒介演繹和侵害變體,也由此在一定程度上消解著新聞?wù)鎸崱乃惴ㄐ侣劶夹g(shù)本體出發(fā),它是如何繼承了算法這一模式本身的缺陷并影響新聞的真實呈現(xiàn)的?為了探尋問題的答案,需拆解算法新聞生產(chǎn)流程:

      (一) 數(shù)據(jù)采集及處理: 模型盲點再現(xiàn)

      算法新聞運行與傳統(tǒng)新聞生產(chǎn)的前提實際上是類似的,兩者均需獲取材料以生產(chǎn)內(nèi)容。傳統(tǒng)的新聞生產(chǎn)中,新聞采集需要相關(guān)人員前往新聞發(fā)生地或相關(guān)主體所在地采集所需信息,而在算法新聞運行中這一流程則體現(xiàn)為核心數(shù)據(jù)抓取及相關(guān)數(shù)據(jù)挖掘。算法新聞運行的技術(shù)基礎(chǔ)在于對大數(shù)據(jù)中新聞信息的抓取與計算分析,而大數(shù)據(jù)本身是通過匯集存儲在數(shù)據(jù)庫里的每一個數(shù)據(jù)生成的。(8)董天策、何旭: 《算法新聞的倫理審視》,《新聞界》2019年第1期,第27—33頁。理想狀態(tài)下,數(shù)據(jù)庫應(yīng)當是一個能夠為算法新聞的運行提供全面、客觀數(shù)據(jù)信息的完美“糧倉”。

      從新聞專業(yè)主義角度和對新聞?wù)鎸嵉目剂砍霭l(fā),“糧倉”的內(nèi)容物至少需保證兩個前提,即客觀性和基本價值原則,而這正與算法新聞數(shù)據(jù)搜集產(chǎn)生一定程度上的相悖。出于材料豐富性和全面性的考量,設(shè)計者往往設(shè)定模型挖掘海量數(shù)據(jù)。區(qū)別于傳統(tǒng)調(diào)查性新聞使用的抽樣方法,海量數(shù)據(jù)往往給人以“全面真實”的樣本假象。事實上,算法新聞運行過程中的海量數(shù)據(jù)基礎(chǔ)導(dǎo)致了兩大問題: 其一是數(shù)據(jù)信度核查難度大,其二是隱私數(shù)據(jù)的挖掘引發(fā)的倫理問題。

      首先,新聞機構(gòu)在利用算法生產(chǎn)新聞時往往是從第三方數(shù)據(jù)庫購買接入數(shù)據(jù)的使用資質(zhì),而第三方數(shù)據(jù)庫的數(shù)據(jù)獲取則有其自身不透明的數(shù)據(jù)來源和獲取方式,且不談數(shù)據(jù)源是否真實可靠,單是經(jīng)過了中間介質(zhì)傳輸和交易往來的數(shù)據(jù)就已使其可信度下降。另一方面,從模型架構(gòu)和算法技術(shù)層面而言,正如前文所述《美國新聞》在為全美大學(xué)進行“優(yōu)秀度”排名時遇到的問題一樣,模型抓取數(shù)據(jù)的選擇依然是由人決定的,而人的片面性及對數(shù)據(jù)的觀照盲點無法被算法自動糾正。

      當前,簡單的機器人寫作僅能夠處理結(jié)構(gòu)化數(shù)據(jù),如中國地震網(wǎng)在預(yù)測到地震信息后立刻發(fā)出新聞消息,再如國內(nèi)很多寫作機器人均可以流暢生產(chǎn)財經(jīng)和體育新聞,并自動對數(shù)據(jù)內(nèi)容進行糾錯。然而對于涉及深度報道、新聞核查的內(nèi)容,算法卻不具備強大的自動糾錯能力。而一旦未被糾錯的虛假信息被算法加工,再經(jīng)由媒介演繹、傳播、再釋,則將導(dǎo)致盲點謬誤的社會性強化。

      其次,在社交媒體賬號及內(nèi)容逐漸占據(jù)媒體內(nèi)容市場的今天,算法抓取的新聞數(shù)據(jù)或多或少將與個人隱私重疊交織。邊沁(Bentham)在18世紀提出圓形監(jiān)獄(panopticon)的理論概念,即全景式、敞視式的監(jiān)獄。(9)Michel Foucault, Discipline and Punish: The Birth of the Prison, New York: Vintage Books, 2012.在邊沁的論述中,圓形監(jiān)獄類似于一個中心有可向外看的瞭望塔、四周由環(huán)形建筑構(gòu)成的空間單位,環(huán)形建筑實為容納不同類別個體的囚房,囚徒之間由于囚房的隔斷具有一種橫向的“不可見性”,但處在瞭望塔內(nèi)的監(jiān)督者卻能夠借助環(huán)形建筑外側(cè)投入的光線,清楚地注視著每一間囚房內(nèi)的個體。

      邊沁提出的敞視式建筑結(jié)構(gòu)與算法新聞的數(shù)據(jù)挖掘機制存在一定程度的耦合: 瞭望塔與算法技術(shù)均可被理解為邊沁視域下“可見”但“無法確知”的權(quán)力。在算法新聞生產(chǎn)過程中,技術(shù)不斷試圖觸碰、透視個體數(shù)據(jù),個體用戶制造的諸如性別、年齡、當前位置、偏好設(shè)置、消費能力等數(shù)據(jù)均被觀看,而自身卻如同環(huán)形囚房內(nèi)的囚徒無法橫向觀看,遑論縱向透視算法權(quán)力。而算法新聞在挖掘數(shù)據(jù)時則等同于置身瞭望塔,能夠觀看一切,卻并未給外界觀看自己的機會。

      (二) 新聞生產(chǎn)及消費: 技術(shù)與人的“導(dǎo)向共謀”

      在特定的動機和不同利益目標的驅(qū)使下,算法技術(shù)、贊助方、技術(shù)人員、報道機構(gòu)等算法新聞相關(guān)主體在一定程度上共同引導(dǎo)了新聞導(dǎo)向,實現(xiàn)了人與技術(shù)的“導(dǎo)向共謀”?!肮仓\”的最為重要的促成因素是參與主體有著特定的動機追求,或為既定的利益千方百計地制造、引導(dǎo)輿論,或為娛樂消遣,或為制造轟動效應(yīng),或為誘導(dǎo)人們的消費行為。(10)匡文波: 《人工智能時代假新聞的“共謀”及其規(guī)避路徑》,《上海師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》2019年第48卷第4期,第104—112頁。

      眾多共謀之下的算法新聞中,假新聞是煽動社會情緒最為直接、成本最低的形式。事實上,假新聞長期以來一直被利益集團用來左右社會輿論。在數(shù)學(xué)科學(xué)家諾亞(Noah Giansiracusa)看來,諸如算法新聞等新技術(shù)和新媒體的興起,將信息博弈的風險推至人類社會有史以來最高的臨界水平。海量數(shù)據(jù)新聞影響下,現(xiàn)實世界與網(wǎng)絡(luò)世界的邊界正在被不斷消解,以算法為代表的技術(shù)平臺創(chuàng)造了“技術(shù)的軍備競賽”(a technological arms race),將假新聞的出現(xiàn)頻率、傳播速度、影響范圍推至高點。

      人工智能和機器學(xué)習(xí)的進步導(dǎo)致先進的數(shù)字篡改媒體類型的出現(xiàn),算法在大量的數(shù)據(jù)訓(xùn)練下也逐漸具備了篡改、操縱音頻、視頻、圖像、文本的技術(shù)路徑,即所謂的“深度造假”(Deepfake)。一些惡意生成的算法新聞中,主人公甚至以視頻形式表現(xiàn)了其本人從未做過的事情,而這項“業(yè)務(wù)”的技術(shù)門檻并不高,甚至往往以模型服務(wù)形式出現(xiàn)。比利時的一名社會民主黨派人士2018年5月在推特和臉書上發(fā)布了一段一分鐘的美國前總統(tǒng)特朗普(Donald Trump)講話的英語視頻,配有荷蘭語字幕。這段視頻的造假技術(shù)較為粗劣,主要是對特朗普的諷刺式二次創(chuàng)作,然而社交平臺用戶對于此視頻的海量調(diào)侃和評論使很多用戶以為這是真實的新聞視頻。而在2021年3月,緬甸一家軍方運營的電視臺播放了一段一名被拘留的前地區(qū)首席部長公開認罪的錄像。錄像中部長談及自己曾向昂山素季(Aung San Suu Kyi)行賄,并對政變的一些細節(jié)加以描述。這段視頻被軍方作為有罪證據(jù)公之于眾,但隨即招致了大量的駁斥聲音——由于聲音和視覺效果與一般視頻存在差異,人們認為這是由算法深度造假的煽動性新聞。

      深度造假部分地構(gòu)成了算法制造假新聞的證據(jù),另一方面,算法推薦也為假新聞的靶向傳播制造了通路。社交平臺推特(Twitter)在成立初期僅僅為新注冊用戶推薦可關(guān)注博主,而自2016年起推特就開始了平臺的內(nèi)容推薦。首先,推特通過創(chuàng)建機器學(xué)習(xí)算法來決定哪些內(nèi)容能夠更好地“提升用戶體驗”,個人用戶的關(guān)注列表、閱讀過的推文都將成為平臺算法學(xué)習(xí)的內(nèi)容。這一算法學(xué)習(xí)步驟看似無害,但當算法決定向用戶推薦何種內(nèi)容時,盲點、模型等技術(shù)的天然謬誤就可能被無限放大。社交媒體算法通常被設(shè)計成能夠最大限度提高用戶參與度的模型,因此如果一個有害的陰謀論,比如“2020年大選被操縱”等內(nèi)容有可能引發(fā)大量用戶參與討論,那么算法將挖掘這一內(nèi)容點并向大眾傳播更多錯誤信息,而這一模式不僅適用于推特,也適用于臉書的新聞動態(tài),以及社交媒體上的任何其他排名和推薦算法。(11)Noah Giansiracusa, How Algorithms Create and Prevent Fake News: Exploring the Impacts of Social Media, Deepfakes, GPT-3, and More, New York: Apress, 2021, p.76.算法治理按照社會行動網(wǎng)絡(luò)中的最有效、最便捷、最穩(wěn)定的原則安排了最佳的行動圖繪(Profifiling),(12)藍江: 《生命檔案化、算法治理和流眾——數(shù)字時代的生命政治》,《探索與爭鳴》2020年第9期,第105—114頁。而手握智能手機與媒介社會溝通的人們在技術(shù)腳本的演繹下,會認為一切內(nèi)容都是自己的選擇。

      如上所述,在當前的傳播環(huán)境下,新聞報道的素材、主體和傳播渠道正快速地向隱于事實背后的數(shù)據(jù)、傳感器、物聯(lián)網(wǎng)和采用了算法推送技術(shù)的互聯(lián)網(wǎng)平臺轉(zhuǎn)化,在這個過程中,擁有數(shù)據(jù)和傳感器的數(shù)量、物聯(lián)網(wǎng)和算法技術(shù)的成熟程度,以及平臺用戶的數(shù)量逐漸成為衡量傳播能力的新標準,同時算法爬取人們的媒介使用痕跡并以標簽化形式界定用戶行為,形成新聞內(nèi)容偏好的用戶擬象。從個體到群體,從群體到地區(qū)乃至國家,算法化的信息傳播逐漸占據(jù)人們的日常生活和傳播活動。從哲學(xué)層面出發(fā),算法新聞不過是“萬物皆數(shù)”哲學(xué)圖式的副產(chǎn)品,“萬物皆數(shù)”意欲追求超穩(wěn)定的世界和諧,其核心概念是模仿、再現(xiàn)與控制,而算法新聞的生產(chǎn)機制正是沿著這樣的框架運行的。(13)馮月季: 《反敘述: 算法新聞的符號哲學(xué)反思》,《編輯之友》2020年第1期,第74—78頁??梢哉f,算法新聞及其新聞?wù)鎸崋栴}已不僅僅是新聞專業(yè)主義框架下的探討議題,一定意義上構(gòu)成了部分的社會擬態(tài)。在社交平臺信息量劇增的后真相時代,傳統(tǒng)新聞專業(yè)主義面臨業(yè)務(wù)與倫理方面的雙重挑戰(zhàn),然而在數(shù)字新聞時代,算法語境下的新聞?wù)鎸嵱捎谙忍炀哂袛?shù)據(jù)盲點、歧視與弊端,在生產(chǎn)看似價值中立的“客觀”報道時,也在一定程度上消解著新聞?wù)鎸崱?/p>

      猜你喜歡
      算法模型
      一半模型
      p150Glued在帕金森病模型中的表達及分布
      重要模型『一線三等角』
      重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
      基于MapReduce的改進Eclat算法
      Travellng thg World Full—time for Rree
      進位加法的兩種算法
      算法初步兩點追蹤
      基于增強隨機搜索的OECI-ELM算法
      3D打印中的模型分割與打包
      夏邑县| 陆川县| 嘉峪关市| 华坪县| 武平县| 五常市| 永胜县| 馆陶县| 余庆县| 诏安县| 大理市| 龙江县| 子长县| 上饶市| 贵南县| 丰城市| 乌什县| 舒兰市| 利川市| 且末县| 庆阳市| 依兰县| 四平市| 营口市| 贵德县| 会理县| 读书| 太谷县| 呼和浩特市| 莱阳市| 来凤县| 尖扎县| 贵港市| 洛南县| 嘉义县| 碌曲县| 虞城县| 驻马店市| 巨野县| 乳山市| 长春市|