賦能與負(fù)能：新聞聚合平臺數(shù)字爬蟲技術(shù)的倫理危機與治理路徑

2023-01-24 09:08:25孫海榮趙志豪

傳媒論壇 2022年24期

孫海榮趙志豪

一、引言

大數(shù)據(jù)時代新聞聚合平臺的發(fā)展更多基于Python語言的“網(wǎng)絡(luò)爬蟲”技術(shù)。網(wǎng)絡(luò)爬蟲是一種用來自動瀏覽萬維網(wǎng)的網(wǎng)絡(luò)機器人，其使用針對性的方法對所需數(shù)據(jù)進(jìn)行高效的抓取，如面對動態(tài)加載的網(wǎng)頁，使用模擬發(fā)送請求或使用Selenium模擬用戶操作的方法抓取數(shù)據(jù)。［1］但為新聞聚合平臺提供“數(shù)據(jù)抓取”“數(shù)值分析”“算法推薦”的數(shù)字爬蟲技術(shù)的同時也帶來了一系列智能倫理危機。表面的客觀數(shù)據(jù)背后隱藏著偏見和歧視、精準(zhǔn)的智能推送背后隱藏著對公民隱私權(quán)和信息自由權(quán)的侵犯、大數(shù)據(jù)優(yōu)化的背后隱藏著數(shù)據(jù)利益的驅(qū)使和人文關(guān)懷的缺失等［2］，為用戶、社會以及新聞專業(yè)主義生態(tài)環(huán)境造成了一定的影響。本文將就數(shù)字爬蟲技術(shù)的使用為切入點，就數(shù)字爬蟲技術(shù)對新聞業(yè)的賦能與負(fù)能進(jìn)行具體闡述，并分別從法律、科技、平臺、機器行為學(xué)角度綜合提出治理路徑以針對新聞聚合平臺數(shù)字爬蟲技術(shù)所帶來的智能倫理危機。

二、賦能與負(fù)能：新聞聚合平臺數(shù)字爬蟲技術(shù)理論分析

法國哲學(xué)家貝爾納·斯蒂格勒所言“人的發(fā)明”蘊含兩層含義：一是說人發(fā)明了技術(shù)，二是說人是“被”發(fā)明的。［3］這里將人與技術(shù)規(guī)定為主體-客體之間的關(guān)系，突出了技術(shù)在人與技術(shù)之間的重要地位。從技術(shù)賦能角度來看，技術(shù)是一種“人之為人”思維下的實踐產(chǎn)物，在這一關(guān)系中，人是與技術(shù)不可分離、相互規(guī)定的技術(shù)存在物。人在發(fā)明創(chuàng)造技術(shù)的同時，技術(shù)實踐也在“創(chuàng)造”人，這就是客體改造與主體改造的相互統(tǒng)一。賈開等學(xué)者（2021）［4］從機器行為學(xué)視角出發(fā)將爬蟲技術(shù)視為嵌入社會環(huán)境并具有主體性的行動者，爬蟲技術(shù)作為行為主體與環(huán)境進(jìn)行主動交互，以社會環(huán)境中“人”的形態(tài)實現(xiàn)主體賦予其的動機并反過來促進(jìn)技術(shù)實踐與適應(yīng)環(huán)境本身。

數(shù)字爬蟲技術(shù)對新聞產(chǎn)業(yè)的生產(chǎn)工藝流程的優(yōu)化升級不僅在于對于微操細(xì)節(jié)的革新，關(guān)鍵在于對新聞產(chǎn)業(yè)生產(chǎn)工藝?yán)碚摰纳墶Ｒ郧岸?、終端、后臺操作流程為例，前端通過網(wǎng)頁抓取、版權(quán)媒體、聚合平臺孵化三個流程將產(chǎn)出內(nèi)容進(jìn)行查重、機器審核后發(fā)送至后臺。后臺通過人工審核進(jìn)行安全性審核與話題流量入口多寡后由內(nèi)容運營進(jìn)行對接，如原創(chuàng)欄目、資源開發(fā)。后臺通過算法推薦進(jìn)行內(nèi)容分發(fā)，將用戶自選擇的頻道置頂進(jìn)行干預(yù)、編輯置頂精選內(nèi)容。

但技術(shù)實踐并非是完全積極正面的，技術(shù)實踐所引發(fā)的倫理問題通常表現(xiàn)為技術(shù)發(fā)明或社會應(yīng)用問題，但其背后隱藏的則是倫理問題。韋伯區(qū)分“信念倫理”與“責(zé)任倫理”，強調(diào)技術(shù)實踐的責(zé)任倫理優(yōu)先。技術(shù)實踐首先要對技術(shù)行動后果負(fù)責(zé)，這是“責(zé)任倫理”優(yōu)先原則。從技術(shù)負(fù)能角度出發(fā)，由爬蟲技術(shù)所引發(fā)的倫理問題單從外部規(guī)制無法將其即將出現(xiàn)的技術(shù)風(fēng)險一并概括，此刻用以應(yīng)對一切技術(shù)風(fēng)險及技術(shù)代價的“信念倫理”與事后承責(zé)的“責(zé)任倫理”處于同等地位。并且技術(shù)與倫理道德的關(guān)系上，倫理道德并非是超越時空占據(jù)絕對統(tǒng)治地位的，技術(shù)帶給倫理更多的是“挑戰(zhàn)”而非“請教”。

數(shù)字爬蟲技術(shù)給新聞聚合平臺所帶來的倫理問題不僅對用戶本身造成了侵犯，同時也對整個新聞業(yè)的專業(yè)精神與專業(yè)理念進(jìn)行了重構(gòu)。從新聞聚合平臺的用戶角度出發(fā)，隱私侵犯、信息自決權(quán)受限以及信息繭房等問題體現(xiàn)了數(shù)字爬蟲技術(shù)對用戶個人的技術(shù)掌控，用戶個人新聞獲取處于技術(shù)牢籠之中。而在新聞業(yè)的專業(yè)精神與專業(yè)理念方面，技術(shù)與內(nèi)容之間的矛盾、新聞價值理念潛規(guī)則、行業(yè)產(chǎn)權(quán)糾紛等涉及新聞專業(yè)主義精神的倫理問題層出不窮。

三、賦能流程：新聞聚合平臺數(shù)字爬蟲技術(shù)的發(fā)展

根據(jù)艾媒網(wǎng)發(fā)布的中國新聞客戶端用戶規(guī)模統(tǒng)計數(shù)據(jù)，2021年中國新聞客戶端用戶約為9.23億人次。諸如“今日頭條”“一點資訊”“谷歌新聞”等深度新聞聚合平臺所采用的爬蟲技術(shù)結(jié)合新聞聚合平臺內(nèi)部的其他算法可以為數(shù)字新聞的“采、編、發(fā)”傳統(tǒng)流程帶來系統(tǒng)化的升級。而這種技術(shù)賦能也確實為用戶帶來了全新體驗，使新聞獲取以及新聞產(chǎn)出變得更加便捷與高效。

（一）新聞采集：數(shù)據(jù)抓取與中文切詞拓展新聞來源

新聞聚合平臺依托數(shù)字爬蟲技術(shù)的數(shù)據(jù)抓取以及中文切詞技術(shù)可以使使用者在短時間內(nèi)獲得海量文章的有關(guān)數(shù)據(jù)，對其進(jìn)行快速統(tǒng)計處理。而在人工智能的加持下，根據(jù)已有的參數(shù)變量在整個互聯(lián)網(wǎng)平臺進(jìn)行快速采集，大大拓展了新聞渠道來源，能夠在新聞發(fā)生的第一時間“快、準(zhǔn)、狠”地精準(zhǔn)推送。這極大地降低了新聞工作者的勞動強度，同時也使得新聞聚合平臺牢牢抓住用戶群體，用戶群體在整個環(huán)節(jié)中不僅是內(nèi)容產(chǎn)出者，同時也是內(nèi)容的傳播擴散者，更是維持新聞聚合平臺收益的核心群體。

（二）新聞編寫：智能寫作自主設(shè)置行文結(jié)構(gòu)

利用“爬蟲技術(shù)+算法”進(jìn)行新聞寫作可以為新聞聚合平臺實現(xiàn)每日發(fā)布數(shù)以萬計的海量新聞稿件，但不同的新聞內(nèi)容具有其不同風(fēng)格的要求、特色、格式和范式，新聞編寫是如何實現(xiàn)這一精準(zhǔn)化分配呢？可以利用爬蟲技術(shù)進(jìn)行參數(shù)設(shè)置，將已知統(tǒng)計過的各類高閱讀量標(biāo)簽化文本融入智能編輯中，幫助作者設(shè)置標(biāo)準(zhǔn)化標(biāo)題，從而規(guī)避不當(dāng)標(biāo)題和“標(biāo)題黨”的誕生，幫助記者更好的查漏補缺。另外，爬蟲技術(shù)通過爬取不同樣本的行文結(jié)構(gòu)特點，使得新聞產(chǎn)品可以契合各渠道的傳播方式，呈現(xiàn)新媒體、全媒體時代的新聞稿件篇章規(guī)則，幫助新聞更大范圍的傳播。寫作方面通過“人工+算法”相結(jié)合的方式，智能機器人根據(jù)算法設(shè)置的參數(shù)進(jìn)行文章初稿的生成與擬定，后續(xù)由內(nèi)容編輯進(jìn)行內(nèi)容審核及安全性審核，按不同自媒體成文方式進(jìn)行修改。但應(yīng)值得注意的是“爬蟲技術(shù)+算法”所產(chǎn)出的智能編輯并不能完全替代人工編輯，主要原因是算法在與環(huán)境的互動當(dāng)中會不斷自我進(jìn)化，而這種進(jìn)化多是依據(jù)已有的參數(shù)目標(biāo)進(jìn)行，很容易在非主觀的情況下產(chǎn)生新聞倫理失范行為，即算法歧視、缺乏人文關(guān)懷精神的新聞稿件。所以，當(dāng)下智能寫作機器人還是較多應(yīng)用于地震災(zāi)難新聞和財經(jīng)數(shù)據(jù)新聞，而面對社會民生類新聞當(dāng)下仍然是以智能寫作機器人輔助人工編輯為主。

（三）內(nèi)容審核：“內(nèi)容庫”和“表現(xiàn)形式”精準(zhǔn)化識別

傳統(tǒng)的新聞審核容易出現(xiàn)新聞來源審查難（非官方的新聞來源真假難以辨別）、新聞稿件數(shù)量大、人工成本較高、人工審核偏見（個人閱歷及價值觀的不同）等問題，導(dǎo)致傳統(tǒng)的新聞審核時長滯后于新聞發(fā)布。審核周期過長影響新聞發(fā)布的及時性，長此以往也會削弱傳統(tǒng)媒體的行業(yè)地位，導(dǎo)致其賴以生存的訂閱量逐步下降。在當(dāng)前大數(shù)據(jù)時代“爬蟲技術(shù)+算法”所形成的智能把關(guān)模式為新聞審核階段保駕護(hù)航，“內(nèi)容庫”和“表現(xiàn)形式”的審核機制可以高效率地篩選、攔截、撤回內(nèi)容有偏差的新聞稿件。新聞聚合平臺均有其專屬的“內(nèi)容庫”，在具體的新聞審核過程中，以內(nèi)容庫內(nèi)的主體、關(guān)鍵詞、關(guān)鍵數(shù)據(jù)等為主要依據(jù)，對待審查的新聞稿件相關(guān)內(nèi)容自動標(biāo)紅，將不符合內(nèi)容規(guī)范的新聞稿件撤回并重新發(fā)至發(fā)稿人處，提醒其問題所在并推薦重新編輯后再度上傳。而針對“表現(xiàn)形式”進(jìn)行新聞審核，主要在于判斷新聞稿件內(nèi)的照片、視頻、H5、超鏈接等是否符合其所投稿的新聞版塊及是否符合其新聞主題，若內(nèi)容違規(guī)或不符主題則同樣撤回。智能把關(guān)模式也會實時審核已發(fā)布稿件，針對違規(guī)的已發(fā)布稿件進(jìn)行自動撤回，保障新聞內(nèi)容的合法性和新聞聚合平臺的核心競爭力。

（四）新聞分發(fā)：適配用戶個人特征利用“Python+”推薦新聞

算法推薦新聞即利用“Python+算法工具”分析使用者個人用戶畫像從而將適配于各個用戶的不同新聞內(nèi)容進(jìn)行精準(zhǔn)分發(fā)，也可以理解為利用算法工具滿足不同用戶的個性化需求。算法推薦新聞這種新聞分發(fā)方式，極大地解放勞動力，使得新聞工作者可以專注于新聞生產(chǎn)的更多方面。算法推薦新聞的核心工具即爬蟲技術(shù)，該技術(shù)通過模擬人類行為，批量分析和處理大規(guī)模的新聞內(nèi)容數(shù)據(jù)?！敖袢疹^條”新聞聚合平臺作為國內(nèi)較為成熟的算法推薦新聞使用者，首先以爬蟲技術(shù)在互聯(lián)網(wǎng)中大量收集、分析數(shù)據(jù)，并以貼標(biāo)簽的形式將不同類型的新聞內(nèi)容進(jìn)行打包分類。隨后跟蹤用戶的平臺使用習(xí)慣如頁面停留時間、喜好領(lǐng)域、當(dāng)前定位所在地等信息對用戶形成一個基本的用戶畫像，將分類編排好的新聞內(nèi)容包按照用戶的個人畫像進(jìn)行個性化分發(fā)，滿足用戶需求。而其中較為隱私的信息如地點、性別、收入、學(xué)歷等個人身份特征信息通常平臺在收集時會對用戶進(jìn)行事先詢問，征求同意與否。

四、負(fù)能表現(xiàn)：數(shù)字爬蟲技術(shù)不當(dāng)使用下的倫理危機

技術(shù)倫理，即對技術(shù)行為進(jìn)行倫理導(dǎo)向，通過倫理干預(yù)，使技術(shù)活動在科技視角之外，更要考慮技術(shù)的目標(biāo)、手段及其后果的正當(dāng)性。以反爬蟲技術(shù)為例，針對過度數(shù)據(jù)挖掘或可能暴露用戶隱私數(shù)據(jù)的行為，編輯算法對爬取行為進(jìn)行反制，將數(shù)據(jù)挖取保持在一個合理的界限之內(nèi)。

諸如“今日頭條”“一點資訊”“財新APP”等多種不同類型的新聞聚合平臺，通過定位推送同城信息、根據(jù)個人喜好進(jìn)行個性化推送、用戶自選興趣領(lǐng)域等人性化功能，為人們的生活帶來了便利。但因新聞聚合平臺技術(shù)濫用所導(dǎo)致的問題層出不窮，不論是破壞行業(yè)格局還是捆綁脅迫收集用戶隱私，此類問題不僅涉及技術(shù)越界，更產(chǎn)生了法律糾紛。本文通過定性研究方式對數(shù)字爬蟲技術(shù)所導(dǎo)致的事件現(xiàn)象、社會行為及倫理問題進(jìn)行分析。

（一）市場糾紛：過度數(shù)據(jù)抓取影響行業(yè)生態(tài)

在數(shù)字經(jīng)濟時代，數(shù)據(jù)的互聯(lián)、共享不僅給平臺競爭賦入新的競爭優(yōu)勢，以此進(jìn)化出的新競爭優(yōu)勢更加便利于用戶的日常使用。而各個互聯(lián)網(wǎng)平臺之間的數(shù)據(jù)抓取主要依賴于算法的核心工具，即爬蟲技術(shù)。

但爬蟲技術(shù)的不正當(dāng)使用也帶來一系列違背行業(yè)規(guī)則更甚觸碰法律的行為?；ヂ?lián)網(wǎng)平臺內(nèi)有大量由用戶自主上傳生成的數(shù)據(jù)內(nèi)容，盡管“UGC”內(nèi)容權(quán)屬存在爭議［5］，但肆意抓取不但消耗個人用戶的創(chuàng)作熱情，并且對其他競品平臺在行業(yè)內(nèi)的地位也產(chǎn)生影響。通過抓取競品平臺公開、免費的數(shù)據(jù)資源從而鞏固自身利益，逐步替代原平臺在行業(yè)中的競爭優(yōu)勢，在行業(yè)中形成壟斷，這種“搭便車”的行為無疑破壞了行業(yè)生態(tài)，對其他平臺產(chǎn)生不正當(dāng)競爭。如此前深圳市中級人民法院審理的“酷米客”訴“車來了”案，“車來了”平臺通過爬取“酷米客”平臺上的公共交通數(shù)據(jù)資源轉(zhuǎn)為己用，是一種典型的搭便車行為，“酷米客”所投入的時間、人工、經(jīng)濟成本無法得到補償。需要注意的是，兩家平臺同擁有為用戶提供當(dāng)前公共交通定位實時查詢的功能，“車來了”的不正當(dāng)競爭行為損害了“酷米客”的商業(yè)利益，理應(yīng)做出相應(yīng)的賠償。

需要注意的是，當(dāng)爬取到其他平臺內(nèi)部尚未公開或已署名“獨家發(fā)布”的數(shù)據(jù)時，會進(jìn)一步產(chǎn)生產(chǎn)權(quán)糾紛，而不僅僅是不正當(dāng)競爭的問題。并且“Python+算法”生成的智能機器人根據(jù)互聯(lián)網(wǎng)資源所創(chuàng)作的新聞產(chǎn)品是否具有原創(chuàng)著作權(quán)？當(dāng)智能機器人所創(chuàng)作的新聞產(chǎn)品被他人盜用時是否觸犯了智能機器人的著作權(quán)？又或當(dāng)其他平臺的智能機器人剽竊了同競品平臺的智能機器人作品時該如何定義此類案件的侵權(quán)行為？這些問題也亟待解決。

（二）階層固化：算法推薦新聞限制用戶自身視野

信息時代下的信息差決定著經(jīng)濟差，而算法推薦新聞在無形中限制人的視野的同時也在鞏固著社會階級關(guān)系，精英階層與社會底層可以接收到的信息在數(shù)字時代不但沒有縮小彼此之間的數(shù)字鴻溝，反而加大了兩個階層之間的差距。以新聞聚合平臺為例，當(dāng)用戶打開新聞聚合平臺時，第一眼在首頁中所看到的即是與自己興趣相關(guān)或者當(dāng)前定位相關(guān)的新聞內(nèi)容，這種內(nèi)容選擇性呈現(xiàn)方式表面看似幫助用戶節(jié)省時間且內(nèi)容種類多樣，但實際上用戶所接受到的由算法推薦的新聞多是算法通過識別用戶畫像進(jìn)而將分類打包好的新聞內(nèi)容投送至用戶處。這種默默無聞的新聞推送方式表面看似便捷多元化，但實際逐漸限制了用戶視野。大多數(shù)用戶都會遭遇到一類情形，即在某新聞平臺長期使用后，其用戶特征已被平臺算法進(jìn)行精準(zhǔn)定位很難在除了自身主動搜索訊息以外的情況下獲得不同層面的新聞內(nèi)容。而想要修改已生成的用戶畫像已十分困難，在面對已不感興趣卻頻繁接受推送的新聞內(nèi)容時，用戶難免產(chǎn)生放棄平臺或麻木的心態(tài)。

產(chǎn)生此類現(xiàn)象的主要原因在于，精英階層有著足夠的經(jīng)濟儲備量和廣泛的社交范圍，其群體不需要僅僅通過社交媒體或新聞聚合平臺來獲取最新的信息。算法推薦可以限制其網(wǎng)絡(luò)上的視野，但在實際生活當(dāng)中精英階層有著更多的信息來源渠道，以及足夠的金錢去支撐他們接觸新的視野和培養(yǎng)新的愛好。但針對于底層人民而言，缺乏時間、金錢與高壓力是此類人群的主要特征，該群體的日常消磨時間方式多放在了社交媒體或新聞聚合平臺上。但隨著算法與環(huán)境不斷互動形成其個人用戶畫像后，該類群體僅剩的拓展知識層面與個人視野的渠道也被限制。這樣的算法控制會逐漸拉大精英階層與底層之間的知識鴻溝與經(jīng)濟差，無法實現(xiàn)階級越遷的底層人民會被固化在自己所固有的社會地位里，久而久之這種情形對社會結(jié)構(gòu)的穩(wěn)定會產(chǎn)生一定的影響。

（三）隱私侵犯：Python算法黑箱下的實時監(jiān)控

基于爬蟲技術(shù)算法“黑箱”的存在，用戶隱私侵犯問題使用戶感到焦慮。［6］算法“黑箱”是指算法內(nèi)部運行機制過于復(fù)雜，以至于算法推薦新聞過程能夠使用算法卻無法具體了解算法編程的內(nèi)容和結(jié)構(gòu)的現(xiàn)象。［7］算法黑箱的實時監(jiān)控下，用戶個人如同“衣不遮體”般暴露在互聯(lián)網(wǎng)平臺面前，導(dǎo)致用戶雖知算法監(jiān)控的存在但卻又無可奈何。

很多新聞聚合平臺利用自身功能的必需性來對使用者隱私進(jìn)行捆綁威脅，若使用者未同意平臺所給予的條款則會被限制使用其產(chǎn)品的部分功能。這種算法權(quán)利的越位對使用者產(chǎn)生了很大的影響，大多使用者并不是不愿意公布自身的隱私，而是害怕隱私上交之后能否被合理保護(hù)以及被索取隱私的目的是為何，這些問題都是需要算法權(quán)利的掌控者所需要回答的。2021年5月，國家網(wǎng)信辦曾通報百度等105款A(yù)PP侵犯用戶個人隱私的現(xiàn)象。這些APP均存在未經(jīng)用戶同意收集使用個人信息以及未按法律更正個人信息等問題，搜狗輸入法、訊飛輸入法、QQ輸入法等市場份額較高的輸入法也包含在內(nèi)，可見問題之普遍。

（四）主體模糊：技術(shù)人員由幕后走進(jìn)臺前，承責(zé)主體模糊

在當(dāng)前智能技術(shù)時代，技術(shù)人員以技術(shù)開發(fā)者、平臺運營者等身份由幕后走上了臺前，承責(zé)主體劃分標(biāo)準(zhǔn)主要以與算法倫理問題之間的關(guān)系密切程度進(jìn)行劃分。技術(shù)開發(fā)者作為算法的創(chuàng)造者理應(yīng)成為承責(zé)主體之一，平臺運營者通常承擔(dān)算法目的規(guī)劃師的職責(zé)也被包含于承責(zé)主體之一，平臺本身作為算法最大的受益方則也作為承責(zé)主體之一。將技術(shù)開發(fā)者、平臺運營者、平臺本身作為承責(zé)主體同樣囊括于新聞傳播倫理規(guī)范中，這對新聞倫理失范問題進(jìn)行責(zé)任主體問責(zé)產(chǎn)生了一定的阻礙，究其原因在于難以判斷失責(zé)主體是否主觀所為。在傳統(tǒng)的新聞傳播活動中，“采、編、發(fā)”新聞生產(chǎn)流程多是以人工為主、機器為輔的方式進(jìn)行。當(dāng)某一環(huán)節(jié)出現(xiàn)問題時，便可以按照內(nèi)部管理機制進(jìn)行主要責(zé)任人的問責(zé)，整體流程清晰而迅速。但在當(dāng)下智能時代，由算法產(chǎn)生的新聞倫理問題通常會以兩種形式出現(xiàn)，即主觀與非主觀。

算法產(chǎn)生倫理問題時，主觀情況下則多與算法開發(fā)的技術(shù)人員有關(guān)。其中涉及技術(shù)人員的新聞道德、個人主觀、經(jīng)濟效益等多種因素。但如何判定算法主觀失誤是一個沒有界限的問題，因為在當(dāng)前的“弱智能”時代，算法多是作為一種工具而非獨立個體，即算法只具備與環(huán)境之間的互動進(jìn)化而不具備自我意識，所以算法的純主觀失誤很難出現(xiàn)。

而當(dāng)算法出現(xiàn)非主觀失誤時，其問責(zé)對象則變得比較模糊。首先，算法由技術(shù)人員開發(fā)而成，而這之中必然包含了算法開發(fā)人員自身不可避免的立場與偏見，在算法的不斷使用過程中這種偏見會以“技術(shù)中立”的形象推送至用戶面前。其次，互聯(lián)網(wǎng)平臺同樣也具有其經(jīng)營目標(biāo)，這一目標(biāo)同樣會施壓于技術(shù)開發(fā)人員從而成為算法的一部分。所以在具體承責(zé)方面具有主體模糊以及主次不分的問題。

現(xiàn)有的法律框架難以對此類新聞倫理失范問題進(jìn)行責(zé)任主體問責(zé)。主要原因在于：第一，在技術(shù)合理使用制度條件下，哪種技術(shù)的使用是符合超規(guī)格使用例外的，而且如何判定算法的主觀與非主觀失誤；第二，技術(shù)開發(fā)人員缺乏一定的新聞倫理常識，多是按照平臺所給予的規(guī)定進(jìn)行算法設(shè)計。而平臺也有自身生存下去的經(jīng)營目標(biāo)，法律適用時在平臺生存與新聞倫理尊嚴(yán)之間難以抉擇，所以針對智能新聞倫理案件時的責(zé)任主體定責(zé)相對模糊。

五、治理路徑：新聞聚合平臺數(shù)字爬蟲技術(shù)倫理危機的應(yīng)對方案

新聞聚合平臺的技術(shù)濫用產(chǎn)生的技術(shù)倫理危機對行業(yè)生態(tài)、新聞倫理、傳媒結(jié)構(gòu)等形成了一系列負(fù)能影響，為應(yīng)對此趨勢理探討一種有效的治理路徑。從技術(shù)倫理的控制目標(biāo)來說，技術(shù)倫理并非要限制技術(shù)的發(fā)展，而是要使作為人類行為產(chǎn)物的技術(shù)活動，在人類社會倫理范疇內(nèi)運行。為此，盛國榮（2010）［8］提出，對技術(shù)倫理的控制必須充分考慮以下幾個命題：一是科技方法可能改變了人類的環(huán)境以及傳統(tǒng)倫理觀念在世界中的適用性，這種適用性需要技術(shù)倫理的跟蹤；二是涉及人們對技術(shù)破壞倫理的思考路徑問題；三是涉及人們對自然的倫理關(guān)系的認(rèn)識問題；四是涉及人們的新倫理建構(gòu)問題，即新的倫理產(chǎn)生之后如何建立起一套新的倫理原則和標(biāo)準(zhǔn)。理應(yīng)從不同角度出發(fā)思考對技術(shù)倫理的控制，在原有的倫理結(jié)構(gòu)基礎(chǔ)上進(jìn)行破局再建構(gòu)，新聞聚合平臺所產(chǎn)生的智能倫理問題不僅要從現(xiàn)有的法律、人文角度出發(fā)，也要主動探索新的技術(shù)治理路徑和治理理念，平衡現(xiàn)有主體與新入主體之間的利益流動，從而推動新聞聚合平臺的健康發(fā)展。

（一）法律角度：建立新聞出版者鄰接權(quán)，維護(hù)行業(yè)生態(tài)

當(dāng)前，我國針對新聞出版者保護(hù)以及應(yīng)對新聞聚合平臺民事糾紛所采用的法律框架為《著作權(quán)法》和《不正當(dāng)競爭法》，但二者之間的缺陷也極其明顯。2018年歐盟正式通過《數(shù)字化單一市場版權(quán)指令》法案，該法案中最具爭議性的一點即在于互聯(lián)網(wǎng)平臺通過以摘要或鏈接的形式轉(zhuǎn)載其他媒體平臺的內(nèi)容時需不需要支付一定的費用。這對于探討我國新聞出版者鄰接權(quán)問題具有很大的啟示作用。

在新聞聚合平臺民事糾紛案件中，爬蟲技術(shù)所涉及的新聞作品與新聞出版者數(shù)量繁多，眾多被侵權(quán)方需一一佐證其對作品享有著作權(quán)，這使維權(quán)方的維權(quán)成本陡然升高，維權(quán)方成為了被“為難”的一方。結(jié)合我國國情創(chuàng)建新聞出版者鄰接權(quán)主要要義在于加強新聞著作權(quán)的內(nèi)容保護(hù)，保障新聞出版者的合法權(quán)利，以維護(hù)新聞專業(yè)權(quán)威。可將新聞出版者鄰接權(quán)解釋為“保護(hù)新聞出版者的腦力勞動，新聞作品蘊含了新聞出版者的人工成本、時間成本，如果被他人免費使用則會降低新聞出版者的生產(chǎn)積極性，不利于新聞領(lǐng)域的發(fā)展”（辜凌云2019）。這一權(quán)利在當(dāng)前智能時代適用，可以為那些不具備“獨創(chuàng)性”的作品提供有力保障，保護(hù)新聞出版者的合法知識勞動。

《不正當(dāng)競爭法》則是一種兜底性的法律保護(hù)措施，具有事后調(diào)整、個案調(diào)整以及證明責(zé)任較重的缺點。具體體現(xiàn)在信息平臺之間的“搭便車”行為，如一些網(wǎng)站在不經(jīng)允許的情況下擅自將其他信息平臺的數(shù)據(jù)進(jìn)行數(shù)字化處理推送給自家網(wǎng)站的用戶。或以“貼摘要”“掛鏈接”的形式表面指明數(shù)據(jù)的從屬方，但實際所摘取的信息已滿足自身網(wǎng)站用戶需求而導(dǎo)致數(shù)據(jù)從屬方丟失大量點擊率、廣告商以及用戶量，造成行業(yè)之間的不正當(dāng)競爭。而新聞出版鄰接權(quán)可以有效防止新聞聚合平臺的肆意“搭便車”行為，法令中對“鏈接行為”有著明確的要求，即使用鏈接方需獲得被鏈接方的許可并支付一定的費用，使得新聞工作者的知識產(chǎn)品獲得了有效保障，避免傳統(tǒng)媒體行業(yè)淪為互聯(lián)網(wǎng)平臺內(nèi)容制造機的尷尬局面。同時也為傳統(tǒng)媒體行業(yè)提供新的生存路徑，即發(fā)展高質(zhì)量的新聞內(nèi)容作品，形成內(nèi)容為王的核心品牌價值，實現(xiàn)內(nèi)容變現(xiàn)。

（二）科技角度：平臺創(chuàng)新算法運作方式，提防算法的隱私侵犯

當(dāng)前我們?nèi)蕴幱凇叭跞斯ぶ悄軙r代”，算法的智能化水平比較有限，但算法作為一個擁有極大發(fā)展?jié)摿Φ男屡d技術(shù)，其對人類產(chǎn)生愈發(fā)強烈的影響，無疑是一種時代趨勢。在對算法技術(shù)的規(guī)制中，多元主體的協(xié)同并進(jìn)是必不可少的?！秶鴦?wù)院關(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》提出，要建立健全公開透明的人工智能監(jiān)督管理體系，實現(xiàn)對智能算法的全過程監(jiān)管。尤其是算法開發(fā)平臺作為算法技術(shù)的主體擁有者，其在算法技術(shù)治理環(huán)節(jié)中占有絕對地位，而平臺在此環(huán)節(jié)中所要履行的則是其技術(shù)職責(zé)。從技術(shù)緯度出發(fā)，以算法監(jiān)督算法是一種有效應(yīng)對算法倫理問題的解決辦法。［9］

首先，建立健全算法風(fēng)險預(yù)防機制［10］，即技術(shù)開發(fā)人員通過設(shè)定具備治理算法功能的算法機制實時監(jiān)控日常平臺系統(tǒng)的運行。當(dāng)算法運行出現(xiàn)失誤時由系統(tǒng)自動進(jìn)行矯正，將算法恢復(fù)初識默認(rèn)值進(jìn)行重新循環(huán)。其次，算法開發(fā)人員可以將自己的源代碼進(jìn)行開源式設(shè)計，邀請代表用戶參與整體算法的設(shè)計，這樣既能滿足大部分使用者需求，也可令算法開發(fā)過程透明、公開，使使用者了解算法開發(fā)的意圖、用法。最后，可以采用智能芯片植入的方式令智能機器人獲得相關(guān)的新聞倫理與底線思維，雖然智能新聞倫理失范并非硬性法則便可治理一切問題，但通過智能芯片的植入可以對大部分新聞聚合平臺侵權(quán)糾紛進(jìn)行預(yù)防，當(dāng)智能識別此行為可能違反芯片內(nèi)所包含的硬性規(guī)則，算法則會進(jìn)行自我矯正。

（三）機器行為學(xué)角度：構(gòu)建風(fēng)險評估框架，發(fā)展風(fēng)險管理工具

“機器行為學(xué)”中的“機器”并不單單指工廠內(nèi)部的生產(chǎn)設(shè)備亦或是具有實體形態(tài)的生產(chǎn)機器，其所指的是所有具有工具屬性的人造物或人造物構(gòu)成的人工現(xiàn)象。算法在當(dāng)前智能時代作為一種人造工具，其具有與實體環(huán)境之間不斷交互進(jìn)化的屬性，這種被環(huán)境改變的屬性則被稱為“權(quán)變性”。而算法不會完全融合于“權(quán)變性”的必然性，所以將算法看作機器的角度進(jìn)行行為分析有利于囊括盡可能多的風(fēng)險因素，對當(dāng)前的算法治理原則進(jìn)行修改。

當(dāng)前算法風(fēng)險治理缺乏一種整體的理論框架為指導(dǎo)，不能針對算法各個風(fēng)險因素產(chǎn)生很好的關(guān)聯(lián)性從而建構(gòu)風(fēng)險治理框架。從機器行為學(xué)的角度理解算法可以從觸發(fā)、開發(fā)、功能和進(jìn)化四個角度入手，以一個算法生命周期為基準(zhǔn)構(gòu)建新的算法治理理論框架。從觸發(fā)、開發(fā)、功能和進(jìn)化等不同環(huán)節(jié)入手，分析每一環(huán)節(jié)中風(fēng)險因素的關(guān)聯(lián)性，可以為風(fēng)險治理框架提供依據(jù)，更多角度的為算法治理制度創(chuàng)新提供可能。

過去傳統(tǒng)算法治理策略中多將“算法”看作為單獨的技術(shù)個體而拎出來單獨研究，形成了“頭痛醫(yī)頭，腳痛醫(yī)腳”的片面監(jiān)管方式。而機器行為學(xué)則更多從“技術(shù)-環(huán)境”“技術(shù)-個體”的視角進(jìn)行問題研究，更加方便針對算法自身進(jìn)化而導(dǎo)致的一系列倫理問題。如算法推薦引擎在給用戶推薦新聞的同時，也在通過篩選點擊率、頁面停留時間等客觀指標(biāo)不斷優(yōu)化操作指令。當(dāng)人們在搜索“白人”時所關(guān)聯(lián)的內(nèi)容較為中性，而在搜索“黑人”時則會更多與犯罪有所關(guān)聯(lián)。這并非算法本身技術(shù)設(shè)定的算法歧視，而是在與環(huán)境的交互中衍生出來的。所以算法治理的范疇?wèi)?yīng)進(jìn)一步擴大，以更全面地囊括可能發(fā)生治理風(fēng)險的因素。

總的來說，若從“機器行為學(xué)”角度出發(fā)探討算法治理框架，前者是從算法生命周期著手，從觸發(fā)、開發(fā)、功能、進(jìn)化四個議題展開；而后者則更多從“算法-群體”“算法-環(huán)境”等人機混合層面?；诖丝蚣芪覀兗瓤梢詫Ξ?dāng)前眾多的算法治理原則或規(guī)范進(jìn)行評估以明確其遺漏所在，同時也可以對不同利益相關(guān)體的不同偏好作出對應(yīng)分析，以更好理解各方的優(yōu)勢與不足。

（四）平臺管理角度：建議嚴(yán)格懲罰細(xì)則，分清承責(zé)主體次序

當(dāng)前所存在的一個問題是，企業(yè)內(nèi)部承責(zé)制度不明晰，未能很好地將法律制度、技術(shù)治理、行業(yè)規(guī)范融合進(jìn)企業(yè)內(nèi)部條例，使得平臺治理方在處理企業(yè)內(nèi)部出現(xiàn)的智能倫理問題時所采用的方式較為滯后。

2021年9月15日，國家互聯(lián)網(wǎng)信息辦公室發(fā)布《關(guān)于進(jìn)一步壓實網(wǎng)站平臺信息內(nèi)容主體責(zé)任的意見》，旨在充分發(fā)揮網(wǎng)站平臺信息內(nèi)容管理第一責(zé)任人作用，引導(dǎo)推動網(wǎng)站平臺準(zhǔn)確把握主體責(zé)任。新聞聚合平臺應(yīng)將外部規(guī)制與內(nèi)部規(guī)制雙結(jié)合，以政策、法律、行規(guī)作為外因，以效益、價值觀作為內(nèi)因?qū)φw企業(yè)承責(zé)制度進(jìn)行嚴(yán)格化重建。

具體可以體現(xiàn)：首先，建立由層級逐漸向下延伸的懲罰辦法，通過層級管理的方式進(jìn)行命令下達(dá)與審核，從源頭杜絕可能產(chǎn)生新聞倫理問題的一切風(fēng)險，并將法律制度與公司條例相結(jié)合，涉及法律底線的行為將會直接移送司法處理；其次，由部門審核指定既具有新聞專業(yè)知識又具備技術(shù)開發(fā)的人員來進(jìn)行關(guān)前和關(guān)后的審核工作，做到以技術(shù)治理技術(shù)。內(nèi)部規(guī)則將代碼問題與員工個人效益直接掛鉤，既可以杜絕社會效益讓位于經(jīng)濟效益的問題，也在一定程度上實現(xiàn)了企業(yè)內(nèi)部的自控能力與社會責(zé)任承擔(dān)功能。

六、結(jié)語

技術(shù)本身無所謂對錯，主要在于技術(shù)的使用者以及技術(shù)的使用程度。在當(dāng)前的“技術(shù)大航?！睍r代，互聯(lián)網(wǎng)平臺已經(jīng)成為信息社會的重要基礎(chǔ)設(shè)施，并逐步滲透到現(xiàn)行的社會運行與制度制定中。作為網(wǎng)民獲取信息的社會公器，新聞聚合平臺理應(yīng)承擔(dān)起應(yīng)有的社會責(zé)任，形成自身中立、獨立、高質(zhì)、高效的品牌價值。但隨著資本的注入與技術(shù)的濫用，新聞聚合平臺逐漸模糊自身定位，在社會公器與私人商域之間搖擺不定。

新聞聚合平臺應(yīng)時刻牢記自身“公共性”的內(nèi)涵，要承擔(dān)起社會公器所應(yīng)該承擔(dān)的責(zé)任，與傳統(tǒng)媒體相互協(xié)作，做好優(yōu)質(zhì)新聞作品的傳聲筒以及利用自身高效的連接性維護(hù)新聞行業(yè)的生態(tài)穩(wěn)定。充分利用自身的技術(shù)優(yōu)勢，做好數(shù)字新聞版權(quán)保護(hù)和優(yōu)質(zhì)原創(chuàng)內(nèi)容的產(chǎn)出，保證優(yōu)質(zhì)新聞內(nèi)容的流通，打破社會輿論結(jié)構(gòu)的圈層化現(xiàn)象。開拓數(shù)字新聞新局面的同時，也理應(yīng)注意到新聞聚合平臺的生存來源在于商業(yè)收益，不能過分追求其承擔(dān)社會責(zé)任而損害了新聞聚合平臺的商業(yè)利益，那么如何平衡好商業(yè)私域與價值公器成為未來需要探討的一個問題。

針對新聞聚合平臺的技術(shù)治理是一個多元主體多維度共同任務(wù)，需要平臺、法律、行政、用戶等多主體的相互協(xié)作。在未來的實際操作中，不能傳統(tǒng)的將技術(shù)視作為單一個體，而要從宏觀的角度將其與環(huán)境、群體聯(lián)系起來，視為一個具有生命、可自我進(jìn)化的人工技術(shù)，只有在這種視野下建構(gòu)的技術(shù)治理理論框架才能承擔(dān)并抵御更多可能性因素的風(fēng)險。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

賦能與負(fù)能：新聞聚合平臺數(shù)字爬蟲技術(shù)的倫理危機與治理路徑

一、引言

二、賦能與負(fù)能：新聞聚合平臺數(shù)字爬蟲技術(shù)理論分析