胡佩
關(guān)鍵詞:數(shù)據(jù)新聞;數(shù)據(jù)采集;倫理問題;應對策略
隨著信息的快速發(fā)展,大數(shù)據(jù)也隨之出現(xiàn),在大數(shù)據(jù)背景之下,數(shù)據(jù)新聞的所采集的數(shù)據(jù)量已經(jīng)遠遠不只是幾個數(shù)據(jù)庫或者是若干個圖表這么簡單,而是基于社交網(wǎng)絡和移動互聯(lián)網(wǎng)終端的海量信息采集[1]。在此情況下,在數(shù)據(jù)新聞生產(chǎn)與制作過程中,對于數(shù)據(jù)新聞中過的數(shù)據(jù)采集來說,也面臨著數(shù)據(jù)采集來源的片面性、對用戶數(shù)據(jù)隱私的失范、數(shù)據(jù)新聞從業(yè)者的數(shù)據(jù)采集技能不足等問題。
依據(jù)數(shù)據(jù)新聞中數(shù)據(jù)的來源進行分類,數(shù)據(jù)新聞可以分成自我采集數(shù)據(jù)型和現(xiàn)有數(shù)據(jù)再利用型 [2]。由于自我采集型數(shù)據(jù)對新聞從業(yè)人員素質(zhì)的要求和投入的時間、資金較高,因而帶來了一定的操作風險,所以自我采集型的數(shù)據(jù)新聞在目前媒體的數(shù)據(jù)新聞實踐中所占的比例并不高。但在使用頻率較高的現(xiàn)有數(shù)據(jù)再利用型的數(shù)據(jù)采集中,由于部分數(shù)據(jù)的采集屬于二手數(shù)據(jù),而非原創(chuàng)的一手數(shù)據(jù),其數(shù)據(jù)的真實性、權(quán)威性、可信度是數(shù)據(jù)采集者需要注意的。在如今大數(shù)據(jù)背景下,信息的存儲以及挖掘方式多種多樣,數(shù)據(jù)新聞中的數(shù)據(jù)采集也面臨著困境。
(一)數(shù)據(jù)采集中的“數(shù)據(jù)片面化”
從數(shù)據(jù)采集量上來說,數(shù)據(jù)新聞所采集的數(shù)據(jù)量已經(jīng)遠遠不只是幾個數(shù)據(jù)庫或者是若干個圖表這么簡單,而是基于社交網(wǎng)絡和移動互聯(lián)網(wǎng)終端的海量信息采集在數(shù)據(jù)新聞中,數(shù)據(jù)來源的局限性會直接導致新聞報道的片面化,甚至是虛假新聞。造成數(shù)據(jù)來源局限性的原因除了數(shù)據(jù)開放程度不夠以及受眾參與眾包新聞的積極性不高等外部因素之外,內(nèi)部因素更不容忽視。
數(shù)據(jù)來源的單一化。新聞媒體以及新聞從業(yè)者為了控制人力、時間和資金成本,會傾向于選擇數(shù)據(jù)易得的采集渠道,比如開放數(shù)據(jù)以及官方數(shù)據(jù),而舍棄自我采集型數(shù)據(jù)、調(diào)查泄漏數(shù)據(jù)等方式。這就很容易造成數(shù)據(jù)來源較為單一,數(shù)據(jù)新聞的內(nèi)容也由此受到一定的影響。
假設數(shù)據(jù)新聞的數(shù)據(jù)來源只有企業(yè)的數(shù)據(jù),或者是說只有官方的數(shù)據(jù),那么該數(shù)據(jù)新聞一定是站在企業(yè)或者官方的立場上所得出來的結(jié)論,新聞的真實性就有待考究。那如果數(shù)據(jù)新聞作品中既有官方的數(shù)據(jù)又有企業(yè)的數(shù)據(jù)也有眾包數(shù)據(jù),那么這個新聞作品的數(shù)據(jù)來源就更加全面,更足以支撐數(shù)據(jù)新聞的可信度。
數(shù)據(jù)采集技能缺失。數(shù)據(jù)新聞記者的數(shù)據(jù)采集的技能缺失體現(xiàn)在搜集數(shù)據(jù)素養(yǎng)的不足,在數(shù)據(jù)采集過程中只采取了報道的數(shù)據(jù)而沒有對數(shù)據(jù)進行分析。同時,在大數(shù)據(jù)時代下,許多新聞從業(yè)者存在大數(shù)據(jù)至上的思維,認為跑新聞現(xiàn)場耗時耗力,因此基于大數(shù)據(jù)時代,單純的從網(wǎng)上搜集報告、抓取數(shù)據(jù)。這就容易導致數(shù)據(jù)新聞的片面性,從而造成數(shù)據(jù)新聞的權(quán)威性和可靠性的弱化。
數(shù)據(jù)源的模糊描述。學者方潔通過對新華網(wǎng)《數(shù)據(jù)折聞》、搜狐網(wǎng)《數(shù)字之道》、網(wǎng)易《數(shù)讀》、財新《數(shù)字說》和澎湃新聞《美數(shù)課》等五個國內(nèi)知名數(shù)據(jù)新聞欄目的定量研究,發(fā)現(xiàn)在總體樣本中,除了7.4%的數(shù)據(jù)新聞沒有對數(shù)據(jù)來源進行描述以外,尚有73.0%的樣本描述模糊,這個數(shù)據(jù)遠遠超過描述清晰的19.6%。
例如,新華網(wǎng)報道的數(shù)據(jù)新聞——唐詩宋詞系列,在該作品的最后,僅僅通過列舉三處來說明數(shù)據(jù)來源,沒有具體指明新聞中的數(shù)據(jù)采集分別來源于這三處中的哪一個地方,數(shù)據(jù)來源描述得十分模糊。在《衛(wèi)報》——中國經(jīng)濟放緩如何影響世界其他國家,在這則數(shù)據(jù)新聞報道中,一個較為明顯的問題是對數(shù)據(jù)來源的交代不夠清晰,僅僅只是在末尾列出了數(shù)據(jù)來源分別是聯(lián)合國商品貿(mào)易數(shù)據(jù)庫、中國海關(guān)總署和世界銀行的統(tǒng)計數(shù)據(jù),但并未詳細標注相應的數(shù)據(jù)文件名或相關(guān)鏈接,淡化了數(shù)據(jù)獲取的途徑與方式,只是對“結(jié)果”的簡單呈現(xiàn),因此讀者無法查驗其數(shù)據(jù)來源是否真實可靠。
(二)數(shù)據(jù)采集中的“數(shù)據(jù)竊取”
我國目前信息公開制度尚不健全,隱私權(quán)的保護特別是信息時代隱私權(quán)的保護存在很大漏洞。而中國鐵道部官網(wǎng)就曾因用戶數(shù)據(jù)泄露而給人們帶來麻煩,而泄露的信息是否存在隱藏的威脅尚未可知。[3]個人數(shù)據(jù)利用中的隱私侵犯是數(shù)據(jù)新聞生產(chǎn)面臨的現(xiàn)實問題,因為在數(shù)據(jù)開放和數(shù)據(jù)新聞生產(chǎn)實踐中存在隱私權(quán)與表達自由、個人數(shù)據(jù)保護與數(shù)據(jù)新聞報道的矛盾[4]。當下隱私保護法以個人為中心的思想:數(shù)據(jù)收集者必須告知個人,他們收集了哪些數(shù)據(jù)、作何用途,也必須在收集工作開始之前征得個人的同意。[5]雖然這不是生產(chǎn)數(shù)據(jù)新聞過程中合法采集數(shù)據(jù)的唯一方式,但“告知與許可”這一共識性基礎已經(jīng)是世界各地都在執(zhí)行的隱私政策。但是,隨著杜交媒體的發(fā)展,數(shù)據(jù)集越來越大,在使用數(shù)據(jù)時獲得每個人的知情同意是不可能的,很難保證載據(jù)對象的自主原則。
大數(shù)據(jù)時代,數(shù)據(jù)的價值不再單純來源于它的基本用途,而更多源于它的二次利用和N次利用,因此,將隱私權(quán)的保護責任從民眾轉(zhuǎn)移到數(shù)據(jù)使用者,這就會出現(xiàn)數(shù)據(jù)初始采集目的與數(shù)據(jù)使用目的不相容的問題,即使數(shù)據(jù)采集時已獲得載據(jù)對象的知情同意,新聞記者編輯在新聞生產(chǎn)中對數(shù)據(jù)的循環(huán)利用也很難每次都做到“告知與許可”。
在現(xiàn)如今“告知與許可”已經(jīng)失效的大數(shù)據(jù)時代下,新聞傳播專業(yè)還沒有采取有效措施,使得數(shù)據(jù)使用與載據(jù)對象隱私保護之間達到干衡。因此,在大數(shù)據(jù)時代下,數(shù)據(jù)新聞既要做到數(shù)據(jù)公開,以此來獲取所需的新聞來源和必要的新聞數(shù)據(jù)支撐,又需要對受眾提供的數(shù)據(jù)負責,尤其是保護受眾的隱私權(quán)。
大數(shù)據(jù)時代背景下,對于數(shù)據(jù)新聞中的數(shù)據(jù)采集,無論是自我采集型還是現(xiàn)有數(shù)據(jù)再利用型,在政府完善數(shù)據(jù)隱私監(jiān)管及法律法規(guī)的約束下,最重要的還是數(shù)據(jù)新聞記者作為數(shù)據(jù)采集人員自主承擔責任,應遵循以下幾個原則:
(一)數(shù)據(jù)來源多樣化原則
數(shù)據(jù)作為數(shù)據(jù)新聞的核心,是支撐數(shù)據(jù)新聞完整呈現(xiàn)的基礎,其來源的權(quán)威性、準確性以及可信度對數(shù)據(jù)新聞的生產(chǎn)產(chǎn)生了重要作用。這就要求新聞從業(yè)者在數(shù)據(jù)采集時,提升自己的數(shù)據(jù)采集技能,做到數(shù)據(jù)來源全面、數(shù)據(jù)種類多樣、數(shù)據(jù)真實可靠。在數(shù)據(jù)新聞中,所采集到的數(shù)據(jù)來源多樣化才能夠克服數(shù)據(jù)來源的片面性。
例如,央視晚間新聞推出的數(shù)據(jù)新聞節(jié)目——據(jù)說春運,它的數(shù)據(jù)來源,不僅有央視與百度合作通過LBS開放平臺分析手機用戶的定位信息,映射出手機用戶的遷徙軌跡,構(gòu)成了一張實時變化的動態(tài)圖,而且還有記者去到火車站現(xiàn)場采訪火車站的一線工作人員并且在現(xiàn)場拍攝了圖片進行了現(xiàn)場的采訪與報道。在這一新聞作品中即涵蓋了大數(shù)據(jù)又有現(xiàn)場的小數(shù)據(jù)采集,其數(shù)據(jù)來源是多樣化的,使得報道更加豐富,避免了新聞報道的片面性。
(二)數(shù)據(jù)采集的自負原則
在數(shù)據(jù)新聞報道過程中,新聞從業(yè)者對新聞數(shù)據(jù)的采集既存在使用用戶的隱私數(shù)據(jù),同時也存在泄漏用戶個人的隱私信息的可能。所以在數(shù)據(jù)新聞的生產(chǎn)過程中,為了避免在數(shù)據(jù)采集過程中用戶的個人信息的侵犯和濫用,作為一名數(shù)據(jù)新聞記者在知情同意缺位的大數(shù)據(jù)時代下要遵循用者自負原則,在保護數(shù)據(jù)對象時要把握好隱私保護和數(shù)據(jù)使用之間的一個平衡。在對個人數(shù)據(jù)進行再利用時,記者可利用技術(shù)手段對個人隱私進行“脫敏”,采用“匿名化”的策略,通過代號化或加密處理,切斷信息與特定個人之間的辨識要素,實現(xiàn)信息的“去個人化”。
需要指出的是,傳統(tǒng)上通過匿名化的方式可以避免數(shù)據(jù)主體被識別的情況,但在大數(shù)據(jù)時代,單項信息的匿名化并不足以起到避免識別的作用,通過多個匿名單項個人信息的組合依然可能識別出數(shù)據(jù)主體,因此需要數(shù)據(jù)新聞記者在匿名處理時綜合評價匿名個人數(shù)據(jù)的潛在風險,采取應對措施,保護數(shù)據(jù)主體的合法權(quán)益[6]。
大數(shù)據(jù)時代背景下,在數(shù)據(jù)新聞在日趨完善的同時,學界和業(yè)界有必要在數(shù)據(jù)新聞生產(chǎn)和制作過程中的數(shù)據(jù)采集倫理問題上進行充分討論、達成共識。同時,為了減少數(shù)據(jù)采集倫理問題給社會帶來的潛在風險系數(shù),要加強法律和專業(yè)倫理規(guī)范的制約,促進數(shù)據(jù)新聞的實踐進一步深入。
參考文獻
[1]喻國明.從精確新聞到大數(shù)據(jù)新聞——關(guān)于大數(shù)據(jù)新聞的前世今生[J].青年記者,2014(36):43-44.
[2]數(shù)據(jù)新聞概論[M].中國人民大學出版社,方潔,2015
[3]鄒方.大數(shù)據(jù)時代新聞業(yè)的革新與困境——以央視《據(jù)說春運》《據(jù)說過年》為例[J].東南傳播,2016(09):10-13.
[4] VOORHOOF D.ECtHR decision: right of privacy vs. data journalism in Finland[EB/OL].https://ecpmf.eu/news/legal/archive/ecthr-decision-right-of-privacy-vs-data-journalism-in-finland.
[5]丁曉東.論個人信息法律保護的思想淵源與基本原理——基于“公平信息實踐”的分析[J].現(xiàn)代法學,2019,41(03):96-110.
[6]張超.試析數(shù)據(jù)新聞生產(chǎn)中的個人數(shù)據(jù)濫用與規(guī)避[J].編輯之友,2018(08):66-70.