袁軼男
(南通市崇川區(qū)文化藝術(shù)中心,江蘇 南通 226000)
在數(shù)字時(shí)代,社交媒體是政務(wù)信息發(fā)布、輿情監(jiān)測、文化傳播、知識構(gòu)建的主要陣地,而社交媒體數(shù)據(jù)也成為網(wǎng)絡(luò)治理、信息管理、輿情分析的主要數(shù)據(jù)源,因此,社交媒體數(shù)據(jù)的長期保存極具重要性。但就目前來看,我國社交媒體數(shù)據(jù)的長期保存不管是從隱私方面還是政策方面都存在一系列問題,嚴(yán)重制約了我國社交媒體數(shù)據(jù)歸檔方面的發(fā)展。本文就數(shù)字時(shí)代我國社交媒體數(shù)據(jù)的長期保存問題提出了相關(guān)的策略,力求推動我國社交媒體歸檔事業(yè)的發(fā)展。
社交媒體是互聯(lián)網(wǎng)中信息生產(chǎn)和交換平臺的統(tǒng)稱,是提供社會性網(wǎng)絡(luò)服務(wù)的工具或平臺?,F(xiàn)階段,最主要的社交媒體包括微信、微博、知乎、抖音等,用戶可以在社交媒體上分享自己的經(jīng)驗(yàn)和看法。社交媒體正以一種全新的互動交流方式改變著人們的工作生活,它既是信息傳播、獲取的過程,也是知識創(chuàng)造、分享的平臺。社交媒體數(shù)據(jù)就是社交媒體中創(chuàng)造、傳播的信息,在數(shù)字時(shí)代,社交媒體數(shù)據(jù)極大地推動了社會的發(fā)展,其長期保存的問題也成為當(dāng)下圖書館情報(bào)行業(yè)關(guān)注的熱點(diǎn)。
在數(shù)字時(shí)代,社交媒體數(shù)據(jù)具有3個特點(diǎn)。首先,社交媒體數(shù)據(jù)的傳播速度快,能即時(shí)反饋。社交媒體數(shù)據(jù)的傳播快,主要是由于其交互式傳播的方式,即民眾既可以即時(shí)接收信息,同時(shí)也能即時(shí)將信息傳播出去[1]。其次,社交媒體數(shù)據(jù)具有原創(chuàng)性。社交媒體的每一個用戶都有創(chuàng)造和傳播的能力,用戶可以以圖片、文字、視頻、音頻等形式分享自己的創(chuàng)作內(nèi)容,同時(shí)也能對其他用戶的創(chuàng)作發(fā)表看法。最后,社交媒體數(shù)據(jù)具有傳播人性化的特點(diǎn)。在大數(shù)據(jù)時(shí)代,社交媒體能分析和挖掘用戶感興趣的內(nèi)容,自動向用戶推送用戶感興趣的內(nèi)容,同時(shí)用戶也能自由地選擇想接收的內(nèi)容和接收的時(shí)間。
檔案是各項(xiàng)工作最真實(shí)和原始的記錄,能起到憑證的作用,是判斷工作的歷史依據(jù),而社交媒體數(shù)據(jù)在某種程度上能反映相關(guān)職能部門的職能活動,具有檔案屬性,能起到憑證的作用,應(yīng)當(dāng)予以妥善保存。在大數(shù)據(jù)時(shí)代,用戶的個人信息、原創(chuàng)內(nèi)容、社交信息都以數(shù)字代碼的形式存儲在社交媒體的服務(wù)器中。我國在《關(guān)于辦理刑事案件收集提取和審查判斷電子數(shù)據(jù)若干問題的規(guī)定》中明確指出,“在初查過程中收集、提取到的電子數(shù)據(jù)可作為證據(jù)使用”[2]。因此,在產(chǎn)生法律糾紛時(shí),社交媒體數(shù)據(jù)可以作為法律的憑證來維護(hù)用戶的合法權(quán)益。另外,政務(wù)社交媒體平臺發(fā)布的內(nèi)容包括醫(yī)療、教育、養(yǎng)老、就業(yè)等,與民眾生活息息相關(guān),社交媒體數(shù)據(jù)的保存能為政府的公務(wù)行為提供證據(jù)。
現(xiàn)階段,許多公共行政部門開始在社交媒體發(fā)布消息,這是互聯(lián)網(wǎng)環(huán)境催生出的新型網(wǎng)絡(luò)問政方式,是政務(wù)活動與社交媒體的一種結(jié)合。利用社交媒體平臺,政府機(jī)構(gòu)能實(shí)現(xiàn)政務(wù)公開,更好地占據(jù)輿論陣地,提升政務(wù)信息的傳播速度和擴(kuò)大傳播范圍,實(shí)現(xiàn)政民互動。在數(shù)字時(shí)代,政務(wù)社交媒體平臺承擔(dān)了政府的部分職能,能夠體現(xiàn)我國黨政機(jī)構(gòu)借助互聯(lián)網(wǎng)技術(shù)逐步地深入群眾、深入基層,更好地服務(wù)大眾。
在傳統(tǒng)媒體時(shí)代,報(bào)紙、雜志等“一統(tǒng)天下”,話語權(quán)多由官方掌握,很多的文化記憶往往是官方記憶。而隨著社交媒體的出現(xiàn),信息的傳播主體變得多樣化,用戶也可以成為傳播者,另外,傳播內(nèi)容、傳播媒體也更加豐富,越來越多的用戶成為文化的傳播者。在數(shù)字時(shí)代,“大眾記憶”逐漸成為社會的記憶,用戶在社交媒體發(fā)布的內(nèi)容,在一定程度上反映了當(dāng)時(shí)的文化,也是時(shí)代的縮影。在數(shù)字時(shí)代,圖書館及其他的文化機(jī)構(gòu)都逐步加入了社交媒體,并且發(fā)布了很多與區(qū)域相關(guān)的歷史、文化、城建、科教等內(nèi)容,這些內(nèi)容很好地記錄了一個區(qū)域文化、歷史的發(fā)展,極具文化價(jià)值。在數(shù)字時(shí)代,官方發(fā)布的內(nèi)容下面往往包含有大量的公眾評論,這些評論在一定程度上決定了社交媒體數(shù)據(jù)的受眾程度,對于構(gòu)建區(qū)域文化記憶意義非凡。
在大數(shù)據(jù)時(shí)代,通過數(shù)據(jù)分析就能從用戶發(fā)布內(nèi)容、檢索內(nèi)容中準(zhǔn)確地分析出用戶的職業(yè)、興趣、政治立場等個人隱私內(nèi)容。國外曾對Facebook的制度化存檔問題做過調(diào)查,支持存檔和不支持存檔的用戶各占一半,這意味著用戶還沒有意識到社交媒體數(shù)據(jù)存檔的重要性。另外,在不支持制度化存檔的用戶中,約有80%的用戶擔(dān)心制度化存檔會讓用戶喪失對數(shù)據(jù)的控制權(quán),同時(shí)也擔(dān)心自己的社交媒體數(shù)據(jù)存檔后被一些不法分子惡意利用等[3]。在大數(shù)據(jù)時(shí)代,個人信息泄露的問題層出不窮,尤其是現(xiàn)在,社交媒體已經(jīng)成為民眾工作和生活的重要組成部分,社交媒體數(shù)據(jù)的長期保存必然會出現(xiàn)用戶個人信息的泄露。因此,要實(shí)現(xiàn)社交媒體數(shù)據(jù)的長期保存,就要在個人隱私、社會價(jià)值之間尋求一個平衡點(diǎn),在得到用戶授權(quán)的情況下有選擇、有范圍地進(jìn)行數(shù)據(jù)的保存。
技術(shù)的限制是社交媒體數(shù)據(jù)長期保存最客觀、最直接的障礙。首先,傳統(tǒng)的存檔技術(shù)主要采用Web Archive技術(shù),包括兩種形式的存檔,即基于比特的存檔和基于內(nèi)容的存檔。在網(wǎng)頁的保存中,主要采用基于比特的存檔形式,保存的內(nèi)容包括樣式表、JavaScript 編寫的腳本內(nèi)容、HTML文件等,其目的是方便用戶在Web瀏覽器中查看[4]。而圖片、文本、視頻等采用的是基于內(nèi)容的存檔形式。Web Archive技術(shù)是目前社交媒體最常用的存檔技術(shù),但這種技術(shù)不夠先進(jìn),同時(shí)很容易造成原格式的丟失和數(shù)據(jù)的交互性缺失。其次,隨著我國各級政府、企業(yè)及科研團(tuán)隊(duì)等入駐社交媒體,社交媒體需要保存的數(shù)據(jù)量越來越大,并且需要進(jìn)行批量的數(shù)據(jù)采集,但由于大多數(shù)社交媒體數(shù)據(jù)捕捉的速率有限,很難達(dá)到要求。最后,對海量數(shù)據(jù)進(jìn)行長期保存主要是為了日后發(fā)揮其價(jià)值,數(shù)據(jù)的數(shù)量不斷增加,數(shù)據(jù)的格式類型也更加豐富,因此對數(shù)據(jù)加工的軟件硬件等都有了新的要求,目前的技術(shù)同樣也達(dá)不到這個要求。
數(shù)字時(shí)代,我國在社交媒體數(shù)據(jù)存檔方面也制定了相關(guān)的政策,并頒布了《中華人民共和國檔案法》(修訂草案)《中華人民共和國侵權(quán)責(zé)任法》《中華人民共和國網(wǎng)絡(luò)安全法》等法案,在一定程度上推動了社交媒體數(shù)據(jù)歸檔工作的開展,但在實(shí)施的過程中也出現(xiàn)了一系列的問題。首先,社交媒體數(shù)據(jù)的價(jià)值判斷問題。在數(shù)字時(shí)代,社交媒體數(shù)據(jù)的數(shù)量非常龐大,其價(jià)值判斷標(biāo)準(zhǔn)很難統(tǒng)一,有關(guān)部門曾提出幾個問題作為社交媒體數(shù)據(jù)價(jià)值判斷的標(biāo)準(zhǔn),但在實(shí)際的應(yīng)用中,這些問題的實(shí)操性很弱,圖書、檔案部分很難做出判定[5]。其次,政府機(jī)構(gòu)制定了一系列的管理政策,但各部分選擇的數(shù)據(jù)類型不一,最后形成的社交媒體檔案形式各異,沒有一套統(tǒng)一的歸檔標(biāo)準(zhǔn),因此后續(xù)的工作很難推進(jìn)。最后,數(shù)字時(shí)代的社交媒體存檔工作是需要多主體協(xié)作開展的,如何界定歸檔工作的主體和范圍,以及如何明確責(zé)任主體是社交媒體數(shù)據(jù)歸檔工作中必須要解決的問題。
我國社交媒體存檔工作起步較晚,相關(guān)政策不夠完善,在很大程度上制約了社交媒體數(shù)據(jù)的長期保存。在數(shù)字時(shí)代,社交媒體數(shù)據(jù)的長期保存要做到政策與標(biāo)準(zhǔn)先行。具體工作可以從以下幾個方面開展,首先,要借鑒國外的存檔實(shí)踐,立足于我國的國情,制定具體的政策和標(biāo)準(zhǔn)。例如制定數(shù)據(jù)的采集標(biāo)準(zhǔn)、存儲結(jié)構(gòu)及長期保存技術(shù)體系等。其次,由于社交媒體的數(shù)據(jù)量非常龐大,所有數(shù)據(jù)的長期保存難以實(shí)現(xiàn),因此,國家檔案部門要搭建其基本的管理原則和管理方法,優(yōu)先對政務(wù)社交媒體進(jìn)行歸檔,并且,政務(wù)社交媒體賬號發(fā)布的內(nèi)容與評論是一個數(shù)據(jù)整體,其中一些獨(dú)到的觀點(diǎn)及轉(zhuǎn)發(fā)時(shí)的評論都是民眾意見的真實(shí)反映,具體納入歸檔的數(shù)據(jù)范圍還需要制定相應(yīng)的標(biāo)準(zhǔn)及專家的研究。最后,在數(shù)據(jù)保存方面,美國、英國等國家有一整套的數(shù)據(jù)加密、檢測、備份、遷移等長期保存策略,并且有相當(dāng)完整的技術(shù)架構(gòu),包括動態(tài)網(wǎng)絡(luò)存儲方式、語義存儲方式、分布式存儲方式及云技術(shù)存儲方式,這些策略都能為我國的社交媒體數(shù)據(jù)長期保存提供參考[6]。
社交媒體數(shù)據(jù)的長期保存是一項(xiàng)繁雜且持續(xù)的工程,需要投入大量的人力、物力、財(cái)力等,單單依賴圖書館是難以完成的。在國外,社交媒體數(shù)據(jù)的歸檔工作主要是由圖書館和檔案館主導(dǎo),科研機(jī)構(gòu)、企業(yè)參與的多元協(xié)作機(jī)制。在數(shù)字時(shí)代,社交媒體是民眾活躍的主要陣地,其中蘊(yùn)含了大量有價(jià)值的信息,圖書館和檔案館作為保存人類文化遺產(chǎn)、傳承中國文化的主要機(jī)構(gòu),有義務(wù)采集、儲存這些有價(jià)值的數(shù)字資源。為了更好地保存社交媒體數(shù)據(jù),要建立起多元協(xié)作的組織結(jié)構(gòu)。立足于我國國情,圖書館和檔案館應(yīng)主動承擔(dān)社交媒體數(shù)據(jù)長期保存的使命,承擔(dān)主要責(zé)任,努力爭取社會資源支持,積極尋求多方合作,在政策和法律的支持下,聯(lián)合其他文化機(jī)構(gòu)、第三方商業(yè)機(jī)構(gòu),形成多元協(xié)作的組織形式,推動社交媒體數(shù)據(jù)長期保存工作的順利開展。多元協(xié)作的組織形式是社交媒體數(shù)據(jù)長期保存的發(fā)展趨勢,多元協(xié)作的組織形式能充分利用各個機(jī)構(gòu)的優(yōu)勢,理順各方關(guān)系,促進(jìn)各機(jī)構(gòu)的深入合作。另外,不管是哪個主體都要與社交媒體的服務(wù)商簽訂合作協(xié)議,獲取數(shù)據(jù)采集和管理的權(quán)利,協(xié)助服務(wù)商進(jìn)行數(shù)據(jù)管理,從而確保工作的正常推進(jìn)。最后,要從政策方面入手,制定合理的政策,明確歸檔工作中的領(lǐng)導(dǎo)主體,確定責(zé)任歸屬,完善監(jiān)督機(jī)制。
社交媒體數(shù)據(jù)保存的最終目的是實(shí)現(xiàn)歸檔資源的利用。在開展存檔工作時(shí),館方要注意工作開展的層次性。社交媒體數(shù)據(jù)長期保存工作是一項(xiàng)長期的任務(wù),在規(guī)劃中一定要避免“追趕潮流”、大規(guī)模地建設(shè)數(shù)字圖書館和數(shù)字檔案館,要循序漸進(jìn),根據(jù)各地文化發(fā)展情況,選取數(shù)個實(shí)驗(yàn)點(diǎn),開展存檔工作。從而在具體的實(shí)踐工作中評估項(xiàng)目的價(jià)值、效益及不足等,并在后續(xù)的發(fā)展中及時(shí)挑戰(zhàn)發(fā)展策略。在長期的探索中,我國已經(jīng)逐步開展了社交媒體數(shù)據(jù)歸檔工作,很多存檔資源已經(jīng)被再次利用。為了實(shí)現(xiàn)歸檔資源的利用,圖書館要完善數(shù)字圖書館的檢索和訪問機(jī)制,開發(fā)和利用多媒體檢索、智能檢索、語音檢索等,為用戶提供智能化、精準(zhǔn)化的檢索服務(wù)。另外,要把握數(shù)字時(shí)代的發(fā)展趨勢,深入挖掘社交媒體數(shù)據(jù)的價(jià)值,利用大數(shù)據(jù)及時(shí)對存檔的數(shù)據(jù)進(jìn)行深層次的開發(fā)和利用,針對不同的應(yīng)用場景、服務(wù)需求等,為用戶提供多元化的資源利用方式。
在數(shù)字記憶時(shí)代,社交媒體數(shù)據(jù)作為網(wǎng)絡(luò)信息資源的重要組成部分,其長期保存問題是圖書館情報(bào)領(lǐng)域研究的重點(diǎn)內(nèi)容。文章就數(shù)字時(shí)代我國社交媒體數(shù)據(jù)長期保存的必要性及制約因素提出了相關(guān)的策略,借此望能拓寬圖書館、檔案館、政府機(jī)構(gòu)、企業(yè)等之間的合作路徑,推動歸檔工作體系的規(guī)范進(jìn)程,促進(jìn)社交媒體數(shù)據(jù)資源再利用。