自媒體網(wǎng)絡信息歸檔初探
自媒體網(wǎng)絡信息可分為原創(chuàng)和轉(zhuǎn)載兩種類型,本文主要討論的是原創(chuàng)類自媒體信息的檔案屬性。
1.1 原始記錄性
人們在工作、學習、旅游、休閑等活動中因有感或有訴求而通過自媒體發(fā)布信息、狀態(tài),例如微博或QQ空間、微信朋友圈等,人們發(fā)布在自媒體上的信息都蘊含著作者的思想,反映了一個時代人們交流方式的嬗變。這種交流平臺的簡易、便捷和有效吸引了越來越多的用戶使用自媒體,并通過這種平臺隨時隨地與別人分享自己的近況或者曝光一些社會的隱秘面,這類原創(chuàng)信息始終是自媒體平臺信息的主體,也是自媒體能夠經(jīng)久不衰的原因所在。以微博為例,公眾人物利用微博建立自己的網(wǎng)上形象,并利用微博宣傳自己;企業(yè)利用微博進行形象宣傳、媒體公關與產(chǎn)品營銷;政府部門使用微博發(fā)布政務信息,引導社會輿論,維護社會穩(wěn)定……各個社會單位為塑造自身的良好形象,在使用微博發(fā)布信息時會非常注重信息的原創(chuàng)性與真實性。
1.2 社會記憶屬性
個人通過自媒體發(fā)布的信息內(nèi)容一般是個人在其日常生活中,有感而發(fā)的一些心情描述或生活記錄“,個人置身于群體的框架中進行回憶,而群體的記憶卻是通過個體記憶來傳達與實現(xiàn)的”。這些“瑣碎”的記憶單個看起來也許價值不大,但從整體來看,無數(shù)條這樣的個人微博組織在一起,就成為能夠反映社會各方面情況的群體記憶。而政府或某些社會團體發(fā)布的信息,則反映了社會各個領域的生產(chǎn)與管理活動情況,這些內(nèi)容同樣具有社會記憶屬性,將這些信息保存起來,可作為未來某個時候考察與復原當代人們生活面貌的重要依據(jù)。以博客來講“,個人記憶被強烈呼喚,博客從技術上滿足了這種需要,是對私人或者是人民記憶的最好實踐。作為記錄的博客的存在,被評價為‘私人領域浮現(xiàn)出公共空間’、‘平凡人物群體亮相’,博客雖然是個人寫作,但是對個體的關注與時代風云密切相關,不僅如此,這無數(shù)雙眼睛補充著被時代忽略的記憶”。從這方面的功能上來說,但凡自媒體平臺,大體與之類似。無數(shù)的個體的記憶匯聚在一起,能夠更加全面細致地反映當代社會生產(chǎn)生活的原始面貌。把有價值的自媒體網(wǎng)絡信息加以歸檔保存,使其發(fā)揮社會記憶功能,對人類社會、歷史的研究與發(fā)展將是一種貢獻。
2.1 自媒體網(wǎng)絡信息的海量性、碎片化
根據(jù)中國互聯(lián)網(wǎng)絡信息中心(CNNIC)最新發(fā)布的第36次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》顯示,截至2015年6月,我國微博客用戶規(guī)模為2.04億,網(wǎng)民使用率為30.6%,手機端微博客用戶數(shù)為1.62億,使用率為27.3%。另外,據(jù)2015微信用戶數(shù)據(jù)報告,截至2015年第一季度末,微信每月活躍用戶已達到5.49億,用戶覆蓋200多個國家、超過20種語言,各品牌的微信公眾賬號總數(shù)已經(jīng)超過800萬個。從這些數(shù)據(jù)中我們可以看出,微博客、微信等自媒體的使用范圍極其廣泛,因而其信息生產(chǎn)迅速而分散,且數(shù)量巨大,這對歸檔信息的收集和保存造成了障礙。
2.2 自媒體網(wǎng)絡信息制作的隨意性、內(nèi)容的真實性問題
與傳統(tǒng)媒體相比,自媒體的信息制作主體發(fā)生了變化,由大眾傳媒的專業(yè)機構擴大到?jīng)]有經(jīng)過新聞采編訓練的普通大眾個體,自媒體世界中的每個人既是信息的受眾也同時是信息制作者。由于信息制作主體的廣泛性、素養(yǎng)層次不一,其所發(fā)布的信息帶有極強的個人色彩,隨意性比較強。一方面,在現(xiàn)實社會中,一部分價值觀、理想信念扭曲的小眾對自媒體網(wǎng)絡的濫用,使自媒體成為制造傳播虛假信息的高效平臺。部分用戶為追求關注度,提高點擊率,越過自身道德底線,肆意發(fā)布道聽途說或自我編造的虛假信息,給自媒體網(wǎng)絡造成了信息污染。另一方面,“Web2.0時代,數(shù)字技術的進步引發(fā)了傳播領域的變革,其本質(zhì)便是傳播主題的泛眾化。傳統(tǒng)媒介組織在信息端口把關的模式發(fā)生改變。網(wǎng)民個體可以不經(jīng)媒介組織,直接在網(wǎng)絡平臺上發(fā)布信息”。這意味著針對自媒體信息發(fā)布的把關及管控的缺失或不力,使得任何個體通過自媒體發(fā)布信息處于一種放任的狀態(tài),而現(xiàn)有的法律或規(guī)定偏向于追責,無法從源頭解決自媒體網(wǎng)絡信息的真實性問題。
2.3 自媒體網(wǎng)絡信息安全問題
自媒體網(wǎng)絡信息安全主要涉及兩個方面的問題,一是自媒體網(wǎng)絡中不良的、有攻擊性的信息會對人們產(chǎn)生傷害,二是各種原因造成的自媒體網(wǎng)絡信息刪除或丟失。在互聯(lián)網(wǎng)中,網(wǎng)民素質(zhì)參差不齊,如果網(wǎng)民通過自媒體傳播一些不良信息,對他人進行謾罵、構陷、攻擊,相關的審查手段是沒有的,自媒體信息更新量大且迅速,即使有信息篩選或?qū)彶闄C制,也難以在其產(chǎn)生不良社會影響前得到根除,事后服務運營商或政府主管部門責令其將有害信息刪除或?qū)χ黧w進行封號。但對于一些產(chǎn)生過較大社會影響的信息,雖然是虛假或有害的,但也有保存的需要,將這些信息及相關評論、轉(zhuǎn)發(fā)記錄與相關后果總結一并歸檔,能夠便于后人了解這一事件的來龍去脈,從而能夠更加詳實地對我們這個時代的社會狀況進行了解與研究。另外,目前自媒體信息暫存于運營商的數(shù)據(jù)庫中,它依賴于運營商的正常運行,隨著歷史的發(fā)展,事物都是在變化的;另外,地震、火災、恐怖襲擊等不確定因素也是自媒體網(wǎng)絡信息及用戶數(shù)據(jù)保存的潛在威脅。例如美國“911”恐怖襲擊中,眾多大公司因其部分重要檔案、資料、數(shù)據(jù)被毀,從此一蹶不振,而事先做好異地備份的公司則沒有在那次襲擊中受到太大影響。目前我們對自媒體網(wǎng)絡信息的歸檔留存工作認識不足,工作力度太過薄弱,有必要將其作為研究對象,加以討論研究并付諸實踐。
3.1 自媒體網(wǎng)絡信息歸檔責任主體分析
在國外,對網(wǎng)絡信息保存問題給予關注的主要是圖書館,有10多個國家啟動了國家級的網(wǎng)絡信息保存項目,大多以圖書館作為責任主體,我國由國家圖書館承擔的WICP項目(網(wǎng)絡信息資源采集與保存實驗項目)啟動于2003年。受圖書館職能定位的影響,由圖書館主導的網(wǎng)絡信息保存對象主要是數(shù)字出版物以及Web網(wǎng)頁等信息,而美國國家圖書館曾做過微博客信息內(nèi)容的采集與出版。由此可見,針對網(wǎng)絡信息的保存工作目前仍處于淺層階段,尤其是針對自媒體網(wǎng)絡信息的歸檔保存,始終沒有一個部門來主導和負責。自媒體網(wǎng)絡信息內(nèi)容豐富,數(shù)量龐大,從檔案工作的視角來看,將各政府機構、社會組織及個人發(fā)布在自媒體中的具有一定價值的原始記錄性信息進行采集與歸檔保存,能夠有力地反映和輔助再現(xiàn)社會各項活動的原貌,發(fā)揮與傳統(tǒng)紙質(zhì)檔案同樣的參考與憑證作用。趙展春認為,網(wǎng)絡信息資源的歸檔保存既是檔案部門在網(wǎng)絡時代工作職能延伸的必然要求,又是適應網(wǎng)絡時代進一步發(fā)揮檔案價值功能的必然選擇,網(wǎng)絡信息資源歸檔保存強調(diào)網(wǎng)絡信息資源的檔案化處理過程,與圖書館在工作內(nèi)容和目標上有所區(qū)別,因此必然要求檔案館成為網(wǎng)絡信息資源歸檔保存的活動主體。自媒體網(wǎng)絡信息是整個網(wǎng)絡信息海洋中的一部分“,檔案工作者是建構社會和歷史記憶的積極因素。在此過程中,他們不僅有義務保護或記錄過去,還有責任把未來的需要和期望銘記于心”。因此,自媒體網(wǎng)絡信息的歸檔保存工作自然而然地應由檔案館來主導。然而,自媒體網(wǎng)絡信息的歸檔工作量大、復雜、技術要求高,僅憑檔案館一方的力量難以完成,檔案館需要尋求運營商和第三方的技術、資金、人才支持,才有可能將這項創(chuàng)新性工作持續(xù)推進。比如與運營商合作共同開發(fā)智能應用工具,自動篩選有價值的自媒體網(wǎng)絡信息并保存到本地;也可以招募民間志愿者,比如新浪微博中的“江寧公安在線”、“謠言檔案館”等用戶,他們經(jīng)常會總結制作一些對社會和人們產(chǎn)生影響的傳謠事件信息發(fā)布在其個人微博上,也幫助網(wǎng)友鑒定一些自媒體信息的真實性,這對減輕謠言對人們的影響,扼止虛假信息的繼續(xù)擴散有積極的作用。
3.2 自媒體網(wǎng)絡信息采集方式、技術分析
以微博為例,國外應用最廣泛的微博客Twitter網(wǎng)站推出了一款微博歸檔工具,這款工具備受用戶青睞,它的主要功能就是允許用戶將他們發(fā)布過的所有微博即他們的全部Twitter消息都下載下來,保存在本地。用戶利用這項功能可以下載的內(nèi)容包括用戶發(fā)布的微博和評論,可按月分期下載,或通過關鍵字、特定短語、標簽和用戶名進行搜索,以有選擇地進行下載。其他一些公司如谷歌(微博)和Facebook早就已經(jīng)向它們的用戶提供了下載數(shù)據(jù)的功能。Twitter推出這項功能比其他公司要晚一些,它鼓勵那些活躍的Twitter用戶回復舊微博,并且給那些微博打上#TwitterArchive的標簽,這樣舊微博就可以再次被其他人看到。在我國,自媒體服務運營商尚未推出類似的歸檔工具,只是一些民間愛好者自行制作出了類似的但功能較為簡單的信息備份工具,這種備份工具能夠使用戶將自己的信息下載保存為TXT格式。檔案工作者對自媒體信息的采集工作所面臨的困難顯而易見。然而方法還是有的:第一種方法是截屏,這是最簡單但也是最沒有效率的方法;第二種方法是先由自媒體用戶自己下載備份自己所發(fā)布的信息,檔案館再有針對性地進行征集,這樣做的好處是避免了用戶與檔案館之間信息使用權的糾紛,但這種方法的效率也是很難保證的;第三種方法是利用先進的網(wǎng)絡信息采集技術,實現(xiàn)自媒體網(wǎng)絡信息的智能化、成批量的抓??;第四種方法是尋求服務運營商支持,直接從其數(shù)據(jù)庫中獲取有效的自媒體網(wǎng)絡信息。第三、四種方法看起來要高效許多,但這兩種方法的施行必然會面臨許多法律上的問題,也會加大信息鑒定的工作量。因此,要做好信息采集工作,首先要處理好檔案館、用戶、運營商三方的關系,這是工作開展的前提。
3.3 自媒體網(wǎng)絡信息歸檔的鑒定、描述與組織
為了保證所歸檔保存的自媒體網(wǎng)絡信息具有一定價值,在歸檔前需要對所采集到的信息進行鑒定與篩選。鑒定工作主要包括兩個方面,一是對自媒體網(wǎng)絡信息價值的鑒定,二是對其真實性的鑒定。首先要保證所歸檔的自媒體網(wǎng)絡信息是有價值的,例如當事人對社會、自然重大突發(fā)事件第一時間的親歷性報道,社會熱點話題,名人隨筆,涉及某一案件的相關文字、照片、視頻或者某項重大活動中重要人物的出席照片、視頻、言論等,這些信息在未來具有可預見的參考、憑證作用。另外要對所采集到的信息的真實性加以求證,如果信息是虛假的,在歸檔時應標注清楚,并列明事實。歸檔信息的描述與組織是其能夠被檢索利用的前提。要做好自媒體網(wǎng)絡信息歸檔的描述與組織工作,首先要有一定的著錄標準,目前在這一方面還有所欠缺。在技術上可行的一種方法是采用元數(shù)據(jù)格式對自媒體網(wǎng)絡信息資源進行描述與組織,那么,我們所要解決就是元數(shù)據(jù)的采集或制作問題。都柏林核心元數(shù)據(jù)是由計算機專家、網(wǎng)絡專家和圖書館專家等人員所組成的一個非正式小組于1995年在美國俄亥俄州都柏林開發(fā)的元數(shù)據(jù)元素集。它由3個核心元數(shù)據(jù)集(內(nèi)容屬性、知識產(chǎn)權屬性、形式屬性)與15個元素(包括標題、創(chuàng)作者、主題、摘要等)構成。都柏林核心元數(shù)據(jù)簡單易用,并主要用于網(wǎng)絡資源的著錄和發(fā)現(xiàn),為網(wǎng)絡信息資源的檢索利用提供了很大便利。構架與創(chuàng)建規(guī)范化的元數(shù)據(jù),要按照一定標準,從自媒體網(wǎng)絡信息中抽取出相應的特征,設計一套規(guī)范的元數(shù)據(jù)格式,以實現(xiàn)對信息的規(guī)范化描述。目前在不同領域和不同應用項目中已存在多種不同的元數(shù)據(jù)格式,針對自媒體網(wǎng)絡信息,我們應綜合多方面因素,設計一套最為合適的元數(shù)據(jù)框架,這個框架應把主題、來源、語種、創(chuàng)建者、日期、類型等元素包含進去。
3.4 自媒體網(wǎng)絡信息歸檔法規(guī)制度建設
自媒體的使用群體范圍特別廣泛,因此自媒體網(wǎng)絡信息的歸檔工作會涉及到許多層面的人和事,這項工作的順利開展需要社會各方面的支持與配合,尤其需要國家層面對自媒體網(wǎng)絡秩序加以約束和規(guī)范,制訂相關的法規(guī)制度。目前來看,已有一些相關的規(guī)定或制度得以實施,比如新浪微博推出的名人、網(wǎng)站、媒體、高校、企業(yè)以及身份通認證,微信的公眾號認證、賬戶綁定手機號等。另外北京市2011年12月推出《北京市微博客發(fā)展管理若干規(guī)定》,實行“后臺實名,前臺自愿”的原則,此規(guī)定實施后新注冊微博用戶在注冊時必須提供真實身份信息,但用戶昵稱能夠自由設定;未進行實名認證的微博老用戶,將不能發(fā)言、轉(zhuǎn)發(fā),只能瀏覽。這些規(guī)定的施行有助于追溯相關信息的原始制作人,以督促用戶對其所發(fā)布的信息負責,減少虛假、有害信息的發(fā)布與傳播。有關規(guī)定對自媒體網(wǎng)絡秩序有規(guī)范作用,有助于加強信息采集的針對性,為信息歸檔工作創(chuàng)造方便。然而對于檔案館開展自媒體網(wǎng)絡信息歸檔工作來說,最有力的支持是從法律層面上賦予檔案館這方面的權利和義務,這樣才能減少信息采集與歸檔工作的阻力與難度。
自媒體賦予并擴大了社會個體及非媒體組織以往所缺乏的話語權,吸引了學者、名人等社會各界人士,政府機構、社會團體等各類組織參與其中,這使得自媒體的管理與運作必將逐步向規(guī)范化的方向發(fā)展,在自媒體網(wǎng)絡平臺中生成的信息也將隨之規(guī)范化而更具有保存價值。在當今自媒體用戶數(shù)量巨大且仍在增長,以及自媒體硬件平臺由PC端轉(zhuǎn)至移動端的情況下,自媒體網(wǎng)絡信息歸檔面臨著嚴峻的形勢,檔案館理當審時度勢,對自媒體網(wǎng)絡信息歸檔進行探索與實踐,這是考驗檔案館魄力的時候,也是壯大檔案事業(yè)的機遇。