黃新平
摘要:在梳理和總結(jié)國內(nèi)外政府社交媒體文件歸檔研究成果的基礎(chǔ)上,對集體智慧和政府社交媒體文件的概念進(jìn)行辨析,提出了集體智慧與政府社交媒體文件檔案化管理融合的問題。同時,基于集體智慧的視角,分析了政府社交媒體文件檔案化管理的實(shí)施主體、流程和策略,以期為政府社交媒體文件的長效管理提供參考。
關(guān)鍵詞:集體智慧政府社交媒體社交媒體文件檔案化管理
Abstract: On the basis of review of the domestic and foreign government social media file archiving, this paper analysis the concept of government social media files and collective intelligence, put forward the integration of collective intelligence and govern? ment social media files archival management. On this basis, discusses the implementing subject, pro? cess and strategy of government social media file ar? chival management. In order to provide reference for long-term management of government social media files.
Keywords: Collective intelligence; Government social media;Social media file; Archival management
“互聯(lián)網(wǎng)+”時代政府社交媒體發(fā)揮的作用日益凸顯,特別是隨著政務(wù)微博、官方微信的應(yīng)用,政府社交媒體逐漸成為公開政務(wù)信息的新渠道。目前,公眾的參政意識逐漸增強(qiáng),政府社交媒體的信息資源總量不斷增加,加上政府社交媒體本質(zhì)上具有檔案屬性,其管理同樣涉及信息的采集、識別、歸檔等過程。[1]在這樣的背景下,如何對政府社交媒體文件進(jìn)行科學(xué)的檔案化管理,提高政府社交媒體信息資源的效用,發(fā)揮集體智慧的作用尤為重要。
一、基于集體智慧的政府社交媒體文件檔案化管理的提出
(一)國內(nèi)外相關(guān)研究
社交媒體信息存檔研究源于近年來社交媒體的迅速發(fā)展與廣泛應(yīng)用,2010年以來,歐美等一些發(fā)達(dá)國家的政府部門、檔案管理機(jī)構(gòu)紛紛開展了不同層次、不同目的、不同形式的政務(wù)社交媒體文件歸檔實(shí)踐項目,其中一些已經(jīng)形成了較為成熟的實(shí)施流程和管理規(guī)范。如英國國家檔案館負(fù)責(zé)的英國政府網(wǎng)絡(luò)存檔項目[2]在歐洲網(wǎng)絡(luò)記憶基金的支持下,開發(fā)了能夠確保社交媒體文件產(chǎn)生背景、結(jié)構(gòu)與內(nèi)容原始性的信息采集工具,按照《英國國家檔案法》的相關(guān)規(guī)定,與Twitter、You? Tube等機(jī)構(gòu)合作,對英國中央政府各部門官方Twitter和YouTube公眾號上公開發(fā)布的政務(wù)信息和政治熱點(diǎn)事件等政府社交媒體文件進(jìn)行檔案化管理。目前,該項目歸檔保存的Twitter文件已達(dá)65000多份,You? Tube文件數(shù)量超過7000個,文件類型涵蓋文本、圖片、音視頻等。此外,美國北卡羅來納州政府社交媒體檔案館項目[3]通過人工選擇的方式識別需要?dú)w檔的州政府部門所使用的Blogs、Wikis、Twitter、Facebook等主流社交媒體賬戶,參照項目所制定的“頁面宏觀評估計分表”,對待采集的政府社交媒體文件進(jìn)行評價和精確計分,根據(jù)得分情況來確定采集的頁面范圍和采集頻率。并依托第三方信息服務(wù)機(jī)構(gòu)——Archive Social所提供的社交媒體信息捕獲和歸檔服務(wù)構(gòu)建北卡羅來納州政府社交媒體文件數(shù)字檔案館。
與國外相比,我國在社交媒體信息歸檔保存方面的研究尚處于萌芽階段。在理論上,如王煥[4]通過系統(tǒng)分析和梳理國外政務(wù)社交媒體文件歸檔工作的流程與管理模式,為我國檔案管理機(jī)構(gòu)提供了具有參考價值的政務(wù)社交媒體文件歸檔辦法。黃霄羽等[5]探討了社交媒體文件權(quán)屬問題,提出社交媒體文件應(yīng)采用合作共管的歸檔管理模式。趙躍[6]對政務(wù)新媒體文件歸檔的動因、主體、內(nèi)容、策略進(jìn)行了思考,并指出了當(dāng)前我國政務(wù)新媒體文件歸檔面臨的挑戰(zhàn)與應(yīng)對策略。在實(shí)踐領(lǐng)域,國內(nèi)相關(guān)的實(shí)踐應(yīng)用研究尚處于起步階段,系統(tǒng)應(yīng)用實(shí)踐發(fā)展尚不成熟。
(二)概念辨析
1.集體智慧。集體智慧即將大量松散的個人、組織或機(jī)構(gòu)集合在一起,通過集體成員間的互動協(xié)作所產(chǎn)生的高于個體所擁有的能夠進(jìn)行理性思考、制定決策、執(zhí)行任務(wù)、解決復(fù)雜問題的團(tuán)體性智慧或能力。在信息資源管理與服務(wù)領(lǐng)域,集體智慧已廣泛應(yīng)用于社會網(wǎng)絡(luò)服務(wù)、眾包服務(wù)、信息資源共建共享等多個方面,維基百科、Yahoo!、Answers等都是典型的成功案例。[7]
2.政府社交媒體文件。政府社交媒體文件可定義為國家政府機(jī)構(gòu)在履行行政活動或處理事務(wù)過程中,使用社交媒體制作或接收的具有保存價值的信息,這些信息符合文件的真實(shí)性、可靠性、完整性的基本特點(diǎn),具有憑證、參考、情報等主要的檔案價值屬性。[8]目前,政府社交媒體信息的文件屬性已經(jīng)得到很多國家的認(rèn)可,如加拿大國家檔案館認(rèn)為政府社交媒體信息是政府文件的重要組成部分,并通過政策法規(guī)進(jìn)行規(guī)范,使其與政府電子文件和政府網(wǎng)站信息等數(shù)字資源一樣成為當(dāng)前檔案部門長期歸檔保存的重要對象。需要指出的是,與政府辦公系統(tǒng)中生成的電子文件和政府網(wǎng)站信息不同,社交媒體文件一般是借助第三方社交媒體平臺形成的,政府發(fā)布的社交媒體文件保存在社交媒體平臺運(yùn)營商提供的服務(wù)器上,這就決定了政府社交媒體文件對第三方平臺的依賴性。因此,與電子文件和政府網(wǎng)站信息的歸檔保存相比,政府社交媒體文件的歸檔工作流程和管理模式還應(yīng)充分考慮到第三方因素。
(三)集體智慧與政府社交媒體文件歸檔的融合
政府社交媒體文件歸檔不僅涉及第三方運(yùn)營機(jī)構(gòu)的問題,還要面臨大量社會公眾參與的網(wǎng)絡(luò)社區(qū)中信息交互與公眾反饋信息的整理,加上這些信息動態(tài)增長、分享與轉(zhuǎn)載導(dǎo)致其更新頻繁,且重復(fù)、無序內(nèi)容較多,很難準(zhǔn)確識別和捕獲,致使政府社交媒體文件歸檔工作面臨巨大的挑戰(zhàn)。因此,對政府社交媒體文件的歸檔不能僅靠某個機(jī)構(gòu),需要多機(jī)構(gòu)的共同參與,而且有必要吸納公眾加入,發(fā)揮集體智慧的優(yōu)勢,協(xié)同高效開展政府社交媒體文件歸檔工作。其中,集體智慧與政府社交媒體文件歸檔的融合具體表現(xiàn)為:一是采用公眾參與的社交媒體信息采集策略,基于公眾、團(tuán)體的智慧來選擇有保存價值的信息,最終建立能夠反映集體記憶、社會感知的政府社交媒體文件數(shù)字檔案館;二是建立分布式合作存檔機(jī)制,政府社交媒體歸檔應(yīng)由文件的形成機(jī)構(gòu)、社交媒體平臺運(yùn)營商、記憶機(jī)構(gòu)共同參與,在各司其職和運(yùn)用自身特有資源下協(xié)同解決政府社交媒體文件歸檔面臨的各種難題。
綜上,我們應(yīng)借鑒國外實(shí)踐經(jīng)驗,發(fā)揮多個主體協(xié)同管理的優(yōu)勢,同時借助政務(wù)社交媒體廣泛群眾基礎(chǔ),征集、內(nèi)化網(wǎng)絡(luò)用戶的意見和建議,實(shí)現(xiàn)集體智慧視角下政府社交媒體文件檔案化管理模式的創(chuàng)新,為國內(nèi)政府社交媒體文件存檔工作面臨的挑戰(zhàn)提供新的解決思路。
二、基于集體智慧的政府社交媒體文件檔案化管理的分析
(一)政府社交媒體文件檔案化管理的實(shí)施主體
如上所述,政府社交媒體文件的歸檔涉及新媒體運(yùn)營商、政府機(jī)構(gòu)和檔案部門三個實(shí)施主體,三者之間的關(guān)系如圖1所示。這些機(jī)構(gòu)通過分工協(xié)作,共同承擔(dān)政府社交媒體文件的檔案化管理工作,從而通過分擔(dān)責(zé)任、降低風(fēng)險,使效益最大化。
1.新媒體運(yùn)營商。政府社交媒體文件屬于電子文件的范疇,同樣具有完整的產(chǎn)生背景、內(nèi)容、結(jié)構(gòu)等信息,這些信息同元數(shù)據(jù)一同捕獲,成為識別文件真實(shí)性與可靠性的重要標(biāo)識。[9]元數(shù)據(jù)管理作為社交媒體文件管理的核心,為了實(shí)現(xiàn)政府社交媒體文件完整捕獲歸檔與真實(shí)保存利用,需要對文件著錄的元數(shù)據(jù)標(biāo)準(zhǔn)提出特殊要求,由于社交媒體文件存儲在新媒體運(yùn)營商提供的服務(wù)器上,因此,需要具備技術(shù)優(yōu)勢的新媒體運(yùn)營商提供相應(yīng)的技術(shù)解決方案,滿足政府社交媒體文件歸檔保存的管理需求。
2.政府機(jī)構(gòu)。政府機(jī)構(gòu)作為社交媒體文件的直接形成機(jī)構(gòu),擁有對文件的管理與處置權(quán),能夠在文件的整個生命周期內(nèi)對其進(jìn)行管理與控制。同時由于政府機(jī)構(gòu)更了解文件形成的背景信息與內(nèi)容結(jié)構(gòu),因此,在文件的真實(shí)性與完整性等價值鑒定與識別上具有不可替代的地位。此外,作為政府社交媒體文件檔案化管理的領(lǐng)導(dǎo)和監(jiān)督主體,負(fù)責(zé)社交媒體文件管理意見與政策的制定,指導(dǎo)并監(jiān)督檔案部門和其他合作機(jī)構(gòu)對政府社交媒體文件的管理。
3.檔案部門。檔案部門是政府社交媒體文件檔案化管理實(shí)施的責(zé)任主體,一方面,檔案部門作為專門的文化記憶機(jī)構(gòu),在政府社交媒體文件采集內(nèi)容涉及范圍確定、歸檔工具與技術(shù)選擇、保存標(biāo)準(zhǔn)體系和流程規(guī)范制定、管理平臺構(gòu)建、歸檔信息服務(wù)利用等方面具有天然的優(yōu)勢,通過形成包括方案、標(biāo)準(zhǔn)、規(guī)范、程序、技術(shù)等諸多要素在內(nèi)的管理框架體系,可為政府社交媒體文件歸檔提供必要的制度環(huán)境。另一方面,檔案部門借助其完善的專業(yè)人員配備和資金支持,參照其在文件歸檔方面成熟的業(yè)務(wù)流程,可以實(shí)現(xiàn)政府社交媒體文件在捕獲、處理、存儲、利用等環(huán)節(jié)的標(biāo)準(zhǔn)化操作。
(二)政府社交媒體文件檔案化管理的實(shí)施流程
政府社交媒體文件作為一種有特定內(nèi)容、結(jié)構(gòu)、背景信息的文件,在一定程度上屬于電子文件范疇,因此,電子文件歸檔管理的一些理念和方法可以應(yīng)用到政府社交媒體文件的檔案化管理中。根據(jù)文件生命周期理論,同樣可以把政府社交媒體文件的生成、發(fā)布、捕獲、歸檔視為完整的生命周期,按照相關(guān)標(biāo)準(zhǔn)和規(guī)范,沿著文件歸檔管理工作采集、管理、保存的思路對其全程管控,保證政府社交媒體文件從采集到長期保存管理上的連續(xù)性和規(guī)范性??紤]到開放檔案信息系統(tǒng)(OAIS)模型已經(jīng)成為國際上公認(rèn)的實(shí)現(xiàn)數(shù)字資源長期保存與獲取的標(biāo)準(zhǔn),政府社交媒體文件歸檔的整個流程也可以參考OAIS模型作為其實(shí)施檔案化管理的邏輯架構(gòu),如圖2所示。
1.政府社交媒體文件的采集。與常規(guī)電子文件不同,政府社交媒體文件依賴于第三方平臺具有的深層次的復(fù)雜結(jié)構(gòu),其海量性、復(fù)雜性、技術(shù)性強(qiáng)等特點(diǎn)導(dǎo)致政府社交媒體文件的采集面臨諸多問題,如對動態(tài)持續(xù)生長信息的實(shí)時采集,以及對豐富的社交媒體情境信息的有效獲取等。因此,結(jié)合政府社交媒體文件的特點(diǎn),在借鑒電子文件獲取相關(guān)方法的基礎(chǔ)上,還應(yīng)與社交媒體平臺運(yùn)營商合作,尋求捕獲社交媒體文件的有效技術(shù)解決方案,包括資源選擇標(biāo)準(zhǔn)、網(wǎng)絡(luò)爬蟲工具配置、數(shù)據(jù)交換格式、元數(shù)據(jù)編碼及轉(zhuǎn)換標(biāo)準(zhǔn)等。以英國國家檔案館對Twitter的捕獲為例,該館在實(shí)施信息采集時遵循Twitter提供的REST API標(biāo)準(zhǔn)、數(shù)據(jù)獲取API服務(wù)標(biāo)準(zhǔn)等,對收割Twitter信息的網(wǎng)絡(luò)爬蟲工具進(jìn)行了規(guī)范配置,獲取以JSON、XML等標(biāo)準(zhǔn)格式數(shù)據(jù)集形式呈現(xiàn)的包含Twitter信息原始數(shù)據(jù)及其元數(shù)據(jù)的檔案信息包(AIP)。[10]
2.政府社交媒體文件的管理。利用網(wǎng)絡(luò)爬蟲工具捕獲的文件多是雜亂無序的,還應(yīng)通過編目著錄與鑒定整理等管理操作使無序信息有序化。比如,歐盟FP7支持的ARCOMEM項目通過構(gòu)建通用的元數(shù)據(jù)模型對采集的文件內(nèi)容、結(jié)構(gòu)、管理過程、形成背景等信息進(jìn)行統(tǒng)一的資源描述,并將描述的信息以標(biāo)準(zhǔn)的WARC網(wǎng)頁檔案文件格式保存,實(shí)現(xiàn)對采集的社交媒體文件的編目著錄。[11]此外,可以借鑒電子文件鑒定理念,將政府社交媒體文件的鑒定整理劃分為文件識斷與文件可用性判斷兩個部分。其中,文件識別用于判斷文件檔案信息包中的元數(shù)據(jù)、長期保存方式等要素是否齊全。文件可用性判斷即對已捕獲文件背景信息、內(nèi)容、結(jié)構(gòu)等特征的可用性檢查,確保文件的真實(shí)性、完整性、有效性。
3.政府社交媒體文件的歸檔保存。社交媒體文件的歸檔保存主要涉及存檔方式與存儲架構(gòu)的選擇。目前對社交媒體文件進(jìn)行存檔的方式較多,包括直接存檔、網(wǎng)絡(luò)鏈接存檔、內(nèi)容尋址存檔等。[12]社交媒體文件具有數(shù)據(jù)量大和存取頻繁的特點(diǎn),解決社交媒體文件在海量存儲與高效存取方面存在的沖突,可以借鑒澳大利亞Pando? ra項目采用的社交媒體文件存檔方式,將文件歸檔分為三個部分,即提供訪問的存檔、長期保存文件的存檔以及持續(xù)工作所需的存檔,通過多個機(jī)構(gòu)共建共享的方式進(jìn)行分布式存檔,提升社交媒體文件歸檔效率。在存儲架構(gòu)選擇方面,社交媒體文件歸檔作為一項持續(xù)性活動,保存文件數(shù)量的動態(tài)增長對存儲管理提出了挑戰(zhàn),云存儲作為動態(tài)易擴(kuò)展、安全可靠、易于管理、成本低廉的數(shù)據(jù)存儲方式可為海量政府社交媒體文件的長期保存提供有效的解決方案。
(三)政府社交媒體文件檔案化管理的實(shí)施策略
1.采用基于群眾智慧的歸檔信息采集策略。集體智慧視角下的政府社交媒體文件檔案化管理所采用的信息采集策略應(yīng)強(qiáng)調(diào)“全民參與、共享記憶”。因此,可借鑒美國國家檔案與文件署官方網(wǎng)站開展的“公民檔案員”項目,[13]提倡國家檔案館等有影響力的文化記憶機(jī)構(gòu)積極建立公眾號,鼓勵公眾參與政府社交媒體文件的采集工作,按照“明確政府社交媒體信息采集主題→利用社交平臺宣傳→社交媒體用戶自發(fā)參與相關(guān)主題信息資源的征集與內(nèi)容評價→負(fù)責(zé)機(jī)構(gòu)有選擇地優(yōu)先采集重要信息→建立反映集體記憶、社會感知的政府社交媒體文件數(shù)字檔案館”的流程,利用群眾的智慧決定采集哪些有保存價值的政府社交媒體文件,從而將政府網(wǎng)絡(luò)信息資源采集與保存轉(zhuǎn)變?yōu)榛谏鐣庾R和社會驅(qū)動的存儲模式。[14]
2.開發(fā)智能化社交媒體信息存檔技術(shù)。當(dāng)前國內(nèi)在社交媒體信息捕獲方面,大多采用截圖、手動打印等傳統(tǒng)方法,而現(xiàn)有的針對淺層網(wǎng)的網(wǎng)頁自動采集方法并不能有效解決這類信息的采集問題。因此,由檔案部門與社交媒體平臺運(yùn)營商合作研發(fā)智能化的方法和工具來實(shí)現(xiàn)社交媒體信息的存檔,是我國開展政府社交媒體文件檔案化管理工作需要突破的重要問題。國外研發(fā)的ARCOMEM Crawler、Archive Social等智能化社交媒體信息存檔工具所實(shí)現(xiàn)的技術(shù)創(chuàng)新與突破可為國內(nèi)社交媒體信息存檔技術(shù)的研發(fā)提供參考。國內(nèi)在開發(fā)智能化的社交媒體信息存檔技術(shù)的過程中,可考慮以國外成功的實(shí)踐案例為“藍(lán)本”,結(jié)合實(shí)際需求,對現(xiàn)有的網(wǎng)絡(luò)信息存檔技術(shù)和方法進(jìn)行優(yōu)化,實(shí)現(xiàn)面向我國主流社交媒體信息存檔的智能化工具,通過技術(shù)創(chuàng)新,來減輕政府社交媒體文件存檔的工作量,降低信息保存成本,提高信息歸檔質(zhì)量。
3.建立分布式合作保存機(jī)制。政府社交媒體文件歸檔是一項持續(xù)而復(fù)雜的工程,需要發(fā)揮集體智慧的作用來共同解決。結(jié)合國情,國內(nèi)可建立由政府機(jī)構(gòu)為主導(dǎo)、檔案部門為責(zé)任主體、社交媒體運(yùn)營商參與,吸納那些對政府社交媒體文件歸檔保存的重要性有足夠認(rèn)識、有意向參與這項公益事業(yè)的公眾和社會組織所組成的分布式合作保存機(jī)制。其中,政府機(jī)構(gòu)應(yīng)發(fā)揮引導(dǎo)作用,獲得政策法規(guī)方面的支持,鼓勵公眾和社會組織參與政府社交媒體文件管理工作,利用群眾智慧來提高文件檔案管理的質(zhì)量。具備技術(shù)優(yōu)勢的社交媒體平臺運(yùn)營商需要在技術(shù)上改革創(chuàng)新提高社交媒體信息采集的效率與質(zhì)量,為政府社交媒體文件的歸檔提供重要的技術(shù)支撐。檔案部門需要制定科學(xué)規(guī)范的社交媒體文件采集標(biāo)準(zhǔn)、策略、方案等,確保資金與資源的有效利用與優(yōu)化配置,與政府機(jī)構(gòu)、社交媒體平臺運(yùn)營商、社會組織和公眾合作協(xié)調(diào)規(guī)劃任務(wù)框架,實(shí)現(xiàn)政府社交媒體文件歸檔工作的有序進(jìn)行。
*本文為吉林大學(xué)研究生創(chuàng)新基金資助項目“大數(shù)據(jù)環(huán)境下政府網(wǎng)站原生數(shù)字政務(wù)信息長期可存取研究”(項目編號:2016048)的研究成果之一。
注釋及參考文獻(xiàn):
[1]萬凱莉.論社交媒體信息的檔案化鑒定[J].檔案學(xué)研究,2016(1):62-66.
[2]UKGovernmentWebArchive[EB/OL].[2016-07-16].http://www.nationalarchives.gov.uk/webarchive/.
[3]State of North Carolina- Social Media Archive[EB/ OL].[2016-07-18].http://nc.gov.archivesocial.com/.
[4]王煥.國外政務(wù)社交媒體文件歸檔研究[J].檔案學(xué)研究,2015(6):99-105.
[5]黃霄羽,錢紅梅.你的網(wǎng)上記憶安全嗎——社交媒體文件權(quán)屬問題的思考[J].中國檔案,2014(4):68-69.
[6][8]趙躍.挑戰(zhàn)與應(yīng)對:我國政務(wù)新媒體文件歸檔若干問題思考[J].檔案學(xué)通訊,2016(3):80-86.
[7]劉海鑫,劉人境.集體智慧的內(nèi)涵及研究綜述[J].管理學(xué)報,2013(2):305-312.
[9]NARA. White Paper on Best Practices for the Capture of Social Media Records[EB/OL].[2016-07-21]. http://www.archives.gov/records- mgmt/resources/social? mediacapture.pdf.
[10]Espley S,Carpentier F,Pop R,et al. Collect,Pre? serve,Access:Applying the Governing Principles of the Na? tional Archives UK Government Web Archive to Social Media Content[J].Alexandria,2014(1):31-50.
[11]Thomas Risse, Elena Demidova, Stefan Dietze, ect. The ARCOMEM Architecture for Social and Semantic Driven Web Archiving[J].Future Internet, 2014(1):688-716.
[12]Operational selection policy OSP27 [EB/OL].[2016-07-26].
http://www.nation- alarchives.gov.uk/documents/in? formation-manage-ment/osp27.pdf.
[13]趙屹,陳曉暉,方世敏.Web2.0應(yīng)用:網(wǎng)絡(luò)檔案信息服務(wù)的新模式——以美國國家檔案與文件署(NARA)為例[J].檔案學(xué)研究,2013(5):74-81.
[14]Elena Demidova,Nicola Barbieri,Stefan Dietze.An? alyzing and Enriching Focused Semantic Web Archives for Parliament Applications [J].Future Internet, 2014(3):433-456.