楊智勇+史曉杰
摘 要:文章在概括和歸納大數(shù)據(jù)概念和特點(diǎn)的基礎(chǔ)上,分析了數(shù)字檔案館與大數(shù)據(jù)的關(guān)系,并闡述數(shù)字檔案館微服務(wù)的基本范疇:個(gè)性化、專題化、特殊化和差異化,提出微服務(wù)的實(shí)現(xiàn)途徑:微博、微信、手機(jī)短信、在線咨詢和個(gè)性化定制等服務(wù)方式。
關(guān)鍵詞:大數(shù)據(jù);數(shù)字檔案資源;微服務(wù)
隨著大數(shù)據(jù)時(shí)代的到來,無論對(duì)個(gè)人還是企事業(yè)單位以及社會(huì)乃至整個(gè)國家和世界,數(shù)據(jù)都已成為一種資產(chǎn)、一種寶貴的財(cái)富。而數(shù)字檔案館的檔案資源作為人類社會(huì)最精華、最寶貴的一種資產(chǎn)和財(cái)富,也將在大數(shù)據(jù)時(shí)代發(fā)揮其文化傳播和信息服務(wù)的作用。本文就數(shù)字檔案館應(yīng)用大數(shù)據(jù)的技術(shù)和理念探討一種新的信息服務(wù)方式——微服務(wù)。
1 大數(shù)據(jù)概述
維基百科定義大數(shù)據(jù)是:由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合,是基于云計(jì)算的數(shù)據(jù)處理與應(yīng)用模式,通過數(shù)據(jù)的整合共享,交叉復(fù)用形成的智力資源和知識(shí)服務(wù)能力。[1]盡管目前大數(shù)據(jù)還沒有統(tǒng)一定義,但對(duì)其存在一個(gè)共識(shí):大數(shù)據(jù)不是對(duì)數(shù)據(jù)量大小的定量描述,而是一種在種類繁多、數(shù)量龐大的多樣數(shù)據(jù)中進(jìn)行的快速信息獲取和應(yīng)用。
1.1 大數(shù)據(jù)的種類及特點(diǎn)。大數(shù)據(jù)的類型大概包括以下幾種:(1)數(shù)字化數(shù)據(jù):掃描并借助光學(xué)字符識(shí)別轉(zhuǎn)化而成電子形式的傳統(tǒng)文獻(xiàn)數(shù)據(jù),其主要存在于國家和地方的檔案、圖書等文獻(xiàn)數(shù)據(jù)資源庫中;(2)自然數(shù)據(jù):即直接形成用于計(jì)算機(jī)和數(shù)據(jù)處理系統(tǒng)的數(shù)據(jù),其主要存在于應(yīng)用程序、管理平臺(tái)、交易系統(tǒng)、數(shù)據(jù)庫、電子郵件、公眾網(wǎng)絡(luò)、社交媒體及GPS定位系統(tǒng)中;(3)模擬數(shù)據(jù):是從物理世界中發(fā)散出來但可以不斷被轉(zhuǎn)化成數(shù)字格式的,其主要存在于手機(jī)、相機(jī)、攝像設(shè)備、傳感器以及可穿戴設(shè)備中。[2]以上數(shù)據(jù)以實(shí)時(shí)、迭代的方式不斷產(chǎn)生、轉(zhuǎn)化和融合。
大數(shù)據(jù)的特點(diǎn)從理論角度可以概括為“4V”:大量(Volume),數(shù)據(jù)從TB躍升到PB甚至是ZB;多樣(Variety),數(shù)據(jù)來源多和數(shù)據(jù)類型多;價(jià)值(Value),單個(gè)有價(jià)值的數(shù)據(jù)比例越來越小,但龐大的數(shù)據(jù)量蘊(yùn)含巨大價(jià)值;快速(Velocity),數(shù)據(jù)增長速度快,數(shù)據(jù)處理速度快。從實(shí)踐角度可以概括為“三性”:全體性,收集和分析更多的數(shù)據(jù)去分析和解決問題;混雜性,從大量混雜的數(shù)據(jù)中判斷某種大的方向;相關(guān)性,利用大數(shù)據(jù)背后的相關(guān)性分析現(xiàn)狀和預(yù)測未來。
1.2 數(shù)字檔案館已具備大數(shù)據(jù)的基本特征
(1)數(shù)字檔案館的信息資源總量龐大且增長迅速。2013年6月8日,江蘇省檔案局副局長張姬雯介紹江蘇省截至2012年底共存儲(chǔ)數(shù)字檔案資源總量為33TB,[3]如果推算到全國大概接近1PB,所以,全國數(shù)字檔案館的信息資源總量已經(jīng)是一個(gè)龐大的數(shù)據(jù)集。2013年3月3日,國家檔案局局長楊冬權(quán)在提交的《關(guān)于隨館藏?cái)?shù)量增加而相應(yīng)增加各級(jí)國家檔案館人員編制的提案》中提到:2011年省、地、縣三級(jí)國家檔案館館藏總量比1987年館藏量增長了5倍,而到2020年將比1987年增加近10倍,[4]可見數(shù)字檔案館的信息資源總量增長速度也比較快。
(2)數(shù)字檔案館的信息資源與大數(shù)據(jù)在內(nèi)容價(jià)值上是相互交叉的。一方面,數(shù)字檔案館的信息資源是大數(shù)據(jù)的重要組成部分。因?yàn)閿?shù)字檔案資源最重要的特點(diǎn)是有機(jī)聯(lián)系,而大數(shù)據(jù)的主要特點(diǎn)也是相關(guān)性,因此,本身即存在有機(jī)聯(lián)系或存在潛在聯(lián)系的數(shù)字檔案資源是大數(shù)據(jù)極其精華的一部分。另一方面,大數(shù)據(jù)又可以劃歸為數(shù)字檔案資源的理論范疇內(nèi)。因?yàn)榇髷?shù)據(jù)也是國家機(jī)構(gòu)、社會(huì)組織或個(gè)人在社會(huì)活動(dòng)中直接形成的各種形式的信息記錄。如:手機(jī)運(yùn)營商掌握的人們實(shí)時(shí)通信記錄,金融行業(yè)掌握的國家、機(jī)構(gòu)和個(gè)人資金交易記錄,網(wǎng)絡(luò)服務(wù)商掌握的人們各種社會(huì)交往、交流記錄,監(jiān)視器留下的人們行動(dòng)的信息記錄……這些都是大數(shù)據(jù)內(nèi)容,而從“大檔案”觀的角度看,這些大數(shù)據(jù)又是數(shù)字檔案資源的組成部分。
(3)數(shù)字檔案館的信息資源在形式類型上像大數(shù)據(jù)一樣更加復(fù)雜多樣。過去的數(shù)字檔案資源類型主要是檔案數(shù)字化后形成以數(shù)據(jù)庫為載體的結(jié)構(gòu)化數(shù)據(jù);而大數(shù)據(jù)時(shí)代非結(jié)構(gòu)化數(shù)據(jù)大量產(chǎn)生,如:各種格式的辦公文檔、文本、圖片、XML、HTML、各類報(bào)表、圖像和音頻/視頻信息,等等,這就使得數(shù)字檔案資源的類型越來越復(fù)雜多樣且難以管理。
2 大數(shù)據(jù)時(shí)代數(shù)字檔案館微服務(wù)的基本范疇
筆者所提的數(shù)字檔案館微服務(wù)是相對(duì)于傳統(tǒng)檔案服務(wù)在大數(shù)據(jù)時(shí)代的一種全新服務(wù)方式,其內(nèi)涵可以概括為:借助于全媒體信息、高速網(wǎng)絡(luò)和移動(dòng)通信等技術(shù)充分挖掘數(shù)字檔案館特有的文獻(xiàn)資源,為用戶提供細(xì)微化、個(gè)體化、差異化的利用服務(wù)。微服務(wù)與傳統(tǒng)服務(wù)的區(qū)別在于:傳統(tǒng)服務(wù)是“我提供什么,你就接受什么”的以檔案部門為主體的服務(wù),微服務(wù)則是“你需要什么,我就提供什么”的以用戶為主體的服務(wù)。數(shù)字檔案館微服務(wù)的基本范疇包括:
2.1 個(gè)性化服務(wù)。傳統(tǒng)檔案服務(wù)側(cè)重于宏觀層面的整體服務(wù),服務(wù)模式是普適的、大眾的,對(duì)微觀層面的個(gè)性化需求考慮較少。微服務(wù)是將檔案用戶細(xì)分為每個(gè)個(gè)體,通過短信提醒、信息推送等方式為個(gè)體用戶提供滿足個(gè)人工作、學(xué)習(xí)、生活等多種個(gè)性化需求的功能性服務(wù)。個(gè)性化服務(wù)體現(xiàn)在三個(gè)方面:一是實(shí)現(xiàn)數(shù)字檔案信息服務(wù)時(shí)空的個(gè)性化,即用戶可以隨時(shí)隨地獲取其所需的檔案信息;二是實(shí)現(xiàn)服務(wù)方式的個(gè)性化,即根據(jù)用戶個(gè)人的利用習(xí)慣和利用方式來開展數(shù)字檔案信息服務(wù);三是提供個(gè)性化的服務(wù)內(nèi)容,即根據(jù)不同用戶的需求,結(jié)合用戶的個(gè)人背景和需求特點(diǎn),有針對(duì)性地使用戶能獲其所需,得其所要。[5]
2.2 專題化服務(wù)。專題化服務(wù)是檔案信息的主要服務(wù)方式,如針對(duì)重大活動(dòng)、重大事件、重要文化宣傳、重要民生問題等,通過有針對(duì)性的收集、整理和編研形成專題成果來提供服務(wù)。微服務(wù)中的專題化是對(duì)傳統(tǒng)檔案專題服務(wù)的有益補(bǔ)充,它是針對(duì)當(dāng)前數(shù)字信息越來越繁雜和多元,用戶難以從浩如煙海的信息中完全獲取有用的信息,尤其是散狀分布、稍縱即逝的微內(nèi)容。因此,檔案人員根據(jù)某一專題對(duì)數(shù)字檔案資源進(jìn)行檢索、挖掘、整序、定制和篩選,形成相對(duì)集中有序、細(xì)化的專題知識(shí)數(shù)據(jù),方便用戶隨時(shí)獲取。
2.3 特殊化服務(wù)。傳統(tǒng)檔案服務(wù)主要是借助紙質(zhì)檔案和老照片的借閱和展示以及對(duì)檔案數(shù)字化后的數(shù)據(jù)庫進(jìn)行脫機(jī)或聯(lián)機(jī)檢索。而現(xiàn)今如平板電腦、電子閱讀器、手機(jī)等逐漸成為主流利用載體,因其易用性、便攜性、多樣性等優(yōu)點(diǎn),深受廣大青年用戶喜愛。因此,開發(fā)針對(duì)新型載體的服務(wù)平臺(tái),提供獨(dú)具檔案館特點(diǎn)的內(nèi)容服務(wù),實(shí)現(xiàn)與平板電腦、手機(jī)等利用載體的無縫對(duì)接,這將對(duì)數(shù)字檔案館服務(wù)產(chǎn)生創(chuàng)新性的改革。目前,國內(nèi)已經(jīng)有檔案館利用WAP網(wǎng)站或APP實(shí)現(xiàn)豐富靈活的檔案信息服務(wù),這些服務(wù)可以向移動(dòng)終端用戶提供館藏資源查詢、珍品推薦、歷史探究、在線展廳、利用案例、檔案信息動(dòng)態(tài)等服務(wù)內(nèi)容。
2.4 差異化服務(wù)。不同年齡、不同職業(yè)、不同教育背景的用戶,對(duì)檔案信息的需求有著較大差異。因此,面對(duì)這些水平各異的用戶如何滿足其差異化的需求既是檔案館服務(wù)的重點(diǎn)也正符合微服務(wù)的初衷,微服務(wù)本身的特殊性決定了它能夠?yàn)楦鞣N類型的用戶提供不同的服務(wù)。例如,針對(duì)普通民眾的民生問題提供婚姻檔案、房產(chǎn)檔案服務(wù),針對(duì)涉案人員關(guān)于知情權(quán)和證據(jù)憑證問題提供政策信息和檔案憑證服務(wù),針對(duì)學(xué)者、研究人員關(guān)于歷史研究和文化傳承問題提供歷史檔案、檔案文化服務(wù),針對(duì)科技人員、工程人員關(guān)于經(jīng)濟(jì)建設(shè)和城市發(fā)展問題提供科技檔案和城建檔案服務(wù),等等。而且不同的人針對(duì)同一問題會(huì)有不同的需求,所以,為不同需求的目標(biāo)用戶群提供差異化服務(wù)也是今后數(shù)字檔案信息服務(wù)的主要方向。[6]
3 大數(shù)據(jù)時(shí)代數(shù)字檔案館微服務(wù)的實(shí)現(xiàn)途徑
2011年9月27日,國家檔案局局長楊冬權(quán)在全國檔案宣傳工作會(huì)議上強(qiáng)調(diào):“注重發(fā)揮各種新興媒體的宣傳作用,比如動(dòng)漫的形式、網(wǎng)絡(luò)視頻的形式、手機(jī)短信的形式、電視滾動(dòng)字幕的形式、戶外電子屏信息的形式、電子書的形式、微博的形式等,從而拓展宣傳形式、手段和載體,占領(lǐng)新興媒體陣地,進(jìn)一步豐富和創(chuàng)新傳播渠道,吸引更多的宣傳受眾?!盵7]
由此可見,微博、微信、短信、電子書、社交網(wǎng)絡(luò)等新媒體形式既是檔案宣傳的新途徑,也將是數(shù)字檔案館微服務(wù)的新途徑。
3.1 微博服務(wù)。微博作為一種網(wǎng)絡(luò)上分享、傳播和交流信息的平臺(tái),其在信息發(fā)布、網(wǎng)絡(luò)營銷、政府管理以及個(gè)人交流等諸多方面都得到廣泛應(yīng)用和發(fā)展,而且微博在泛內(nèi)容、大眾化內(nèi)容的基礎(chǔ)上,開始涌現(xiàn)出一些垂直化、精細(xì)化的內(nèi)容,對(duì)于用戶個(gè)性化需求滿意度逐步提升。2014年7月21日,第34次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示:截至2014年6月底,我國微博用戶規(guī)模為2.75億;其中手機(jī)微博用戶數(shù)為1.89億,占所有微博用戶的68.7%。[8]目前,越來越多的檔案館通過開通官方微博向社會(huì)公眾提供方便快捷的檔案服務(wù),微博服務(wù)已逐漸成為數(shù)字檔案館微服務(wù)的主要途徑之一。
通過開通微博,數(shù)字檔案館可以將檔案館的使命、目標(biāo)、愿景等傳達(dá)給用戶,也可以將檔案館的活動(dòng)動(dòng)態(tài)、館藏信息、文化教育、服務(wù)項(xiàng)目等發(fā)送給用戶,拉近檔案館與廣大公眾的距離,提高檔案信息服務(wù)的范圍和質(zhì)量,進(jìn)而提高社會(huì)的檔案意識(shí);另外,通過微博,檔案館人員之間可以就工作中的問題進(jìn)行交流,共享信息,增強(qiáng)協(xié)作,共建信任,為更好地服務(wù)社會(huì)創(chuàng)造條件。目前,較有影響和特色的檔案館微博有:“蘇州檔案”、“銀川檔案”、“撫順檔案”等。
3.2 微信服務(wù)。微信是騰訊公司于2011年推出的一個(gè)為智能終端提供即時(shí)通訊服務(wù)的應(yīng)用程序,它支持跨通信運(yùn)營商、跨操作系統(tǒng)平臺(tái)通過網(wǎng)絡(luò)快速發(fā)送語音、視頻、圖片和文字等功能,目前國內(nèi)用戶已超5億。基于龐大的用戶群體,在數(shù)字檔案館服務(wù)中應(yīng)用微信這類新興的信息傳播和共享平臺(tái),既可以改善檔案服務(wù)過程中的弱互動(dòng)性,還可以提高檔案信息服務(wù)的共享性和智能化水平,微信服務(wù)也將成為未來數(shù)字檔案館微服務(wù)的重要途徑。
檔案館通過建立微信公共平臺(tái),有利于提高檔案信息服務(wù)的關(guān)注度,通過對(duì)進(jìn)出檔案館或附近的目標(biāo)人群定位,即可“一對(duì)一”式主動(dòng)致以問候;利用微信公共平臺(tái)可以較大范圍地綁定用戶群,從而更好地掌握用戶需求;通過微信公共平臺(tái)的自助服務(wù),用戶可以隨時(shí)了解所需信息,有利于提高用戶的自主性和自發(fā)性活動(dòng),從而從根本上提高檔案服務(wù)的個(gè)性化水平。[9]目前,山東省檔案館、天津泰達(dá)圖書館檔案館、海鹽檔案館等已開通了微信公共平臺(tái)。
3.3 手機(jī)短信服務(wù)。短信作為手機(jī)最傳統(tǒng)、最基本的功能之一,至今一直是人們進(jìn)行信息交流的有效工具,而這一服務(wù)也正好迎合大數(shù)據(jù)時(shí)代人們對(duì)檔案信息“短、平、快”的需要特點(diǎn)。手機(jī)短信服務(wù)主要內(nèi)容包括:檔案信息咨詢、檔案信息發(fā)布以及個(gè)性化短信服務(wù)。檔案信息咨詢是用戶將自己所要查閱或咨詢的問題以短信方式發(fā)送到檔案部門,檔案人員首先根據(jù)系統(tǒng)預(yù)先設(shè)定的常見問題提供解答,然后對(duì)未能解答問題進(jìn)行分析和整理,最后將相關(guān)信息發(fā)送給用戶;檔案信息發(fā)布是將檔案方面的新聞動(dòng)態(tài)、政策法規(guī)、重要活動(dòng)等以短信形式發(fā)送給用戶;個(gè)性化短信服務(wù)是用戶根據(jù)需求定制自己感興趣的檔案信息,檔案人員可以定期或不定期將這些信息發(fā)送給用戶。
3.4 在線咨詢服務(wù)。在線咨詢(又稱“在線客服”)是新一代的網(wǎng)絡(luò)商務(wù)即時(shí)通訊系統(tǒng),它以網(wǎng)頁為載體,為網(wǎng)站訪客提供方便快捷的交流方式。在線咨詢已經(jīng)在消費(fèi)、服務(wù)、醫(yī)療、通信、金融等行業(yè)有了較為成熟和普遍應(yīng)用。盡管目前國內(nèi)很多檔案部門已經(jīng)在網(wǎng)站首頁設(shè)置了檔案咨詢功能,但絕大多數(shù)都是靜態(tài)和滯后的。而微服務(wù)的理念即是倡導(dǎo)用戶參與,只有用戶積極響應(yīng)才可以反饋檔案館所提供的服務(wù)是否令人滿意,才能真正了解用戶的需求。因此,檔案館可以借鑒商業(yè)客服的在線咨詢服務(wù)方式,當(dāng)用戶查找信息遇到困難時(shí),自動(dòng)彈出檔案館在線客服的即時(shí)對(duì)話框,使檔案信息服務(wù)人員隨時(shí)“守候”在用戶身邊,及時(shí)解決用戶在檔案利用過程中的問題。
3.5 個(gè)性化定制服務(wù)。傳統(tǒng)的檔案利用系統(tǒng)是為所有專業(yè)、層次、地域的用戶提供統(tǒng)一的資源和服務(wù),而大數(shù)據(jù)時(shí)代提倡個(gè)性化、差異化的微服務(wù),就需要開發(fā)新型的數(shù)字檔案資源利用系統(tǒng),為用戶量身定做專門的數(shù)字檔案資源和服務(wù)。該系統(tǒng)可以設(shè)計(jì)三大模塊:一是數(shù)據(jù)資源模塊,其中設(shè)置“我的專題檔案資料”、“我的個(gè)人數(shù)據(jù)資料”、“我的參考資料”等選項(xiàng),將用戶最常用的數(shù)字檔案資源作為首層列出,便于檢索和利用;二是網(wǎng)絡(luò)資源模塊,其中設(shè)置“我的收藏夾”、“我的個(gè)人鏈接”、“我的搜索引擎”等選項(xiàng),將用戶經(jīng)常查找的網(wǎng)絡(luò)檔案資源有效組織起來,滿足其多元化的信息組合需求;三是服務(wù)功能模塊,通過設(shè)置“我的檔案館員”、“我的檔案新聞”、“我的檢索界面”、“我的幫助”等選項(xiàng),使用戶與相應(yīng)的檔案館員建立直接聯(lián)系,為其提供檔案咨詢服務(wù),并使用戶及時(shí)獲取有針對(duì)性的與檔案相關(guān)的動(dòng)態(tài)信息內(nèi)容。[10]
4 結(jié)束語
《大數(shù)據(jù)時(shí)代》一書中提到:“數(shù)據(jù)價(jià)值的關(guān)鍵在于其無限的再利用,即它的潛在價(jià)值。收集信息固然至關(guān)重要,但還遠(yuǎn)遠(yuǎn)不夠,因?yàn)榇蟛糠值臄?shù)據(jù)價(jià)值在于它的使用,而不是占有本身?!盵11]因此,數(shù)字檔案館的檔案資源作為大數(shù)據(jù)最重要的一部分,要充分發(fā)揮其價(jià)值,也需要從以“藏”為主向以“用”為主轉(zhuǎn)變,從“被動(dòng)服務(wù)”向“主動(dòng)服務(wù)”轉(zhuǎn)變,將宏觀、大眾化服務(wù)與微觀、個(gè)性化服務(wù)有機(jī)結(jié)合。而微服務(wù)作為一種“短、平、快”的服務(wù)方式,它將成為傳統(tǒng)檔案服務(wù)的有益補(bǔ)充和有效改進(jìn),將會(huì)更加貼近用戶并為其提供更加細(xì)微、專業(yè)的服務(wù)。
參考文獻(xiàn):
[1]大數(shù)據(jù)[EB/OL].[2013-08-02].http://zh.wikipedia.org/zh/%E5%A4%A7%E6%95%B0%E6%8D%AE.
[2]Presidents Council of Advisors on Science & Technology.Big Data and Privacy: A Technological Perspective[R].The White House,2014:18~22.
[3]江蘇檔案資源總量居全國前列,“死”檔案變?yōu)椤盎睢辟Y源[EB/OL].[2013-06-08].http://news.jschina.com.cn/system/2013/06/08/017577171.shtml.
[4]楊冬權(quán).關(guān)于隨館藏?cái)?shù)量增加而相應(yīng)增加各級(jí)國家檔案館人員編制的提案[N].中國檔案報(bào),2013:3~7.
[5][10]李漫,李紅梅.基于數(shù)字檔案館的檔案信息個(gè)性化服務(wù)研究[J].湖北檔案,2010(2):25~26.
[6]張英.微服務(wù):開創(chuàng)圖書館服務(wù)的“藍(lán)海”[J].圖書館建設(shè),2011(7):51~52.
[7]楊冬權(quán)在全國檔案宣傳工作會(huì)議上的講話[EB/OL].[2011-10-03].http://www.zgdazxw.com.cn/NewsView.asp?ID=16066.
[8]第34次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[EB/OL].[2014-07-21]. http://www.cnnic.cn/hlwfzyj/hlwxzbg/hlwtjbg/201407/P020140721507223212132.pdf.
[9]李明玉,周耀林.檔案網(wǎng)絡(luò)化社會(huì)服務(wù)探微[J].湖北檔案,2014(3):15~16.
[11][英]維克托·邁爾-舍恩伯格,等.大數(shù)據(jù)時(shí)代[M].盛楊燕,周濤譯.杭州:浙江人民出版社,2012:165.
(作者單位:楊智勇,上海大學(xué)圖書情報(bào)檔案系; 史曉杰,開封市城市建設(shè)檔案館 來稿日期:2014-08-08)