蘇君華/上海大學圖書情報檔案系 姜 璐/南昌大學人文學院歷史系
加拿大學者Terry Cook曾提出檔案第四范式[1],即檔案工作者與社會/社區(qū)(既有城市和鄉(xiāng)村的真實社會/社區(qū),又有網(wǎng)絡空間社會連接的虛擬社會/社區(qū))共建檔案,由專業(yè)檔案員鼓勵和指導大眾參與建檔。隨著“協(xié)同共建共享”服務理念的逐步確立以及互聯(lián)網(wǎng)的普及,檔案機構與用戶、用戶與用戶之間的聯(lián)系日益密切,檔案用戶參與檔案信息資源建設儼然成為時代所趨。而以互聯(lián)網(wǎng)為依托的檔案眾包模式則應運而生,成為溝通檔案機構與用戶、用戶與用戶的橋梁與紐帶,使得用戶參與檔案資源建設成為可能。
2006年杰夫·豪(Jeff Howe)首次提出“眾包”[2]一詞,并對其進行了定義。眾包活動自身所具有的互聯(lián)、共享、共建特征,使得它在檔案信息資源建設中的應用與研究越來越得到認同。
檔案眾包是以檔案機構、社會公眾為主體,檔案資源為對象,互聯(lián)網(wǎng)技術為依托而開展的檔案資源建設實踐。近年來,該領域備受相關學者關注。
第一,從內涵界定來看,國內外學者對檔案眾包理論的研究均始于21世紀初,研究時間較短,對于檔案眾包的內涵界定也尚未有統(tǒng)一的說法,但大都從信息資源建設(孫洋洋,2015)、數(shù)字檔案資源建設參與模式(加小雙等,2016)、檔案眾包實踐操作(謝曉萍等,2015)等角度進行闡釋。第二,從研究視角來看,大部分學者均是從檔案信息資源建設的角度來探討檔案眾包的實施框架與路徑(聶永浩等,2019)、發(fā)展策略(趙宇,2017)、模式研究(董雨等,2019)等,提出檔案眾包是推動大眾參與檔案信息資源開發(fā)建設的新途徑、新模式。第三,從研究范疇來看,主要涉及對檔案眾包典型案例的分析與介紹和對檔案眾包某一具體環(huán)節(jié)的研究兩個方面。對于檔案眾包具體環(huán)節(jié)的研究主要包括平臺建設(姚倩雯,2019)、質量管理與評價(鍋艷玲等,2019)以及公眾參與激勵機制(晏秦,2017)等。綜上,檔案眾包是公眾參與檔案資源建設、發(fā)展檔案服務的重要探索。
眾包理念自2006年提出后被廣泛運用于各個領域,近十年來在國內外也掀起了一股對檔案眾包實踐探析的熱潮,主要有以下兩方面。
第一,國外實踐研究。國外檔案眾包實踐起步較早,發(fā)展也較為成熟,在美國、蘇格蘭等地都有許多成功案例,如美國的“公民檔案工作者”(Citizen Archivist)項目、蘇格蘭的“檔案轉錄”項目等,不僅吸引了大量社會公眾參與,還取得了較好的實踐成果,其中美國“公民檔案工作者”項目還獲得了美國2012年度政府最佳創(chuàng)新實踐獎。在這些眾包案例中公眾參與任務主要為檔案轉錄、添加標簽以及OCR校對3種。此外,參與者還可通過轉錄舊天氣、當志愿者、上傳和分享檔案、編輯維基文章、提出建議等方式參與。第二,國內實踐研究。我國檔案眾包實踐起步較晚,2015年國內省級檔案館僅遼寧省檔案館有進行檔案眾包實踐探索。近年來,隨著“互聯(lián)網(wǎng)+”的普及,國內檔案眾包項目數(shù)量有所增加,但仍處于初步發(fā)展階段。通過研究發(fā)現(xiàn),我國檔案眾包活動主要為檔案轉錄和征集兩種,典型案例有上海市圖書館歷史文獻中心開展的“盛宣懷檔案抄錄項目”[3]、青島市檔案館[4]與多家媒體共同啟動的檔案征集活動、沈陽市檔案館網(wǎng)站“家庭檔案”模塊[5]等。
對國內外檔案眾包實踐案例進行研究,根據(jù)檔案業(yè)務管理活動可將檔案眾包模式分為“用戶收集檔案”“用戶整理檔案”“用戶編研檔案”“用戶鑒定檔案”4種。
“用戶收集檔案”指檔案部門為豐富某一主題檔案館藏資源而發(fā)布相關檔案資源征集任務,公眾根據(jù)項目要求自愿向平臺提交個人所擁有檔案資源。該模式在構建社會記憶、彌補歷史空白等方面有著不可比擬的優(yōu)勢,尤其是在重大突發(fā)事件和歷史重大事件檔案的補充中,這種優(yōu)勢更為突出。但這一優(yōu)勢的發(fā)揮須保證收集成果真實準確,為此檔案部門在開展此類活動時應加強對其成果質量的監(jiān)督與控制。
“用戶收集檔案”模式的檔案眾包活動通常屬于較低層次的檔案資源開發(fā)項目,具有以下特征:第一,參與主體多元。在“用戶收集檔案”模式下,檔案資源的收集主體不再只有檔案專業(yè)管理人才這一單一結構,還包括擁有相關主題檔案資源的社會公眾。如美國“颶風數(shù)字記憶銀行”項目規(guī)定凡13歲以上的社會大眾均可在規(guī)定模塊上傳自己的故事、圖片和音頻參與該項目[6];浙江省“浙江記憶工程”呼吁社會公眾主動參與,鼓勵其分享檔案數(shù)據(jù)給檔案館[7]。第二,收集對象復雜。新型載體(磁盤、光盤、膠片等)的出現(xiàn)使得檔案類型不斷豐富。為更加全面地豐富館藏結構,檔案收集對象也需由原來單一的紙質檔案轉變?yōu)榧堎|檔案與新型檔案。如國家圖書館啟動的中國戰(zhàn)“疫”記憶庫項目的征集對象除戰(zhàn)“疫”手稿、書畫墨跡類材料外,還包括照片、數(shù)字資源以及版權和口述史料等[8];澳大利亞“發(fā)現(xiàn)米爾登霍爾的堪培拉”項目[9]由檔案部門與公眾共同建立米爾登霍爾照片數(shù)據(jù)集,目前已收集300余組照片檔案。
“用戶整理檔案”指檔案部門借助社會公眾力量對已有檔案資源進行轉錄、著錄、標引等,保證檔案信息資源的可讀性和可用性。由于該模式眾包內容繁瑣、持續(xù)時間長,檔案館工作人員時間精力有限[10],需借助社會公眾力量才能完成。但該模式的成功進行需參與者持續(xù)保持積極性,因而檔案部門在開展此類項目時應設置有效的用戶激勵機制來維持參與者的持續(xù)積極性,以保證項目順利完成。
“用戶整理檔案”模式下的檔案眾包活動主要是以檔案資源優(yōu)化為目的的勞動密集型項目,具有以下特征:第一,參與主體限定。該模式下的眾包活動雖未明確對參與者的個人素養(yǎng)、專業(yè)素質進行規(guī)定,實則卻存在一定程度的要求,這也是其與“用戶收集檔案”模式的主要區(qū)別之一。因此,通常參與者在通過注冊申請后還需要接受專業(yè)培訓或學習才能參與到項目中去,如蘇格蘭“轉錄檔案”項目、荷蘭“眾在參與”項目等都明確規(guī)定參與者需通過專業(yè)培訓、學習后方可接觸具體項目。第二,整理內容復雜。檔案整理工作的內容最常見的有檔案轉錄、檔案著錄、檔案標引、貼標簽四項內容,這也是當前“用戶整理檔案”模式的典型內容,如英國“檔案志愿者”項目、新加坡“公民檔案員計劃”等都有涉及以上內容。除此之外,整理工作有時還會涉及檔案地理定位、檔案數(shù)字化、字幕制作、語言翻譯等內容,典型代表有美國愛荷華大學DIY History項目、莫斯科大劇院“發(fā)現(xiàn)大劇院歷史”項目等。
“用戶編研檔案”主要表現(xiàn)為吸引和鼓勵社會公眾積極參與檔案館館藏的編研活動(如編輯維基文章等),為檔案資源深層次的開發(fā)利用建言獻策。該模式中社會公眾可通過互動對話的方式就檔案編研主題向檔案部門提出自己的見解和建議,但這種模式的實現(xiàn)需要依托功能強大的眾包平臺,因而檔案部門在開展此類項目時需加大對平臺建設的投入,為參與者提供一個良好的中端交互環(huán)境。
“用戶編研檔案”模式下的眾包項目是對檔案資源進行更深層次開發(fā)的活動,具有以下特征:第一,主體互動性強。在眾包項目過程中主要涉及參與者與檔案部門這兩類主體,在項目進程中他們需要通過持續(xù)的互動交流來實現(xiàn)對檔案資源信息的表達和接收。如澳大利亞歐茲馬戲團檔案館鼓勵參與者參與其網(wǎng)上展示視頻的討論[11];英國“檔案志愿者”項目中公眾可以通過發(fā)表意見行使志愿者職能,且無論贊譽、評論或抱怨檔案館均會予以回應,并公布互動、反饋結果[12]。第二,內容主觀性強。 用戶參與檔案編研的途徑主要包括發(fā)表評論、添加故事、編輯維基百科、添加描述、添加注釋等,以上內容成果大部分都屬于參與者自身的思維創(chuàng)作資源,帶有較強的主觀色彩和個人意識。如在澳大利亞“目的地:澳大利亞——分享我們的戰(zhàn)后移民故事”項目[13]中,參與者所添加的200余個故事均是參與者的親身經(jīng)歷或見證的移民故事;在遼寧省檔案館的“社會檔案人”[14]中,公眾雖是依托已有的館藏資源對百度百科的檔案資源進行編輯,但編輯的方式與語言風格仍具有較強的主觀性。
“用戶鑒定檔案”模式下眾包內容主要為公眾對項目檔案內容進行識別、糾錯以及鑒定真?zhèn)?,以保證檔案信息資源的真實性和完整性。這一模式眾包活動可分為鑒別與糾錯兩種,前者的參與對象以專家為主,后者則以普通公眾為主。因此檔案部門在開展此類項目時應準確判斷項目難度和類型,精準招募項目成員,避免造成不必要的資源和人才浪費。
“用戶鑒定檔案”模式是公眾參與檔案眾包的較高層次途徑,具有以下特征:第一,參與主體不定。這一模式下的參與主體既可以是單獨的個體即社會公眾與專家各自分別參與,又可以是聯(lián)合的群體即社會公眾與專家共同參與。如蘇州市的中國絲綢檔案館為保證所征集絲綢檔案的真實、有效,組織成立了由有一定專長的社會公眾和檔案專家共同組成的征集檔案鑒定評估專家組,對絲綢檔案的年代、真?zhèn)?、價值等進行鑒定[15];而英國國家檔案館的用戶鑒定小組則就只由專家或技術研究人員構成。第二,支付成本高。主要體現(xiàn)在對檔案界人才以及專家團隊的雇傭費用高。當涉及對某一專業(yè)領域檔案資源的真?zhèn)舞b定時,普通的項目參與者是無法參與審核的,尤其是當鑒定內容涉及檔案專業(yè)以外的其他技術領域、歷史領域等范圍時,檔案部門需要專門聘請擅長該領域的專家團隊來協(xié)助審核,才能保證審核過程的專業(yè)性和審核結果的科學性。
為保證檔案眾包項目按時保質保量完成,檔案機構和相關主體需提高平臺準入門檻、完善平臺功能、嚴控成果審核程序并輔以有效的激勵機制,對檔案眾包項目進行全面系統(tǒng)的監(jiān)管,將質量控制貫穿于眾包項目的始終。
第一,高身份認證門檻,從源頭處將“惡意”參與者排除在眾包系統(tǒng)之外。一般來講,身份認證內容主要包括參與者的姓名、性別、身份證號、知識水平、空閑時間段、誠信度等。其中參與者的空閑時間段和誠信度是保證眾包成果質量的關鍵因素,對“用戶整理檔案”模式下的眾包項目尤為重要。因此平臺需就用戶的個人信息向有關征信系統(tǒng)進行核實,只有通過身份、信用審核并擁有較多空閑時間的用戶才能成為眾包項目成員。但筆者訪問國內現(xiàn)有檔案眾包項目平臺,發(fā)現(xiàn)當前僅有上海市圖書館歷史文獻平臺要求用戶需經(jīng)實名認證注冊才能接受任務,不過沒有收集用戶個人誠信度、空閑時間等方面的信息,可能導致任務完成度低、審核通過率不高等問題。
第二,豐富素質測評內容,為參與者能力與任務匹配機制提供科學數(shù)據(jù)。為保證眾包成果的質量,通過審核的用戶還不能馬上參與到具體項目中去,還需進行多方位的素質測評,主要包括對參與者的基本文學知識、檔案常識、專業(yè)素養(yǎng)和技能進行測評,依據(jù)測評結果可將參與者劃分為三類:初級參與者、中級參與者、資深參與者,并將這三類參與者分別對應分配到“用戶收集檔案”“用戶整理檔案”“用戶編研檔案”“用戶鑒定檔案”4種模式下的項目中去,實現(xiàn)從根本上解決眾包成果質量良莠不齊問題的目標。在2018年8月英國國家檔案館發(fā)布的《英國國家檔案館志愿者手冊》與《志愿政策》[16][17]中就明確提出應根據(jù)志愿者的能力和背景精準分配任務,以保證任務質量。
第一,抓住參與者的內在性動機,設置無償激勵機制。參與者的內在性動機指用戶參與眾包項目完全是出于對項目內容感興趣,想從中獲取成就感與榮譽感。因此,檔案館可以通過緊抓住參與者的內在性需求,設置積分獎勵或個人貢獻度排名等方式賦予他們足夠的榮譽感與成就感,讓他們切實地感受到被滿足與被重視,從而獲得用戶持續(xù)積極參與眾包活動的內驅力。如美國國家圖書館利用積分、貢獻排行榜激勵用戶積極參與照片分類、評論、標注,僅10天就收到10000多條標注和2000多條評論;芬蘭圖書館的報紙數(shù)字化、糾錯等項目以游戲通關的形式進行。
第二,把握參與者的外在性動機,設置有償獎勵機制。參與者的外在性動機是指用戶參與眾包項目與項目本身無關而是被一些外在性的激勵因素吸引過來的,通常表現(xiàn)為貨幣報酬或物質獎勵等有償獎勵方式。陳翀、羅文馨等在對北京師范大學圖書館書評眾包中用戶的參與意愿進行問卷調查時發(fā)現(xiàn),獎勵對提高用戶參與意愿的作用最大[18]。因此,檔案部門應根據(jù)參與者的外在性需求,在項目的不同環(huán)節(jié)合理增加相應的物質、經(jīng)濟獎勵,以維持參與者的持續(xù)活躍性。如蘇格蘭的“檔案轉錄”項目規(guī)定,項目參與者可免費瀏覽、下載或拷貝原本需要付費的檔案圖片以作為用戶參與的回饋[19],且截至2015年就共有3631個志愿者參與到其中,完成了112100頁的文件轉錄。
第一,參與者之間可利用該功能進行經(jīng)驗交流和成果互審。該功能可適用于不同模式的用戶交流,如“用戶整理檔案”模式的參與者可借助IM(QQ群、微信群等途徑)分享個人總結的檔案轉錄技巧、貼標簽的操作要點等;“用戶編研檔案”模式的不同參與者可就相同主題提出不同的理解和建議,從而碰撞出思維的火花;“用戶鑒定檔案”模式的參與者可通過該功能實現(xiàn)成果互審,以及時修正明顯錯誤。在英國“檔案志愿者”活動中明確提出志愿者可以通過用戶論壇進行一問一答式交流來表達自己的心聲,并將用戶討論結論以PDF形式公布出來[20]。
第二,檔案人員可借助該功能進行線上指導和問題仲裁。當參與者面臨編輯百科詞條、檔案信息添加與分析等專業(yè)技能要求較高的“用戶編研檔案”任務時,檔案人員可通過線上交流社區(qū)對參與者進行遠程指導和答疑。并在參與者之間就某個問題爭論不休、難以定奪時,檔案人員亦可通過IM功能及時從專業(yè)的角度對其進行線上商議定奪,從而為檔案眾包的質量提供專業(yè)保證。如在英國“戰(zhàn)地日記(Operation War Diary)”項目中,英國國家檔案館聯(lián)合英國帝國戰(zhàn)爭博物館和眾包平臺Zooniverse建立了“第一次世界大戰(zhàn)百年數(shù)字計劃學術咨詢小組”,在線解答志愿者在檔案數(shù)字化與標引過程中的問題,以保證項目質量[21]。
第一,項目成員互審機制。是指依靠項目內成員的力量對已完成的任務進行初步的審核,審核內容包括任務完成的完整度、內容是否有明顯的政治偏頗和偏題,是否有明顯的差錯等。對于“用戶收集檔案”“用戶整理檔案”模式下的眾包項目,該機制可作為其成果的第一道審核,第一時間將嚴重偏離主題或政治傾向偏頗較大的內容篩選出去。學者鍋艷玲[22]曾將眾包成果審核主體分為接包小組成員間審核、接包團體范圍成員審核以及專家小組審核三層,其中一二層主要負責對基礎性業(yè)務和知識的審核。
第二,檔案工作者和專家團體審核機制。檔案工作者和專家團體審核機制是指將精通檔案業(yè)務、精通計算機和數(shù)據(jù)庫等相關知識的專業(yè)人員,以及不同領域和范圍內的專家團體集中起來組成一個審核小組,從專業(yè)的角度對用戶提交的成果進行質量評估、內容完善以及問題定奪。尤其是對編輯百科詞條、檔案信息添加與分析等專業(yè)技能要求較高且沒有標準答案的“用戶編研檔案”眾包成果的審核而言,該機制是必不可少的。上海圖書館“盛宣懷檔案著錄”中將平臺用戶分為了游客、發(fā)布者、抄錄者和專家四類,其中專家經(jīng)過注冊、專業(yè)評估后,就可對平臺項目進行著錄、抄錄與審核。