摘要:用戶參與檔案知識(shí)生產(chǎn)激活了檔案資源組織和利用方式,但其中的角色分工尚未明確。文章重點(diǎn)分析UGC、PGC、OGC三種機(jī)制的特點(diǎn)及關(guān)系,并以UGC為比較中心,發(fā)現(xiàn)檔案知識(shí)生產(chǎn)內(nèi)容存在謬誤紕漏、價(jià)值密度較低、涉及法律問(wèn)責(zé)、質(zhì)量評(píng)價(jià)混亂等問(wèn)題。因而遵循“源頭把關(guān)—過(guò)程規(guī)范—全程控制”邏輯,提出了內(nèi)容質(zhì)量控制策略:重視檔案素養(yǎng)教育,實(shí)現(xiàn)業(yè)余與專業(yè)平衡,突出檔案知識(shí)挖掘,加強(qiáng)前后環(huán)節(jié)協(xié)同。
關(guān)鍵詞:檔案知識(shí);用戶生成內(nèi)容;內(nèi)容質(zhì)量
分類號(hào):G271.6;G273.5
Research on Production of Archival Knowledge Oriented to Quality Control of Content——Comparison based on OGC, PGC and UGC Mechanism
Long Jiaqing
(School of Information Resource Management of Renmin University of China, Beijing, l00872)
Abstract:The users participation in the archival knowledge production activates ways of organizing and utilizing archives resources , but the role division is not yet clear. The article focuses on the analysis of the characteristics and relationships of the three mechanisms, and makes UGC as the center of comparison, then finds that the content of archival knowledge production has some problems, such as, low value density, legal accountability and confusion in quality evaluation. Therefore, following the logic of "Source check-Process review-Full control", the content quality control strategies are put forward: Attach importance to archival literacy education, achieve balance between amateur and professional, highlight the knowledge mining of archives, strengthen collaboration of links.
Keywords:User-Generated Content; Archival Knowledge; Content Quality
隨著知識(shí)社會(huì)快速演變,檔案資源的知識(shí)資產(chǎn)觀愈發(fā)強(qiáng)烈,各級(jí)檔案部門(mén)紛紛開(kāi)展知識(shí)生產(chǎn)型服務(wù)[1],我國(guó)檔案事業(yè)從“國(guó)家模式”走向“社會(huì)模式”[2],公民和第三方組織等社會(huì)力量也正積極融入檔案治理體系,在參與式檔案活動(dòng)中凝聚知識(shí)能量。2021年將在阿聯(lián)酋阿布扎比舉辦的國(guó)際檔案大會(huì),以“賦能知識(shí)社會(huì)”(Empowering Knowledge Societies)為主題[3],致力于號(hào)召全球檔案工作者共同探討21世紀(jì)知識(shí)社會(huì)中檔案事業(yè)所面臨的挑戰(zhàn)與機(jī)遇,其中的子議題“信任與證據(jù)”(Trust and Evidence)將重點(diǎn)探討“用戶專家VS職業(yè)專家”(User Experts VS the Profession)的內(nèi)容以及在數(shù)字檔案資源參與式建設(shè)中的實(shí)踐反思[4],建設(shè)環(huán)節(jié)具體包括前端檔案資源收集、中端檔案標(biāo)引著錄鑒定和后端知識(shí)集成服務(wù)。
毋庸置疑,用戶參與式建設(shè)激活了檔案資源開(kāi)發(fā)利用,但其產(chǎn)出成果的內(nèi)容質(zhì)量卻往往遭遇質(zhì)疑[5],具體問(wèn)題有:用戶知識(shí)結(jié)構(gòu)影響內(nèi)容質(zhì)量的廣度與深度;主觀認(rèn)知和專業(yè)能力影響內(nèi)容質(zhì)量的客觀性、真實(shí)性;片面追求輿論宣傳而忽視檔案內(nèi)容生成規(guī)律;脫離中國(guó)檔案實(shí)際工作,盲目追隨西方語(yǔ)境下的包裝形式。因此,在檔案知識(shí)生產(chǎn)情境中探討用戶和專業(yè)人員的協(xié)同關(guān)系,以及如何保障內(nèi)容質(zhì)量是十分必要的。文章采用內(nèi)容分析和比較研究方法,通過(guò)分析不同角色分工的差異,力求找出因用戶參與檔案知識(shí)生產(chǎn)而產(chǎn)生的內(nèi)容質(zhì)量問(wèn)題,進(jìn)而提出優(yōu)化策略。
檔案知識(shí)生產(chǎn)是檔案資源開(kāi)發(fā)和知識(shí)管理的交叉領(lǐng)域,是由“檔案知識(shí)”和“知識(shí)生產(chǎn)”子概念組配而成,學(xué)界尚未形成明確概念。據(jù)邁克爾·吉本斯(Michael Gibbons)的知識(shí)生產(chǎn)新模式理論可知[6],知識(shí)生產(chǎn)不再是科學(xué)界精英的內(nèi)部共同體行為,而是整個(gè)社會(huì)廣泛參與的生產(chǎn)過(guò)程,具有應(yīng)用生產(chǎn)情景和多維度質(zhì)量控制的特征。因此,檔案知識(shí)生產(chǎn)也應(yīng)被置于知識(shí)社會(huì)場(chǎng)景,并兼顧各生產(chǎn)主體的參與需求,基于已有檔案資源基礎(chǔ)進(jìn)行整合、發(fā)現(xiàn)、挖掘、聚合。其中生產(chǎn)主體按照“用戶—內(nèi)容—專業(yè)”進(jìn)行分工,分別對(duì)應(yīng)了“用戶生成內(nèi)容”“專業(yè)生產(chǎn)內(nèi)容”“職業(yè)生產(chǎn)內(nèi)容”三類生產(chǎn)機(jī)制。
1.1大眾視角:用戶生成內(nèi)容(User-Generated Content,UGC)
UGC是發(fā)軔于Web2.0環(huán)境下的一種新興網(wǎng)絡(luò)資源創(chuàng)作與組織模式,即在網(wǎng)絡(luò)空間創(chuàng)作文字、圖片、音頻及視頻等內(nèi)容[7]。其作為互聯(lián)網(wǎng)技術(shù)賦能的產(chǎn)物,是變革傳統(tǒng)信息傳播的重要力量,具有內(nèi)容個(gè)性化、視角多元化、社會(huì)關(guān)系虛擬化和傳播扁平化等特征[8]。對(duì)檔案領(lǐng)域的作用體現(xiàn)在:豐富檔案館藏內(nèi)容,參與檔案業(yè)務(wù)流程,延伸檔案交互社區(qū),以知識(shí)共享模式發(fā)表不同見(jiàn)解,實(shí)現(xiàn)檔案原有信息增值[9]??傮w來(lái)說(shuō),UGC機(jī)制下,檔案知識(shí)生產(chǎn)的內(nèi)容來(lái)源漸趨廣泛,檔案用戶黏性穩(wěn)步增加,譬如疫情期間,蘇格蘭檔案與文件協(xié)會(huì)(ARA Scotland)等機(jī)構(gòu)在Twitter平臺(tái)發(fā)起“#Archive 30”話題活動(dòng)[10],用戶通過(guò)分享檔案工作建議,提供珍貴檔案手稿,建構(gòu)了屬于大眾的記憶資源和知識(shí)文化。
3.2內(nèi)容價(jià)值密度較低
檔案知識(shí)生產(chǎn)價(jià)值在于將原有檔案資源轉(zhuǎn)化為可利用的創(chuàng)新知識(shí),如生產(chǎn)者對(duì)數(shù)字檔案內(nèi)容進(jìn)行分類、聚合、排序、抽取、過(guò)濾、濃縮、提煉和可視化等操作,使其成為可解析的科學(xué)知識(shí)。但被UGC泛化的知識(shí)生產(chǎn),知識(shí)條目體量變大,內(nèi)容碎片化、同質(zhì)化現(xiàn)象嚴(yán)重,而真正有價(jià)值的知識(shí)量占比卻不高,價(jià)值密度較低。尤其是用戶生產(chǎn)的“評(píng)價(jià)類”內(nèi)容,即用戶在社交媒體上對(duì)檔案知識(shí)生產(chǎn)成果進(jìn)行的反饋互動(dòng),這其中的“湊字打卡”“好評(píng)返利”“植入廣告”現(xiàn)象不僅影響到捕獲內(nèi)容的整體質(zhì)量,還額外增加了“信息清洗”的負(fù)擔(dān),更談不上知識(shí)創(chuàng)造。正如早年P(guān). André團(tuán)隊(duì)對(duì)Twitter內(nèi)容價(jià)值進(jìn)行的數(shù)據(jù)分析,分析可知:用戶所生產(chǎn)的內(nèi)容中25%無(wú)價(jià)值,36%有價(jià)值,39%介于兩者之間[16],因此美國(guó)也于2019年4月宣布停止原有的Twitter訊息存檔政策,將重點(diǎn)放在保存重要訊息上而非追求數(shù)據(jù)量。
3.3內(nèi)容涉及法律問(wèn)責(zé)
由于UGC主要工作場(chǎng)域主要是互聯(lián)網(wǎng)端口,加上網(wǎng)絡(luò)環(huán)境中存在過(guò)濾技術(shù)識(shí)別不到位、網(wǎng)絡(luò)治理不規(guī)范、公民版權(quán)意識(shí)薄弱等困境,因而容易導(dǎo)致知識(shí)產(chǎn)權(quán)爭(zhēng)議、用戶隱私泄露、檔案泄密風(fēng)險(xiǎn)等棘手問(wèn)題,具體有:檔案知識(shí)生產(chǎn)存在涉密情況,若用戶對(duì)《檔案法》《網(wǎng)絡(luò)安全法》《保守國(guó)家秘密法》不甚了解,就容易發(fā)生檔案泄密事件,這也是習(xí)近平總書(shū)記總體國(guó)家安全觀審視下的首要風(fēng)險(xiǎn)。內(nèi)容所有權(quán)存在爭(zhēng)議,由于網(wǎng)絡(luò)空間信任與共享生態(tài)復(fù)雜,造成了鼓勵(lì)用戶參與生產(chǎn)和使用涉及版權(quán)內(nèi)容之間的矛盾,這不僅會(huì)讓檔案機(jī)構(gòu)陷入兩難處境,也會(huì)削弱用戶對(duì)檔案公開(kāi)利用的認(rèn)知印象。用戶在內(nèi)容生產(chǎn)中必有“觸網(wǎng)留痕”記錄,而檔案部門(mén)卻易忽視個(gè)人信息使用的范圍和方式,包括檔案用戶數(shù)據(jù)違規(guī)采集、隱私聲明冷漠化處理、用戶數(shù)據(jù)授權(quán)與傳輸風(fēng)險(xiǎn)、用戶信息利用侵權(quán)等[17],這對(duì)檔案用戶隱私均構(gòu)成極大威脅。
3.4內(nèi)容質(zhì)量評(píng)價(jià)阻礙
對(duì)UGC進(jìn)行全流程追蹤評(píng)價(jià),是有效提高檔案知識(shí)內(nèi)容質(zhì)量的保障,但目前,內(nèi)容質(zhì)量評(píng)價(jià)框架尚未成熟。一方面,內(nèi)容質(zhì)量評(píng)價(jià)指標(biāo)的缺失和滯后,不利于識(shí)別和糾正內(nèi)容生產(chǎn)中的問(wèn)題。在項(xiàng)目驗(yàn)收中,后端展示成果是評(píng)價(jià)審查的重點(diǎn),但其前端和過(guò)程環(huán)節(jié)易被忽視,其中包括對(duì)用戶知識(shí)背景、使用工具技術(shù)能力、產(chǎn)出知識(shí)成本效益、項(xiàng)目操作靈活程度等方面的評(píng)估。另一方面,現(xiàn)有評(píng)價(jià)方案和規(guī)范之間銜接度不夠,缺少專門(mén)評(píng)價(jià)標(biāo)準(zhǔn)。目前,評(píng)價(jià)對(duì)象包括社交媒體背景、內(nèi)容主題、內(nèi)容語(yǔ)義關(guān)聯(lián)、檔案資源描述、學(xué)術(shù)利用標(biāo)簽等多種角度,卻未有專門(mén)針對(duì)用戶參與檔案內(nèi)容生產(chǎn)的評(píng)價(jià)指南。因此在評(píng)估用戶對(duì)內(nèi)容質(zhì)量的影響效果時(shí),仍需要參考客觀性、體系化、普適性的評(píng)價(jià)體系。
針對(duì)上述問(wèn)題,要想實(shí)現(xiàn)“人人共建知識(shí)社會(huì)”的愿景,就必須加強(qiáng)全流程控制,以全面提高檔案知識(shí)內(nèi)容的輸出質(zhì)量。筆者以UGC機(jī)制為核心,結(jié)合OGC和PGC機(jī)制的優(yōu)點(diǎn),認(rèn)為應(yīng)將用戶定位于“業(yè)余的專業(yè)者”。
4.1源頭把關(guān),重視檔案素養(yǎng)培育
用戶參與檔案知識(shí)生產(chǎn),不僅能有效彌補(bǔ)PGC人才空缺,也可增加OGC與用戶的對(duì)話場(chǎng)景,避免檔案利用服務(wù)成為檔案部門(mén)自?shī)首詷?lè)的空頭標(biāo)簽。內(nèi)容質(zhì)量控制的首要任務(wù)就是尋找合適的目標(biāo)用戶,從源頭上確保預(yù)期內(nèi)容質(zhì)量,因此,無(wú)論是志愿服務(wù)抑或興趣驅(qū)使,還是眾包加入的用戶,必須要求具有一定檔案素養(yǎng)和專業(yè)認(rèn)知。國(guó)內(nèi)外已有愈來(lái)愈多UGC項(xiàng)目通過(guò)啟動(dòng)資質(zhì)審查、注冊(cè)篩選、知識(shí)測(cè)評(píng)以確認(rèn)合格的目標(biāo)用戶,譬如在“麻省記憶路演”項(xiàng)目(Mass. Memories Road Show)中,檔案館規(guī)定:只有受過(guò)訓(xùn)練的人才能介入,從源頭塑造了優(yōu)質(zhì)社群檔案[18]。同時(shí),檔案素養(yǎng)培育不僅要在用戶準(zhǔn)入之前執(zhí)行,還要在用戶進(jìn)入生產(chǎn)環(huán)節(jié)后進(jìn)行日常開(kāi)展,將檔案素養(yǎng)嵌入公眾社會(huì)意識(shí),進(jìn)而實(shí)現(xiàn)業(yè)務(wù)集成與檔案素養(yǎng)的持續(xù)互動(dòng)。
4.2內(nèi)容為王,突出檔案知識(shí)挖掘
無(wú)論執(zhí)行何種機(jī)制,其核心始終是“C”,即關(guān)注內(nèi)容本身。價(jià)值有導(dǎo)向,知識(shí)有溫度,無(wú)論數(shù)字環(huán)境中知識(shí)生產(chǎn)方式如何變革,深挖優(yōu)質(zhì)內(nèi)容都占據(jù)著不可撼動(dòng)的地位。首先,要關(guān)注內(nèi)容缺口,即辨識(shí)何種檔案資源需要加大力度開(kāi)發(fā),如宏觀反映民族文化特點(diǎn)的非遺檔案資源,微觀書(shū)寫(xiě)百姓生活的檔案敘事。以“我的北京記憶”網(wǎng)站為例,其開(kāi)設(shè)了北京故事和采風(fēng)問(wèn)俗等訪問(wèn)專題,并號(hào)召用戶添加記憶資源,以承載北京城市變遷的記憶縮影,截至2020年6月,已累計(jì)添加1041條文集、8671張圖片和415個(gè)視頻[19]。其次,要精分內(nèi)容類型,選擇適合用戶群體的生產(chǎn)內(nèi)容類型,包括娛樂(lè)社交、知識(shí)分享、嚴(yán)肅宣傳、輿論引導(dǎo)等類型。再次,要按主題內(nèi)容選擇呈現(xiàn)方式,即按照檔案知識(shí)主題匹配更易被理解的展示手段,包括網(wǎng)站互動(dòng)、APP訂閱、數(shù)字檔案展覽、檔案虛擬游戲、檔案文創(chuàng)產(chǎn)品等。最后,要借助數(shù)字技術(shù)工具進(jìn)行深度加工,在對(duì)檔案文本進(jìn)行截詞切分、標(biāo)引注釋、人物識(shí)別基礎(chǔ)上,對(duì)結(jié)構(gòu)化內(nèi)容進(jìn)行語(yǔ)義關(guān)聯(lián)、詞頻統(tǒng)計(jì)、人物網(wǎng)絡(luò)分析、學(xué)術(shù)地圖可視化等知識(shí)發(fā)現(xiàn)。
4.3業(yè)務(wù)規(guī)范,實(shí)現(xiàn)業(yè)余與專業(yè)平衡
隨著檔案知識(shí)內(nèi)容質(zhì)量要求提高,其生產(chǎn)過(guò)程對(duì)用戶的專業(yè)素質(zhì)提出了更多條件。未來(lái)的生產(chǎn)用戶將被定位于“業(yè)余的專業(yè)者”,這與第二部分提及的“PGC+UGC交集”相似,但不同點(diǎn)在于:未來(lái)將更立足于普通用戶群體,為其提供業(yè)務(wù)指南和專業(yè)輔助,而非依賴于檔案專家群體,即在生產(chǎn)中平衡業(yè)余和專業(yè)的關(guān)系。為實(shí)現(xiàn)這點(diǎn),第一,應(yīng)引導(dǎo)用戶遵從知識(shí)生產(chǎn)各環(huán)節(jié)的業(yè)務(wù)規(guī)范,如加拿大國(guó)家圖書(shū)檔案館Co-Lab項(xiàng)目首頁(yè)彈窗有1—17步的完成指令,英國(guó)國(guó)家檔案館“戰(zhàn)爭(zhēng)日記”存檔項(xiàng)目提供10分鐘培訓(xùn)視頻;第二,參考用戶活動(dòng)屬性來(lái)進(jìn)行規(guī)范審查,包括該用戶是否存在不良征信、注冊(cè)時(shí)間長(zhǎng)短、基本資料完成度、完成時(shí)間情況等,以此保障內(nèi)容完整性和真實(shí)性;第三,運(yùn)用激勵(lì)政策搭建長(zhǎng)期合作關(guān)系,“業(yè)余走向?qū)I(yè)”的關(guān)鍵在于增強(qiáng)用戶參與度,可開(kāi)設(shè)問(wèn)答專區(qū)和業(yè)務(wù)交流坊等,使用戶增強(qiáng)對(duì)檔案知識(shí)生產(chǎn)的認(rèn)同感,以主人翁精神參與專業(yè)技能訓(xùn)練。
4.4全程控制,加強(qiáng)前后環(huán)節(jié)協(xié)同
檔案知識(shí)生產(chǎn)是有流程規(guī)則的,各子環(huán)節(jié)質(zhì)量均會(huì)影響整體內(nèi)容質(zhì)量。因此展開(kāi)全程控制是實(shí)現(xiàn)“資源→知識(shí)”的關(guān)鍵所在,按照流程周期可將其簡(jiǎn)單劃分為三個(gè)階段:
(1)前期控制
調(diào)查內(nèi)容生產(chǎn)需求和用戶供給之間的適配情況。要求檔案職員提前掌握館藏檔案數(shù)量、館情實(shí)施條件、檔案知識(shí)需求、網(wǎng)絡(luò)技術(shù)要求等,看是否與用戶供給,即人員數(shù)量、工作時(shí)間、知識(shí)運(yùn)用能力、檔案主題認(rèn)知等適配。
(2)中期抽查
對(duì)階段性成果內(nèi)容進(jìn)行抽樣檢查和反饋檢驗(yàn)。檔案職員可通過(guò)自驗(yàn)和他驗(yàn)方式進(jìn)行內(nèi)容質(zhì)量審查,包括對(duì)同質(zhì)性、準(zhǔn)確性、可靠性、創(chuàng)新性等方面的控制,以此調(diào)整生產(chǎn)進(jìn)度和調(diào)度安排。
(3)后期審核
對(duì)照修訂版評(píng)價(jià)指南,在保護(hù)用戶隱私和嚴(yán)格校驗(yàn)無(wú)誤后,可將資源存入檔案知識(shí)庫(kù)或公布利用,如美國(guó)國(guó)家檔案館的公民檔案管理員項(xiàng)目(Citizen Archivist)[20],鼓勵(lì)大眾參與檔案館各項(xiàng)事務(wù)中,其中涉及標(biāo)引、著錄、設(shè)計(jì)等在線工作,并遵循全程控制以保障歷史檔案加工成果的準(zhǔn)確性。
*本文系2019年國(guó)家社科基金項(xiàng)目“數(shù)字政府背景下電子文件單軌制管理的數(shù)字連續(xù)性保障框架研究”(項(xiàng)目編號(hào):19CTQ036)階段性研究成果。
[1]張曉娟,馬瑜,左田原,等.知識(shí)經(jīng)濟(jì)時(shí)代的企業(yè)檔案管理——一種知識(shí)資產(chǎn)觀[J].檔案學(xué)通訊,2012(4):76-79.
[2]徐擁軍,李孟秋.再論檔案事業(yè)從“國(guó)家模式”走向“社會(huì)模式”[J].檔案管理,2020(3):5-9.
[3]International Council on Archives. Rescheduling for ICA Abu Dhabi Congress[EB/OL].[2020-05-20].https://www.ica.org/ en/rescheduling-for-ica-abu-dhabi-congress.
[4]張江珊,蔡非凡.檔案學(xué)語(yǔ)境下的“參與”研究[J].檔案學(xué)研究,2019(6):19-24.
[5]徐擁軍,陳潔,張晨文,等.“用戶生成內(nèi)容”在檔案工作中的應(yīng)用及影響[J].檔案學(xué)研究,2019(2):13-19.
[6]邁克爾·吉本斯,等.知識(shí)生產(chǎn)的新模式——當(dāng)代社會(huì)科學(xué)與研究的動(dòng)力學(xué)[M].北京:北京大學(xué)出版社,2011:16-22.
[7]趙宇翔,范哲,朱慶華.用戶生成內(nèi)容(UGC)概念解析及研究進(jìn)展[J].中國(guó)圖書(shū)館學(xué)報(bào),2012(5):68-81.
[8]聶云霞,龍家慶.面向用戶需求的檔案信息服務(wù)“扁平化”模式建構(gòu)[J].檔案與建設(shè),2018(5):4-8.
[9]周林興,劉星.UGC機(jī)制下檔案用戶虛擬在線社區(qū)研究[J].檔案學(xué)研究,2016(6):33-36.
[10]ARA Scotland.#Archive 30 is launching on Wednesday 1st April[EB/OL].[2020- 05- 25].https://twitter.com/arascot /status/1234488243594366976?s=21.
[11]胡泳,張?jiān)码?互聯(lián)網(wǎng)內(nèi)容走向何方?——從UGC、PGC到業(yè)余的專業(yè)化[J].新聞?dòng)浾撸?016(8):21-25.
[12]人民網(wǎng).淺析UGC、PGC和OGC[EB/OL][.2020-05-26]. http://yjy.people.com.cn/n/2014/0120/c245079-24169402.html.
[13]宋雪雁,于夢(mèng)文,王阮.價(jià)值共創(chuàng)視角下數(shù)字時(shí)代檔案文獻(xiàn)編纂模式研究——基于用戶主導(dǎo)的邏輯[J].檔案學(xué)研究,2019(6):94-101.
[14]Library and Archives Canada.Challenges-Co-Lab[EB/ OL].[2020-05-27].https://co-lab.bac-lac.gc.ca/eng/Challenges.
[15]上海圖書(shū)館歷史文獻(xiàn)眾包中心.盛宣懷檔案抄錄項(xiàng)目[EB/OL].[2020 -06-13].http://zb.library.sh.cn/.
[16]AndréP, Bernsetin M S, Luther K. Who gives a Tweet? Evaluating microblog content value[C]//Proceedings of the ACM 2012 conference on Computer Supported Cooperative Work.Seat- tle:ACM Press,2012:471-474.
[17]周林興,徐承來(lái),周麗.用戶畫(huà)像視域下檔案用戶隱私問(wèn)題研究[J].檔案學(xué)研究,2020(2):58-64.
[18]Roeschley A,Kim J.“Something that feels like a community”: the role of personal stories in building community- ased participatory archives[J].Archival Science, 2019(1):27-49.
[19]中國(guó)人民大學(xué)我的北京記憶網(wǎng)站.首頁(yè)—我的北京記憶[EB/OL].[2020- 06- 13].http://www.mypekingmemory.cn/ 5adae6b0efc52b4608642210/index.html.
[20]Citizen Archivist|National Archives[EB/OL].[2020-05-30].https://www.Arch- ives.gov/citizen-archivist.