李子林 許佳欣
(1.中國(guó)人民大學(xué)信息資源管理學(xué)院 北京 100872;2.武漢大學(xué)信息管理學(xué)院 武漢 430072)
數(shù)字人文(Digital Humanities)起源于二十世紀(jì)中期的“人文計(jì)算”(Humanities Computing),此后隨著計(jì)算機(jī)技術(shù)、數(shù)字技術(shù)、多媒體技術(shù)的深度發(fā)展和應(yīng)用,數(shù)字人文逐漸從一個(gè)人文研究的現(xiàn)象描述性詞匯拓寬發(fā)展成一個(gè)新型跨學(xué)科的研究領(lǐng)域。20世紀(jì)60年代以來(lái),在大規(guī)模網(wǎng)絡(luò)計(jì)算、全視頻社交平臺(tái)、虛擬現(xiàn)實(shí)技術(shù)的支撐下,人文知識(shí)的產(chǎn)生、獲取、歸集、呈現(xiàn)和解讀不可避免地置身于數(shù)字場(chǎng)景之中。在此背景下,傳統(tǒng)人文研究范式受到?jīng)_擊,受數(shù)據(jù)驅(qū)動(dòng)的態(tài)勢(shì)日益明顯,人文研究的對(duì)象和工具逐漸從文本型記錄向數(shù)字化記錄和原生數(shù)字資源轉(zhuǎn)變。數(shù)字人文學(xué)科領(lǐng)域的許多學(xué)者都致力于將技術(shù)融合進(jìn)學(xué)術(shù)研究,例如文本分析、地理信息系統(tǒng)(GIS)、互動(dòng)游戲和多媒體等在哲學(xué)、史學(xué)、文學(xué)、語(yǔ)言學(xué)和社會(huì)學(xué)等學(xué)科的應(yīng)用[1]。然而,檔案作為傳統(tǒng)人文研究的重要對(duì)象和資源,卻陷入“燈下黑”的窘境,在數(shù)字人文研究的過(guò)程中缺少應(yīng)有的重視與對(duì)待。
凱特·塞默(Kate Theimer)在文章“數(shù)字人文背景下的檔案和檔案是數(shù)字人文的背景”(Archives in Context and as Context)中指出:數(shù)字人文學(xué)者普遍情況下將所掌握的文獻(xiàn)資料藏品統(tǒng)稱為“檔案”(Archives),主要原因在于這些文獻(xiàn)資料是經(jīng)過(guò)擇選后的產(chǎn)物。數(shù)字人文學(xué)者們達(dá)成的基本共識(shí)是:有意識(shí)有目的地去擇選一組文獻(xiàn)資料,并利用該文獻(xiàn)資料開展人文研究,便可將其視為“檔案”[2]。相較于“檔案”的專業(yè)定義和界定范疇,以上觀點(diǎn)未免有失偏頗,僅抓取檔案的部分特征屬性,卻忽略了“檔案”本質(zhì)特征的考量。眾所周知,檔案作為一個(gè)傳統(tǒng)學(xué)科與研究領(lǐng)域,其萌芽可追溯到16世紀(jì),經(jīng)過(guò)400余年的歷史發(fā)展逐步走向豐滿和深刻,并形成以來(lái)源原則、文件生命周期理論為支柱的理論體系[3]。由此可見,相較于發(fā)展起步較晚的數(shù)字人文學(xué)科領(lǐng)域,檔案學(xué)領(lǐng)域具備相對(duì)穩(wěn)定、成熟的理論體系和基本原則。因此,在面對(duì)數(shù)字人文領(lǐng)域?qū)Α皺n案”概念的模糊界定和泛化使用的情況時(shí),檔案學(xué)者應(yīng)該具備敏銳的觀察與思辨能力,以檔案專業(yè)視角審視、考察這種現(xiàn)象背后的緣由,明晰檔案在數(shù)字人文研究中的特殊價(jià)值和意義,對(duì)于搭建檔案學(xué)領(lǐng)域與數(shù)字人文領(lǐng)域交流溝通的“無(wú)障礙”橋梁具有重要的理論和現(xiàn)實(shí)意義。
縱觀數(shù)字人文理論與實(shí)踐研究的發(fā)展脈絡(luò),不難發(fā)現(xiàn)檔案在其中扮演重要角色,發(fā)揮著特殊的價(jià)值。從數(shù)字人文研究對(duì)象角度看,檔案是區(qū)別于圖書等資料的特殊文獻(xiàn)資料;從數(shù)字人文研究理論看,檔案理論為數(shù)字人文理論框架的搭建與完善提供參考;從數(shù)字人文研究質(zhì)量看,檔案的憑證價(jià)值為數(shù)字人文研究成果提供質(zhì)量保證。
全球檔案學(xué)領(lǐng)域?qū)τ凇皺n案”(Archives)的定義在描述上大同小異,在核心思想上基本保持一致。美國(guó)現(xiàn)代著名檔案學(xué)者謝倫伯格在其著作《現(xiàn)代檔案——原則與技術(shù)》中指出:檔案是“經(jīng)鑒定值得永久保存的、供查考和研究之用的,業(yè)已藏入或者選出準(zhǔn)備藏入某一檔案機(jī)構(gòu)的任何公私機(jī)構(gòu)的文件?!泵绹?guó)檔案工作者協(xié)會(huì)(Society of American Archivist,SAA)將“檔案”定義為:個(gè)人、家庭或組織(公共或私人)在處理自身事務(wù)時(shí)產(chǎn)生或接收的、具有長(zhǎng)久保存價(jià)值、或者可以作為其生成者履職和問(wèn)責(zé)的證據(jù)性材料。同時(shí),檔案的管護(hù)遵循尊重來(lái)源、尊重原始秩序和集體控制的原則。我國(guó)學(xué)者馮惠玲教授等人編著的《檔案學(xué)概論》(第二版)中將“檔案”定義為:“檔案是組織或個(gè)人在以往的社會(huì)實(shí)踐活動(dòng)中直接形成的清晰的、確定的、具有完整記錄作用的固化信息”。
基于以上定義可總結(jié)出,“檔案”作為一種特殊類型的文獻(xiàn)資料,與圖書等文獻(xiàn)資料相比具有以下特征:第一,檔案具有真實(shí)性,即在檔案形成過(guò)程真實(shí)的前提下,歸檔后的檔案與歸檔前的文件在形制與內(nèi)容上完全一致[4]。檔案的真實(shí)性分為形成過(guò)程和內(nèi)容信息兩部分,前者要求檔案必須是在社會(huì)實(shí)踐過(guò)程中真實(shí)形成的,后者要求檔案所反映的內(nèi)容信息與社會(huì)現(xiàn)實(shí)具有一致性。數(shù)字人文背景下,檔案資源在形成過(guò)程和內(nèi)容信息兩方面真實(shí)性的雙重保障,可以為歷史學(xué)、考古學(xué)等人文學(xué)科的研究提供豐富的原始記錄材料,具有圖書、資料等其他文獻(xiàn)類型不可替代的價(jià)值。第二,檔案具有憑證性,客觀地記錄了以往的歷史情況,保留著真切的歷史標(biāo)記,是令人信服的歷史證據(jù)。美國(guó)檔案學(xué)者謝倫伯格提出檔案具有“雙重價(jià)值”:“原始價(jià)值即第一價(jià)值,包括文件形成機(jī)關(guān)需求的行政價(jià)值、法律價(jià)值、財(cái)務(wù)價(jià)值和科研價(jià)值;從屬價(jià)值即對(duì)研究工作所具有的第二價(jià)值,包括證據(jù)價(jià)值和情報(bào)價(jià)值。”檔案資源的憑證性在數(shù)字人文研究中占據(jù)優(yōu)勢(shì),能夠?yàn)檠芯刻峁┱鎸?shí)、可靠、可用的研究材料,從而保障研究的順利開展??巳R蒙特(Tanya E.Clement) 在2016年文章《數(shù)字人文的方法論》(Where Is Methodology in Digital Humanities ?)中指出:數(shù)字人文研究必須依靠足夠充分的細(xì)節(jié)或“證據(jù)”信息,以建立精準(zhǔn)、令人信服的描述和闡釋。同時(shí),這種描述和闡釋應(yīng)盡可能在更為寬泛的領(lǐng)域呈現(xiàn),這便要求數(shù)字人文不斷吸納社會(huì)科學(xué)的方法論[5]。
普林斯頓數(shù)字人文中心副主任鮑爾(Bauer)將檔案和數(shù)字策展實(shí)踐的本體論、認(rèn)識(shí)論和方法論等檔案學(xué)和信息學(xué)理論納入數(shù)字人文項(xiàng)目的理論范疇。檔案學(xué)作為具有悠久發(fā)展歷史的傳統(tǒng)學(xué)科,與文獻(xiàn)學(xué)、歷史學(xué)、社會(huì)學(xué)等人文社會(huì)學(xué)科之間關(guān)聯(lián)甚密。作為檔案學(xué)兩大理論支柱的“來(lái)源原則”和“全宗理論”也為數(shù)字人文研究提供理論性的輔助和支撐,具體體現(xiàn)在:
第一,來(lái)源原則(The Principle of Provenance)是把同一機(jī)構(gòu)、組織或個(gè)人形成的檔案作為一個(gè)整體加以管理的原則[6]。它要求檔案資源應(yīng)當(dāng)按其來(lái)源和形成單位進(jìn)行整理和分類,在整理和分類時(shí)應(yīng)當(dāng)尊重原有整理順序,同一來(lái)源的檔案資源不可分離,不同來(lái)源的檔案資源不得混淆。隨著計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)技術(shù)的發(fā)展,檔案工作全面進(jìn)入后保管時(shí)代。電子文件興起的背景下,傳統(tǒng)的來(lái)源原則中檔案資源的“實(shí)體來(lái)源”逐漸發(fā)展為“概念來(lái)源”,“新來(lái)源觀”應(yīng)運(yùn)產(chǎn)生。特里·庫(kù)克(Terry Cook)在第十三屆國(guó)際檔案大會(huì)上指出, “來(lái)源”一詞不應(yīng)限定在實(shí)體機(jī)構(gòu)上,還應(yīng)當(dāng)包括文件形成的目的、過(guò)程、活動(dòng)、形成者職能及其他抽象來(lái)源等。而不論是“概念來(lái)源”還是“實(shí)體來(lái)源”,并沒有脫離來(lái)源原則的基本精神,均強(qiáng)調(diào)要保證檔案資源來(lái)源的可追溯與背景信息的完善。在數(shù)字人文研究重點(diǎn)關(guān)注的學(xué)科領(lǐng)域中,文學(xué)、哲學(xué)、語(yǔ)言學(xué)、歷史學(xué)、考古學(xué)等人文學(xué)科強(qiáng)調(diào)研究?jī)?nèi)容的真實(shí)、完整、背景可追溯。檔案資源作為數(shù)字人文研究開展的重要資料型工具,來(lái)源原則對(duì)來(lái)源和背景信息的控制在一定程度上保證了數(shù)字人文研究者從歷史背景出發(fā)開展研究,有利于保障項(xiàng)目的真實(shí)性與權(quán)威性,充分發(fā)揮檔案在建構(gòu)社會(huì)記憶中的重要作用。美國(guó)托萊多大學(xué)圖書館(The Library of University of Toledo)運(yùn)營(yíng)的數(shù)字人文項(xiàng)目以俄亥俄州托萊多地區(qū)各家檔案館的館藏資源為依托,并直接運(yùn)用基于檔案來(lái)源原則編制的檔案檢索工具,幫助數(shù)字人文項(xiàng)目參與者全面、快速地識(shí)別各類檔案資源。同時(shí),以國(guó)家級(jí)、區(qū)域級(jí)、州級(jí)三級(jí)來(lái)源標(biāo)準(zhǔn)搭建檔案資源組織和獲取路徑,提高數(shù)字人文研究過(guò)程中對(duì)研究資源背景信息的有效控制[7]。
第二,全宗理論(Fonds theory),全宗(Fonds)是一個(gè)國(guó)家機(jī)構(gòu)、社會(huì)組織或個(gè)人形成的具有有機(jī)聯(lián)系的檔案整體[8]。全宗理論是對(duì)來(lái)源原則的具體化表現(xiàn),要求人們?cè)诠芾頇n案時(shí)要維護(hù)檔案來(lái)源方面的聯(lián)系,把同一形成者的檔案看作一個(gè)整體不能分散[9]。全宗的基本含義包括三個(gè)方面: (1)全宗是一個(gè)有機(jī)整體;(2)全宗是在一定的歷史活動(dòng)中形成的;(3)全宗是以一定的社會(huì)單位為基礎(chǔ)而構(gòu)成的[10]。根據(jù)全宗的來(lái)源所反映的內(nèi)容可分為主體全宗和客體全宗。一個(gè)相對(duì)獨(dú)立的活動(dòng)主體在執(zhí)行職責(zé)的活動(dòng)中形成的檔案文件構(gòu)成主體全宗,以主體活動(dòng)的承受者或?qū)ο鬄橹行男纬傻木哂谐商仔浴⑾嗷ブg有著密切聯(lián)系的檔案文件構(gòu)成客體全宗。而無(wú)論是主體全宗還是客體全宗,全宗理論保證了檔案在一定的社會(huì)實(shí)踐活動(dòng)中作為一個(gè)有機(jī)整體的成套性和關(guān)聯(lián)性,從而為數(shù)字人文研究提供完整可靠的研究材料。數(shù)字人文背景下,檔案資源的開發(fā)利用已不再針對(duì)單一主體,而是強(qiáng)調(diào)全體公民的共建共享。正如特里·庫(kù)克提出的證據(jù)、記憶、認(rèn)同、社會(huì)(社區(qū))四個(gè)檔案學(xué)發(fā)展范式,強(qiáng)調(diào)每個(gè)人都是檔案資源的形成者與開發(fā)利用者[11]。這從側(cè)面反映出數(shù)字人文背景下的檔案資源具有主體多樣化的特點(diǎn),而全宗理論中的主體全宗能夠契合這種趨勢(shì),為數(shù)字人文研究提供多樣化主體的研究資源。同時(shí),傳統(tǒng)環(huán)境下檔案資源所呈現(xiàn)信息的類型和數(shù)量仍是相對(duì)單一和分散的文件,敘述歷史事件的方式相對(duì)較為單薄片面,這導(dǎo)致檔案服務(wù)難以實(shí)現(xiàn)對(duì)整個(gè)事件從經(jīng)濟(jì)、文化、社會(huì)生活等多重視角進(jìn)行豐富而立體的認(rèn)知。數(shù)字人文背景下,客體全宗理論通過(guò)聚合特定領(lǐng)域和社會(huì)實(shí)踐活動(dòng)中的檔案資源,有利于從多角度、多方面展現(xiàn)靈活動(dòng)態(tài)的檔案服務(wù),使研究者形成豐富而立體的認(rèn)知。數(shù)字人文理念重視數(shù)字技術(shù)轉(zhuǎn)換、突破時(shí)空限制,實(shí)現(xiàn)檔案信息資源的比較、選擇、組配、協(xié)作,例如:加州大學(xué)洛杉磯分校城市模擬團(tuán)隊(duì)運(yùn)作的“1893年哥倫比亞世界博覽會(huì)”項(xiàng)目通過(guò)對(duì)哥倫比亞世界博覽會(huì)的靜態(tài)圖片、動(dòng)態(tài)視頻片段進(jìn)行抽取,運(yùn)用一系列預(yù)定義和預(yù)先渲染圖像創(chuàng)建動(dòng)態(tài)幻象,采用實(shí)時(shí)交互技術(shù)為用戶與模擬環(huán)境之間建立交互渠道,用戶通過(guò)操縱鼠標(biāo)和鍵盤實(shí)現(xiàn)在虛擬數(shù)字場(chǎng)景中的自由參觀與游覽。
檔案與圖書、資料不同之處在于它不是提供系統(tǒng)科學(xué)知識(shí)的出版物,而是把原本屬于人類社會(huì)實(shí)踐活動(dòng)組成部分的文件材料,按其歷史聯(lián)系加以匯集、整理、加工的產(chǎn)物。它不但記錄了事物的結(jié)果,而且記載了事物的具體發(fā)生和發(fā)展過(guò)程,是人類社會(huì)實(shí)踐活動(dòng)的真實(shí)影像,成為具體的客觀事物的原始性記錄[12]。相較于圖書資料的知識(shí)性、科學(xué)性特點(diǎn),檔案作為具有憑證價(jià)值的權(quán)威文獻(xiàn)資料,是開展數(shù)字人文研究的重要工具。本杰明·施密特(Benjamin M. Schmidt)在論述檔案對(duì)數(shù)字人文研究的重要性時(shí)提出:“過(guò)去的未經(jīng)修改的文本使我們以舊的方式思考,因此,檔案館、圖書館館藏等文本資料使我們的閱讀與歷史思維方式更加一致,區(qū)別于在數(shù)字環(huán)境下文本變化引發(fā)思維方式的改變”[13]。雖然有“記憶”就必然有“遺忘”,但在數(shù)字人文技術(shù)影響下,越來(lái)越多的檔案工作者開展了檔案數(shù)字化保存項(xiàng)目,利用口述檔案聲像保存、非遺檔案典藏加工、機(jī)器鑒定與數(shù)碼成像等技術(shù)對(duì)檔案展開保護(hù),并借助VR/AR影響技術(shù)再現(xiàn)檔案原貌與歷史生態(tài),為用戶提供全方位、寬領(lǐng)域、多視角下對(duì)真實(shí)歷史事件的還原,提供了較之傳統(tǒng)環(huán)境下數(shù)倍豐富程度的信息資源。資源的海量和廣闊對(duì)維護(hù)歷史的真實(shí)性、客觀性具有重要意義,具備真實(shí)性、完整性、憑證性的檔案資源一定程度幫助人們培養(yǎng)一種更加獨(dú)立、客觀、理性的思維方式?!皵?shù)字敦煌”“南京大屠殺檔案展覽”等項(xiàng)目運(yùn)用數(shù)字人文技術(shù)承載豐富海量的檔案信息資源來(lái)幫助人們“回憶”過(guò)往,對(duì)保存民族與集體記憶,維護(hù)歷史的真實(shí)完整,以及培養(yǎng)人們以客觀、辯證、歷史的視角看待過(guò)去具有重大意義。
以中國(guó)社會(huì)科學(xué)基金近10年(2010-2019)資助項(xiàng)目為例,除圖書情報(bào)與檔案管理學(xué)科以外,歷史學(xué)、地理學(xué)、文學(xué)、政治學(xué)等領(lǐng)域的項(xiàng)目中涉及檔案(此處指以檔案為研究對(duì)象或憑證材料)的數(shù)量高達(dá)72項(xiàng)。由此可見,檔案憑借其憑證價(jià)值始終是歷史學(xué)、文學(xué)、宗教學(xué)等傳統(tǒng)環(huán)境下人文學(xué)科研究的重要資料。而數(shù)字人文領(lǐng)域尚未意識(shí)到檔案的重要價(jià)值。另外,在國(guó)際關(guān)注的釣魚島歸屬問(wèn)題上,早在明朝永樂年間(公元1403年),有關(guān)中國(guó)海上航路的《順風(fēng)相送》一書中便記載有釣魚嶼。1719年赴琉球的清朝冊(cè)封使徐葆光在《中山傳信錄》中曾指出其海上航路是:“由閩安鎮(zhèn)出五虎門,取雞籠頭,經(jīng)花瓶嶼、彭家山、釣魚臺(tái)、黃尾嶼、赤尾嶼,取姑米山、馬齒島,入琉球那霸港?!边@些歷史檔案無(wú)不雄辯地證明,釣魚島自古以來(lái)就是中國(guó)的固有領(lǐng)土。因此,數(shù)字人文研究在選取研究對(duì)象和研究資料時(shí)應(yīng)注意區(qū)分檔案與其他類型資料之間的差異,認(rèn)識(shí)到檔案憑證價(jià)值對(duì)數(shù)字人文研究成果詮釋、呈現(xiàn)的重要作用。
目前,國(guó)內(nèi)外已經(jīng)陸續(xù)開展了許多與數(shù)字人文相關(guān)的研究和實(shí)踐。從研究領(lǐng)域來(lái)看,國(guó)際數(shù)字人文研究熱點(diǎn)可分為四大領(lǐng)域:文化遺產(chǎn)數(shù)字化保護(hù)、數(shù)字歷史項(xiàng)目開發(fā)、數(shù)字人文基礎(chǔ)設(shè)施和面向數(shù)字人文的圖書館服務(wù)[14]。其中文化遺產(chǎn)的數(shù)字化保護(hù)以及數(shù)字歷史的項(xiàng)目開發(fā)與檔案資源有著密切的合作關(guān)系,領(lǐng)域涉及文學(xué)、藝術(shù)、歷史、地理、語(yǔ)言學(xué)、社會(huì)學(xué)等。如代表性的影谷項(xiàng)目、女作家檔案項(xiàng)目、威尼斯時(shí)光機(jī)項(xiàng)目等都對(duì)檔案資源進(jìn)行有效的開發(fā)利用。然而,縱覽數(shù)字人文項(xiàng)目的實(shí)施過(guò)程,可以發(fā)現(xiàn)目前數(shù)字人文領(lǐng)域的研究者尚未對(duì)檔案數(shù)字人文項(xiàng)目(涉檔數(shù)字人文項(xiàng)目)進(jìn)行明確的界定和區(qū)分。從研究機(jī)構(gòu)來(lái)看,國(guó)際數(shù)字人文主要以圖書館、博物館以及大學(xué)科研機(jī)構(gòu)為依托,檔案館也在其中發(fā)揮著越來(lái)越重要的作用。當(dāng)前,開展的檔案數(shù)字人文項(xiàng)目主要分為三種類型:檔案資源驅(qū)動(dòng)型數(shù)字人文項(xiàng)目、檔案機(jī)構(gòu)主導(dǎo)型數(shù)字人文項(xiàng)目和檔案相關(guān)型數(shù)字人文項(xiàng)目。三類項(xiàng)目的具體內(nèi)涵和區(qū)別如下:
檔案資源驅(qū)動(dòng)型數(shù)字人文項(xiàng)目是當(dāng)前檔案數(shù)字人文項(xiàng)目中最具典型性、最凸顯檔案價(jià)值屬性的項(xiàng)目,此類數(shù)字人文項(xiàng)目的核心特點(diǎn)在于:以檔案作為項(xiàng)目的研究對(duì)象,立足檔案的內(nèi)容進(jìn)行分析、挖掘和開發(fā),形成高附加值的數(shù)字檔案資源,為人文研究服務(wù)。代表項(xiàng)目有:影谷項(xiàng)目(The Valley of Shadow),是美國(guó)弗吉尼亞大學(xué)數(shù)字歷史研究中心1993年啟動(dòng)的數(shù)字人文項(xiàng)目,即保存1860年至1870年美國(guó)南北戰(zhàn)爭(zhēng)(American Civil War)期間普通人生活原始記錄的數(shù)字檔案館。與為數(shù)眾多的歷史網(wǎng)站不同,影谷項(xiàng)目并沒有向讀者講述任何的歷史故事,而是基于時(shí)間和空間節(jié)點(diǎn)呈現(xiàn)南北戰(zhàn)爭(zhēng)期間的信件、日記、報(bào)表、公告、報(bào)紙、演講稿等各類檔案文獻(xiàn),向讀者展示出特定時(shí)空下歷史生活的真實(shí)場(chǎng)景。同時(shí),該項(xiàng)目可為人文學(xué)者提供基于時(shí)間節(jié)點(diǎn)的檔案資源分析服務(wù),同時(shí)用戶在瀏覽、檢索檔案資源時(shí)可以自由創(chuàng)建標(biāo)簽、筆記,搭建獨(dú)特的人文研究路徑。威尼斯時(shí)光機(jī)項(xiàng)目,是由瑞士洛桑聯(lián)邦理工學(xué)院 (EPFL)和威尼斯大學(xué)合作的以威尼斯國(guó)家檔案館的檔案資源為基礎(chǔ),對(duì)海量的手稿、地圖、專著等歷史文獻(xiàn)進(jìn)行深入挖掘和處理,試圖還原千年之前威尼斯的歷史樣貌。借助這架虛擬的時(shí)光機(jī),現(xiàn)代歷史學(xué)家和公眾便能探索多樣化的古代威尼斯模型, 它實(shí)質(zhì)上是一個(gè)涵蓋1000多年歷史且可用于研究和教育的大型開放數(shù)據(jù)庫(kù),內(nèi)容將涵蓋從貿(mào)易和金融市場(chǎng),到公共衛(wèi)生和疾病傳播的方方面面。
所謂檔案機(jī)構(gòu)主導(dǎo)型數(shù)字人文項(xiàng)目即以檔案館、特藏中心等檔案機(jī)構(gòu)主導(dǎo)開展的數(shù)字人文項(xiàng)目。當(dāng)前,此類項(xiàng)目在所有數(shù)字人文項(xiàng)目中的數(shù)量占比較低,究其原因在于:圖書館、博物館、高校歷史學(xué)院、新媒體研究中心等機(jī)構(gòu)成為開展數(shù)字人文項(xiàng)目的前線陣地,而檔案機(jī)構(gòu)受職能、人員、經(jīng)費(fèi)等條件的限制,開展數(shù)字人文項(xiàng)目的起步稍緩一步。值得肯定的是,檔案館長(zhǎng)久以來(lái)保存收藏著政府及社會(huì)組織機(jī)構(gòu)各類記錄、特殊手稿和重要價(jià)值的文學(xué)、歷史作品,毫無(wú)疑問(wèn)成為人文與社會(huì)科學(xué)領(lǐng)域?qū)W者與檔案工作者建立合作伙伴關(guān)系的重要陣地。數(shù)字人文背景下,以檔案館為核心的檔案機(jī)構(gòu)應(yīng)該堅(jiān)持以積極開放的心態(tài),本著交流、協(xié)作的原則參與到數(shù)字人文項(xiàng)目之中。代表項(xiàng)目有:法國(guó)大革命數(shù)字檔案館項(xiàng)目,法國(guó)國(guó)家檔案館與斯坦福大學(xué)圖書館合作將法國(guó)1789年大革命期間的印刷品、勛章、硬幣等進(jìn)行數(shù)字化處理并建成數(shù)字圖像庫(kù), 研究人員可從藝術(shù)家、主題、風(fēng)格、地點(diǎn)等維度進(jìn)行檢索利用,探索法國(guó)大革命中意識(shí)形態(tài)和公民信仰等方面的隱含作用。荷蘭虛擬城市項(xiàng)目,荷蘭國(guó)家檔案館將館藏視為一個(gè)世界地圖,并利用虛擬現(xiàn)實(shí)技術(shù)進(jìn)行3D轉(zhuǎn)化, 通過(guò)虛擬城市數(shù)字人文項(xiàng)目的實(shí)施,使公眾生動(dòng)、全面地了解照片檔案的館藏?cái)?shù)量、范圍與多樣性,同時(shí)借助圖像分析和色彩還原技術(shù),將原始黑白歷史影像檔案進(jìn)行色彩還原,整理成《彩色二戰(zhàn)》紀(jì)錄片,為人文研究的學(xué)者提供觀賞和利用。
檔案相關(guān)型數(shù)字人文項(xiàng)目是當(dāng)前開展的數(shù)字人文項(xiàng)目中最為普遍的類型。檔案相關(guān)型數(shù)字人文項(xiàng)目是一個(gè)寬泛的表述,具體涉及以下幾種類型:一是檔案是數(shù)字人文研究、組織、開發(fā)的資源之一,與圖書等其他文獻(xiàn)資源一起為數(shù)字人文研究服務(wù);二是檔案工作者或檔案機(jī)構(gòu)作為參與方加入到數(shù)字人文項(xiàng)目之中,提供專業(yè)的檔案知識(shí)與研究方法;三是檔案作為輔助型工具或參考性資源加入到數(shù)字人文項(xiàng)目的研究成果之中,完善研究成果的功能。具體如下:谷歌地圖“時(shí)間返回”功能。2010年,谷歌公司對(duì)旗下的應(yīng)用谷歌地圖進(jìn)行升級(jí),增設(shè)“時(shí)間回返”功能,通過(guò)對(duì)1852年至1922年間紐約州和新澤西州房地產(chǎn)檔案、郡縣市的地形圖、建筑結(jié)構(gòu)圖等文獻(xiàn)資料進(jìn)行收集、匯總和處理,實(shí)現(xiàn)當(dāng)前地圖與歷史地圖的重新適配和關(guān)聯(lián),幫助用戶了解特定歷史時(shí)間跨度內(nèi)城市風(fēng)貌變遷?!芭_(tái)灣歷史數(shù)位圖書館工具集”項(xiàng)目。為幫助人文研究者便捷、快速、精準(zhǔn)地查找所需歷史文獻(xiàn),臺(tái)灣數(shù)位人文典藏項(xiàng)目的檔案專家學(xué)者與信息技術(shù)人員合作開發(fā)基于檔案內(nèi)容的“臺(tái)灣歷史數(shù)位圖書館工具集”:蘇州碼轉(zhuǎn)換器、度量衡單位換算系統(tǒng)、THDL前后綴詞分析工具、THDL臺(tái)灣總督府抄錄地契書地區(qū)分析、THDL臺(tái)灣總督府抄錄契書歷史地理資訊系統(tǒng)等數(shù)據(jù)檢索與分析工具,極大提升了歷史檔案資源的查檢、利用率?!熬幼【緟^(qū)域”信息項(xiàng)目。里士滿大學(xué)數(shù)字研究實(shí)驗(yàn)室牽頭創(chuàng)建在線信息中心,面向社會(huì)提供美國(guó)“居住警示區(qū)域”信息, 將全美社區(qū)按照安全系數(shù)標(biāo)注為不同等級(jí),從“最佳”到“危險(xiǎn)”。同時(shí)將社區(qū)檔案內(nèi)容著錄到不同的安全等級(jí)區(qū)域,使用者可以自由搜索150幅地圖和對(duì)5000個(gè)社區(qū)的檔案描述信息。由此形成良性信息生態(tài)圈,拓展與提升檔案文化與開發(fā)成果的覆蓋面和影響力,實(shí)現(xiàn)檔案信息資源的社會(huì)價(jià)值。
國(guó)際數(shù)字人文研究的開展主要以圖書館、博物館以及大學(xué)科研機(jī)構(gòu)為依托,檔案館也在其中發(fā)揮著越來(lái)越重要的作用。近十年來(lái),國(guó)內(nèi)外檔案館聯(lián)合圖書館、博物館以及大學(xué)科研機(jī)構(gòu),以特色資源建設(shè)、古籍文獻(xiàn)數(shù)字化等作為發(fā)展契機(jī)和重點(diǎn),成立了一批數(shù)字人文國(guó)際學(xué)術(shù)性研究組織或機(jī)構(gòu),致力于數(shù)字人文項(xiàng)目的建設(shè)和開發(fā),建立人文網(wǎng)站和主題數(shù)據(jù)庫(kù)并面向用戶開放[15]。隨著檔案領(lǐng)域與數(shù)字人文領(lǐng)域交流互動(dòng)的深入,檔案在數(shù)字人文研究中的應(yīng)用愈發(fā)廣泛。相信未來(lái)的數(shù)字人文舞臺(tái)將會(huì)有檔案領(lǐng)域的一席之地。
數(shù)字人文本質(zhì)上是一個(gè)“方法論共同體”(Methodological Commons) ,即由人文學(xué)者采用計(jì)算機(jī)方法和工具, 依靠數(shù)字化和數(shù)據(jù)化的人文資料從事人文研究的實(shí)踐活動(dòng),文獻(xiàn)循證是重要的研究方法之一。文獻(xiàn)循證是主要借助各種形式的文獻(xiàn)中所包含的事實(shí),對(duì)研究問(wèn)題形成一定的證據(jù)鏈,在一系列因果關(guān)系中尋找可靠結(jié)論的最佳實(shí)踐[16]。當(dāng)前,文獻(xiàn)循證技術(shù)主要包括:RDF(Resource Description Framework,資源描述框架)技術(shù)和可信度判別技術(shù)。RDF技術(shù)可以將大量文獻(xiàn)中的事實(shí)進(jìn)行結(jié)構(gòu)化并存儲(chǔ)起來(lái),從而構(gòu)成文獻(xiàn)循證的事實(shí)基礎(chǔ),支持這樣海量陳述的集合,進(jìn)行一致性檢驗(yàn)和推理??尚哦扰袆e技術(shù)是通過(guò)對(duì)文獻(xiàn)中記載的數(shù)據(jù)內(nèi)容建立可信度指標(biāo),通過(guò)互證、相關(guān)實(shí)體的可信度建立一個(gè)相對(duì)真實(shí)性的描述,根據(jù)系統(tǒng)指標(biāo)的變化不斷進(jìn)行重新衡量和計(jì)算。
作為數(shù)字人文研究中特殊的信息資源,基于檔案文獻(xiàn)開發(fā)的檔案循證平臺(tái)具有重要的價(jià)值。以上海圖書館開發(fā)的“中文古籍聯(lián)合目錄及循證平臺(tái)”為例,通過(guò)收錄上海大學(xué)圖書館和美國(guó)加州伯克利大學(xué)圖書館1.2萬(wàn)種善本館藏,13萬(wàn)種普通古籍以及歷史上有影響力的18本官修目錄、史志目錄、私家目錄和版本目錄,輔以人名、地名、印章等額外規(guī)范數(shù)據(jù),利用關(guān)聯(lián)數(shù)據(jù)技術(shù),實(shí)現(xiàn)各個(gè)圖書館現(xiàn)存古籍珍藏的聯(lián)合查詢、規(guī)范控制,并提供循證版本、考查源流的功能,為人文研究者提供全面、可互相參考作證的史料素材[17]。檔案循證平臺(tái)的開發(fā)可參考以上思路,通過(guò)與國(guó)內(nèi)各級(jí)綜合檔案館建立館藏互聯(lián)協(xié)議,運(yùn)用RDF技術(shù)實(shí)現(xiàn)相關(guān)主題數(shù)字檔案資源的歸集,實(shí)現(xiàn)檔案目錄、內(nèi)容的關(guān)聯(lián),篩選并提供循證檔案版本,以檔案作為考查源流和佐證研究的工具。
在信息資源獲取渠道多樣、獲取成本日益減少的數(shù)字時(shí)代,用戶對(duì)傳統(tǒng)信息服務(wù)形式的依賴度逐漸降低,而以科研人員為核心的專業(yè)用戶對(duì)信息服務(wù)深度與自主性提出更高的要求,交互式信息服務(wù)鏈應(yīng)運(yùn)產(chǎn)生。交互式的信息服務(wù)鏈?zhǔn)菍F(xiàn)有館藏的各類信息資源服務(wù)進(jìn)行整合后的獨(dú)立產(chǎn)品,其能夠挖掘用戶的深層需求,為數(shù)字人文的研究提供升級(jí)的信息服務(wù)。該類信息服務(wù)的實(shí)現(xiàn)以信息資源庫(kù)的建設(shè)為基礎(chǔ)。回歸到數(shù)字人文研究本身,檔案資源作為數(shù)字人文研究的重要信息資源之一,檔案數(shù)字資源庫(kù)的建設(shè)必不可少,是數(shù)字人文研究資源倉(cāng)儲(chǔ)的重要表現(xiàn)形式。
臺(tái)灣數(shù)位典藏是檔案數(shù)字資源庫(kù)建設(shè)的典型案例。檔案典藏機(jī)構(gòu)通過(guò)加強(qiáng)與業(yè)界的合作,共同開發(fā)優(yōu)質(zhì)的素材資源, 營(yíng)造健全的典藏內(nèi)容授權(quán)環(huán)境,構(gòu)建數(shù)位典藏產(chǎn)業(yè)鏈發(fā)展的上游。數(shù)位典藏所含的資源范圍廣泛,不僅有檔案館、博物館、圖書館等傳統(tǒng)檔案保存單位,還有美術(shù)館、大學(xué)、研究單位、藝術(shù)團(tuán)體等多元公私營(yíng)機(jī)構(gòu)參與, 涵蓋生物、考古、地質(zhì)、人類學(xué)、檔案、拓片、器物、語(yǔ)言等16個(gè)主題[18]。面對(duì)如此內(nèi)涵廣闊、類別豐富的資源,如何進(jìn)行良好地梳理和開發(fā)并建立檔案資源庫(kù)就成為數(shù)字人文工作者們亟需解決的問(wèn)題。以臺(tái)北故宮為例,其開發(fā)流程為:首先對(duì)典藏品進(jìn)行數(shù)位化處理,建置高解析度數(shù)位化圖檔及文物基本資料。其次,系統(tǒng)建置與整合。建置資料庫(kù),提供線上免付費(fèi)目錄檢索服務(wù)與用戶友好界面,制定文物高階影像數(shù)位化與線上流程規(guī)范,提供詳盡完整的文物資訊與便利的文物研究作業(yè)。再次,數(shù)位成果推展。故宮每年都會(huì)出版或拍攝文物圖片,積累大量數(shù)位圖像,并積極推行數(shù)位影像的應(yīng)用與原型故事開發(fā)[19],如制作主題網(wǎng)站、文物3D欣賞,針對(duì)不同年齡層及個(gè)人提供客制化服務(wù)。此為典藏單位內(nèi)部工作,若加入產(chǎn)業(yè)價(jià)值鏈中,仍需與數(shù)位典藏授權(quán)經(jīng)紀(jì)合作,將典藏品數(shù)位化處理后提供獨(dú)特的素材給授權(quán)經(jīng)紀(jì),授權(quán)經(jīng)紀(jì)將多樣化素材進(jìn)行整合,再依規(guī)范管理將素材帶入市場(chǎng)流通, 并與中游廠商進(jìn)行談判,進(jìn)入下一環(huán)節(jié)[20]。
團(tuán)隊(duì)建設(shè)體系建設(shè)是數(shù)字人文應(yīng)用于檔案信息資源開發(fā)的關(guān)鍵條件。倫敦大學(xué)數(shù)字人文研究中心主任梅麗莎·特拉絲(Melissa M. Terras)表示:“數(shù)字人文的發(fā)展,需要接受過(guò)人文學(xué)科訓(xùn)練的、擁有整體思維能力的人才,也需要專攻某一技術(shù)領(lǐng)域的專家。構(gòu)建起這樣的平衡對(duì)社會(huì)和組織機(jī)構(gòu)將會(huì)產(chǎn)生巨大影響,數(shù)字人文必將成為人文學(xué)科研究的主流之一?!被跀?shù)字人文研究的深度發(fā)展需求,數(shù)字人文研究團(tuán)隊(duì)建設(shè)及成員協(xié)作成為重要的突破口。
如何實(shí)現(xiàn)數(shù)字人文領(lǐng)域內(nèi)專家的有效溝通和匯集,如何識(shí)別相關(guān)主題領(lǐng)域權(quán)威學(xué)者的特色優(yōu)勢(shì),如何搭建跨領(lǐng)域、跨學(xué)科、跨地域的數(shù)字人文團(tuán)隊(duì)協(xié)作機(jī)制,為數(shù)字人文研究提供源源不斷、創(chuàng)新活力的智力支持,專家檔案知識(shí)地圖可以作為切入點(diǎn)。通過(guò)收集數(shù)字人文項(xiàng)目檔案資料,對(duì)數(shù)字人文項(xiàng)目中團(tuán)隊(duì)參與成員的參與情況、知識(shí)貢獻(xiàn)度、專長(zhǎng)領(lǐng)域、研究成果等信息進(jìn)行組織、匯集,形成專家檔案。在此基礎(chǔ)上,以專家檔案作為知識(shí)地圖搭建的基礎(chǔ)性信息材料,制定統(tǒng)一的資源描述、組織、系統(tǒng)管理、檢索與服務(wù)等方面的標(biāo)準(zhǔn),運(yùn)用3D可視化技術(shù),按學(xué)科領(lǐng)域、研究主題、專家姓名、專家國(guó)籍等主題對(duì)專家檔案進(jìn)行處理和分析,同時(shí)也可以借助關(guān)聯(lián)數(shù)據(jù)項(xiàng):學(xué)科領(lǐng)域、研究主題、項(xiàng)目名稱等以可視化的方式展示師承關(guān)系、人際網(wǎng)絡(luò)、科研合作、研究領(lǐng)域的知識(shí)地圖。中國(guó)歷代人物傳記資料庫(kù)(或稱數(shù)據(jù)庫(kù))(China Biographical Database,簡(jiǎn)稱CBDB)由北京大學(xué)中國(guó)古代史中心與哈佛大學(xué)費(fèi)正清研究中心、臺(tái)灣“中央研究院”歷史語(yǔ)言研究所聯(lián)合主持,旨在將計(jì)算機(jī)技術(shù)與人文社會(huì)科學(xué)相結(jié)合,系統(tǒng)性地對(duì)中國(guó)歷史上所有重要的傳記資料進(jìn)行數(shù)字化處理,以便采用社會(huì)科學(xué)方法研究中國(guó)歷史。該數(shù)據(jù)庫(kù)收錄從先秦到晚清約41萬(wàn)人的傳記、著作資料(約4億字),從人物、親屬、非親屬關(guān)系、社會(huì)區(qū)分、入仕途徑、官歷、地址、著述、研究成果等維度呈現(xiàn)人物關(guān)系圖譜,為人文歷史學(xué)研究提供全面、形象、多維度的信息網(wǎng)絡(luò)。
數(shù)字人文研究成果的展示與呈現(xiàn)是數(shù)字人文項(xiàng)目開展的最終目的和任務(wù)。當(dāng)前開展的涉檔數(shù)字人文項(xiàng)目中,研究成果基本上采用網(wǎng)站頁(yè)面、系統(tǒng)平臺(tái)的方式呈現(xiàn)。國(guó)外學(xué)者呂克爾(Ruecker)等人卻認(rèn)為:“數(shù)字時(shí)代的到來(lái),為文化遺產(chǎn)的展覽和傳播提供新的途徑。越來(lái)越多文化遺產(chǎn)收藏品經(jīng)過(guò)數(shù)字化處理在互聯(lián)網(wǎng)上面向社會(huì)公眾提供。從理論上而言,當(dāng)下這些珍貴的文化遺產(chǎn)比歷史上任何時(shí)期都擁有可供更多的社會(huì)受眾發(fā)現(xiàn)、利用的條件。但是,從實(shí)踐層面看,以美術(shù)館、圖書館、檔案館和博物館(GLAM)為首的文化遺產(chǎn)機(jī)構(gòu)基于館藏開展的數(shù)字人文項(xiàng)目中,缺乏以用戶友好理念指導(dǎo)的館藏開發(fā)方式,導(dǎo)致在線館藏的可獲取性受限”。[21]鑒于此,檔案館和其他文化機(jī)構(gòu)館藏的數(shù)字界面(Digital Interfaces)日漸成為社會(huì)公眾訪問(wèn)和獲取文化遺產(chǎn)的重要手段,該類數(shù)字界面的設(shè)計(jì)日漸成為數(shù)字人文和交互設(shè)計(jì)領(lǐng)域共同關(guān)注的重點(diǎn)內(nèi)容。
新的檔案和藏品利用界面設(shè)計(jì)方法,將引入“檔案活化”(Archival Liveness)概念,此概念的引入為數(shù)字人文項(xiàng)目中的數(shù)字界面設(shè)計(jì)者在對(duì)檔案材料進(jìn)行處理時(shí)提供一種新的概念考量?!皺n案活化”概念推動(dòng)一種新視角的產(chǎn)生,即檔案化(Archiving)是為一系列正在進(jìn)行的、專業(yè)化、制度化和技術(shù)性的活動(dòng)過(guò)程,同時(shí)促使人們關(guān)注這些過(guò)程中體現(xiàn)的各種時(shí)間性[22]。在整個(gè)界面設(shè)計(jì)工作中,制作檔案化過(guò)程的一些獨(dú)特的時(shí)間特征,并用這些時(shí)間特征反映檔案被利用和呈現(xiàn)的方式。湯姆·斯科菲爾德(Tom Schofield)等學(xué)者基于一批當(dāng)代詩(shī)歌檔案,設(shè)計(jì)出既能呈現(xiàn)數(shù)字檔案作品,又“適應(yīng)”詩(shī)歌作品時(shí)間節(jié)奏的檔案利用界面。借助以參與者(通常是詩(shī)人自己)為中心的理念,開發(fā)繪圖機(jī)和實(shí)時(shí)Twitter機(jī)器人,將數(shù)字檔案資源以更為活力、創(chuàng)新的形式呈現(xiàn)。在此概念的指導(dǎo)下,檔案用戶界面的設(shè)計(jì)與升級(jí)成為檔案館業(yè)務(wù)活動(dòng)的拓展領(lǐng)域。另外,澳大利亞原住民數(shù)字檔案館項(xiàng)目中,試圖借助社交媒體與智能手機(jī)等數(shù)字化工具技術(shù)搭建檔案用戶界面,創(chuàng)新檔案在時(shí)間、空間維度的存儲(chǔ)形式,沖破傳統(tǒng)社會(huì)權(quán)力運(yùn)作對(duì)檔案組織、編目、呈現(xiàn)、利用的影響,創(chuàng)造以澳大利亞原住民社群為核心對(duì)象的知識(shí)共享模式[23]。
數(shù)字人文的生存和發(fā)展意義不僅僅在于數(shù)字化技術(shù)在傳統(tǒng)人文研究的應(yīng)用,更加注重在數(shù)字時(shí)代下促使傳統(tǒng)人文與社會(huì)學(xué)科煥發(fā)出新的生存活力。先進(jìn)的數(shù)字技術(shù)豐富了檔案資源開發(fā)利用方式,開放協(xié)同的數(shù)字人文理念拓展了檔案理論與實(shí)踐研究的發(fā)展空間,在深刻認(rèn)識(shí)檔案在數(shù)字人文領(lǐng)域價(jià)值、作用的基礎(chǔ)上,做到“有的放矢”“因地制宜”,在交流合作中實(shí)現(xiàn)雙向領(lǐng)域和諧共生的目標(biāo)。