劉晉如
摘 要:本文通過(guò)對(duì)中美檔案館、圖書(shū)館和高校數(shù)字人文科研機(jī)構(gòu)相關(guān)網(wǎng)站的調(diào)研,從研究主體、項(xiàng)目類型和技術(shù)應(yīng)用方面介紹和歸納了中美代表性檔案數(shù)字人文項(xiàng)目,進(jìn)而對(duì)比中美檔案數(shù)字人文項(xiàng)目的差異,并建議從檔案數(shù)字人文觀、跨界合作、人才培育三方面推進(jìn)我國(guó)檔案數(shù)字人文項(xiàng)目的深入發(fā)展。
關(guān)鍵詞:數(shù)字人文;檔案項(xiàng)目;人文項(xiàng)目
Abstract:Through the investigation of the websites of Chinese and American archives, libraries and digital humanities research institutions, this paper introduces and summarizes the representative humanities and Chinese digital files in the research subjects, project types and technology applications, and then compares the Chinese and American archives figures. The differences in humanities projects, and suggestions for the in-depth development of China's archives digital humanities projects from the three aspects of archival digital humanities, cross-border cooperation and talent cultivation.
Keywords: Digital humanities; Archive project; Humanities project
1 緒論
隨著信息技術(shù)的發(fā)展,人文研究和信息領(lǐng)域的交叉融合越來(lái)越明顯,信息服務(wù)于人文研究的方式發(fā)生變化,關(guān)于數(shù)字人文的研究日趨興盛。數(shù)字人文是指將人文研究所需的信息資源結(jié)合數(shù)字技術(shù)以一種全新的形式服務(wù)于人文學(xué)科的研究方法,也可以理解為按照人文研究的需求設(shè)計(jì)信息數(shù)字形態(tài)的技術(shù)手段。數(shù)字人文經(jīng)歷了一個(gè)由低級(jí)到高級(jí)的發(fā)展階段,目前的數(shù)字人文更加強(qiáng)調(diào)數(shù)據(jù)的整合、關(guān)聯(lián)、挖掘,是一種數(shù)據(jù)驅(qū)動(dòng)型的科學(xué)研究范式。
檔案作為人文研究的重要信息資源,毋庸置疑地成為數(shù)字人文項(xiàng)目的重要開(kāi)發(fā)對(duì)象。但是目前檔案界關(guān)于數(shù)字人文的研究數(shù)量很少,處于探索階段。以“檔案”并含“數(shù)字人文”在中國(guó)知網(wǎng)進(jìn)行篇名檢索,檢索時(shí)間為2018年12月15日,得到相關(guān)中文文獻(xiàn)6篇。趙生輝介紹了國(guó)外檔案領(lǐng)域數(shù)字人文項(xiàng)目的概況、特點(diǎn)及對(duì)我國(guó)的啟示;董聰穎以威尼斯時(shí)光機(jī)為例說(shuō)明了數(shù)字人文對(duì)檔案信息資源開(kāi)發(fā)利用的影響,并從宏觀、中觀、微觀三個(gè)層面提出了促進(jìn)數(shù)字人文在檔案信息資源開(kāi)發(fā)中的應(yīng)用;李子林、王玉玨、龍家慶指出了數(shù)字人文與檔案工作的相互關(guān)系以及數(shù)字人文背景下檔案工作發(fā)展的新思路;吳加琪提出了檔案工作參與數(shù)字人文建設(shè)的必要性以及檔案工作在數(shù)字人文中的參與機(jī)制和保障措施。相關(guān)研究大多是探索檔案工作與數(shù)字人文的關(guān)系及其參與;數(shù)字人文在檔案信息資源開(kāi)發(fā)中的應(yīng)用;國(guó)外數(shù)字人文項(xiàng)目的介紹與啟示。
由此可見(jiàn),目前有關(guān)研究缺乏國(guó)內(nèi)檔案數(shù)字人文實(shí)踐和項(xiàng)目的介紹。數(shù)字人文中心是數(shù)字人文實(shí)踐的基地和展示窗口,數(shù)字人文的實(shí)踐需要集合各方面的資金、技術(shù)、人才,許多數(shù)字人文中心相繼成立?!皣?guó)際數(shù)字人文中心網(wǎng)絡(luò)(center-Net),自2007年4月成立以來(lái),已將來(lái)自19個(gè)國(guó)家約100個(gè)中心的200多名成員加入國(guó)際數(shù)字人文中心目錄?!盵1]全球各個(gè)數(shù)字人文中心運(yùn)行方式基本都采用項(xiàng)目制。美國(guó)是數(shù)字人文實(shí)踐的先驅(qū),占據(jù)全球數(shù)字人文中心的半壁江山。對(duì)中美檔案數(shù)字人文項(xiàng)目的調(diào)查和比較,最能直觀、客觀地體現(xiàn)國(guó)家數(shù)字人文檔案實(shí)踐的發(fā)展水平,進(jìn)而從中尋找差距,借鑒經(jīng)驗(yàn),結(jié)合國(guó)情采取切實(shí)可行的改進(jìn)方法。
2 概念界定
2.1 數(shù)字人文。“數(shù)字人文源于20 世紀(jì)40 年代出現(xiàn)的人文計(jì)算( humanities computing) ,最初著眼于計(jì)算語(yǔ)言學(xué)和文本資料的數(shù)字化,隨后被應(yīng)用于眾多人文學(xué)科領(lǐng)域。”[2]“2001年《數(shù)字人文指南》出版后,數(shù)字人文一詞逐漸代替了人文計(jì)算,作為一個(gè)新的研究領(lǐng)域,在2009年的語(yǔ)言協(xié)會(huì)年會(huì)(the Modern Language Association)上,獲得了北美文學(xué)界的承認(rèn)。”[3]首先,數(shù)字人文是一項(xiàng)跨學(xué)科研究?!皵?shù)字人文是將數(shù)化工具和技術(shù)(包含數(shù)字化、數(shù)據(jù)管理、數(shù)據(jù)分析、可視化、虛擬現(xiàn)實(shí)等技術(shù))應(yīng)用于傳統(tǒng)人文學(xué)科的一項(xiàng)跨學(xué)科研究,涉及語(yǔ)言、文學(xué)、歷史、藝術(shù)、文化人類學(xué)、考古學(xué)、哲學(xué)等眾多人文社會(huì)科學(xué)領(lǐng)域。”[4]此外,數(shù)字人文是一種新的研究范式?!皵?shù)字人文是指結(jié)合各種數(shù)字化材料,借助電腦的分析能力開(kāi)展的人文研究。”[5]“數(shù)字人文以數(shù)據(jù)密集型計(jì)算為基礎(chǔ),改變了傳統(tǒng)人文社會(huì)科學(xué)的研究范式,從定性到定量輔助加定性,為人文研究提出問(wèn)題、界定問(wèn)題和回答問(wèn)題提供新的視角。”[6]綜上所述,數(shù)字人文的內(nèi)涵隨著數(shù)字技術(shù)發(fā)展不斷深化,數(shù)字人文已經(jīng)從開(kāi)始的數(shù)字化文本服務(wù)人文研究轉(zhuǎn)變?yōu)榛跀?shù)據(jù)密集計(jì)算服務(wù)人文研究。運(yùn)用數(shù)字技術(shù)和工具實(shí)現(xiàn)以數(shù)據(jù)驅(qū)動(dòng)人文研究的跨學(xué)科研究范式。這是問(wèn)題驅(qū)動(dòng)范式向數(shù)據(jù)驅(qū)動(dòng)范式的轉(zhuǎn)變,通過(guò)數(shù)據(jù)驅(qū)動(dòng)人文研究,側(cè)重發(fā)現(xiàn)而非解釋的人文研究方法。
2.2 檔案數(shù)字人文項(xiàng)目。數(shù)字人文的實(shí)踐成果往往以項(xiàng)目的形式體現(xiàn)。“項(xiàng)目是指一系列獨(dú)特的、復(fù)雜的并相互關(guān)聯(lián)的活動(dòng),這些活動(dòng)有著一個(gè)明確的目標(biāo)或目的,必須在特定的時(shí)間、預(yù)算、資源限定內(nèi),依據(jù)規(guī)范完成?!盵7]從條件來(lái)看,檔案數(shù)字人文項(xiàng)目是運(yùn)用數(shù)字人文技術(shù),利用檔案資源為解決某一主題的人文問(wèn)題形成的一系列有聯(lián)系、有條件(實(shí)踐、資源、預(yù)算)限制的活動(dòng)。從內(nèi)容看,檔案數(shù)字人文項(xiàng)目是數(shù)字人文項(xiàng)目的一種,是指利用數(shù)字技術(shù)和工具對(duì)檔案資源進(jìn)行整合、加工從而服務(wù)于人文研究的項(xiàng)目。檔案資源是一個(gè)寬泛概念,不局限于檔案館藏,還包括其他企事業(yè)單位、行業(yè)機(jī)構(gòu)和散落在個(gè)人手中的檔案。數(shù)字人文的內(nèi)涵隨著數(shù)字技術(shù)的發(fā)展不斷演化,可分為數(shù)字化人文——數(shù)據(jù)化人文——可視化人文三個(gè)發(fā)展階段,也可看作檔案數(shù)字人文項(xiàng)目的三個(gè)層次。分別是指利用檔案數(shù)字化信息、檔案數(shù)據(jù)化信息和檔案可視化信息服務(wù)人文研究,三者逐層遞進(jìn),都可視為檔案數(shù)字人文項(xiàng)目建設(shè)的內(nèi)容。
3 中美檔案數(shù)字人文項(xiàng)目比較
3.1 項(xiàng)目研究主體。中國(guó)檔案數(shù)字人文項(xiàng)目的研究主體較為分散。除我國(guó)臺(tái)灣外,我國(guó)其他地區(qū)為數(shù)不多的數(shù)字人文中心目前并未開(kāi)展專門的檔案數(shù)字人文項(xiàng)目。中國(guó)檔案數(shù)字人文項(xiàng)目一般由圖書(shū)館、檔案館、高校科研機(jī)構(gòu)分別開(kāi)展。如中國(guó)國(guó)家圖書(shū)館的“中國(guó)記憶”項(xiàng)目、上海圖書(shū)館開(kāi)放數(shù)據(jù)平臺(tái)中的“盛宣懷檔案知識(shí)庫(kù)”和“名人手稿檔案庫(kù)”、天津市檔案館的“津沽史料”項(xiàng)目、上海市檔案館的“上海記憶”項(xiàng)目、青島市檔案館的“老青島”項(xiàng)目、中國(guó)人民大學(xué)人文北京研究中心開(kāi)展的“北京記憶”項(xiàng)目、臺(tái)灣大學(xué)數(shù)位人文研究中心的“大型數(shù)位典藏”項(xiàng)目。圖書(shū)館、檔案館的檔案數(shù)字人文項(xiàng)目一般由檔案館、圖書(shū)館提供檔案資源并提出項(xiàng)目需求,外包給信息技術(shù)公司完成。高校的檔案數(shù)字人文項(xiàng)目由高校數(shù)字人文科研中心、政府、企事業(yè)單位或個(gè)人合作完成。中國(guó)人民大學(xué)人文北京研究中心是中國(guó)人民大學(xué)與北京市政府合作組建的專門進(jìn)行“人文北京”課題研究的校屬跨學(xué)科研究機(jī)構(gòu)。臺(tái)灣大學(xué)數(shù)位人文研究中心設(shè)置的咨詢委員會(huì)的成員由校內(nèi)圖書(shū)館館長(zhǎng)及計(jì)算機(jī)資訊網(wǎng)絡(luò)中心主任及聘請(qǐng)的校內(nèi)外相關(guān)專長(zhǎng)領(lǐng)域人士共同構(gòu)成,同時(shí)根據(jù)研究發(fā)展需要聘請(qǐng)校內(nèi)外學(xué)者專家為特約研究員。
美國(guó)檔案數(shù)字人文項(xiàng)目的研究主體較為集中,大多由高校數(shù)字人文中心進(jìn)行研究。如,美國(guó)普林斯頓大學(xué)數(shù)字人文中心提供莎士比亞書(shū)店內(nèi)書(shū)籍流通和名人借閱情況的“莎士比亞書(shū)店”項(xiàng)目、密歇根州立大學(xué)數(shù)字人文與社會(huì)科學(xué)中心提供奴隸身份信息開(kāi)放數(shù)據(jù)庫(kù)的“奴隸傳記”項(xiàng)目、布朗大學(xué)數(shù)字學(xué)術(shù)中心轉(zhuǎn)錄和翻譯碑文文字并提供數(shù)字化開(kāi)放利用的“以色列碑文”項(xiàng)目、斯坦福大學(xué)空間與文本分析中心關(guān)于追溯舊金山城市規(guī)劃史的“想象中的舊金山”項(xiàng)目。截至2017年6月,數(shù)字人文合作組織“數(shù)字人文中心網(wǎng)絡(luò)”(center-Net)所收錄的數(shù)字人文中心已達(dá)192個(gè),覆蓋32個(gè)國(guó)家和地區(qū),其中一半以上來(lái)自美國(guó)。[8]美國(guó)高校數(shù)字人文中心的成員構(gòu)成可從兩個(gè)角度劃分。按照職責(zé)范圍劃分,包括:項(xiàng)目負(fù)責(zé)人、項(xiàng)目管理員、項(xiàng)目研究員、項(xiàng)目執(zhí)行人員、項(xiàng)目咨詢委員會(huì)。按照專家系統(tǒng)劃分,包括:專業(yè)學(xué)科專家、計(jì)算機(jī)系數(shù)字技術(shù)專家、專業(yè)科學(xué)館員以及其他相關(guān)人員。如“布朗大學(xué)數(shù)字學(xué)術(shù)中心的專家包括:社會(huì)科學(xué)數(shù)據(jù)專家、數(shù)字人文專家、數(shù)字技術(shù)顧問(wèn)、GIS專家,還包括其他高校中心專家和擅長(zhǎng)文本挖掘等技術(shù)的跨學(xué)科人才”。[9]高校數(shù)字人文科研中心集結(jié)了高校內(nèi)外的信息技術(shù)人才和資源支持,因此具備開(kāi)展優(yōu)質(zhì)檔案數(shù)字人文項(xiàng)目的條件。
3.2 項(xiàng)目類型。中國(guó)檔案數(shù)字人文項(xiàng)目的類型較單一,以檔案數(shù)字歷史文化項(xiàng)目為主。受中國(guó)歷史文化的影響,中國(guó)特別注重歷史檔案的保存,加之公眾文化需求的日益增長(zhǎng),中國(guó)檔案數(shù)字人文項(xiàng)目大多服務(wù)于史學(xué)研究和文化傳播。中國(guó)國(guó)家圖書(shū)館的“中國(guó)記憶”項(xiàng)目是“整理中國(guó)現(xiàn)當(dāng)代重大事件、重要人物專題檔案,并通過(guò)在館借閱、在線瀏覽、多媒體展覽、專題講座等形式向公眾提供服務(wù)的檔案資源建設(shè)與服務(wù)項(xiàng)目”。[10]通過(guò)口述檔案、影像檔案,手稿、信件、照片和實(shí)物檔案的收集和采集,形成多載體、多種類的專題檔案資源集合,包括我們的文字、中國(guó)年畫(huà)、絲綢刺繡、東北抗日聯(lián)軍等專題。中國(guó)人民大學(xué)人文北京研究中心的“北京記憶”項(xiàng)目是一個(gè)北京文化大型數(shù)字平臺(tái),融合北京城市多維文化的檔案資源,囊括了鐵路、飲食、建筑、藝術(shù)等專題,對(duì)京城文化進(jìn)行數(shù)字化展示與傳播,滿足北京文化研究者資料獲取和信息查詢需求。“上海圖書(shū)館開(kāi)放數(shù)據(jù)平臺(tái)中的盛宣懷檔案知識(shí)庫(kù)包含了盛宣懷家族自1850至1936年間的日記、文稿、信札、電報(bào)、賬冊(cè)、電文、合同、章程等17.5萬(wàn)件檔案,內(nèi)容涉及政治、經(jīng)濟(jì)、社會(huì)、軍事、外交、金融、貿(mào)易、教育各方面,是研究中國(guó)近代史的檔案寶庫(kù)?!盵11]
美國(guó)檔案數(shù)字人文項(xiàng)目的類型多樣,包括檔案數(shù)字史學(xué)項(xiàng)目、檔案數(shù)字文學(xué)項(xiàng)目、檔案數(shù)字地理項(xiàng)目、檔案數(shù)字文物項(xiàng)目、檔案數(shù)字社會(huì)學(xué)項(xiàng)目。美國(guó)檔案信息環(huán)境和信息思維較為開(kāi)放,并且數(shù)字人文中心的建立使得美國(guó)檔案數(shù)字人文項(xiàng)目具備相關(guān)領(lǐng)域的專家和相應(yīng)的技術(shù)資源條件。如,美國(guó)普林斯頓大學(xué)數(shù)字人文中心的“重建過(guò)去”項(xiàng)目,通過(guò)對(duì)破損文物建筑的檔案記錄進(jìn)行數(shù)字化,并搜集相關(guān)建筑的文本、圖片和其他材料屬性描述信息,開(kāi)發(fā)一個(gè)用于文物建筑遺址VR模型重建的建筑材料數(shù)據(jù)庫(kù)。哈佛大學(xué)地理信息中心的“漫步伊甸園”項(xiàng)目,是根據(jù)普利策獎(jiǎng)獲獎(jiǎng)作家保羅·薩洛佩克的檔案記錄結(jié)合地理信息系統(tǒng)繪制的反映人類遷移路徑的空間檔案地圖。該作家在全球范圍內(nèi)行走了人類的遷徙之路,并通過(guò)文字、照片、音頻和視頻記錄了他的所見(jiàn)所感,哈佛大學(xué)地理信息中心將其行程中的GPS數(shù)據(jù)繪制成地圖,并將其所生成的檔案信息融入其中,提供可視化圖像,在地圖上使用富勒投影和光譜著色來(lái)說(shuō)明人類通過(guò)這條路徑的行程距離和時(shí)間。這些項(xiàng)目通過(guò)檔案數(shù)據(jù)的跨學(xué)科融合,拓寬了檔案數(shù)字人文項(xiàng)目的服務(wù)范圍,從文史學(xué)延展到地理發(fā)現(xiàn)、文物保護(hù)甚至社會(huì)學(xué)問(wèn)題的研究。
3.3 技術(shù)應(yīng)用。中國(guó)檔案數(shù)字人文項(xiàng)目以數(shù)字化技術(shù)為主。數(shù)字化技術(shù)是構(gòu)建數(shù)字人文資源的基礎(chǔ),包括掃描技術(shù)、OCR文字識(shí)別技術(shù)、多媒體技術(shù)等。國(guó)內(nèi)通過(guò)對(duì)實(shí)體檔案的掃描以人文項(xiàng)目形式建立了大量人文主題的專題檔案數(shù)字資料庫(kù),包括文本檔案資料庫(kù)(全文數(shù)據(jù)庫(kù)、目錄數(shù)據(jù)庫(kù))和多媒體檔案資料庫(kù)。中國(guó)國(guó)家數(shù)字圖書(shū)館項(xiàng)目已經(jīng)建設(shè)了館藏甲骨實(shí)物與拓片數(shù)字化資源庫(kù)、敦煌遺珍數(shù)字化資源庫(kù)、館藏年畫(huà)數(shù)字化資源庫(kù)等多個(gè)數(shù)字人文資料庫(kù)。一些綜合檔案館也在檔案信息網(wǎng)站中設(shè)置了專題檔案數(shù)字化資源庫(kù),通過(guò)數(shù)字化的文本、照片、音頻、影像反映城市歷史文化。如上海檔案館的“上海記憶”、天津市檔案館的“津沽史料”、青島市檔案館的“老青島”等。還有一些資料庫(kù)實(shí)現(xiàn)了檢索功能和檢索結(jié)果的優(yōu)化。“臺(tái)灣大學(xué)數(shù)位人文研究中心目前已建立了35個(gè)大型數(shù)位典藏資料庫(kù),內(nèi)含超過(guò)600萬(wàn)份全文資料、近3000萬(wàn)幅影像、4億字的全文、數(shù)百小時(shí)的影音資料,開(kāi)發(fā)了20多種信息檢索和分析工具。”[12]其中大多是一手的檔案史料,包括臺(tái)灣文化資料庫(kù)、日治法院檔案資料庫(kù)、臺(tái)灣舊照片資料庫(kù)等。這些檔案資料庫(kù)通過(guò)檔案元數(shù)據(jù)的著錄,運(yùn)用資訊勘探分析工具和分類、統(tǒng)計(jì)方法分析并呈現(xiàn)檔案材料中的關(guān)系型脈絡(luò),優(yōu)化線索方式,如在臺(tái)灣文化庫(kù)中可進(jìn)行關(guān)鍵詞檢索、時(shí)間軸檢索、分類檢索、地圖檢索。
美國(guó)檔案數(shù)字人文項(xiàng)目以數(shù)據(jù)技術(shù)為主。“數(shù)據(jù)技術(shù)包括本體技術(shù)、語(yǔ)義萬(wàn)維網(wǎng)技術(shù)(包括關(guān)聯(lián)數(shù)據(jù))等專門針對(duì)知識(shí)單元(語(yǔ)義單位)的數(shù)據(jù)管理技術(shù);文本分析(詞頻分析、共現(xiàn)分析、關(guān)聯(lián)關(guān)系分析等)、內(nèi)容(主題)分析、時(shí)序分析、空間分析、社會(huì)關(guān)系分析等數(shù)據(jù)分析技術(shù);可視化技術(shù)、人機(jī)交互技術(shù)等數(shù)據(jù)展示技術(shù)?!盵13]通過(guò)數(shù)據(jù)技術(shù)可以構(gòu)建檔案知識(shí)庫(kù)即提供知識(shí)服務(wù)的結(jié)構(gòu)化數(shù)據(jù)庫(kù),實(shí)現(xiàn)文本的內(nèi)容分析、時(shí)空分析、歷史人物的社會(huì)關(guān)系分析,并以可視化的形式直觀展現(xiàn)檔案數(shù)據(jù)的內(nèi)在聯(lián)系。可視化是指通過(guò)聚合和提取來(lái)展示數(shù)據(jù)的方法,可分為統(tǒng)計(jì)可視化、文本可視化、地理可視化。美國(guó)斯坦福大學(xué)圖書(shū)館和法國(guó)國(guó)家圖書(shū)館合作開(kāi)發(fā)的“法國(guó)革命數(shù)字檔案館”項(xiàng)目,通過(guò)檔案類別、數(shù)量和時(shí)間的量化分析和數(shù)據(jù)關(guān)聯(lián),在選擇不同的檢索類別時(shí),在可視化圖表中可實(shí)時(shí)觀察相關(guān)檔案在不同時(shí)間點(diǎn)的數(shù)量的變化,確定某一檢索條件下檔案的年代分布和數(shù)量多寡。美國(guó)內(nèi)布拉斯加大學(xué)林肯分校數(shù)字人文研究中心開(kāi)展的“鐵路與現(xiàn)代美國(guó)的形成”項(xiàng)目,對(duì)大量鐵路公司的員工信件、商務(wù)合同、薪資記錄、舊照片等歷史檔案進(jìn)行數(shù)字化,創(chuàng)建了鐵路工人數(shù)據(jù)庫(kù),并通過(guò)文本分析、數(shù)據(jù)關(guān)聯(lián)技術(shù)進(jìn)行統(tǒng)計(jì)和挖掘,繪制了鐵路工人時(shí)空變化分布地圖。這種基于檔案數(shù)據(jù)關(guān)聯(lián)和分析的可視化直觀高效地提供了檔案背后的知識(shí),為人文研究提供了新的研究思路。
4 對(duì)我國(guó)檔案數(shù)字人文項(xiàng)目建設(shè)的啟示
4.1 檔案工作者要樹(shù)立正確的數(shù)字人文觀。首先要加強(qiáng)檔案工作人員的數(shù)字人文意識(shí),主動(dòng)參與檔案數(shù)字人文項(xiàng)目建設(shè)。目前國(guó)內(nèi)具有代表性的檔案數(shù)字人文項(xiàng)目都是圖書(shū)館和高校發(fā)起的,如上海圖書(shū)館的上海年華項(xiàng)目、中國(guó)人民大學(xué)的北京記憶項(xiàng)目、中國(guó)國(guó)家圖書(shū)館的中國(guó)記憶項(xiàng)目等,國(guó)內(nèi)檔案領(lǐng)域的數(shù)字人文項(xiàng)目案例較少。這些項(xiàng)目依托綜合圖書(shū)館和高校檔案館館藏開(kāi)展,檔案資源有限且缺乏檔案專業(yè)人才的指導(dǎo)。檔案館擁有豐富的檔案館藏資源,應(yīng)主動(dòng)發(fā)起和參與數(shù)字人文項(xiàng)目。檔案館員對(duì)于社會(huì)檔案需求和檔案價(jià)值有更加專業(yè)的把握,由檔案館牽頭發(fā)起檔案數(shù)字人文項(xiàng)目更易全面整合相關(guān)檔案資源,挖掘館藏檔案資源的深層價(jià)值。此外,檔案館在開(kāi)展數(shù)字人文項(xiàng)目時(shí)要樹(shù)立正確的數(shù)字人文觀念。數(shù)字人文不等于數(shù)字記憶,數(shù)字人文強(qiáng)調(diào)數(shù)據(jù)驅(qū)動(dòng)人文研究,僅僅通過(guò)檔案數(shù)字化和檢索方式的升級(jí)無(wú)法實(shí)現(xiàn)。檔案工作者要樹(shù)立持續(xù)發(fā)展的數(shù)字人文理念,不能止步于檔案數(shù)字記憶的留存和人文研究的查詢服務(wù),要充分運(yùn)用數(shù)字人文相關(guān)技術(shù)建立量化數(shù)據(jù)庫(kù),融合地理信息系統(tǒng)等相關(guān)專業(yè)領(lǐng)域,實(shí)現(xiàn)檔案數(shù)據(jù)對(duì)人文研究的可視化服務(wù)和知識(shí)服務(wù)。
4.2 加強(qiáng)跨領(lǐng)域、跨國(guó)際的交流合作。要加快檔案領(lǐng)域數(shù)字人文中心建設(shè),整合國(guó)內(nèi)檔案數(shù)字人文領(lǐng)域的數(shù)據(jù)、人才、技術(shù)、資金等資源。目前國(guó)內(nèi)檔案領(lǐng)域數(shù)字人文項(xiàng)目存在高??蒲袡C(jī)構(gòu)、圖書(shū)館和檔案館各行其是的現(xiàn)象,不利于資金、人力、物力的集中,容易導(dǎo)致數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,項(xiàng)目質(zhì)量參差不齊,造成資源浪費(fèi)、重復(fù)建設(shè)。檔案數(shù)字人文項(xiàng)目除了需要檔案、圖書(shū)、人文、信息技術(shù)等各個(gè)領(lǐng)域的專家學(xué)者共同籌謀,還可借助網(wǎng)絡(luò)平臺(tái),以眾包模式發(fā)動(dòng)公眾參與檔案數(shù)字人文項(xiàng)目?!笆⑿麘褭n案抄錄”項(xiàng)目是上海圖書(shū)館2017年啟動(dòng)的在線眾包抄錄平臺(tái)。上海圖書(shū)館收藏的盛檔記錄大多是書(shū)信形式的繁體手寫(xiě)稿,因年代久遠(yuǎn)而字跡模糊,OCR識(shí)別困難,加之?dāng)?shù)量巨大,僅靠專業(yè)人員難以完成數(shù)字化工作。因此,上海市圖書(shū)館集結(jié)社會(huì)智慧與力量,招募業(yè)余愛(ài)好者參與盛檔的元數(shù)據(jù)和全文數(shù)字化抄錄和標(biāo)注,完成提交后由圖書(shū)館專家進(jìn)行質(zhì)量審核。同時(shí),要加強(qiáng)與國(guó)外數(shù)字人文中心合作,解決技術(shù)難題和檔案資源流失海外的問(wèn)題。如浙江大學(xué)和哥倫比亞大學(xué)合作的“甲骨文數(shù)字化”項(xiàng)目,北京大學(xué)、哈佛大學(xué)費(fèi)正清中國(guó)研究中心、中央研究院歷史語(yǔ)言研究所等多所高校和研究機(jī)構(gòu)共同主持的“中國(guó)歷代人物傳記資料庫(kù)”項(xiàng)目等。[14]通過(guò)與國(guó)際間、行業(yè)間、民眾間的合作,可以減少技術(shù)、資源阻力,提高檔案數(shù)字人文項(xiàng)目的質(zhì)量。
4.3 加快檔案領(lǐng)域數(shù)字人文人才的培育。檔案數(shù)字人文項(xiàng)目開(kāi)展的前提是檔案數(shù)據(jù)的齊全完整,檔案數(shù)據(jù)庫(kù)的建設(shè)與維護(hù)相當(dāng)于檔案數(shù)字人文項(xiàng)目的前端,這對(duì)于檔案工作者的業(yè)務(wù)技能和知識(shí)儲(chǔ)備都提出了更高的要求。檔案數(shù)字人文項(xiàng)目的跨學(xué)科屬性決定了數(shù)字人文項(xiàng)目團(tuán)隊(duì)的多樣性,需要人文專家、信息技術(shù)專家、圖書(shū)檔案專家、項(xiàng)目管理專家等結(jié)構(gòu)多元的專家團(tuán)隊(duì)。但是從我國(guó)的現(xiàn)實(shí)情況來(lái)看,大多數(shù)檔案館員的知識(shí)結(jié)構(gòu)和檔案數(shù)字人文項(xiàng)目的專家結(jié)構(gòu)都比較單一。因此,要積極推進(jìn)檔案館員的數(shù)字人文人才培育工作,培養(yǎng)檔案館員跨學(xué)科研究的能力,關(guān)注數(shù)字人文技術(shù)的學(xué)習(xí)和數(shù)字人文工具的使用。如,北京大學(xué)圖書(shū)館開(kāi)設(shè)的“數(shù)字人文工作坊”,旨在激發(fā)計(jì)算機(jī)等信息科學(xué)領(lǐng)域師生人文研究的興趣、充實(shí)人文和社會(huì)科學(xué)領(lǐng)域師生的數(shù)字技術(shù)知識(shí),并促進(jìn)二者的協(xié)調(diào)互動(dòng)與跨界融合。通過(guò)邀請(qǐng)數(shù)字人文學(xué)者作專題講座,就人文和技術(shù)的某些專題進(jìn)行交流和討論;對(duì)學(xué)員開(kāi)設(shè)社會(huì)網(wǎng)絡(luò)分析軟件培訓(xùn)課程;以建立“數(shù)字人文”社交網(wǎng)絡(luò)群等方式進(jìn)行數(shù)字人文技術(shù)傳播與分享,營(yíng)造數(shù)字技術(shù)與人文結(jié)合的學(xué)術(shù)氛圍。
參考文獻(xiàn):
[1]centerNet.Centers[EB/OL].[2018-11-13].http://dhcenternet.org/about.
[2][8]林澤斐,歐石燕.美國(guó)高校數(shù)字人文研究項(xiàng)目研究?jī)?nèi)容解析[J].圖書(shū)情報(bào)工作,2017(22):52-58.
[3]宋丹丹,戴凡,王安萌,周曉紅.國(guó)內(nèi)圖書(shū)館數(shù)字人文研究綜述[J].晉圖學(xué)刊,2017(5):74-78.
[4][12]金玲娟.我國(guó)圖書(shū)館數(shù)字人文服務(wù)現(xiàn)狀、障礙與對(duì)策研究[J].圖書(shū)館工作與研究,2018(9):15-20.
[5]梁晨.量化數(shù)據(jù)庫(kù):“數(shù)字人文”推動(dòng)歷史研究之關(guān)鍵[J].江海學(xué)刊,2017(2):162-164.
[6]朱本軍,聶華.跨界與融合:全球視野下的數(shù)字人文——首屆北京大學(xué)“數(shù)字人文論壇”會(huì)議綜述[J].大學(xué)圖書(shū)館學(xué)報(bào),2016(5):16-21.
[7]百度百科[EB/OL].[2018-11-13].https://baike.baidu.com/item/%E9%A1%B9%E7%9B%AE/477803?fr=aladdin.
[9]鄧要然,李少貞.美國(guó)高校數(shù)字人文中心調(diào)查[J].圖書(shū)館論壇,2017(3):26-34.
[10]中國(guó)國(guó)家圖書(shū)館.中國(guó)記憶項(xiàng)目實(shí)驗(yàn)網(wǎng)站[EB/OL].[2018-11-13].http://www.nlc.gov.cn/cmptest/.
[11]上海圖書(shū)館.盛宣懷檔案知識(shí)庫(kù)[EB/OL].[2018-11-13].http://sd.library.sh.cn/sd/home/index.
[13]劉煒,葉鷹.數(shù)字人文的技術(shù)體系與理論結(jié)構(gòu)探討[J].中國(guó)圖書(shū)館學(xué)報(bào),2017(5):32-41.
[14]鄧要然.美國(guó)圖書(shū)館領(lǐng)域數(shù)字人文項(xiàng)目研究[J].圖書(shū)館工作與研究,2017(8):29-35.
(作者單位:上海大學(xué)圖書(shū)情報(bào)檔案系 來(lái)稿日期:2018-12-20)