石志松
(深圳大學(xué)城圖書館,廣東深圳 518055)
當(dāng)今時代是數(shù)字化時代,是“互聯(lián)網(wǎng)+”時代,各種學(xué)科的研究環(huán)境、研究方法都因數(shù)字資源和互聯(lián)網(wǎng)絡(luò)而改變,人文學(xué)科和人文研究受到的影響尤其明顯。自上世紀60年代以來,在計算機技術(shù)支撐下,人文資料的獲取、保存、分析和展示方式都發(fā)生了變化,大量的圖書報紙、藝術(shù)作品、視聽資料等被數(shù)字化。數(shù)字化的學(xué)術(shù)資源逐漸成為人文研究的基礎(chǔ)平臺,在部分人文領(lǐng)域,人文計算(Humanities Computing)的概念開始出現(xiàn)。隨著數(shù)字技術(shù)對人文研究、教學(xué)與傳播各環(huán)節(jié)的滲透,數(shù)字人文(Digital Humanities)的概念逐漸取代人文計算,成為一個新興的跨學(xué)科研究領(lǐng)域的代名詞[1]。
利用數(shù)字技術(shù)輔助來促進人文研究,在歐美已經(jīng)是一種趨勢。目前,全球范圍內(nèi)有超過185個直接以“Digital Humanities”命名的中心、研究機構(gòu)、學(xué)術(shù)圈子或團體,其中有超過80%都分布在北美和歐洲[2]。我國數(shù)字人文研究起步較晚,除了2011年成立的武漢大學(xué)數(shù)字人文中心外,直到2016年后才陸續(xù)有新的數(shù)字人文機構(gòu)或團隊建設(shè)動向,例如:2016年成立的北京大學(xué)數(shù)字人文小組,2017年9月掛牌的南京大學(xué)數(shù)字人文研究中心。從CNKI“數(shù)字人文”文獻發(fā)表年度趨勢(圖1)也可以看出,我國數(shù)字人文領(lǐng)域發(fā)表文獻量從2016年開始迅速增長,與數(shù)字人文研究機構(gòu)的增長基本同步,表明我國近兩年來數(shù)字人文的研究熱度快速提升。但是,CNKI“數(shù)字人文”文獻發(fā)表的絕對量還很低,說明我們在該領(lǐng)域的研究還很薄弱,需要加大研究力度和資源投入,奮起追趕國際學(xué)術(shù)潮流和研究前沿。
圖1 CNKI“數(shù)字人文”文獻發(fā)表年度趨勢(截至2018年5月25日數(shù)據(jù))
綜合國內(nèi)外數(shù)字人文發(fā)展現(xiàn)狀和趨勢,我們有必要研究和學(xué)習(xí)國外數(shù)字人文發(fā)展的先進經(jīng)驗,推動我國數(shù)字人文研究取得跨越式發(fā)展??v觀世界各國數(shù)字人文發(fā)展歷程,筆者認為荷蘭數(shù)字人文發(fā)展的全方位合作模式和經(jīng)驗值得我們現(xiàn)階段借鑒和推廣。荷蘭數(shù)字人文研究的起步也不算早,但是近年來發(fā)展迅猛,一個重要因素就是多種層級和模式的合作。荷蘭通過人文技術(shù)中心(CHAT)的國際跨界合作模式、“數(shù)字人文診所”的館際互助合作模式以及馬斯特里赫特大學(xué)數(shù)字人文項目的館院合作模式等全方位的合作,推動數(shù)字人文研究取得了長足進展。
2011年,荷蘭皇家文理學(xué)院(KNAW)、阿姆斯特丹自由大學(xué)、阿姆斯特丹大學(xué)、荷蘭數(shù)字科學(xué)研究中心以及國際商業(yè)機器公司(IBM)合作,共同成立并運作“人文技術(shù)中心”(CHAT:Center for Humanities and Technology),建立起長期的戰(zhàn)略合作伙伴關(guān)系。CHAT的研究人員認為,我們需要一種多數(shù)學(xué)者都能便捷使用的方式來獲取、表達以及存儲人文學(xué)科數(shù)據(jù)。同樣重要的還有對強大檢索工具的需求,使學(xué)者能夠從“多重視角”(multiple perspectives)挖掘人文研究數(shù)據(jù)。CHAT成員和合作伙伴將創(chuàng)建新的分析方法(包括實例、數(shù)據(jù)和工具等),以大幅提高人文研究的效率。CHAT的研究目標包括:①人文研究和理解的轉(zhuǎn)型以應(yīng)對社會挑戰(zhàn);②異構(gòu)、復(fù)雜社會數(shù)據(jù)的算法和計算工具的重大改進;③通過對語言、文化和歷史的全新理解取得社會效益。
自二十世紀后半葉以來,計算機與計算方法已經(jīng)改變了人們的工作、交流、娛樂甚至思考的方式。人文科學(xué)研究對人類精神的發(fā)展和批判性反思作出了重大貢獻,對包括媒體、教育和旅游在內(nèi)的許多經(jīng)濟和文化生活部門產(chǎn)生了積極影響。人文科學(xué)研究也為計算機技術(shù)的創(chuàng)新做出了貢獻,例如現(xiàn)在可在移動設(shè)備上使用的預(yù)測文本。CHAT的人文學(xué)者和計算機科研人員之間的合作將會在這兩個領(lǐng)域取得重大突破,并將使社會、技術(shù)和文化活動的許多其他領(lǐng)域受益。
CHAT通過一系列研討會促進了寬領(lǐng)域?qū)υ?,大量對話都聚焦于?dāng)前正在推進的利用最先進的工具開展人文研究,以及該領(lǐng)域有可能實現(xiàn)或極度需要的創(chuàng)新舉措。通過研討,CHAT將重要的人文學(xué)科挑戰(zhàn)及核心技術(shù)進行了總結(jié),如表1所示。
表1 人文學(xué)科面臨的挑戰(zhàn)及核心技術(shù)
2.3.1 人文學(xué)科面臨的挑戰(zhàn)
(1)觀點
各類觀點之間的界限模糊不清、搖擺不定,這是既存在于文本也存在于視頻圖像中的巨大挑戰(zhàn)。不同個人、群體以及民族的觀點之間往往也存在沖突。呈現(xiàn)多元觀點并追溯其發(fā)展演變,能夠有效緩解外交與商業(yè)領(lǐng)域的沖突狀況。
(2)語境
得益于文化遺產(chǎn)及日常生活的數(shù)字化發(fā)展,如今我們能夠獲取話語及其觀點的縱向發(fā)展路徑。此處面臨的挑戰(zhàn)有:①如何判斷相關(guān)語境(地點、時間、任務(wù)、角色)以及如何判定出正確的數(shù)據(jù)粒度;②如何串聯(lián)相關(guān)語境,以便自動識別復(fù)雜活動(例如“買房”“成立項目團隊”“創(chuàng)業(yè)”)并據(jù)此推薦回答與內(nèi)容。認知計算機將會發(fā)掘并呈現(xiàn)出數(shù)據(jù)之間以往未知的關(guān)聯(lián)以及這些關(guān)聯(lián)的重要性。
(3)結(jié)構(gòu)
對語義結(jié)構(gòu)和統(tǒng)計結(jié)構(gòu)的發(fā)掘,是為內(nèi)容自動分配相應(yīng)含義與價值的關(guān)鍵所在。我們的愿望是推動大規(guī)模知識圖譜的自動生成,這些知識圖譜是由激增的復(fù)雜語義單元(實體對象、關(guān)系、活動、事件)構(gòu)成的。
(4)敘述
對相關(guān)文件的簡單排序?qū)?fù)雜問題的解答任務(wù)留給了人類。我們的愿望是利用混雜數(shù)據(jù)中提取出的觀點,創(chuàng)立豐富的數(shù)據(jù)表示法,構(gòu)建有效的文本及視覺敘述結(jié)構(gòu)。
2.3.2 核心技術(shù)
(1)認知計算
認知計算系統(tǒng)利用會話式自然語言及視覺、觸覺與其他情感化界面,與人類就人類術(shù)語開展協(xié)作。認知系統(tǒng)將會自主學(xué)習(xí)與推理,與人類自然互動,利用專業(yè)知識完成研究與決策。
(2)網(wǎng)絡(luò)分析法
現(xiàn)代網(wǎng)絡(luò)理論與技術(shù)通過延展當(dāng)前工作的規(guī)模程度以及提供分析框架的方式,具備了向人文學(xué)科轉(zhuǎn)型的發(fā)展?jié)摿Α?/p>
(3)可視化
大型多模態(tài)數(shù)據(jù)庫的接入,為人文學(xué)科的研究人員既帶來了機遇也帶來了挑戰(zhàn)。我們需要新型的可視化工具,實現(xiàn)對相關(guān)含義的跨時間互動式發(fā)掘,以及對多種模態(tài)的整合。我們還需要新的方法來傳達這些可視化分析所揭示的內(nèi)容。
(4)文本及社會分析法
目前,CHAT在文本的語言學(xué)與詞匯分析、主題提取與總結(jié)、以及文本含義與內(nèi)部關(guān)聯(lián)的自然語言處理(NLP)方面已經(jīng)取得了巨大進展。但這些計算技術(shù)往往脆弱且不完整,對各個語料庫也提出了重要的定制化需求,因此還存在很多需要解決的問題。開發(fā)細微化的語言理解力(例如欺騙、幽默、隱喻、元話語等)仍是一大重要挑戰(zhàn)。
(5)檢索與數(shù)據(jù)表示法
現(xiàn)代信息檢索領(lǐng)域的一大關(guān)鍵性挑戰(zhàn)是,從文件檢索轉(zhuǎn)變?yōu)楹x更加豐富的單元檢索,比如回答、實體對象、事件、討論與觀點。該領(lǐng)域的進步將會為人文學(xué)者在重要的“研究”(exploration)與“語境化”(contextualization)任務(wù)中提供協(xié)助。
荷蘭圖書館界有志于提高圖書館員的數(shù)字人文知識和技能。為此,荷蘭國家圖書館、阿姆斯特丹自由大學(xué)圖書館、萊頓大學(xué)圖書館和根特大學(xué)圖書館共同創(chuàng)立了名為“數(shù)字人文診所(Digital Humanities Clinics)”的平臺,為提升圖書館員的數(shù)字人文素養(yǎng)提供培訓(xùn)活動。該平臺是2015-2016年間發(fā)起并逐漸成立起來的,這些“診所”旨在為眾多有不同需求的圖書館員(包括已掌握基本技能的學(xué)科館員和技術(shù)館員)提供DH(數(shù)字人文)基本方法和技能的培訓(xùn)。
3.2.1 為圖書館員提供DH的基本方法和技能
“診所”的目標是傳授圖書館員數(shù)字人文的基礎(chǔ)知識,課程內(nèi)容能為研究人員和學(xué)生提供服務(wù);發(fā)現(xiàn)館員的知識和技術(shù)缺口,通過培訓(xùn)使之提升;通過“診所”傳授的技術(shù),幫助館員實現(xiàn)日常圖書館工作的自動化。培訓(xùn)目標不是要把館員變成程序員或數(shù)據(jù)處理專員,而是希望幫助他們提升DH綜合素養(yǎng)以適應(yīng)DH項目需求。
3.2.2 加強圖書館與學(xué)術(shù)界的合作與聯(lián)系
通過邀請高校和研究機構(gòu)的研究人員在“診所”授課,為圖書館員和研究人員之間的溝通和交流提供機會。研究人員對專業(yè)領(lǐng)域的熱情,也能引起圖書管理員對相關(guān)問題的興趣。
3.2.3 建立荷蘭圖書館員的DH培訓(xùn)和交流網(wǎng)絡(luò)
這個計劃能為圖書館員提供線下培訓(xùn)和線上交流的知識網(wǎng)絡(luò)。培訓(xùn)活動后會有持續(xù)跟進,可以繼續(xù)參與DH社區(qū)的學(xué)習(xí),還可以一起合作開發(fā)圖書館相關(guān)的DH項目。
為了使培訓(xùn)課程具有代表性,能覆蓋圖書館員參與DH項目所需的基礎(chǔ)知識和技能,“數(shù)字人文診所”的組織者參考了美國和英國的相關(guān)調(diào)研成果。美國研究圖書館協(xié)會的里克·穆利根(Rikk Mulligan)在其撰寫的報告“數(shù)字學(xué)術(shù)支持”中指出,圖書館員在數(shù)字人文素養(yǎng)方面最大的缺口及人員占比為:可視化(65%)、計算機文本分析和支持(64%)、統(tǒng)計分析支持(60%)和開發(fā)軟件(54%)。英國研究圖書館(RLUK)的克里斯蒂娜·坎普托里(Christina Kamposiori)在27個圖書館中進行了類似的調(diào)查,發(fā)現(xiàn)那些接受調(diào)查的圖書館員希望學(xué)習(xí)的DH知識和技能包括:編程(77.8%)、DH知識(77.8%)、談判和溝通技巧(66.7%)、領(lǐng)導(dǎo)技能(55.6%)和研究技巧(59.3%)。
“數(shù)字人文診所”的組織者確定的培訓(xùn)課程如表2所示,課程設(shè)置上兼顧講座課程和動手操作的工作坊,參與的學(xué)員們還可以靈活選擇意向參與的項目。
2016年6月在赫爾辛基舉行的歐洲研究圖書館協(xié)會(LIBER)會議,是馬斯特里赫特大學(xué)圖書館數(shù)字人文發(fā)展的重要轉(zhuǎn)折點。在本次以“圖書館知識開放之路”為主題的會議中,馬斯特里赫特大學(xué)圖書館館長Ingrid Wijk受到啟發(fā),開始尋求圖書館與各院系之間可能存在的合作渠道,以推進數(shù)字人文的研究。
馬斯特里赫特大學(xué)的數(shù)字人文專家目前正在開展一系列數(shù)字人文研究。例如,數(shù)字文化開發(fā)教授莎莉·懷亞特(Sally Wyatt)關(guān)注的問題是“技術(shù)和社會變革之間的關(guān)系(尤其是社會排斥和不平等問題)”,突出了數(shù)字人文的政治潛力和重要性;藝術(shù)與社會科學(xué)學(xué)院的利奧尼·科尼普斯(Leonie Cornips)教授研究的是兒童對荷蘭語的雙語習(xí)得,以及在多語言環(huán)境下調(diào)查林堡地區(qū)的身份認同建設(shè);語言研究中心的尼爾·懷里(Neill Wylie)和迪耐斯·麥克阿利斯特(Denise McAllister),使用語料庫語言學(xué)工具為該校學(xué)生提供培訓(xùn)課程;藝術(shù)與社會科學(xué)學(xué)院的妮可·蘭德拉德(Nico Randeraad)和克里斯·里奧納德茨(Chris Leonards),與圖書館合作進行歷史社會網(wǎng)絡(luò)關(guān)系的可視化研究。Ingrid Wijk館長強調(diào),圖書館員在這些項目的合作中,不僅僅是為研究人員提供資源和信息服務(wù),更重要的是要以合作者的身份參與項目研究。
表2 “數(shù)字人文診所”培訓(xùn)課程
4.2.1 短期規(guī)劃
首先,馬斯特里赫特大學(xué)圖書館需要確定數(shù)字人文項目的目標,為此可以組織一個“專家小組”,邀請該校數(shù)字人文領(lǐng)域的優(yōu)秀學(xué)者,還包括該校圖書館對數(shù)字人文感興趣的館員、藝術(shù)與社會科學(xué)學(xué)院和人文科學(xué)學(xué)院的教員、其他院系對此領(lǐng)域感興趣的工作人員和學(xué)生以及來自其他數(shù)字人文組織的代表參與研討。這個“專家小組”的目的是清楚地了解研究人員對圖書館的期望,圖書館對研究人員的期望,雙方分別采用和掌握了哪些技能,以及如何將這些技能最有成效地結(jié)合起來。
4.2.2 中期規(guī)劃
馬斯特里赫特大學(xué)要在數(shù)字人文發(fā)展方面取得領(lǐng)先,就應(yīng)該考慮如何更加具體地促進該大學(xué)數(shù)字人文項目的基礎(chǔ)設(shè)施建設(shè)以及確定該大學(xué)的圖書館該扮演什么樣的角色。可以聘請一到兩名博士生或博士后或其他經(jīng)驗豐富的研究人員,來探究馬斯特里赫特大學(xué)的圖書館和該領(lǐng)域的研究者之間的合作應(yīng)該如何更好地建立起來。這些研究人員也可以加入“數(shù)字人文診所”項目,以獲得進一步的啟發(fā)和支持。此外,還可以嘗試多方面的合作:調(diào)查與荷蘭其他數(shù)字人文研究機構(gòu)合作的可能性,例如阿姆斯特丹數(shù)字人文中心、荷蘭電子科學(xué)中心、人文科技中心等;借鑒馬里蘭大學(xué)圖書館的“數(shù)字人文孵化器”項目經(jīng)驗,為員工提供素質(zhì)培訓(xùn)項目。保存圖書館的數(shù)字人文項目成果并提供可訪問的途徑,是馬斯特里赫特大學(xué)圖書館在馬斯特里赫特地區(qū)推廣數(shù)字人文的重要方式。
4.2.3 長期建議
在馬斯特里赫特大學(xué)圖書館建立數(shù)字人文中心、實驗室、工作組,這是該圖書館長期數(shù)字人文研究的重要一步。馬斯特里赫特大學(xué)圖書館可以嘗試成為數(shù)字人文的“樞紐”并刺激馬斯特里赫特地區(qū)的數(shù)字人文研究和交流。促進馬斯特里赫特大學(xué)的圖書館和其他的院系的研究人員之間的交換,增強他們之間的聯(lián)系,幫助他們更好地了解目前正在進行的工作以及這些工作如何最好地與圖書館和各院系的優(yōu)勢相結(jié)合。此外,馬斯特里赫特大學(xué)圖書館要更多地參與數(shù)字人文教學(xué),由圖書館提供數(shù)字人文的研究模塊,甚至可以提供研究實習(xí)的機會,使得馬斯特里赫特大學(xué)的數(shù)字人文課程變得有趣。
根據(jù)馬斯特里赫特大學(xué)數(shù)字人文發(fā)展規(guī)劃,該校數(shù)字人文項目各階段任務(wù)分解如表3所示。該任務(wù)分解是該校數(shù)字任務(wù)項目實踐的經(jīng)驗總結(jié)和固化,是高校圖書館與校內(nèi)各院系進行數(shù)字人文研究合作的寶貴經(jīng)驗,值得學(xué)習(xí)和借鑒。
表3 馬斯特里赫特大學(xué)數(shù)字人文項目各階段任務(wù)
數(shù)字人文是典型的交叉學(xué)科,“數(shù)字”代表的是數(shù)字技術(shù)、網(wǎng)絡(luò)技術(shù)、文獻計量、統(tǒng)計分析、圖形圖像等技術(shù)領(lǐng)域,而“人文”代表的是歷史、地理、社科、藝術(shù)、心理等人文領(lǐng)域,多學(xué)科交叉應(yīng)用研究是數(shù)字人文研究的顯著特征。正如倫敦國王學(xué)院數(shù)字人文教授西蒙·坦納(Simon Tanner)所言,“創(chuàng)新”“開放”“合作”“跨界”的理念在數(shù)字人文研究中尤其重要[6]。人文技術(shù)中心(CHAT)的成立與運行正是這一理念的體現(xiàn)。人文技術(shù)中心匯集了荷蘭的人文研究機構(gòu)、技術(shù)研究機構(gòu)、高校和國際著名計算機公司IBM的優(yōu)勢資源,是典型的國際跨界合作模式。人文技術(shù)中心以創(chuàng)建新的分析方法、提高人文研究的效率為目標,為人文研究搭建了工具性基礎(chǔ)設(shè)施?!肮び破涫?,必先利其器”,對于數(shù)字人文研究的后發(fā)國家和地區(qū)來說,成立人文技術(shù)研究合作機構(gòu),統(tǒng)籌優(yōu)勢資源,推進研究基礎(chǔ)設(shè)施建設(shè),是精耕深作、利在千秋的良策。
圖書館現(xiàn)已在數(shù)字人文研究中逐漸承擔(dān)起重要的角色,起到中樞和紐帶作用,促進了各種數(shù)字人文資源的融合與分享。圖書館的文獻資源是圖書館參與數(shù)字人文的核心競爭力,尤其是數(shù)字化時代,圖書館對館藏資源的收集整理以及數(shù)字化、網(wǎng)絡(luò)化平臺構(gòu)建,是數(shù)字人文研究的重要基礎(chǔ)。荷蘭馬斯特里赫特大學(xué)圖書館正是利用了圖書館的資源優(yōu)勢,把該館打造成校內(nèi)數(shù)字人文研究館院合作模式的樞紐,并主持起草了該校的數(shù)字人文發(fā)展規(guī)劃,占據(jù)了數(shù)字人文項目合作的核心地位。此外,未來圖書館應(yīng)該更加廣泛地發(fā)揮工具及平臺提供、課題咨詢和信息分享的作用,甚至介入到數(shù)字資源出版等領(lǐng)域。同時,圖書館還要利用自身的資源優(yōu)勢、人才優(yōu)勢和環(huán)境優(yōu)勢在數(shù)字人文教育和推廣方面發(fā)揮更大的作用。
圖書館員在數(shù)字人文研究項目中有多重作用:與人文學(xué)者合作,為研究人員提供數(shù)字人文研究工具;將數(shù)字人文研究項目與所需的館藏資源匹配、對接;肩負項目IT專家的責(zé)任,搭建信息共享平臺;發(fā)揮自身專業(yè)優(yōu)勢,與項目各參與方溝通,實現(xiàn)跨學(xué)科合作[7]。馬斯特里赫特大學(xué)圖書館館長Ingrid Wijk認為,圖書館員應(yīng)該成為數(shù)字人文項目的合作者,而不僅僅是服務(wù)提供者。所以,圖書館要大力發(fā)展數(shù)字人文首先需要著力提升圖書館員的數(shù)字人文素養(yǎng)。荷蘭的“數(shù)字人文診所”培訓(xùn)模式,協(xié)調(diào)圖書館界的優(yōu)勢資源,調(diào)動學(xué)術(shù)界力量參與,課程設(shè)置上兼顧理論課程與實踐工作坊,同時注重知識硬技能和溝通軟技能的結(jié)合,為圖書館員培訓(xùn)提供了絕佳樣例。我們可以在此基礎(chǔ)上,針對我國的實際情況,完善我們自己的培訓(xùn)計劃,充分調(diào)動各級圖書館學(xué)會的資源,集中力量打造圖書館界數(shù)字人文培訓(xùn)的“黃埔軍?!?。
在當(dāng)今數(shù)字化和“互聯(lián)網(wǎng)+”的大時代背景下,數(shù)字人文的發(fā)展方興未艾??v觀世界數(shù)字人文的研究現(xiàn)狀和發(fā)展趨勢,數(shù)字人文將是圖書館發(fā)展的新方向,圖書館在數(shù)字人文領(lǐng)域的發(fā)展將大有可為。我們要以“創(chuàng)新”“開放”“合作”“跨界”的理念,努力將圖書館建設(shè)成為數(shù)字技能和服務(wù)的樞紐、創(chuàng)新性學(xué)術(shù)交流的平臺,打破各學(xué)科間的壁壘,助力數(shù)字化時代知識和文化的可持續(xù)發(fā)展。