• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      把“專題數(shù)據(jù)庫”作為方法:數(shù)字人文的重新認識及其在AI時代的發(fā)展趨勢

      2023-10-28 13:40:36肖鵬
      圖書情報知識 2023年5期
      關(guān)鍵詞:人文數(shù)據(jù)庫數(shù)字

      肖鵬

      1 引言

      在信息資源管理及圖書館學(xué)領(lǐng)域,人文社科專題數(shù)據(jù)庫(以下簡稱“專題數(shù)據(jù)庫”)被認為是一個既新且舊的研究對象。孫建軍教授曾指出,“說其‘老’,是因為過去很多機構(gòu)和領(lǐng)域都有投身過專題數(shù)據(jù)庫建設(shè),如圖檔博機構(gòu)、文化機構(gòu)、高??蒲袡C構(gòu)等;說其‘新’,是因為在大數(shù)據(jù)、智慧數(shù)據(jù)等理念催生下,過去以機構(gòu)、資源等為導(dǎo)向的專題數(shù)據(jù)庫建設(shè)已經(jīng)不能適應(yīng)新環(huán)境下人文社科‘開放化’、‘計算化’、‘協(xié)同化’、‘智能化’等新要求”[1]。只是,即便該議題有煥然新顏的一面,也有若干團隊對它保持關(guān)注并持續(xù)產(chǎn)出高質(zhì)量成果,但不得不承認,與20世紀90年代相比,專題數(shù)據(jù)庫的研究正在走向?qū)W科的邊緣區(qū)位。

      而在具有交叉特質(zhì)的數(shù)字人文領(lǐng)域,專題數(shù)據(jù)庫也是作為基礎(chǔ)的存在[2]。多數(shù)數(shù)字人文項目往往“以有限資源聚焦特定議題”,其產(chǎn)出天然指向了專題化的數(shù)字學(xué)術(shù)產(chǎn)品。對數(shù)字人文相關(guān)專題數(shù)據(jù)庫的研究并不在少,但主要聚焦于數(shù)據(jù)庫介紹和調(diào)查、技術(shù)開發(fā)和需求分析等,對它的概念化和理論化嘗試同樣稀缺??梢哉f,“專題數(shù)據(jù)庫”常常被視為是一項具體實務(wù)或一種實踐方式,而并非一個具有理論意義的分析切口。

      “作為基礎(chǔ)”的專題數(shù)據(jù)庫對于洞察數(shù)字人文有著獨特的優(yōu)勢。專題數(shù)據(jù)庫之所以“既新且舊”,正因為它從20世紀90年代以來,一直在人文社會科學(xué)研究中占據(jù)顯著位置:轟轟烈烈的數(shù)字人文浪潮之前,“專題數(shù)據(jù)庫”就是人文學(xué)者利用文獻資源的基本途徑[3]。即便到今天,大多數(shù)人文學(xué)者與數(shù)字人文的直接聯(lián)系仍來自于專題數(shù)據(jù)庫——作為一個貫穿“傳統(tǒng)人文”到“數(shù)字人文”轉(zhuǎn)變歷程的關(guān)鍵實體,考察專題數(shù)據(jù)庫的內(nèi)涵演變可以幫助我們理解數(shù)字人文對人文社群的切實影響。此外,當前對數(shù)字人文的討論多是從理論轉(zhuǎn)型、范式演變、整體規(guī)劃這些“自上而下”的視角展開,對設(shè)施建設(shè)、工程思維等方面的關(guān)注還有待加強,而專題數(shù)據(jù)庫作為數(shù)字人文項目的實踐成果之一,能夠有效投射出設(shè)計、開發(fā)、維護、完善和利用等實務(wù)性流程和物質(zhì)化要素,提供了一種“自下而上”的考察路徑,對當下的主流視角具有補充作用。

      基于此,本文的核心觀點是:專題數(shù)據(jù)庫是接合人文社群與技術(shù)脈絡(luò)的界面,也是承載人文批判與技術(shù)轉(zhuǎn)型的基石,要推進對數(shù)字人文領(lǐng)域的理解和認知,不僅僅要把“專題數(shù)據(jù)庫”視為具化的實體,厘清其形態(tài)與內(nèi)涵,更要把它作為“方法”,成為捕捉數(shù)字人文發(fā)展內(nèi)涵與動向的監(jiān)測儀。

      2 作為方法:一種批判性的研究路徑

      本文嘗試通過“專題數(shù)據(jù)庫”與外部的宏大議題相連接,將其作為窺見數(shù)字人文龐雜體系的小切口,這一研究思路在很大程度上借鑒了近年來關(guān)注日增的“作為方法”的批判性路徑。

      “把XX作為方法”(來自日語中的“方法としての”,以下簡稱“作為方法”)是人文社科領(lǐng)域的一種獨特表達或構(gòu)詞。這一構(gòu)詞起源于1960年竹內(nèi)好“作為方法的亞洲”的演講,溝口雄三教授在30年后的《作為方法的中國》中將之進一步發(fā)揚,旨在通過探尋“亞洲”“中國”等區(qū)域話語的主體性構(gòu)建過程獲得具有普遍性的知識[4]。1994年,溝口雄三在與汪暉的對談中對日本學(xué)界“沒有中國的中國學(xué)”進行了批判。溝口認為,中日有一千多年的交往,但日本本土到20世紀90年代仍然沒有真正的中國研究。他以江戶之后的日本學(xué)界為例,指出當時“日本的學(xué)者不關(guān)心同時代的中國(清朝),而關(guān)心宋明時代或古代的中國文化。為什么呢?這是因為他們是為了自己的統(tǒng)治而吸收中國的儒教,這種關(guān)心即使在明治以后也繼續(xù)存在”[5],否定了這種以自我為中心的、帶有想象性的漢學(xué)研究路徑。解構(gòu)即醞釀著重構(gòu),他據(jù)此提出“有中國又超越中國的中國學(xué)”的學(xué)術(shù)愿景。大體來講,便是要通過走進真實的中國打造出一副“中國眼鏡”,發(fā)現(xiàn)一個和歐洲原理相對應(yīng)的“中國原理”,最終用來回望和認識日本自身——這一過程大體便可稱為“作為方法的中國”。

      在溝口雄三之后,隨著陳光興、孫歌等一批學(xué)者的引介,以“某某區(qū)域”(如華南、上海等等)作為方法在我國歷史學(xué)、社會學(xué)和區(qū)域研究中迅速興起。最近十年來,“作為方法”的使用語境進一步拓展,從“家”[6]到“民國”[7]、從“記憶”[8]到“平臺”[9]等等,直到項飆頗為“出圈”的對話錄《把自己作為方法》,“作為方法”幾乎覆蓋諸種事物及各類概念。恰如周曉虹教授所言,當下“無一不可以‘作為方法’。以致最時髦的反問恐怕倒是,究竟什么不可以‘作為方法’”[10]。

      “把XX作為方法”的內(nèi)核是一種批判性的理論視角。在全球化背景下,尤其在歐美主導(dǎo)的現(xiàn)代性話語體系中,世界各個區(qū)域復(fù)雜主體性的構(gòu)建過程被隱匿,難以滋養(yǎng)多元的問題意識和學(xué)術(shù)立場。故而,“作為方法”最早作為一種對抗和批判的學(xué)術(shù)工具出現(xiàn)在區(qū)域國別研究中,之后又拓展到其他各類批判性研究之中。這一批判性視角的實現(xiàn)需要兩個步驟:①跳脫預(yù)設(shè)和固有的思維框架(如區(qū)域研究中“中西”二元思維、“沖擊—反應(yīng)”理論等)與諸多先在性觀念預(yù)設(shè),認識到作為對象的“XX”在內(nèi)涵上的多樣性。一般來講,為了還原其復(fù)雜內(nèi)涵,需要系統(tǒng)考察和斟酌“XX”這一事物的發(fā)展趨勢、內(nèi)涵演變與相關(guān)話語的構(gòu)建過程。②通過多樣性和復(fù)雜性的發(fā)掘,將“XX”與更宏大層面的學(xué)術(shù)議題或社會議題聯(lián)系起來,將其轉(zhuǎn)換為一副眼鏡(或謂“視角”),打造區(qū)別于預(yù)設(shè)和固有的理論框架,以支持新的觀察、分析與思考。

      “作為方法”的迅速擴散,大約可以視為多元主義對全球化以及歐美主導(dǎo)話語的挑戰(zhàn)。研究者們旨在通過這一路徑,跳脫預(yù)設(shè)性的學(xué)理框架,還原諸種區(qū)域、事物、概念的本來面貌,將它們安置到更加多元的理論顯微鏡之下進行觀察——這種“還原”與“跳脫”對于數(shù)字人文領(lǐng)域其實同樣重要(可詳見6.3腳注中關(guān)于西蒙教授訪談的引用)。

      3 把“專題數(shù)據(jù)庫”作為方法

      3.1 作為方法的“專題數(shù)據(jù)庫”

      “專題數(shù)據(jù)庫”有時也被稱為專題數(shù)字平臺(門戶)、領(lǐng)域數(shù)據(jù)庫、特色數(shù)據(jù)庫、學(xué)科/主題數(shù)據(jù)庫等。在傳統(tǒng)圖書館學(xué)研究中,“專題數(shù)據(jù)庫”一般指的是專門性的資源(或?qū)挿阂饬x上的“數(shù)據(jù)”)集合體,它所“庫存”的資源/數(shù)據(jù)主要是圍繞特定領(lǐng)域、人物、事件或問題聚集起來的[1,11]。這一定義描繪的專題數(shù)據(jù)庫,其核心特質(zhì)和內(nèi)涵就是“資源/數(shù)據(jù)集合”。

      但實際上,專題數(shù)據(jù)庫從來都不可能只是信息資源的簡單聚合,因為“資源之上,總有更多”。即便最古老的人文社科專題數(shù)據(jù)庫,都需要為用戶提供分類瀏覽或特定檢索等利用途徑,這使得這一數(shù)據(jù)集合體天然就擁有一定的工具特質(zhì);又譬如,由人文學(xué)者或團隊建設(shè)的專題數(shù)據(jù)庫多服務(wù)于特定研究需求,典型者如“中國近現(xiàn)代思想史研究專業(yè)數(shù)據(jù)庫(1830-1930)”就是為“中國現(xiàn)代重要政治術(shù)語的形成”課題而專門設(shè)計[12],因而它們又往往具備潛在的問題發(fā)現(xiàn)屬性。

      隨著時代的發(fā)展、技術(shù)的迭代和需求的變化,專題數(shù)據(jù)庫呈現(xiàn)出越來越豐富的特質(zhì)和屬性;而隨著數(shù)字人文成為一股潮流并把專題數(shù)據(jù)庫作為這一潮流的主要成果,專題數(shù)據(jù)庫的可能性被徹底激活了。把“專題數(shù)據(jù)庫”作為方法,從本質(zhì)上說,就是通過把握“專題數(shù)據(jù)庫”在數(shù)字人文語境下的新特質(zhì),并基于這種理解探究數(shù)字人文領(lǐng)域的深層次內(nèi)涵。

      為了實現(xiàn)以上目的,依據(jù)前文“作為方法”的兩個步驟,本文的研究進路包括兩個階段。階段(1):探討“專題數(shù)據(jù)庫”的概念和內(nèi)涵演變。通過調(diào)研一系列作為數(shù)字人文項目成果的專題數(shù)據(jù)庫產(chǎn)品,分析專題數(shù)據(jù)庫的主要形態(tài)與發(fā)展趨勢,發(fā)掘數(shù)字人文變革在“專題數(shù)據(jù)庫”這一“舊”實體身上留下的“新”痕跡。我們需要的不是對專題數(shù)據(jù)庫的簡單定義,而是在“資源/數(shù)據(jù)集合”的基礎(chǔ)上,澄清“專題數(shù)據(jù)庫”這一概念在數(shù)字人文實踐中已經(jīng)被廣泛認同、卻并沒有被清晰定義和言明的那部分全新內(nèi)涵。階段(2):立足對“專題數(shù)據(jù)庫”新特質(zhì)和新屬性的分析,將其視為一面認識數(shù)字人文的透鏡,聯(lián)結(jié)數(shù)字人文理論研究的關(guān)鍵文獻,圍繞“數(shù)字人文時代的專題數(shù)據(jù)庫如何形成”這一問題,形成重新審視和反思數(shù)字人文的框架,深化對作為場域的數(shù)字人文的認識。

      3.2 研究素材與研究過程

      可以說,階段(1)和階段(2)貫穿了一系列具體問題:一方面,什么是專題數(shù)據(jù)庫?在數(shù)字人文出現(xiàn)之前,它有什么核心特質(zhì)?當我們把它視為數(shù)字人文項目的成果或一個重要部分,它又呈現(xiàn)出什么新特性?另一方面,專題數(shù)據(jù)庫作為貫穿“人文”到“數(shù)字人文”轉(zhuǎn)型的關(guān)鍵實體,它可以為我們提供什么樣的獨特視角和分析框架?透過這一視角/框架,我們?nèi)绾胃聦?shù)字人文的認識,數(shù)字人文又如何展現(xiàn)出對傳統(tǒng)人文領(lǐng)域的關(guān)系變革與結(jié)構(gòu)性調(diào)整?以上的新知識,對于推進未來的數(shù)字人文研究與實踐又有什么啟發(fā)?

      為了回應(yīng)以上問題,筆者主要采用了帶有扎根性質(zhì)的定性研究路徑。定性研究的素材選自《全球代表性數(shù)字人文專題數(shù)據(jù)庫目錄(暫名)》(以下簡稱《專題數(shù)據(jù)庫目錄》)(見文后“支撐數(shù)據(jù)1”)?!秾n}數(shù)據(jù)庫目錄》是本團隊內(nèi)部自建的數(shù)據(jù)集,收錄了20世紀90年代至今1700余個專題數(shù)據(jù)庫的基本信息(見表1)。該數(shù)據(jù)集在此前相關(guān)項目的沉淀數(shù)據(jù)基礎(chǔ)上[13],進一步整合了不同信息源的專題數(shù)據(jù)庫信息,主要包括:重要數(shù)字人文中心(主要依據(jù)centerNet等的數(shù)字人文中心名錄)、數(shù)字人文資助方(如安德魯·梅隆基金會)、數(shù)字人文資源聚集門戶(如人文社會資料庫名錄檢索)的項目數(shù)據(jù)與數(shù)據(jù)庫信息,國內(nèi)外學(xué)術(shù)論文的介紹和指引等。一些學(xué)者自行搜集和整理的項目/數(shù)據(jù)庫清單也對本數(shù)據(jù)集起到補充作用,例如下文列舉的“炸彈觀察計劃”數(shù)據(jù)庫便是從DH GIS PROJECT博文中按圖索驥而得[14]。

      表1 《全球代表性數(shù)字人文專題數(shù)據(jù)庫目錄》元數(shù)據(jù)方案(部分)Table 1 "Catalog of Global Representative Digital Humanities Specialized Database" Metadata Scheme(Partial)

      筆者按照3個原則從《專題數(shù)據(jù)庫目錄》中篩選出定性研究所需的樣本專題數(shù)據(jù)庫:(1)該庫有與之關(guān)聯(lián)的數(shù)字人文項目,并且項目的必備元數(shù)據(jù)要素相對完備;(2)具有一定的活躍度,例如最近3年有內(nèi)容更新,或相關(guān)的數(shù)字人文項目處于活躍期/受資助期;(3)項目主持人或項目主持單位具有一定影響力或代表性。最終挑選出相關(guān)專題數(shù)據(jù)庫341個,并于2022年6月到2023年8月期間進行了逐一訪問和重新調(diào)查,其中可訪問的有193個。

      在調(diào)查過程中,我們基于數(shù)據(jù)庫的內(nèi)容、特點和建設(shè)方描述,對這些數(shù)據(jù)庫在“資源/數(shù)據(jù)集合”之外的“特質(zhì)/內(nèi)涵”進行開放性編碼(見文后“支撐數(shù)據(jù)2”),共形成380個“特質(zhì)標簽”。對這些標簽進行剔除(刪除出現(xiàn)頻次少于19的標簽)和歸類后,最終篩選“工具箱”“發(fā)聲筒”“透視鏡”“賦能器”“探路儀”“文化庫”“交際場”“思想集”8種主要的新特性。每一個樣本專題數(shù)據(jù)庫在聚集資源之外,都展現(xiàn)出以上8種新特性中的至少一種。

      其后,根據(jù)國家社科基金青年項目“技術(shù)賦能視閾下人文學(xué)者的數(shù)字學(xué)術(shù)需求及其圖書館服務(wù)策略研究”對100余名人文社科研究者、數(shù)字人文項目參與者、圖書館/檔案員的訪談素材[15-16](見文后“支撐數(shù)據(jù)3”),并結(jié)合重要的理論文獻、學(xué)術(shù)報告與行業(yè)新聞,將8種新特性歸納為4個關(guān)鍵詞,即:工具性(對應(yīng)“工具箱”)、問題性(對應(yīng)“探路儀”“思想集”)、體驗性(對應(yīng)“透視鏡”“文化庫”“交際場”)與社會性(對應(yīng)“發(fā)聲筒”“思想集”),又基于訪談加入一個新的關(guān)鍵特性“穩(wěn)定性”。作為階段(1)的研究結(jié)果,下文第四部分將對這五個特性展開詳細討論。

      為了進一步討論階段(2)提出的各個問題,通過扎根方式將各個新特性與相應(yīng)的訪談素材、理論文獻等進行歸因連接和編碼(見文后“支撐數(shù)據(jù)2”),探討數(shù)字人文的介入如何引致專題數(shù)據(jù)庫在“資源/數(shù)據(jù)”集合的基礎(chǔ)上演化出各種新特性。這一工作發(fā)掘出了“工程”“媒介”“物質(zhì)”和“生態(tài)”等四方面要素,它們形塑了數(shù)字人文語境下的專題數(shù)據(jù)庫,各自之間也互為牽引,構(gòu)建起一個從專題數(shù)據(jù)庫出發(fā)、詮釋數(shù)字人文的理論框架,下文第五部分將對此進行介紹。

      4 專題數(shù)據(jù)庫的新特性

      基于現(xiàn)有研究,我們更新了“專題數(shù)據(jù)庫”的界定:專門性的資源(或?qū)挿阂饬x上的“數(shù)據(jù)”)集合體,它所“庫存”的資源/數(shù)據(jù)主要是圍繞特定領(lǐng)域、人物、事件或問題聚集起來的;當其作為數(shù)字人文項目的研究成果或與相關(guān)項目密切關(guān)聯(lián)時,為了更好地發(fā)掘?qū)n}資源/數(shù)據(jù)的潛力,還往往展現(xiàn)出工具性、問題性、體驗性、社會性、穩(wěn)定性等特征。

      4.1 工具性

      誠如上文所言,任何專題數(shù)據(jù)庫都擁有諸如“檢索”或“分類”等基本的工具性,否則便無法滿足其用戶對資源的利用需求。從這個角度來講,作為“研究工具”的特質(zhì)是天然嵌入其血液之中的,只不過傳統(tǒng)上不會特別強調(diào)罷了。在數(shù)字人文的視域下,專題數(shù)據(jù)庫的工具化更為顯著,人文學(xué)者對于數(shù)字人文的首要期待便是提供分析工具——學(xué)界領(lǐng)袖們一直強調(diào)數(shù)字人文不僅僅是工具[17]。這些澄清之所以必要,恰恰因為其工具特質(zhì)過于明顯所致。

      專題數(shù)據(jù)庫的工具化趨勢體現(xiàn)得最為明顯的一點便是,多數(shù)專題數(shù)據(jù)庫都擁有了相對完備的基礎(chǔ)/通用工具功能。在今天,如果用戶面對一個只有瀏覽和基本檢索功能的數(shù)據(jù)庫,他們的第一直覺往往是“簡陋的”或“不滿意的”。得益于模塊化、可復(fù)用等開發(fā)資源的成熟,在數(shù)據(jù)庫中嵌入高級檢索、導(dǎo)航欄、可視化、表格化、GIS、OCR等基本工具(功能)的難度和成本持續(xù)降低。以Gale Scholar為代表,其多個歷史文獻/檔案類的子庫都采用同一套通用的工具模板,檢索、可視化、文獻分析、原始文本參閱等功能成為這些數(shù)據(jù)庫的標配。此外,開發(fā)者往往還會基于數(shù)據(jù)庫的資源特點開發(fā)具有針對性的專用工具,比較典型的如“中國哲學(xué)書電子化計劃”“國學(xué)大師”等中小型數(shù)字人文站點。這些站點的很多工具如“相似段落資料庫”“注音轉(zhuǎn)換”“部首查詢”“引得信息”等非常輕量化,卻又因切中人文學(xué)者的需求而備受好評。

      專題數(shù)據(jù)庫的“通用工具”與“專用工具”之間并無明確的界限。一方面,許多曾經(jīng)只在少數(shù)數(shù)據(jù)庫上出現(xiàn)的專用功能,現(xiàn)在逐步呈現(xiàn)通用化、標配化的趨勢,如可視化功能最具有代表性。另一方面,不同專題數(shù)據(jù)庫之間經(jīng)常通過不同方式實現(xiàn)功能的互相借用,例如借道API,專用的分析功能可以嵌入其他數(shù)據(jù)庫之中;類似“引得數(shù)字平臺”,則對MARKUS(碼庫思)進行二次開發(fā)將其作為平臺的功能之一。專題數(shù)據(jù)庫事實上成為了不同數(shù)字人文項目之間的媒介,通過工具功能的轉(zhuǎn)換與調(diào)用在不同數(shù)字人文項目之間建立起隱秘的關(guān)聯(lián),進而將不同的數(shù)字人文社群聯(lián)系在一起——這種聯(lián)系方式在傳統(tǒng)人文領(lǐng)域是相當罕見的。

      4.2 問題性

      在專題數(shù)據(jù)庫選擇特定專題資源的那一刻起,就埋下了相應(yīng)的問題意識。對于人文學(xué)者來講,推動數(shù)字人文項目的核心動機也在于學(xué)術(shù)問題的發(fā)現(xiàn)和解難。專題數(shù)據(jù)庫作為數(shù)字人文項目的實體化成果,在當前的建設(shè)實踐中,主要通過構(gòu)建規(guī)?;⒄Z義化、深度標注的數(shù)據(jù)基礎(chǔ)支持一些新穎的研究思路,輔助學(xué)者社群發(fā)現(xiàn)偶然性知識,進而依賴社群的研究素養(yǎng)將其演化為正式的學(xué)術(shù)問題。

      比較具有代表性的是芬蘭語義計算研究小組(Sematic Computing Research Group,簡稱“SeCo小組”)開發(fā)的BiographySampo平臺,該平臺覆蓋了13,100條與人物傳記相關(guān)的數(shù)據(jù)(類似CBDB),并通過使用CIDOC DRM模型與至少16個外部的數(shù)據(jù)源進行了對接;基于這一數(shù)據(jù),SeCo小組采用機器學(xué)習(xí)在知識圖譜中挖掘出大量“有趣的”關(guān)聯(lián)關(guān)系,梳理出整個數(shù)據(jù)庫內(nèi)人物、職業(yè)、地點等諸多數(shù)據(jù)類型之間的關(guān)系網(wǎng)絡(luò)[18]。研究者可以在該數(shù)據(jù)庫發(fā)現(xiàn)很多意料之外的關(guān)聯(lián),如某類職業(yè)的從業(yè)人員在某地的相似行為等等,Biography Sampo還為這種“關(guān)聯(lián)”提供了自然語言解釋。實際上,這便是通過Biography Sampo平臺實現(xiàn)對群體傳記學(xué)(prosopography)的支持?!吧虾D書館古籍聯(lián)合目錄及循證平臺”之于古籍循證方法[19],復(fù)旦大學(xué)“中國歷史地理信息系統(tǒng)”之于HGIS(Historical or Humanities GIS,歷史GIS)研究[20],均有與之相似之處。

      雖然“問題性”是人文學(xué)者對數(shù)字人文的最大期待,但轟轟烈烈的數(shù)字人文革命尚未真正發(fā)生:一方面,有學(xué)者認為,數(shù)字人文尚未能證明其對人文問題具備獨特的創(chuàng)新和解難能力,他們指出數(shù)字人文更多是利用數(shù)據(jù)庫支撐的新方法和新數(shù)據(jù)來對已有結(jié)論進行擴展解釋和重復(fù)驗證。李點教授在關(guān)于數(shù)字人文“何作何為、何去何從”的文章中對此已做了系統(tǒng)的闡述[21]。另一方面,當前對加強“問題發(fā)現(xiàn)”功能的主要思路是期待專題數(shù)據(jù)庫在提供數(shù)據(jù)的同時構(gòu)建“可解釋的工具”,以“達到破除算法黑箱、發(fā)現(xiàn)文本背后的生產(chǎn)邏輯的目的”[22]。然而,可解釋性和透明性恰恰是當前AI環(huán)境下人類面臨的最主要困難之一[23],這一學(xué)術(shù)進路似乎并不通暢。

      4.3 體驗性

      傳統(tǒng)的人文研究中就有強調(diào)“為大眾而歷史”的“公共史學(xué)”路徑,在數(shù)字人文世界,這種面向公共的特質(zhì)更為顯著了。有相當一部分專題數(shù)據(jù)庫(特別是那些由公共文化機構(gòu)支持建設(shè)的)日益強調(diào)通過故事化、虛擬化、沉浸化、可視化的方式來引起公眾興趣——考慮到以上方式都以不同方式增強用戶體驗為目的,我們姑且將這一特質(zhì)稱為“體驗性”。

      一個可供討論的例子便是炸彈觀察計劃(The Bomb Sight Project)。進入該項目數(shù)據(jù)庫的主界面,迎面而來便是一張觸目驚心的紅點圖(bombsight.org)。該數(shù)據(jù)庫基于英國國家檔案收藏的二戰(zhàn)時期炸彈普查資料,展現(xiàn)了1940年到1941年“倫敦大轟炸”期間德國空襲英國時投下的炸彈分布和整體數(shù)量。通過基于地圖的可視化方式,普羅大眾可以直觀感受到當時轟炸之迅猛、情況之危急[24]。

      采用地圖、虛擬3D技術(shù)、可視化、動畫化、互動游戲等諸多方式來加強體驗的專題數(shù)據(jù)庫或類似平臺還有很多,考慮到古籍活化、遺產(chǎn)活化等屬于熱門議題,這里無須贅述。有必要一提的是,在眾多的案例中,筆者之所以選擇炸彈觀察計劃,原因在于它在資料上是扎實的、在功能上是有效且簡單的,這種特質(zhì)和后文要進一步論述的“穩(wěn)定性”有著密切關(guān)聯(lián)。

      4.4 社會性

      如果說工具性和問題性原本便潛伏在傳統(tǒng)專題數(shù)據(jù)庫的內(nèi)核里,那么,“社會性”和“體驗性”一樣,無疑是專題數(shù)據(jù)庫在數(shù)字人文視域下呈現(xiàn)的全新特質(zhì)。這兩種特性的興起,不僅與數(shù)字人文項目的資金來源、建設(shè)主體等有關(guān),也受到人文社科研究的社會化傾向影響?!白寣W(xué)術(shù)進入公眾生活”可能不是數(shù)字人文帶來的新話題,卻在數(shù)字化進程中得以更好地實現(xiàn)。

      和“體驗性”相比,“社會性”強調(diào)的是學(xué)術(shù)社會化的嚴肅面相。比如和“炸彈觀察計劃”看似雷同的“知你所在”(Know Your Place)項目,其數(shù)據(jù)庫的主體界面之一也應(yīng)用了GIS技術(shù)與可視化地圖。該項目通過招募志愿者,對西英格蘭地區(qū)8個郡的地圖進行標注,發(fā)掘當?shù)氐倪z產(chǎn)數(shù)據(jù),強化地方的文化認同。其“社會性”還體現(xiàn)在許多細節(jié)之處,例如它特別標注了歷史上特殊群體的活動地點,旨在讓大眾理解他們的生活軌跡和歷史處境[25]。

      與“知你所在”相比,“撕裂/分離”(Torn Apart/Separados)項目的社會改革意圖更為鮮明。此項目發(fā)起于特朗普實施“零容忍”移民政策期間,當時,這一政策要求逮捕非法移民并將他們與未成年子女強行分離拘留[26]。項目團隊利用來自美國移民和海關(guān)執(zhí)法局(ICE)等多個源頭的數(shù)據(jù)建立專題數(shù)據(jù)庫,通過可視化的方式展現(xiàn)移民拘留狀況的地理分布。為了及時、有力地回應(yīng)“零容忍”政策,“撕裂/分離”項目從起意到發(fā)布僅用了幾周的時間,最終引發(fā)社會熱烈反響。這一項目與2011年成立的#transform DH小組有密切關(guān)聯(lián),該小組濫觴于數(shù)字人文大辯論時期,目的是“重新定義數(shù)字人文作為進行變革性社會正義學(xué)術(shù)研究的工具”,旨在通過數(shù)字人文的方式將諸多包容性議題帶入公眾視野[27]。

      4.5 穩(wěn)定性

      在基于《專題數(shù)據(jù)庫目錄》的調(diào)查、分析和編碼過程中,筆者并沒有提取出“穩(wěn)定性”這一特性。梳理了相關(guān)的訪談素材之后,再回過頭考察各類專題數(shù)據(jù)庫,很明顯會發(fā)現(xiàn):專題數(shù)據(jù)庫大多采用了非常基礎(chǔ)且成熟的建設(shè)模式和技術(shù)方案。

      表面來看,這一特性似乎是反直覺的。畢竟多年來我們把數(shù)字人文視為具有顛覆性的領(lǐng)域,呼吁引入各種各樣的新技術(shù)與新方法,而這些新穎的事物似乎總是前沿、激進且?guī)в胁环€(wěn)定性的。但如果仔細觀察:第一,我們討論的“新技術(shù)”或“新方法”往往是相對于人文領(lǐng)域而言,它們在自然科學(xué)以及其他領(lǐng)域多有相對成熟的應(yīng)用。第二,隨著人類社會的數(shù)字化轉(zhuǎn)型進程日益縱深,數(shù)據(jù)庫建設(shè)的人才與技術(shù)成本都在迅速降低——這一點與20世紀80年代到新千禧年前后的情況大有不同。當時,專題數(shù)據(jù)庫(有一些被稱為“數(shù)字圖書館”)的建設(shè)常常需要國家或大型機構(gòu)的專門投入,僅紙本文獻的數(shù)字化便所費不貲,“建庫”是一件專業(yè)、艱難、且高成本的事宜。第三,除了部分特別強調(diào)體驗性的項目,數(shù)字人文耗資較大的技術(shù)投入主要集中在考古分析、圖像監(jiān)測等需要大型設(shè)備投入的領(lǐng)域,有很多還處于“實驗室”階段而沒有發(fā)布為更大眾化的“專題數(shù)據(jù)庫”形態(tài)。

      中國歷代人物傳記資料庫(CBDB)是可以用來闡述穩(wěn)定性的案例之一。作為業(yè)內(nèi)最負知名度的數(shù)字人文項目和專題數(shù)據(jù)庫,其技術(shù)邏輯相當簡單,當然,其資料處理和數(shù)字化過程是繁復(fù)、精細且實用的(而這一點才是關(guān)鍵)。與此同時,我們也可以看到不少數(shù)字人文項目在經(jīng)費上的困境、在人員招募上的乏力以及在技術(shù)應(yīng)用方面的艱難,這又使得“穩(wěn)定性”成為一種不得已的選擇。最早接受筆者采訪的一位開發(fā)者曾大吐苦水,“這個項目長期以來就只有我一個人進行開發(fā)……每年拿到的經(jīng)費常常連我的工資發(fā)不出來”;同時,他也表達了自己對技術(shù)問題的看法,“靜態(tài)網(wǎng)頁是我們最好的選擇,不必什么花里胡哨……我們也很重視體驗,但我覺得吧,學(xué)人用戶的體驗就在內(nèi)容和功能上,不在視覺層……”從更宏觀的層面來看,如果考慮到科研投入額度的整體提高,今天的數(shù)字人文項目所獲得的平均資助其實很難與早年的專題數(shù)據(jù)庫比肩。

      從專題數(shù)據(jù)庫可持續(xù)發(fā)展方面來看,保持簡單、穩(wěn)定也是一個關(guān)鍵思路。倫敦國王學(xué)院的國王數(shù)字實驗室(King's Digital Lab)在2015年成立后,就對其繼承的自20世紀90年代以來的100個數(shù)字人文項目成果進行評估、研究并實施數(shù)字管護。該機構(gòu)以有限資源成功維護多個項目的核心經(jīng)驗之一,就是通過將站點去前端化、去可視化、去動態(tài)化,保證其核心內(nèi)容得以留存和遷徙[28]。

      5 從專題數(shù)據(jù)庫的視角重新認識數(shù)字人文

      專題數(shù)據(jù)庫在傳統(tǒng)的“資源/數(shù)據(jù)集合”之外衍生出工具性、問題性、體驗性等新特質(zhì),無疑與數(shù)字人文對傳統(tǒng)人文領(lǐng)域的重構(gòu)有著密切關(guān)系。通過歸因研究并勾連相關(guān)的理論文獻和研究進展,筆者發(fā)現(xiàn),這些新特性主要源自數(shù)字人文的工程特質(zhì)、媒介屬性、物質(zhì)維度和生態(tài)構(gòu)成——這四個方面構(gòu)建起一個從專題數(shù)據(jù)庫出發(fā)的理論框架,展現(xiàn)了數(shù)字人文領(lǐng)域的權(quán)力結(jié)構(gòu)與內(nèi)在邏輯。

      從這一“自下而上”的理論框架來看,其實數(shù)字人文領(lǐng)域與傳統(tǒng)人文領(lǐng)域的內(nèi)在邏輯相去甚遠:與其說數(shù)字人文是對傳統(tǒng)人文研究的“升級”,不如說,數(shù)字人文在某種程度上重新構(gòu)建了一個新場域,建立了一套獨屬自己的規(guī)則。

      5.1 數(shù)字人文的工程特質(zhì)

      從“穩(wěn)定性”的討論中,我們就可以明顯窺見數(shù)字人文的工程特質(zhì),而“工具性”“問題性”也在一定程度上受到工程特質(zhì)的牽引。金偉副教授曾指出,數(shù)字人文要“建立工程化思維建設(shè)模式”,最為重要的是“將實現(xiàn)相關(guān)工程的要素全部進行分析定性,然后根據(jù)有效運作的原理以結(jié)構(gòu)化的方式逐步整合集成,最后構(gòu)建出一個可供實踐使用的具有規(guī)范化、標準化、模塊化、系統(tǒng)化、程序化特征的產(chǎn)品”[29],這種“規(guī)范化、標準化、模塊化、系統(tǒng)化、程序化”在某些時候是有利的,例如前文所提及的古籍循證與群體傳記學(xué),乃至于金觀濤教授所言“有助于一種大尺度長程二階反思意識的形成”[30]。但與此同時,這種程式化模式對人文社科的某些思辨回路是構(gòu)成挑戰(zhàn)的。

      數(shù)字人文工程特質(zhì)的另一影響,還在于它改變了人文研究課題的實施重點。2010年前后,后來曾主持知名數(shù)字人文基礎(chǔ)設(shè)施項目“竹子計劃”的查德·凱因茲(Chad Kainz)敏銳地指出,“在典型人文技術(shù)項目中,至少有三分之二的時間用于開發(fā),而不是專注于學(xué)術(shù)研究”“許多項目用了很多精力在做‘又一個數(shù)據(jù)庫’或‘又一個網(wǎng)站’”[31]。為了讓數(shù)字人文重新把“學(xué)術(shù)研究”作為重點,“竹子計劃”等強調(diào)“不要重復(fù)造輪子”的基礎(chǔ)設(shè)施計劃開始運作,并在一定程度上改變了“重開發(fā)輕研究”的模式。值得注意的是,與歐美相比,我國在數(shù)字人文基礎(chǔ)設(shè)施建設(shè)方面依然亟待加強,由于相關(guān)的討論很多,這里不再贅述。

      5.2 數(shù)字人文的媒介屬性

      作為“資源/數(shù)據(jù)集合”的專題數(shù)據(jù)庫本就承載了大量具有媒介價值的信息,而“工具性”“體驗性”“社會性”等新特質(zhì)更進一步凸顯了“作為媒介”的數(shù)字人文。例如,從“工具性”層面來講,通過專題數(shù)據(jù)庫,數(shù)字人文不僅僅向研究者提供封裝好的數(shù)字工具,更在潛移默化地傳達項目構(gòu)建的方法論框架(這是對“思辨性挑戰(zhàn)”的一個絕佳注腳),傳遞項目開發(fā)者的學(xué)術(shù)認同和價值取向。如果說“工具性”展現(xiàn)的是數(shù)字人文作為“學(xué)術(shù)媒介”的可能,那么,“體驗性”則訴說著數(shù)字人文成為一種新興“大眾媒介”的潛在威能,那些以可視化、沉浸式體驗的數(shù)據(jù)庫或平臺正在成為“可感知的橋梁”[32],將特定主題的內(nèi)容與信息帶入民眾的日常生活。事實上,當前數(shù)字人文日益受到公共文化機構(gòu)重視的原因,恰在于其能夠通過不同的表達方式喚起民眾的情感共振。而“社會性”在“大眾媒介”基礎(chǔ)上又向前一步,體現(xiàn)了更為主動的輸出姿態(tài),具有很強的社會話語意識。

      隨著對數(shù)字人文媒介屬性的覺察,一個重要的工作便是謹慎地思考其在當前寬闊的媒介譜系中的定位,與此同時,也應(yīng)當認真考量數(shù)字人文作為媒介的立場、職責(zé)與倫理問題。

      5.3 數(shù)字人文的物質(zhì)維度

      在專題數(shù)據(jù)庫的特質(zhì)考察中,不難覺察數(shù)字人文的物質(zhì)化特征。例如,“穩(wěn)定性”指向了運營數(shù)字人文的經(jīng)費成本是數(shù)據(jù)庫發(fā)展的重要制約,上文“問題性”論述的最后一段更揭露了外部技術(shù)環(huán)境對數(shù)據(jù)庫建設(shè)的局限所在。

      “物質(zhì)性”本就是國際學(xué)界比較重視的話題,進入數(shù)字時代以后,我們常常驚嘆數(shù)字信息資源區(qū)別于紙質(zhì)信息資源的獨特優(yōu)勢,譬如無成本的傳輸、無限度的復(fù)制、無邊界的利用等等。然而,這些特性或特征在很大程度上都是遙遠的神話。數(shù)字世界當然是有成本的、有邊界、有限度的,因為各項功能的實現(xiàn)都需要存儲設(shè)備、傳輸網(wǎng)絡(luò)以及其他各類基礎(chǔ)設(shè)施的投入和支撐。不少數(shù)字人文項目在立項之時主要考慮如何產(chǎn)出豐饒的數(shù)字化成果,對軟硬件的升級迭代、服務(wù)器的承載和存續(xù)、技術(shù)框架的持續(xù)改變等問題常常欠乏關(guān)注,而這些工作全部需要實打?qū)嵉赝度?,三五年即結(jié)項的經(jīng)費投入模式一般不足以實現(xiàn)長久的可開放性和可維護性??梢哉f,喚醒當前研究中被屏蔽的物質(zhì)性維度,有助于引導(dǎo)數(shù)字人文學(xué)者建立更加務(wù)實和具化的行動理念。

      “物質(zhì)性的回歸”的意義還不僅止于優(yōu)化數(shù)字人文項目運營管理模式,它還要求我們注意到看似沒有邊界的數(shù)字人文世界背后充滿著不平等和不公平,正如Urszula Pawlicka-Deger博士所指出的,“數(shù)字人文領(lǐng)域所期望的多樣性和包容性根植于基礎(chǔ)設(shè)施的復(fù)雜性,而這些復(fù)雜性又深深嵌入于經(jīng)濟、政治和社會文化背景之中”[33]。

      5.4 數(shù)字人文的生態(tài)構(gòu)成

      如果我們仔細考量專題數(shù)據(jù)庫的每一個新特性,會發(fā)現(xiàn)它們之間似乎是矛盾的又可以是融洽的。譬如重視學(xué)術(shù)導(dǎo)向的“工具性”和“問題性”,或多或少與注重公眾導(dǎo)向的“體驗性”和“社會性”存在沖突;當然,我們也可以把“問題性”理解為“社會性”的基礎(chǔ),視其為一種以學(xué)術(shù)響應(yīng)社會、改良社會的路徑。退遠一步來看,專題數(shù)據(jù)庫在整個數(shù)字人文生態(tài)中處于相當獨特的中介位置,例如,它既是相關(guān)機構(gòu)和團隊構(gòu)筑數(shù)字人文項目的主要產(chǎn)出(越來越多國家社科基金項目以“數(shù)據(jù)庫建設(shè)”或類似工作作為成果),同時也是人文社科研究者開展學(xué)術(shù)研究的起點(通過在專題數(shù)據(jù)庫的檢索和發(fā)現(xiàn)開始特定主題的研究工作)??梢哉f,專題數(shù)據(jù)庫這些復(fù)合的新特質(zhì),是由數(shù)字人文這個領(lǐng)域生態(tài)的復(fù)雜性所決定的——不同學(xué)科之間的合作與角力、不同行業(yè)之間的對話與溝通、不同主體之間天差地別的訴求都在此熔為一爐。

      數(shù)字人文這種跨學(xué)科、跨行業(yè)的復(fù)雜生態(tài),是它的活力之源,也是它的熵增之始。筆者一直堅持,不要輕易地去劃定數(shù)字人文的邊界、不要輕易地給數(shù)字人文下絕對定義,這很容易斷絕其持續(xù)發(fā)展的可能性??梢哉f,作為場域的數(shù)字人文早就脫離“人文研究升級版”的定位束縛。

      學(xué)界和業(yè)界經(jīng)常用“大帳篷”來描述數(shù)字人文生態(tài),相比之下,本文更傾向于采用“大集市”的提法。對比“大帳篷”,“大集市”不僅展現(xiàn)了不同主體的共存,更強調(diào)主體之間的交流、互動,同時隱喻了互相競爭的潛在可能與互惠互易的最終結(jié)果導(dǎo)向。如果想要保持數(shù)字人文的活力,關(guān)鍵點或許就是建立靈活的規(guī)則,以打破傳統(tǒng)學(xué)科范式僵化的話語模式。

      6 AI 時代數(shù)字人文的發(fā)展趨勢及其批判性研究

      把“專題數(shù)據(jù)庫”作為方法與視角,不僅僅是為了解構(gòu)和重新認識數(shù)字人文,更關(guān)鍵的是幫助我們更好地理解外部要素對數(shù)字人文可能帶來的影響——而眼下,最大的影響變量可能來自于AI。

      在最近接連引爆輿論的各項技術(shù)熱點中,只有AI足以讓我們安之若素地將“時代”二字置于其后。AI的沖擊是巨大的,它將進一步推動數(shù)字人文對傳統(tǒng)學(xué)術(shù)場域中知識生產(chǎn)、學(xué)術(shù)傳播、項目合作等關(guān)系的重構(gòu),再次改變權(quán)力話語與邏輯規(guī)則。下文將基于“工程-媒介-物質(zhì)-生態(tài)”的理論框架做一簡要的討論。同時,這一討論也是為了展示該框架的通用分析價值。

      6.1 工程層面:AI對數(shù)字人文工作模式的重構(gòu)

      AI的影響先是在“產(chǎn)品之外”,其后再滲透到“產(chǎn)品之內(nèi)”的各項要素。所謂“產(chǎn)品之外”,指的是對數(shù)字人文工程建設(shè)環(huán)境的改變,一個很有代表性的例子,便是在ChatGPT出現(xiàn)不久之后,長期參與CBDB項目的王宏甦研究員便提到,在“ChatGPT和AI編程工具Copilot這類人工智能工具已經(jīng)完全融入日常工作。我們會和 ChatGPT討論方案設(shè)計……在工作中我們會把ChatGPT當作平等的同事來討論問題”,盡管“在程序設(shè)計和規(guī)范方面,ChatGPT是一位非常有經(jīng)驗的同事。而在人文的問題上,我們當下很少使用ChatGPT”[34]。在這個案例中,ChatGPT并非直接作為工具或功能嵌入到數(shù)據(jù)庫之中,而是融入到數(shù)據(jù)庫的工作環(huán)境和建設(shè)流程里。當然,基于筆者的調(diào)查,把AI作為同事的協(xié)同案例還是少數(shù),更多“產(chǎn)品之外”的實踐是將其作為學(xué)術(shù)生產(chǎn)工具,例如在項目調(diào)研中利用了語音轉(zhuǎn)錄、在文字錄入或圖片標注中采用AI視覺分析、在分詞的工作里采用了自然語言處理等等。隨著AI在數(shù)字人文工作環(huán)境與流程中的嵌入日深,其對專題數(shù)據(jù)庫等工程“產(chǎn)品”的影響也將逐漸增強,進而真正為“工具性”“問題性”“體驗性”等內(nèi)在特質(zhì)賦能,3.2提到的SeCo小組及其BiographySampo平臺便是一例。

      6.2 媒介層面:AI與數(shù)字人文的媒介性反思

      2023年的ChatGPT備受矚目,首要原因自然是技術(shù)層面的突破,是年7月底,《自然》雜志稱ChatGPT正式攻破了圖靈測試;但更重要的是,它將所有人都卷入了圖靈的“模仿游戲”之中[35],讓普羅大眾都有機會窺探到通用人工智能(Artificial General Intelligence,即傳統(tǒng)概念上具備人類智慧的“強AI”)來臨的前兆。比爾·蓋茨在同年3月發(fā)表名為《AI時代已然開始》的文章,認為ChatGPT的誕生是圖形界面之后一個新的分水嶺,之所以將其和Windows“圖形界面”并列,正由于它們都擁有嵌入幾乎所有日常場景的莫大潛力[36]。

      顯然,AI本身具有很強的媒介屬性,足以觸及每個人的日常生活,而當這種媒介性與數(shù)字人文獨有的故事、文化與體驗特質(zhì)相互結(jié)合的時候,影響力是互為疊加的。與此同時,AI的諸多缺陷也將通過媒介性更大規(guī)模地傳播開來。例如AI的算法偏見問題,Andrew Prescott教授就此在新近的論文中列舉了從亞馬遜到COMPAS的一系列案例,堪稱精彩[37]。從這個角度來講,數(shù)字人文對媒介性的反身性和責(zé)任式思考將更為迫切。

      6.3 物質(zhì)維度:AI與漸深的數(shù)字基礎(chǔ)設(shè)施鴻溝

      從物質(zhì)性層面來講,AI對數(shù)字人文的影響主要體現(xiàn)在基礎(chǔ)設(shè)施鴻溝層面。與上文提到的各類技術(shù)一樣,AI同樣不是沒有成本、無需代價的。在“AI新基建”的語境下,“算力”與“數(shù)據(jù)”“算法”一樣都是關(guān)鍵的基礎(chǔ)支撐,而“算力”完全是“物質(zhì)性”的,缺乏算力的工程、團隊和地區(qū)根本無力享用AI的恩賜,甚至可能成為一種詛咒。

      值得一提的是,雖然本文把“專題數(shù)據(jù)庫”作為方法主要依循“作為方法”(見1.1)的思想路徑1本文最終選擇了比“基礎(chǔ)設(shè)施”更底層、更實體、更具化的“專題數(shù)據(jù)庫”作為中心論述對象,其主要原因在于從我國當前的實踐情況來看,許多與數(shù)字人文基礎(chǔ)設(shè)施相關(guān)的工作仍處于起步階段,“接地氣”、大眾化的專題數(shù)據(jù)庫無疑是一個比“基礎(chǔ)設(shè)施”更恰當?shù)那腥朦c。,但近來數(shù)字人文及相關(guān)研究領(lǐng)域也出現(xiàn)了一個與之非常相近的新課題,即是“把‘基礎(chǔ)設(shè)施’作為方法”(infrastructural approaches),或謂“在數(shù)字人文框架下開展關(guān)鍵基礎(chǔ)設(shè)施研究”[38],這一課題是數(shù)字人文直面“漸深的數(shù)字基礎(chǔ)設(shè)施鴻溝”的理論工具?!鞍鸦A(chǔ)設(shè)施作為方法”的研究受到了STS(科學(xué)、技術(shù)和社會)領(lǐng)域的深刻影響,它特別強調(diào)從基礎(chǔ)設(shè)施(包括物質(zhì)性的和非物質(zhì)性的技術(shù)、語言、平臺、設(shè)備、機構(gòu)等等)的角度認識數(shù)字人文,了解數(shù)字實踐如何被政治、經(jīng)濟、文化等宏觀要素影響,通過發(fā)現(xiàn)和解決其不平等、不均衡和不包容問題2西蒙·馬奧尼教授在2023年一次訪談中很好地闡述了這種不平等和不包容,他指出“盡管數(shù)字人文學(xué)科基于開放的國際交流和包容的文化溝通等理念創(chuàng)立,但當前以英語為主的數(shù)字人文社區(qū)排斥了世界上大部分地區(qū)的學(xué)術(shù)參與……數(shù)字人文學(xué)科在一個英語化的環(huán)境中發(fā)展了近70年。學(xué)科語言的單一化導(dǎo)致以英文為中心的偏見,扭曲了數(shù)字人文學(xué)科的評估標準,限制了研究主題。迄今為止,數(shù)字人文領(lǐng)域的主要研究中心、協(xié)會和門戶網(wǎng)站都設(shè)立在美國和英國;著名的數(shù)字人文期刊側(cè)重于出版、推廣、資助英語著作……由于語言障礙,中文和其他非拉丁文的著作版本都無法被列入數(shù)字人文目錄,也很難被歐美同行引用”。見:劉雨微. 文化包容引領(lǐng)數(shù)字人文發(fā)展[N]. 中國社會科學(xué)報,2023-01-30(003)。,更好地推動全球范圍內(nèi)數(shù)字人文的發(fā)展[39]。這一議題在國際數(shù)字人文界引起了一定反響,成為了最新一卷《數(shù)字人文辯論》(Debates in the Digital Humanities)的主題。

      6.4 生態(tài)層面:構(gòu)建面向AI的規(guī)則迫在眉睫

      我們很難簡單預(yù)測或討論AI對這一生態(tài)造成的影響,這一方面是由于數(shù)字人文生態(tài)本身就含有極其多元的主體和極其繁雜的變量(見5.4)。另一方面,AI這一概念本身也是復(fù)雜的:它不僅僅是技術(shù)體系或社會議題,同樣有著深刻的歷史文化根基。AI的人文根基是人類文明對自動化與機械化的想象,從克里特文明的機械銅人塔羅斯到《列子·湯問》中偃師制造的舞蹈倡優(yōu),再到《終結(jié)者》《黑客帝國》等知名電影中的反派“天網(wǎng)”和“母體”,這些以想象構(gòu)筑的圖景不僅具有內(nèi)涵上的一致性,更展現(xiàn)了人類對非人智能日漸擴大的憂慮和畏懼。而在神話傳說和流行文化之外,從笛卡爾到狄德羅等一眾知識界先驅(qū)對“機器能思考嗎”的提問展開了深刻且悠長的人文思考(直到圖靈把重點轉(zhuǎn)換到技術(shù)實現(xiàn)問題之上)[40]。以上堆積已久的復(fù)雜情緒和思想資源是和AI技術(shù)深刻綁定的,顯然,人們在面對其他諸如區(qū)塊鏈、云計算等技術(shù)概念時斷不會帶有如此“沉重”的包袱。如果說數(shù)字人文領(lǐng)域是“數(shù)字”和“人文”的交叉地帶,那么AI大概天然就是最具代表性的數(shù)字人文議題。因此,我們在討論AI進入數(shù)字人文生態(tài)的議題時,也不能只是關(guān)注它的技術(shù)面向。

      如此一來,一個更有效的辦法是主動出擊,率先構(gòu)筑在AI背景下數(shù)字人文生態(tài)的基本理念、協(xié)作原則以及社區(qū)文化。基于目前與AI相關(guān)的報告和研究,筆者認為,一些最核心的規(guī)則應(yīng)該包括:

      (1)堅持以“負責(zé)任創(chuàng)新”作為基本理念[41],強調(diào)AI的創(chuàng)新利用應(yīng)該以“社會責(zé)任”為前提和要件。(2)人文學(xué)者必須進入“回路中”。在當前的AI訓(xùn)練與開發(fā)中,人與AI循環(huán)協(xié)作的“人在回路中”(Humans-in-the-Loop)是一種重要模式。這里的“人”不僅僅是“學(xué)者”,更應(yīng)該是“人文學(xué)者以及相關(guān)研究群體”,通過讓人介入機器學(xué)習(xí)與監(jiān)督以推動系統(tǒng)的優(yōu)化和對人文理念的內(nèi)化[42]。(3)采用恰當?shù)姆绞?,將AI應(yīng)用于數(shù)字人文項目中的隱私與其他方面的諸多風(fēng)險公開化、透明化。(4)從宏觀的基礎(chǔ)設(shè)施與工程實踐層面來說,呼吁和推動包容的全球數(shù)字人文社區(qū)的創(chuàng)建。

      如果說(1)到(4)都需要外部非學(xué)術(shù)資源的介入,那么作為數(shù)字人文研究者,我們更要堅持的就是:(5)發(fā)展數(shù)字人文的批判性研究,將人文社科的批判性精神帶入AI時代。

      7 結(jié)語:信息資源管理學(xué)科的再發(fā)現(xiàn)與新發(fā)展

      本文將“專題數(shù)據(jù)庫”作為方法,不僅試圖為重新發(fā)現(xiàn)和認知數(shù)字人文領(lǐng)域提供一種可能的新視角,還試圖指出:信息資源管理學(xué)科不僅僅可以為數(shù)字人文及其他交叉領(lǐng)域提供技術(shù)、資源和方法的支持,更能為它們帶去思想與理論層面的貢獻。

      在一級學(xué)科更名的背景下,新生的信息資源管理學(xué)科正在涉足日益廣泛的跨學(xué)科研究,在數(shù)字人文之外,從公共文化到人機交互、從數(shù)據(jù)科學(xué)到健康信息……在這些新興的學(xué)術(shù)場景之中,我們不能只是實踐的行動者、平臺的建設(shè)者和技術(shù)的應(yīng)用者。我們最重要的學(xué)術(shù)任務(wù)之一,是把內(nèi)部的學(xué)科概念轉(zhuǎn)換并發(fā)展為普遍性的理論話語,是把信息資源管理認識世界的那副學(xué)術(shù)透鏡帶入到跨學(xué)科的對話與交流之中,為AI及更多前沿問題的解難提供理論支撐。

      思想資源的傳承與理論話語的構(gòu)建永遠是最重要的。畢竟——我們可以用“數(shù)字”來行動、也需要聆聽“人文”的指導(dǎo),但我們既然是“我們”,就應(yīng)該用“信息資源管理”來思考和說話,就應(yīng)該讓“信息資源管理”發(fā)出它獨有的聲響。

      支撐數(shù)據(jù)

      支撐數(shù)據(jù)由作者自存儲,E-mail:xiaop25@mail.sysu.edu.cn。

      1. 全國科技名詞委科研項目“數(shù)字人文高頻術(shù)語及其在國家人文數(shù)據(jù)基礎(chǔ)設(shè)施中的應(yīng)用研究”課題組. Global-dh.xlsx.《全球代表性數(shù)字人文專題數(shù)據(jù)庫目錄(暫名)》數(shù)據(jù)集.

      2. 肖鵬. coding.xlsx.專題數(shù)據(jù)庫編碼表.

      3. 國家社科基金青年項目“技術(shù)賦能視閾下人文學(xué)者的數(shù)字學(xué)術(shù)需求及其圖書館服務(wù)策略研究”課題組.訪談.docx. 訪談轉(zhuǎn)錄/記錄稿.

      猜你喜歡
      人文數(shù)據(jù)庫數(shù)字
      人文
      北京紀事(2024年1期)2024-01-03 03:16:55
      答數(shù)字
      人文紹興
      中國三峽(2017年3期)2017-06-09 08:14:59
      數(shù)據(jù)庫
      財經(jīng)(2017年2期)2017-03-10 14:35:35
      數(shù)字看G20
      人文社科
      全國新書目(2016年5期)2016-06-08 08:54:10
      數(shù)據(jù)庫
      財經(jīng)(2016年15期)2016-06-03 07:38:02
      數(shù)據(jù)庫
      財經(jīng)(2016年3期)2016-03-07 07:44:46
      數(shù)據(jù)庫
      財經(jīng)(2016年6期)2016-02-24 07:41:51
      讓人文光輝照耀未來
      仁布县| 修武县| 玛纳斯县| 绍兴市| 威信县| 保德县| 通渭县| 黔南| 社会| 南和县| 澎湖县| 苏尼特左旗| 建始县| 海原县| 丰城市| 犍为县| 晋中市| 彰化县| 行唐县| 淅川县| 永泰县| 玛纳斯县| 库尔勒市| 涟水县| 万州区| 巩义市| 嘉善县| 榕江县| 平凉市| 渝中区| 云霄县| 聊城市| 上栗县| 那坡县| 郯城县| 华坪县| 天祝| 明光市| 图木舒克市| 桃园县| 田阳县|