• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      計(jì)算人文學(xué)科的內(nèi)涵、體系及機(jī)遇

      2023-06-18 06:15:42黃水清劉瀏王東波
      圖書與情報(bào) 2023年1期
      關(guān)鍵詞:數(shù)字人文信息資源管理新文科

      黃水清 劉瀏 王東波

      摘? ?要:計(jì)算人文經(jīng)歷了半個(gè)多世紀(jì)的發(fā)展,在名詞、定義、指代方面亟需明確形成規(guī)范,并使這一交叉領(lǐng)域在當(dāng)前發(fā)展階段更加凸顯計(jì)算的價(jià)值和重要性。文章對計(jì)算人文相關(guān)表述進(jìn)行了再討論,明確了“計(jì)算人文”這一表述的優(yōu)勢,闡明了計(jì)算人文的研究對象、研究問題和研究方法,厘清了計(jì)算人文的學(xué)科內(nèi)涵,分析了計(jì)算人文在國家戰(zhàn)略、信息資源管理學(xué)科更名以及新文科建設(shè)中面臨的機(jī)遇和使命,并以計(jì)算語言學(xué)、計(jì)算史學(xué)、計(jì)算文獻(xiàn)學(xué)、計(jì)算文學(xué)等學(xué)科為例闡述了計(jì)算人文學(xué)科體系的構(gòu)成。計(jì)算人文學(xué)科由眾多形如“計(jì)算X”的子學(xué)科組成,各個(gè)“X”可分別對應(yīng)于某個(gè)具體的人文學(xué)科。

      關(guān)鍵詞:計(jì)算人文;數(shù)字人文;信息資源管理;新文科;知識庫

      中圖分類號:G252? ?文獻(xiàn)標(biāo)識碼:A? ?DOI:10.11968/tsyqb.1003-6938.2023001

      Abstract Computational humanities has experienced more than half a century of development, and it is urgent to gradually clarify and form norms in terms of nouns, definitions, and references, and to highlight the value and importance of computing in this interdisciplinary at the current stage of development. This article discussed several related expressions including digital humanities and computational humanities, and clarified the advantages of computational humanities as an expression. Focusing on the objects, issues and methods, with clarification on the subject connotation, this study analyzes the opportunities of computational humanities in national strategy, subject renaming of IRM, and new liberal arts construction. Taking computational linguistics, computational history, computational philology, and computational literature as examples, this article explained and formed a system of computational humanities as a discipline which is composed of many sub-disciplines in the form of "computational X", and each "X" can correspond to a specific disciplines in humanities.

      Key words computational humanities; digital humanities; information resource management; new liberal arts; knowledge base

      計(jì)算人文的產(chǎn)生源于“計(jì)算”與“人文”的碰撞與交叉。布薩的經(jīng)典研究——阿奎那語詞索引證實(shí)了開展“計(jì)算”與“人文”交叉研究的可行性,也提示了計(jì)算人文的研究對象及研究問題。計(jì)算人文產(chǎn)生之初未必以“計(jì)算人文”一詞示人,還有若干與“計(jì)算人文”指代相近的術(shù)語見之于學(xué)術(shù)文獻(xiàn),它們均揭示了計(jì)算方法、信息技術(shù)與人文研究的關(guān)聯(lián)及潛在價(jià)值。計(jì)算方法、信息技術(shù)起初僅是作為新的研究視角與方法被引入人文學(xué)科的研究,但在發(fā)展過程中既受到不斷涌現(xiàn)的新技術(shù)的促進(jìn)與推動,也不可避免地接受了人文學(xué)科理念、思潮的浸潤與影響,逐漸積累起穩(wěn)定的對象領(lǐng)域、常用的技術(shù)方法、共同的研究目標(biāo)等學(xué)科屬性。與其他新興學(xué)科領(lǐng)域的發(fā)展過程類似,正是在自我革新與持續(xù)演進(jìn)過程中,計(jì)算人文夯實(shí)了發(fā)展基礎(chǔ)、增強(qiáng)了學(xué)科屬性。經(jīng)過半個(gè)多世紀(jì)的發(fā)展,如今作為學(xué)科的計(jì)算人文已初見雛形。

      值此學(xué)科變革之際,新方法引入、多學(xué)科交叉、新領(lǐng)域拓展已成為學(xué)科發(fā)展常態(tài)。在人文社科領(lǐng)域,以文理交叉為主要內(nèi)容,以自然科學(xué)方法尤其是信息技術(shù)、定量分析等研究方法的引入為主要特征的新文科建設(shè)方興未艾。計(jì)算人文學(xué)科體系的發(fā)展與完善恰逢其時(shí)。2022年9月,醞釀已久的新版學(xué)科目錄正式公布,“圖書情報(bào)與檔案管理”一級學(xué)科正式更名為“信息資源管理”。在學(xué)科更名過程中,學(xué)界也多次討論了信息資源管理學(xué)科的內(nèi)涵與外延拓展,計(jì)算人文或?qū)⒁詳?shù)字人文的表達(dá)方式成為信息資源管理下的二級學(xué)科,躋身于新增學(xué)科之列。同時(shí),爭論、搖擺甚至偏差也一直伴隨著計(jì)算人文的發(fā)展歷程。為此,本文將回顧計(jì)算人文及相關(guān)表述的沿革與變遷,探討計(jì)算人文的對象領(lǐng)域、學(xué)科問題與研究方法,分析計(jì)算人文的時(shí)代機(jī)遇與責(zé)任,勾勒計(jì)算人文的學(xué)科體系,拋磚引玉,求教方家,以期促進(jìn)計(jì)算人文以及信息資源管理學(xué)科的建設(shè)發(fā)展。

      1? ?計(jì)算人文及相關(guān)概念

      2004年,布薩提出了“人類表達(dá)”(Human Expression)[1]的概念,并認(rèn)為廣義上人文計(jì)算是對人類表達(dá)的各種可能的分析方法的自動化。但是布薩并未對人類表達(dá)給出明確的定義,只是認(rèn)為人類表達(dá)是一種“精致的人文活動”,并列舉了音樂、戲劇、設(shè)計(jì)、繪圖四種人類表達(dá)形式。

      要明確計(jì)算人文的定義與指代,首先需要對“人類表達(dá)”這一關(guān)鍵性概念給出明確的定義。對“人類表達(dá)”可以這樣定義:所謂“人類表達(dá)”,就是以符號系統(tǒng)記錄和呈現(xiàn)的人類人文活動。而計(jì)算人文,則以人類表達(dá)為對象,將計(jì)算方法及信息技術(shù)應(yīng)用于諸如文學(xué)、史學(xué)、哲學(xué)、語言學(xué)、文獻(xiàn)學(xué)、音樂藝術(shù)等傳統(tǒng)的人文學(xué)科領(lǐng)域,融合數(shù)據(jù)、計(jì)算與人文,拓展人文學(xué)科知識生產(chǎn)、知識呈現(xiàn)、知識傳播方式,目的為促進(jìn)人文學(xué)科的發(fā)展。計(jì)算人文通過對人文學(xué)科領(lǐng)域相關(guān)數(shù)據(jù)的計(jì)算與挖掘,發(fā)現(xiàn)采用傳統(tǒng)方法或無法得出或較難得出或難于呈現(xiàn)的觀點(diǎn)與線索,彌補(bǔ)了傳統(tǒng)人文學(xué)科在研究方法、研究對象等方面存在的不足,并使得人文學(xué)科的相關(guān)研究具有過程可重復(fù)、數(shù)據(jù)可驗(yàn)證、方法可復(fù)用、結(jié)論可推廣等自然科學(xué)方面的特性,有利于人文學(xué)科的教學(xué)、研究及成果的推廣普及,同時(shí)也促進(jìn)了人文精神對技術(shù)方法的批判與滲透[2-3]。計(jì)算人文是技術(shù)與人文融合而產(chǎn)生的新興學(xué)科,既能幫助相關(guān)人士掌握人文學(xué)科領(lǐng)域傳統(tǒng)文獻(xiàn)閱讀、田野調(diào)查等途徑無法獲得的數(shù)據(jù)與知識(即回答“是什么”),也能分析挖掘并呈現(xiàn)數(shù)據(jù)與數(shù)據(jù)、知識與知識之間隱含的聯(lián)系與規(guī)律(即回答“為什么”)。

      實(shí)際上,用于表述計(jì)算與人文交叉融合研究的術(shù)語十分繁雜,在相關(guān)研究論文能檢索到的術(shù)語不下10個(gè),其中部分術(shù)語在學(xué)術(shù)界使用較為頻繁、具有較大的影響力。除了近年來火爆的“數(shù)字人文”一詞外,“人文計(jì)算”[4-6]、“計(jì)算機(jī)與人文”、“文學(xué)和語言計(jì)算”[7]等術(shù)語都曾成為一時(shí)之選,其他如“人文中的計(jì)算機(jī)”[8-9]、“人文中的計(jì)算”[10]、“量子人文”[11-12]、“人文中的計(jì)算機(jī)輔助解釋”[13]等也具備了一定的代表性,本文列舉了較為重要的5個(gè)相關(guān)表述的出現(xiàn)時(shí)間及應(yīng)用情況(見表1)。從流傳度的角度來看,這些表述雖然各領(lǐng)風(fēng)騷十?dāng)?shù)年,但其變遷與沿革并不是簡單的替代關(guān)系[14]。

      從表1可知,各個(gè)術(shù)語表達(dá)形式上雖然存在不同,其實(shí)際含義卻多有重合或基本類似。不論如何變化,計(jì)算人文及相關(guān)術(shù)語的指代本質(zhì)上始終不變,即計(jì)算與人文的交叉融合、具有人文學(xué)科屬性的交叉研究,其目標(biāo)均為搭建“計(jì)算”“數(shù)據(jù)”與“人文”之間的橋梁,其關(guān)注的研究對象、采用的研究方法基本一致。其中,計(jì)算人文、人文計(jì)算、數(shù)字人文的詞形與字面意思最為接近,區(qū)別僅在于側(cè)重點(diǎn)有所不同。詞匯使用的區(qū)別既反映了研究者對這一交叉領(lǐng)域概念理解的細(xì)微差別,也在一定程度上折射出計(jì)算機(jī)技術(shù)發(fā)展的時(shí)代特點(diǎn),同時(shí)也體現(xiàn)了各時(shí)代的研究者對于該交叉領(lǐng)域的理解和對其發(fā)展的追求。

      “計(jì)算人文”一詞最早見諸于國內(nèi)學(xué)術(shù)文獻(xiàn)是2021年[3,15],遠(yuǎn)比“數(shù)字人文”晚,但出現(xiàn)在國外文獻(xiàn)中實(shí)際上反而早于“數(shù)字人文”[16]。國外學(xué)術(shù)文獻(xiàn)中與“計(jì)算人文”類似的概念出現(xiàn)的場景比較復(fù)雜,涵義也不是非常明確,術(shù)語呈現(xiàn)具有不一性,不過基本上都是在討論計(jì)算機(jī)技術(shù)與人文研究交叉的問題[17-18]。“計(jì)算人文”的英文表述除了直接對應(yīng)的Computational Humanities、Computing Humanities兩種形式外,還有許多其他表述。McCarty撰文分析相關(guān)概念時(shí)所提及的Computing the Humanities[19]、Computing Humanists[20]和Computing in the Humanities[4]等表述,實(shí)際上都指向計(jì)算人文。其實(shí),如果僅僅站在語義的角度Computing in the Humanities表意更準(zhǔn)確,只是作為一個(gè)詞組若是用作學(xué)科名詞會影響傳播。

      從術(shù)語的流行度來看,“數(shù)字人文”近20年來無論在學(xué)界或大眾傳播領(lǐng)域的使用頻度都遠(yuǎn)高于“計(jì)算人文”,這可能源于“數(shù)字人文”一詞通俗易懂,且在數(shù)字時(shí)代具有天然的傳播效應(yīng)。但“數(shù)字”一詞存在語義含混的問題,實(shí)際使用時(shí)必須明確其指代以免產(chǎn)生歧義,同時(shí)“數(shù)字人文”對當(dāng)下計(jì)算機(jī)前沿技術(shù)的表達(dá)也明顯不足。理想的術(shù)語應(yīng)符合概念、語符和交際三個(gè)維度的綜合要求,即概念明晰,具備系統(tǒng)性,語符簡明,具備規(guī)范性,交際有效,具備理解性。選用更準(zhǔn)確的表述有利于學(xué)科發(fā)展,“計(jì)算人文”在當(dāng)下無疑更能滿足以上對術(shù)語的基本要求。在直觀的淺語義層面,“計(jì)算人文”準(zhǔn)確地表達(dá)了“人文為對象和問題,計(jì)算為方法”的內(nèi)涵,與“人類表達(dá)為對象,融合數(shù)據(jù)、計(jì)算與人文”的深層語義不會產(chǎn)生偏差,作為學(xué)術(shù)和學(xué)科名稱也更為貼切?!皵?shù)字人文”因其傳播效應(yīng)與大眾接受度也可以使用,但須明了其準(zhǔn)確的語義,避免理解方面的歧義。未來有必要從術(shù)語內(nèi)譯和外譯的角度對“計(jì)算人文”術(shù)語的內(nèi)涵、外延及演化展開更深入地討論。

      2? ?計(jì)算人文的對象、問題與方法

      計(jì)算人文蘊(yùn)含了“人類表達(dá)為對象,融合數(shù)據(jù)、計(jì)算與人文”的深層語義和內(nèi)涵。理解這一概念的關(guān)鍵在于正確把握計(jì)算與人文兩者的關(guān)聯(lián)和地位,界定計(jì)算人文的對象、問題和方法,明確其與傳統(tǒng)人文研究的實(shí)質(zhì)區(qū)別,在此基礎(chǔ)上才能準(zhǔn)確清晰地定義計(jì)算人文的目標(biāo)與框架。

      2.1? ? 以人類表達(dá)為對象

      以符號系統(tǒng)記錄和呈現(xiàn)的人文活動只是人文活動兩個(gè)組成部分的其中之一,人類人文活動的另外一個(gè)組成部分是無法以符號系統(tǒng)記錄和呈現(xiàn)的人文活動,如展示、演出、田野調(diào)查以及未被記錄的個(gè)體理解、體驗(yàn)、感悟、審美等。作為計(jì)算人文對象的人類表達(dá),僅指以符號系統(tǒng)記錄和呈現(xiàn)的人類人文活動。布薩還認(rèn)為,文本是人類表達(dá)的主要形態(tài)[1]。

      以人類表達(dá)為對象,就是以呈現(xiàn)為符號形態(tài)的人類人文活動為對象。在以符號系統(tǒng)記錄和呈現(xiàn)的人類表達(dá)的各種形態(tài)中,以人類自然語言書寫的文本是人類表達(dá)最主要的形態(tài),除此之外還有圖像、音頻、視頻、數(shù)值等形態(tài)。為方便起見,在不引起歧義的前提下,以人類表達(dá)為對象也可簡便稱之為以人文為對象。即,雖然計(jì)算人文的對象僅為以符號形態(tài)記錄并呈現(xiàn)的人類人文活動,實(shí)際上并不包括人類人文活動中未以符號形態(tài)記錄并呈現(xiàn)的部分,但為簡捷起見,可粗略地稱之為以人文為對象。

      以文本形態(tài)的人類表達(dá)作為計(jì)算人文的主要對象,與人文研究的對象形態(tài)分布是一致的。人文研究的對象多為文本形態(tài),如文本語言、歷史典籍、文藝作品等。實(shí)際上,人文研究所關(guān)注的文本語言、歷史典籍和文藝作品等對象,其載體形式在歷史上也經(jīng)歷了多次變化,從甲骨、金石到竹簡、絹帛,再到印刷術(shù)發(fā)明后的紙張、書籍,進(jìn)而發(fā)展到當(dāng)前的數(shù)字形態(tài),人文研究對象的載體形態(tài)演進(jìn)伴隨著整個(gè)人類文明發(fā)展的過程。當(dāng)前,人文對象的載體形態(tài)已發(fā)展到以數(shù)字方式存儲的文本,針對人文的計(jì)算成為可能。技術(shù)的進(jìn)步改變了人文對象的外部特征,雖然當(dāng)代的人文對象多以數(shù)字化或數(shù)據(jù)化的方式呈現(xiàn),但載體的變化并未改變其人文特性,計(jì)算人文關(guān)注的仍然是符號化表達(dá)的人文活動,特別是人文活動中主要以文本形態(tài)呈現(xiàn)的部分。

      計(jì)算人文彌補(bǔ)了傳統(tǒng)人文研究及推廣普及等的不足,使其煥發(fā)出新的面貌。計(jì)算人文可以從微觀的字詞句段、到中觀的篇章書籍、再到宏觀的大規(guī)模語料庫,從而跨越維度限制觀察文本語言對象;計(jì)算人文可以將靜態(tài)平面的文字繪制成動態(tài)立體的圖形,更加生動、鮮活地呈現(xiàn)人物和故事,從而穿越時(shí)空限制探索歷史典籍;計(jì)算人文可以采用量化、客觀、可驗(yàn)證的評價(jià)鑒賞方式,獲得對經(jīng)典的新體驗(yàn),從而跳出個(gè)體主觀感受賞析文藝作品。計(jì)算人文為人文對象的分析、挖掘、評價(jià)、教學(xué)、普及、傳播開辟了新的途徑,也為人文研究打開了新的維度。計(jì)算人文從新的視角審視和解讀傳統(tǒng)人文對象,從新的維度擴(kuò)展人文對象,并利用新的方法普及和傳播人文的內(nèi)涵和價(jià)值。

      2.2? ? 以人文學(xué)科的問題為研究問題

      以人文為對象的計(jì)算人文研究,其關(guān)注的問題仍然是人文學(xué)科的問題。人文學(xué)科研究的問題聚焦于“發(fā)生了什么”(基于對象內(nèi)容對事實(shí)進(jìn)行判斷)、“表達(dá)了什么”(圍繞對象內(nèi)容進(jìn)行描述和解讀)、“如何去評價(jià)”(關(guān)注對象內(nèi)容的人文內(nèi)涵和價(jià)值)。計(jì)算方法和信息技術(shù)的應(yīng)用,為人文研究帶來了新方法、新工具,并促使新的研究范式逐漸形成,新興領(lǐng)域與學(xué)科也隨之逐漸確立。但是,在這一過程中,所研究問題的人文本質(zhì)始終沒有發(fā)生改變。正如布薩編纂《托馬斯·阿奎那索引》的過程那樣,雖然阿奎那著作的載體從書本、磁帶更新至數(shù)字文本,索引形式也從卡片更新至網(wǎng)絡(luò)數(shù)據(jù)庫,但其中的核心問題卻依然是語詞索引[19-20]。又如《紅樓夢》前八十回與后四十回的作者身份[21-22],不論采用基于詞頻統(tǒng)計(jì)的語言風(fēng)格分析方法,還是采用機(jī)器學(xué)習(xí)模型下的文本分類方法,其核心研究問題仍然是圍繞著《紅樓夢》作者為誰這個(gè)困擾了紅學(xué)家百余年的未解之迷而展開。

      計(jì)算人文的數(shù)據(jù)與計(jì)算思維視角打破了人文研究的某些傳統(tǒng),研究過程也與自然科學(xué)的技術(shù)路線更接近,過程中的某些發(fā)現(xiàn)及解決的問題似乎與傳統(tǒng)人文問題不甚相似,如計(jì)算人文的研究往往涉及數(shù)據(jù)庫、語料庫、知識庫的建設(shè)以及模型和算法設(shè)計(jì)與應(yīng)用。其實(shí),這些庫的建設(shè)以及模型、算法設(shè)計(jì)只是計(jì)算人文研究的中間環(huán)節(jié)和過程性問題,計(jì)算人文終極目的仍是發(fā)現(xiàn)和解決人文學(xué)科的問題,計(jì)算人文最終還應(yīng)回歸到人文[15]。計(jì)算人文借助計(jì)算和信息技術(shù)探索與解決的一定是人文學(xué)科的問題。除了人文學(xué)科的研究問題,計(jì)算人文并不存在自己的研究問題。所謂計(jì)算人文的研究問題,或者是人文學(xué)科本身的問題,或者是為解決人文學(xué)科的問題而產(chǎn)生的問題。不論計(jì)算與信息技術(shù)如何發(fā)展,計(jì)算人文都不能偏離以人文為目標(biāo),正如夜空中的北斗,計(jì)算人文的追求務(wù)必以人文學(xué)科為旨?xì)w。

      2.3? ? 以數(shù)據(jù)基礎(chǔ)之上的計(jì)算為方法

      計(jì)算人文的爆發(fā)式發(fā)展得益于自然語言處理等領(lǐng)域的突破性進(jìn)展,這使得計(jì)算人文有能力實(shí)現(xiàn)真正意義的計(jì)算,而非簡單的統(tǒng)計(jì)或計(jì)量。其實(shí),將統(tǒng)計(jì)手段應(yīng)用于人文學(xué)科早于計(jì)算人文出現(xiàn)很多年,如以詞匯計(jì)量和語言風(fēng)格分析為代表的研究已有百年左右的歷史,其產(chǎn)生與當(dāng)代信息技術(shù)并無多少關(guān)聯(lián)。但是,計(jì)算的規(guī)模和效率在當(dāng)代以令人難以置信的速度提升,使得這類即使可追溯至百年前的研究在計(jì)算人文時(shí)代也呈現(xiàn)了嶄新的面貌[23]。

      計(jì)算人文的計(jì)算方法,是建立在數(shù)據(jù)基礎(chǔ)上的,沒有數(shù)據(jù)無以言計(jì)算。計(jì)算時(shí)代同時(shí)也是數(shù)據(jù)時(shí)代,計(jì)算人文就是數(shù)據(jù)、計(jì)算與人文的融合、匯通。計(jì)算人文的數(shù)據(jù),不再是個(gè)體或有限的樣本數(shù)據(jù),而是近似于全樣本的全局性海量數(shù)據(jù)。計(jì)算的規(guī)模和效率方面的突破,使得面向全局性數(shù)據(jù)的計(jì)算人文既能開展統(tǒng)計(jì)、歸納等方面的研究探索,也能進(jìn)行量化分析、關(guān)聯(lián)性挖掘,進(jìn)而在數(shù)據(jù)的基礎(chǔ)上得到人文學(xué)科方面的結(jié)論?;跀?shù)據(jù)的分析結(jié)果與研究結(jié)論方便采用表格和圖形呈現(xiàn),而隨著可視化技術(shù)的不斷進(jìn)步,采用可視化方式直觀呈現(xiàn)的分析結(jié)論更易于理解和傳播,便于人文思想與理念的普及與推廣。

      計(jì)算人文的計(jì)算方法,使其較之于傳統(tǒng)人文研究在對象、問題、結(jié)論等具體方面產(chǎn)生了很多的不同。針對同樣的研究對象,計(jì)算人文基于不同類型的數(shù)據(jù)可以從不同的維度去考察從而可能提出不同的研究問題;針對同樣的研究問題,計(jì)算人文通過對數(shù)據(jù)的統(tǒng)計(jì)、分析、挖掘可能得到不同的研究結(jié)論;針對于同樣的研究結(jié)論,計(jì)算方法可以發(fā)揮數(shù)據(jù)的優(yōu)勢為原有結(jié)論提供不同視角的解讀和分析,增強(qiáng)原有結(jié)論的可靠性。計(jì)算人文為人文研究在方法論方面作了補(bǔ)充與完善,但并不是要替代原有的人文研究。不論是發(fā)現(xiàn)新的問題、提出新的結(jié)論、還是闡釋的新視角,計(jì)算的研究方法能夠與人文的研究內(nèi)涵相得益彰,發(fā)揮出“一加一大于二”的效果。計(jì)算方法與傳統(tǒng)人文方法相較,計(jì)算方法更接近自然科學(xué)的研究規(guī)范,更具客觀性,具有可重復(fù)、可驗(yàn)證、可復(fù)用、可推廣的特點(diǎn)。

      為實(shí)現(xiàn)計(jì)算,計(jì)算人文的海量數(shù)據(jù)須組織、構(gòu)建成為方便計(jì)算機(jī)存儲與處理的數(shù)據(jù)集合,多以數(shù)據(jù)庫、語料庫、知識庫等方式保存在計(jì)算機(jī)中。顧名思義,數(shù)據(jù)庫、語料庫、知識庫分別用于組織、存儲和管理數(shù)據(jù)、語料、知識。計(jì)算人文以人類表達(dá)為對象,在各種人類表達(dá)形態(tài)中,文本是主要形態(tài),故常常采用語料庫和知識庫方式組織、存儲、管理文本語料和知識。數(shù)據(jù)庫、語料庫、知識庫支持建立在其上的、以數(shù)據(jù)為基礎(chǔ)的計(jì)算。人們熟知的是數(shù)據(jù)庫,對語料庫、知識庫的了解相對較少。

      語料庫是由人工或機(jī)器標(biāo)注好的真實(shí)語言材料組成的數(shù)據(jù)集[24]。語料庫收錄經(jīng)過標(biāo)注的自然語言素材,須有一定規(guī)模。發(fā)展到現(xiàn)在,語料庫已經(jīng)全部是數(shù)字形態(tài),既可以以數(shù)據(jù)庫方式存儲,也可以以文本文件等非數(shù)據(jù)庫方式存儲。

      如果說語料庫是語料的集合,知識庫則是知識的集合。由于知識多以自然語言表述,知識庫的收錄對象主要為自然語言文本。知識庫一詞雖然在文獻(xiàn)中經(jīng)常出現(xiàn),但并沒有清晰、嚴(yán)格的定義。知識庫必須能夠支持包括智能計(jì)算在內(nèi)的各種類型的計(jì)算才有價(jià)值,為此知識庫可以定義為:知識庫是在對語義特別是自然語言語義進(jìn)行形式化描述和有序組織的基礎(chǔ)上形成的知識集合,由詞匯、關(guān)系、規(guī)則、模型和語料庫等構(gòu)成,目的為實(shí)現(xiàn)知識表示與知識存儲并支持知識獲取與知識運(yùn)算。

      語料庫與知識庫既有區(qū)別也有聯(lián)系。語料庫只包含單一形式的語言單元和標(biāo)注信息,知識庫則包含對多種語言單元及其類屬、同義、關(guān)聯(lián)等關(guān)系的揭示和序化。語料庫只是知識庫的一個(gè)子集,知識庫包含語料庫但不是僅有語料庫,知識庫還涵蓋語詞知識、規(guī)則知識、關(guān)聯(lián)關(guān)系、知識模型、推理模型等內(nèi)容。而且,知識庫可能包含一種以上形式的語料庫。

      3? ?計(jì)算人文的機(jī)遇與使命

      經(jīng)歷了70多年交叉融合的實(shí)踐,計(jì)算人文正逐漸成為成熟穩(wěn)定的研究領(lǐng)域乃至學(xué)科。并且,由于踏上了人工智能的技術(shù)浪潮,其發(fā)展已成為備受矚目的焦點(diǎn)。計(jì)算人文所具備的人文內(nèi)涵和技術(shù)特點(diǎn)使其在當(dāng)下的學(xué)科體系、學(xué)術(shù)體系、話語體系建設(shè)過程中迎來了重要的發(fā)展機(jī)遇,也肩負(fù)起重要的發(fā)展使命。

      3.1? ? 國家戰(zhàn)略與使命

      十八大以來,習(xí)近平總書記和中央持續(xù)關(guān)注哲學(xué)社會科學(xué)的繁榮與發(fā)展。2016年5月17日,習(xí)近平總書記親自主持召開了哲學(xué)社會科學(xué)工作座談會并發(fā)表重要講話,要求“構(gòu)建具有自身特質(zhì)的學(xué)科體系、學(xué)術(shù)體系、話語體系”,“要加快發(fā)展具有重要現(xiàn)實(shí)意義的新興學(xué)科和交叉學(xué)科”。同時(shí),總書記還特別強(qiáng)調(diào),“要運(yùn)用互聯(lián)網(wǎng)和大數(shù)據(jù)技術(shù),加強(qiáng)哲學(xué)社會科學(xué)圖書文獻(xiàn)、網(wǎng)絡(luò)、數(shù)據(jù)庫等基礎(chǔ)設(shè)施和信息化建設(shè)”,“要加強(qiáng)對中華優(yōu)秀傳統(tǒng)文化的挖掘和闡發(fā)”。在十九大報(bào)告中,總書記明確提出了“兩創(chuàng)”方針,即“推動中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化、創(chuàng)新性發(fā)展”,并寫入十九大黨章。圍繞“兩創(chuàng)”方針,國家近期接連頒布了《關(guān)于推進(jìn)新時(shí)代古籍工作的意見》《關(guān)于推進(jìn)實(shí)施國家文化數(shù)字化戰(zhàn)略的意見》《2021-2035年國家古籍工作規(guī)范》等重要文件,形成了關(guān)于古籍和傳統(tǒng)文化數(shù)字化工作的重要研究方向和目標(biāo)。在黨的二十大報(bào)告中,總書記重申了“兩創(chuàng)”方針和“實(shí)施國家文化數(shù)字化戰(zhàn)略”。

      計(jì)算人文的建設(shè)發(fā)展順應(yīng)了中央精神及國家發(fā)展戰(zhàn)略的內(nèi)在要求,與總書記構(gòu)建中國哲學(xué)社會科學(xué)的學(xué)科體系、學(xué)術(shù)體系、話語體系,發(fā)展新興學(xué)科、交叉學(xué)科,將新技術(shù)應(yīng)用于哲學(xué)社會科學(xué)研究的指示精神一致。計(jì)算人文的核心內(nèi)涵與“兩創(chuàng)”方針的要求相契合。對推動新時(shí)代古籍整理工作而言,計(jì)算人文可以成為古籍整理與研究重要的學(xué)科方法[25]。

      計(jì)算人文有助于區(qū)分傳統(tǒng)文化中的精華與糟粕?!皟蓜?chuàng)”的對象是中華優(yōu)秀文化,計(jì)算人文能夠發(fā)揮內(nèi)容標(biāo)注的技術(shù)優(yōu)勢,利用自然語言處理模型從大規(guī)模的古籍文本中自動標(biāo)注和發(fā)現(xiàn)相關(guān)的內(nèi)容和知識,實(shí)現(xiàn)精華和糟粕的區(qū)分。計(jì)算人文有助于中華優(yōu)秀文化表現(xiàn)形式的轉(zhuǎn)換。中華優(yōu)秀文化的主要內(nèi)容誕生于傳統(tǒng)農(nóng)業(yè)社會,其表現(xiàn)形式和話語體系與現(xiàn)代社會存在明顯的隔膜,有著巨大的時(shí)空距離。結(jié)合大規(guī)模數(shù)字資源和知識組織方法,計(jì)算人文可采用形式重造的方式對中華傳統(tǒng)文化的表現(xiàn)方式進(jìn)行創(chuàng)造性轉(zhuǎn)化,把古代話語轉(zhuǎn)換成當(dāng)代的大眾話語,以利于中華優(yōu)秀文化的繼承與傳播。計(jì)算人文有助于促進(jìn)中華優(yōu)秀傳統(tǒng)文化的繁榮與普及?!皟蓜?chuàng)”旨在用中華優(yōu)秀傳統(tǒng)文化和當(dāng)代先進(jìn)價(jià)值觀引領(lǐng)大眾,并為中華優(yōu)秀傳統(tǒng)文化在當(dāng)代找到生活載體和文化載體,而計(jì)算人文可以通過可視化的直觀呈現(xiàn)方式,助力相關(guān)內(nèi)容的普及和傳播。

      在學(xué)術(shù)體系、學(xué)科體系、話語體系的構(gòu)建過程中,計(jì)算人文與傳統(tǒng)人文學(xué)科的關(guān)系可類比考古學(xué)與歷史學(xué)的關(guān)系。習(xí)近平總書記在主持十九屆中央政治局第二十三次集體學(xué)習(xí)時(shí)曾指出,“建設(shè)中國特色、中國風(fēng)格、中國氣派的考古學(xué),增強(qiáng)中國考古學(xué)在國際考古學(xué)界的影響力、話語權(quán)”。而中國考古學(xué)也用成果證明了自身的價(jià)值,“向世界展示了中國文明的燦爛輝煌,證明中國人對人類發(fā)展作出了重大的創(chuàng)造性貢獻(xiàn)”[26]。在這一過程中,考古學(xué)與歷史學(xué)既保持密切聯(lián)系但又不同于歷史研究,“中國考古學(xué)一開始便同歷史學(xué)聯(lián)系,并不意味考古學(xué)不是獨(dú)立的學(xué)科?!保?6]考古學(xué)最大的特點(diǎn)就是它是一門具有自己獨(dú)特的理論與方法的多學(xué)科交叉。成為“一門有自己理論及方法的科學(xué),越來越廣泛地與有關(guān)學(xué)科融合接觸”,成為了“人文社會科學(xué)同自然科學(xué)的重要結(jié)合點(diǎn)?!保?6]

      3.2? ? 學(xué)科更名的機(jī)遇

      學(xué)科發(fā)展既遵循科學(xué)自身的規(guī)律,也需要順應(yīng)社會、時(shí)代的需求。計(jì)算人文的學(xué)科發(fā)展內(nèi)在動力已然充沛,具備了學(xué)科發(fā)展的內(nèi)因,但還需要抓住各種外部機(jī)遇。

      教育部最新公布的學(xué)科目錄中,“圖書情報(bào)與檔案管理”一級學(xué)科已正式更名為“信息資源管理”。學(xué)科名稱的變更對于學(xué)科的未來將產(chǎn)生深遠(yuǎn)的影響[27],學(xué)科的內(nèi)涵與外延、意義與價(jià)值、范疇與邊界等均需充分討論以形成共識和理解??梢钥隙ǖ氖牵皥D書情報(bào)與檔案管理”更名為“信息資源管理”將帶來學(xué)科內(nèi)涵外延與范疇邊界的拓展,而不是相反。具體來說,若干新的二級學(xué)科將躋身于信息資源管理一級學(xué)科。數(shù)據(jù)、計(jì)算等方面的新興學(xué)科也迎來了至關(guān)重要的機(jī)遇,將成為未來學(xué)科增長的方向,它們既與計(jì)算人文密切相關(guān),又與信息資源管理的需求和目標(biāo)同步。作為一級學(xué)科的信息資源管理內(nèi)涵外延與范疇邊界的拓展必將帶來二級學(xué)科增設(shè)的需求,在原有圖書館學(xué)、情報(bào)學(xué)、檔案學(xué)之外增設(shè)與學(xué)科發(fā)展緊密相連的二級學(xué)科,是保持新學(xué)科生命力和發(fā)展前景的關(guān)鍵。與此同時(shí),體現(xiàn)數(shù)據(jù)、計(jì)算等新興方向的計(jì)算人文(或以“數(shù)字人文”之名)在原學(xué)科目錄體系中沒有自己的位置,現(xiàn)實(shí)中迫切需要尋找學(xué)科關(guān)系密切的一級學(xué)科棲身??紤]到計(jì)算人文(或數(shù)字人文)的相關(guān)特點(diǎn)與屬性,以及信息資源管理學(xué)科的發(fā)展歷程和現(xiàn)狀,選擇信息資源管理是最佳方案。

      首先,無論是以“計(jì)算人文”還是以“數(shù)字人文”為學(xué)科名稱,其對象是一致的,即包括全體文史哲等學(xué)科在內(nèi)的人文學(xué)科的研究對象、研究問題都有可能成為計(jì)算人文的研究對象與研究問題。也即在學(xué)科歸屬方面計(jì)算人文歸入文史哲的任何學(xué)科都有理由同時(shí)卻又都不合適;其次,圖書情報(bào)與檔案管理或信息資源管理學(xué)科在數(shù)據(jù)尤其是文本數(shù)據(jù)加工與處理方面具有傳統(tǒng)優(yōu)勢,近幾十年以文本數(shù)據(jù)為對象的加工、整序、計(jì)算與應(yīng)用方面更是發(fā)展成為圖書情報(bào)學(xué)科的通用學(xué)科方法,計(jì)算人文歸屬信息資源管理學(xué)科在學(xué)科方法論方面與一級學(xué)科下的其他二級學(xué)科具有共性,可相互借鑒。

      計(jì)算人文或數(shù)字人文歸屬信息資源管理學(xué)科的爭議主要在于計(jì)算人文雖具有交叉屬性,但人文特點(diǎn)鮮明,歸屬管理類的信息資源管理學(xué)科沖淡了其人文屬性。事實(shí)上,正如本文所言,計(jì)算人文的交叉屬性決定了其歸屬任何人文學(xué)科門類都有不足,信息資源管理從研究方法、研究內(nèi)容、現(xiàn)有研究隊(duì)伍的相關(guān)程度等方面考慮都是計(jì)算人文或數(shù)字人文學(xué)科的最佳棲身之所。此外,信息資源管理原有二級學(xué)科的圖書館學(xué)、檔案學(xué)本身的人文學(xué)科屬性也很鮮明,目前擬議的新增二級學(xué)科中還有古籍保護(hù)這樣的更具人文學(xué)科屬性的學(xué)科,計(jì)算人文或數(shù)字人文若與它們并列,人文學(xué)科屬性并沒有削弱,卻更能體現(xiàn)信息資源視角的學(xué)科研究特點(diǎn)。同時(shí),位列信息資源管理學(xué)科之下的計(jì)算人文或數(shù)字人文與其他人文學(xué)科可以根據(jù)需要實(shí)現(xiàn)任意交叉,產(chǎn)生若干研究方向或三級學(xué)科,如計(jì)算語言學(xué)、計(jì)算史學(xué)、計(jì)算文學(xué)、計(jì)算文獻(xiàn)學(xué)、計(jì)算法學(xué)等,完全不受文史哲等具體學(xué)科在學(xué)科目錄中所屬類別的約束。

      需要指出的是,計(jì)算人文作為信息資源管理學(xué)科下的二級學(xué)科,不但不妨礙而且有助于推動在相關(guān)人文學(xué)科設(shè)置形如“‘計(jì)算+‘人文學(xué)科”的對應(yīng)學(xué)科方向并開展研究,如語言學(xué)類別下的計(jì)算語言學(xué)、歷史學(xué)類別下的計(jì)算史學(xué)、文學(xué)類別下的計(jì)算文學(xué)、文獻(xiàn)學(xué)類別下的計(jì)算文獻(xiàn)學(xué)、法學(xué)類別下的計(jì)算法學(xué)、檔案學(xué)類別下的計(jì)算檔案學(xué)等。

      概而言之,計(jì)算人文或數(shù)字人文作為信息資源管理的二級學(xué)科是完全可行且值得期待的。人民大學(xué)數(shù)字人文二級學(xué)科博士點(diǎn)的成功實(shí)踐也為這一領(lǐng)域建設(shè)獨(dú)立學(xué)科提供了寶貴的經(jīng)驗(yàn)和方案。

      3.3? ? 新文科建設(shè)的契機(jī)

      2020年,教育部召開了“新文科建設(shè)工作會議”,新文科建設(shè)從概念邁向正式實(shí)施。計(jì)算人文融合數(shù)據(jù)、計(jì)算與人文,將計(jì)算方法、信息技術(shù)應(yīng)用于人文學(xué)科問題的研究,搭建起計(jì)算、數(shù)據(jù)與人文三者之間的橋梁,典型地體現(xiàn)了新文科文理交叉的特征,與新文科的發(fā)展理念高度契合。

      計(jì)算人文在以人類表達(dá)為對象的前提下關(guān)注數(shù)據(jù)、計(jì)算與人文三者之間的關(guān)系,與新文科強(qiáng)調(diào)的信息技術(shù)具有天然的聯(lián)結(jié)。計(jì)算人文自產(chǎn)生之初就既具有信息與計(jì)算的特質(zhì),又具有人文學(xué)科的屬性,可以說計(jì)算人文是天然的新文科。另外,計(jì)算人文中的“人文”理論上可以是任意人文學(xué)科。計(jì)算人文可以與任意人文學(xué)科相結(jié)合,產(chǎn)生計(jì)算語言學(xué)、計(jì)算史學(xué)、計(jì)算文學(xué)、計(jì)算文獻(xiàn)學(xué)、計(jì)算法學(xué)等下位類學(xué)科,天然具有跨學(xué)科、多學(xué)科的特征。同時(shí),語言學(xué)、史學(xué)、文學(xué)、文獻(xiàn)學(xué)等傳統(tǒng)人文學(xué)科的理論、方法、觀念也浸潤了計(jì)算人文的方方面面。計(jì)算人文借鑒和吸收傳統(tǒng)人文學(xué)科的理論、方法和觀念,促進(jìn)自身的發(fā)展。

      計(jì)算人文需充分發(fā)揮在新文科方面的優(yōu)勢,抓住新文科建設(shè)的契機(jī),構(gòu)建起計(jì)算人文的新文科體系。此外,計(jì)算人文在新文科建設(shè)過程中除了探索與示范自身的新文科建設(shè)、完善自身的學(xué)科發(fā)展之外,還有義務(wù)助力相關(guān)傳統(tǒng)人文學(xué)科和專業(yè)邁向新文科。計(jì)算人文有能力也有義務(wù)為其他學(xué)科的新文科建設(shè)之途提供有效的發(fā)展經(jīng)驗(yàn)和借鑒思路。計(jì)算人文的學(xué)科發(fā)展和建設(shè)既需要“長期堅(jiān)持,落地生根”,也需要“堅(jiān)守傳統(tǒng),交叉創(chuàng)新”。

      4? ?計(jì)算人文的學(xué)科體系

      實(shí)踐先于理論,是當(dāng)前計(jì)算人文發(fā)展的一個(gè)顯著特點(diǎn),也是計(jì)算人文學(xué)科體系形成的重要方式。在技術(shù)交叉和項(xiàng)目驅(qū)動下,計(jì)算人文衍生出特有的“大帳篷”發(fā)展模式[28]。在“大帳篷”模式下,影響力較大的研究項(xiàng)目往往可能催生出一個(gè)研究方向乃至子學(xué)科,典型的如早期布薩的《托馬斯·阿奎那索引》編制和《聯(lián)邦黨人文集》作者判定研究。前者基于數(shù)字化存儲、詞頻統(tǒng)計(jì)、倒排索引等技術(shù),在當(dāng)下發(fā)展出文本和人文對象多媒介載體融合的索引與統(tǒng)計(jì),以及基于大規(guī)模詞頻自動統(tǒng)計(jì)的語詞研究。后者基于文本分類模型,影響了計(jì)量語言學(xué)、文體語言風(fēng)格計(jì)算以及計(jì)算語言學(xué)相關(guān)的詞法分析、句法分析、語義分析、機(jī)器翻譯等研究?!按髱づ瘛蹦J绞沟糜?jì)算人文形成了區(qū)別于傳統(tǒng)人文學(xué)科研究的一個(gè)重要特征,即能夠容納更多的研究項(xiàng)目、研究主題與研究成果?!按髱づ瘛蹦J降奶卣鲗?shí)質(zhì)上是各領(lǐng)域、各地區(qū)出現(xiàn)各種類型的獨(dú)立項(xiàng)目,名目繁多的項(xiàng)目匯聚了多樣化的研究主題、研究成果,共同促進(jìn)研究方向與子學(xué)科的產(chǎn)生與形成。

      計(jì)算人文的理論體系尚未成熟,隨著研究主題、研究項(xiàng)目、研究成果的逐漸積累,研究實(shí)踐將促進(jìn)理論的升華。在當(dāng)前的發(fā)展模式下,計(jì)算人文學(xué)科體系下將產(chǎn)生并容納眾多的“計(jì)算X”形式的“計(jì)算”與“人文學(xué)科”的組合。“計(jì)算X”可以勾勒計(jì)算人文學(xué)科體系的大致框架,為后續(xù)的理論升華提供實(shí)踐基礎(chǔ)。

      4.1? ? 計(jì)算語言學(xué)

      計(jì)算語言學(xué)以真實(shí)語言為材料研究自然語言的自動化處理,學(xué)科層面的計(jì)算語言學(xué)在技術(shù)與實(shí)踐層面體現(xiàn)為自然語言處理,是計(jì)算人文發(fā)展最為突出又極為特殊的子領(lǐng)域或子學(xué)科。計(jì)算語言學(xué)的特殊之處在于,由于計(jì)算人文的研究對象一般為自然語言書寫的文本,故而計(jì)算語言學(xué)或自然語言處理往往成為計(jì)算人文研究的技術(shù)方法。語言資源建設(shè)方面的語料庫、知識庫構(gòu)建為計(jì)算語言學(xué)的典型項(xiàng)目,如現(xiàn)代漢語的北京大學(xué)人民日報(bào)語料庫、南京農(nóng)業(yè)大學(xué)新時(shí)代人民日報(bào)語料庫[29-31],古代漢語的南京農(nóng)業(yè)大學(xué)的古漢語平行語料庫[32],俞士汶先生的北京大學(xué)綜合型語言知識庫[33],南京農(nóng)業(yè)大學(xué)基于《漢學(xué)引得叢刊》構(gòu)建的中國古代典籍文本知識庫等。文本處理技術(shù)方面的語言生成、語義理解為計(jì)算語言學(xué)的代表性應(yīng)用,如詞頻統(tǒng)計(jì)、詞典編纂、語義分析等。

      4.2? ? 計(jì)算史學(xué)

      經(jīng)歷了從統(tǒng)計(jì)歷史學(xué)、計(jì)量史學(xué)到計(jì)算史學(xué)的發(fā)展過程,計(jì)算史學(xué)近年來成為計(jì)算人文研究的重要分支[34]。計(jì)算史學(xué)結(jié)合史籍文本挖掘、地理信息系統(tǒng)以及數(shù)據(jù)可視化等技術(shù),重點(diǎn)圍繞事件、時(shí)間、地點(diǎn)和人物等多維歷史對象,從計(jì)算的視角提出新解讀、新問題和結(jié)論,為傳統(tǒng)的史學(xué)領(lǐng)域開辟了新的研究陣地。國內(nèi)外計(jì)算史學(xué)均以文本知識挖掘?yàn)橹髁鳎ㄟ^對文本知識的自動抽取和計(jì)量分析,得到計(jì)算視角的史學(xué)研究結(jié)論。值得注意的是,國外多關(guān)注近現(xiàn)代歷史[35],而國內(nèi)則更偏向上古史和中古史[36-38]。此外,基于地理信息系統(tǒng)(GIS)的計(jì)算史學(xué)研究在知識呈現(xiàn)方式上更顯著更直觀,因而更具備推廣和傳播效應(yīng)[39-40]。

      4.3? ? 計(jì)算文獻(xiàn)學(xué)

      計(jì)算文獻(xiàn)學(xué)是計(jì)算人文與歷史文獻(xiàn)學(xué)和古典文獻(xiàn)學(xué)相結(jié)合的研究方向。傳統(tǒng)文獻(xiàn)學(xué)研究面臨數(shù)字化轉(zhuǎn)型,需要對文獻(xiàn)本身進(jìn)行了數(shù)字化拆解和重構(gòu),并以數(shù)字化手段輔助傳統(tǒng)文獻(xiàn)學(xué)的研究[41]。計(jì)算文獻(xiàn)學(xué)融合了文本知識挖掘、知識庫構(gòu)建、預(yù)訓(xùn)練模型構(gòu)建等計(jì)算機(jī)技術(shù),以及文獻(xiàn)計(jì)量、知識組織、本體構(gòu)建、文本檢索等圖書情報(bào)學(xué)方法,在古籍文獻(xiàn)研究、古籍引書研究、古籍目錄學(xué)研究等具體應(yīng)用方面已形成新視角。已有研究在古籍引書計(jì)量分析[42-43]、古籍目錄別裁分析[44]、古籍預(yù)訓(xùn)練模型構(gòu)建[45]等方面進(jìn)行了初步探索,相關(guān)研究的價(jià)值和潛力值得進(jìn)一步深研。

      4.4? ? 計(jì)算文學(xué)

      計(jì)算文學(xué)重點(diǎn)關(guān)注文本內(nèi)容的理解和分析,其提出和發(fā)展以“遠(yuǎn)讀”為代表[46]。以量化文學(xué)批評為目的“遠(yuǎn)讀”雖然飽受爭議[47],但其在文本內(nèi)容和分析中的視角和方法至今仍具有啟發(fā)性。隨著深度學(xué)習(xí)下文本知識挖掘技術(shù)的突破,計(jì)算文學(xué)在文本內(nèi)容理解和計(jì)算方面展現(xiàn)出廣闊的研究前景,如主題分析、分類聚類、風(fēng)格計(jì)算、情感分析等[48-49];另一方面,基于文本內(nèi)容生成技術(shù)開展的計(jì)算機(jī)文學(xué)創(chuàng)作已成為研究熱點(diǎn)[50],如小說詩歌生成、文本自動摘要、文字冒險(xiǎn)游戲等。隨著以ChatGPT[51]為典型代表的生成式大語言模型取得巨大成功,流暢語言文本生成似乎不再是人類獨(dú)有的能力,而AI生成的文本能否看作文學(xué)創(chuàng)作[52]的爭論將會再次引起關(guān)注,未來將成為計(jì)算文學(xué)不可忽視的主題。

      4.5? ? “計(jì)算X”體系下的其他學(xué)科

      在數(shù)據(jù)與計(jì)算的推動下,除上述學(xué)科領(lǐng)域外,眾多的其他人文學(xué)科領(lǐng)域也已形成或正在形成較為鮮明獨(dú)特的計(jì)算人文子學(xué)科,如計(jì)算法學(xué)、計(jì)算藝術(shù)、計(jì)算檔案學(xué)等。

      法學(xué)既有人文科學(xué)屬性也有社會科學(xué)屬性,因此計(jì)算法學(xué)一定意義上也可以納入計(jì)算人文的學(xué)科體系,如針對法哲學(xué)、法律史等的計(jì)算人文研究。這也是計(jì)算人文與計(jì)算社會科學(xué)學(xué)科相關(guān)性的具體體現(xiàn)。不過,計(jì)算法學(xué)[53]目前主要面向法律文檔的分析與計(jì)量等目標(biāo),逐漸形成了包括海量判決書分析、自動化法律推理、裁判文書推薦等獨(dú)具特色的研究方向[54-55]。

      計(jì)算藝術(shù)的獨(dú)特之處在于所研究的對象可能是非文本形態(tài)的“人類表達(dá)”。計(jì)算藝術(shù)對傳統(tǒng)藝術(shù)對象進(jìn)行計(jì)算視角的分析和解讀,具體如傳統(tǒng)繪畫的相似性和聚類分析[56],音樂樂譜的計(jì)量和統(tǒng)計(jì)[57]等。值得注意的是,基于深度學(xué)習(xí)擴(kuò)散模型(diffusion model)的圖像生成算法在近期取得了突破性進(jìn)展,以DALLE-2[58]為代表的AI作畫技術(shù)為計(jì)算藝術(shù)應(yīng)用于藝術(shù)作品自動生成打開了大門。

      計(jì)算人文在傳統(tǒng)檔案學(xué)領(lǐng)域也得到了初步的嘗試,圍繞計(jì)算檔案學(xué)的學(xué)理性探究、檔案人文服務(wù)理念以及檔案研究的路徑與方法,計(jì)算檔案學(xué)開辟了數(shù)據(jù)驅(qū)動下的檔案學(xué)研究新范式[59-61]。

      在計(jì)算人文的體系下,這些已形成或?qū)⒁纬傻挠?jì)算人文子學(xué)科可以統(tǒng)一稱之為“計(jì)算X”。

      5? ?總結(jié)和展望

      走過了大半個(gè)世紀(jì)發(fā)展歷程的計(jì)算人文,雖然在不同的發(fā)展階段研究重心有所不同、采用的主要技術(shù)方法有所不同、用于表述的名詞術(shù)語有所不同,總而言之,側(cè)重點(diǎn)有所不同,但以人類表達(dá)為對象的初衷沒有變,以研究和解決人文學(xué)科問題努力的方向沒有變。在不同的發(fā)展階段,統(tǒng)計(jì)、計(jì)量、數(shù)字化、數(shù)據(jù)化以及數(shù)據(jù)基礎(chǔ)之上的計(jì)算曾分別擔(dān)綱計(jì)算人文的主要研究方法與研究手段,計(jì)算人文各類研究項(xiàng)目的研究內(nèi)容、成果產(chǎn)出、成果呈現(xiàn)也相應(yīng)地有所不同,用于表達(dá)計(jì)算人文含義的名詞也經(jīng)過了多樣的變化。

      在計(jì)算的規(guī)模和效率得到飛速提升的當(dāng)下,憑借人工智能技術(shù)的支撐,數(shù)據(jù)加工處理和計(jì)算等技術(shù)的推動與人文學(xué)科自身發(fā)展的需要共同促使計(jì)算人文真正進(jìn)入了計(jì)算時(shí)代。以人類表達(dá)特別是文本形態(tài)的人類表達(dá)為研究對象,以人文學(xué)科的問題為研究問題,以數(shù)據(jù)基礎(chǔ)之上的計(jì)算為主要研究方法,計(jì)算人文在“大帳篷”模式下的多樣研究實(shí)踐促進(jìn)了學(xué)科體系的形成,也將催生學(xué)科理論的升華與完善。當(dāng)前,計(jì)算人文在國內(nèi)還迎來了國家戰(zhàn)略需求、一級學(xué)科更名以及新文科建設(shè)的重大機(jī)遇,計(jì)算人文應(yīng)充分發(fā)揮兼具人文內(nèi)涵與技術(shù)引領(lǐng)的優(yōu)勢,承擔(dān)起將新技術(shù)應(yīng)用于哲學(xué)社會科學(xué)研究、發(fā)展新興學(xué)科和交叉學(xué)科的使命,為構(gòu)建中國特色哲學(xué)社會科學(xué)學(xué)科體系、學(xué)術(shù)體系、話語體系貢獻(xiàn)力量的同時(shí)也發(fā)展壯大自身。

      致謝:本文寫作過程中教育部語言文字應(yīng)用研究所馮志偉教授、南京大學(xué)魏向清教授、清華大學(xué)劉石教授提供了諸多寶貴建議與幫助,謹(jǐn)致謝意!

      參考文獻(xiàn):

      [1]? BUSA R A.Foreword:Perspectives on the Digital Humanities[J].A Companion to Digital Humanities,Hoboken,2004:xvi-xxi.

      [2]? 黃水清.人文計(jì)算與數(shù)字人文:概念、問題、范式及關(guān)鍵環(huán)節(jié)[J].圖書館建設(shè),2019(5):68-78.

      [3]? 黃水清,劉瀏,王東波.計(jì)算人文的發(fā)展及展望[J].科技情報(bào)研究,2021,3(4):1-12.

      [4]? MCCARTY W.Humanities Computing[M].Basingstoke:Palgrave Macmillan,2005.

      [5]? SVENSSON P.Humanities Computing as Digital Humanities[M].Defining Digital Humanities.Routledge,2016:175-202.

      [6]? SCHOLES R,WULFMAN C.Humanities Computing and Digital Humanities[J].South Atlantic Review,2008,73(4):50-66.

      [7]? SULA C A,HILL H V.The early history of digital humanities:An analysis of Computers and the Humanities(1966-2004)and Literary and Linguistic Computing(1986-2004)[J].Digital Scholarship in the Humanities,2019,34(S1):i190-i206.

      [8]? CORNS T N.Computers in the Humanities:Methods and Applications in the Study of English Literature[J].Literary and Linguistic Computing,1991,6(2):127-130.

      [9]? KATZEN M.The application of computers in the humanities:A view from Britain[J].Information Processing & Management,1986,22(3):259-267.

      [10]? NYHAN J,F(xiàn)LINN A,WELSH A.Oral History and the Hidden Histories project:towards histories of computing in the humanities[J].Digital Scholarship in the Humanities,2015,30(1):71-85.

      [11]? BARZEN J,LEYMANN F.Quantum humanities:a vision for quantum computing in digital humanities[J].SICS Software-Intensive Cyber-Physical Systems,2020,35(1):153-158.

      [12]? BARZEN J.From Digital Humanities to Quantum Humanities:Potentials and Applications[M].Quantum Computing in the Arts and Humanities:An Introduction to Core Concepts,Theory and Applications.Cham:Springer International Publishing,2022:1-52.

      [13]? ROCKWELL G,SINCLAIR S.Hermeneutica:Computer-Assisted Interpretation in the Humanities[M].MIT Press,2022.

      [14]? 黃水清,劉瀏,王東波.國內(nèi)外數(shù)字人文研究進(jìn)展[J].情報(bào)學(xué)進(jìn)展,2022,14(1):50-84.

      [15]? 黃水清.回歸人文:從人文計(jì)算到計(jì)算人文[N].社會科學(xué)報(bào),2021-09-09(5).

      [16]? WULF Wm A.Look in the spaces for tomorrows innovations[J].Communications of the ACM,1997,40(2):109-111.

      [17]? BIEMANN C,CRANE G R,F(xiàn)ELLBAUM C D,et al.Computational Humanities-bridging the gap between Computer Science and Digital Humanities(Dagstuhl Seminar 14301)[J].Dagstuhl Reports,2014,4(7):80-111.

      [18]? From digital to computational humanities:The VAST project vision[EB/OL].[2023-01-22].https://air.unimi.it/handle/2434/891349.

      [19]? BUSA R.The annals of humanities computing:The index Thomisticus[J].Computers and the Humanities,1980,14(2):83-90.

      [20]? BUSA R.INDEX THOMISTICUS[EB/OL].[2022-10-10].https://www.corpusthomisticum.org/it/index.age.

      [21]? 陳炳藻.從詞匯上的統(tǒng)計(jì)論《紅樓夢》 作者的問題[A].首屆國際《紅樓夢》 研討會[C].美國威斯康星大學(xué),1980:16-20.

      [22]? 施建軍.基于支持向量機(jī)技術(shù)的《紅樓夢》作者研究[J].紅樓夢學(xué)刊,2011(5):35-52.

      [23]? HOCKEY S.The History of Humanities Computing[M].SCHREIBMAN S,SIEMENS R,UNSWORTH J.A Companion to Digital Humanities.Malden,MA,USA:Blackwell Publishing Ltd,2004:1-19.

      [24]? 黃水清,王東波.國內(nèi)語料庫研究綜述[J].信息資源管理學(xué)報(bào),2021,11(3):4-17,87.

      [25]? 黃水清,王曉光,夏翠娟,等.推進(jìn)新時(shí)代古籍工作,加快創(chuàng)新智能化發(fā)展[J].農(nóng)業(yè)圖書情報(bào)學(xué)報(bào),2022,34(5):4-20.

      [26]? 李學(xué)勤.寫在“二十世紀(jì)中國考古”之前[J].文史知識,1999(6):38-39.

      [27]? 初景利,黃水清.從“圖書情報(bào)與檔案管理”到“信息資源管理”——一級學(xué)科更名的解析與思考[J].圖書情報(bào)工作,2022,66(14):1-7.

      [28]? 6th Annual International Conference of the Alliance of Digital Humanities Organizations,DH 2011,Stanford,CA,USA,June 19-22,2011,Conference Abstracts[C].Stanford University Library,2011.

      [29]? 黃水清,王東波.新時(shí)代人民日報(bào)分詞語料庫構(gòu)建、性能及應(yīng)用(一)——語料庫構(gòu)建及測評[J].圖書情報(bào)工作,2019,63(22):5-12.

      [30]? 黃水清,王東波.新時(shí)代人民日報(bào)分詞語料庫構(gòu)建、性能及應(yīng)用(二)——深度學(xué)習(xí)自動分詞模型構(gòu)建[J].圖書情報(bào)工作,2019,63(23):5-12.

      [31]? 黃水清,王東波.新時(shí)代人民日報(bào)分詞語料庫構(gòu)建、性能及應(yīng)用(三)——句長與詞的分析比較[J].圖書情報(bào)工作,2019,63(24):5-15.

      [32]? 王東波.面向知識挖掘的平行句法語料庫構(gòu)建研究:數(shù)字人文視角下的史部典籍信息組織[M].南京:南京大學(xué)出版社,2019.

      [33]? 俞士汶.建設(shè)綜合型語言知識庫的理念與成果的價(jià)值[J].中文信息學(xué)報(bào),2007(6):3-12.

      [34]? 馬建強(qiáng).計(jì)算歷史學(xué):大數(shù)據(jù)時(shí)代的歷史研究[J].學(xué)術(shù)論壇,2015,38(12):99-105.

      [35]? AU YEUNG C man,JATOWT A.Studying How the Past is Remembered:Towards Computational History through Large Scale Text Mining[A].Proceedings of the 20th ACM International Conference on Information and Knowledge Management[C].New York,NY,USA:Association for Computing Machinery,2011:1231-1240.

      [36]? 劉瀏,黃水清,孟凱,等.《春秋》三傳女性人物的人文計(jì)算研究[J].圖書情報(bào)工作,2020,64(23):109-123.

      [37]? 何琳,喬粵,孟凱.基于典籍的春秋社會時(shí)間序列演變分析方法初探[J].情報(bào)理論與實(shí)踐,2021,44(2):33-40.

      [38]? 嚴(yán)承希,王軍.數(shù)字人文視角:基于符號分析法的宋代政治網(wǎng)絡(luò)可視化研究[J].中國圖書館學(xué)報(bào),2018,44(5):87-103.

      [39]? KNOWLES A K,HILLIER A.Placing History:How Maps,Spatial Data,and GIS are Changing Historical Scholarship[M].ESRI,Inc,2008.

      [40]? 包弼德.群體、地理與中國歷史:基于CBDB和CHGIS[J].量化歷史研究,2017(Z1):213-246.

      [41]? 劉石.文獻(xiàn)學(xué)的數(shù)字化轉(zhuǎn)向[J].文學(xué)遺產(chǎn),2022(6):10-13.

      [42]? 黃水清,周好,彭秋茹,等.引書的自動識別及文獻(xiàn)計(jì)量學(xué)分析[J].情報(bào)學(xué)報(bào),2021,40(12):1325-1337.

      [43]? 孫燕,劉瀏,王東波.《春秋左傳正義》引書計(jì)算人文研究[J].圖書情報(bào)工作,2023,67(2):119-130.

      [44]? 張力元,王軍.基于機(jī)器學(xué)習(xí)的古籍目錄互著與別裁探析[J].中國圖書館學(xué)報(bào),2022,48(2):47-61.

      [45]? 王東波,劉暢,朱子赫,等.SikuBERT與SikuRoBERTa:面向數(shù)字人文的《四庫全書》預(yù)訓(xùn)練模型構(gòu)建及應(yīng)用研究[J].圖書館論壇,2022,42(6):31-43.

      [46]? MORETTI F.Distant Reading[M].Verso Books,2013.

      [47]? 笪章難,汪蘅.以計(jì)算的方法反對計(jì)算文學(xué)研究[J].山東社會科學(xué),2019(8):24-39.

      [48]? 張逸勤,鄧三鴻,胡昊天,等.預(yù)訓(xùn)練模型視角下的跨語言典籍風(fēng)格計(jì)算研究[C].第十二屆全國情報(bào)學(xué)博士生學(xué)術(shù)論壇,2022.

      [49]? STURGEON D.Unsupervised identification of text reuse in early Chinese literature[J].Digital Scholarship in the Humanities,2018,33(3):670-684.

      [50]? BROWN T,MANN B,RYDER N,et al.Language Models are Few-Shot Learners[A].Advances in Neural Information Processing Systems:卷 33[C].Curran Associates,Inc,2020:1877-1901.

      [51]? ChatGPT:Optimizing Language Models for Dialogue[EB/OL].[2023-01-20].https://openai.com/blog/chatgpt/.

      [52]? THORP H H.ChatGPT is fun,but not an author[J].Science,2023,379(6630):313-313.

      [53]? 鄧矜婷,張建悅.計(jì)算法學(xué):作為一種新的法學(xué)研究方法[J].法學(xué),2019(4):104-122.

      [54]? 申衛(wèi)星,劉云.法學(xué)研究新范式:計(jì)算法學(xué)的內(nèi)涵、范疇與方法[J].法學(xué)研究,2020,42(5):3-23.

      [55]? 梁柱,沈思,葉文豪,等.基于結(jié)構(gòu)內(nèi)容特征的裁判文書自動推薦研究[J].情報(bào)學(xué)報(bào),2022,41(2):167-175.

      [56]? WEINSTEIN M,VOSS E,SOLL D.Dendrography and Art History:a computer-assisted analysis of Cézannes Bathers[J].HQ:Digital Humanities Quarterly,2019,13(3).

      [57]? LUPKER J A T,TURKEL W J.Music Theory,the Missing Link Between Music-Related Big Data and Artificial Intelligence[J].HQ:Digital Humanities Quarterly,2021,15(1).

      [58]? RAMESH A,DHARIWAL P,NICHOL A,et al.Hierarchical Text-Conditional Image Generation with CLIP Latents[M].arXiv,2022.

      [59]? 趙躍,張佳欣.計(jì)算檔案學(xué)在中國的發(fā)展前景探析——基于中國圖情檔界的計(jì)算檔案學(xué)認(rèn)知調(diào)查[J].檔案學(xué)通訊,2021(5):32-39.

      [60]? 張斌,李子林.數(shù)字人文背景下檔案館發(fā)展的新思考[J].圖書情報(bào)知識,2019(6):68-76.

      [61]? 牛力,高晨翔,張宇鋒,等.發(fā)現(xiàn)、重構(gòu)與故事化:數(shù)字人文視角下檔案研究的路徑與方法[J].中國圖書館學(xué)報(bào),2021,47(1):88-107.

      作者簡介:黃水清,男,南京農(nóng)業(yè)大學(xué)信息管理學(xué)院教授,博士生導(dǎo)師;劉瀏,男,南京農(nóng)業(yè)大學(xué)信息管理學(xué)院副教授;王東波,男,南京農(nóng)業(yè)大學(xué)信息管理學(xué)院教授,博士生導(dǎo)師。

      猜你喜歡
      數(shù)字人文信息資源管理新文科
      美軍信息資源管理戰(zhàn)略概況研究與啟示
      新文科建設(shè)背景下的高校圖書館服務(wù)研究
      新文科建設(shè)的理路與設(shè)計(jì)
      新文科背景下公共管理學(xué)科大類人才培養(yǎng)模式的優(yōu)化
      “新文科”背景下新聞傳播教育的新形勢與新進(jìn)路
      出版廣角(2019年9期)2019-06-14 08:19:30
      大數(shù)據(jù)在部隊(duì)信息資源管理中的運(yùn)用
      電子測試(2018年4期)2018-05-09 07:28:33
      淺談西藏農(nóng)牧業(yè)信息資源管理
      數(shù)字學(xué)術(shù)與公眾科學(xué):數(shù)字圖書館新生態(tài)
      跨界與融合:全球視野下的數(shù)字人文
      跨界與融合:全球視野下的數(shù)字人文
      广昌县| 彩票| 福建省| 体育| 江孜县| 黄梅县| 若尔盖县| 芒康县| 维西| 双流县| 贡嘎县| 于田县| 板桥市| 成安县| 长治市| 清水河县| 安国市| 泊头市| 新疆| 陵水| 石嘴山市| 麟游县| 沙坪坝区| 长葛市| 商城县| 闸北区| 女性| 东兰县| 中牟县| 卢湾区| 青河县| 修武县| 昆山市| 碌曲县| 荥阳市| 正安县| 海安县| 临邑县| 台东市| 平度市| 贡山|