摘要:數字人文領域的術語互通是海峽兩岸學術交流和知識共享的重要橋梁。文章以期刊論文作為術語收集的數據源,構建起海峽兩岸數字人文術語對照表。根據兩岸術語表達的差異情況對術語進行分類,這些差異產生的原因可以總結為歷史習慣、內涵界定、翻譯習慣及文字表達習慣不同四個方面。研究形成的術語表可以作為數字人文術語庫的建設基礎,旨在深化數字人文理論研究,為建設數字人文學術共同體提供助力。
關鍵詞:數字人文;術語表;學術共同體;海峽兩岸;術語
中圖分類號:G250.7;H083文獻標識碼:ADOI:10.12339/j.issn.1673-8578.2024.04.007
Abstract:The mutual understanding of terminologies in the field of digital humanities serves as an significant bridge for academic exchange and knowledge sharing between the two sides of the Taiwan Strait. This article takes journal papers as the data source for terminology collection and constructs a comparative table of digital humanities terminologies across the Taiwan Strait. The terms are categorized according to the differences in their expressions across the strait, which can be attributed to four aspects: historical habits, connotations, translation habits, and textual expression habits. The glossary of terms resulting from the research can serve as the foundation for the construction of a digital humanities terminology database, aiming to deepen the theoretical research of digital humanities and provide assistance for the construction of a digital humanities academic community.
Keywords:digital humanities; terminology list; academic community; across the Taiwan Strait;terminology
0引言
數字人文①(臺灣地區(qū)稱為“數位人文”,以下統(tǒng)稱為“數字人文”)作為一個新興的跨學科領域,已經吸引了眾多學者的關注,他們將數字技術、工具和方法應用于人文研究過程,圍繞著數字人文的本地化實踐和研究進行了批判性思考和持續(xù)探索[1]。在跨學科知識的碰撞與交叉融合中,一些嶄新的術語也隨之出現。一系列表達多樣、語義豐富的術語既體現了數字人文作為新生事物的生命力,也為研究者在進行跨學科研究時厘清術語內涵、準確傳達信息、促進知識傳播方面提出了新命題。
我國臺灣地區(qū)的數字人文工作可以追溯至20世紀80年代開始的數位典藏工程[2],引入數字化手段,將傳統(tǒng)類型的典藏品轉化為數位典藏資料庫,積累起數量豐富的數字史料[3]。以第一屆“數位典藏與數位人文國際研討會”為起點,伴隨著資訊科技的迅速發(fā)展,臺灣數字人文經歷了從數位典藏到數位人文的轉向,聚焦于數位人文研究工具開發(fā)和數位技術的應用,DocuSky數位人文學術研究平臺匯集了30多種研究工具,是最具影響力的成果之一。2017年,《數位典藏與數位人文》作為臺灣地區(qū)第一本數字人文學術刊物,正式創(chuàng)刊并出版,進一步提升了臺灣地區(qū)數字人文研究的影響力。與此同時,大陸的數字人文研究也取得了顯著進展。自2009年中國學者引進“數字人文”這一概念后,從數字人文研究的理論建構、數字人文中心與數字人文學會等研究機構的成立到數字人文學術期刊與論文發(fā)表規(guī)模的迅速擴大,中國數字人文研究的話語體系快速形成,呈現出蓬勃發(fā)展的大好前景[4]。然而,在海峽兩岸數字人文學術共同體的形成過程中,學者們對數字人文研究術語具有不同的表述和理解,這在一定程度上阻礙了兩岸的學術交流。在數字人文領域的術語研究尚未形成規(guī)模和體系時,從海峽兩岸數字人文術語翻譯對比的視角進行研究頗為重要。為此,本文收集了海峽兩岸數字人文領域的術語,形成一個大致描述數字人文領域整體研究內容的術語表,進一步整理,并對海峽兩岸數字人文術語的表述方式、概念內涵進行對比分析。這是數字人文領域術語研究的初步探索,期待為后續(xù)研究提供可能的研究方法和路徑。
1海峽兩岸數字人文術語的收集與分類
1.1收集方法
期刊論文作為知識傳播的代表性途徑,研究者借此可以快速收集學科領域內的專業(yè)術語[5]。本文對臺灣地區(qū)數字人文研究類專業(yè)期刊及其他創(chuàng)設數字人文專欄的核心期刊進行了詳細調研,參考各期刊所發(fā)論文的數量、質量等數據,選取臺灣地區(qū)數字人文領域權威性和專業(yè)性均位于前列的期刊《數位典藏與數位人文》作為研究對象。
2017年臺灣大學數位人文學會設立者項潔創(chuàng)辦《數位典藏與數位人文》,其研究團隊開展了“docusky數位人文學術研究平臺”等項目,并研發(fā)了多種文本數字化處理、標注和分析工具,在數位科技與人文研究中具有深遠影響力。項潔在該期刊的發(fā)刊詞中強調了數字人文領域期刊“作為數字人文研究者發(fā)表和出版的正式管道”[6],能夠為學科聚焦和學科認同提供專門場域。此外,歷屆臺灣地區(qū)數位典藏與數位人文國際研討會的論文集作為補充數據源也納入到我們的研究范圍。
數據收集與處理過程分為以下四個步驟:(1)初步探索:了解并歸納不同學者對數字人文領域術語內涵的界定和闡釋,嘗試利用詞頻統(tǒng)計器等工具進行初步檢索和篩選。(2)臺灣地區(qū)數字人文術語提?。簩ζ诳詣?chuàng)刊以來發(fā)布的59篇學術論文進行了詳盡的閱讀和分析,從中提取了專業(yè)術語和專有名詞。以文獻的關鍵詞為主,輔以論文內容分析,通過人工審核、專家咨詢,去除重復項后,共收集了66個術語及其相應的英文翻譯。(3)大陸對應數字人文術語檢索:以論文篇名和關鍵詞中包含這些術語的英譯詞或詞組為檢索條件,在中國知網數據庫中進行檢索,尋找這些術語在大陸的對應表達方式。匯集并整理所有檢索結果,形成本文的數據基礎,然后利用專業(yè)軟件進行詞條的對比分析。(4)術語對照:根據臺灣地區(qū)與大陸數字人文術語名稱的相似情況進行分類,形成包含“英文表達-臺灣術語表達-大陸術語表達”的術語對照表。
1.2海峽兩岸數字人文術語的分類
目前海峽兩岸術語對比研究的學術成果中,單宇等學者將兩岸化學工程術語完全相同和僅有繁簡字差異的都歸為“相同”這一類別,存在差異的術語分為“用語習慣的不同”“譯法不同”和“其他”三類[7]。劉金婷等學者將兩岸大氣科學領域的術語分為“完全一致術語”和“不一致術語”兩大類,其中“不一致術語”又細分為“部分一致術語”和“完全不一致術語”兩類[8]。借鑒已有的分類方法,本文根據海峽兩岸數字人文使用術語的差異情況分別匯總,兩岸術語表達基本一致(僅存在繁簡字體區(qū)別或較小的用字差別)的術語有29個(詳見表1),臺灣地區(qū)與大陸術語譯名有明顯差異的術語有37個(詳見表2)。
1.2.1表達基本一致的術語表
海峽兩岸在數字人文研究中表達基本一致的術語主要分為如下幾類:(1)從群體傳記學、文學、計算機等其他學科引入的術語保留了原有的學科特色,如計算機領域“字符識別模型”“語言預訓練模型”等科技術語,體現了計算機專業(yè)和人文學科融合的特點;“版面分析”則體現了古籍OCR識別與版本識別的技術融合。(2)在數字人文研究中開發(fā)的數據庫成果,例如“中國歷代人物傳記資料庫”“臺灣歷史人物傳記資料庫”“臺灣客語語料庫”等,作為專有名詞,它們具有統(tǒng)一且唯一的表達方式。(3)臺灣數字人文研究形成的新詞匯,大陸在介紹和引入時也保留了原有的術語譯法。例如,“輕造字”是臺灣學者在古籍數字化整理時針對缺字問題提出的解決方法,造字是基于聚類校對根據新出現的異體字圖形識別字類、分配編碼并錄入造字管理系統(tǒng)的過程,“輕”則體現在造字成本低、速度快和易管理三個方面;“詞夾子”是臺灣數位人文學術研究平臺開發(fā)團隊研發(fā)的半自動工具,能夠從文本中提取特定類別的詞匯;此外還有“僧侶游方資料庫”“AT分類法”等新出現的術語。
1.2.2表達有明顯差異的術語表
在臺灣地區(qū)數字人文研究的發(fā)展歷程中,文獻典藏的數字化處理和數字典藏數據庫的建設是其初步探索的重要方面。為推動實踐項目深入發(fā)展,人文學者主導并開發(fā)了符合人文研究需求的計算機技術和工具,推動了本地區(qū)數字人文研究范式的轉型,并在東亞乃至全球范圍內倡導區(qū)域性數字人文研究等議題中發(fā)揮了引領作用。同時,臺灣地區(qū)的這些研究也對大陸數字人文學科的蓬勃發(fā)展產生了強有力的帶動和輻射作用,成為大陸開展數字人文研究的重要引介[9]。與航空科學等領域的術語差異情況不同,數字人文學科本身具有開放多元的特質,加之借助互聯網的即時、快速、高效的溝通優(yōu)勢,海峽兩岸數字人文研究人員的學術溝通、交流與合作十分密切。因此,多數術語在兩岸間并沒有本質區(qū)別。這些術語對照情況見表2, 本文第2部分將詳細分析這些差異產生的原因。
2海峽兩岸數字人文典型術語內涵差異與分析
術語是詞匯體系的重要組成,漢語術語中四字格結構最為常見,還有五字格、六字格等更長的術語[10]。相較于整詞分析,術語中關鍵語素的拆分和解讀對揭示術語內涵的差異更為直接。兩岸數字人文研究對metadata、data、line等關鍵語素具有不同理解。一個術語的差異可能是由單一語素引起,也可能是多個語素差異的共同作用[11]。本文將數字人文領域的術語構詞中出現的關鍵語素匯總見表3。
在兩岸的數字人文研究中,術語翻譯和其涵蓋的范圍有不同的界定標準。單個術語中往往包含多個關鍵語素,因而影響兩岸術語差異的因素也不可能是單一的,而應該是多方面的。本文將從以下幾個方面探討這些差異產生的主要原因。
2.1延續(xù)歷史慣用表述
梳理早期術語的演變對于把握臺灣地區(qū)數字人文術語的內涵大有裨益,有助于我們更深刻地理解臺灣地區(qū)與“計算”“人文”緊密聯系的各術語流行和轉變的緣由,以此厘清臺灣地區(qū)與大陸數字人文領域的不同特點,更準確地判斷其互通交流的方式[12]。以“information”為例,20世紀八九十年代臺灣電子工業(yè)飛速發(fā)展,臺灣媒體將電腦、電話、電訊融合而成的新型工業(yè)形態(tài)稱為“資訊工業(yè)”,并隨之派生出“資訊”“資訊技術”等詞語,而大陸在報道臺灣的資訊活動時采用了“信息工業(yè)”一詞。經過長時間的發(fā)展,臺灣學者仍然沿用“資訊”一詞,大陸將“information”翻譯為信息、情報?!癲igital”一詞也并非數字人文領域的專有詞匯,我國臺灣地區(qū)譯為“數位”,由日本引入因而借鑒了日語翻譯方式,而大陸譯為“數字”。這些詞匯在數字人文這一新興學科中仍然延續(xù)了海峽兩岸在歷史上形成的各自的表達習慣。
2.2術語內涵界定不同
術語的內涵豐富多樣,對術語內涵理解的側重點不同往往導致術語表達方式的差異。以“computational linguistics”為例,以文本分析為導向的詞語索引以及詞頻統(tǒng)計等方法在計算人文出現伊始便成為研究熱點,隨著計算技術的升級,該研究領域理論與實踐成果不斷豐富。臺灣學者將“語文分析”視作計算語言學領域所倡導的文本分析技術或方法,語文分析技術主張從漢字構字、詞匯、語義、語音和語法分析等多個角度開展人文研究[13]。相比之下,大陸在術語表達上更明確地體現了計算在人文學科中的理論屬性,將其譯為“計算語言學”。還有,臺灣地區(qū)將“data”和“text”都譯為“資料”,大陸則分別譯為“數據”和“文本”。對照國外對這兩個術語的定義以及我國海峽兩岸對術語內涵的理解可以發(fā)現,我國臺灣地區(qū)對“資料”的界定更為寬泛,不限于紙質載體與數字載體等多種形式,無論是文本或是數據,更加強調資料的內容價值。圍繞資料的管理與利用,海峽兩岸對“data curation”的翻譯與解讀也各有側重,臺灣地區(qū)將其譯為“資料庋用”,其中“庋”意為“置放、收藏”,而“用”則包含了“使用、管理”等多重含義,這種翻譯方式體現了庋藏和使用的融合[14]。大陸對“curation”的翻譯則更為多樣,常見的有“監(jiān)督”“管理”“策劃”等。翻譯結果雖有明顯差異,但兩岸學者對“data curation”在文獻數據庫建設與管理中的作用卻有著共識,都強調資料的維護、保存和增值。然而,現有的翻譯方式并沒有完全體現出“data curation”促進數據增值的內涵。王海寧等學者梳理了國內外“digital/data curation”概念的內涵和翻譯方式,針對現有譯法指代模糊、以偏概全等問題,提出“數據理用”的新譯法[15]。盡管海峽兩岸對數字人文術語內涵的理解各有側重,但對研究者而言,這并沒有成為他們之間交流互鑒的障礙。相反,多角度、多層次地解讀術語內涵更有助于研究者以全面的視角把握數字人文的發(fā)展,系統(tǒng)建設數字人文學科的知識體系。
2.3翻譯方式的差異
臺灣地區(qū)與大陸在直譯與意譯的翻譯習慣方面常有差異。以“index”和“metadata”為例,“index”是西方目錄學傳入中國的研究工具,是一種以歸納的邏輯整理文獻的方法[16],新修改的索引編制規(guī)則(總則)中對“index(索引)”有以下定義:由一系列索引款目及參照組成,指向文獻中的概念、語詞及其他項目的檢索工具,按照異于文獻自身次序的排序法進行排序或存儲[17]。臺灣地區(qū)在翻譯時直譯為“資源參照”,而大陸則采用意譯方式,將其翻譯為“索引”。類似地,對于“metadata”這一術語,可以定義為“說明數據的數據”,用于識別、描述、定位和管理數據資源,臺灣地區(qū)采用意譯方式譯為“詮釋資料”,而大陸則直譯為“元數據”。同樣地,海峽兩岸對“term clip”的翻譯也體現了不同的翻譯習慣,臺灣地區(qū)將其直譯為“詞夾子”,既指代專門的研究工具,也指代利用該工具提取出的詞匯集合;而大陸則意譯為“術語集”,并將“term extractor”譯為“術語提取器”,這樣的翻譯結果更直接地體現了“詞夾子”的功能。
2.4文字表達習慣不同
多年隔絕使海峽兩岸形成了各自的語言特色。在文字表達習慣上,大陸是從左到右的橫排與豎排并用,以橫排為主;而臺灣地區(qū)則是豎排與從左到右的橫排并用,以豎排為主的書寫和閱讀習慣[18]。這種差異在術語表達中也有所體現,以“行識別模型”為例,臺灣地區(qū)的“行”通常指的是大陸的“列”,這種術語使用的不同反映了兩岸在文字書寫和排版習慣上的差異。目前學術研究對此已經達成了共識,文本的列(行)指若干漢字沿直線方向排列所形成的連續(xù)文字區(qū)域[19]。
3海峽兩岸數字人文術語互通的探索與思考
3.1為建設數字人文術語庫奠定基礎
術語庫是數字人文基礎設施的組成部分。術語表是收集特定領域術語及相關信息的列表,不僅是專業(yè)領域知識的載體,也是確保術語使用一致性和準確性的重要工具。與其他學科相比,數字人文是一個新興的跨學科研究領域,學科之間的交流與溝通尤為頻繁,術語表的建設和完善有助于數字人文領域知識的系統(tǒng)化和標準化。通過收集、整理和規(guī)范專業(yè)術語,術語表為學者提供權威可靠的術語資源。
本文形成的術語對照表作為檢索工具,幫助研究者在應用文獻綜述作為研究方法時可以完整地檢索并搜索到相關文獻,關注海峽兩岸數字人文術語的對照差異并提高檢索查全率和查準率[20]。同時,文章探索應用的術語庫建設方法可以為后續(xù)深入研究提供研究路徑,通過開展規(guī)范化的術語庫建設,為海峽兩岸建設共同的數字人文語料庫奠定基礎,促進語料的統(tǒng)一。
3.2為深化數字人文理論研究提供助力
術語的內涵解讀對于理解和深化學科理論至關重要。通過對“數位資訊”“計算人文”“data curation”等核心術語的深入剖析,研究者能夠更準確地把握學科的基本概念和發(fā)展脈絡。這不僅為學科話語體系的構建提供了理論基礎,而且有助于避免因術語使用不當而引發(fā)誤解和混淆,確保學術交流的順暢和有效。
另外,理解海峽兩岸數字人文術語本身對研究者來說并非難事,認識兩岸數字人文術語的不同翻譯方式和界定方式能夠幫助讀者深入理解術語內涵,我們追求的并不是兩岸數字人文術語的完全一致和嚴格統(tǒng)一,而是借助術語來開展更深層次的理論研究。
3.3以建設數字人文學術共同體為長遠目標
從數字人文學科建設的內在立場來看,專業(yè)術語、論著語篇等作為學科話語的具體表現形式,是數字人文學科的有機組成部分。術語研究作為學術話語體系建設的基礎,“既包括術語概念的規(guī)范控制和內涵研究,也涉及研究論著的翻譯交流等內容”[21],術語概念和標準化、規(guī)范化以及體現數字人文學科特色的術語表的形成不僅是學科專業(yè)性和成熟度的體現,而且有助于跨學科交流和國際傳播。加強海峽兩岸數字人文術語研究,必須以推進兩岸數字人文研究的互動交流、推進學術協(xié)作共通為前提,并以建設中國境內數字人文學術共同體為長遠目標,以此推動學科內部話語的溝通和學術交流的深化。
注釋
① 文中涉及臺灣地區(qū)數字人文領域的一些專有名詞,比如臺灣數位人文學會、docusky數位人文學術研究平臺等 保留原有稱呼不變。
參考文獻
[1] 大衛(wèi)·M.貝里. 數字人文 數字時代的知識與批判[M].王曉光,譯. 沈陽:東北財經大學出版社, 2019.
[2]羅珮瑄,陳雅琳. 滴水空明數位人文空間.文本標記與數位閱讀:從“疾病感覺地圖”“葉德輝藏書閣”與“游方”談起[J].數字人文研究, 2022,2(3):21-38.
[3]張衍,賈詩威. 我國臺灣地區(qū)圖書資訊與檔案學研究進展(2009-2018)[J].圖書館論壇,2020,40(4):50-65.
[4]夏翠娟. 數字人文的理論沿革和范式轉向:從“人文研究的數字方法”到“后數字時代的人文研究”[J/OL].中國圖書館學報:1-24[2024-06-24].http://kns.cnki.net/kcms/detail/11.2746.G2.20240506.1825.002.html.
[5]趙柯然,王延飛.“情報”術語爭議對學術交流與學科建設的影響反思[J].圖書情報工作, 2018,62(2): 35-39. DOI:10.13266/j.issn.0252-3116.2018.02.006.
[6]項潔. 發(fā)刊詞:從數位典藏到數位人文[J].數位典藏與數位人文, 2018(1): i-v.
[7]單宇,項艷艷. 海峽兩岸化學工程術語的差異及成因初探[J].中國科技術語, 2016,18(5): 42-46,52.
[8]劉金婷,韋沁,代曉明. 基于Gephi的海峽兩岸科技術語差異可視化研究:以大氣科學術語為例[J].中國科技術語, 2023,25(3): 33-43.
[9]肖鵬. 把“專題數據庫”作為方法:數字人文的重新認識及其在AI時代的發(fā)展趨勢[J].圖書情報知識, 2023, 40(5): 16-27.
[10]張暉.術語的生成與解析初論[J].中國科技術語, 2016,18(1): 19-21, 35.
[11]張暉.兩岸術語詞之微差異語素:類型、分布及成因[J].寧夏大學學報(人文社會科學版), 2020,42(4):28-37.
[12]黃水清,劉瀏,王東波.國內外數字人文研究進展[J].情報學進展,2022,14:50-84.
[13]劉昭麟. 從《數位人文研究》展望資料開放、工具協(xié)同與議題網絡[J].數位典藏與數位人文, 2018(1),11-50. https://doi.org/10.6853/DADH.201804_1.0002.
[14]黃千珮,蕭頌主,黃芮盈. 資料庋用之前:軍歌資料庫的數位建檔歷程[J].數位典藏與數位人文, 2022(10), 165-209. https://doi.org/10.6853/DADH.202210_(10).0006.
[15]王海寧,丁家友,聶云霞. Digital/Data Curation的概念與翻譯研究[J].圖書館雜志,2018,37(1):8-18. DOI:10.13663/j.cnki.lj.2018.01.002.
[16]熊靜.索引運動與索引學說的建立[J].圖書情報知識,2016(4):27-36.
[17]國家市場監(jiān)督管理總局,國家標準化管理委員會. 索引編制規(guī)則(總則):GB/T 22466-2023[S/OL].(2023-05-23)[2024-06-29].https://www.guifanku.com/qitaguifan/822889.html.
[18]鄭啟五. 海峽兩岸用語差異[M].福州:福建人民出版社,1989.
[19]釋賢超. 一種多模型融合的中文古籍OCR後處理方法[J].數位典藏與數位人文, 2023(11),83-104. https://doi.org/10.6853/DADH.202304_(11).0003.
[20]肖鵬. 中國圖情領域的翻譯與引介傳統(tǒng)及其實踐反思:以“譯介譜系”為落足點[J].圖書館建設, 2020(3):6-11,27.DOI:10.19764/j.cnki.tsgjs.20200911.
[21]易凌,龔蛟騰,陶成煦,等.言以成事:中國圖書館學話語研究綜述[J].圖書情報工作, 2024, 68(6): 142-151. DOI:10.13266/j.issn.0252-3116.2024.06.013.
作者簡介:王逍晴,女,中山大學信息管理學院在讀碩士研究生。主要研究方向為數字人文、文化遺產保護。通信方式:wangxq85@mail2.sysu.edu.cn。
淳靖,女,中山大學信息管理學院在讀碩士研究生。主要研究方向為圖書情報、公共文化服務與管理。通信方式:chunj3@mail2.sysu.edu.cn。
收稿日期:2024-07-23 修回日期:2024-08-16
基金項目:2022年度全國科學技術名詞審定委員會一般項目“數字人文高頻術語及其在國家人文數據基礎設施中的應用研究”(YB2022020)階段性成果