單宇 曹悅琪 汪韻
摘 要:術(shù)語規(guī)范及相關(guān)標(biāo)準(zhǔn)國際化成為中國高鐵“出海”的重要基礎(chǔ)。文章以概念系統(tǒng)為切入點,闡述了多語種高鐵術(shù)語庫建設(shè)的內(nèi)容與方法,包括術(shù)語的收集、提取、翻譯與審核,術(shù)語庫的創(chuàng)建、維護與管理等。術(shù)語庫建設(shè)完成后,可應(yīng)用于高鐵相關(guān)翻譯實踐、高鐵術(shù)語詞典編纂與BTI、MTI翻譯教學(xué)等領(lǐng)域,促進術(shù)語標(biāo)準(zhǔn)化建設(shè),完善術(shù)語規(guī)范與統(tǒng)一。開展中國高鐵術(shù)語庫建設(shè)具有重要現(xiàn)實意義,有利于中國高鐵產(chǎn)品、技術(shù)和服務(wù)真正“走出去”,打造中國高鐵國際競爭話語權(quán),彰顯中國智造和文化自信,提高中國國際影響力。
關(guān)鍵詞:中國高鐵;術(shù)語庫建設(shè)與應(yīng)用;高鐵術(shù)語;高鐵術(shù)語庫
中圖分類號:H083;H059? 文獻標(biāo)識碼:A? DOI:10.12339/j.issn.1673-8578.2022.03.012
Construction and Application of China’s High-speed Rail “Going Global” Termbase//SHAN Yu, CAO Yueqi, WANG Yun
Abstract:Standardization of terms and internationalization of relevant standards have become an important foundation for China’s high-speed railway “going global”. This paper expounds the contents and methods of the construction of multilingual high-speed railway termbase from the perspective of conceptual system, including term collection, extraction, translation and review, termbase construction, maintenance and management. The termbase completed could be applied to the various fields such as translation practice related to high-speed railway, compilation of high-speed railway term dictionary and teaching of BTI and MTI. The termbase can promote the standardization, specification and unification of terms, and will be conducive to the enhancement of China’s high-speed rail’s international competition advantages, enabling China’s high-speed rail products, technologies and services to “go global” indeed, which demonstrates China’s intelligent manufacturing and cultural confidence and improves China’s international influence.
Keywords: China’s high-speed rail; construction and application of termbase; high-speed rail related terms; high-speed rail termbase
收稿日期:2021-10-07? 修回日期:2022-04-14
基金項目:2019年教育部人文社會科學(xué)研究規(guī)劃基金項目(19YJA880004);2020年度湖南省哲學(xué)社會科學(xué)基金重點項目(20ZDB032);2020年國家社會科學(xué)基金重大項目(20&ZD312);2021年湖南省研究生科研創(chuàng)新一般項目(CX20210139)
引言
從“制造”到“智造”,從“輸血”到“造血”,從“引進來”到“走出去”,中國高鐵實現(xiàn)了由引進、消化、吸收到自主創(chuàng)新發(fā)展的飛躍。放眼國際,中國鐵路已經(jīng)在美洲、非洲、亞洲、中東等地區(qū)落地生根,推進包括術(shù)語規(guī)范在內(nèi)的高鐵相關(guān)標(biāo)準(zhǔn)國際化,加速“中國標(biāo)準(zhǔn)”的世界化,是中國高鐵“出海”的重要基礎(chǔ)。
1 研究背景
國外多語種術(shù)語庫的建設(shè)歷史悠久,如德國國防部投入開發(fā)的LEXIS術(shù)語庫(LEXIS Terminological Data-bank)、歐洲共同體委員會術(shù)語庫(Eurodicautom)、西門子公司投入建設(shè)的多語種術(shù)語庫 TEAM 、聯(lián)合國術(shù)語庫UNTERM(The United Nations Terminology Database)、歐盟 IATE 互動型術(shù)語庫(Inter Active Terminology for Europe)、加拿大政府術(shù)語數(shù)據(jù)庫TERMIUM等。
1989 年以來,國內(nèi)多個機構(gòu)陸續(xù)建立不同類型的專業(yè)術(shù)語庫。經(jīng)過多年的發(fā)展,國內(nèi)重要的多語種術(shù)語庫有中國特色話語對外翻譯標(biāo)準(zhǔn)化術(shù)語庫、中國關(guān)鍵詞、中國核心詞匯等。相比而言,國內(nèi)術(shù)語庫建設(shè)從語種和規(guī)模上來看都不甚完善,大多僅包括漢英兩種語言,且所涉領(lǐng)域較為單一。
2 術(shù)語及概念系統(tǒng)
術(shù)語學(xué)探討的概念是同某一知識領(lǐng)域所研究的客體相對應(yīng)的,因而有其內(nèi)在的系統(tǒng)性。在一個知識領(lǐng)域中,概念用定義描述,被賦予約定的指稱即術(shù)語。概念體系反映相應(yīng)的知識體系。
概念系統(tǒng)的研究是術(shù)語工作不可缺少的一個環(huán)節(jié),它可以揭示專業(yè)領(lǐng)域內(nèi)各個概念之間的結(jié)構(gòu)關(guān)系,因而為系統(tǒng)研究高鐵專業(yè)的術(shù)語提供了條件。例如,通過研究高鐵相關(guān)術(shù)語所表達的全部概念,可幫助研究者核查所收錄術(shù)語有無重大遺漏;通過透徹理解概念系統(tǒng)中各個概念之間的各種關(guān)系,可構(gòu)成新的術(shù)語;通過研究漢、英、西、法不同語言之間的概念系統(tǒng)是否協(xié)調(diào)一致,可發(fā)現(xiàn)這些語言中相應(yīng)的術(shù)語是否等價。根據(jù)概念系統(tǒng)編纂而成的詞典有很強的系統(tǒng)性,將其應(yīng)用于術(shù)語系統(tǒng),便于進行聯(lián)機檢索,利于術(shù)語含義的理解,頗助于術(shù)語工作者的培訓(xùn)和術(shù)語教學(xué)。
3 中國高鐵術(shù)語庫建設(shè)
3.1 總體目標(biāo)
高鐵術(shù)語本體庫是以中國高鐵概念系統(tǒng)為基礎(chǔ),建設(shè)以漢語術(shù)語為核心,英語、法語、西班牙語對應(yīng)術(shù)語為映射,涵蓋術(shù)語知識各類相關(guān)條目的集合。多語種高鐵術(shù)語庫構(gòu)建的基本思路是:收集高鐵相關(guān)權(quán)威資料,建成高鐵語料庫,從語料庫中提取核心術(shù)語,根據(jù)高鐵概念系統(tǒng)擴展術(shù)語的相關(guān)知識條目,如定義、例句、屬性關(guān)系等。
3.2 建庫原則
目的性。根據(jù)用戶對術(shù)語庫功能和數(shù)據(jù)的需求,充分考慮社會效益和經(jīng)濟效益,開發(fā)術(shù)語庫,避免盲目追求系統(tǒng)的大規(guī)模、高技術(shù)和多功能。
科學(xué)性。深入研究術(shù)語庫開發(fā)中涉及的各種學(xué)科的理論與技術(shù),在科學(xué)的基礎(chǔ)上建設(shè)術(shù)語庫。
可擴充性。根據(jù)新的需求,對術(shù)語庫的數(shù)據(jù)、軟件與硬件等進行擴充。
3.3 術(shù)語提取
術(shù)語來源為國家鐵路局發(fā)布的鐵路工程施工安全系列技術(shù)規(guī)范等14項工程建設(shè)標(biāo)準(zhǔn)英文譯本。選擇Sketch Engine工具對所得語料進行術(shù)語提取。Sketch Engine作為一種在線語料庫索引工具,用于描述總結(jié)詞匯的語法知識,如關(guān)鍵詞與詞語搭配的使用頻率、顯著性,相關(guān)例句以及語法關(guān)系,同義詞辨析等功能。生成詞目表(lemma list)可從候選術(shù)語中選取有效術(shù)語,根據(jù)關(guān)鍵值(keyness)生成的詞表可過濾功能詞,Sketch Engine的“Word sketch”功能可以識別詞的搭配和語法行為,其中“Extract keywords and terms”功能可以通過N連詞(n-gram)精確索引。
在術(shù)語條目存儲格式方面,錄入建庫后,為了保證后期能夠?qū)⒍嗾Z種詞目及對應(yīng)關(guān)系順利導(dǎo)入本體知識庫,所有詞目均以xls格式存儲,方便使用OWL語言進行批量導(dǎo)入。
3.4 術(shù)語庫建設(shè)
3.4.1 建設(shè)工具
為方便后期轉(zhuǎn)向本體庫建設(shè),選擇Protégé作為術(shù)語庫工具。Protégé是目前主流的開源本體構(gòu)建工具,也是語義網(wǎng)中本體構(gòu)建的核心開發(fā)工具,由斯坦福大學(xué)醫(yī)學(xué)院生物信息研究中心基于Java語言開發(fā),支持? DAML+OIL、OWL、XML、RDF(S)等多種本體描述語言,可實現(xiàn)類的建模、實例編輯、模型處理以及模型轉(zhuǎn)換等功能。
3.4.2 術(shù)語庫結(jié)構(gòu)
本研究將高鐵術(shù)語庫設(shè)計為包含6大類以及31個子類的領(lǐng)域本體,具體分為工務(wù)工程(橋梁工程、站場工程、路基工程、軌道工程、隧道工程),牽引供電(供電系統(tǒng)、變電系統(tǒng)、接觸網(wǎng)系統(tǒng)、電力系統(tǒng)、遠(yuǎn)程監(jiān)控系統(tǒng)),通信信號(地面子系統(tǒng)、聯(lián)鎖子系統(tǒng)、調(diào)度集中控制系統(tǒng)、車載子系統(tǒng)、通信系統(tǒng)),動車組(列車網(wǎng)絡(luò)系統(tǒng)、制動系統(tǒng)、總成、牽引系統(tǒng)、車體、轉(zhuǎn)向架),運營調(diào)度(供電管理、客運調(diào)度、綜合維修、車輛管理、運行管理、運輸計劃),和客運服務(wù)(客運組織管理、市場營銷策劃、旅客服務(wù)系統(tǒng)、票務(wù)系統(tǒng))。使用Protégé創(chuàng)建類(Class)并構(gòu)建類之間的關(guān)系(Description)所得可視化本體結(jié)構(gòu)如圖1所示。
3.4.3 屬性結(jié)構(gòu)
根據(jù)Protégé工具的功能模塊,研究將術(shù)語條目分為三類來存儲:對象屬性(Object properties)、數(shù)據(jù)屬性(Data properties)和注解(Annotations)。其中對象屬性定義實體對象之間的關(guān)系,包括“isKindOf”“isPartOf”“isCharacterizedWith”“isPrototypeOf”“isEquippedWith”“isAssignedTo”等;數(shù)據(jù)屬性定義實體本身的屬性,除Protégé自帶的30余種數(shù)據(jù)類型外,自定義“Type”“Standard length”“Quantity”“Material”“Cycle”“Apply to”等;注解條目包括詞法信息(lexical information)、變體信息(term variations)、概念信息(conceptual information)、管理信息(administrative information),注解條目結(jié)構(gòu)如圖2所示。
3.4.4 實例錄入
將術(shù)語作為實例錄入術(shù)語庫中,術(shù)語相關(guān)信息包括對象屬性、數(shù)據(jù)屬性和注解。由于語料庫產(chǎn)生的本體知識數(shù)據(jù)規(guī)模十分龐大,手工構(gòu)建方法顯然效率太低,Protégé內(nèi)置的Cellfie模塊可以實現(xiàn)半自動化導(dǎo)入數(shù)據(jù)信息,用戶需使用MappingMaster[1]領(lǐng)域特定語言(DSL)自行編寫轉(zhuǎn)換規(guī)則[2],它可以定義從Excel工作表內(nèi)容到OWL本體的映射。正確規(guī)范編寫的轉(zhuǎn)換規(guī)則可以實現(xiàn)創(chuàng)建類、定義類之間的關(guān)系、添加實體、定義實體屬性等批量操作,顯著提高導(dǎo)入效率,同時減少手工輸入的錯漏情況。
引用Excel工作表的單元格內(nèi)容以字符“@”為前綴,字母表示列,數(shù)字表示行。工作表左上角的單元格為A1,其余依次向縱橫方向擴展,字符“*”指定一行或一列,如“@B*”表示引用第二列的單元格內(nèi)容,“@3*”表示引用第三行的單元格內(nèi)容。
聲明類與類之間的關(guān)系和實體及其屬性時,可以使用<CLASS> <INDIVIDUAL><ANNOTATIONS><TYPES><FACTS><SAME_AS>等語句,編寫轉(zhuǎn)換規(guī)則時可以限定需聲明單元格范圍,轉(zhuǎn)換規(guī)則聲明界面示意如圖3所示。應(yīng)用轉(zhuǎn)換規(guī)則批量導(dǎo)入術(shù)語后的注解條目如圖4所示。
在“Individual”模塊點擊術(shù)語“pantograph”,“Description”顯示術(shù)語所屬類別以及對應(yīng)的中文(受電弓)、西班牙語(pantógrafo)和法語(pantographe)術(shù)語,“Annotation”模塊顯示術(shù)語的語種、詞性、定義、例句等信息。應(yīng)用轉(zhuǎn)換規(guī)則批量導(dǎo)入后術(shù)語的對象屬性如圖5所示。
“Property assertions”模塊顯示術(shù)語“sleeper”的對象屬性(Object property assertions)和數(shù)據(jù)屬性(Data property assertions)。如圖5所示,其對象屬性顯示“sleeper”應(yīng)具有必要的“soundness”(堅固性)、“elasticity”(彈性)和“durability”(耐久性),數(shù)據(jù)屬性顯示“sleeper”的常用材料、單位長度鋪設(shè)數(shù)量和標(biāo)準(zhǔn)長度。
3.5 術(shù)語庫實例
經(jīng)以上各步驟建設(shè)完成的中國高鐵“出?!毙g(shù)語庫數(shù)據(jù)集,基本描述信息如表1。
4 結(jié)語
中國高鐵“出?!庇欣诮?gòu)連接絲綢之路經(jīng)濟帶的交通運輸網(wǎng)絡(luò)(歐亞、中亞、泛亞、中俄美加),促進中國“一帶一路”倡議構(gòu)想的早日實現(xiàn)。高鐵“出海”應(yīng)是產(chǎn)品、技術(shù)和服務(wù)三個層面全面“走出去”,語言先行,高鐵項目的招標(biāo)、談判、修建及運營,都離不開明晰、準(zhǔn)確、融洽的溝通,實現(xiàn)多語種術(shù)語的規(guī)范與統(tǒng)一,培養(yǎng)優(yōu)秀的專業(yè)化語言服務(wù)人才是“走出去”戰(zhàn)略實施過程的一個重要環(huán)節(jié)。
中國高鐵“出?!毙g(shù)語庫建設(shè)完成后,可應(yīng)用于多個領(lǐng)域。在高鐵相關(guān)翻譯實踐方面,將高鐵術(shù)語庫與計算機輔助翻譯技術(shù)工具相結(jié)合,利用軟件的翻譯記憶和計算機匹配技術(shù),既可以提高翻譯效率,又可提高翻譯的準(zhǔn)確性和一致性。
在高鐵語言相關(guān)教學(xué)方面,高鐵語料庫可提供有效資源。高鐵多語語料庫包含漢語、英語、法語、西班牙語,其中收錄具有代表性的期刊論文和新聞等正規(guī)語料,可供查詢語言特征、檢驗語言設(shè)想、統(tǒng)計詞頻或進行縱橫對比分析等。
在高鐵術(shù)語詞典編纂方面,由于術(shù)語庫內(nèi)容豐富,可實時更新,利用動態(tài)術(shù)語庫編纂詞典可以反映語言的真實變化,還可大大縮短編纂周期。
中國高鐵“出?!毙g(shù)語庫既可成為術(shù)語標(biāo)準(zhǔn)化建設(shè)的有機組成,也可成為中國高鐵參與國際經(jīng)濟競爭的戰(zhàn)略武器。加快術(shù)語的規(guī)范與統(tǒng)一,進一步推進中國高鐵術(shù)語庫建設(shè),將促成中國高鐵的產(chǎn)品、技術(shù)與服務(wù)真正地“走出去”,提升中國國際影響力。
參考文獻
[1] MappingMasterDSL[EB/OL]. (2020-10-29) [2021-04-13]. https://github.com/protegeproject/mapping-master/wiki/MappingMasterDSL.
[2] Transformation Rule Language[EB/OL]. (2020-03-07)[2021-04-13]. https://github.com/protegeproject/mapping-master/wiki/Transformation-Rule-Language.
作者簡介:單宇(1977—),女,博士,中南大學(xué)外國語學(xué)院教授。主要研究方向為科技翻譯、語料庫翻譯學(xué)、語言教學(xué)、翻譯史。先后主持教育部人文社會科學(xué)研究規(guī)劃基金項目,湖南省哲學(xué)社會科學(xué)基金項目,參與國家社會科學(xué)基金重大項目。公開發(fā)表學(xué)術(shù)論文35篇,出版學(xué)術(shù)專著3部、譯著2部、教材5部。通信方式:yushan@csu.edu.cn。
《中國科技術(shù)語》雜志社
曹悅琪(1997—),女,中南大學(xué)外國語學(xué)院碩士研究生。研究方向包括科技翻譯、專用語料庫、術(shù)語庫等。主持中南大學(xué)中央高校基本科研業(yè)務(wù)費專項資金資助項目1項。通信方式:cao123yq@sina.com。
汪韻(1999—),女,中南大學(xué)外國語學(xué)院碩士研究生,研究方向為科技翻譯。通信方式:wangyun12399@163.com。