宮靜萍,劉 萍
(安徽科技學(xué)院 外國語學(xué)院,安徽 鳳陽 233100)
語料庫在口筆譯教學(xué)中的應(yīng)用研究
宮靜萍,劉 萍
(安徽科技學(xué)院 外國語學(xué)院,安徽 鳳陽 233100)
語言學(xué)研究上經(jīng)常使用的語料庫,近十幾年來已慢慢應(yīng)用在翻譯教學(xué)與研究領(lǐng)域,不過仍以歐洲語言的應(yīng)用為主。本文以英漢、漢英翻譯為例,介紹語料庫如何應(yīng)用在翻譯教學(xué)及研究上。內(nèi)容涵蓋語料庫種類、語料庫檢索工具、各種潛在用途、相關(guān)翻譯語料庫之建構(gòu)建議,以及設(shè)計以語料庫為輔之翻譯教學(xué)課程。
語料庫;語料檢索;語料標(biāo)記;以語料庫為輔的翻譯教學(xué)
語料庫(corpus)作為學(xué)術(shù)研究工具,從17世紀(jì)的字典編纂、18世紀(jì)的圣經(jīng)研究、19世紀(jì)的方言研究,一直到20世紀(jì)中期的一般語言研究,已擁有四個世紀(jì)的長久歷史。1960年開始,電腦運算能力逐漸加速發(fā)展,儲存媒體的成本不斷降低,直接促進語料庫的飛快發(fā)展,各種大型語料庫應(yīng)運而生,語料庫語言學(xué)(corpus linguistics)也成為語言學(xué)之下一個蓬勃發(fā)展的分支,為語言研究及語言教學(xué)提供了一項有力的工具。
翻譯學(xué)作為語言學(xué)的相關(guān)學(xué)科,自然也可從語料庫的研究上獲得助益。20世紀(jì)90年代初期,英國曼徹斯特大學(xué)翻譯研究大師Mona Baker (1993)首次利用語料庫工具分析英譯文本中的獨特翻譯體共性(translation universal),進而在翻譯學(xué)之下建立了語料庫翻譯學(xué)(Corpus-based Translation Studies簡稱CTS)分支。之后的十幾年間, CTS相關(guān)的研究如雨后春筍般大量問世,翻譯學(xué)的地位也更新鞏固。21世紀(jì)初期, CTS學(xué)者的視角逐漸從單純的翻譯語體研究轉(zhuǎn)為翻譯教學(xué)及實踐研究,期望新時代電腦與語料庫工具的結(jié)合能夠為翻譯教學(xué)傳統(tǒng)及專業(yè)翻譯實務(wù)帶來新的助益。許多大學(xué)及翻譯相關(guān)機構(gòu)開始建立各種實用的翻譯語料庫,規(guī)模也日漸龐大,從百萬字?jǐn)U增至數(shù)千萬字。歐美國家一些翻譯課程里已開始教導(dǎo)學(xué)生自建語料庫(do-it-yourself corpora),作為字典及網(wǎng)絡(luò)之外的翻譯輔助工具。[1]本文將以口筆譯教學(xué)與研究為主軸,介紹語料庫在這兩方面的可行應(yīng)用方向。
翻譯教學(xué)過程中,老師或?qū)W生經(jīng)常需要進行各種探索,例如某個字的翻譯方法、專有名詞如何處理、表達(dá)方式、遣詞用字的推敲、翻譯口吻等等。語料庫由于包含了大量的例句,因此特別適合作為翻譯查詢的輔助工具。本文將以語料庫與翻譯教學(xué)的結(jié)合為主題,探討語料庫的種類、語料庫查詢方式、語料庫在翻譯教學(xué)上的潛在用途等等。
(一)商業(yè)語料庫
當(dāng)今學(xué)術(shù)界里,各種語言的語料庫已相當(dāng)齊全。英式英語的 “英國國家語料庫”(British National Corpus,簡稱BNC)及美式英語的 “美國國家語料庫”( American National Corpus,簡稱ANC)則是英語世界里的兩大代表語料庫。美國賓州大學(xué)主持的Linguistic Data Consortium則是一個非常龐大的語料庫建設(shè)計劃,內(nèi)容涵蓋各種主題及語言的語料庫,并且對外販?zhǔn)?,集中語言資源的管理,避免各單位自建語料庫而導(dǎo)致資源重疊。現(xiàn)代的電腦商業(yè)語料庫在規(guī)模上均極為龐大,最起碼都有千萬字以上。在內(nèi)容方面則大致上有書面語、口語、一般主題及專業(yè)主題之分。[2]商業(yè)語料庫需要付費方得使用,有些語料庫極為昂貴,不適合個人購買。大型的商業(yè)語料庫雖然內(nèi)容豐富,但用在翻譯輔助上并非絕對有幫助。例如查詢很簡單的nut一字,它有 “堅果”、“螺帽”、“呆子”等不同意思,規(guī)模達(dá)一億字以上的若能夠使用小型的專業(yè)自建(DIY)語料庫,在查詢上將非常方便。
(二)DIY語料庫
自建的翻譯輔助語料庫,在規(guī)模及內(nèi)容上可由老師、研究者、學(xué)生自行決定,依照上課或研究目標(biāo)建立各式各樣的小規(guī)模語料庫(一百萬字以下)。建置上可區(qū)分主題、文體、文類、年代、文章困難度等等。剛開始建立語料庫時或許感覺費時,需要進行大量的網(wǎng)絡(luò)搜索、文章分類、文字標(biāo)注等初步作業(yè),但系統(tǒng)的建立起來之后,后續(xù)的工作便只是不斷添加內(nèi)容及語料管理,長遠(yuǎn)看來依舊有其價值。其實翻譯老師的個人電腦里已經(jīng)有許多現(xiàn)成的語料。學(xué)生平日交的翻譯作業(yè)文檔即是一例,老師可以將這些作業(yè)收集成為語料庫,每次同一篇作業(yè)(原文)都有不同學(xué)生的翻譯版本,妥善收集整理之后便成為一個極為實用的 “翻譯作業(yè)語料庫”,可用在翻譯教學(xué)及翻譯品質(zhì)的研究上。另外,學(xué)生針對一篇翻譯作業(yè)進行網(wǎng)絡(luò)查詢,搜索到的參考文件也可以收集成 “翻譯專業(yè)主題語料庫”,長久積累之后便是一個相當(dāng)實用的參考語料庫。個別學(xué)生本身的翻譯作業(yè)也可建置成 “個別學(xué)生語料庫”,方便自我學(xué)習(xí)及自我風(fēng)格的研究。自建語料庫的文字來源極為廣泛。
(三)單語查詢
大多數(shù)的語料庫檢索軟體均只能進行單語查詢,較常用的軟體包括WordSmith、Concordance、AntConc、Xaira、Text STAT等等。這些軟體均提供基本的查詢結(jié)果,例如詞頻表(frequency list)、附前后文的關(guān)鍵詞索引(key word in context,簡稱KWIC)、詞頻表及KWIC的多重排序方式等等。詞頻表列出語料庫內(nèi)所有單詞的出現(xiàn)頻率,可選擇依照單詞的頻率高低或字母順序進行排序,再擇一單詞觀察其所有KWIC例句。[3]西方語料庫翻譯學(xué)界經(jīng)常針對單語的翻譯語料庫(translated corpus)及非翻譯語料庫(non-translated corpus)進行比較,亦即所謂的 “可比語料庫”( comparable corpora),以此研究翻譯文字的語體特色,成果豐碩。
(四)雙語查詢
平行語料庫(parallel corpora)的查詢,完全依賴源語與譯語語料之間是否絕對對齊(alignment)。目前歐洲語言之間的自動對齊準(zhǔn)確度已相當(dāng)高,歐亞語言之間則仍存在自動對齊的技術(shù)問題。經(jīng)過對齊的語料,大致可區(qū)分為 “一對一”及 “一對多”的對齊模式。著名的ParaConc平行語料庫最多可以進行 “一對三”的顯示,亦即一源語對三個版本的譯語。分析雙語或多語的平行語料庫,可以研究翻譯技巧、查詢翻譯對等關(guān)系、提供翻譯例子、協(xié)助學(xué)生了解專業(yè)譯者的翻譯策略等等。在商業(yè)軟體方面,ParaConc不僅可進行最多 “一對三”的顯示,還與亞洲語言相容。除此之外,MultiConcord也頗為知名,但不支持亞洲語言。[4]
(五)翻譯教學(xué)中使用語料庫的目的
傳統(tǒng)的翻譯教學(xué)模式,一般而言均是老師決定原文文章之后,交由學(xué)生閱讀全文,查詢生詞及相關(guān)知識,決定翻譯技巧及整體策略,之后再進行翻譯。利用語料庫工具,我們可以將原文輸入語料庫,取得詞頻表之后,再分析前一百個高頻詞并加以分類,初步了解該篇作業(yè)的內(nèi)容屬性,可協(xié)助學(xué)生擬定翻譯策略。以美國奧巴馬總統(tǒng)2009年初的就職演說為例,這篇演講若當(dāng)成作業(yè),約2400字,學(xué)生全部讀完需要一段時間,也無法立即掌握這篇重要演說的意境。經(jīng)由語料庫處理之后,我們?nèi)〉眠@篇演講的前一百個高頻詞,并依詞性加以分類,整理成如下表一。
從表1可以看出,同一詞類里面不斷出現(xiàn)的幾個詞均有其語用意義,例如代名詞的密集使用代表奧巴馬總統(tǒng)的就職演說強調(diào)與美國民眾對話,期望拉近與老百姓的距離,而非只是政策的宣示。幾個助動詞的使用也代表信念與決心。連接詞but、because的使用,代表演講人的推理及因果解釋。各種名詞的使用象征團結(jié)、共同目標(biāo)、愛國主義、美國與世界的互動、國際議題、代代相傳、勇敢迎接挑戰(zhàn)等等。幾個形容詞的使用目的主要是凸顯共同的目標(biāo)、國家利益、安全、希望等等。整體而言,這篇就職演說強調(diào)與民眾對話、渴望、希望、挑戰(zhàn)、不畏懼、團結(jié)、團隊精神、國際合作、快速行動等等。這些意涵均可作為學(xué)生擬定翻譯策略及語氣時的參考,在著手翻譯之前,對這篇演說已有了不同于傳統(tǒng)閱讀層面的認(rèn)同。此外,語料庫在翻譯教學(xué)、實踐與研究過程中,也是極具價值的工具,可讓使用者找到各種例句及翻譯方法,用途相當(dāng)廣泛。
表1 以語料庫為輔的翻譯作業(yè)文本分析
文本:奧巴馬2009年總統(tǒng)就職演說稿
分析對象:前一百個高頻詞
詞性字例意涵人稱代名詞、所有格代名詞our,we,us,you,they,those,their口語化文本情態(tài)助動詞will,can,must信念、決心連詞but,because轉(zhuǎn)折、解釋名詞nation,America,people,world,gener?ation,spirit,crisis,men,peace,power,courage,economy,father,force團結(jié)、共同目標(biāo)、愛國主義、美國與世界之互動、代代相傳、挑戰(zhàn)、勇氣……形容詞new,common,grea?ter,long共同目標(biāo)、國家利益、國家安全、希望……動詞do,let,work,know,meet,seek行動、信心、與敵人對話……時間副詞today,now,time,day,forward緊急行動、把握時間整體翻譯重點:口語、渴望、希望、挑戰(zhàn)、不畏懼、團結(jié)、團隊精神、全球合作、快速行動……
翻譯語料庫提供各種工具及方法來分析翻譯作品(product),以此可了解翻譯過程(process)。以連接詞but的漢譯為例(表2),根據(jù)研究,原文100個含but的句子里,有高達(dá)91.5%會被翻成 “但是”;其他被翻成 “但是”的英文連接詞還有however、and、yet等等,合計十七種。由此可以看出,許多連詞均會讓譯者想到 “但是”,而非只有but或however。此外,根據(jù)相同的研究,在漢譯文本中使用 “但是”的句子里,有83%可在原文中找到相對應(yīng)的連詞,17%是譯者需要自行添加。這種連詞明朗化的現(xiàn)象,說明譯者在翻譯過程中的主動性。
表2 漢譯文本中 “但是”一詞之原文
對等詞百分比及明朗化現(xiàn)象分析
原文對等詞出現(xiàn)頻率百分比%but72591.5however354.4and70.9yet60.8其他(13詞)192.4合計(17詞)792100沿用自原文79283明朗化(譯者自行添加)16217合計954100
綜上所述,在翻譯過程中使用語料庫的方法,對翻譯品質(zhì)及效率之提升均有一定程度的助益。在翻譯研究中,語料庫之使用亦讓我們發(fā)現(xiàn)平常不易觀察之現(xiàn)象,對翻譯過程之了解也具備一定功能。
語料庫結(jié)合翻譯教學(xué)的發(fā)展,至今已有十幾年的歷史,也慢慢形成所謂的 “以語料庫為輔的翻譯教學(xué)”(Corpus-assisted Translator Training;簡稱CATT)。[5]在此一背景下,世界各國的主要翻譯系所及組織紛紛建立自己的翻譯語料庫,作為教學(xué)及研究的工具。結(jié)合CATT的翻譯課程是未來的發(fā)展趨勢,筆者從翻譯教學(xué)及研究角度出發(fā),認(rèn)為以下三種語料庫是值得追求的方向。
(一)專業(yè)筆譯、學(xué)生筆譯語料庫(Corpus of Professional and Trainee Translators;簡稱CPTT)
CPTT的建置可采 “外譯漢”及 “漢譯外”雙向語料的方式,內(nèi)容包括由專業(yè)譯者及學(xué)生譯者完成的各種主題譯文及其原文,同時開發(fā)專用的雙語語料庫檢索軟件,并且必須做好原文及譯文的語料對工作。在語料本身的標(biāo)注方面,可加入多層次的注記,例如基本文本資料、詞性、學(xué)生檔案、專業(yè)譯者檔案、翻譯錯誤標(biāo)記、創(chuàng)意譯例、翻譯技巧等等,目的在比較專業(yè)譯者與學(xué)生譯者的技巧及文本處理方式之差異。此類語料庫在教學(xué)方面可以讓學(xué)生了解及學(xué)習(xí)專業(yè)譯者的譯筆功夫,在研究方面可以分析兩類譯者的差異類型,以尋找出最有效的教學(xué)方式。
(二)專業(yè)口譯、學(xué)生口譯語料庫(Corpus of Professional and Trainee Interpreters;簡稱CPTI)
CPTI的設(shè)計架構(gòu)類似CPTT,只是將筆譯語料改為口譯語料,但其技術(shù)復(fù)雜程度卻更高。首先是口譯內(nèi)容的正確書寫,這是極為繁瑣、耗時的工作。目前雖然有電腦自動書寫工具可供使用,但準(zhǔn)確度高低不一,仍必須依賴人工進行修正工作??谧g語料完成之后,必須與原文對齊以方便查詢。檢索介面也必須提供各種查詢口語語料的功能,例如原文及譯文的倒轉(zhuǎn)及快轉(zhuǎn)同步、關(guān)鍵詞檢索、隨機點選播放等等,以方便進行雙語比較或是專業(yè)口譯與學(xué)生口譯之比較。另外,口譯語料若經(jīng)過完整的標(biāo)注,例如停頓點、口譯員修正、重復(fù)、、語氣等等,將有利于口譯策略及風(fēng)格之研究。
(三)專業(yè)文本語料庫(Corpus of Specialized Texts;簡稱CST)
隨著國際化及網(wǎng)絡(luò)時代的來臨,翻譯的專業(yè)性也日漸提高,任何一篇等待翻譯的文本均有一定的困難度。CST的內(nèi)容設(shè)計以單語語料為主,強調(diào)語料的廣度及深度,涵蓋各式主題,分類詳盡,并具備即時更新的功能。CST猶如譯者的隨身圖書館,可隨時提供最貼切、恰當(dāng)?shù)淖g文建議,減少譯者在網(wǎng)絡(luò)搜索引擎上的查詢時間。例如譯者在翻譯 “固話客戶”一詞時,初步的直覺翻譯或許是 “fixed line customer”,但經(jīng)過查詢CST之后,可獲得 “wireline customer”、“l(fā)andline customer”這些更專業(yè)的翻譯建議。對于譯者譯入外語時所欠缺的語感,CST特別有幫助。
本文介紹了語料庫在翻譯教學(xué)與研究上的一些應(yīng)用方式,期望為翻譯學(xué)術(shù)界引介一個極為實用的工具與資源。筆者認(rèn)為語料庫應(yīng)該成為翻譯課程中的一環(huán),讓學(xué)生及老師均具備語料庫的操作及應(yīng)用能力。老師可以在作業(yè)設(shè)計上加入語料庫內(nèi)容,鼓勵學(xué)生以個人或小組方式自制語料庫,協(xié)助翻譯作業(yè)的完成,并以此提倡自主學(xué)習(xí)的習(xí)慣。翻譯系所的學(xué)生在數(shù)年的求學(xué)過程當(dāng)中需要完成許多作業(yè),這些都是現(xiàn)成的翻譯語料,如果經(jīng)過妥善的收集、分類、標(biāo)注,必可為翻譯教學(xué)過程帶來更充實的學(xué)習(xí)素材。在研究方面,翻譯語料庫的建構(gòu)也可作為碩士、博士論文研究的材料,無論是研究翻譯共性、教案編寫、教學(xué)研究、譯例分析、翻譯策略等等,均是極為可行的應(yīng)用方向。
[1]丁信善. 語料庫語言學(xué)的發(fā)展及現(xiàn)狀[J].當(dāng)代語言學(xué), 1998, (1):4~7.
[2]廖七一. 當(dāng)代英國翻譯理論[M]. 武漢: 湖北教育出版社, 2001:395~396.
[3]Biber, Douglas. Corpus Linguistics 1998 [M]. Beijing: Foreign Language Teaching and Research Press, 2000:16.
[4]謝應(yīng)光.語料庫語言學(xué)與外語教學(xué)[J]. 外語教學(xué)與研究, 1996, (3):45~47.
[5]楊惠中.語料庫語言學(xué)導(dǎo)論[M]. 上海: 上海外語教育出版社, 2002:333.
A Corpus-assisted Approach to Teaching Translation and Interpretation
GONG Jing-ping, LIU Ping
(College of Foreign Language, Anhui Science and Technology University, Fengyang Anhui 233100, China)
Machine-readable corpora have been widely used in translation research and teaching for more than a decade, although the application is dominantly prevalent in the translation of European languages. Drawing on examples from English-Chinese and Chinese-English translation, this paper provides an overview of how corpora can be used in the teaching and researching of translation. The discussions center on types of corpora, concordancing tools, potential applications, suggestions on building do-it-yourself translation corpora, parallel concordancing, use of corpora in translation teaching, and the development of a corpus-assisted translation curriculum based on three purpose-built corpora.
corpus;concordancing;part-of-speech tagging corpora;corpus-assisted translation curriculum
H315.9
A
1674-344X(2017)7-0029-04
2017-06-03
安徽省教育廳人文社科專項項目(SK2015A784)
宮靜萍(1986-),女,安徽蚌埠人,助教,碩士,研究方向為翻譯與英語教學(xué)。 劉 萍(1967-),女,安徽宣城人,副教授,碩士,研究方向為英語教學(xué)。
責(zé)任編輯:陳君丹