劉靖 李智
摘要:文章通過對國內(nèi)口譯大賽的特點(diǎn)進(jìn)行分析,探討了利用口譯比賽資源建立口譯學(xué)習(xí)者語料庫的可行性,提出了建立口譯學(xué)習(xí)者語料庫的步驟與過程,并深入挖掘建立此類語料庫的意義,以期對口譯教學(xué)與研究提供新對象、新方法和新途徑。
關(guān)鍵詞:口譯比賽;口譯學(xué)習(xí)者;口譯學(xué)習(xí)者語料庫;口譯研究
一、研究緣起
自上個(gè)世紀(jì)中葉口譯成為獨(dú)立的職業(yè)以來,在研究與實(shí)踐中不斷摸索前行。本世紀(jì)初,中國成立了翻譯本科專業(yè),截至2020年,目前國內(nèi)開設(shè)翻譯本科專業(yè)(BTI)的院校達(dá)到281所,翻譯碩士(MTI)的院校達(dá)到253所,口筆譯教育發(fā)展迅猛。
與此同時(shí),國內(nèi)也開展了多種口譯競賽,有大陸地區(qū)的,還有大陸地區(qū)與香港、澳門、臺灣等地共同舉辦的。學(xué)生們不僅在競賽中展示出新時(shí)期口譯學(xué)習(xí)者的風(fēng)采,而且在交流學(xué)習(xí)中不斷提升口譯能力。
二、國內(nèi)口譯競賽特點(diǎn)
目前國內(nèi)主要的口譯競賽有全國口譯大賽、海峽兩岸口譯大賽、中華口譯大賽等全國性賽事,還有校級、省級等多個(gè)級別的口譯比賽。
全國口譯大賽由中國翻譯協(xié)會與高等教育出版社、中國對外翻譯出版公司、中國翻譯協(xié)會語言服務(wù)行業(yè)創(chuàng)業(yè)創(chuàng)新中心等機(jī)構(gòu)主辦,自2009年首屆舉辦以來,截至目前已經(jīng)成功舉辦了八屆,2020年6月舉辦第九屆。涉及的語種主要是英語和漢語。一般分為初賽、省級復(fù)賽、大區(qū)賽和總決賽。在總決賽中還分為交傳決賽和同傳邀請賽;比賽包括英漢交傳、漢英交傳、對話交傳、中英同傳和英中同傳等環(huán)節(jié)。口譯材料主題包括文化交流、政治演講、熱點(diǎn)評論等。
海峽兩岸口譯大賽是由廈門大學(xué)發(fā)起,由廈門大學(xué)與臺灣翻譯學(xué)會共同主辦,兩岸三地高校參與的口譯比賽交流活動(dòng)。截止目前,已經(jīng)舉辦了八屆。主要語種是英語和漢語。賽制包括校選賽、省賽、大區(qū)賽、大陸地區(qū)決賽、臺灣決賽、兩岸總決賽等;比賽包括中英主旨口譯、英漢會議口譯、漢英會議口譯、雙向?qū)υ捒谧g等環(huán)節(jié)。比賽材料主題包括科學(xué)常識、科技信息、文化保護(hù)和熱點(diǎn)時(shí)事等。
中華口譯大賽是由聯(lián)合國訓(xùn)練研究所主辦,2019年舉行了第一屆比賽,包括初賽、復(fù)賽、大區(qū)賽、總決賽四級賽制,比賽包括英漢主旨口譯、漢英主旨口譯、英譯漢,漢譯英和對話口譯等環(huán)節(jié)??谧g材料包括政治演講、科技創(chuàng)新、企業(yè)管理和國際時(shí)事等主題。
這些比賽在主題方面雖各有傾向,但主要通過多級賽制、多類主題、多種形式對學(xué)生進(jìn)行了口譯能力分級考核,選拔優(yōu)秀選手。
三、研究基礎(chǔ)
語料庫是一個(gè)按照一定的采樣標(biāo)準(zhǔn)采集而來的,能夠代表一種語言或者某語言的一種變體或文類的電子文集(梁茂成等,2010,3)。Shlesinger(1998)最早提出將語料庫的方法應(yīng)用于口譯研究之中。目前國內(nèi)外的語料庫主要是包括同聲傳譯語料庫(CIAIR)(Tohyama,2006),是目前最大的同傳口譯語料庫,共計(jì)182小時(shí),轉(zhuǎn)寫文字100萬字;中國大學(xué)生英漢漢英口筆譯語料庫(PACCEL-S)(文秋芳、王金銓,2008)目前已經(jīng)出版;歐洲議會口譯語料庫(EPIC)(Bendazzoli & Sandrelli,2010)包含英語、意大利語和西班牙語的多語平行語料庫,庫容約為18萬字;上海交通大學(xué)研發(fā)的漢英會議口譯語料庫(CECIC)(胡開寶、陶慶,2010),目前庫容約為54萬字;電視口譯語料庫(CorIT)(Falbo,2012);中國總理“兩會”記者會漢英交替?zhèn)髯g語料庫(CEIPPC)(王斌華,2012)等。
由于語料獲取、清洗、轉(zhuǎn)寫、標(biāo)注等過程需要大量的人工,制作難度較大,因此國內(nèi)外已建成的語料庫比較有限。其中主要為二語或多語的平行語料庫,中英互譯的語料庫非常少,除文秋芳、王金銓(2008)出版的大學(xué)生口筆譯語料庫之外,其他均以職業(yè)譯員交傳或者同傳的內(nèi)容為對象,缺少對口譯學(xué)習(xí)者的關(guān)照,也缺少同一音頻的不同譯員的平行產(chǎn)出。將比賽的中英互譯內(nèi)容提取出來,對不同層次學(xué)生口譯產(chǎn)出進(jìn)行平行對比,這樣形成了口譯學(xué)習(xí)者語料庫。對口譯學(xué)習(xí)者而言,該庫為口譯學(xué)習(xí)提供了大量的訓(xùn)練與學(xué)習(xí)素材,為訓(xùn)練學(xué)生自主學(xué)習(xí)與點(diǎn)評提供了基礎(chǔ)。對教師而言,口譯學(xué)習(xí)者語料庫的建立不僅可以讓教師更好更快地發(fā)現(xiàn)學(xué)生的問題所在,發(fā)掘優(yōu)秀案例,而且還可以為口譯研究提供豐富研究資源與對象,對于提高學(xué)生口譯能力,培養(yǎng)口譯人才提供更多助力。
四、建構(gòu)方法與過程
結(jié)合口譯語料庫的建庫基本方法,建立口譯學(xué)習(xí)者語料庫可進(jìn)行以下四個(gè)步驟。
第一,提取音頻或視頻。提取音視頻的途徑主要有以下兩種方式,第一通過現(xiàn)場錄音、錄像等,第二通過提取出版物或網(wǎng)絡(luò)抓取等。國內(nèi)比賽跨度約為10年,完全依靠現(xiàn)場錄音錄像難以實(shí)現(xiàn),因此可以通過網(wǎng)絡(luò)或跨校合作,借助其他高校的存檔等方式互補(bǔ)資源不足的問題。
第二,語料清洗、切分和命名。去除語料中無效的段落,將圖像、聲音清晰完整的內(nèi)容切分保存。切分時(shí)可利用格式工廠等音視頻軟件,并根據(jù)統(tǒng)一的規(guī)則命名文件。命名時(shí),需注明比賽名稱、場次、語言方向、口譯類型、源語言或目標(biāo)語言、選手姓名或編號、時(shí)長、主題等信息,為防止命名過長可通過字母、數(shù)字等進(jìn)行代替,但字母與數(shù)字的意義需要統(tǒng)一。
第三,雙語轉(zhuǎn)寫、標(biāo)注與對齊??赏ㄟ^科大訊飛、搜狗等軟件分別對中英文音頻(轉(zhuǎn)寫時(shí),需要將視頻資料轉(zhuǎn)換為音頻)進(jìn)行機(jī)器轉(zhuǎn)寫或人工轉(zhuǎn)寫。轉(zhuǎn)寫后進(jìn)行校對,并標(biāo)注語言與副語言信息,然后將音視頻與文字對齊。標(biāo)注時(shí)需要注意:(1)段對齊與句對齊的差別;(2)統(tǒng)一語言信息標(biāo)注原則,如詞性、標(biāo)點(diǎn)等;(3)統(tǒng)一副語言信息的標(biāo)注原則,如口頭語、停頓、語調(diào)變化等。
第四,整合。將標(biāo)注、對齊完畢的材料統(tǒng)一存儲,根據(jù)教學(xué)、研究需要,利用語料庫軟件進(jìn)行調(diào)取,并做好文本備份。
五、思考與討論
基于競賽資源建立的口譯學(xué)習(xí)者語料庫對口譯教學(xué)與研究具有非常重要的現(xiàn)實(shí)意義。
第一,彌補(bǔ)教學(xué)資源陳舊,豐富口譯訓(xùn)練模式。傳統(tǒng)口譯教材出版周期長,訓(xùn)練材料時(shí)效性低??谧g比賽的主題豐富,大多取材于國際時(shí)事、政治演講、文化交流和新興技術(shù)等方面,涵蓋政治、經(jīng)濟(jì)、文化、教育、科技等多個(gè)領(lǐng)域,且材料考察目的性強(qiáng),具有代表性。比賽中口譯的形式多樣,不拘泥于交替?zhèn)髯g,還包括主旨口譯、對話口譯、同聲傳譯等。應(yīng)用時(shí),可滿足不同訓(xùn)練目標(biāo),進(jìn)行調(diào)取,如進(jìn)行聽辨信息、記憶、筆記、邏輯表達(dá)等訓(xùn)練。因此,口譯學(xué)習(xí)者語料庫不僅適用于培訓(xùn)競賽選手,更重要的是,可以在日常教學(xué)培訓(xùn)中,彌補(bǔ)口譯教材陳舊、語料過時(shí)等問題,為教師和學(xué)生提供大量新鮮素材。學(xué)生觀摩欣賞不同級別的選手表現(xiàn),可以進(jìn)行評價(jià)、對比分析,發(fā)掘優(yōu)勢,取長補(bǔ)短。
第二,為口譯研究提供新的突破口。王斌華(2019,75)指出早期的口譯質(zhì)量評估多依靠問卷調(diào)查,近期研究者意識到評估口譯需要對口譯活動(dòng)、源語言、目標(biāo)語言等多種信息進(jìn)行綜合評估??谧g學(xué)習(xí)者語料庫不僅提供了平行雙語文本的對齊標(biāo)注,而且還具備副語言信息和現(xiàn)場音視頻,為口譯綜合全面評估提供了必要的研究基礎(chǔ)??谧g研究的綜述文獻(xiàn)顯示,傳統(tǒng)口譯研究對語言能力、口譯技巧、口譯教學(xué)等本體論研究較多,且國內(nèi)研究以思辨性研究為主(胡庚申,2019;任文、黃娟,2019)。在基于口譯比賽內(nèi)容的語料庫中,全國性口譯比賽一般會經(jīng)過校級、省級、大區(qū)和全國級別的比賽,層層選拔,對象能力梯度明顯,選手的口譯質(zhì)量、邏輯表述、現(xiàn)場應(yīng)變等能力差異較大,非常適合抽樣和量化研究??梢娫摲N語料庫為口譯研究提供了豐富的研究對象、新的研究思路與方法。
六、結(jié)語
口譯比賽在國內(nèi)已經(jīng)進(jìn)行了10年之久,積累了相當(dāng)多的語料資源,將這些資源通過細(xì)致的分類與梳理,建立標(biāo)準(zhǔn)化、標(biāo)注規(guī)則統(tǒng)一口譯學(xué)習(xí)者語料庫,充分利用多主題、多層次的語料,有助于口譯學(xué)習(xí)者、口譯教育工作者進(jìn)一步完善口譯教學(xué)、口譯研究和口譯學(xué)習(xí)。
參考文獻(xiàn):
[1]胡庚申.我國口譯研究40年(1978-2018)[J].外語教學(xué)與研究,2019,51(6):938—948,961.
[2]胡開寶,陶慶.漢英會議口譯語料庫的創(chuàng)建與應(yīng)用研究[J].中國翻譯,2010,31(5):49—56,95.
[3]梁茂成,李文中,許家金.語料庫應(yīng)用教程[M].北京:外語教學(xué)與研究出版社,2010.
[4]任文,黃娟.中國口譯研究熱點(diǎn)與趨勢探析(2008—2018)[J].中國翻譯,2019,40(5):37—47.
[5]王斌華.語料庫口譯研究——口譯產(chǎn)品研究方法的突破[J].中國外語,2012,9(3):94—100.
[6]王斌華.口譯理論研究[M].北京:外語教學(xué)與研究出版社,2019.
[7]文秋芳,王金銓.中國大學(xué)生英漢漢英口筆譯語料庫[M].北京:外語教學(xué)與研究出版社,2008.
編輯∕李夢迪