宋亞軍
(河南工學院 外語系,河南 新鄉(xiāng) 453003)
小型旅游英漢雙語平行語料庫的創(chuàng)建及教學應(yīng)用
宋亞軍
(河南工學院 外語系,河南 新鄉(xiāng) 453003)
當今語料庫已經(jīng)應(yīng)用在多個學科領(lǐng)域,也得到學者們越來越多的重視,但是具有地方特色,能夠服務(wù)地方發(fā)展的小型雙語平行語料庫的獨特優(yōu)勢和應(yīng)用價值還需繼續(xù)挖掘。文章以一個小型旅游英漢雙語平行語料庫的創(chuàng)建及其在教學中的應(yīng)用表明,雙語平行語料庫在專門用途英語教學上也有著廣闊的使用前景。關(guān)鍵詞:專門用途英語;雙語平行語料庫;英語教學
毋庸置疑,語料庫語言學的持續(xù)發(fā)展不僅加強了學科之間的聯(lián)系,如語料庫翻譯學、語料庫與二語習得、話語研究、機器翻譯等,同時它也提供了獨具特色的量化研究方法,使得計算機技術(shù)可快速、準確、高效地處理大批量數(shù)據(jù),來幫助人們解決多維度、深層次的語言問題。
盡管有些國際學者對平行語料庫和可比語料庫的概念還存在爭議[1]19,但國內(nèi)普遍認為平行語料庫是指收錄某一源語語言文本及其對應(yīng)的目的語文本的語料庫[2]33。王克非也指出平行語料庫是由源語文本及其平行對應(yīng)的譯語文本構(gòu)成的雙語語料庫[3]6。而專門用途雙語平行語料庫是依據(jù)某一特定學科或?qū)I(yè)領(lǐng)域而建立的雙語對應(yīng)語料庫,其立足點是語料來源于某一學科或者專業(yè)[4]。相比通用語料庫,專門用途語料庫在專業(yè)詞典編撰、學科語言研究及教學方面的優(yōu)勢是很明顯的,但是受限于語料庫資源的匱乏、語料庫建設(shè)困難等原因,專門用途語料庫的建設(shè)和研究發(fā)展緩慢,而且面臨很多的問題和挑戰(zhàn)。本文在梳理國內(nèi)專門用途平行語料庫研究現(xiàn)狀基礎(chǔ)上,詳細描述建設(shè)專門用途語料庫的具體方法及專門用途語料庫的教學應(yīng)用。
自從20世紀90年代世界上第一個雙語平行語料庫——加拿大議會會議錄英法平行語料庫建成后,經(jīng)過20多年的發(fā)展,雙語平行語料庫在技術(shù)開發(fā)、詞典編撰及語言研究方面都取得了很大的發(fā)展。國內(nèi)在平行語料庫建設(shè)方面也有不少建樹,建成了不少大型平行語料庫,如:北京外國語大學王克非等創(chuàng)建的3000萬字/詞通用漢英平行語料庫,上海交通大學胡開寶等學者創(chuàng)建的1000萬字/詞英漢醫(yī)學平行語料庫[5],以及香港理工大學和北京外國語大學學者共同創(chuàng)建的約100萬字/詞的英漢旅游文本語料庫等[6]。
但這些雙語語料庫出于建庫類型、研究目的及最終用戶等因素的影響,在具體學科教學方面尚有限制,筆者在中國知網(wǎng)以“平行語料庫”為主題詞查詢發(fā)現(xiàn),近些年關(guān)于平行語料庫研究雖呈增長趨勢,尤其從2015開始每年論文發(fā)表篇數(shù)都已過百,但和通用語料庫研究相比還存在許多不足之處:(1)語料庫建設(shè)過多,口語及專門領(lǐng)域研究很少;(2)學科領(lǐng)域分布不均勻,尚有很多學科沒有適合的語料庫;(3)資源共享困難,存在重復(fù)建設(shè)現(xiàn)象;(4)關(guān)于文學和翻譯的研究較多,具體學科教學實踐的應(yīng)用研究較少。
本課題組地處河南,河南省旅游資源豐富,省政府也十分重視旅游資源的開發(fā)和利用,在河南省國民經(jīng)濟和社會發(fā)展“十三五”規(guī)劃綱要中也強調(diào)要依托建設(shè)鄭汴洛焦國際文化旅游名城,打造一批文化旅游、鄉(xiāng)村旅游、生態(tài)旅游、紅色旅游、特色旅游精品線路和品牌景區(qū),塑造國際國內(nèi)旅游形象品牌。但河南旅游外宣資料還有不足之處,語言使用還有很多問題[7]?;诖?,本研究依托地方資源和優(yōu)勢,試圖建設(shè)適合地方發(fā)展的小型專門旅游雙語平行語料庫,探討面向教學的平行語料庫建設(shè),以期幫助河南旅游事業(yè)培養(yǎng)更多的后備人才。
雙語平行語料庫建設(shè)不同于單語語料庫建設(shè),在收集語料、語料對齊及整理方面比較復(fù)雜,本研究歷時半年建成了25萬字/詞小型旅游英漢雙語平行語料庫。語料庫的建設(shè)經(jīng)歷了語料庫設(shè)計、語料收集和語料整理三個步驟,現(xiàn)將語料庫建設(shè)情況介紹如下:
2.1 語料庫的總體設(shè)計
語料庫的建設(shè)規(guī)模要依據(jù)研究目的來確定,并非越大越好,小型但具有較強針對性的語料庫也能達到應(yīng)有的研究目的。Tribble認為大型語料庫由于其范圍較廣、數(shù)據(jù)龐雜而并不適合專門用途英語學習,也無法對教師和學生提供直接有效的幫助。Flowerdew認為一般的小型語料庫規(guī)模達到25萬字/詞就夠了[8]67。由于本語料庫設(shè)計目的主要是為了研究當?shù)芈糜挝谋镜恼Z言特點、揭示翻譯方法和策略,以幫助學生和教師了解并熟悉行業(yè)用語并提高他們的語言應(yīng)用水平,從而為旅游事業(yè)發(fā)展提供語言支持和幫助。在加上地域和時間的限制,本語料庫所定的初始規(guī)模25萬字/詞應(yīng)該可以滿足教學需求。
2.2 語料收集
語料收集最主要的問題就是語料的代表性。語料庫的代表性指的是一個語料庫在多大程度上代表一種語言或語言變體中各種不同的語言現(xiàn)象[9]7。基于此,本語料庫語料來源主要是教材資料、正式出版物及互聯(lián)網(wǎng)資源。紙質(zhì)采集方法主要為掃描輸入,使用的工具為ABBYY FINEREADER12。
2.3 語料處理和加工
語料處理和加工主要包括語料降噪清理、元信息標記、分詞處理及語料對齊。語料降噪處理一般包括編碼轉(zhuǎn)換、格式規(guī)范及拼寫檢查等,目的是為了讓計算機準確地讀取數(shù)據(jù)。同時每個文本也會添加元信息,以方便記錄、了解文本屬性,如作者、主題、體裁、譯者、時間等信息。語料庫分詞處理和語料對齊對建設(shè)平行語料庫至關(guān)重要,目的是為了讓源語和目的語一一對應(yīng)起來,以方便存儲和提取語言間的對譯轉(zhuǎn)換信息[3]22。
平行語料庫常見的對齊方式是句級對齊,因為對翻譯意義單位提取仍存在技術(shù)困難[10],而分詞處理及句級對齊技術(shù)相對比較成熟。本語料庫所采用的對齊軟件為ABBYY Aligner,并輔助以人工校對,以TMX格式保存。平行語料庫檢索軟件用的是北京外國語大學中國外語與教育研究中心語料庫團隊開發(fā)的ParaConc軟件,為了適應(yīng)軟件需要,還要對生成的TMX文件進行分割處理,即利用正則表達式,把TMX文件分割成ASCII編碼的英語和漢語兩個TXT文本,并確保雙語對齊,以便ParaConc軟件后期檢索使用。
數(shù)據(jù)驅(qū)動學習(Data-driving Learning,簡稱DDL)是伯明翰大學學者Tim Johns提出來的,它的主要理念是引導學生基于大量的語料庫數(shù)據(jù),觀察、概括和歸納語言使用現(xiàn)象,自我發(fā)現(xiàn)語法規(guī)則、意義表達及語用特征[11]25。也就是說通過語料庫索引軟件,以“發(fā)現(xiàn)式”方法學習英語,再通過歸納總結(jié)的方法達到語言知識的建構(gòu)。同傳統(tǒng)外語教學相比,數(shù)據(jù)驅(qū)動教學模式具有以下主要優(yōu)勢:以學生的自主學習為主要的過程特征,以真實語言為主要語言輸入,強調(diào)探索和發(fā)現(xiàn)的學習過程,主張自下而上的歸納式的學習。同時在教學過程中驅(qū)動學習也會以學生自身需求為導向,鼓勵學生間的互助合作和共同探索。而對于旅游專業(yè)的學生而言,雙語平行語料庫可以在專業(yè)詞匯學習、翻譯實踐、寫作及口語學習方面發(fā)揮一定的作用。本課題研究中所使用的教學軟件是用于平行語料庫檢索的ParaConc軟件和單語語料庫檢索的PowerConc軟件,二者都是北京外國語大學中國外語與教育研究中心語料庫團隊開發(fā)的可免費使用的軟件。
3.1 平行語料庫用于專業(yè)詞匯學習
語料庫的資源和技術(shù)為學生們提供了一種自下而上的歸納式學習方法,學生首先可以接觸大量的真實語言,然后自己總結(jié)某些專業(yè)詞匯的主要用法和常見含義,并配以翻譯文本,從而達到雙語詞匯能力提高的目的。比如可以利用主題詞分析的方法,把旅游英語文本語料庫和本族語者的通用語料庫進行比對就可以提取旅游文本主題詞,并對重點主題詞進行語料庫驅(qū)動的學習,即學生們可以自行觀察索引行,通過不同例句猜測其不同意義和用法。如圖1所示。
教師還可以利用ParaConc軟件向大家展示中英同詞不同義或不同譯的情況,利用這些直觀的方式從視覺和聽覺上不斷刺激,達到讓學生積累詞匯的目的。
3.2 平行語料庫用于翻譯實踐
由于平行語料庫具有雙語對應(yīng)的特點,對翻譯教學有著得天獨厚的優(yōu)勢。如利用ParaConc和ABBYY Aligner軟件可以呈現(xiàn)許多真實對譯例句,教師可以讓學生們觀察例句并發(fā)現(xiàn)和總結(jié)翻譯特點,待學生們理解后,教師再對翻譯中出現(xiàn)的對譯、增譯、減譯和分譯等情況加以講解,這樣學生們理解起來就比較容易,再加以練習,就能達到熟練使用翻譯策略的目的。同樣,平行語料庫還可以起到詞典的作用,學生有什么不確定的翻譯,可以在語料庫中進行查詢,看相同或類似的問題是如何翻譯的,長期使用和學習就能提高旅游英語的實際翻譯能力。
圖1 主題詞檢索分析
圖2 同詞不同譯
3.3 平行語料庫用于口語練習和英語寫作
由于語料庫能提供海量的信息,同時針對本地區(qū)具體實際情況和參照本地區(qū)旅游文本,可以先為學生布置口語話題,如介紹新鄉(xiāng)市八里溝風景區(qū)的概況,讓學生自行尋找資料進行景區(qū)導游詞創(chuàng)作,待學生完成后再到語料庫中尋找該景區(qū)的介紹資料,并據(jù)此對自己創(chuàng)作的導游詞加以比對和修改,形成相對準確和適合學生的英語導游詞,再加以背誦和記憶,學生的語言功底和英語表達能力自然會提高,這種能力的提高也會體現(xiàn)在漢語的表達水平上。
同時導游詞的創(chuàng)作也是提高學生寫作水平的路徑之一。教師可以首先向?qū)W生介紹旅游文本的體裁特點、寫作原理和技巧,然后通過語料庫對文本在詞匯、語法和語篇層面的發(fā)現(xiàn),達到熟悉旅游寫作的句法和結(jié)構(gòu)特征的目的。然后進入寫作實踐階段,仍以某一地區(qū)景點為話題,通過學生寫作、自評(與語料庫文本比對)、學生互評、修正、評估的五個階段實現(xiàn)學生寫作水平的逐漸提高。
本文介紹了具有地方特色的小型旅游專門雙語平行語料庫的建設(shè)和教學應(yīng)用的情況,涉及語料庫建設(shè)的具體實施步驟和具體的教學應(yīng)用,其優(yōu)勢在于為科研工作者的建庫工作提供參考,同時又可以幫助學生提高詞匯學習的效率、掌握翻譯的技巧及策略、提高口譯和翻譯寫作實踐的能力,為地方旅游事業(yè)發(fā)展提供技術(shù)指導和人才服務(wù)支持。當然本研究還處于語料庫的初始使用階段,后期還可增加學生翻譯語料和全國旅游語料,同時還可以對具體翻譯現(xiàn)象,如錯誤翻譯進行標注,對語料庫進行詞性賦碼等,以探討更深層次的語法和翻譯問題,從而更好地服務(wù)日常教學和地方旅游事業(yè)的發(fā)展。
(責任編輯 楊文忠)
[1] Tony McEnery and Andrew Hardie. Corpus Linguistics: Method, Theory and Practice [M]. Oxford: Cambridge University Press,2012.
[2] 胡開寶.語料庫翻譯學概論[M].上海:上海交通大學出版社,2011.
[3] 王克非.雙語對應(yīng)語料庫:研制與應(yīng)用[M].北京:外語教學與研究出版社,上海:上海交通大學出版社,2004 .
[4] 崔維霞,王均松.國內(nèi)學科專業(yè)語料庫研究現(xiàn)狀及發(fā)展趨勢[J].西安外國語大學學報,2013,01(55).
[5] 管新潮,胡開寶,張冠男.英漢醫(yī)學平行語料庫的創(chuàng)建與初始應(yīng)用研究[J].當代外語研究,2011,09(36).
[6] 李艷輝.面向教學的化工類英漢雙語平行語料庫的構(gòu)建[J].吉林化工學院學報,2016,12(58).
[7] 宋亞軍.河南旅游英語外翻資料的語料庫分析[J].河南機電高等專科學校學報,2016,02(64).
[8] Anne O’Keeffe and Michael McCarthy The Routledge Handbook of Corpus Linguistics[M]. London:Routledge,2010.
[9] 梁茂成.什么是語料庫語言學[M].上海:上海外語教育出版社,2016.
[10] 李文中.平行語料庫設(shè)計及對應(yīng)單位識別[J].當代外語研究,2010,09(26).
[11] 衛(wèi)乃興,李文中,濮建忠,等.語料庫應(yīng)用研究[M].上海:上海外語教育出版社,2005.
The Construction and Application of Small Specialized Bilingual Paralleled Corpus
SONG Ya-jun
(Foreign Languages Department of Henan Institute of Technology, Xinxiang 453003, China)
Nowadays corpus technology has been applied in many areas and more and more scholars have found its value, but the unique advantage and application value of small bilingual paralleled corpus which has local characteristics and can serve local development are still being needed. Many facts indicate that bilingual paralleled corpus has more broadened application and potential value in specialized English teaching.
specialized English; bilingual paralleled corpus; English teaching
H319.3
A
1008–2093(2017)03–0070–04
2017-03-01
河南省教育廳人文社會科學研究項目(2017-ZDJH-035)
宋亞軍(1980―),男,山東德州人,講師,碩士,主要從事語料庫語言學及外語教學研究。