• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      《翻譯驅(qū)動(dòng)型語料庫》述評(píng)*

      2014-03-11 09:04:00江蘇師范大學(xué)北京師范大學(xué)張繼光天津外國(guó)語大學(xué)王少爽
      語料庫語言學(xué) 2014年2期
      關(guān)鍵詞:平行語料庫工具

      江蘇師范大學(xué)/北京師范大學(xué) 張繼光 天津外國(guó)語大學(xué) 王少爽

      Federico Zanettin.2012.Translation-driven Corpora: Corpus Resources for Descriptive and Applied Translation Studies.Manchester: St.Jerome Publishing.xii+244pp.

      《翻譯驅(qū)動(dòng)型語料庫》述評(píng)*

      江蘇師范大學(xué)/北京師范大學(xué) 張繼光 天津外國(guó)語大學(xué) 王少爽

      Federico Zanettin.2012.Translation-driven Corpora: Corpus Resources for Descriptive and Applied Translation Studies.Manchester: St.Jerome Publishing.xii+244pp.

      1.引言

      自Baker(1993)倡導(dǎo)將語料庫運(yùn)用于翻譯研究,至今已過20年。在此期間,語料庫已成為翻譯工作的一種重要輔助工具,基于語料庫的研究方法也已逐漸發(fā)展為描寫翻譯研究的主流,語料庫技術(shù)應(yīng)用被眾多翻譯院系定為譯者培訓(xùn)課程的重點(diǎn)內(nèi)容之一。同時(shí),諸如翻譯記憶(TM)系統(tǒng)、基于統(tǒng)計(jì)的機(jī)器翻譯系統(tǒng)(MT)等翻譯輔助工具越來越倚重語料庫。語料庫是當(dāng)今眾多語言服務(wù)提供商不可或缺的工具,也是目前翻譯云建設(shè)的關(guān)鍵技術(shù)。語料庫方法被視為翻譯研究的一種新范式,并有學(xué)者提出“語料庫翻譯學(xué)”的概念(王克非 2006;胡開寶2011),不少以此為主題的著述陸續(xù)出版。

      2012年英國(guó)St.Jerome出版社推出了《翻譯驅(qū)動(dòng)型語料庫》一書。該書副標(biāo)題為《描寫及應(yīng)用翻譯研究的語料庫資源》。該書作者是著名語料庫翻譯學(xué)研究者Federico Zanettin。書中介紹了語料庫翻譯學(xué)在過去20年所取得的成果,全景式地介紹了語料庫創(chuàng)建常見工具及其研究應(yīng)用,對(duì)于當(dāng)前翻譯研究具有重要指導(dǎo)意義。本文首先分述各章主要內(nèi)容,然后評(píng)述其學(xué)術(shù)貢獻(xiàn)與寫作特點(diǎn),最后探討該書對(duì)于國(guó)內(nèi)語料庫翻譯學(xué)研究的啟示。

      2.內(nèi)容概述

      該書共八章。第二至第七章,每章分別關(guān)注語料庫創(chuàng)建及使用中的一些具體問題,同時(shí)設(shè)置有實(shí)踐任務(wù)、延伸閱讀書目、在線語料庫資源鏈接等。

      第一章“引言”概述了此書的主要內(nèi)容及配套的光盤資源。電子文本和文本分析工具為從事學(xué)術(shù)研究的學(xué)者及語言服務(wù)提供商帶來了許多寶貴的機(jī)會(huì),但如何使用這些資源卻對(duì)專家學(xué)者們構(gòu)成了不小的挑戰(zhàn)。本書旨在幫助研究者應(yīng)對(duì)挑戰(zhàn),充分利用語料庫工具開展相關(guān)研究及應(yīng)用。

      第二章“語料庫語言學(xué)與翻譯研究”介紹了幾種常見語料庫及語料庫語言學(xué)在翻譯研究中的運(yùn)用。該書重點(diǎn)關(guān)注“翻譯驅(qū)動(dòng)型語料庫”,即基于與翻譯相關(guān)的目的而創(chuàng)建、使用的語料庫。翻譯驅(qū)動(dòng)型語料庫一般包括兩個(gè)或更多的子語料庫,可以對(duì)它們進(jìn)行比較和對(duì)比,以發(fā)現(xiàn)源語和目標(biāo)語的異同之處,揭示譯語文本獨(dú)特的語言特征,或用來研究翻譯風(fēng)格和體裁;翻譯驅(qū)動(dòng)型語料庫還可以用來調(diào)查特定人員所使用的翻譯語言,比較其異同。本章還論及了如何利用語料庫研究譯作規(guī)律(翻譯共性)、譯者規(guī)律(譯者風(fēng)格)和語言規(guī)律,接著回顧了幾個(gè)常用于翻譯教學(xué)的語料庫,最后簡(jiǎn)述了語料庫在機(jī)輔翻譯和計(jì)算語言學(xué)中的運(yùn)用。

      第三章“語料庫設(shè)計(jì)與語料獲取”簡(jiǎn)介了語料庫建設(shè)的各個(gè)步驟,論述了語料庫規(guī)模及構(gòu)成等方面問題,包括單語語料庫、雙語語料庫和多語語料庫的設(shè)計(jì)和標(biāo)準(zhǔn),還涉及了這些標(biāo)準(zhǔn)與翻譯驅(qū)動(dòng)型語料庫之間的關(guān)系,以及如何獲得語料。Zanettin指出,語料庫設(shè)計(jì)首先需要考慮的是規(guī)模,而語料庫的規(guī)模以及設(shè)計(jì)標(biāo)準(zhǔn)取決于創(chuàng)建該語料庫的目的。語料庫設(shè)計(jì)的第二大問題是語料庫構(gòu)成。Zanettin以英語-意大利雙語雙向平行語料庫CEXI作為個(gè)案,研究具體闡述翻譯驅(qū)動(dòng)型語料庫的設(shè)計(jì)問題。采用紙質(zhì)文本電子化的傳統(tǒng)方式建立大型語料庫成本高昂,Zanettin大力提倡借助互聯(lián)網(wǎng)資源來創(chuàng)建語料庫,并重點(diǎn)推薦了創(chuàng)建網(wǎng)絡(luò)語料庫的工具WebCONC。另外還介紹了WebCorp Live、Wacky!、BootCaT等工具及應(yīng)用。把互聯(lián)網(wǎng)作為語料庫資源使用,有兩種方法:第一種是把網(wǎng)絡(luò)作為宏觀語料庫,設(shè)置一定參數(shù),把檢索范圍限制在網(wǎng)絡(luò)中的一個(gè)小領(lǐng)域,這與在語料庫中設(shè)置參數(shù)選擇子語料庫的做法類似;第二種方法是把互聯(lián)網(wǎng)作為語料庫素材的來源,也就是從互聯(lián)網(wǎng)上選擇文本,然后把它們收錄到大型的、魯棒的語料庫(robust corpora)中。

      第四章“語料編碼與標(biāo)注”重點(diǎn)關(guān)注用于描寫翻譯學(xué)的語料庫的標(biāo)注方法及標(biāo)準(zhǔn)。Zanettin談到電子文本編碼的發(fā)展歷程,推薦使用UTF-8作為當(dāng)前語料庫建設(shè)的恰當(dāng)編碼格式。單詞層次最常見的標(biāo)注是詞性標(biāo)注和詞形還原。另外,還可以對(duì)文本進(jìn)行語義、語篇標(biāo)注。多語語料庫標(biāo)注可以涉及其他的文本或語言學(xué)信息,如譯文的源語信息、源語文本與目標(biāo)語文本的對(duì)應(yīng)情況、某個(gè)單詞的詞義或標(biāo)準(zhǔn)的翻譯對(duì)等語。Zanettin指出,是否標(biāo)注及標(biāo)注的程度取決于研究目的,用于描寫翻譯研究的標(biāo)注的程度應(yīng)該是位于“完全不標(biāo)注”和“極其細(xì)致的標(biāo)注”兩極之間。作者介紹了兩種通用語料庫標(biāo)注標(biāo)準(zhǔn):“文本編碼計(jì)劃”(TEI)指南和“可擴(kuò)展標(biāo)記語言語料庫附碼標(biāo)準(zhǔn)”(XCES)。講述了在TEI標(biāo)注框架里如何對(duì)翻譯驅(qū)動(dòng)語料庫進(jìn)行標(biāo)注,重點(diǎn)是三類信息的標(biāo)注:語料庫整體文本的文獻(xiàn)信息、語料庫中每個(gè)文本的文獻(xiàn)信息、文本本身的結(jié)構(gòu)信息。前面講到的標(biāo)注都是和文本在一起,放在方括號(hào)里面的,這是“文本內(nèi)”標(biāo)注(inline annotation)。作者還介紹了另外一種標(biāo)注模式,即分離式標(biāo)注(standalone annotation)。進(jìn)行分離式標(biāo)注,不同層次的標(biāo)注被記錄下來、然后和正文文本分開保存。Zanettin認(rèn)為分離式的XML標(biāo)注具有光明的前景,因其有助于語料庫資源的互通與分享。章末結(jié)論建議,為了讓研究者能夠共享語料庫資源,學(xué)界很有必要采用一個(gè)通用的標(biāo)注標(biāo)準(zhǔn)。

      第五章“語料庫工具及語料庫分析”首先分別介紹了用于創(chuàng)建、管理及分析語料庫的軟件工具,然后將重點(diǎn)放在語料庫分析方面。一些常見的語料庫分析工具和技術(shù)通過實(shí)例展示出來,讓讀者清楚地了解它們?nèi)绾谓沂菊Z料庫的詞匯模式,例如搭配、類聯(lián)接、語義傾向、語義韻、語義關(guān)聯(lián)等。索引工具幫助研究者揭示語料庫的語言和文本信息。語料庫提供的實(shí)證證據(jù)使得用戶能夠更容易識(shí)別語言、文本行為的模式,證實(shí)或證偽自己的直覺。通過提取索引行并對(duì)之進(jìn)行歸類,用戶可以搜集到某個(gè)單詞的詞匯環(huán)境信息,也就是它的搭配概貌。但是檢索詞必須要表達(dá)準(zhǔn)確,否則搜索結(jié)果會(huì)出現(xiàn)“噪音”(noise,無關(guān)信息)或“緘默”(silence,遺漏信息)。本章重點(diǎn)介紹了用于提取類聯(lián)接關(guān)系的程序Sketch Engine。該軟件最大的特色是“詞匯素描”,它可以自動(dòng)總結(jié)一個(gè)單詞的語法和搭配行為?;バ畔ⅰ值、T值、對(duì)數(shù)似然率等用來計(jì)算搭配顯著性的幾種統(tǒng)計(jì)學(xué)方法及其各自適用的范圍,在本章也作了詳細(xì)說明。

      第六章“創(chuàng)建多語語料庫”闡述了雙語平行語料庫的創(chuàng)建與應(yīng)用。Zanettin首先比較了可比語料庫與平行語料庫,然后概述了平行語料庫句子對(duì)齊的步驟及所使用工具,通過引用各種平行語料庫創(chuàng)建過程中的例子詳述了平行語料庫處理方面的問題。多語平行語料庫OPUS被用來作為個(gè)案研究,討論了可以用來創(chuàng)建對(duì)齊版本的平行語料庫所需的工具及創(chuàng)建步驟。接著又討論了平行語料庫與翻譯記憶的差別,以及在可比語料庫和平行語料庫中的“詞語對(duì)齊”。Zanettin介紹了兩類對(duì)齊方法,一類基于長(zhǎng)度,另一類基于內(nèi)容?;陂L(zhǎng)度的對(duì)齊依靠計(jì)算一對(duì)文本里單詞、句子的數(shù)量,利用統(tǒng)計(jì)學(xué)方法計(jì)算它們之間的關(guān)系。第二種方法是基于“類符”而非“形符”。這種方法的雙語對(duì)齊是通過“錨點(diǎn)”建立起聯(lián)系,一種特別的錨點(diǎn)詞是語料庫的結(jié)構(gòu)標(biāo)注。Zanettin推薦了ParaConc Aligner和Alinea兩種常見的語料庫對(duì)齊工具。

      第七章“使用多語語料庫”論述了在描寫翻譯研究、應(yīng)用翻譯研究中用于對(duì)多語語料庫開展研究的工具和技術(shù)手段,并解決了索引行的展示與分析等相關(guān)問題。在概述了用于檢索平行語料庫和提取平行索引行的一些工具之后,接著用兩個(gè)個(gè)案研究讓讀者了解利用平行語料庫可開展的各種分析??砷_展的分析種類取決于語料標(biāo)注的層次、用來提取及展示索引行的工具。最后簡(jiǎn)析了職業(yè)譯者如何利用多語語料庫資源??杀日Z料庫與平行語料庫可以幫助譯者解決一些用其他方法無法解決的問題。本章介紹了用于檢索ENPC語料庫的TCE應(yīng)用程序以及用于檢索COMPARA語料庫的DISPARA應(yīng)用程序,以及WordSmith和MultiConcord這兩個(gè)索引工具,并重點(diǎn)講解了ParaConc的使用方法。

      第八章“結(jié)論”預(yù)測(cè)未來電腦技術(shù)的發(fā)展給語料庫創(chuàng)建及分析帶來的影響,并對(duì)基于語料庫的翻譯研究項(xiàng)目的未來發(fā)展方向提出建議。Zanettin指出,基于語料庫的翻譯研究是一項(xiàng)眾人參與的事業(yè),它的發(fā)展前景取決于現(xiàn)在面臨的一些問題能否成功解決,其中最主要的問題在于是否有合適的語料庫資源及工具。

      3.簡(jiǎn)評(píng)

      《翻譯驅(qū)動(dòng)型語料庫:描寫及應(yīng)用翻譯研究的語料庫資源》反映了語料庫翻譯學(xué)領(lǐng)域的發(fā)展歷程及最新成果,系統(tǒng)總結(jié)了語料庫翻譯學(xué)中的各種常見工具、程序及研究方法,對(duì)于語料庫翻譯學(xué)研究的深入拓展具有重要意義。本書體現(xiàn)了Zanettin對(duì)語料庫翻譯學(xué)的研究方法與工具的系統(tǒng)化思考,其寫作特色主要體現(xiàn)在以下三個(gè)方面:

      第一,概念新穎,講解到位。在本書中,Zanettin提出了一些新概念、新術(shù)語,并介紹了一些不太為普通讀者所熟悉的專業(yè)術(shù)語,對(duì)這些術(shù)語進(jìn)行了清晰的解釋。譬如,本書的書名是“翻譯驅(qū)動(dòng)型語料庫”,這本身就是一個(gè)新術(shù)語。語料庫語言學(xué)領(lǐng)域一直存在兩種研究范式:基于語料庫的研究(corpus-based studies)和語料庫驅(qū)動(dòng)的研究(corpus-driven studies)。梁茂成(2012)系統(tǒng)分析了這兩種研究范式,指出二者具有不同應(yīng)用領(lǐng)域。本書提出的“翻譯驅(qū)動(dòng)型語料庫”,是指出于與翻譯相關(guān)的目的而創(chuàng)建、使用的語料庫?!胺g驅(qū)動(dòng)型語料庫”和上文提到的兩種研究范式屬于不同的概念。但是“翻譯驅(qū)動(dòng)型語料庫”與“基于語料庫的翻譯研究”、“語料庫驅(qū)動(dòng)的翻譯研究”又有密切聯(lián)系,“翻譯驅(qū)動(dòng)型語料庫”既可用于“基于語料庫的翻譯研究”,也可用于“語料庫驅(qū)動(dòng)的翻譯研究”。

      第二,涵蓋面廣,信息量大。本書文獻(xiàn)信息豐富,系統(tǒng)總結(jié)了前人在相關(guān)領(lǐng)域已開展的研究,全面介紹了語料庫翻譯學(xué)能夠用到的各種資源、工具。Zanettin對(duì)語料庫設(shè)計(jì)、語料搜集、語料庫編碼與標(biāo)注、語料索引與分析等語料庫創(chuàng)建與使用的全過程,均進(jìn)行了詳細(xì)的介紹與說明,重點(diǎn)講解了利用互聯(lián)網(wǎng)創(chuàng)建語料庫的相關(guān)工具及注意事項(xiàng)。該書體現(xiàn)了語料庫翻譯學(xué)領(lǐng)域的最新研究進(jìn)展。

      第三,編排合理,可讀性強(qiáng)。本書內(nèi)容安排合理,由易到難、循序漸進(jìn),幫助讀者從理解該學(xué)科最為基礎(chǔ)的概念入手,逐步過渡到復(fù)雜的概念及應(yīng)用程序。Zanettin采用理論與實(shí)踐相結(jié)合的方式,方便讀者掌握相關(guān)的工具及程序,具體體現(xiàn)在三個(gè)方面:第一,在講解工具手段時(shí),作者一般都會(huì)運(yùn)用實(shí)際例子及圖示的方式說明其應(yīng)用方法,方便讀者理解;第二,借助個(gè)案研究,詳細(xì)說明前人在創(chuàng)建及分析語料庫時(shí)遇到的問題及解決方法,針對(duì)性強(qiáng);第三,每章均精心設(shè)有配套任務(wù),讓讀者親自動(dòng)手實(shí)踐,真正掌握新學(xué)到的研究方法及工具,可操作性很強(qiáng)。另外,本書還提供了光盤,收錄了書中提到的免費(fèi)工具、在線網(wǎng)絡(luò)資源的鏈接以及任務(wù)部分的材料,這大大方便了讀者開展研究實(shí)踐。

      4.對(duì)我國(guó)語料庫翻譯研究的啟示

      在國(guó)內(nèi),雖然使用語料庫方法研究翻譯現(xiàn)象已經(jīng)取得了豐碩的成果,但語料庫翻譯學(xué)如何深入開展,是目前我們面臨的主要課題。該書對(duì)于國(guó)內(nèi)語料庫翻譯學(xué)研究具有很強(qiáng)的指導(dǎo)意義。

      一方面,國(guó)內(nèi)學(xué)界應(yīng)與國(guó)際學(xué)界接軌,積極創(chuàng)建網(wǎng)絡(luò)語料庫。目前國(guó)內(nèi)基于互聯(lián)網(wǎng)的語料庫建設(shè)項(xiàng)目發(fā)展相對(duì)滯后,雖然國(guó)內(nèi)已創(chuàng)建了多個(gè)大型語料庫,但是基本上都是采取傳統(tǒng)方式而建,極其費(fèi)時(shí)費(fèi)力。利用互聯(lián)網(wǎng)資源創(chuàng)建大型參照語料庫和平行語料庫,可以節(jié)省寶貴的人力、物力、財(cái)力,同時(shí)版權(quán)限制也比紙質(zhì)版的相對(duì)要小。國(guó)內(nèi)已有部分學(xué)者開始利用互聯(lián)網(wǎng)資源創(chuàng)建語料庫,并取得了初步成功。熊文新(2013)從互聯(lián)網(wǎng)采集“中外對(duì)話”雙語環(huán)保類文章,創(chuàng)建了平行語料庫。他通過頁面分析,利用正則表達(dá)式提煉網(wǎng)頁中的正文文本部分,并以純文本格式保存各個(gè)文檔,“實(shí)驗(yàn)僅耗時(shí)330分鐘,就積累了500多萬字詞特定領(lǐng)域的高質(zhì)量語料”(同上:133)。

      另一方面,我們應(yīng)善用工具,但不能過于迷信工具。基于語料庫的研究現(xiàn)在受人追捧,但務(wù)必牢記語料庫只是一種工具和手段,應(yīng)充分認(rèn)識(shí)語料庫的局限性,避免陷入盲信語料庫數(shù)據(jù)的窠臼?;谀骋徽Z料庫研究發(fā)現(xiàn)的結(jié)果不僅需要其他語料庫的數(shù)據(jù)進(jìn)行多元互證(triangulation),同時(shí)需要利用語料庫以外的知識(shí)進(jìn)行評(píng)估,例如語料庫收錄文本在創(chuàng)作時(shí)的特定編輯及出版狀況。語料庫工具呈現(xiàn)的數(shù)據(jù)最終還是得由人去分析、解釋。Tymoczko(1998)就曾提醒我們:“基于語料庫的翻譯研究切勿自降身價(jià),陷入盲目的搜尋量化證據(jù),這已經(jīng)侵蝕了很多‘科學(xué)研究’,使它們變得荒謬、空洞。使用語料庫翻譯學(xué)工具和研究方法的研究者必須避免求穩(wěn)這個(gè)心態(tài),檢索語料庫及強(qiáng)大的電子文檔不能僅僅是為了證明很明顯的道理或給出讓人信服的量化數(shù)據(jù),這都是沒有真正必要的。簡(jiǎn)言之,付出了很多時(shí)間與金錢,結(jié)果證實(shí)的卻是憑常識(shí)都知道的事?!?/p>

      概而言之,《翻譯驅(qū)動(dòng)型語料庫》一書較為全面地考察了翻譯研究的語料庫方法及所用到的各種工具資源,有望為國(guó)內(nèi)語料庫翻譯學(xué)提供研究方法和思路上的指導(dǎo),同時(shí)亦對(duì)語料庫在翻譯實(shí)踐及研究中的應(yīng)用層面具有重要參考價(jià)值。

      Baker, M.1993.Corpus linguistics and translation studies: Implications and applications [A].In M.Baker, G.Francis & E.Tognini-Bonelli (eds.).Text and Technology: In Honour of John Sinclair[C].Amsterdam: John Benjamins.233-250.

      Tymoczko, M.1998.Computerized corpora and the future of translation studies [J].Meta43(4): 452-459.

      胡開寶,2011,《語料庫翻譯學(xué)概論》[M]。上海:上海交通大學(xué)出版社。

      梁茂成,2012,語料庫語言學(xué)研究的兩種范式:淵源、分歧及前景 [J],《外語教學(xué)與研究》(3):323-335。

      熊文新,2013,Web、語料庫與雙語平行語料庫的建設(shè) [J],《圖書情報(bào)工作》(10):128-135。

      王克非,2006,語料庫翻譯學(xué)——新研究范式 [J],《中國(guó)外語》(3):8-9。

      通信地址:221116 江蘇省徐州市江蘇師范大學(xué)外國(guó)語學(xué)院/100875 北京市北京師范大學(xué)外文學(xué)院(張繼光)

      050031 天津市天津外國(guó)語大學(xué)中央文獻(xiàn)翻譯研究基地/河北省石家莊市石家莊經(jīng)濟(jì)學(xué)院外國(guó)語學(xué)院(王少爽)

      * 本研究得到教育部人文社會(huì)科學(xué)研究基金項(xiàng)目“基于語料庫的當(dāng)代英語散文漢譯文本研究”(12YJC740137)、江蘇省社會(huì)科學(xué)基金項(xiàng)目“葛浩文譯作特征描述性研究”(13WWC011)和江蘇省省高校哲學(xué)社會(huì)科學(xué)研究基金項(xiàng)目“基于語料庫的當(dāng)代英語散文漢譯研究”(2011SJD740024)的資助。

      猜你喜歡
      平行語料庫工具
      向量的平行與垂直
      平行
      逃離平行世界
      波比的工具
      波比的工具
      《語料庫翻譯文體學(xué)》評(píng)介
      “巧用”工具
      讀者(2017年18期)2017-08-29 21:22:03
      把課文的優(yōu)美表達(dá)存進(jìn)語料庫
      再頂平行進(jìn)口
      汽車觀察(2016年3期)2016-02-28 13:16:36
      基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      化州市| 龙口市| 布拖县| 阜城县| 文水县| 阿荣旗| 永清县| 延庆县| 石柱| 黄龙县| 四川省| 高青县| 盐山县| 紫阳县| 湄潭县| 三亚市| 兰西县| 崇左市| 海阳市| 鄂温| 崇明县| 万州区| 青田县| 丹巴县| 庐江县| 荥经县| 阿拉善左旗| 景谷| 大港区| 高州市| 弋阳县| 商丘市| 东城区| 广东省| 五家渠市| 新疆| 武山县| 洪泽县| 修水县| 高密市| 靖州|