• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于語料庫的翻譯單位本體性研究

      2020-09-03 03:51:12李康熙
      關(guān)鍵詞:歧義語料庫譯文

      李康熙,孟 潔

      (合肥工業(yè)大學(xué) 外國語學(xué)院,合肥 230601)

      一、引 言

      眾所周知,文本的翻譯并非是逐詞進(jìn)行的。首先,單詞本質(zhì)上是多義的(polysemous),在脫離上下文語境時(shí)很難確定其具體涵義;其次,源語與目標(biāo)語的詞法、句法和語義體系不盡相同,因此多數(shù)情況下無法在詞匯層面上建立二者的一一對應(yīng)關(guān)系。鑒于以上事實(shí),翻譯學(xué)研究中引入了翻譯單位這個(gè)概念,用于描述譯者在翻譯過程中所使用的操作單位。

      不幸的是,盡管翻譯單位的概念很早即已提出[1]21,且在翻譯學(xué)研究中引起了足夠多的討論,但是由于研究方法上普遍缺乏對翻譯單位本體的重視,一定程度上造成了翻譯單位概念的混亂。彭長江[2]認(rèn)為某些學(xué)者“往往不明確否定巴氏[巴爾胡達(dá)羅夫]定義的核心,實(shí)際上將其拋棄,卻不為翻譯單位重新下定義”。司顯柱[3]也曾指出在翻譯單位問題上,各家立論之間彼此相互對立,互不相容。只有回歸翻譯單位的本體性研究,才有可能厘清翻譯單位的基本性質(zhì),并為后續(xù)研究提供準(zhǔn)確的概念參照體系。

      本研究擬轉(zhuǎn)變現(xiàn)有的翻譯單位研究的范式,通過語料庫定量研究方法來代替?zhèn)鹘y(tǒng)的定性研究方法來界定翻譯單位的內(nèi)涵與外延。在詳細(xì)對比各種翻譯單位定義的基礎(chǔ)上,本研究總結(jié)了翻譯單位的四種基本屬性,并據(jù)此對雙語平行語料庫中的翻譯單位進(jìn)行手工標(biāo)注。最后對標(biāo)注結(jié)果進(jìn)行統(tǒng)計(jì)分析,進(jìn)而加深人們對翻譯單位概念的本體性認(rèn)識。

      二、翻譯單位定義

      縱觀翻譯單位的研究歷史可見,早期的翻譯單位研究傾向于對翻譯單位給出明確的定義,其中具有代表性的定義及其翻譯如下:一是最小的話語片段,其全部符號結(jié)合得如此緊密以至于不可能分開翻譯[1]21。二是在譯文中能夠找到對應(yīng)物的源文單位,但它的組成部分單獨(dú)地在譯文中卻并沒有對應(yīng)物。換言之,翻譯單位就是源語在譯語中具備對應(yīng)物的最小(最低限度)的語言單位[4]。 三是最小的可以獨(dú)立于其他部分而作為一個(gè)整體翻譯的源文片段[5](1)此處為Newmark對Vinay & Darbelnet提出的翻譯單位定義的重新闡述。。四是譯者在翻譯時(shí)所關(guān)注的源文片段,該片段在目標(biāo)語中需要作為一個(gè)整體來對待[6]。五是翻譯過程中最小的無歧義的(源文)語言單位[7]。六是兩類(翻譯)單位稱為話語層翻譯的分析單位和轉(zhuǎn)換單位。話語層翻譯的分析單位指一個(gè)相對完整的語言材料,它能幫助我們對話語內(nèi)部、話語外部以及屬于理解語言心理機(jī)制等方面的非語言因素做出恰當(dāng)分析的單位。話語層翻譯的轉(zhuǎn)換單位指在譯文中能夠找到相應(yīng)的源語單位,不過它的組成部分不一定能在譯文中找到對應(yīng)物[8]。

      這些代表性的翻譯單位定義的共性是顯而易見的,即它們都認(rèn)為翻譯單位是源文的某一級語言單位,它由于某種因素在翻譯過程中作為一個(gè)整體來對待。這些定義還暗示著,翻譯單位并非一成不變地固定在詞匯這個(gè)級別,否則我們將沒有任何必要去研究這種翻譯現(xiàn)象。對比發(fā)現(xiàn),各翻譯單位定義之間的差異主要在于如何界定翻譯單位這個(gè)方面。本研究總結(jié)認(rèn)為,翻譯單位的定義屬性包括以下四個(gè)方面:

      一是緊密性(compactness),即源文某語言單位內(nèi)部各成分密不可分,因此不可以分開逐個(gè)翻譯或根據(jù)字面意思進(jìn)行翻譯。如上所述,Vinay和Darbelnet的翻譯單位(見定義一)就是根據(jù)緊密性來定義的。

      二是獨(dú)立性(independence),即源文某語言單位與上下文其他成分相對獨(dú)立,也就說無需參照上下文即可給出翻譯對應(yīng)物。獨(dú)立性可以看作是緊密性的對立面。前者從語言單位的外部特征來界定翻譯單位,后者則從語言單位的內(nèi)部屬性著手。根據(jù)定義,獨(dú)立性是Newmark的翻譯單位的根本特征。

      三是無歧義性(lack of ambiguity),即源文某語言單位在語義上是自足的。將無歧義性作為翻譯單位根本屬性的代表人物是Teubert[7,9]。他注意到很多詞匯單位都是多義性的,其具體意義取決于上下文語境,所以最小的可翻譯單位應(yīng)該是單詞和其相關(guān)的上下文語境的組合,這些上下文語境提供了消除詞匯歧義的所有必要信息。

      四是無對應(yīng)性(lack of correspondence),即源文某語言單位本身在譯文中有對應(yīng)物,但其下一級組成單位卻沒有對應(yīng)物。強(qiáng)調(diào)翻譯單位的無對應(yīng)性特征的代表人物是巴爾胡達(dá)羅夫。與基于源文分析的緊密性、獨(dú)立性和無歧義性特征不同,無對應(yīng)性特征不是根據(jù)源文各符號之間的銜接關(guān)系來判斷翻譯單位的?;跓o對應(yīng)性定義的翻譯單位是轉(zhuǎn)換性的,一切視源文某單位是否在譯文中具有對應(yīng)物而定。

      以上四種定義屬性分別從不同的角度來界定翻譯單位,體現(xiàn)了翻譯單位的多重特征。在翻譯的分析過程中,翻譯單位取決于源文某單位內(nèi)部各成分之間的緊密性、與上下文之間的獨(dú)立性、語義上的無歧義性等特征;而在翻譯的轉(zhuǎn)換過程中,翻譯單位則取決于該語言單位及其組成成分與譯文單位的對應(yīng)關(guān)系。對于同一源文單位,根據(jù)不同的定義屬性可能會(huì)得到不同的判定結(jié)果。通過下面的語料標(biāo)注過程和結(jié)果分析,我們可以清晰地發(fā)現(xiàn)這四種界定標(biāo)準(zhǔn)之間的區(qū)別和聯(lián)系。

      三、數(shù)據(jù)搜集及處理

      本研究劃分翻譯單位的標(biāo)準(zhǔn)是根據(jù)上文提到的四種定義屬性來制定的。其中,緊密性、獨(dú)立性和無歧義性三種屬性是作為一個(gè)整體來處理的。這主要是出于兩方面考慮:其一,三者都是從源文的角度來分析翻譯單位的,因此切分結(jié)果彼此重合之處很多;其二,緊密性與獨(dú)立性劃分標(biāo)準(zhǔn)的主觀性較強(qiáng),在實(shí)際操作時(shí)很難處理,而結(jié)合無歧義性標(biāo)準(zhǔn)之后則能夠獲得較為確切的分析結(jié)果。相對而言,無對應(yīng)性標(biāo)準(zhǔn)則是從源文與譯文的對比角度來分析翻譯單位的,與其他三種標(biāo)準(zhǔn)差異較大,因此本研究將其區(qū)別對待。

      本研究中翻譯單位的標(biāo)注語料來自NIST 2002機(jī)器翻譯評測項(xiàng)目的測試集[10]。該語料庫包括491對句珠,體裁全部為新聞?wù)Z料,見表1。

      表1 用于翻譯單位標(biāo)注的語料庫情況

      此語料庫中的所有句珠都是1∶1的對齊模式。這意味著在標(biāo)注過程中不可能出現(xiàn)比句子更大的翻譯單位的情況。對于每一對句珠,我們用中括號對英文中的翻譯單位進(jìn)行手工標(biāo)記。例如:

      此例是按照無對應(yīng)性標(biāo)準(zhǔn)來劃分翻譯單位的。其中,短語foreign military presence的各個(gè)組成部分在譯文中都有確定的對應(yīng)物,因此,根據(jù)無對應(yīng)性定義,此短語中的每個(gè)單詞都是翻譯單位。相反,如果根據(jù)緊密性或獨(dú)立性定義,foreign military presence整個(gè)短語可視為一個(gè)整體概念,因此更適合被標(biāo)記為一個(gè)短語層的翻譯單位。從無歧義性的角度看,foreign和military兩個(gè)詞基本上是單義的,但是presence卻是一個(gè)多義詞。只有根據(jù)上下文中的特征詞military才可以斷定它指的是軍隊(duì)進(jìn)駐,而不是一般意義上的出席或者存在。鑒于此,綜合緊密性、獨(dú)立性和無歧義性三種屬性的分析結(jié)果,本研究將foreign military presence標(biāo)注為一個(gè)基于源文分析(即綜合考慮緊密性、獨(dú)立性和無歧義性三個(gè)標(biāo)準(zhǔn))的翻譯單位,用中括號標(biāo)注如下:

      詞性標(biāo)注是語料預(yù)處理的常見步驟。本研究對英文和中文文本進(jìn)行詞性標(biāo)注的工具為Stanford POS Tagger工具包[11]。之所以使用詞性標(biāo)注工具是為了發(fā)現(xiàn)翻譯單位的統(tǒng)計(jì)分布與詞性之間的統(tǒng)計(jì)關(guān)聯(lián)。

      四、結(jié)果分析

      傳統(tǒng)的翻譯單位研究方法通常依賴個(gè)人內(nèi)省經(jīng)驗(yàn),導(dǎo)致研究結(jié)論主觀性較強(qiáng)。相反,本研究根據(jù)語料庫中的真實(shí)翻譯實(shí)例進(jìn)行統(tǒng)計(jì)分析,從而能夠獲得更加客觀可信的結(jié)論。以下是從雙語對應(yīng)語料庫的標(biāo)注結(jié)果中得到的幾個(gè)主要研究發(fā)現(xiàn)。

      1.翻譯單位的統(tǒng)計(jì)分布

      根據(jù)無對應(yīng)性標(biāo)準(zhǔn),本研究從上述語料庫中共劃分出8 568個(gè)翻譯單位,而基于源文分析的翻譯單位共7 295個(gè)。具體的標(biāo)注結(jié)果見表2和表3。

      表2 基于無對應(yīng)性的翻譯單位統(tǒng)計(jì)

      表3 基于源文分析的翻譯單位統(tǒng)計(jì)

      由表2可見,基于無對應(yīng)性的翻譯單位主要集中在一元組(unigram)和二元組(bigram)這兩個(gè)層次上。需要指出的是,本語料的體裁為新聞稿,其中有大量的人名或地名采用音位(字位)層的翻譯方式,從而導(dǎo)致該層次的翻譯單位比例比正常文本大很多,可見文體是影響翻譯單位大小的因素之一。另外,所有的音位(字位)層翻譯單位實(shí)際上僅僅是由591個(gè)單詞切分而成的,約占整個(gè)英文語料的4.33%。如果按照單詞數(shù)目來計(jì)算的話,實(shí)際上以音位(字位)層作為翻譯單位的比例是遠(yuǎn)低于三元組(trigram)翻譯單位的。通過對比兩類翻譯單位的統(tǒng)計(jì)結(jié)果,本研究發(fā)現(xiàn)以下規(guī)律:

      其一,與基于無對應(yīng)性的翻譯單位相比,基于源文分析的翻譯單位平均長度更大。前者的平均長度是1.25詞/單位,后者則達(dá)到2.49詞/單位。

      其二,基于源文分析的翻譯單位分布區(qū)間更大。在極端情況下,翻譯單位的長度達(dá)到12個(gè)單詞,如cost the US corporations and government agencies billions of dollars in losses,由于cost和in losses之間的遠(yuǎn)距離依存關(guān)系(long-distance dependency),導(dǎo)致該單位中各部分不能分開獨(dú)立翻譯。

      其三,基于源文分析的翻譯單位分布更加均勻。從表3可見,雖然此類翻譯單位以三元組為主,但是與其他長度的翻譯單位相比,統(tǒng)計(jì)學(xué)差異并不明顯。相反,基于無對應(yīng)性的翻譯單位則呈現(xiàn)出截然相反的趨勢,多達(dá)53%的無對應(yīng)性翻譯單位都出現(xiàn)在單詞這個(gè)層次上。換句話說,基于無對應(yīng)性的翻譯單位的分布規(guī)律性更強(qiáng),而基于源文分析的翻譯單位則主要呈隨機(jī)分布的特點(diǎn)。

      除了長度上的差異之外,本研究還發(fā)現(xiàn)兩類翻譯單位的切分結(jié)果是密切聯(lián)系的。一般來講,基于源文分析的翻譯單位與基于無對應(yīng)性的翻譯單位呈現(xiàn)一種包含與被包含關(guān)系。具體來說,前者一般是后者的同級或者上一級語言單位。前者傾向于將詞與其上下文語境組合為翻譯單位,后者則傾向于以詞為翻譯單位。

      這種現(xiàn)象是很容易解釋的。各種基于源文分析的翻譯單位,不管是出于內(nèi)部的緊密性、與上下文的獨(dú)立性還是無歧義性考慮,最終的結(jié)果都要求這些源文單位在譯文中具有對應(yīng)物。這是所有翻譯單位定義所暗含的前提假設(shè)。只有在找到源文某單位在譯文中的對應(yīng)物之后,我們才會(huì)進(jìn)一步討論它是否符合緊密性、獨(dú)立性或無歧義性標(biāo)準(zhǔn)。如果不符合以上翻譯單位標(biāo)準(zhǔn)的話,我們將繼續(xù)分析該單位的上層語言結(jié)構(gòu),依此類推。基于無對應(yīng)性的翻譯單位的判斷過程與此恰恰相反:在確定了源文某單位在譯文中的對應(yīng)物之后,我們將分析該單位的下層結(jié)構(gòu)在譯文中的對應(yīng)情況。當(dāng)且僅當(dāng)它的內(nèi)部某成分在譯文中缺乏對應(yīng)物時(shí),才可以判定它是一個(gè)基于無對應(yīng)性的翻譯單位。

      以上分析清晰地表明,翻譯單位本質(zhì)上是一個(gè)動(dòng)態(tài)的復(fù)雜概念。隨著分析的角度不同,翻譯單位的大小不盡相同。而且,即使選擇了確定的角度,我們也不能一勞永逸地將翻譯單位固定在某個(gè)特定的語言層次。鑒于此,本研究認(rèn)為,我們有必要采取兼容并包的方式來重新定義翻譯單位,即源文中任何一個(gè)語言單位,只要它滿足上述四種定義屬性中的任何一個(gè),即可將其認(rèn)定為翻譯單位。只有這樣,我們才能將翻譯單位概念應(yīng)用于整個(gè)翻譯的分析和轉(zhuǎn)換過程中。

      2.翻譯單位的影響因素

      影響翻譯單位的因素是多方面的。結(jié)合詞性標(biāo)注工具本研究發(fā)現(xiàn),翻譯單位既與單詞詞性、源語與目標(biāo)語的相似程度等客觀因素,又與譯者的翻譯策略等主觀因素密切相關(guān),見表4。

      表4 不同詞性的英文單詞與漢語的對應(yīng)情況

      由表4可見,源文單詞詞性不同,作為翻譯單位(基于無對應(yīng)性標(biāo)準(zhǔn))的幾率也不相同。其中,實(shí)詞比虛詞更有可能在譯文中找到對應(yīng)。名詞、主要?jiǎng)釉~、形容詞和副詞在譯文中具有對應(yīng)物的比例都在80%以上,但是冠詞、代詞、連詞、助動(dòng)詞、嘆詞和小品詞等虛詞在譯文中的對應(yīng)比例通常較低。這些虛詞通常與鄰近的實(shí)詞組合在一起成為翻譯單位,如agree to/贊成和call on/呼吁。多達(dá)75%的二元組翻譯單位是由一個(gè)實(shí)詞和一個(gè)虛詞組成的。

      除此以外,翻譯單位還與翻譯的具體語言密切相關(guān)。某些語言之間的親緣關(guān)系如此接近,以至于大多數(shù)時(shí)候源文的詞,甚至是比詞更小的音素或詞素都可以作為翻譯單位;另一種極端情況是,翻譯涉及的兩種語言差異如此之大,以至于譯者只能在比詞更大的層次上建立對應(yīng)關(guān)系。毋庸置疑,英漢翻譯的翻譯單位肯定與英法翻譯的翻譯單位有著截然不同的分布特征。

      譯者的主觀策略也一定程度上能夠影響翻譯單位的大小。以本語料庫中nuclear weapon為例。一種情況下,譯者省略了weapon的對應(yīng)詞武器,將其譯為核子,此時(shí)整個(gè)短語便成為一個(gè)基于無對應(yīng)性的翻譯單位。同時(shí),我們在語料庫中還發(fā)現(xiàn)另外一種譯法,即nuclear weapon/核武器。由于此例中的每個(gè)源文單詞在譯文中都能找到對應(yīng)物,翻譯單位不再是短語,而是單詞。由此可見,譯者在翻譯時(shí)總是擁有一定的自由度,通過個(gè)性化的遣詞造句方式來影響到翻譯單位的大小。

      五、結(jié) 論

      本研究從翻譯單位的主要定義出發(fā),通過分析它們在內(nèi)涵和外延方面的細(xì)微差別,最終總結(jié)出四種基本的翻譯單位定義屬性,即緊密性、獨(dú)立性、無歧義性和無對應(yīng)性。然后,應(yīng)用基于語料庫的定量研究方法分析了各類翻譯單位屬性之間的區(qū)別和聯(lián)系。

      研究發(fā)現(xiàn),基于源文分析的翻譯單位定義分別將緊密性、獨(dú)立性和無歧義性作為判斷的標(biāo)準(zhǔn),而基于無對應(yīng)性的翻譯單位定義則將譯文與源文之間的映射關(guān)系作為判斷的依據(jù)。盡管存在種種差異,各翻譯單位定義的共性在于它們都強(qiáng)調(diào)了同一類語言現(xiàn)象,即譯者在翻譯過程中并不總是在詞的層次上進(jìn)行翻譯操作的。

      從翻譯單位的統(tǒng)計(jì)分布來看,基于源文分析的翻譯單位比基于無對應(yīng)性的翻譯單位長度更大,分布更均勻。但是兩者之間也是緊密聯(lián)系的。一般來說,前者與后者呈現(xiàn)一種包含與被包含關(guān)系。雖然在翻譯的分析過程中,譯者出于某種考慮將源文某單位作為一個(gè)整體對待,但是在后續(xù)的轉(zhuǎn)換過程中,譯者仍然有可能將此整體單位拆分并逐個(gè)建立譯文對應(yīng)。這體現(xiàn)出譯者在翻譯時(shí)“大處著眼,小處著手”的思維過程。

      總而言之,翻譯單位是多種主客觀因素共同作用的結(jié)果。它與源文的單語特征(如詞性)、源語與目標(biāo)語的關(guān)系(如語法和詞匯的相似性)以及譯者的主體性(如個(gè)性化的遣詞造句)等因素密切相關(guān)。為了更好地描述翻譯過程的全貌,本研究主張采取兼容并包的態(tài)度,將翻譯單位定義為源文的某一語言單位,它由于具有緊密性、獨(dú)立性、無歧義性或無對應(yīng)性四種屬性之一,因此被視作一個(gè)整體來翻譯。

      猜你喜歡
      歧義語料庫譯文
      Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
      《語料庫翻譯文體學(xué)》評介
      譯文摘要
      eUCP條款歧義剖析
      中國外匯(2019年12期)2019-10-10 07:26:58
      把課文的優(yōu)美表達(dá)存進(jìn)語料庫
      English Jokes: Homonyms
      I Like Thinking
      “那么大”的語義模糊與歧義分析
      基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      尋求歧義研究的解釋力度:從認(rèn)知視角到社會(huì)視角——兼評《現(xiàn)代漢語歧義識別與消解的認(rèn)知研究》
      苏尼特左旗| 永年县| 陵川县| 新乐市| 彭水| 洪湖市| 桐梓县| 墨脱县| 西乌| 航空| 镶黄旗| 津市市| 民乐县| 巧家县| 金昌市| 阳山县| 名山县| 缙云县| 神池县| 宽城| 鹤壁市| 丰顺县| 恩施市| 图们市| 抚顺县| 镇赉县| 东安县| 瑞丽市| 巍山| 台州市| 邢台市| 进贤县| 临城县| 平安县| 社会| 民勤县| 江津市| 临夏市| 铁岭县| 将乐县| 二连浩特市|