陳 媛
(河南科技大學 外國語學院,河南 洛陽 471023)
機器翻譯是利用計算機對不同自然語言之間進行自動翻譯的技術,是解決信息時代語言障礙問題不可或缺的手段。近年來,由于計算機技術不斷發(fā)展,計算機性能逐步提升以及人工智能在自然語言處理上的廣泛應用,機器翻譯技術取得了巨大進步,利用在線翻譯系統(tǒng)處理不同語言之間的翻譯問題已經成為一種趨勢。但就目前現(xiàn)狀來看,機器翻譯的輸出結果,特別是英漢機器翻譯的輸出譯文還存在諸多問題,如結構歧義和語義歧義等。[1]機器翻譯系統(tǒng)的主導策略是通過中間表述實現(xiàn)間接翻譯,翻譯過程涉及語義、 句法、 詞法層次的分析,其中句法分析的準確與否直接影響到意義的表達效果。[2]另外,英漢兩種語言屬不同的語法體系,兩者的句法結構有本質的區(qū)別,即英語句式結構嚴密而緊湊,漢語句式結構松散而簡練。要想提高英漢機器翻譯的準確率,就必須克服兩種語言句法結構上的差異,以語義為基礎,在句法的輔助下完成翻譯過程。本文以英語最基本的句式主謂賓結構為切入點,研究英漢機器翻譯的句法錯誤類型,旨在為機器翻譯系統(tǒng)補充建立形式化的句法規(guī)則提供語言基礎,從句法學的角度給予一定的翻譯指導,幫助提高機器翻譯的質量。
近十年以來,很多專家學者致力于基于句法學提高機器翻譯準確度的研究,取得了一定的成果。如王致華介紹了依賴型句法為基礎的統(tǒng)計學機器翻譯模式,以及如何實現(xiàn)英漢兩種語言的語法剖析,并對運用此翻譯模式解碼過程中所存在的問題,提出相應解決策略。[3]劉群提出了多個基于源語言句法的統(tǒng)計機器翻譯模型與方法,并進一步證明依存到串翻譯模型實現(xiàn)的機器翻譯系統(tǒng)效果較好,性能超過了層次短語模型。[4]張亞鵬等利用基于短語的翻譯模型,創(chuàng)建了交互式機器翻譯系統(tǒng),運用句法層面的子樹信息來指導翻譯假設的擴展。[5]馮志偉討論了噪聲信道模型、 基于短語和基于句法的統(tǒng)計機器翻譯的優(yōu)與劣,主張把短語規(guī)則、 句法規(guī)則融入到機器翻譯中,同時結合理性主義方法和經驗主義方法,以推動機器翻譯的進一步發(fā)展。[6]由此可見,這些研究主要致力于基于句法規(guī)則的統(tǒng)計學機器翻譯模型研究,缺少對機器翻譯適用的句法規(guī)則進行細化和總結,有一定的局限性。
此外,也有些研究涉及某一受限語言(大多集中在科技文獻、 報告、 操作程序說明等科普類文獻)或某一特殊句型的英漢機器翻譯。如羅季美以“汽車技術文獻翻譯語料庫”中某一知名品牌汽車操作手冊作為研究對象,分析并歸納出機器在汽車技術文獻這一受限專業(yè)領域內進行翻譯處理時表現(xiàn)出的句法錯誤特征。[7]黎斌、 唐躍勤以英語特殊句型There be為切入點,著重探討英漢機器翻譯中特殊句型的對應與不對應的調整問題,分析機器翻譯軟件在There be句型英漢翻譯過程中的不足之處。[8]周巧從句法學角度對含“when”的句式的機器翻譯錯誤進行分析,提出解決這一類翻譯錯誤問題的見解。[9]安靜針對英漢機器翻譯中長句句式的預處理問題,提出一種基于依存句法分析和序列標注的英文長句分割方法。[10]以上的研究并沒有涉及英語基本句式結構的英漢機器翻譯問題。而主謂賓結構是英語句式的典型結構,在日常說話和文字交流中使用的頻率較高,如果翻譯處理不當,會嚴重影響現(xiàn)有機器翻譯系統(tǒng)的翻譯質量和可讀性。基于此,本文將著重研究主謂賓結構英漢機器翻譯的句法錯誤類型,在現(xiàn)行機器翻譯系統(tǒng)句法規(guī)則的基礎之上,為補充建立形式化的句法規(guī)則提供語言分析基礎,從而提高英漢機器翻譯的質量。
中國科學院計算機研究所對現(xiàn)有機器翻譯系統(tǒng)綜合分析的結果顯示,目前機器翻譯主要是在受限語言處理中取得了最高的5級適用級別和85%以上的可翻譯度。[11]這是由于受限語言常用性、 簡明性、 單義性和規(guī)范性的特點在很大程度上簡化了基于某一受限語言范疇的機器翻譯語法規(guī)則的制定??梢?,在受限語言范疇內實施機器翻譯研究是可行的。新聞類文本,屬于受限語言的一種,其結構集中在語意句法層面,并且文中有大量主謂賓結構的句子。它最重要的語言特點就是邏輯性較強,翻譯時譯文應簡潔明了,且與原文在內容和語義上要準確對應。新聞的載體涉及經濟、 政治、 科學技術、 商業(yè)、 工業(yè)、 生活等領域,這也決定了此類文本可以為機器翻譯研究提供廣泛的語料。因此,本文從各大權威新聞網站選取了2018年6月至2018年12月的50篇英語新聞為源語料,所選新聞覆蓋了時政、 國際、 商業(yè)、 科技、 財政、 文化、 旅游等,對其中主謂賓句子的機器譯文和人工譯文逐一進行平行對比研究。語料中的機器譯文主要來自谷歌翻譯系統(tǒng),有需要時也會與必應翻譯、 有道翻譯的結果作參照比對。人工譯文均來源于河南科技大學專業(yè)翻譯人員。
基于筆者之前對語料中1187項主謂賓結構英漢機器翻譯譯文錯誤的對比分析和歸納總結,本文設定了主謂賓結構英漢機器翻譯在詞序、 謂語動詞短語、 介詞短語、 名詞短語、 從句、 分詞短語、 動詞不定式短語處理上出現(xiàn)的7類句法錯誤。[12]之后根據(jù)這7種句法錯誤類型對機器譯文中存在的誤譯進一步標注和統(tǒng)計,并計算出各種誤譯類型的發(fā)生頻率。其中對一個主謂賓結構中重復出現(xiàn)的同一類型誤譯進行一次標注和統(tǒng)計,對同一句子中出現(xiàn)的不同類型誤譯分別加以標注和統(tǒng)計。錯誤率為出現(xiàn)該類型句法錯誤的機器譯文總句數(shù)/機器錯誤譯文總句數(shù)×100 %,結果如圖1所示。
圖1 主謂賓結構句法錯譯類型及錯誤率(%)
從圖1的數(shù)據(jù)可以看出,在句法錯譯類型中,詞序錯譯的發(fā)生率最高,達到28%。這是因為英漢兩種語言屬于不同的語法體系,英語注重形合,漢語注重意合,人工譯者可以根據(jù)語境靈活地對譯文進行譯后編輯,使其符合目的語的表達習慣。然而,由于雙語詞典的收集和翻譯轉化規(guī)則的總結十分復雜,目前的機器翻譯系統(tǒng)不可能覆蓋所有的語法規(guī)則,因此還不能很好地按照目的語的表達習慣,對譯文的結構進行合理排序,就容易造成此類誤譯。同時,在譯文平行比對中還發(fā)現(xiàn),詞序錯譯與機器對謂語動詞短語、 介詞短語、 名詞短語、 從句、 分詞短語、 動詞不定式短語的錯誤處理存在較大的交錯,故下文中不再把詞序錯譯作為單獨的誤譯類型進行分析。所有句法誤譯類型中動詞不定式短語的錯譯率最低,僅為2%。
本文將根據(jù)主謂賓結構機器譯文句法錯誤的分類,結合圖1的統(tǒng)計數(shù)據(jù),對各類典型的機器譯文句法錯誤實例加以分析和說明。在以下所舉例子中,a句為機器譯文,b句為人工譯文,對比部分以下畫線標注以示區(qū)別;每個例子只用于說明所屬錯誤類型的單一翻譯錯誤。
英語主謂賓結構的謂語部分必須由動詞或動詞短語充當,而動詞或動詞短語決定語言的邏輯關系,是英語語句的靈魂,也是機器翻譯過程中的重要環(huán)節(jié)。英漢翻譯中不地道不自然的表達很大程度上源于對謂語的處理不當。通過平行對比發(fā)現(xiàn),主謂賓結構中謂語動詞短語的錯譯主要表現(xiàn)在以下四種類型:謂語動詞與副詞的固定搭配誤譯;謂語動詞與介詞的固定搭配誤譯;多語義動詞短語誤譯;動詞短語與多個并列賓語組合的誤譯。以下以具體實例詳細說明。
1.謂語動詞與副詞的固定搭配誤譯
例1 Tens of thousands of tourists and locals traditionallyring inthe New Year on the wide shopping boulevard.
a.成千上萬的游客和當?shù)厝藗鹘y(tǒng)上在新的一年里在廣闊的購物大道上響起。
b.成千上萬的游客和當?shù)厝藗鹘y(tǒng)上在寬闊的購物大道上迎接新年。
例2 Apple hasheld firm onits premium pricing strategy in China.
a.蘋果牢牢地抓住關于在中國的高端定價策略。
b.蘋果堅持其在中國的優(yōu)惠定價策略。
例1、 例2是謂語動詞與副詞固定搭配誤譯的典型示例。在這兩個例子中,謂語動詞短語“ring in”和“hold on”屬于“動詞+副詞”構成的固定搭配形式,緊跟其后的名詞“the New Year”和 “strategy”分別作動詞短語的賓語,因此b句人工譯文將其翻譯為“迎接新年” 和“堅持策略”與原句語義一致,符合新聞英語語言表述需準確無誤的要求。相比之下,a句機器譯文錯誤地把“動詞+副詞”構成的固定短語“ring in” 和“hold on”翻譯成 “動詞+介詞短語”的形式,使譯文與原句語義大相徑庭,造成信息嚴重失真。
2.謂語動詞與介詞的固定搭配誤譯
例3 Scientistsnamedthe system’s first satelliteafter the location of its headquarters.
a.科學家在其總部所在地之后命名該系統(tǒng)的第一顆衛(wèi)星。
b.科學家們以其總部的所在地命名了該系統(tǒng)的第一顆衛(wèi)星。
例3中, 謂語動詞與介詞構成的短語形式“name after”表示“以……命名”是固定搭配,此句中“name after”被名詞短語分隔開,機器不能識別“after the location of its headquarters”也是動詞短語的一部分,而將其錯誤地處理成“在……之后”的介詞短語,造成了語義的偏差。顯然可見,機器系統(tǒng)在進行英漢翻譯過程中不太注意句法結構,而是僅僅根據(jù)短語表中的概率對句子進行分段,導致誤譯現(xiàn)象頻繁發(fā)生。
3.多語義動詞短語誤譯
例4 The team is stilllooking intosome other accusations.
a.這個小組一直在看其它的一些指控。
b.該小組還在調查其他一些指控。
機器在處理多語義動詞短語的翻譯時也存在較多問題,究其原因是由于機器缺乏結合上下文選擇合適語義的能力。如例4中,動詞短語“l(fā)ook into”有“調查、 觀察、 窺視、 瀏覽、 看”等多種含義,但在此特定語境下,人工譯者很容易判斷出應取其“調查”的語義。而機器翻譯系統(tǒng)無法消除具有多種含義的動詞短語的歧義,造成誤譯。
4.動詞短語與多個并列賓語組合的誤譯
例5 Itconsists of cultural connotations and emotions, complicated plots, exquisite depictions of characters, aesthetic modeling and impressive visual presentation.
a.它由文化內涵和情感組成,復雜的情節(jié),精美的人物描繪,美學造型和令人印象深刻的視覺呈現(xiàn)。
b.它由文化內涵和情感,復雜的情節(jié),精美的人物描繪,美學造型和令人印象深刻的視覺呈現(xiàn)所組成。
例5中,動詞短語“consists of”后接五個作其賓語的并列名詞短語“cultural connotations and emotions”“complicated plots”“exquisite depictions of characters”“aesthetic modeling and impressive visual presentation”,但a句機器譯文分裂處理了五個平行賓語,顯然構成誤譯。這表明機器未能準確識別動詞短語后多個賓語的并列關系。
由此可見,主謂賓結構中謂語動詞短語的復雜多變性始終是機器翻譯過程中需要解決的難點。因此,為了實現(xiàn)謂語動詞短語的最佳漢譯效果,需建立動詞短語語義模式庫,采用以語義單元、 句式以及變量為基礎的翻譯方法,利用匹配算法輸出漢語語義模式即英語的譯文。根據(jù)這種方法,可以進一步提高機器翻譯的準確性和效率。
一般而言,英語介詞有單重介詞和雙重介詞之分。單重介詞指在語言片斷中出現(xiàn)的唯一介詞,雙重介詞指在語言片斷中順次出現(xiàn)的兩個介詞。[12]本文主要涉及的是英語單重介詞。英語單重介詞總數(shù)并不多,但其構成的介詞短語在主謂賓結構中通常以表語、 定語、 補語或表示各種不同語法功能的狀語形式出現(xiàn)。因此,由于介詞短語有較高的使用頻率和復雜的句法功能,它在主謂賓結構英漢機器翻譯中,也經常出現(xiàn)介詞短語的錯誤翻譯。對比發(fā)現(xiàn)主謂賓結構中的介詞短語錯譯主要有兩種情形:介詞短語作定語的錯譯和介詞短語作狀語的錯譯。
1.介詞短語作定語的錯譯
例6 Trump defendedhis decisions to withdraw troops from Syria.
a.特朗普為他的決定辯護為了從敘利亞撤軍。
b.特朗普為自己從敘利亞撤軍的決定進行了辯護。
例6的主謂賓結構中,介詞短語“to withdraw troops from Syria”作賓語“his decisions”的后置定語。眾所周知,英語中作定語的介詞短語后置于被修飾詞,而漢語中的定語一般置于被修飾詞前。對于人工譯者,通過分析句子結構,能夠容易地識別出介詞短語作定語的句法功能。相比之下,機器機械地完全遵照原文詞序,沒有把作定語的介詞短語“to withdraw troops from Syria”調整到被修飾詞“his decisions”之前,導致機器譯文不知所云。
2.介詞短語作狀語的錯譯
例7 China aims to maintain stable industrial growth in 2019by cultivating a more robust domestic market and further leveling the playing field for foreign and private enterprises.
a.中國的目標是在2019年保持穩(wěn)定的工業(yè)增長,培育更加強勁的國內市場,進一步為外國和私營企業(yè)提供公平的競爭環(huán)境。
b.中國的目標是通過培育更強勁的國內市場,進一步平衡外國和私營企業(yè)的競爭環(huán)境,在2019年保持穩(wěn)定的工業(yè)增長。
英語中的介詞“by”后常接無冠詞的名詞或動名詞,表示“方式、 方法、 手段”,意為“通過、 用、 靠 ”。對比a、 b兩句譯文,機器譯文直接忽略了說明動詞“maintain”方式的“by﹢cultivating a more robust domestic market”作狀語的句法功能,而錯誤地將其處理成與“maintain”并列的動詞詞組,造成所傳達的信息不準確,使讀者的理解與原句有較大出入。
從對介詞短語錯譯實例的分析來看,在主謂賓結構英漢機器翻譯中,介詞短語翻譯準確與否主要取決于對其語義和句法功能的判斷。因此,今后設計的機器翻譯軟件,需進一步建立和完善對英語介詞短語語義和句法特征全面描述的系統(tǒng),同時與單雙重介詞固定搭配語義模式庫、 介詞短語相關句式語義模式庫相結合,有效地解決一般語境下英語主謂賓結構中介詞短語翻譯的問題,從而提高機器翻譯的質量。
英語中,短語的分類較多,但名詞短語最為重要,它是英語造句中不可或缺的元素。尤其在英語主謂賓結構中,名詞短語常常充當句子的主語或賓語,起到說明人物、 行為、 事實或動作對象的語法功能。新聞英語的語言表達力求簡練,所選語料中存在大量名詞短語。通過平行對比發(fā)現(xiàn),主謂賓結構中的名詞短語錯譯主要表現(xiàn)在機器對名詞短語的語義和詞序處理的隨意性。
例8TheWhiteStorm2:DrugLord, has knockedMarvel’s superhero hit Spider-Man: Far from Homefrom the top spot at China’s box office since its opening day on July 5.
a.《白色風暴2: 毒梟》自7月5日開幕以來,已經將漫威的超級英雄擊中《蜘蛛俠:遠離家園》的中國票房榜首。
b.自7月5日上映以來,《白色風暴2: 毒梟》擊敗了漫威的超級英雄大片《蜘蛛俠:遠離家園》,成為中國票房冠軍。
例8中的名詞短語“Marvel’s superhero hit”是由限定詞“Marvel’s”+起修飾作用的名詞“superhero”+中心名詞“hit”構成,作句子的賓語。其中中心名詞“hit”具有多個義項,具體語義取決于語境。a句機器譯文錯誤地選取了“hit”這個單詞的最高頻詞義“擊中”,使譯文表達不合邏輯,違背了新聞語言通俗易懂、 內容準確的要求。而人工譯者能夠結合上下文,準確判斷出“hit” 在具體語境下的含義,譯為“超級英雄大片”,使譯文可讀性更強。
例9The much-anticipated teaser trailer for the upcoming live-action remake of Disney’s animated blockbuster “Mulan”will draw a chorus of praise from Chinese netizens.
a.備受期待的預告片為即將上映真人翻拍版的迪士尼動畫大片《花木蘭》將引起中國網民的贊美。
b.備受期待的迪士尼動畫大片《花木蘭》真人翻拍版的預告片將在中國網民中引起熱烈的好評。
英語中的名詞短語由名詞及其修飾語構成,名詞的修飾語通常位于名詞之前作前置定語或其之后作后置定語。在復雜的名詞短語中,更常見的是后置修飾定語,例如分詞短語、 介詞短語、 定語從句、 不定式等。由于在英漢兩種語言中,主謂賓這三種成分的次序基本上是一致的,而各種定語的位置卻很不相同,在英譯漢過程中,要注意語序的調整,特別是當英語中后置的定語譯成漢語時,那些定語一般都要前置。例 9中作主語的名詞短語結構復雜,由形容詞“the much-anticipated”+ 中心名詞“teaser trailer” +介詞短語“for the upcoming live-action remake of Disney’s animated blockbuster ‘Mulan’”構成,其中介詞短語作后置定語。a句機器譯文表現(xiàn)出與原英語詞序完全相同的順序,使譯文晦澀難懂而且容易令讀者造成誤解,而b句人工譯文把作定語的介詞短語前置,使譯文語義一目了然,符合漢語的表達習慣。例9充分體現(xiàn)了機器對結構復雜的名詞短語進行翻譯時對詞序處理的隨意性。
由此可見,在主謂賓結構英漢機器翻譯中,名詞短語的多義區(qū)分和詞序調整仍是機器翻譯研究中有待解決的問題。針對多義區(qū)分問題的解決,其關鍵在于加強機器翻譯系統(tǒng)對源語言的深入分析,完善機器翻譯系統(tǒng)依賴的雙語詞典,使詞典不僅提供釋義功能,了解所指對象,并且還要提供注解、 加注詞類和附加含義標簽,提供盡可能全面的、 根據(jù)特定的上下文相關性選擇詞義的搭配、 語用、 語境等基本信息。再者,今后設計的機器翻譯系統(tǒng),需融入句法信息和詞性標注信息的源端重排序模型,使源端和目標端的語序保持一致,從而實行長短距離的調序,彌補語序沒有調整的不足,提高機器翻譯系統(tǒng)的譯文質量。
從句誤譯也是主謂賓結構英漢機器翻譯存在的問題之一。英語中,主要有名詞性從句、 定語從句、 狀語從句。從句是相對于主句而言的,且從句需有引導詞引出。在對機器譯文和人工譯文平行對比中發(fā)現(xiàn),機器系統(tǒng)通常不能準確地識別從句的類型,引導詞的語義和句法功能經常被誤解,從而造成錯譯。如例10的a句機器譯文把賓語從句的引導詞“that” 錯誤地處理成指示代詞“那個”,例11的a句機器譯文將定語從句引導詞“who”處理成了疑問詞“誰”。
例10 The preliminary probe foundthat Quanjian had exaggerated the efficacy of some of its products.
a.初步調查發(fā)現(xiàn),那個權健夸大了部分產品的功效。
b.初步調查發(fā)現(xiàn),權健夸大了部分產品的功效。
例11 Customerswho want to secure one of the first 500“pioneer” examples of the solar carneed to pay a reservation fee of 119,000.
a.誰希望獲得的第500“先鋒”的太陽能汽車的例子之一的客戶需要支付的119,000預約費。
b.想要獲得首批500輛“先鋒”太陽能汽車的客戶,需要支付11.9萬歐元的預訂費。
再者,由于英漢兩種語言不同的語法規(guī)則,機器對從句的序位常常處理不當,尤其是對定語從句和狀語從句的語序調整不當,導致譯文不符合漢語表達習慣,造成誤譯。如例12、 例13。
例12 Chinese scientists have developed new biomimetic polypropylene foamswhich can be used to prevent and control oil pollution.
a.中國科學家開發(fā)出新的仿生聚丙烯泡沫,可用于預防和控制油污。
b.中國科學家開發(fā)出了一種新的可用于預防和控制油污的仿生聚丙烯泡沫。
英語定語從句可分為限定性定語從句和非限定性定語從句,而漢語中根本無定語從句這一概念。并且,在英語中,無論是限制性定語從句還是非限制性定語從句都置于被修飾詞之后,但漢語中定語通常置于被修飾詞之前。因此,在處理定語從句的英漢翻譯問題時,人工譯者一般都會對詞序做出相應調整。例12的a句機器譯文中作定語的“可用于預防和控制油污”保留了英文的語序,表明機器在翻譯中調整定語從句語序能力的不足。
例13 Computer algorithms as well as the hardware for positioning, map construction, route design and avoiding obstacles have all been optimized to suit the agricultural environment,when taking into consideration fertilization, watering the plants, bumpy roads and other natural factors.
a.計算機算法以及定位、 地圖構造、 路線設計和避免障礙的硬件都進行了優(yōu)化, 以適應農業(yè)環(huán)境,在考慮施肥、 澆地、 崎嶇道路和其他自然因素時。
b.在考慮施肥、 澆水、 道路顛簸等自然因素的同時,優(yōu)化了適合農業(yè)環(huán)境的計算機算法以及定位、 地圖構建、 路線設計、 避障等硬件。
例13中,a句機器譯文的錯誤發(fā)生在于對“when”引導的狀語從句序位處理不當,造成邏輯語義與原文有偏差,表明機器對狀語從句在主謂賓語句中語序處理的不穩(wěn)定性。
在對主謂賓結構中從句錯譯實例的歸納分析中,我們發(fā)現(xiàn)對從句的正確翻譯首先取決于機器對從句的識別。因此,在今后的機器翻譯軟件設計中,需補充建立從句識別模型。即通過分析從句的句法結構特點,歸納總結其在句子中的左右邊界規(guī)則和內部構成成分的共現(xiàn)關系規(guī)則,進一步構建從句識別規(guī)則集,從而實現(xiàn)對從句的自動識別,提高機器翻譯輸出的準確率。
分詞短語是英語中一種常見的句法形式。與從句相比,分詞短語結構簡潔,在新聞英語中得到廣泛應用。分詞短語具有形容詞的功能,同時又表現(xiàn)各種動詞性特點,如時態(tài)、 語態(tài)、 帶狀語性修飾語及帶賓詞的性能,在句子中可以充當表語、 定語、 狀語、 補語和獨立結構等。在對主謂賓結構中分詞短語錯譯實例進行歸納分析時發(fā)現(xiàn),造成此類錯誤的原因主要是機器不能準確識別分詞短語復雜的句法功能。例14中,a句機器譯文把作目的狀語的現(xiàn)在分短語詞“Backing up those words”錯誤分析為句子的謂語動詞,反映了機器對分詞短語句法功能的混淆以及對其分析處理的能力還有待提高。
例14Backing up those words,PSG last month signed a partnership with Chinese insurance giant Pingan Group to stage 200 trials for kids across 16 Chinese cities this summer.
a.PSG支持這些話,上個月與中國保險巨頭平安集團簽署了合作伙伴關系,今年夏天將為16個中國城市的孩子們舉辦200場試驗。
b.為了支持這一說法,巴黎圣日耳曼上個月與中國保險巨頭平安集團簽署了合作協(xié)議,將于今年夏天在中國16個城市開展200項針對兒童的試驗。
動詞不定式是動詞的一種非限定形式,具有豐富的句法功能。在人工譯文和機器譯文的對比結果中,動詞不定式短語的錯譯率最低,這說明機器對主謂賓結構中動詞不定式的處理表現(xiàn)良好。具體來說,機器譯文中動詞不定式的誤譯主要體現(xiàn)在動詞不定式短語作目的狀語時。
例15 All of these issuesrequire pragmatism over ideology, global vision over self-interest, and systematic sequencing to achieve positive and substantial change.
a.所有這些問題都需要對意識形態(tài)的實用主義,對自身利益的全球視野以及實現(xiàn)積極和實質性變革的系統(tǒng)排序。
b.所有這些問題都需要實用主義而非意識形態(tài),需要全球視野而非利己主義,需要有系統(tǒng)的排序來實現(xiàn)積極和實質性的變革。
例15中,動詞不定式短語“to achieve positive and substantial change”緊隨作賓語的名詞詞組“systematic sequencing”之后,機器錯誤地按照原句語序將其處理成“systematic sequencing”的后置定語,造成語義模糊,顯然不符合原句的邏輯語義。從b句人工譯文可以看到,譯者準確地識別出動詞不定式作目的狀語的句法功能,因此在翻譯時添加了“來” 字傳達表示“目的”之語義,既保持了原句語義的完整性,又保證了譯文的真實性。
在對分詞短語和動詞不定式誤譯實例的歸納分析中,我們發(fā)現(xiàn)作為英語動詞的兩種非謂語形式,兩者均有自身的時態(tài)和語態(tài)變化,具有豐富復雜的句法功能。因此,為了避免句法功能混淆引起的誤譯,應進一步提高機器翻譯系統(tǒng)對分詞和動詞不定式句法功能分析的能力,如根據(jù)最大熵原理建立分詞和動詞不定式識別模型,提高句法分析技術的精準性。
機器翻譯是一項非常重要且充滿挑戰(zhàn)的工作,主謂賓結構是英語句式的典型結構,在日常說話和文字交流中使用的頻率較高,是機器翻譯過程中需要攻克的重點。本論文通過分析主謂賓結構英漢機器翻譯存在的句法錯誤,將一些規(guī)律性的錯誤進行歸納分析,用以指導翻譯實踐,從而提高機器翻譯譯文的質量,使譯文更準確、 更地道。研究結果表明,目前的機器翻譯系統(tǒng)在新聞類文本這一受限語言范圍內具有一定的英漢翻譯能力,但隨著主謂賓語句稍一復雜,有較多修飾成分和限定成分時,機器翻譯的準確度就隨之下降,出現(xiàn)較多句法錯誤。其中,詞序錯譯的發(fā)生率最高,其他錯誤類型的發(fā)生率從高到低依次為謂語動詞短語錯譯、 介詞短語錯譯、 名詞短語錯譯、 從句錯譯、 分詞短語錯譯、 動詞不定式短語錯譯。因此,在今后的機器翻譯系統(tǒng)中需進一步加強詞典的結構建設,為語言處理程序提供源語言基本單位所具有的詞法、 句法、 語法、 語義、 語用等方面信息,補充和完善復雜多義區(qū)分的途徑,提高系統(tǒng)中上下文相關處理的能力。本文對此進行了初步探索,為主謂賓結構的英漢機器翻譯提供了一定的理論指導。
加強對機器譯文錯誤的研究是十分必要的。本研究只選取了50篇新聞英語文本, 今后, 語料的數(shù)量和范圍可進一步擴大, 使研究結果更具代表性, 從而提高機器翻譯的質量,推動機器翻譯的發(fā)展。需要說明的是,本文所列舉的所有語言錯誤截至筆者完稿時都可重復。但是由于在線機器翻譯系統(tǒng)持續(xù)修正,這些語言錯誤可能會在之后產生的譯文中逐漸減少。