• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      TAUS指南在快速譯后編輯(LPE)中的應用

      2022-05-30 10:48:04仲晨陽倪蓉
      關(guān)鍵詞:機器翻譯

      仲晨陽 倪蓉

      摘要:隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算的飛速發(fā)展,機器翻譯發(fā)生了巨大變化,機器翻譯譯后編輯( machine translation post-editing,MTPE)模式也應運而生,逐漸成為翻譯服務(wù)業(yè)的主流模式。但若要進一步提高MTPE效率和質(zhì)量,還需要相應的規(guī)范和準則加持,以幫助譯后編輯者識別機器翻譯錯誤并快速決策機器譯文是否需要進行編輯。通過介紹翻譯自動化用戶協(xié)會( TAUS)的MT-PE指南的相關(guān)實踐準則,并根據(jù)文本性質(zhì)和受眾選取適用準則指導進行了醫(yī)學報告的快速譯后編輯(light post-editing,LPE)實踐,對醫(yī)學報告文本譯后編輯實踐中存在的詞匯錯譯、分詞短語錯譯、從句錯譯以及段落錯譯、漏譯等問題進行了分析,并對該指南的實際指導意義進行了總結(jié)與評價。

      關(guān)鍵詞:機器翻譯;快速譯后編輯;機器翻譯譯后編輯指南;醫(yī)學報告翻譯

      中圖分類號:H 059

      文獻標志碼:A

      文章編號:1009 - 895X(2022)03 - 0238 - 07

      DOI: 10. 13256/j. cnki:jusst.sse.2022.03 .005

      近年來,機器翻譯質(zhì)量得到了極大改善,信息技術(shù)已經(jīng)與翻譯服務(wù)業(yè)深度融合。同時傳統(tǒng)的純?nèi)斯しg無法滿足全球化和本地化催生的海量翻譯需求,且成本相對較高,新的翻譯業(yè)務(wù)類型與質(zhì)量標準相較以前都有了很多變化,從而促使越來越多的企業(yè)開始用機器翻譯技術(shù)進行初步的翻譯項目處理,也就導致了譯后編輯市場的擴大。作為提升機器翻譯質(zhì)量的新模式,譯后編輯還缺少規(guī)范一致的實踐原則、質(zhì)量評估標準等,因此若要該模式得到有效并廣泛的應用,還需要清晰明確的各類指導準則。2016年,翻譯自動化用戶協(xié)會( Translation Auto-mation User Society,TAUS)發(fā)布了MT Post-edit-ing Guidelines,這是目前可參考的較為完整的機器翻譯譯后編輯指南。本文根據(jù)該指南對醫(yī)學報告機器譯文進行了快速譯后編輯實踐,并對其指導意義及存在的問題進行了分析。

      一、機器翻譯與譯后編輯

      (一)機器翻譯的發(fā)展及缺陷

      機器翻譯的廣泛應用產(chǎn)生了巨大的社會效益和經(jīng)濟效益?;仡櫰浒l(fā)展歷程,主要經(jīng)歷了四個階段:一是基于規(guī)則( RBMT);二是基于例子(EB-MT);三是統(tǒng)計機器翻譯(SMT);四是神經(jīng)網(wǎng)絡(luò)機器翻譯( NMT)。神經(jīng)網(wǎng)絡(luò)機器翻譯利用已有的大規(guī)模的真實語料庫來進行深度學習,從語料庫中自動獲取語言特征和規(guī)則,它是基于大數(shù)據(jù)、使用神經(jīng)網(wǎng)絡(luò)來實現(xiàn)翻譯的機器翻譯系統(tǒng)[1]。神經(jīng)網(wǎng)絡(luò)機器翻譯的發(fā)展使機器譯文質(zhì)量得到了質(zhì)的提升。

      但是,即便神經(jīng)機器翻譯系統(tǒng)使機器譯文質(zhì)量飛速發(fā)展,機器譯文仍有很多局限性,自然語言處理仍有許多在實踐中難以解決的問題,比如從句錯譯、詞匯錯譯、譯文調(diào)序失敗、符號錯譯、漏譯等問題[2]。醫(yī)學報告作為醫(yī)學文本的一種,其特點就是縮略語、醫(yī)學術(shù)語使用較多,同時為表達客觀及行文簡潔準確,被動語態(tài)以及分詞結(jié)構(gòu)應用較多[3]。機器在翻譯醫(yī)學文本時,往往會出現(xiàn)術(shù)語錯譯、漏譯和詞匯替代錯譯問題,同時也會出現(xiàn)對被動句以及分詞結(jié)構(gòu)的處理不當導致譯文含義與原文出現(xiàn)偏差的現(xiàn)象。具體可見本文第三節(jié)的實踐分析。要克服機器譯文存在的這些缺陷,使譯文質(zhì)量達到要求,目前最快捷有效的方法就是對其進行人工修改、完善,即進行機器翻譯譯后編輯。

      (二)譯后編輯概述

      譯后編輯( post-editing)是在語言或格式方面,對機器翻譯的原始產(chǎn)出,即初始譯文,進行加工與修改來提高機譯產(chǎn)出的準確性與可讀性[4]。2010年TAUS實踐中的譯后編輯報告將譯后編輯定義為“用最少的人工改進機器生成的翻譯的過程”[5]。而針對不同要求和目的,關(guān)于機器翻譯譯后編輯的IS0 18 587標準將譯后編輯分為兩個級別:快速譯后編輯( Light Post-editing,LPE)、完全譯后編輯( Full Post-editing,F(xiàn)PE)[6]。機器翻譯譯后編輯模式充分提高機器翻譯的速度(效率),也保證發(fā)揮人工翻譯的精度(質(zhì)量),從而既滿足翻譯市場快速發(fā)展的需求,也推動了翻譯技術(shù)的發(fā)展,還促進了學界和業(yè)界的交流與合作,豐富了語言服務(wù)產(chǎn)業(yè)鏈的組成[7]。

      不過譯后編輯作為新的翻譯工作模式,在實踐過程中除了要識別并糾正上述機器譯文各類錯誤之外,還需考慮效率、質(zhì)量要求、成本等各方面因素。因此譯后編輯在發(fā)展過程中還需要獨立、一致的標準來衡量和約束譯后編輯的質(zhì)量,確定譯后編輯工作量等,幫助譯后編輯者更加高效高質(zhì)地完成譯后編輯任務(wù),同時培養(yǎng)出更多高質(zhì)量的譯后編輯人員。但目前機器翻譯譯后編輯相關(guān)的大部分實踐準則就比較宏觀,如崔啟亮提出的實踐準則相對宏觀,進行實踐時還需自行確立具體規(guī)則[7]。而Midori Tat-suni提出的對MTPE譯文相關(guān)的部分要求與TAUS類似,但比較寬泛.并未針對不同的質(zhì)量要求進行細致劃分,實際應用時還需綜合考慮各種因素進行細化[8]。目前相對具體的實踐準則是TAUS發(fā)布的MT POST-EDITING GUIDELINES,根據(jù)不同的質(zhì)量要求列出了對應的原則,所以本文采用該原則指導所選文本的譯后編輯實踐,以檢驗其是否能有效提高譯后編輯效率。

      二、TAUS機器翻譯譯后編輯指南

      TAUS成立于2004年,是全球語言和翻譯行業(yè)的資源中心。該協(xié)會通過自己的數(shù)據(jù)云和質(zhì)量評估服務(wù)為翻譯行業(yè)提供相關(guān)的建議、工具、指標、基準和數(shù)據(jù)等。2016年,該協(xié)會發(fā)行了MTPE指南,旨在促進譯后編輯模式的發(fā)展,提升譯后編輯的質(zhì)量和效率,并幫助該行業(yè)選擇、培訓高素質(zhì)、高水準的譯后編輯工作者。 該指南指出,最基本的譯后編輯質(zhì)量評估準則有兩條,一是機器生成的譯文質(zhì)量,二是對待翻譯材料的最終質(zhì)量預期,即譯后編輯工作如何進行,取決于機器生成的原始譯文質(zhì)量及客戶對譯文質(zhì)量的需求[9]。該指南把預期的最終譯后編輯質(zhì)量大致分為兩個等級,一級為“good enough quality”,另一級為“human translation quality”,其具體要求見表1.

      在選擇適用質(zhì)量要求時,主要取決于目標讀者或客戶對最終譯文質(zhì)量的需求(包括最終譯文的受眾或使用目的)以及初始機器譯文的質(zhì)量。而對于初始機器譯文質(zhì)量的評判,若花費太多時間來確定其是否可用會得不償失,降低效率。因此可在決策時間上加一些限制,若在一定時間內(nèi)查看一個機器翻譯片段(在熟悉源文本和目標文本之后),發(fā)現(xiàn)無法輕松理解,那就舍棄機器譯文。Mesa-Lao在其實驗分析中表明,大部分測試者在初讀機器譯文上的停留時間為5 - 10秒左右,本文的譯后編輯實踐即以5 - 10秒原則來判斷是應該糾正機器譯文,還是應該刪除并重新翻譯低質(zhì)量的片段[10]。同時針對最終譯文質(zhì)量的不同質(zhì)量預期(是“good enough quality”還是“human translation quality”)以及機器生成譯文的不同質(zhì)量,采取不同的譯后編輯策略,決定是進行LPE還是FPE。

      三、基于TAUS指南進行的醫(yī)學文本

      譯后編輯實踐分析

      醫(yī)學報告屬于醫(yī)學類文本,作為科技文本的一種,對MTPE模式的適應性較強,同時有海量翻譯需求,對翻譯效率要求較高。本文選取了The NewEngland Journal of Medicine上的醫(yī)學報告來進行譯后編輯實踐,這是關(guān)于2019新型冠狀肺炎武漢病例分析的報告,發(fā)布于2020年1月24日,全文約3 000詞。此文的目的是與醫(yī)學工作者和研究者共享信息以及時有效共同應對并預防疫情。因為該流行病傳染性強,傳播速度快,加之如今交通非常發(fā)達,人員流動頻繁,所以此類文本信息翻譯非常注重準確性和時效性。同時,此類文本譯文目標受眾為醫(yī)學專家或工作者,他們僅需了解原文概述或要點,以幫助自己了解疾病相關(guān)信息,共同做好應對準備并尋找解決辦法,所以可選擇省時高效的LPE模式進行MTPE,使最終譯文達到“good enoughquality”的要求(下文提到的具體準則均針對“good enough quality”)。

      本文所選擇的機器翻譯引擎為谷歌翻譯,在實踐過程中發(fā)現(xiàn)詞匯錯譯、分詞短語錯譯、從句錯譯以及段落錯譯、漏譯問題較多,而此前一直被視為難點的被動語態(tài)問題已不明顯?;谏窠?jīng)網(wǎng)絡(luò)機器翻譯強大的學習能力以及大數(shù)據(jù)的支撐,目前谷歌對被動句的處理表現(xiàn)較為良好,比如,筆者較早時期實踐時發(fā)現(xiàn)的相關(guān)問題,在幾個月之后再次用谷歌生成譯文時,發(fā)現(xiàn)其已經(jīng)對譯文進行了改良,符合“good enough quality”的要求,可不再作為難點進行分析。其他相關(guān)案例具體分析如下。

      (一)詞匯錯譯

      例1 In late December 2019, several local healthfacilities reported clusters ofpatients with pneumoniaof unknown cause that were epidemiologically linkedto a seafood and wet animal wholesale market in Wuhan, Hubei Province, China. _We report the re-sults of this investigation, identifying the source of thepneumonia clusters,and describe a novel coronavrrus detected in patients with pneumoma whose specimens were tested by the China CDC at an early stage of the outbreak.

      谷歌譯文(2020年8月9日) 2019年12月下旬,幾家地方衛(wèi)生機構(gòu)報告了一群原因不明的肺炎,其在流行病學上與中國湖北省武漢市的海鮮和濕動物批發(fā)市場有關(guān)。……我們報告了這項調(diào)查的結(jié)果,確定了肺炎簇的來源,并描述了在疾病爆發(fā)早期由中國疾病預防控制中心檢測其標本的肺炎患者中檢測到的新型冠狀病毒。

      修改譯文2019年12月下旬,中國湖北武漢幾家當?shù)氐尼t(yī)療機構(gòu)報告了一群原因不明的肺炎患者,從流行病學角度看,均與當?shù)氐囊患液ur和水產(chǎn)動物批發(fā)市場有關(guān)?!覀儓蟾媪吮敬蔚恼{(diào)查結(jié)果,確定了肺炎患者群體的來源,并描述了在疾病爆發(fā)早期由中國疾病預防控制中心檢測其標本的肺炎患者中檢測到的新型冠狀病毒。

      通過5- 10秒原則可快速識別出谷歌關(guān)于 “wet ammals”和“clusters”的翻譯出現(xiàn)了錯誤,導致句意出現(xiàn)偏差,為達到要求(1)“語義正確”,對這兩處進行了編輯,而“clusters”也按照上下文語境選擇正確的詞義。同時對比原文還發(fā)現(xiàn),谷歌譯文出現(xiàn)了信息遺漏的現(xiàn)象,漏譯了“clusters of patients”,因此為達到TAUS指南要求(2)“確保信息無遺漏”,確保譯文信息無添加或遺漏,在進行快速譯后編輯時將遺漏信息補全。

      例2

      Emerging and reemerging pathogens are global challenges for public health. Coronaviruses are enveloped RNA viruses that are distributed broadly among humans, other mammals, and birds and that cause respiratory, enteric, hepatic, and neurologic di-seases.

      谷歌譯文(2020年8月9日) 病原體的出現(xiàn)和重新出現(xiàn)是公共衛(wèi)生的全球性挑戰(zhàn)。冠狀病毒是被包膜的RNA病毒,廣泛分布于人類,其他哺乳動物和鳥類中,并引起呼吸系統(tǒng),腸道,肝臟和神經(jīng)系統(tǒng)疾病。

      修改譯文新興和再現(xiàn)病原體是公共衛(wèi)生的全球性挑戰(zhàn)。冠狀病毒是有包膜RNA病毒,廣泛分布于人類、其他哺乳動物以及鳥類宿主中,并可引起呼吸道、腸道、肝臟和神經(jīng)系統(tǒng)疾病。

      結(jié)合5 - 10秒原則以及醫(yī)學文本翻譯的重難點,可觀察到“病原體的出現(xiàn)和重新出現(xiàn)”這里是不夠準確的?!癳merging”有新興的、出現(xiàn)的、形成的等意思,但在本例中該詞應取“新興的”一意,谷歌在選擇詞義時出現(xiàn)錯誤;因此為符合TAUS指南第(1)條要求,對語義不正確的地方進行快速譯后編輯,其他部分機器譯文基本符合TAUS指南的質(zhì)量標準,因此按第(4)條要求保留了大部分原始機器譯文。

      例3

      Human airway epithelial cell cultures were generated in an air-liquid interface for 4 t0 6 weeks toform well-differentiated, polarized cultures resemblingin vivo pseudostratified mucociliary epithelium.

      谷歌譯文(2020年8月9日) 人氣道上皮細胞培養(yǎng)物在氣液界面上產(chǎn)生4至6周,形成分化良好的極化培養(yǎng)物,類似于體內(nèi)假復層粘膜纖毛上皮細胞。

      修改譯文在氣液相界面培養(yǎng)人類呼吸道上皮細胞4至6周,形成分化良好的極化培養(yǎng)物,類似于體內(nèi)假復層粘膜纖毛上皮細胞。

      借助5 - 10秒原則,本例中的“generate”有“繁殖、產(chǎn)生、發(fā)生”等意思,在本句中應取“繁殖”的含義。谷歌在選擇詞義時未能準確根據(jù)語境識別,使譯文句意產(chǎn)生偏差不易理解,因此在按照TAUS指南要求進行快速譯后編輯時對該詞的翻譯進行編輯。而此處指的是“人類呼吸道上皮細胞被繁殖”,因此在譯后編輯時根據(jù)句意將“generate”譯為“培養(yǎng)”。

      (二)分詞短語錯譯

      例4 More than 20,000 viral reads from indi-vidual specimens were obtained, and most contigs matched to the genome from lineage B of the genus betacoronavirus - showing more than 850-/0 identity with a bat SARS-Iike CoV (bat-SL-CoVZC45, MG77 2933.1) genomepublishedpreviously.

      谷歌譯文(2020年8月9日) 從單個標本中獲得了20 000多個病毒讀物,并且大多數(shù)重疊群與beta冠狀病毒屬B譜系的基因組相匹配——與蝙蝠SARS樣冠狀病毒(bat-SL-CoVZC45,MG772933.1)的同一性超過85%基因組先前已發(fā)表。

      修改譯文從單個標本中獲得了20 000多個病毒讀段,大多數(shù)重疊群與β冠狀病毒屬B譜系的基因組相匹配——與之前發(fā)布的蝙蝠SARS樣冠狀病毒( bat-SL-CoVZC45,MG772933.1)基因組的同源性超過85%。

      本例中的“published previously”作為bat SARS-like CoV genome的后置定語,谷歌譯文未對語序進行調(diào)整,保留了其原文的序位,導致譯文產(chǎn)生歧義,不夠準確,所以為符合TAUS指南要求(1),對其進行了調(diào)整。同時,“reads”一詞既有普通釋義又有專業(yè)釋義,需緊扣上下文關(guān)系,選擇醫(yī)學釋義[11]。借助5 - IO秒原則也可快速判斷reads在本篇醫(yī)學報告中譯為“讀物”是不正確的,所以為達到TAUS指南要求,對其進行修改。通過術(shù)語在線查詢該詞,發(fā)現(xiàn)其在生物物理學領(lǐng)域是“測序片段”“測序讀段”的意思,因此將其譯為“讀段”。

      例5

      0ur study showed that initial propagation of human respiratory secretions onto human arrway epithelial cell cultures,followed by transmission elec-tron microscopy and whole genome sequencing of cul-ture supernatant,was successfully used for visualiza-tion and detection of new human coronavirus that canpossibly elude identification by traditional approaches.

      谷歌譯文(2020年8月9日) 我們的研究表明,人呼吸道分泌物在人氣道上皮細胞培養(yǎng)物中的初步繁殖,然后通過透射電子顯微鏡和培養(yǎng)物上清液的全基因組測序,已成功用于可視化和檢測新的人冠狀病毒,而這可能無法通過傳統(tǒng)方法進行鑒定。

      修改譯文我們的研究表明,在人類呼吸道細胞培養(yǎng)基中對人類呼吸道分泌物進行初步繁殖,然后用透射電子顯微鏡觀察并對培養(yǎng)物上清液進行全基因組測序,可成功可視化并檢測新型人類冠狀病毒,而這種病毒可能無法通過傳統(tǒng)方法進行鑒定。

      本例中的分詞短語作插入語,谷歌對該插入語的處理按照原文順序和詞性生成了機器譯文,但邏輯上不夠連貫造成語義不夠準確,引起了理解上的困難,無法達到TAUS指南要求(l)。而Cook曾提出要保證從讀者的認知角度看,譯文語篇要連貫以免給讀者的信息提取設(shè)置障礙和干擾[12]。因此在譯后編輯時根據(jù)前后語境補充了語義,并對整個句子進行了邏輯重組。此外,本例還存在術(shù)語不一致、詞義選擇錯誤以及代詞指代不清等問題,不符合TAUS相關(guān)指南要求的質(zhì)量,因此均對其進行了編輯。

      (三)從句錯譯

      例6 Four lower resprratory tract samples, in-cluding bronchoalveolar-lavage fluid, were collectedfrom patients with pneumonia of unknown cause who were identified in Wuhan on December 21, 2019, orlater and who had been present at the Huanan Seafood Market close to the time of their clinical presentation.

      谷歌譯文(2020年8月9日) 從2019年12月21日或以后在武漢發(fā)現(xiàn)的,原因不明的肺炎患者中收集了四個下呼吸道樣本,包括支氣管肺泡灌洗液,這些樣本在他們離開時已出現(xiàn)在華南海鮮市場臨床表現(xiàn)。

      修改譯文我們從2019年12月21日前后在武漢確診的不明原因肺炎患者身上收集了四份下呼吸道樣本(包括支氣管肺泡灌洗液),他們出現(xiàn)臨床癥狀不久前都曾去過華南海鮮市場。

      借助5 - 10秒原則,可識別出本句最后一句的機器譯文是無法理解的,回看原文可發(fā)現(xiàn)本句有兩個定語從句均修飾“patients”,谷歌在處理時并未準確識別本句邏輯,將第二個從句判定為是修飾句首“samples”的,導致最終生成的譯文句意產(chǎn)生偏差,不符合TAUS指南的要求(1)。因此在譯后編輯時對其進行了修改,將第二個從句的譯文予以修正,并為達到要求(4)對第一個從句的譯文進行了LPE處理。

      例7

      0ur study showed that initial propagationof human respiratory secretions onto human airway epithelial cell cultures, followed by transrmssion elec-tron microscopy and whole genome sequencing of cul-ture supernatant, was successfully used for visualiza-tion and detection of new human coronavirus that canpossibly elude identification by traditional approaches.

      谷歌譯文(2020年8月9日) 我們的研究表明,人呼吸道分泌物在人氣道上皮細胞培養(yǎng)物中的初步繁殖,然后通過透射電子顯微鏡和培養(yǎng)物上清液的全基因組測序,已成功用于可視化和檢測新的人冠狀病毒,這可能無法通過傳統(tǒng)方法進行鑒定。

      修改譯文我們的研究表明,在人類呼吸道細胞培養(yǎng)基中對人類呼吸道分泌物進行初步繁殖,然后用透射電子顯微鏡觀察并對培養(yǎng)物上清液進行全基因組測序,可成功可視化并檢測新型人類冠狀病毒,而這種病毒可能無法通過傳統(tǒng)方法進行鑒定。

      本句較長,借助5 - 10秒原則可發(fā)現(xiàn)最后一句語義不清晰,易產(chǎn)生歧義。仔細閱讀原文,發(fā)現(xiàn)谷歌在處理修飾“new human coronavrrus”的定語從句時,沒有明確引導詞的指代,使譯文句意模糊不夠準確,為達到TAUS指南要求(l),對該處進行了編輯。同時機器譯文還出現(xiàn)了詞性未能準確轉(zhuǎn)換導致譯文意思不夠明確的現(xiàn)象,即對“initialpropagation”的處理不夠靈活準確,所以譯后編輯時將其修改為“進行初步繁殖”。

      (四)段落錯譯、漏譯問題

      例8

      Three adult patients presented with severepneumonia and were admitted to a hospital iIl Wuhan on December 27, 2019. Patient l was a 49-year-oldwoman, Patient 2 was a 61-year-old man, and Patient 3was a 32-year-oldrrian.Clinical profiles were avail-able for Patients l and 2.Patient l reported having nounderlying chronic medical conditions but reportedfever (temperature, 37 cC t0 38 cC) and cough withchest discomfort on December 23, 2019. Four daysafter the onset of illness,her cough and chest discom-fort worsened, but the fever was reduced;a diagnosis of pneumonia was based on computed tomographic(CT) scan. ...Patients l and 3 recovered and were dis-charged from the hospital on January 16, 2020. Patient2 died on January 9,2020. No biopsy specimens were obtained.

      谷歌譯文(2020年10月7日) 三名患有嚴重肺炎的成年患者于2019年12月27日人武漢醫(yī)院。患者1為49歲女性,患者2為61歲男性,患者3為32歲老人患者1和2可獲得臨床資料?;颊?報告于2019年12月23日無基本慢性病,但報告有發(fā)燒(溫度37℃至38℃)和咳嗽伴胸口不適。疾病,咳嗽和胸部不適加劇,但發(fā)燒減少;肺炎的診斷基于計算機斷層掃描(CT)掃描。……患者1和3已康復,并于2020年1月16日出院?;颊?于2020年1月9日死亡。未獲得活檢標本。

      修改譯文 三名患有嚴重肺炎的成年患者于2019年12月27日人武漢醫(yī)院。患者1為49歲女性,患者2為61歲男性,患者3為32歲男性?;颊?和2可獲得臨床資料。患者1報告于2019年12月23日,無基本慢性病,但報告有發(fā)燒(溫度37℃至38℃)和咳嗽伴胸口不適?;颊?在發(fā)病四天后,咳嗽和胸部不適加劇,但發(fā)燒減少,肺炎的診斷基于計算機斷層掃描( CT)掃描?!颊?和3已康復,并于2020年1月16日出院?;颊?于2020年1月9日死亡,未獲得活檢標本。

      根據(jù)5 - 10秒評價原則,可以快速判定“Pa-tient 3 was a 32-year-old man”的譯文是有問題的,然后對其進行了修改。但令人奇怪的是前兩處對于年齡的翻譯處理都很準確,僅此處譯文出現(xiàn)了問題,為進行確認,筆者使用谷歌在線翻譯引擎嘗試了3-4次,都得到了同樣的結(jié)果。而本段中“Fourdays after the onset of illness”被遺漏了,這里的漏譯僅憑5 - 10秒閱讀機器生成的譯文是判定不出來的,必須結(jié)合原文進行審校檢查。但其實該句句法并不復雜,鑒于之前谷歌譯文的良好表現(xiàn),筆者為確認也進行了3-4次的谷歌翻譯嘗試,得出的結(jié)果均相同。鑒于此,筆者認為這是阻礙譯后編輯效率提高的一個重要因素,也是機器翻譯應盡快解決的問題。

      綜上,在本次實踐過程中發(fā)現(xiàn),相當一部分機器原始譯文已符合TAUS指南中“good enoughquality”的要求,不用做太多修改。且機器翻譯質(zhì)量在持續(xù)提高,在醫(yī)學專有名詞、術(shù)語以及被動語態(tài)方面均表現(xiàn)良好,但對一詞多義的詞匯識別還不夠準確,問題較多,同時對長句、結(jié)構(gòu)復雜的句子處理較為糟糕,如定語從句、分詞結(jié)構(gòu)等,轉(zhuǎn)換時無法對句子語序進行調(diào)整,導致譯文意思出現(xiàn)偏差,甚至在翻譯段落時出現(xiàn)漏譯現(xiàn)象。

      通過使用TAUS指南指導LPE的實踐發(fā)現(xiàn),指導性較強的是要求(1)(2)(4),可根據(jù)此三條要求快速做出判斷是否應對機器譯文進行LPE。因本次實踐中未遇到文化上不妥和侵犯信息,以及因本文為英譯漢,漢語無拼寫問題,所以要求(3)和(5)關(guān)于文化和拼寫問題不用討論。要求(4)在應用時應注意盡可能多地保留機器初始譯文是建立在機器譯文質(zhì)量較高的基礎(chǔ)上,譯者應迅速做出判斷是否舍棄機器譯文進行人工翻譯,否則時間成本反而更高。要求(6)無需進行僅跟文風相關(guān)的改正和(7)不需僅為改善譯文流暢度進行句子重組,就允許我們保留一些不符合中文語言習慣但句子含義表達正確的機器譯文而無需進行修改。如例1僅修改了詞匯錯譯的部分,其余均保留機器譯文,節(jié)約了很多時間。通過使用TAUS指南,在進行譯后編輯時會更有目的性,標準更加明確,可盡量避免做一些不必要的修改導致時間成本和人工成本的浪費。當然,TAUS指南仍有許多不足之處,依舊不夠具體,有待在實踐應用中繼續(xù)完善。

      四、結(jié)束語

      語言服務(wù)行業(yè)采用機器翻譯譯后編輯模式來提高翻譯效率和翻譯質(zhì)量,也需要統(tǒng)一規(guī)范的標準來幫助評估工作質(zhì)量并定價。同時好的規(guī)范還可以促進MTPE模式效率和質(zhì)量的進一步提升,如本文按照TAUS指南對“good enough quality”的要求進行快速譯后編輯時,目標更加明確和清晰,避免譯后編輯過程中因標準不確定進行不必要的編輯,導致比純?nèi)斯しg耗時更長的情況發(fā)生。且此類醫(yī)學報告信息交流的時效性尤為關(guān)鍵,因為流行病的傳播快、傳染性強,信息能夠更快實現(xiàn)共享,就可能更早更有效地防控疾病更大范圍傳播,就可能幫助各國醫(yī)務(wù)工作者共同合作更早研究出應對方法。因此,采取較高的機器初始譯文質(zhì)量加清晰的譯后編輯要求(規(guī)則),可幫助譯后編輯者們在更短時間內(nèi)獲得符合預期的譯文。當然本文所遵循的TAUS指南也依舊存在需要改善或進一步細化的地方,相信隨著機器翻譯譯后編輯的發(fā)展,更加完善的規(guī)范會生成,機器翻譯譯后編輯模式也會更加成熟高效。

      參考文獻:

      [1] 馮志偉.機器翻譯與人工智能的平行發(fā)展[J].外國語,2018, 41(6):35 -48.

      [2] 羅季美,李梅.機器翻譯譯文錯誤分析[J].中國翻譯,2012,33 (5): 84-89

      [3] 劉玉強,賀子瓊.醫(yī)學英語的文體特征及其翻譯策略[J].英語廣場,2015( 10): 35 -36.

      [4] 馮全功,崔啟亮,譯后編輯研究:焦點透析與發(fā)展趨勢[J].上海翻譯,2016(6):67 - 74,89.

      [5] TAUS. Post-editing in Practice[EB/OL]. (2010-03-10)[2020-08-20]

      https://www. taus net/think-tank/reports/postedit-reports/postediting-in-practice.

      [6] ISO. IS0

      18587: 2017 Translation services -Post-editing of machine translation output -Require-ments[S]. ISO, 2017.

      [7] 崔啟亮.論機器翻譯的譯后編輯[J].中國翻譯,2014,35 (6): 68-73.

      [8] TATSUMI M. Post-editing machine translated text in acommercial setting: observation and statistical analy-sis[D]. Ireland: Dublin City University, 2010.[9]

      TAUS. TAUS MT Post-editing guidelines[EB/OL](2016-01-20) [2020-08-20].

      https:i/www taus.netithink- tank/reportsipostedit-reports/taus -po st-editing- guidelines.

      [10] SANCHIS-TRIIIES G,ALABAU V,BUCK C,et al.Interactive translation prediction versus conventionalpost-editing in practice:a study with the CasMaCatworkbench[J]. Machine Translation, 2014,

      28(3):217 - 235.

      [11] 李拜華.英漢醫(yī)學翻譯中的詞義選擇[J].中國翻譯,1995 (1): 16-22.

      [12] COOK G.Discourse

      and Literature[M]. Shanghai:Shanghai Foreign Language Education Press, 1999.

      (編輯:朱渭波)

      猜你喜歡
      機器翻譯
      海量數(shù)據(jù)機器單詞中關(guān)鍵語義篩選方法研究
      機器翻譯不可盲取
      青春歲月(2017年1期)2017-03-14 11:28:47
      信息時代下機器翻譯的“可譯”與“不可譯”
      互聯(lián)網(wǎng)+新時代下人機翻譯模式研究
      考試周刊(2017年2期)2017-01-19 09:13:50
      “語聯(lián)網(wǎng)+行業(yè)” 助力中國偉大復興
      考試周刊(2017年2期)2017-01-19 09:12:54
      大數(shù)據(jù)背景下石油科技翻譯
      智富時代(2016年12期)2016-12-01 17:03:10
      機器翻譯不可盲取
      基于免費在線翻譯工具的機器翻譯缺陷探討
      漢哈機器翻譯中的文字轉(zhuǎn)換技術(shù)研究
      機器翻譯句法錯誤分析
      顺义区| 石首市| 治多县| 焦作市| 六枝特区| 沙田区| 安达市| 太谷县| 新郑市| 阳朔县| 阳原县| 绍兴县| 岚皋县| 枣庄市| 顺昌县| 顺义区| 民乐县| 乐安县| 那曲县| 鄂伦春自治旗| 桂阳县| 文化| 海门市| 定边县| 招远市| 清涧县| 交口县| 平南县| 乐都县| 东宁县| 鹤庆县| 陵水| 芮城县| 珠海市| 吴旗县| 西贡区| 金华市| 常宁市| 桃江县| 齐河县| 夏邑县|