仲晨陽(yáng),倪 蓉
(上海理工大學(xué) 外語(yǔ)學(xué)院,上海 200093)
近年來(lái),機(jī)器翻譯質(zhì)量得到了極大改善,信息技術(shù)已經(jīng)與翻譯服務(wù)業(yè)深度融合。同時(shí)傳統(tǒng)的純?nèi)斯しg無(wú)法滿足全球化和本地化催生的海量翻譯需求,且成本相對(duì)較高,新的翻譯業(yè)務(wù)類型與質(zhì)量標(biāo)準(zhǔn)相較以前都有了很多變化,從而促使越來(lái)越多的企業(yè)開(kāi)始用機(jī)器翻譯技術(shù)進(jìn)行初步的翻譯項(xiàng)目處理,也就導(dǎo)致了譯后編輯市場(chǎng)的擴(kuò)大。作為提升機(jī)器翻譯質(zhì)量的新模式,譯后編輯還缺少規(guī)范一致的實(shí)踐原則、質(zhì)量評(píng)估標(biāo)準(zhǔn)等,因此若要該模式得到有效并廣泛的應(yīng)用,還需要清晰明確的各類指導(dǎo)準(zhǔn)則。2016 年,翻譯自動(dòng)化用戶協(xié)會(huì)(Translation Automation User Society,TAUS)發(fā)布了MT Post-editing Guidelines,這是目前可參考的較為完整的機(jī)器翻譯譯后編輯指南。本文根據(jù)該指南對(duì)醫(yī)學(xué)報(bào)告機(jī)器譯文進(jìn)行了快速譯后編輯實(shí)踐,并對(duì)其指導(dǎo)意義及存在的問(wèn)題進(jìn)行了分析。
機(jī)器翻譯的廣泛應(yīng)用產(chǎn)生了巨大的社會(huì)效益和經(jīng)濟(jì)效益?;仡櫰浒l(fā)展歷程,主要經(jīng)歷了四個(gè)階段:一是基于規(guī)則(RBMT);二是基于例子(EBMT);三是統(tǒng)計(jì)機(jī)器翻譯(SMT);四是神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(NMT)。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯利用已有的大規(guī)模的真實(shí)語(yǔ)料庫(kù)來(lái)進(jìn)行深度學(xué)習(xí),從語(yǔ)料庫(kù)中自動(dòng)獲取語(yǔ)言特征和規(guī)則,它是基于大數(shù)據(jù)、使用神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)翻譯的機(jī)器翻譯系統(tǒng)[1]。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的發(fā)展使機(jī)器譯文質(zhì)量得到了質(zhì)的提升。
但是,即便神經(jīng)機(jī)器翻譯系統(tǒng)使機(jī)器譯文質(zhì)量飛速發(fā)展,機(jī)器譯文仍有很多局限性,自然語(yǔ)言處理仍有許多在實(shí)踐中難以解決的問(wèn)題,比如從句錯(cuò)譯、詞匯錯(cuò)譯、譯文調(diào)序失敗、符號(hào)錯(cuò)譯、漏譯等問(wèn)題[2]。醫(yī)學(xué)報(bào)告作為醫(yī)學(xué)文本的一種,其特點(diǎn)就是縮略語(yǔ)、醫(yī)學(xué)術(shù)語(yǔ)使用較多,同時(shí)為表達(dá)客觀及行文簡(jiǎn)潔準(zhǔn)確,被動(dòng)語(yǔ)態(tài)以及分詞結(jié)構(gòu)應(yīng)用較多[3]。機(jī)器在翻譯醫(yī)學(xué)文本時(shí),往往會(huì)出現(xiàn)術(shù)語(yǔ)錯(cuò)譯、漏譯和詞匯替代錯(cuò)譯問(wèn)題,同時(shí)也會(huì)出現(xiàn)對(duì)被動(dòng)句以及分詞結(jié)構(gòu)的處理不當(dāng)導(dǎo)致譯文含義與原文出現(xiàn)偏差的現(xiàn)象。具體可見(jiàn)本文第三節(jié)的實(shí)踐分析。要克服機(jī)器譯文存在的這些缺陷,使譯文質(zhì)量達(dá)到要求,目前最快捷有效的方法就是對(duì)其進(jìn)行人工修改、完善,即進(jìn)行機(jī)器翻譯譯后編輯。
譯后編輯(post-editing)是在語(yǔ)言或格式方面,對(duì)機(jī)器翻譯的原始產(chǎn)出,即初始譯文,進(jìn)行加工與修改來(lái)提高機(jī)譯產(chǎn)出的準(zhǔn)確性與可讀性[4]。2010 年TAUS 實(shí)踐中的譯后編輯報(bào)告將譯后編輯定義為“用最少的人工改進(jìn)機(jī)器生成的翻譯的過(guò)程”[5]。而針對(duì)不同要求和目的,關(guān)于機(jī)器翻譯譯后編輯的ISO 18 587 標(biāo)準(zhǔn)將譯后編輯分為兩個(gè)級(jí)別:快速譯后編輯(Light Post-editing, LPE)、完全譯后編輯(Full Post-editing, FPE)[6]。機(jī)器翻譯譯后編輯模式充分提高機(jī)器翻譯的速度(效率),也保證發(fā)揮人工翻譯的精度(質(zhì)量),從而既滿足翻譯市場(chǎng)快速發(fā)展的需求,也推動(dòng)了翻譯技術(shù)的發(fā)展,還促進(jìn)了學(xué)界和業(yè)界的交流與合作,豐富了語(yǔ)言服務(wù)產(chǎn)業(yè)鏈的組成[7]。
不過(guò)譯后編輯作為新的翻譯工作模式,在實(shí)踐過(guò)程中除了要識(shí)別并糾正上述機(jī)器譯文各類錯(cuò)誤之外,還需考慮效率、質(zhì)量要求、成本等各方面因素。因此譯后編輯在發(fā)展過(guò)程中還需要獨(dú)立、一致的標(biāo)準(zhǔn)來(lái)衡量和約束譯后編輯的質(zhì)量,確定譯后編輯工作量等,幫助譯后編輯者更加高效高質(zhì)地完成譯后編輯任務(wù),同時(shí)培養(yǎng)出更多高質(zhì)量的譯后編輯人員。但目前機(jī)器翻譯譯后編輯相關(guān)的大部分實(shí)踐準(zhǔn)則就比較宏觀,如崔啟亮提出的實(shí)踐準(zhǔn)則相對(duì)宏觀,進(jìn)行實(shí)踐時(shí)還需自行確立具體規(guī)則[7]。而Midori Tatsuni 提出的對(duì)MTPE 譯文相關(guān)的部分要求與TAUS類似,但比較寬泛,并未針對(duì)不同的質(zhì)量要求進(jìn)行細(xì)致劃分,實(shí)際應(yīng)用時(shí)還需綜合考慮各種因素進(jìn)行細(xì)化[8]。目前相對(duì)具體的實(shí)踐準(zhǔn)則是TAUS 發(fā)布的MT POST-EDITING GUIDELINES,根據(jù)不同的質(zhì)量要求列出了對(duì)應(yīng)的原則,所以本文采用該原則指導(dǎo)所選文本的譯后編輯實(shí)踐,以檢驗(yàn)其是否能有效提高譯后編輯效率。
TAUS 成立于2004 年,是全球語(yǔ)言和翻譯行業(yè)的資源中心。該協(xié)會(huì)通過(guò)自己的數(shù)據(jù)云和質(zhì)量評(píng)估服務(wù)為翻譯行業(yè)提供相關(guān)的建議、工具、指標(biāo)、基準(zhǔn)和數(shù)據(jù)等。2016 年,該協(xié)會(huì)發(fā)行了MTPE 指南,旨在促進(jìn)譯后編輯模式的發(fā)展,提升譯后編輯的質(zhì)量和效率,并幫助該行業(yè)選擇、培訓(xùn)高素質(zhì)、高水準(zhǔn)的譯后編輯工作者。
該指南指出,最基本的譯后編輯質(zhì)量評(píng)估準(zhǔn)則有兩條,一是機(jī)器生成的譯文質(zhì)量,二是對(duì)待翻譯材料的最終質(zhì)量預(yù)期,即譯后編輯工作如何進(jìn)行,取決于機(jī)器生成的原始譯文質(zhì)量及客戶對(duì)譯文質(zhì)量的需求[9]。該指南把預(yù)期的最終譯后編輯質(zhì)量大致分為兩個(gè)等級(jí),一級(jí)為“good enough quality”,另一級(jí)為“human translation quality”,其具體要求見(jiàn)表1。
表 1 譯后編輯質(zhì)量要求Tab. 1 Requirements for MT Post-editing
在選擇適用質(zhì)量要求時(shí),主要取決于目標(biāo)讀者或客戶對(duì)最終譯文質(zhì)量的需求(包括最終譯文的受眾或使用目的)以及初始機(jī)器譯文的質(zhì)量。而對(duì)于初始機(jī)器譯文質(zhì)量的評(píng)判,若花費(fèi)太多時(shí)間來(lái)確定其是否可用會(huì)得不償失,降低效率。因此可在決策時(shí)間上加一些限制,若在一定時(shí)間內(nèi)查看一個(gè)機(jī)器翻譯片段(在熟悉源文本和目標(biāo)文本之后),發(fā)現(xiàn)無(wú)法輕松理解,那就舍棄機(jī)器譯文。Mesa-Lao 在其實(shí)驗(yàn)分析中表明,大部分測(cè)試者在初讀機(jī)器譯文上的停留時(shí)間為5~10 秒左右,本文的譯后編輯實(shí)踐即以5~10 秒原則來(lái)判斷是應(yīng)該糾正機(jī)器譯文,還是應(yīng)該刪除并重新翻譯低質(zhì)量的片段[10]。同時(shí)針對(duì)最終譯文質(zhì)量的不同質(zhì)量預(yù)期(是“good enough quality”還是“human translation quality”)以及機(jī)器生成譯文的不同質(zhì)量,采取不同的譯后編輯策略,決定是進(jìn)行LPE 還是FPE。
醫(yī)學(xué)報(bào)告屬于醫(yī)學(xué)類文本,作為科技文本的一種,對(duì)MTPE 模式的適應(yīng)性較強(qiáng),同時(shí)有海量翻譯需求,對(duì)翻譯效率要求較高。本文選取了The New England Journal of Medicine上的醫(yī)學(xué)報(bào)告來(lái)進(jìn)行譯后編輯實(shí)踐,這是關(guān)于2019 新型冠狀肺炎武漢病例分析的報(bào)告,發(fā)布于2020 年1 月24 日,全文約3 000 詞。此文的目的是與醫(yī)學(xué)工作者和研究者共享信息以及時(shí)有效共同應(yīng)對(duì)并預(yù)防疫情。因?yàn)樵摿餍胁魅拘詮?qiáng),傳播速度快,加之如今交通非常發(fā)達(dá),人員流動(dòng)頻繁,所以此類文本信息翻譯非常注重準(zhǔn)確性和時(shí)效性。同時(shí),此類文本譯文目標(biāo)受眾為醫(yī)學(xué)專家或工作者,他們僅需了解原文概述或要點(diǎn),以幫助自己了解疾病相關(guān)信息,共同做好應(yīng)對(duì)準(zhǔn)備并尋找解決辦法,所以可選擇省時(shí)高效的LPE模式進(jìn)行MTPE,使最終譯文達(dá)到“good enough quality”的要求(下文提到的具體準(zhǔn)則均針對(duì)“good enough quality”)。
本文所選擇的機(jī)器翻譯引擎為谷歌翻譯,在實(shí)踐過(guò)程中發(fā)現(xiàn)詞匯錯(cuò)譯、分詞短語(yǔ)錯(cuò)譯、從句錯(cuò)譯以及段落錯(cuò)譯、漏譯問(wèn)題較多,而此前一直被視為難點(diǎn)的被動(dòng)語(yǔ)態(tài)問(wèn)題已不明顯?;谏窠?jīng)網(wǎng)絡(luò)機(jī)器翻譯強(qiáng)大的學(xué)習(xí)能力以及大數(shù)據(jù)的支撐,目前谷歌對(duì)被動(dòng)句的處理表現(xiàn)較為良好,比如,筆者較早時(shí)期實(shí)踐時(shí)發(fā)現(xiàn)的相關(guān)問(wèn)題,在幾個(gè)月之后再次用谷歌生成譯文時(shí),發(fā)現(xiàn)其已經(jīng)對(duì)譯文進(jìn)行了改良,符合“good enough quality”的要求,可不再作為難點(diǎn)進(jìn)行分析。其他相關(guān)案例具體分析如下。
例1In late December 2019, several local health facilities reportedclusters of patients with pneumoniaof unknown cause that were epidemiologically linked to a seafood andwet animalwholesale market in Wuhan, Hubei Province, China. ...We report the results of this investigation, identifying the source ofthe pneumonia clusters, and describe a novel coronavirus detected in patients with pneumonia whose specimens were tested by the China CDC at an early stage of the outbreak.
谷歌譯文(2020 年8 月9 日) 2019 年12 月下旬,幾家地方衛(wèi)生機(jī)構(gòu)報(bào)告了一群原因不明的肺炎,其在流行病學(xué)上與中國(guó)湖北省武漢市的海鮮和濕動(dòng)物批發(fā)市場(chǎng)有關(guān)?!ぁぁぁぁぁの覀儓?bào)告了這項(xiàng)調(diào)查的結(jié)果,確定了肺炎簇的來(lái)源,并描述了在疾病爆發(fā)早期由中國(guó)疾病預(yù)防控制中心檢測(cè)其標(biāo)本的肺炎患者中檢測(cè)到的新型冠狀病毒。
修改譯文2019 年12 月下旬,中國(guó)湖北武漢幾家當(dāng)?shù)氐尼t(yī)療機(jī)構(gòu)報(bào)告了一群原因不明的肺炎患者,從流行病學(xué)角度看,均與當(dāng)?shù)氐囊患液ur和水產(chǎn)動(dòng)物批發(fā)市場(chǎng)有關(guān)?!覀儓?bào)告了本次的調(diào)查結(jié)果,確定了肺炎患者群體的來(lái)源,并描述了在疾病爆發(fā)早期由中國(guó)疾病預(yù)防控制中心檢測(cè)其標(biāo)本的肺炎患者中檢測(cè)到的新型冠狀病毒。
通過(guò)5~10 秒原則可快速識(shí)別出谷歌關(guān)于“wet animals”和“clusters”的翻譯出現(xiàn)了錯(cuò)誤,導(dǎo)致句意出現(xiàn)偏差,為達(dá)到要求(1)“語(yǔ)義正確”,對(duì)這兩處進(jìn)行了編輯,而“clusters”也按照上下文語(yǔ)境選擇正確的詞義。同時(shí)對(duì)比原文還發(fā)現(xiàn),谷歌譯文出現(xiàn)了信息遺漏的現(xiàn)象,漏譯了“clusters of patients”,因此為達(dá)到TAUS 指南要求(2)“確保信息無(wú)遺漏”,確保譯文信息無(wú)添加或遺漏,在進(jìn)行快速譯后編輯時(shí)將遺漏信息補(bǔ)全。
例2Emerging and reemerging pathogensare global challenges for public health. Coronaviruses are enveloped RNA viruses that are distributed broadly among humans, other mammals, and birds and that cause respiratory, enteric, hepatic, and neurologic diseases.
谷歌譯文(2020 年8 月9 日) 病原體的出現(xiàn)和重新出現(xiàn)是公共衛(wèi)生的全球性挑戰(zhàn)。冠狀病毒是被包膜的RNA 病毒,廣泛分布于人類,其他哺乳動(dòng)物和鳥(niǎo)類中,并引起呼吸系統(tǒng),腸道,肝臟和神經(jīng)系統(tǒng)疾病。
修改譯文新興和再現(xiàn)病原體是公共衛(wèi)生的全球性挑戰(zhàn)。冠狀病毒是有包膜RNA 病毒,廣泛分布于人類、其他哺乳動(dòng)物以及鳥(niǎo)類宿主中,并可引起呼吸道、腸道、肝臟和神經(jīng)系統(tǒng)疾病。
結(jié)合5~10 秒原則以及醫(yī)學(xué)文本翻譯的重難點(diǎn),可觀察到“病原體的出現(xiàn)和重新出現(xiàn)”這里是不夠準(zhǔn)確的?!癳merging”有新興的、出現(xiàn)的、形成的等意思,但在本例中該詞應(yīng)取“新興的”一意,谷歌在選擇詞義時(shí)出現(xiàn)錯(cuò)誤;因此為符合TAUS 指南第(1)條要求,對(duì)語(yǔ)義不正確的地方進(jìn)行快速譯后編輯,其他部分機(jī)器譯文基本符合TAUS 指南的質(zhì)量標(biāo)準(zhǔn),因此按第(4)條要求保留了大部分原始機(jī)器譯文。
例3Human airway epithelial cell cultures weregeneratedin an air-liquid interface for 4 to 6 weeks to form well-differentiated, polarized cultures resembling in vivo pseudostratified mucociliary epithelium.
谷歌譯文(2020 年8 月9 日) 人氣道上皮細(xì)胞培養(yǎng)物在氣液界面上產(chǎn)生4 至6 周,形成分化良好的極化培養(yǎng)物,類似于體內(nèi)假?gòu)?fù)層粘膜纖毛上皮細(xì)胞。
修改譯文在氣液相界面培養(yǎng)人類呼吸道上皮細(xì)胞4 至6 周, 形成分化良好的極化培養(yǎng)物,類似于體內(nèi)假?gòu)?fù)層粘膜纖毛上皮細(xì)胞。
借助5~10 秒原則,本例中的“generate”有“繁殖、產(chǎn)生、發(fā)生”等意思,在本句中應(yīng)取“繁殖”的含義。谷歌在選擇詞義時(shí)未能準(zhǔn)確根據(jù)語(yǔ)境識(shí)別,使譯文句意產(chǎn)生偏差不易理解,因此在按照TAUS 指南要求進(jìn)行快速譯后編輯時(shí)對(duì)該詞的翻譯進(jìn)行編輯。而此處指的是“人類呼吸道上皮細(xì)胞被繁殖”,因此在譯后編輯時(shí)根據(jù)句意將“generate”譯為“培養(yǎng)”。
例4More than 20,000 viralreadsfrom individual specimens were obtained, and most contigs matched to the genome from lineage B of the genus betacoronavirus-showing more than 85% identity with a bat SARS-like CoV (bat-SL-CoVZC45, MG77 2933.1) genomepublished previously.
谷歌譯文(2020 年8 月9 日) 從單個(gè)標(biāo)本中獲得了20 000 多個(gè)病毒讀物,并且大多數(shù)重疊群與beta 冠狀病毒屬B 譜系的基因組相匹配-與蝙 蝠 SARS 樣 冠 狀 病 毒( bat-SL-CoVZC45,MG772933.1)的同一性超過(guò)85%基因組先前已發(fā)表。
修改譯文從單個(gè)標(biāo)本中獲得了20 000 多個(gè)病毒讀段,大多數(shù)重疊群與β 冠狀病毒屬B 譜系的基因組相匹配-與之前發(fā)布的蝙蝠SARS樣冠狀病毒(bat-SL-CoVZC45,MG772933.1)基因組的同源性超過(guò)85%。
本例中的“published previously”作為bat SARSlike CoV genome 的后置定語(yǔ),谷歌譯文未對(duì)語(yǔ)序進(jìn)行調(diào)整,保留了其原文的序位,導(dǎo)致譯文產(chǎn)生歧義,不夠準(zhǔn)確,所以為符合TAUS 指南要求(1),對(duì)其進(jìn)行了調(diào)整。同時(shí),“reads”一詞既有普通釋義又有專業(yè)釋義,需緊扣上下文關(guān)系,選擇醫(yī)學(xué)釋義[11]。借助5~10 秒原則也可快速判斷reads 在本篇醫(yī)學(xué)報(bào)告中譯為“讀物”是不正確的,所以為達(dá)到TAUS 指南要求,對(duì)其進(jìn)行修改。通過(guò)術(shù)語(yǔ)在線查詢?cè)撛~,發(fā)現(xiàn)其在生物物理學(xué)領(lǐng)域是“測(cè)序片段”“測(cè)序讀段”的意思,因此將其譯為“讀段”。
例5Our study showed that initial propagation of human respiratory secretions onto human airway epithelial cell cultures,followed by transmission electron microscopy and whole genome sequencing of culture supernatant, was successfully used for visualization and detection of new human coronavirus that can possibly elude identification by traditional approaches.
谷歌譯文(2020 年8 月9 日) 我們的研究表明,人呼吸道分泌物在人氣道上皮細(xì)胞培養(yǎng)物中的初步繁殖,然后通過(guò)透射電子顯微鏡和培養(yǎng)物上清液的全基因組測(cè)序,已成功用于可視化和檢測(cè)新的人冠狀病毒,而這可能無(wú)法通過(guò)傳統(tǒng)方法進(jìn)行鑒定。
修改譯文我們的研究表明,在人類呼吸道細(xì)胞培養(yǎng)基中對(duì)人類呼吸道分泌物進(jìn)行初步繁殖,然后用透射電子顯微鏡觀察并對(duì)培養(yǎng)物上清液進(jìn)行全基因組測(cè)序,可成功可視化并檢測(cè)新型人類冠狀病毒,而這種病毒可能無(wú)法通過(guò)傳統(tǒng)方法進(jìn)行鑒定。
本例中的分詞短語(yǔ)作插入語(yǔ),谷歌對(duì)該插入語(yǔ)的處理按照原文順序和詞性生成了機(jī)器譯文,但邏輯上不夠連貫造成語(yǔ)義不夠準(zhǔn)確,引起了理解上的困難,無(wú)法達(dá)到TAUS 指南要求(1)。而Cook 曾提出要保證從讀者的認(rèn)知角度看,譯文語(yǔ)篇要連貫以免給讀者的信息提取設(shè)置障礙和干擾[12]。因此在譯后編輯時(shí)根據(jù)前后語(yǔ)境補(bǔ)充了語(yǔ)義,并對(duì)整個(gè)句子進(jìn)行了邏輯重組。此外,本例還存在術(shù)語(yǔ)不一致、詞義選擇錯(cuò)誤以及代詞指代不清等問(wèn)題,不符合TAUS 相關(guān)指南要求的質(zhì)量,因此均對(duì)其進(jìn)行了編輯。
例6Four lower respiratory tract samples, including bronchoalveolar-lavage fluid, were collected from patients with pneumonia of unknown cause who were identified in Wuhan on December 21, 2019, or later andwho had been present at the Huanan Seafood Market close to the time of their clinical presentation.
谷歌譯文(2020 年8 月9 日) 從2019 年12月21 日或以后在武漢發(fā)現(xiàn)的,原因不明的肺炎患者中收集了四個(gè)下呼吸道樣本,包括支氣管肺泡灌洗液,這些樣本在他們離開(kāi)時(shí)已出現(xiàn)在華南海鮮市場(chǎng)臨床表現(xiàn)。
修改譯文我們從2019 年12 月21 日前后在武漢確診的不明原因肺炎患者身上收集了四份下呼吸道樣本(包括支氣管肺泡灌洗液),他們出現(xiàn)臨床癥狀不久前都曾去過(guò)華南海鮮市場(chǎng)。
借助5~10 秒原則,可識(shí)別出本句最后一句的機(jī)器譯文是無(wú)法理解的,回看原文可發(fā)現(xiàn)本句有兩個(gè)定語(yǔ)從句均修飾“patients”,谷歌在處理時(shí)并未準(zhǔn)確識(shí)別本句邏輯,將第二個(gè)從句判定為是修飾句首“samples”的,導(dǎo)致最終生成的譯文句意產(chǎn)生偏差,不符合TAUS 指南的要求(1)。因此在譯后編輯時(shí)對(duì)其進(jìn)行了修改,將第二個(gè)從句的譯文予以修正,并為達(dá)到要求(4)對(duì)第一個(gè)從句的譯文進(jìn)行了LPE 處理。
例7Our study showed thatinitial propagation ofhuman respiratory secretions onto human airway epithelial cell cultures, followed by transmission electron microscopy and whole genome sequencing of culture supernatant, was successfully used for visualization and detection of new human coronavirusthat can possibly elude identification by traditional approaches.
谷歌譯文(2020 年8 月9 日) 我們的研究表明,人呼吸道分泌物在人氣道上皮細(xì)胞培養(yǎng)物中的初步繁殖,然后通過(guò)透射電子顯微鏡和培養(yǎng)物上清液的全基因組測(cè)序,已成功用于可視化和檢測(cè)新的人冠狀病毒,這可能無(wú)法通過(guò)傳統(tǒng)方法進(jìn)行鑒定。
修改譯文我們的研究表明,在人類呼吸道細(xì)胞培養(yǎng)基中對(duì)人類呼吸道分泌物進(jìn)行初步繁殖,然后用透射電子顯微鏡觀察并對(duì)培養(yǎng)物上清液進(jìn)行全基因組測(cè)序,可成功可視化并檢測(cè)新型人類冠狀病毒,而這種病毒可能無(wú)法通過(guò)傳統(tǒng)方法進(jìn)行鑒定。
本句較長(zhǎng),借助5~10 秒原則可發(fā)現(xiàn)最后一句語(yǔ)義不清晰,易產(chǎn)生歧義。仔細(xì)閱讀原文,發(fā)現(xiàn)谷歌在處理修飾“new human coronavirus”的定語(yǔ)從句時(shí),沒(méi)有明確引導(dǎo)詞的指代,使譯文句意模糊不夠準(zhǔn)確,為達(dá)到TAUS 指南要求(1),對(duì)該處進(jìn)行了編輯。同時(shí)機(jī)器譯文還出現(xiàn)了詞性未能準(zhǔn)確轉(zhuǎn)換導(dǎo)致譯文意思不夠明確的現(xiàn)象,即對(duì)“initial propagation”的處理不夠靈活準(zhǔn)確,所以譯后編輯時(shí)將其修改為“進(jìn)行初步繁殖”。
例8 Three adult patients presented with severe pneumonia and were admitted to a hospital in Wuhan on December 27, 2019. Patient 1 was a 49-year-old woman, Patient 2 was a 61-year-old man, and Patient 3 wasa 32-year-old man.Clinical profiles were available for Patients 1 and 2. Patient 1 reported having no underlying chronic medical conditions but reported fever (temperature, 37 ℃ to 38 ℃) and cough with chest discomfort on December 23, 2019.Four days after the onset of illness,her cough and chest discomfort worsened, but the fever was reduced; a diagnosis of pneumonia was based on computed tomographic(CT) scan. ...Patients 1 and 3 recovered and were discharged from the hospital on January 16, 2020. Patient 2 died on January 9, 2020. No biopsy specimens were obtained.
谷歌譯文(2020 年10 月7 日) 三名患有嚴(yán)重肺炎的成年患者于2019 年12 月27 日入武漢醫(yī)院?;颊? 為49 歲女性,患者2 為61 歲男性,患者3 為32 歲老人患者1 和2 可獲得臨床資料?;颊? 報(bào)告于2019 年12 月23 日無(wú)基本慢性病,但報(bào)告有發(fā)燒(溫度37 ℃至38 ℃)和咳嗽伴胸口不適。疾病,咳嗽和胸部不適加劇,但發(fā)燒減少;肺炎的診斷基于計(jì)算機(jī)斷層掃描(CT)掃描。……患者1 和3 已康復(fù),并于2020 年1 月16 日出院?;颊? 于2020 年1 月9 日死亡。未獲得活檢標(biāo)本。
修改譯文三名患有嚴(yán)重肺炎的成年患者于2019 年12 月27 日入武漢醫(yī)院?;颊? 為49 歲女性,患者2 為61 歲男性,患者3 為32 歲男性?;颊? 和2 可獲得臨床資料?;颊? 報(bào)告于2019 年12 月23 日,無(wú)基本慢性病,但報(bào)告有發(fā)燒(溫度37 ℃至38 ℃)和咳嗽伴胸口不適。患者1 在發(fā)病四天后,咳嗽和胸部不適加劇,但發(fā)燒減少,肺炎的診斷基于計(jì)算機(jī)斷層掃描(CT)掃描?!颊? 和3 已康復(fù),并于2020 年1 月16 日出院?;颊? 于2020 年1 月9 日死亡,未獲得活檢標(biāo)本。
根據(jù)5~10 秒評(píng)價(jià)原則,可以快速判定“Patient 3 was a 32-year-old man”的譯文是有問(wèn)題的,然后對(duì)其進(jìn)行了修改。但令人奇怪的是前兩處對(duì)于年齡的翻譯處理都很準(zhǔn)確,僅此處譯文出現(xiàn)了問(wèn)題,為進(jìn)行確認(rèn),筆者使用谷歌在線翻譯引擎嘗試了3~4 次,都得到了同樣的結(jié)果。而本段中“Four days after the onset of illness”被遺漏了,這里的漏譯僅憑5~10 秒閱讀機(jī)器生成的譯文是判定不出來(lái)的,必須結(jié)合原文進(jìn)行審校檢查。但其實(shí)該句句法并不復(fù)雜,鑒于之前谷歌譯文的良好表現(xiàn),筆者為確認(rèn)也進(jìn)行了3~4 次的谷歌翻譯嘗試,得出的結(jié)果均相同。鑒于此,筆者認(rèn)為這是阻礙譯后編輯效率提高的一個(gè)重要因素,也是機(jī)器翻譯應(yīng)盡快解決的問(wèn)題。
綜上,在本次實(shí)踐過(guò)程中發(fā)現(xiàn),相當(dāng)一部分機(jī)器原始譯文已符合TAUS 指南中“good enough quality”的要求,不用做太多修改。且機(jī)器翻譯質(zhì)量在持續(xù)提高,在醫(yī)學(xué)專有名詞、術(shù)語(yǔ)以及被動(dòng)語(yǔ)態(tài)方面均表現(xiàn)良好,但對(duì)一詞多義的詞匯識(shí)別還不夠準(zhǔn)確,問(wèn)題較多,同時(shí)對(duì)長(zhǎng)句、結(jié)構(gòu)復(fù)雜的句子處理較為糟糕,如定語(yǔ)從句、分詞結(jié)構(gòu)等,轉(zhuǎn)換時(shí)無(wú)法對(duì)句子語(yǔ)序進(jìn)行調(diào)整,導(dǎo)致譯文意思出現(xiàn)偏差,甚至在翻譯段落時(shí)出現(xiàn)漏譯現(xiàn)象。
通過(guò)使用TAUS 指南指導(dǎo)LPE 的實(shí)踐發(fā)現(xiàn),指導(dǎo)性較強(qiáng)的是要求(1)(2)(4),可根據(jù)此三條要求快速做出判斷是否應(yīng)對(duì)機(jī)器譯文進(jìn)行LPE。因本次實(shí)踐中未遇到文化上不妥和侵犯信息,以及因本文為英譯漢,漢語(yǔ)無(wú)拼寫(xiě)問(wèn)題,所以要求(3)和(5)關(guān)于文化和拼寫(xiě)問(wèn)題不用討論。要求(4)在應(yīng)用時(shí)應(yīng)注意盡可能多地保留機(jī)器初始譯文是建立在機(jī)器譯文質(zhì)量較高的基礎(chǔ)上,譯者應(yīng)迅速做出判斷是否舍棄機(jī)器譯文進(jìn)行人工翻譯,否則時(shí)間成本反而更高。要求(6)無(wú)需進(jìn)行僅跟文風(fēng)相關(guān)的改正和(7)不需僅為改善譯文流暢度進(jìn)行句子重組,就允許我們保留一些不符合中文語(yǔ)言習(xí)慣但句子含義表達(dá)正確的機(jī)器譯文而無(wú)需進(jìn)行修改。如例1 僅修改了詞匯錯(cuò)譯的部分,其余均保留機(jī)器譯文,節(jié)約了很多時(shí)間。通過(guò)使用TAUS 指南,在進(jìn)行譯后編輯時(shí)會(huì)更有目的性,標(biāo)準(zhǔn)更加明確,可盡量避免做一些不必要的修改導(dǎo)致時(shí)間成本和人工成本的浪費(fèi)。當(dāng)然,TAUS 指南仍有許多不足之處,依舊不夠具體,有待在實(shí)踐應(yīng)用中繼續(xù)完善。
語(yǔ)言服務(wù)行業(yè)采用機(jī)器翻譯譯后編輯模式來(lái)提高翻譯效率和翻譯質(zhì)量,也需要統(tǒng)一規(guī)范的標(biāo)準(zhǔn)來(lái)幫助評(píng)估工作質(zhì)量并定價(jià)。同時(shí)好的規(guī)范還可以促進(jìn)MTPE 模式效率和質(zhì)量的進(jìn)一步提升,如本文按照TAUS 指南對(duì)“good enough quality”的要求進(jìn)行快速譯后編輯時(shí),目標(biāo)更加明確和清晰,避免譯后編輯過(guò)程中因標(biāo)準(zhǔn)不確定進(jìn)行不必要的編輯,導(dǎo)致比純?nèi)斯しg耗時(shí)更長(zhǎng)的情況發(fā)生。且此類醫(yī)學(xué)報(bào)告信息交流的時(shí)效性尤為關(guān)鍵,因?yàn)榱餍胁〉膫鞑タ?、傳染性?qiáng),信息能夠更快實(shí)現(xiàn)共享,就可能更早更有效地防控疾病更大范圍傳播,就可能幫助各國(guó)醫(yī)務(wù)工作者共同合作更早研究出應(yīng)對(duì)方法。因此,采取較高的機(jī)器初始譯文質(zhì)量加清晰的譯后編輯要求(規(guī)則),可幫助譯后編輯者們?cè)诟虝r(shí)間內(nèi)獲得符合預(yù)期的譯文。當(dāng)然本文所遵循的TAUS指南也依舊存在需要改善或進(jìn)一步細(xì)化的地方,相信隨著機(jī)器翻譯譯后編輯的發(fā)展,更加完善的規(guī)范會(huì)生成,機(jī)器翻譯譯后編輯模式也會(huì)更加成熟高效。
上海理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2022年3期