張凌霄,陳亦菲,郭 瑜
(南京師范大學(xué)外國語學(xué)院,江蘇 南京 210046)
隨著科技不斷發(fā)展,國際學(xué)術(shù)交流日益密切,人們的跨語種對話需求增長,實時語音翻譯軟件在市場上大量涌現(xiàn)。但是,目前的口譯APP良莠不齊,不同專業(yè)領(lǐng)域的用戶適合何種口譯軟件、各類口譯軟件的用戶體驗感如何還需要進一步調(diào)查分析。我們選擇對目前研究較少的“口譯APP”,選取市面上三款熱門口譯APP,深入對比某些重點學(xué)科領(lǐng)域(包括但不限于法律、財經(jīng)、新能源、人工智能領(lǐng)域)的翻譯結(jié)果,探究口譯APP的應(yīng)用現(xiàn)狀并預(yù)測其發(fā)展前景[1]。
機器翻譯(Machine Translation,即MT)是指通過計算機把一種語言轉(zhuǎn)換為另一種或多種語言文本的過程。從上世紀(jì)70年代至今,機器翻譯經(jīng)歷了從“直接翻譯”到“深度學(xué)習(xí)的神經(jīng)機器翻譯”的發(fā)展。目前,深度學(xué)習(xí)技術(shù)的大規(guī)模應(yīng)用使機器翻譯的效果得到了巨大的提升。
近年人工智能翻譯的質(zhì)量不斷提升,然而由于依賴大數(shù)據(jù)及概率的推算,目前的機器翻譯技術(shù)在復(fù)雜語法、篇章等方面仍有欠缺,在文學(xué)、法律等專業(yè)領(lǐng)域也尚有許多不足。因此,人機耦合成為了更好的選擇。利用機器預(yù)先做好復(fù)雜繁瑣或重復(fù)性的工作,再由人工進行后期編輯處理,并為機器提供新的語料和訓(xùn)練,實現(xiàn)機器翻譯與人工翻譯相互促進[2]。
專業(yè)筆譯方面,計算機輔助翻譯應(yīng)用的普及有力地推動其變革,促進譯員之間協(xié)作,保證項目分工的流暢、機器預(yù)翻譯、統(tǒng)一規(guī)范術(shù)語等,極大提高了筆譯效率。專業(yè)口譯方面,由于口頭語言更復(fù)雜多變,為語音識別及解析帶來了更大挑戰(zhàn)。目前,機器翻譯在口譯方面的表現(xiàn)遠(yuǎn)不如筆譯,但在人機耦合的情況下,隨著語音技術(shù)的發(fā)展,機器可以幫助譯員整理筆記和專業(yè)詞匯,提高翻譯效率[3]。
大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能技術(shù)的發(fā)展對我國產(chǎn)業(yè)發(fā)展產(chǎn)生了巨大的影響,諸多產(chǎn)業(yè)紛紛開始將產(chǎn)品與人工智能相融合,其中包括語言服務(wù)業(yè)。眾多商業(yè)巨頭推出實時翻譯產(chǎn)品,迎合市場的同時有力地推進了人工智能翻譯應(yīng)用的發(fā)展與研究[4]。
國內(nèi)現(xiàn)有的翻譯應(yīng)用中以“技術(shù)派”與“應(yīng)用派”為代表,前者擁有突出技術(shù),依靠網(wǎng)絡(luò)平臺在語音識別、文字識別、語種方言、翻譯技術(shù)等一個或多個方面尤為優(yōu)異,如科大訊飛、搜狗旅行翻譯寶,后者以智能應(yīng)用為特點,不斷升級轉(zhuǎn)型,以更加用戶友好的方式開拓翻譯機器市場,如“咪咕靈犀”AI技術(shù)應(yīng)用、網(wǎng)易有道翻譯王2.0 Pro。然而,AI+翻譯應(yīng)用的市場也存在諸多問題,技術(shù)和應(yīng)用方面都有待提高。
隨著跨境旅游日益增多,國際經(jīng)濟文化交流日益密切,實時翻譯的需求量不斷加大。翻譯APP以其便攜、低成本等優(yōu)勢,逐漸成為多數(shù)人的首選。然而,作為手機軟件,翻譯APP既有機器翻譯本身的不足外,又受制于手機硬件、系統(tǒng)、網(wǎng)絡(luò)等等,其翻譯效果并不能盡如人意。多數(shù)翻譯APP在旅游生活方面能給用戶帶來一定幫助,但在專業(yè)領(lǐng)域語言翻譯方面還鮮有應(yīng)用[5]。
在人工智能翻譯飛速發(fā)展的今天,人工智能翻譯在筆譯、旅游生活實時翻譯等方面表現(xiàn)較好,而在專業(yè)口譯以及各專業(yè)領(lǐng)域翻譯等方面還存在許多不足。因此,我們選擇口譯APP,借助測評、問卷、訪談等多種方式,著重研究分析其在專業(yè)領(lǐng)域的翻譯效果。
本次測試選擇了市面上流行的三大口譯APP為研究對象。三大口譯APP均能做到實時進行語音識別并進行翻譯,其口碑在同類口譯APP中頗佳,在功能和性能方面也各有利弊,可以幫助實驗人員對翻譯結(jié)果進行對比分析[6]。實驗中選取的音視頻材料涵蓋了法律、財經(jīng)、新能源、人工智能這四個領(lǐng)域。
通過文獻(xiàn)研究,我們可以做一個簡單假設(shè)。目前市面上較為流行的口譯APP能基本勝任生活中的輔助交流工作,但是在專業(yè)領(lǐng)域上的能力還有所欠缺,暫時難以為專業(yè)性學(xué)術(shù)交流提供口譯服務(wù)。此外,生活中的交流多偏向于簡單句與口語化表達(dá),而口譯APP在長難句以及書面化語料的翻譯方面則有所欠缺。因此,本文從譯員的評價視角出發(fā),選取專業(yè)領(lǐng)域術(shù)語及長難句書面化語料,對口譯APP的語音識別能力以及翻譯效果進行測試。
本次實驗分為五個步驟,具體步驟如下。
(1)步驟一:建立APP評定標(biāo)準(zhǔn)。本次實驗著重測試口譯 APP在專業(yè)領(lǐng)域的語音識別及翻譯功能,因此以其主要參照因素制定評分細(xì)則。
(2)步驟二:篩選測試語料。收集法律、財經(jīng)、新能源、人工智能四個專業(yè)領(lǐng)域的音、視頻文件,篩選出長度及難度基本相當(dāng)?shù)脑~組、單句、語段進行測試。
(3)步驟三:篩選測試口譯APP。經(jīng)過初步測試,篩選出三款質(zhì)量相對較優(yōu)的口譯APP進行全面、系統(tǒng)的測試。
(4)步驟四:測試機器口譯。測試過程分為了三個階段進行依次測試詞組、單句、語段的測試。
(5)步驟五:評定與分析。記錄每一款口譯APP在每一領(lǐng)域的語音識別結(jié)果及翻譯結(jié)果,生成對比分析報告,歸納總結(jié)口譯APP存在的問題,并提出解決假設(shè)。
通過測試,我們對口譯APP的運轉(zhuǎn)性能、翻譯能力有了更深入的了解。針對同一句句子,不同的口譯APP給出了不同的翻譯結(jié)果,其翻譯的多樣性也能夠給從事專業(yè)翻譯工作的人以啟發(fā)。如“燃料電池汽車使用可再生氫氣,其排放物只有水蒸氣”這句話的三種機器譯文。
(1)Fuel cell vehicles use renewable hydrogen,and their only emissions are water vapor.
(2)Fuel cell vehicles use renewable hydrogen,which emits only water vapor.
(3)Fuel cell cars use renewable cleaners that emit nothing but water vapor.
三種 APP的翻譯結(jié)果都合理準(zhǔn)確,其中(1)句的結(jié)構(gòu)相對簡單,基本屬于直譯;(2)(3)句的定語從句結(jié)構(gòu)使翻譯結(jié)果更為簡潔,使用者可以在保證結(jié)果正確的情況下,根據(jù)使用情境或自身理解運用水平選擇合適口譯APP。
然而,口譯APP還有很多不足之處。在語音識別方面,口譯APP對模糊音的辨別還有待加強,比如識別“What is left unmentioned in contract may be added there as an appendix.”一句中的“unmentioned”,翻譯軟件的識別結(jié)果出現(xiàn)“on mentioned”,導(dǎo)致翻譯出的意思完全相反。
在翻譯方面,會出現(xiàn)專業(yè)名詞錯譯、句子結(jié)構(gòu)判斷錯誤、句子主要成分漏譯等情況。如“發(fā)現(xiàn)了……,由此建立了人工智能的機制模擬方法”,在翻譯其后半段時,各口譯APP均使用了從句結(jié)構(gòu),然而個別軟件漏譯了句子的主要成分,如“…, from which the establishment of artificial intelligence mechanisms,simulation methods.”這句話中缺少了動詞。
通過對口譯APP在中譯英與英譯中兩個方面的口譯測試,我們發(fā)現(xiàn)口譯APP可以勝任日常生活中的基礎(chǔ)交流,但涉及到專業(yè)詞匯、復(fù)雜句式等方面仍然存在問題。語音識別能力和翻譯結(jié)果準(zhǔn)確度作為最影響口譯APP翻譯效果的兩大因素更應(yīng)當(dāng)著重加強。此外,用戶界面、輸入修改操作等也能改善用戶對口譯 APP的使用體驗感。但是,口譯 APP還應(yīng)從語音識別能力和翻譯準(zhǔn)確度入手,優(yōu)化口譯APP詞庫。具體分析如下。
3.2.1 存在問題
(1)語音識別效果。
對中文的語音識別能力較強,但對英文的語音識別能力仍然較弱,個別模糊音難以辨認(rèn),比如在摩擦音和爆破音等輕音的識別上無法準(zhǔn)確識別,發(fā)音相近的單詞識別不準(zhǔn)確,比如上文提到的“unmentioned”。
(2)翻譯效果。
某些專業(yè)領(lǐng)域的詞匯難以翻譯準(zhǔn)確,體現(xiàn)出口譯APP的語料庫在專業(yè)領(lǐng)域還有所欠缺,特別是在法律、人工智能、醫(yī)學(xué)等常用的領(lǐng)域中,擴充專業(yè)名詞的語料庫,以提高專業(yè)詞匯的翻譯準(zhǔn)確度。比如美國著名的達(dá)特茅斯學(xué)院“Dartmouth College”,口譯APP并不能識別出這個專有名詞,應(yīng)而識別結(jié)果為“dot mouse”,“that mouse”等。
(3)用戶體驗感。
有時選擇語音識別選項時無法進行語音識別,需要重新進入口譯APP進行操作,運行性能欠缺,極大地影響了用戶體驗感。同時,有個別口譯APP沒有輸入修改操作,只能重新識別,操作更為繁瑣。3.2.2 解決對策
(1)不斷豐富語料庫。
基于語料庫的機器翻譯系統(tǒng)的發(fā)展與深度學(xué)習(xí)的神經(jīng)機器翻譯的大規(guī)模應(yīng)用說明了在機器翻譯過程中對語料庫進行收集、整理、加工并總結(jié)自然語言規(guī)律的重要性。在新詞、熱詞不斷更新迭代的當(dāng)今時代,語料庫必需不斷擴充以適應(yīng)口譯工作的需要[7]。尤其是專業(yè)領(lǐng)域的詞匯術(shù)語及專有名詞更需要與時俱進。
(2)人機耦合。
APP的語音識別能力難以在短時間內(nèi)有大幅度的提高,所以需要人工進行輔助翻譯。在口譯之前做適當(dāng)?shù)臏?zhǔn)備工作,比如準(zhǔn)備專業(yè)術(shù)語英漢對照表等,在翻譯后可以對翻譯結(jié)果進行適當(dāng)?shù)男薷摹4送?,口譯APP在進行語音識別時,應(yīng)該對識別內(nèi)容有初步的糾錯和改正功能,以提高翻譯的準(zhǔn)確性。同時,輸入修改操作也應(yīng)該更加便捷,這樣彌補了語音識別的不足,有助于增強翻譯結(jié)果準(zhǔn)確度[8]。
經(jīng)過漫長的發(fā)展歷程,機器翻譯行業(yè)在科技迅猛發(fā)展的今天愈發(fā)欣欣向榮,但良好的發(fā)展勢頭的背后,口譯APP仍然在諸多方面亟待完善,如提升語音識別與語音解析水平、提高翻譯速度與準(zhǔn)確度、不斷優(yōu)化善語料庫等。通過不斷地發(fā)展與完善,我們期待口譯APP以其更優(yōu)質(zhì)的性能,開拓廣闊的市場,得到更好的運用,在人類的翻譯事業(yè)中發(fā)揮更大的作用。