黎亞飛 張瑞華
(天津科技大學(xué)外國語學(xué)院,天津 300222)
“機器翻譯(Machine Translation)是利用計算機把一種自然源語轉(zhuǎn)換成另一種自然目標語言的過程。機器翻譯研究如何利用計算機實現(xiàn)自然語言之間的自動翻譯,是人工智能和自然語言處理領(lǐng)域的重要研究方向之一”(劉洋,2017)。機器翻譯作為一門涵蓋計算機科學(xué)、信息學(xué)、語言學(xué)、統(tǒng)計學(xué)等學(xué)科的邊緣學(xué)科,具有多學(xué)科的研究視角和跨學(xué)科的研究價值。計算機科學(xué)與信息工程的巨大進步、現(xiàn)當(dāng)代語言學(xué)和與語料庫語言學(xué)的蓬勃發(fā)展、概率統(tǒng)計學(xué)的引入對機器翻譯的理論研究和方法探索都產(chǎn)生了深刻的影響和巨大的推動作用。人工智能時代到來,機器翻譯的前景一片光明。最初,機器翻譯僅用于軍事和政府文件翻譯,而如今機器翻譯被廣泛應(yīng)用于廣大網(wǎng)民群眾的日常生活,成為大量普通網(wǎng)民日常必備的工具。當(dāng)前,Google 公司推出的循環(huán)神經(jīng)網(wǎng)絡(luò)系統(tǒng)已經(jīng)支持60 多種語言的通用翻譯,微軟必應(yīng)、搜狗、騰訊、百度、網(wǎng)易有道等多家互聯(lián)網(wǎng)公司紛紛推出了自己的互聯(lián)網(wǎng)免費機器翻譯系統(tǒng)(劉群,2012)。機器翻譯質(zhì)量已經(jīng)得到大幅提升,令語言學(xué)和計算機領(lǐng)域的不少學(xué)者開始擔(dān)憂人工智能的發(fā)展會搶走不少從事翻譯工作者的飯碗。
機器翻譯是人工智能不可或缺的一部分,也是計算機語言學(xué)下的重要分支(馮志偉,2011)。早在計算語言學(xué)的萌芽時期,就已得到了長足的發(fā)展。機器翻譯也是語料庫翻譯學(xué)應(yīng)用的一個重要領(lǐng)域。而國內(nèi)語料庫翻譯學(xué)正是濫觴于機器翻譯的研究,始于楊惠中的“語料庫語言學(xué)與機器翻譯”(1993)一文;翻譯記憶軟件技術(shù)的核心就是平行語料庫(張繼光,2016)。根據(jù)知網(wǎng)上學(xué)術(shù)論文數(shù)據(jù)分類顯示,機器翻譯的研究總體上分為兩大類:計算機科學(xué)類和語言學(xué)類。計算機科學(xué)類重點關(guān)注如何改進機器翻譯質(zhì)量,語言學(xué)類則主要關(guān)注計算機輔助翻譯,致力于應(yīng)用機器翻譯來輔助人工翻譯。語言學(xué)類的發(fā)文數(shù)量少于計算機科學(xué)類(李晗佶、陳海慶,2018)。機器翻譯的發(fā)展需要計算機科學(xué)家和語言學(xué)研究者的共同努力(胡清平,2005)。
古希臘時期便有人大膽設(shè)想“用機器來進行自然語言翻譯”。20 世紀30年代初期,法國科學(xué)家G.B.Artsouni 明確提出“用機器來進行自然語言翻譯”的想法。1933年,蘇聯(lián)發(fā)明家ТРОЯНСКИЙ 便設(shè)計了一種機械的語言翻譯機器,并在1933年9月5日申請登記了發(fā)明專利。然而受限于當(dāng)時的科技水平,ТРОЯНСКИЙ 的機器翻譯模型并未制成。1946年,ENIAC 作為世界上第一臺電子計算機在美國賓夕法尼亞大學(xué)的Eckert 與Mauchly 共同努力下誕生。在ENIAC 問世的同一年,美國科學(xué)家Weaver 和英國工程師Booth 又提出了利用計算機進行語言自動翻譯的構(gòu)想。對此英國數(shù)學(xué)家Turing在1947年9月寫給英國國家物理實驗室的一份報告中也談到他在計算機建造計劃中就曾指出,機器翻譯可以顯示出計算機的智能。Weaver1947年首次提出“用解讀密碼方法指導(dǎo)機器翻譯”,這一想法后來便成為了如今統(tǒng)計機器翻譯(SMT)噪聲信道理論的基礎(chǔ)。上世紀90年代,IBM 公司Brown 等開發(fā)人員將其想法完善并付諸實踐,成為現(xiàn)在統(tǒng)計機器翻譯的數(shù)學(xué)模型。1954年,世界上第一次機器翻譯試驗成功,IBM 公司和美國喬治敦大學(xué)用 IBM-701 計算機把幾個簡單的俄語句子翻譯成了英語。隨后,英國、蘇聯(lián)、日本等國家也開始進行機器翻譯試驗。
然而,機器翻譯研究很快便陷入了低谷,直到20 世紀70年代末,機器翻譯開始走向?qū)嵱没?。一系列機器翻譯實用系統(tǒng)如EURPOTRA 多國語翻譯系統(tǒng)、Weinder 系統(tǒng)、TAUM-METEO 系統(tǒng)等先后出現(xiàn)。1976年,在與加拿大蒙特利爾大學(xué)合作下,加拿大聯(lián)邦政府翻譯局開發(fā)出實用性機器翻譯系統(tǒng)TAUM-METEO 并正式投入使用——提供天氣預(yù)報的翻譯服務(wù)。據(jù)稱此翻譯系統(tǒng)每天可以翻譯1500~2000 篇天氣預(yù)報資料,翻譯速度可達6~30 萬詞/時,且能通過電視、報紙立即公布。20 世紀90年代初期,IBM 公司Brown 等人提出基于信源信道思想的統(tǒng)計機器翻譯模型。同時期,人工神經(jīng)網(wǎng)絡(luò)翻譯再次把機器翻譯研究推向熱潮。神經(jīng)網(wǎng)絡(luò)法最早可追溯到1997年,西班牙學(xué)者?eco和Forcada 提出利用“編碼-解碼”框架進行翻譯的思想。2002年1月,世界上第一家把統(tǒng)計機器翻譯軟件商品化的公司Language Weaver 于美國成立,致力于研制統(tǒng)計機器翻譯軟件(Statistical Machine Translation Software)。2013年,基于人工神經(jīng)網(wǎng)絡(luò)的機器翻譯(Neural Machine Translation )嶄露頭角,加拿大蒙特利爾大學(xué)的機器學(xué)習(xí)實驗室發(fā)布了開源的基于神經(jīng)網(wǎng)絡(luò)的機譯系統(tǒng)GroundHog;百度2015年發(fā)布了將統(tǒng)計和自動學(xué)習(xí)相結(jié)合的在線機譯系統(tǒng);Google 2016年 在ArXiv.org 上發(fā)文介紹了谷歌的循環(huán)神經(jīng)機器翻譯系統(tǒng)(Google Recurrent Neural Machine Translation);Facebook2017年推出基于卷積神經(jīng)網(wǎng)絡(luò)開發(fā)的語言翻譯模型(Convolutional Neural Machine Translation)。
基于人工神經(jīng)網(wǎng)絡(luò)的機器翻譯系統(tǒng)引入了當(dāng)前最先進的技術(shù),實現(xiàn)了目前為止機器翻譯質(zhì)量的大幅提升。據(jù)稱,Google 公司在用循環(huán)神經(jīng)網(wǎng)絡(luò)系統(tǒng)進行機器翻譯實驗中,取得了驚人的成就,其中漢英機器翻譯的錯誤率下降了85%,而英語-西班牙語和法語-英語的神經(jīng)機器翻譯幾乎可以與人工翻譯相媲美。Facebook 用其推出的基于卷積神經(jīng)網(wǎng)絡(luò)開發(fā)的語言翻譯模型進行翻譯實驗,其速度比谷歌公司基于循環(huán)神經(jīng)網(wǎng)絡(luò)開發(fā)的語言翻譯模型要快9 倍,且翻譯準確率更高。測試結(jié)果表明,前者在英-德、英-法的測試上都比后者更接近人工翻譯水平(馮志偉,2018)。機器翻譯在處理一般的形合語言、規(guī)則特征顯化的文本時,忠實度較高,譯文可讀性較強,其翻譯水平基本接近人工翻譯水平,尤其是在處理日常對話文本、新聞科技文本時,其優(yōu)勢更為突出。2017年國際機器翻譯會議(WMT)對于新聞文本的機器翻譯結(jié)果進行了評測,主流語言之間的機器翻譯測評得分都比較高(其測評得分均在70%以上),例如:漢英系統(tǒng)和英漢系統(tǒng)得分均為73%,德英系統(tǒng)得分78%,英德系統(tǒng)得分73%,俄英系統(tǒng)得分82%,英俄系統(tǒng)得分75%(由于法語-西班牙語與法語-英語機器翻譯系統(tǒng)已經(jīng)比較成熟,沒有參加這次評測)(馮志偉,2018)。
在這個信息爆炸的大數(shù)據(jù)時代,機器翻譯的研究是歷史發(fā)展的必然產(chǎn)物,機器翻譯的前景也是一片光明。谷歌、微軟、百度、搜狗、騰訊、科大訊飛、阿里巴巴、網(wǎng)易有道等多家互聯(lián)網(wǎng)公司紛紛推出了自己的互聯(lián)網(wǎng)在線機器翻譯系統(tǒng),用戶只需登錄相應(yīng)網(wǎng)站,便可免費獲取翻譯結(jié)果。機器翻譯研究不斷注有新活力,取得了不容小覷的成就。目前,谷歌公司推出的循環(huán)神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)已經(jīng)可以支持60 多種語言的實時互譯,國內(nèi)百度在線機器翻譯系統(tǒng)也已經(jīng)可以支持28 種語言旳實時互譯。這些互聯(lián)網(wǎng)在線機器翻譯系統(tǒng)適配手機端、PC 端、平板電腦端、網(wǎng)頁端及各個瀏覽器插件等多種終端平臺;其功能也相當(dāng)人性化、多樣化,支持屏幕取詞、文字掃描翻譯、拍照翻譯、離線翻譯、網(wǎng)頁翻譯等多種翻譯形式;其翻譯質(zhì)量雖然有待提升,但是在日常對話、新聞翻譯等領(lǐng)域已經(jīng)較為出色。表1 是以騰訊翻譯君為例,截取本論文摘要部分來進行翻譯質(zhì)量的展示。
表1 “騰訊翻譯君”示例
大眾通常所理解并接觸到的機器翻譯指的是互聯(lián)網(wǎng)機器翻譯系統(tǒng)中的通用翻譯功能,網(wǎng)民只需登錄相關(guān)網(wǎng)站或者服務(wù)器,便可免費獲取翻譯結(jié)果,只是翻譯的字數(shù)或多或少會有限制,非商業(yè)用途已是足夠。其實這些網(wǎng)絡(luò)機器翻譯系統(tǒng)和平臺不僅提供通用翻譯,還提供垂直領(lǐng)域翻譯、定制化翻譯、語種識別、人工翻譯等功能,這些功能會適當(dāng)收取一定費用。以百度翻譯系統(tǒng)為例,通用翻譯已支持28 種語言在線實時互譯,每人每月可享受200 萬字符免費翻譯;垂直領(lǐng)域翻譯目前適用于科技電子類、水利機械類、生物醫(yī)藥類三個垂直領(lǐng)域,收費標準為49 元/百萬字符,垂直領(lǐng)域翻譯專有名詞、術(shù)語等更加準確;定制化翻譯依托大規(guī)模雙語語料,付費標準依情況而定,其翻譯結(jié)果基本接近人工翻譯水平,表2 列出的是旅游領(lǐng)域和科技領(lǐng)域的幾個例子。
百度翻譯目前支持中、英、日、韓、泰、越六個語種精準識別,且目前供網(wǎng)民免費試用;語音即時翻譯目前支持中、英、日、粵四種語言的源語音識別、12 種目標語言的語音輸出及28 種目標語言的文本翻譯結(jié)果,每人每月可享用一萬次免費調(diào)用量,超出部分每次收費0.02 元/次起;拍照翻譯目前支持中、英、日、韓、法、德、葡、意、西、俄等10 個語種的源語言的識別,中、英、日、韓、俄、法等28種目標語言的輸出,每人每月可享用一萬次免費調(diào)用量,超出部分每次收費0.03 元/次起。不僅如此,科大訊飛、騰訊等互聯(lián)網(wǎng)機器翻譯平臺也開始提供語音文字轉(zhuǎn)化服務(wù),即時消息翻譯功能(以聊天影音工具QQ、Wechat 為代表),聊天影音工具QQ 也能提供拍照翻譯、掃描翻譯服務(wù),只是目前來說譯文可讀性較差。盡管如此,機器翻譯的誕生與發(fā)展還是給我們的生活與工作帶來了極大的便利,并且使人工智能向前邁了一大步。
基于規(guī)則的機器翻譯系統(tǒng)(Rule-Based Machine Translation)發(fā)展成為統(tǒng)計機器翻譯系統(tǒng)(Statistical Machine Translation)再到今天的神經(jīng)網(wǎng)絡(luò)機器翻譯系統(tǒng)(Neural Machine Translation),機器翻譯發(fā)展不斷革新,每一次革新又為機器翻譯注入新活力,使我們離人工智能時代更進一步?;谝?guī)則的機器翻譯系統(tǒng)把基于短語的句法分析(Phrase-Based Syntactic Analysis)放在第一位,另外把語法和算法分開,法國機器翻譯專家B.Vauquois 教授用“機器翻譯金字塔”(MT Pyramid)總結(jié)了基于語言規(guī)則的機器翻譯方法的翻譯過程(見圖1),成為了基于規(guī)則的機器翻譯中的“獨立分析-獨立生成-相關(guān)轉(zhuǎn)換”的方法論原則(馮志偉,2010)。
圖1 機器翻譯金字塔
“在這個金字塔上,越往塔尖的方向走,對語言的分析也越深入”,統(tǒng)計機器翻譯要解決的主要問題就是如何避免在引入深層次語言分析時保證分析的正確性(劉群,2009)。20 世紀90年代,RBMT 引入了語料庫方法、基于實例的方法、統(tǒng)計方法。機器翻譯因此可以從加工處理過的大規(guī)模真實語料庫中獲取語言知識,由此衍生出了統(tǒng)計機器翻譯(SMT)系統(tǒng)。這一系統(tǒng)把基于語料庫的概率統(tǒng)計方法和基于規(guī)則的邏輯推理方法巧妙結(jié)合,使機器翻譯又向前邁進了一步(馮志偉,2011)。統(tǒng)計機器翻譯無需人工編寫規(guī)則,只需利用平行語料庫來訓(xùn)練模型參數(shù),人工成本較低,開發(fā)周期較短。統(tǒng)計機器翻譯是百度、谷歌、微軟等多家國內(nèi)外機器翻譯公司的核心技術(shù)(劉群,2003)。機器翻譯繼續(xù)發(fā)展,神經(jīng)網(wǎng)絡(luò)機器翻譯系統(tǒng)應(yīng)運而生。人工神經(jīng)網(wǎng)絡(luò)具有自組織和自學(xué)習(xí)的能力,信息分布存儲和信息處理并行,采用聯(lián)結(jié)主義(connectionism)的方法,克服了之前機器翻譯中信息加工處理的障礙。Google 循環(huán)神經(jīng)網(wǎng)絡(luò)系統(tǒng)利用已有的大規(guī)模真實語料進行深度學(xué)習(xí),從語料庫中自動獲取語言特征和語言規(guī)則,用函數(shù)log p(f|e)表示某一源語言e 轉(zhuǎn)換為目標語言f 的概率,概率越大,證明神經(jīng)機器翻譯的效果越好。該系統(tǒng)把源語言看作輸入序列,把目標語言看作輸出序列,每次輸入與上一次輸出結(jié)果相關(guān)聯(lián),循環(huán)往復(fù),目的在于得到盡可能大的log p(f|e)參數(shù)近似值(parametric approximation)。此系統(tǒng)更具整體性,譯文的可讀性和準確性較之前更高。Facebook 卷積神經(jīng)網(wǎng)絡(luò)將文本序列化、單詞向量化,經(jīng)過分層處理后再輸出結(jié)果。卷積神經(jīng)網(wǎng)絡(luò)由多個隱層按照順序排列組成,每個隱層又由若干個神經(jīng)元組成,每個神經(jīng)元同時又與前一層中的所有神經(jīng)元關(guān)聯(lián),而神經(jīng)元中又具有學(xué)習(xí)能力的權(quán)重與偏差。卷積神經(jīng)網(wǎng)絡(luò)工作時,神經(jīng)網(wǎng)絡(luò)的輸入是一個向量,然后經(jīng)過隱層的變換和選擇,每個神經(jīng)元得到相應(yīng)輸入數(shù)據(jù),接著進行內(nèi)積運算激活函數(shù)運算,整個網(wǎng)絡(luò)形成一個可導(dǎo)的評分函數(shù)。這種編碼-解碼的框架通過多跳注意(multi-hop attention)(類似于人工翻譯時分解句子結(jié)構(gòu),不斷回顧源語言文本確定下一個輸出序列)和門控(gating)(控制篩選神經(jīng)網(wǎng)絡(luò)中傳遞到下一個神經(jīng)元中的信息流,放大翻譯中狹義或廣義的概覽,選取更適于語境的單詞)來改善翻譯效果。此框架還可結(jié)合外部語料,擴展性較強,翻譯速度更快,譯文質(zhì)量也更高。
侯強(2019:31)依據(jù)知識處理方式將機器翻譯方法分為三類:規(guī)則法(該類包括直接法、轉(zhuǎn)換法、中間語法);語料庫法(該類可細分為實例法、統(tǒng)計法、神經(jīng)網(wǎng)絡(luò)法);混合法(集規(guī)則法、語料庫法于一體:可細分為并行翻譯法、串行翻譯法、混雜翻譯法)(見表3)。
目前,機器翻譯研究主要以語料庫法為主,其中又以神經(jīng)網(wǎng)絡(luò)法最為典型。
綜合來看,規(guī)則法譯文忠實度較高,適合形合語言、規(guī)則特征顯化的文本;語料庫法譯文流暢度較高,適合意合語言、規(guī)則特征隱化的文本;混合法翻譯質(zhì)量較高,適用范圍較廣,能夠克服單一方法的部分障礙,但其翻譯過程還需依據(jù)具體文本作適當(dāng)調(diào)整。
各類機器翻譯系統(tǒng)如雨后春筍般涌現(xiàn),機器翻譯系統(tǒng)的評測成為一大問題。當(dāng)前,機器翻譯評測方法主要有人工評測和自動評測兩種。當(dāng)前,自動評測系統(tǒng)通常采用BLEU(bilingual evaluation understudy)來衡量機器翻譯譯文與專業(yè)人工翻譯譯文的差異指標(劉群,2012)。BLEU 計算這個指標時,需要選取機器翻譯的譯文作為candidate docs,同時選取一些專業(yè)翻譯人員翻譯的文本作為reference docs,然后計算兩個文本之間的相似程度。機器翻譯文本與參考文本之間的相似程度取值范圍在0-1,取值越靠近1 表示機器翻譯文本與參考文本之間的相似程度越大,機器翻譯效果越好。BLEU 作為機器翻譯的評估指標,快速便捷,但是僅關(guān)注詞語搭配關(guān)系而忽略句子的整體結(jié)構(gòu),評估比較粗略,不適用于需要精確評估翻譯文本質(zhì)量的情況。因此在評估時也會用到一些改進方法,如METEOR、TER 等。此外,翻譯記憶技術(shù)(Translation Memory)是“譯者運用計算機程序部分參與翻譯過程的一種翻譯策略”(Shuttleworth&Cowie,轉(zhuǎn)引自梁三云,2004),也是計算機輔助翻譯的核心技術(shù)。雪人cat、Déjà Vu、Trados、MemoQ等翻譯記憶工具的應(yīng)用使機器自動翻譯省時、省力,同時也能保持翻譯的高度一致性。
表3 機器翻譯方法
機器翻譯算法不斷更新改進。在WMT 2019的比賽中,微軟亞洲研究院機器學(xué)習(xí)組運用多個創(chuàng)新算法:多體對偶學(xué)習(xí)(Multi-agent dual learning)、屏蔽序列到序列的預(yù)訓(xùn)練(Masked sequence to sequence pre-training)、自動神經(jīng)網(wǎng)絡(luò)架構(gòu)優(yōu)化(Automatic neural architecture optimization)、軟性上下文數(shù)據(jù)增強(Soft contextual data augmentation)。在機器翻譯的任務(wù)中,從學(xué)習(xí)機制、預(yù)訓(xùn)練、網(wǎng)絡(luò)架構(gòu)優(yōu)化、數(shù)據(jù)增強等方面,大大提升了機器翻譯結(jié)果的質(zhì)量。在單詞語義翻譯方面,韓冬提出用Factored 編碼器與Gated 編碼器來克服傳統(tǒng)機器翻譯“源端單詞語義學(xué)習(xí)”的障礙,以此提高翻譯性能,并通過目前性能最優(yōu)的神經(jīng)機器翻譯框架Transformer 進行了中英翻譯實驗,其結(jié)果表明,這兩種融合源端單詞的翻譯方式能夠顯著改善機器翻譯質(zhì)量(韓冬,2019)。由于部分領(lǐng)域機器翻譯譯文可讀性較差,譚敏提出領(lǐng)域適應(yīng)方法以改善部分資源稀缺領(lǐng)域的機器翻譯質(zhì)量,通過訓(xùn)練使判別器攜帶所需語域特征并構(gòu)建集成系統(tǒng),目前通過實驗已證實了在中英廣播對話領(lǐng)域與英德口語領(lǐng)域應(yīng)用該方法,其翻譯效果均有顯著改善(譚敏,2019)。由于機器翻譯系統(tǒng)鮮少對漢語進行優(yōu)化,為改善漢英翻譯質(zhì)量,肖新鳳(2019)提出對不同文本進行預(yù)處理并使嵌入層數(shù)據(jù)參數(shù)初始化,在編碼器與解碼器間加入用于語法變換的轉(zhuǎn)換層,改進seq2seq 模型結(jié)構(gòu)。通過實驗已經(jīng)證實,經(jīng)過預(yù)處理或者使用轉(zhuǎn)換層均使翻譯性能顯著提高。WMT2019 冠軍得主微軟亞洲研究院在官微透露:天津大學(xué)聯(lián)合微軟亞洲研究院提出的Transformer 的壓縮方法,不僅減少了近一半的參數(shù)量,模型在語言建模和神經(jīng)機器翻譯任務(wù)的表現(xiàn)也有所提升。在ACL 2019年會上,微軟亞洲研究院提出無監(jiān)督中轉(zhuǎn)機器翻譯(Unsupervised Pivot Translation),利用單語數(shù)據(jù)進行訓(xùn)練,對于資源數(shù)據(jù)較少的語言翻譯很重要,源語與目的語可通過多個中轉(zhuǎn)語言連接,經(jīng)實驗證實拆分后的翻譯性能得到大幅提升。目前,改善機譯質(zhì)量也依賴于人工譯后編輯,人工翻譯輔助機器翻譯是目前為止輸出好譯文的最佳方法。一些公司(比如“傳神語聯(lián)網(wǎng)網(wǎng)絡(luò)科技股份有限公司”)已搭建了人機共譯交互平臺,人工譯后編輯成為了各大互聯(lián)網(wǎng)翻譯平臺的重要手段。
機器翻譯的誕生是新世紀的福音,不僅給我們的日常生活和學(xué)習(xí)工作帶來了極大的便利,也使我們向人工智能時代又邁進了一大步。機器翻譯取得的進展有目共睹,在實用化和商業(yè)化的道路上,機器翻譯只會越走越遠。語音機器翻譯、術(shù)語管理、專門用途文本翻譯的需求將會引領(lǐng)機器翻譯未來發(fā)展的方向。盡管機器翻譯發(fā)展前景甚佳,但是機器翻譯和翻譯技術(shù)適用范圍有限,主要應(yīng)用于通用新聞報道、科技文本等重復(fù)性高的文本,始終不能完全取代人工翻譯。即便是當(dāng)前最先進的神經(jīng)機器翻譯系統(tǒng)也只是在日常會話、新聞翻譯等領(lǐng)域取得較好的效果。文學(xué)文本隱喻性較強,機器翻譯與翻譯技術(shù)只能作為輔助翻譯手段,為專業(yè)翻譯工作者服務(wù)。機器翻譯和人工智能不會取代人的創(chuàng)造力和想象力,但是會提升翻譯的質(zhì)量,避免枯燥重復(fù)的翻譯工作,機器翻譯的改進與發(fā)展需要計算機科學(xué)、信息科學(xué)、統(tǒng)計學(xué)、語言學(xué)等多學(xué)界共同努力,才能實現(xiàn)更成熟化的人機互助翻譯。