• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      淺析計(jì)算機(jī)翻譯的發(fā)展概況與趨勢

      2020-07-04 02:13劉玉恩
      電腦知識(shí)與技術(shù) 2020年13期
      關(guān)鍵詞:計(jì)算機(jī)輔助翻譯機(jī)器翻譯

      劉玉恩

      摘要:歷經(jīng)多年的發(fā)展,計(jì)算機(jī)翻譯技術(shù)日趨成熟,大幅提高了翻譯效率,降低了翻譯成本,為促進(jìn)中國與世界各國的交流與合作發(fā)揮了重要作用。本文對計(jì)算機(jī)翻譯的發(fā)展歷程進(jìn)行了論述,從應(yīng)用的角度比較了機(jī)器翻譯與計(jì)算機(jī)輔助翻譯的異同,并對兩者未來的發(fā)展趨勢進(jìn)行了展望。

      關(guān)鍵詞:機(jī)器翻譯;計(jì)算機(jī)輔助翻譯;MT;CAT

      中圖分類號(hào):H059 文獻(xiàn)標(biāo)識(shí)碼:A

      文章編號(hào):1009-3044(2020)13-0212-02

      1引言

      社會(huì)對翻譯需求的急劇增長促進(jìn)了翻譯事業(yè)的蓬勃發(fā)展,尤其1946年電子計(jì)算機(jī)誕生之后,結(jié)合互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能的計(jì)算機(jī)翻譯技術(shù)應(yīng)運(yùn)而生,在日常生活中發(fā)揮了越來越重要的作用。

      2計(jì)算機(jī)翻譯技術(shù)的發(fā)展歷程

      從時(shí)間歷程劃分,計(jì)算機(jī)翻譯技術(shù)大致經(jīng)歷了初創(chuàng)期、停滯期、復(fù)蘇期和發(fā)展期。

      2.1初創(chuàng)期(1947-1964)

      1949年,美國科學(xué)家WarrenWeaver正式提出機(jī)器翻譯的設(shè)想。1954年,美國Georgetown大學(xué)與IBM公司合作,用IBM-701型計(jì)算機(jī)實(shí)現(xiàn)了首次英俄機(jī)器翻譯試驗(yàn)。1956年,中國將計(jì)算機(jī)翻譯技術(shù)納入了全國科學(xué)工作發(fā)展規(guī)劃,課題名稱為“機(jī)器翻譯、自然語言翻譯規(guī)則的建設(shè)和自然語言的數(shù)學(xué)理論”。1957年,中國科學(xué)院語言研究所與計(jì)算機(jī)技術(shù)研究所聯(lián)合開展了俄漢機(jī)器翻譯試驗(yàn)。同期,歐洲各國也高度重視機(jī)器翻譯的研究。

      2.2停滯期(1965-1974)

      限于當(dāng)時(shí)計(jì)算機(jī)的硬件水平,最初的機(jī)器翻譯只能采用直譯法,不能對源語言的結(jié)構(gòu)進(jìn)行深度分析處理,譯文質(zhì)量遠(yuǎn)低于人工翻譯。1964年,美國的語言自動(dòng)處理咨詢委員會(huì)(AL-PAC)對過去十余年間美國重金資助的機(jī)器翻譯項(xiàng)目進(jìn)行了整體評(píng)估。1966年11月,該委員會(huì)發(fā)布了題為《語言與機(jī)器:翻譯和語言學(xué)視角下的計(jì)算機(jī)》的報(bào)告,對機(jī)器翻譯基本持否定的態(tài)度,認(rèn)為在可預(yù)期的將來,機(jī)器翻譯不可能達(dá)到與人工翻譯相媲美的目標(biāo)。該報(bào)告嚴(yán)重影響了機(jī)器翻譯的研究。

      2.3復(fù)蘇期(1975-1989)

      隨著計(jì)算機(jī)和語言學(xué)的發(fā)展以及社會(huì)信息服務(wù)需求的提升,機(jī)器翻譯的研究迎來了復(fù)蘇,許多國家相繼投入巨額資金開發(fā)機(jī)器翻譯系統(tǒng)。歐共體的EURORA計(jì)劃和DLT系統(tǒng),日本的Mu系統(tǒng)和ODA計(jì)劃,以及美國的CMU機(jī)器翻譯項(xiàng)目都是這一時(shí)期具有代表性的項(xiàng)目。20世紀(jì)70年代中后期,中國的機(jī)器翻譯研究也從停滯走向了復(fù)蘇,部分項(xiàng)目列入“六五”“七五”以及“863”等重大課題。軍事科學(xué)院研制的“KY-1”英漢機(jī)譯系統(tǒng)和中科院計(jì)算所研制的“863-IMT”英漢機(jī)譯系統(tǒng)成為中國機(jī)器翻譯歷史上具有里程碑意義的系統(tǒng)。

      2.4發(fā)展期(1990-t今)

      全球化趨勢對翻譯的巨大需求以及Internet的普及應(yīng)用,推動(dòng)了機(jī)器翻譯研究進(jìn)入新的發(fā)展階段。1990年,芬蘭赫爾辛基第13屆國際計(jì)算語言學(xué)大會(huì)提出了處理大規(guī)模文本的任務(wù)。1993年,IBM的DellaPietra等人提出的基于詞對齊的翻譯模型,標(biāo)志著現(xiàn)代統(tǒng)計(jì)機(jī)器翻譯方法的誕生。在統(tǒng)計(jì)機(jī)器翻譯的基礎(chǔ)上,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型的應(yīng)用,大幅提升了機(jī)器翻譯的質(zhì)量。同期,中國在機(jī)翻領(lǐng)域也取得了前所未有的成績,相繼推出了百度、有道、譯星、雅信、通譯等機(jī)器翻譯系統(tǒng)。

      3計(jì)算機(jī)翻譯的類型和特點(diǎn)

      計(jì)算機(jī)翻譯從應(yīng)用角度上可分為機(jī)器翻譯和計(jì)算機(jī)輔助翻譯。

      3.1機(jī)器翻譯(MT)

      機(jī)器翻譯(machinetranslation,MT),又稱機(jī)譯,是利用計(jì)算機(jī)將一種自然語言文本(源語言)自動(dòng)轉(zhuǎn)換為另一種自然語言文本(目標(biāo)語言)的過程。從語言學(xué)角度來講,機(jī)器翻譯就是自然語言處理技術(shù)的開發(fā)應(yīng)用,其原理是利用計(jì)算機(jī)按照特定的規(guī)則把一種自然語言自動(dòng)轉(zhuǎn)換為另一種目標(biāo)自然語言。從最早的詞典匹配,到詞典結(jié)合語言學(xué)規(guī)則的翻譯,再到基于語料庫的統(tǒng)計(jì)學(xué)機(jī)器翻譯,隨著計(jì)算機(jī)軟硬件水平的飛速提升,機(jī)器翻譯技術(shù)也日趨成熟,能夠?yàn)槠胀ㄓ脩籼峁?shí)時(shí)、便捷的翻譯服務(wù)。目前的常見的網(wǎng)絡(luò)在線翻譯系統(tǒng),如谷歌翻譯、百度翻譯、有道翻譯、騰訊翻譯等均屬于機(jī)器翻譯的范疇。

      3.2計(jì)算機(jī)輔助翻譯(CAT)

      計(jì)算機(jī)輔助翻譯(computer aided translation,CAl)的工作原理:TM(翻譯記憶)+MT(機(jī)器翻譯)+HT(人工翻譯/校對)。它的核心技術(shù)是翻譯記憶(Translation Memory)和術(shù)語庫(Terminol-ogy Database)。簡單來說,系統(tǒng)會(huì)根據(jù)相應(yīng)規(guī)則,將原文劃分為單獨(dú)的句子或段落,并分解成詞或詞組,再根據(jù)系統(tǒng)附帶的術(shù)語庫或用戶自行建立的語料庫,輸出相應(yīng)的翻譯結(jié)果。此外,系統(tǒng)還會(huì)自動(dòng)檢索翻譯記憶庫中與之相同或類似的翻譯資源,給出參考譯文供譯者借鑒。目前常見的CAT軟件有SDL Tra-dos、Smartcat、YiCAT、iCAT、Transmate、Wordfast等。

      4計(jì)算機(jī)輔助翻譯的發(fā)展趨勢

      20世紀(jì)50年代到20世紀(jì)80年代之間,基于規(guī)則的機(jī)器翻譯(RBMT)占據(jù)了主流。這種翻譯方法通過研究源語言和目標(biāo)語言之間的語言學(xué)信息,基于詞典和語法生成翻譯結(jié)果。20世紀(jì)80年代,隨著統(tǒng)計(jì)學(xué)的發(fā)展,統(tǒng)計(jì)機(jī)器翻譯(SMT)應(yīng)運(yùn)而生。這種方法將統(tǒng)計(jì)模型應(yīng)用到機(jī)器翻譯之中,基于對雙語語料庫的分析生成翻譯結(jié)果。SMT的效果要優(yōu)于RBMT。

      1997年,Ramon Neco和Mikel Forcada提出了使用編碼器一解碼器結(jié)構(gòu)做機(jī)器翻譯的構(gòu)想。2003年,蒙特利爾大學(xué)Yosh-uaBengio的研究團(tuán)隊(duì)開發(fā)出了一個(gè)基于神經(jīng)網(wǎng)絡(luò)的語言模型,并改善了SMT模型存在的數(shù)據(jù)稀疏性問題。他們的研究為神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯奠定了基礎(chǔ)。2013年,Nal Kalchbrenner和PhilBlunsom開發(fā)出了一種新型端到端編碼器一解碼器結(jié)構(gòu)模型。他們的研究成果意味著神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(Neural MachineTranslation。NMT)的誕生。

      NMT最初的表現(xiàn)并不好。2014年,Yoshua Bengio的團(tuán)隊(duì)為NMT引人了attention機(jī)制后,NMT的表現(xiàn)顯著提升。在2015年的Workshop 0n Statistical Machine Translation(WMT)比賽上,蒙特利爾大學(xué)的團(tuán)隊(duì)使用NMT方法贏得了英語一德語翻譯的第一名。2016年9月,谷歌大腦團(tuán)隊(duì)宣布在谷歌翻譯產(chǎn)品的漢語一英語語言上使用NMT替代基于短語的機(jī)器翻譯。2017年,F(xiàn)acebook人工智能研究院(FAIR)就宣布了他們使用CNN實(shí)現(xiàn)NMT方法,其可以實(shí)現(xiàn)與基于RNN的NMT近似的表現(xiàn)水平,但速度卻快9倍。亞馬孫、微軟、IBM、英偉達(dá)和SYSTRAN等科技巨頭也都參與了NMT的開發(fā)。在中國,百度、有道、騰訊、搜狗、訊飛、阿里巴巴等公司甚至已經(jīng)部署了NMT。在最近的ACL 2017會(huì)議上,機(jī)器翻譯類接收到的論文全都與神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯有關(guān)。2019年3月,云從科技和上海交通大學(xué)聯(lián)合宣布,計(jì)算機(jī)算法在自然語言處理(NLP)上取得重大突破,在大型深層閱讀理解任務(wù)RACE數(shù)據(jù)集登頂?shù)谝?,并成為世界首個(gè)超過人類排名的模型。隨著算法的改進(jìn),NMT必將持續(xù)突破并取代SMT成為主流的機(jī)器翻譯技術(shù)。

      5結(jié)語

      經(jīng)過多年的發(fā)展,計(jì)算機(jī)翻譯技術(shù)取得了長足的進(jìn)步,極大地提高了翻譯質(zhì)量和效率,降低了翻譯成本,促進(jìn)了國際間交流與合作。對機(jī)器翻譯發(fā)展歷程和趨勢的探討,能為翻譯工作者瞄準(zhǔn)學(xué)科前沿,建立傳統(tǒng)與科技相融合,知識(shí)創(chuàng)新與技術(shù)創(chuàng)新相并行的翻譯研究新局面提供有價(jià)值的參考。

      猜你喜歡
      計(jì)算機(jī)輔助翻譯機(jī)器翻譯
      互聯(lián)網(wǎng)+新時(shí)代下人機(jī)翻譯模式研究
      “語聯(lián)網(wǎng)+行業(yè)” 助力中國偉大復(fù)興
      計(jì)算機(jī)輔助翻譯環(huán)境下術(shù)語庫創(chuàng)建、應(yīng)用與術(shù)語管理
      门源| 石城县| 乐平市| 临漳县| 梧州市| 东明县| 赣州市| 扶绥县| 陇川县| 盐城市| 漯河市| 睢宁县| 光山县| 原阳县| 濉溪县| 多伦县| 静乐县| 阜平县| 行唐县| 马公市| 汉阴县| 屯昌县| 革吉县| 湘乡市| 嘉荫县| 都江堰市| 忻城县| 信宜市| 盖州市| 景泰县| 英山县| 句容市| 满城县| 黔南| 马鞍山市| 嘉黎县| 通化市| 辰溪县| 莆田市| 盐池县| 乌鲁木齐市|