摘要:近些年來,人工智能(簡稱AI)技術快速的發(fā)展,深刻地影響著生活中各行各業(yè)。在這當中,語言服務業(yè)涉及的機器翻譯,有“AI中的AI”之稱,一直被視作人類的最后一塊智慧高地,它也引來了眾多高校與研究機構競相對其進行研究,更引來了包括谷歌、阿里在內的企業(yè)巨頭踴躍投入。而且,不少傳統(tǒng)的語言服務企業(yè)也意欲向此轉型。那么,人工智能翻譯技術的現(xiàn)狀是具有可發(fā)展性的, AI對日語翻譯有很大的影響,人工翻譯與機器翻譯的未來是光明的,結合人工智能翻譯的發(fā)展現(xiàn)狀及其當前應用的成果,對以上內容進行了分析探討,以及對AI翻譯領域的研究方向,提供理論參考的依據(jù)。
關鍵詞:人工智能;機器翻譯;人工翻譯;深度學習;應用;前景
中圖分類號:H36?文獻標識碼:A?文章編號:1672-9129(2020)09-0052-02
1?人工智能在日語翻譯中的發(fā)展歷程和應用
自明治維新前后,日本求學精進文化大爆發(fā),產生了多位影響深遠的文學家及翻譯家,將所謂的“西學”引進過來,對東亞產生的文化影響自然不言而喻。但是這些日本翻譯名家卻鮮有親傳弟子,可能翻譯這也是一個靠天賦的工作,即使有掛名翻譯的弟子也大多都去轉行去寫書或者做學者研究了,這在戰(zhàn)后日本是一個大環(huán)境影響。日本翻譯界名家頻出,明治維新前后更如雨后春筍一般。一段時間后,翻譯熱情消退,從常規(guī)的綜合翻譯門類逐漸轉向實用類翻譯。如今,人工智能發(fā)展極為迅速,人們對人工智能的應用越來越依賴,它可以節(jié)省時間,在翻譯領域也占有重要的位置。
人工智能時代,服務的入口主要是自然語言的語音交互,自然語言處理會是人機交互的主要模式,誰能讓機器更懂人類的語言,誰就能有可能取勝。人工智能會全面包圍我們生活的方方面面,這意味著,人工智能入口的競爭會更加慘烈,而越早參與,獲得越多的用戶,勝利的幾率就越大。現(xiàn)在有很多人害怕被人工智能搶走飯碗,從去年開始,華爾街有越來越多的分析師辭職,因為他們覺得自己即將被人工智能取代。在翻譯界,這種恐慌更是普遍,其實人工智能不是本身厲害,而是背后的專家厲害,它的翻譯基于專家翻譯的語料庫。隨著人工智能時代的到來,大家如果不自己去學習新東西,很快就會落伍,被時代的巨浪淘汰。事實上,我們應該去了解人工智能的優(yōu)勢與劣勢,不能妄自菲薄,也不能過于迷信。在了解人工智能的缺陷之后,我們就可以專攻它的缺陷,形成自己的優(yōu)勢。
2?人工智能在機器翻譯方面的發(fā)展現(xiàn)狀
人工智能作為一項極具前瞻性的技術目前廣泛應用于計算機科學,語言翻譯,金融貿易,醫(yī)藥,診斷,重工業(yè),運輸,遠程通訊,法律,科學發(fā)現(xiàn),玩具和游戲,音樂等諸多方面。
現(xiàn)如今機器翻譯變得越來越強大。從一開始的只能夠翻譯單詞,對于翻譯句子簡直可以說一竅不通的,到之后轉變成翻譯出來句子可以符合基本的語法,再漸漸變得越來越有基本的邏輯性了,再到現(xiàn)在部分軟件可以聯(lián)系需要翻譯的部分的前后文,翻譯結果的可讀性與正確性都大為改觀。近幾年來,加入了“深度學習技術”等人工智能的機器翻譯,它可以像人一樣,已經不再簡單地將一個個單詞翻譯成另一種語言,而是不斷向前回顧以理解結構復雜的句子,并且結合前后文來進行翻譯。
國內的百度,有道等公司都為用戶提供了免費的在線多語言翻譯系統(tǒng)。將源語言文字輸入其軟件中,便可迅速翻譯為目標語言文字。速度快、成本低是其主要特點,而且應用廣泛,不同行業(yè)都可以采用相應的專業(yè)翻譯,但是翻譯過程是機械的和僵硬的,會出現(xiàn)更多問題,仍需要人工翻譯進行補充。像亞馬遜的Alexa、蘋果的Siri、微軟的Cortana等比較富有創(chuàng)新的領域已經吸引了眾資金和公眾的注意力。
循環(huán)神經網(wǎng)絡機器翻譯按照序列進行工作,也就是和人一樣,按照顧序一個個的進行翻譯。而卷積神經網(wǎng)絡則可以同時處理很多個語言片段,并且具有信息分層處理能力。將文本序列化、單詞向量化,經過分層處理后再輸出結果。在分層過程中,還會不斷回顧源文本來確定下一個輸出序列。提出這種技術的是Facebook和最近的機器翻譯新秀DeepL。2017年上半年,F(xiàn)acebook宜布推出了基于循環(huán)神經網(wǎng)絡開發(fā)的語言翻譯模型,據(jù)說比基于卷積神經網(wǎng)絡開發(fā)的語言翻譯模型速度快9倍,而且準確率更高。在測試上,F(xiàn)acebook翻譯系統(tǒng)幾個方面都比卷積神經網(wǎng)絡更接近人工翻譯。
并且,不管是循環(huán)神經網(wǎng)絡還是卷積神經網(wǎng)絡都不是機器翻譯的最終結果,比如谷歌近期提到的不再基于卷積神經網(wǎng)絡的注意力機制,以及多層神經網(wǎng)絡、深度坤經網(wǎng)絡等等,都是解決機器翻譯的方法。在速度、計算資源消耗、情感理解等等多種維度上都有不同的表現(xiàn)。如果從最終的實用性來說,神經網(wǎng)絡模型能影響到的僅僅只是一小部分。更多的是語料庫的大小、繁重的語料標注工作等等,同時這也注定了蒙古語、藏語這種語料較少語言依然無法使用機器翻譯的方便之處。
3?人工智能在語言翻譯上應用現(xiàn)狀
人類語言復雜多樣,不同語言之間無法直接溝通,需要翻譯轉換,由此便產生語言翻譯需求并逐步發(fā)展成為語言翻譯服務產業(yè)。近些年來,隨著人工智能在語音工程(包括語音識別和語音合成)、自然語言處理等方面不斷取得新突破,人工智能在語言翻譯上也不斷取得新的進展,并得以更廣泛地應用在諸多領域。
3.1人工智能的第一次高峰。在1956年的這次會議之后,人工智能迎來了屬于它的第一段趕時間。在這段長達十余年的時間里,計算機被廣泛應用于數(shù)學和自然語言領域,用來解決代數(shù)、幾何和英語問題。這讓很多研究學者看到了機器向人工智能發(fā)展的信心。甚至在當時,有很多學者認為:“二十年內,機器將能完成人能做到的一切?!?人工智能第一次低谷: 70年代,人工智能進入了一段痛苦而艱難歲月。由于科研人員在人工智能的研究中對項目難度預估不足,不僅導致與美國國防高級研究計劃署的合作計劃失敗,還讓大家對人工智能的前景蒙上了一層陰影。與此同時,社會輿論的壓力也開始慢慢壓向人工智能這邊,導致很多研究經費被轉移到了其他項目上。在當時,人工智能面臨的技術瓶頸主要是三個方面,第一,計算機性能不足,導致早期很多程序無法在人工智能領域得到應用;第二,問題的復雜性,早期人工智能程序主要是解決特定的問題,因為特定的問題對象少,復雜性低,可一旦問題上升維度,程序立馬就不堪重負了;第三,數(shù)據(jù)量嚴重缺失,在當時不可能找到足夠大的數(shù)據(jù)庫來支撐程序進行深度學習,這很容易導致機器無法讀取足夠量的數(shù)據(jù)進行智能化。因此,人工智能項目停滯不前,但卻讓一些人有機可乘,1973年,人工智能遭遇了長達6年的科研深淵。人工智能的崛起:1980年,卡內基梅隆大學為數(shù)字設備公司設計了一套名為XCON的“專家系統(tǒng)”。這是一種,采用人工智能程序的系統(tǒng),可以簡單的理解為“知識庫+推理機”的組合,XCON是一套具有完整專業(yè)知識和經驗的計算機智能系統(tǒng)。這套系統(tǒng)在1986年之前能為公司每年節(jié)省下來超過四千美元經費。有了這種商業(yè)模式后,衍生出了硬件,軟件公司。人工智能第二次低谷:可憐的是,命運的車輪再一次碾過人工智能,讓其回到原點。僅僅在維持了7年之后,這個曾經轟動一時的人工智能系統(tǒng)就宣告結束歷史進程。到1987年以后,專家系統(tǒng)風光不再。在語音技術上,近些年來,隨著深度學習的廣泛應用,人工智能在語音工程方面取得了較大突破,語音識別的準確率大幅提升。圖中展示了2010年來人工智能在語音識別上的表現(xiàn)。
例如Siri、Voice Search和Echo等取得了較大的突破,能夠在一定程度上實現(xiàn)不同語言間的交流以及語音向另一種文字的轉化。2016年10月,微軟美國研究院發(fā)布的一款語音識別系統(tǒng)實現(xiàn)了錯誤率為5.9%的新突破,這是人工智能第一次取得跟人類相似的語音識別錯誤率。
在自然語言處理上,人工智能也取得了很大進展,尤其是機器翻譯方面取得較大突破。計算機自然語言處理能力的顯著提高。Google公司應用了神經機器翻譯系統(tǒng),能夠實現(xiàn)完整句子的翻譯,是人工智能在機器翻譯上的一個標志性突破。國內的科大訊飛、騰訊、網(wǎng)易、百度等公司也都在機器翻譯上推出了免費在線翻譯產品,在中英互譯上取得較大的進展。
3.2商業(yè)應用情況。國內外各大互聯(lián)網(wǎng)巨頭都在不斷拓展人工智能翻譯的市場,開發(fā)人工智能翻譯商業(yè)應用。尤其是各大公司提供的網(wǎng)頁在線翻譯工具市場應用廣泛,語言翻譯服務市場發(fā)展前景如火如荼。由于市場需求量巨大,一些公司因此關停了人工智能翻譯引擎,轉而提供付費翻譯服務。
在智能手機普及的今天,各大互聯(lián)網(wǎng)公司相繼推出了自己的翻譯類軟件APP。比較流行的翻譯APP如谷歌翻譯、有道翻譯官、百度翻譯等軟件,能夠實現(xiàn)拍照翻譯、實時翻譯、語音翻譯等諸多功能,而且針對專業(yè)客戶提供更高級的付費專業(yè)翻譯服務。
與此同時,AI翻譯機成為人工智能語言和翻譯的最熱門商業(yè)產品。繼微軟、谷歌陸續(xù)推出自己的翻譯機之后,國內的網(wǎng)易、搜狗、騰訊、科大訊飛、分音塔科技等公司也逐步推出了自己的翻譯機。目前,AI翻譯機取得了不俗的銷售業(yè)績,市場前景看好,且功能強大,語言翻譯識別更加精準智能。以科大訊飛公司為例,該公司推出的一款訊飛翻譯機2.0,不僅支持中文與英、日、韓等33種語言即時互譯,而且能夠支持粵語、四川話、河南話等方言翻譯和拍照翻譯,并具備4G、WIFI和離線翻譯模式,其英語翻譯水準最高可達CET-6級水平。人工智能翻譯水平正在快速進步,其進步速度之快可能大大超出人們的預期,在日語翻譯中,人工智能更是占有重要的位置。
結論:總之,對于翻譯教學來說,言語環(huán)境匱乏是當前制約學生口語學習的 最大障礙,口語評價難度較大而且時效性差更是加劇了口語教與學的難度,人工智能的強勁優(yōu)勢,所開發(fā)的強勁聽說智能測試系統(tǒng),智能考試和教學系統(tǒng)為其提供了特別大的幫助。隨著深度學習等技術在人工智能的應用,人工智能翻譯水平正在快速進步。人工智能翻譯具有快速、效率高、不會疲勞的優(yōu)點,也存在翻譯機械、生硬、整體匹配性差的問題,當前的人工智能翻譯水平離人們的預期還有不少差距。在市場應用方面,人工智能翻譯不斷推出在線翻譯服務、翻譯機等新產品。在市場應用前景方面,人工智能翻譯市場潛力巨大,相信在不久的將來,在日語翻譯領域中,人工智能會變得更加的成熟,應用也會更加廣泛。
參考文獻:
[1]劉榮 機器翻譯系統(tǒng)的框架設計和實現(xiàn)[J] 山西省科技廳2006年18期
[2]徐艷平 語言產業(yè)研究的現(xiàn)狀與前景[J]浙江經貿職業(yè)技術學院2014年06期
[3]陳宗海 系統(tǒng)仿真技術及應用[J] 中國科技大學出版社2009年07期
作者簡介:董馨竹(1998.01—),女,漢族,山東威海人,學生,本科,就讀于遼寧工業(yè)大學。