• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      人工智能背景下機器翻譯質量對比分析與前景展望

      2019-12-26 21:38:55崔林艷虞金芳
      皖西學院學報 2019年2期
      關鍵詞:源語言語料庫譯文

      崔林艷,虞金芳

      (1.安徽農業(yè)大學 經濟技術學院,安徽 合肥 230036;2.安徽農業(yè)大學 經濟管理學院,安徽 合肥 230036)

      人類語言種類繁多,全世界大約有6000~7000種語言[1]。隨著人類文明的進步和經濟全球化,跨語言的溝通和交流對世界各地的人們來說都變得越來越重要。為了克服語言的障礙,曾經有人提出使用人類通用語言(lingua franca)來替代各種不同語言的想法。但是,這樣的想法顯然是很難實現的[2](P2)。

      機器翻譯一直被公認為是人工智能領域最難的課題之一。讓機器理解人類的語言,進而實現不同語言之間的無障礙翻譯,不僅是科學家們奮斗追求的夢想,也寄托著全人類實現自由溝通交流的美好愿望。本文通過對目前市場上常用的幾款人工智能機器翻譯軟件翻譯結果與人工譯文的對比分析,展望未來人工智能背景下機器翻譯的發(fā)展前景與方向。

      1 機器翻譯(Machine Translation,簡稱MT)

      1.1 機器翻譯的概念

      機器翻譯就是利用計算機把一種語言(源語言,source language)翻譯成另外一種語言(目標語言,target language),實現各種自然語言之間的自動轉換,是人工智能和自然語言處理領域的重要研究方向之一。

      1.2 機器翻譯的誕生

      機器翻譯的研究歷史可以追溯到20世紀30年代。20世紀30年代初,法國科學家G.B.阿爾楚尼提出了用機器來進行翻譯的想法。1933年,蘇聯(lián)發(fā)明家П.П.特洛揚斯基設計出把一種語言翻譯成另一種語言的機器,并在同年登記了他的發(fā)明。但是,受到當時技術水平的限制,他的翻譯機沒能成功。1946年,第一臺現代電子計算機 ENIAC 誕生。隨后不久,信息論的先驅、美國科學家 W. Weaver 和英國工程師A. D. Booth 在討論電子計算機的應用范圍時,于1947年提出了利用計算機進行語言自動翻譯的想法。1949年,W. Weaver 發(fā)表《翻譯備忘錄》,正式提出機器翻譯的思想。

      1.3 機器翻譯系統(tǒng)的發(fā)展類型

      機器翻譯系統(tǒng)的發(fā)展類型主要分為三種:基于規(guī)則的機器翻譯系統(tǒng)、基于語料庫的機器翻譯系統(tǒng)和基于人工神經網絡的機器翻譯系統(tǒng)。

      1.3.1 基于規(guī)則的機器翻譯系統(tǒng)

      主要分為三種類型:第一類是直接翻譯系統(tǒng),設計原理是根據源語言和目標語言之間的詞匯單元的對應關系,缺點是針對性過強;第二類是轉換翻譯系統(tǒng),源語言的分析獨立于目標語言,源語言的分析一般只在句法平面上進行,用目標語言單元替換源語言單元時要考慮上下文,轉換時還要考慮源語言與目標語言的結構差別;第三類是中間語言翻譯系統(tǒng),把源語言的文本用人工設計的無歧義的中間語言(interlingua)表示出來,然后再把中間語言所表達的意義用目標語言的詞匯和句法結構表示出來。

      1.3.2 基于語料庫的機器翻譯系統(tǒng)

      主要分為兩種類型:一種是基于統(tǒng)計的機器翻譯系統(tǒng),另一種是基于實例的機器翻譯系統(tǒng)。這兩種系統(tǒng)都使用語料庫作為翻譯知識的來源,所以統(tǒng)稱為基于語料庫的機器翻譯系統(tǒng)。區(qū)別在于:基于統(tǒng)計的機器翻譯系統(tǒng),知識的表示是統(tǒng)計數據,翻譯知識的獲取在翻譯之前已經全部完成;基于實例的機器翻譯系統(tǒng),翻譯知識的獲取在翻譯之前沒有全部完成,翻譯過程中還要查詢語料庫。

      1.3.3 基于人工神經網絡的機器翻譯系統(tǒng)

      基于人工神經網絡的機器翻譯系統(tǒng)——神經機器翻譯(Neural Machine Translation,簡稱NMT)。2013年以來,隨著深度學習技術取得的較大進展,基于人工神經網絡的機器翻譯系統(tǒng)逐漸替代了過去基于規(guī)則和基于語料庫的機器翻譯系統(tǒng)。神經網絡機器翻譯系統(tǒng)受啟發(fā)于人類自己的生物學神經網絡系統(tǒng),通過端到端的神經網絡直接實現自然語言之間的翻譯。神經機器翻譯系統(tǒng)改進了以往機器翻譯系統(tǒng)的不足,通過對上下文信息的充分比較,完成句子的整體編碼和解碼,由此產生的譯文更順暢、自然、準確。

      2 人工智能(Artificial Intelligence,簡稱 AI)

      2.1 人工智能的概念

      人工智能是相對于自然人的天然智能而言,即利用計算機來模擬人的某些思維過程和智能行為(如學習、推理、思考、規(guī)劃等)的學科。

      2.2 人工智能的發(fā)展歷程

      從1956年正式提出人工智能學科算起,人工智能技術取得了長足的發(fā)展,尤其是近十年來發(fā)展迅猛, 已經廣泛應用于社會各個學科和領域,成為一門廣泛的交叉和前沿學科。人工智能的發(fā)展歷程主要分為三個階段:人工智能的起源、人工智能的二次低谷和人工智能的快速發(fā)展期。

      2.2.1 人工智能的起源

      1950年,一位名叫M. L. Minsky(后被稱為“人工智能之父”)的大學生與他的同學D. Edmund一起,建造了世界上第一臺神經網絡計算機,這被看作是人工智能的一個起點。1956年,在Dartmouth會議上,計算機專家J. McCarthy首次提出“人工智能”術語,這標志著“人工智能”這門新興學科的誕生。

      2.2.2 人工智能的二次低谷

      從1956年正式提出人工智能學科之后一直到20世紀80年代末期,人工智能的發(fā)展經歷了二次低谷。第一次低谷是到了70年代,由于科研人員在人工智能研究中對項目難度預估不足,導致與美國國防高級研究計劃署的合作計劃失敗,讓大家對人工智能的前景蒙上了一層陰影,人工智能遭遇了長達6年的科研低谷。到了80年代初期,卡耐基梅隆大學為DEC公司設計了一個專家系統(tǒng),能夠自動為購買電腦軟件的用戶匹配對應的芯片、驅動、數據線和接口,不但效率比銷售人員高,每年還能為公司節(jié)省幾千萬美金。許多公司效仿,人工智能研究迎來了新一輪高潮。但很快科學家們發(fā)現,系統(tǒng)雖然有用,但應用領域過于狹窄,系統(tǒng)中所需的知識需要預先輸入,但當時想要獲取計算機能理解的知識并不容易,而且系統(tǒng)的維護費用也較高。于是,人工智能的研究又陷入了第二次低谷。

      2.2.3 人工智能的快速發(fā)展期

      1993年,隨著計算機性能的飛速發(fā)展、海量數據的累積和人工智能研究者們的不懈努力,人工智能研究領域不斷取得突破,迎來了快速發(fā)展時期。2006年,Jeffrey Sinton提出深度學習的算法,借助這種算法,科學家們不斷在眾多領域取得研究突破。人工智能的發(fā)展進入了快速發(fā)展時期。

      3 人工智能背景下機器翻譯質量對比分析與前景展望

      3.1 目前市場上常用的幾款人工智能機器翻譯軟件

      目前百度、科大訊飛、Google、有道等公司紛紛研發(fā)出基于神經網絡翻譯引擎技術的人工智能機器翻譯系統(tǒng)。

      3.1.1 百度翻譯

      2015年,百度率先在機器翻譯系統(tǒng)中采用深度神經網絡技術,推出全球首個神經網絡賦能的機器翻譯服務,并在同年實現了基于神經網絡的離線翻譯,機器翻譯質量由此有了質的提升。百度自然語言處理部首席科學家、技術委員會主席吳華認為,“神經網絡的應用是推動機器翻譯真正落地的重要里程碑,在神經網絡的框架下,我們能夠在多個語言對之間共享語義表達,無須為每個語言對單獨構建編碼器或解碼器,這意味著可以在沒有語料庫的情況下也能提高翻譯質量?!盵3]

      3.1.2 科大訊飛翻譯

      2018年4月,科大訊飛推出最新人工智能機器翻譯研究成果—訊飛翻譯器2.0。該款翻譯器可以實現中文與33種語言的即時互譯、拍照翻譯和方言口音的識別功能。基于神經網絡的方言識別技術,就算是用方言或帶方言口音的非標準普通話,也可輕松實現即時翻譯功能。目前該款翻譯器可以支持粵語、四川話、東北話、河南話等;對英語方言也可以識別,比如倫敦腔、美國鄉(xiāng)村腔、日本腔英語、印度腔英語等,均可以清晰分辨。

      3.1.3 Google翻譯

      Google 翻譯是谷歌公司提供的一項免費翻譯服務。功能主要包括:即時翻譯,只需輸入文字,即可在超過100多種語言之間隨時互譯;拍照翻譯,可使用相機將拍攝的文字即時互譯;點按翻譯,在任何應用中點按文字,系統(tǒng)即會彈出相應翻譯;語音翻譯,支持32種語言的即時語音互譯;離線翻譯,即使沒有連接到互聯(lián)網,也能翻譯52種語言;手寫翻譯,以手寫方式輸入93種語言的字符,無須使用鍵盤輸入;翻譯收藏夾,點擊星標可收藏翻譯的內容,供日后參考。另外,一些詞典上查不到的俚語、俗語等,也可通過Google翻譯搜索,即使查不到直接的解釋,也可以通過搜索到的上下文內容來猜測其含義。

      3.1.4 有道翻譯

      2018年4月,網易有道在全球移動互聯(lián)網大會(GMIC)上發(fā)布了基于離線神經網絡翻譯技術(YNMT)的實景AR翻譯技術,可以支持中、英、日、韓四種語言,整個翻譯過程可實現動態(tài)離線完成。目前有道翻譯的主要功能還包括:支持107種語言的翻譯、拍照翻譯、語音翻譯、同傳翻譯、在線翻譯、離線翻譯、網頁翻譯和逗趣的表情翻譯等。

      3.2 上述四款機器翻譯軟件譯文與人工譯文對比

      3.2.1 源語言文本

      句子1:世界那么大,我想去看看。

      句子2:生如夏花之絢爛,死如秋葉之靜美。

      句子3:幸福和美好未來不會自己出現,成功屬于勇毅而篤行的人。

      句子4:當今世界正處于大發(fā)展大變革大調整時期,世界多極化、經濟全球化、社會信息化、文化多樣化深入發(fā)展,各國相互聯(lián)系和依存日益加深。同時,國際形勢中不穩(wěn)定不確定因素增多,單邊主義、保護主義、逆全球化思潮抬頭。

      句子5:世人都曉神仙好,惟有功名忘不了,古今將相在何方,荒冢一堆草沒了。世人都曉神仙好,只有金銀忘不了,終朝只恨聚無多,及到多時眼閉了。世人都曉神仙好,只有嬌妻忘不了,君生日日說恩情,君死又隨人去了。世人都曉神仙好,只有兒孫忘不了,癡心父母古來多,孝順兒孫誰見了。

      3.2.2 人工譯文

      句子1:The world is so big, I want to see it.

      句子2:Let life be beautiful like summer flowers and death like autumn leaves.

      句子3:Happiness and a bright future do not appear automatically. Success only belongs to those who are brave and persevering.

      句子4:The world is undergoing major development, changes and adjustments. The trend toward multi-polarity, economic globalization,IT application and cultural diversity is deepening. Countries are increasingly interconnected and interdependent. Meanwhile, the world is witnessing growing instabilities and uncertainties, with unilateralism, protectionism and de-globalization on the rise.

      句子5:All men long to be immortals, Yet to riches and rank each aspires, The great ones of old, where are they now? Their graves are a mass of briars. All men long to be immortals, Yet silver and gold they prize, And grub for money all their lives, Till death seals up their eyes. All men long to be immortals, Yet dote on the wives they’ve wed, Who swear to love their husband evermore, But remarry as soon as he’s dead. All men long to be immortals,Yet with getting sons won’t have done, Although fond parents are legion, Who ever saw a really filial son?

      3.2.3 機器翻譯譯文3.2.3.1 百度翻譯譯文

      句子1:The world is so big, I want to see.

      句子2:Life is like summer flowers, death is like autumn leaves.

      句子3:Happiness and a bright future do not appear on their own. Success belongs to those who are brave and committed.

      句子4:Nowadays, the world is in a period of great development, great change and great adjustment. With the deepening development of world multipolarity, economic globalization, social informatization and cultural diversity, countries are increasingly interconnected and dependent on each other. At the same time, there are more uncertainties and uncertainties in the international situation. Unilateralism, protectionism and anti-globalization are on the rise.

      句子5:Everyone knows that immortals are good, but their fame and fame will never be forgotten. Where will the past and the present be? There is no grass in the mound. The world knows that immortals are good. Only gold and silver can not be forgotten. Eventually, they only hate to gather together, and their eyes are closed for a long time. Everyone knows that immortals are good. Only a lovely wife can’t forget them. On your birthday, you say kindness, and you die with others. Everyone knows that immortals are good. Only children and grandchildren can’t forget them. They have been obsessed with their parents for a long time. They are filial to their children and grandchildren.

      3.2.3.2 科大訊飛翻譯譯文

      句子1:The world is so big, I want to see it.

      句子2:Life is like the glory of summer flowers, and death is like the beauty of autumn leaves.

      句子3:Happiness and a bright future will not appear automatically. Success only favors those with courage and perseverance.

      句子4:The world today is undergoing a period of great development, great changes and major adjustments. The world is multi-polarized, economic globalization, social information, and cultural diversity are deepening, and countries are increasingly interconnected and dependent. At the same time, uncertainties and uncertainties in the international situation have increased, and unilateralism, protectionism, and counter-globalization have risen.

      句子5:The world knows the gods well, but the fame can’t be forgotten. The ancient and the modern will be where they are, and the ridiculous pile of grass is gone. Everyone knows that the gods are good. Only gold and silver can’t be forgotten. In the end, they only hate to gather together, and for a long time they close their eyes. Everyone knows the gods, and only the wife can’t forget. On the birthday of Jun, he said that he was kind, and he died. Everyone knows the gods are good, only the children and grandchildren can’t forget, the infatuated parents have come from many times, and the filial sons and grandchildren have met.

      3.2.3.3 Google翻譯譯文

      句子1:The world is so big, I want to see it.

      句子2:Life is like the glory of summer flowers, and death is like the beauty of autumn leaves.

      句子3:Happiness and a bright future will not appear on its own, and success is a person who is brave and limp.

      句子4:The world today is undergoing a period of great development, great changes and major adjustments. The world is multi-polarized, economic globalization, social information, and cultural diversity are deepening, and countries are increasingly interconnected and dependent. At the same time, uncertainties and uncertainties in the international situation have increased, and unilateralism, protectionism, and counter-globalization have risen.

      句子5:The world knows the gods well, but the fame can’t be forgotten. The ancient and the modern will be where they are, and the ridiculous pile of grass is gone. Everyone knows that the gods are good. Only gold and silver can’t be forgotten. In the end, they only hate to gather together, and for a long time they close their eyes. Everyone knows the gods, and only the wife can’t forget. On the birthday of Jun, he said that he was kind, and he died. Everyone knows the gods are good, only the children and grandchildren can’t forget, the infatuated parents have come from many times, and the filial sons and grandchildren have met.

      3.2.3.4 有道翻譯譯文

      句子1:The world is so big, yet I owe it a visit.

      句子2:Let life be beautiful like summer flowers and death like autumn leaves.

      句子3:Happiness and a better future do not come by themselves. Success belongs to the brave and earnest.

      句子4:The world today is undergoing major development, major changes and major adjustments. The trend towards a multi-polar world, economic globalization, social informatization and cultural diversity is gaining momentum, and countries are increasingly interconnected and interdependent. At the same time, factors of instability and uncertainty are on the rise in the international situation, and trends of unilateralism, protectionism and anti-globalization are on the rise.

      句子5:The world all know the immortal is good, but the fame can not forget, ancient and modern phase in where, a pile of grass barren mound. People all know the gods are good, only gold and silver can not forget, eventually only hate to gather no more, and to many eyes closed. The world all xiao fairy good, only the wife can not forget, your birthday said kindness, you died with the people. The world all xiao immortal good, only the children can not forget, spoony parents ancient, filial son who saw.

      3.3 上述四款機器翻譯軟件譯文質量分析

      對句子1“世界那么大,我想去看看?!钡姆g,四款軟件的譯文都比較準確通順,其中百度、訊飛和Google的譯文與人工譯文基本相同。

      第2個句子“生如夏花之絢爛,死如秋葉之靜美。”是印度詩人泰戈爾《飛鳥集》中的一句詩,原文是英語,由我國翻譯家鄭振鐸翻譯成中文。四款軟件的譯文基本都將原文的意思傳達清楚,并且語法正確??拼笥嶏w和Google的譯文相同,有道的譯文則與英語原文完全一樣。

      對句子3“幸福和美好未來不會自己出現,成功屬于勇毅而篤行的人?!钡姆g,四款軟件的譯文雖然都有不足,但是原文的意思基本都傳達出來了??拼笥嶏w的譯文相對其他三款軟件的譯文質量更好一點,Google翻譯對“成功屬于勇毅而篤行的人”這句話的原文意思理解有誤,導致譯文錯誤。

      句子4的內容選自2018年12月“中國對歐盟政策文件(China’s Policy Paper on the European Union )”,人工譯文是該文件的官方英文版本。按照嚴復“信、達、雅”的翻譯原則來看,上述四款機器翻譯軟件對句子4的翻譯都可以做到“信”的標準,“達”的標準也基本可以滿足,但都還有些欠缺。比如說對于“國際形勢中不穩(wěn)定不確定因素增多”中的“不穩(wěn)定不確定因素”的翻譯,人工譯文是“instabilities and uncertainties”,百度、訊飛、Google的翻譯都是“ uncertainties and uncertainties ”,有道的翻譯是“ factors of instability and uncertainty ”。還比如對“逆全球化思潮抬頭”中“逆全球化思潮”的翻譯,人工譯文是“de-globalization”,百度和有道的翻譯都是“ anti-globalization ”,訊飛和Google的翻譯都是“ counter-globalization ”。由此可見,對于一些常見的句子和表達方式,機器翻譯雖然各有不同的翻譯版本,但基本都可以做到忠實準確地傳達原文的內容,但是對于一些原文意思較接近的詞語和表達方式,機器翻譯目前還不能做到準確識別它們的區(qū)別。

      句子5的內容是曹雪芹《紅樓夢》中的《好了歌》,人工譯文是楊憲益、戴乃迭翻譯的版本,譯文雖然能將原文的意思忠實傳達,但是原文特有的節(jié)奏美、韻律美卻很難傳達。對句子5的翻譯,上述四款機器翻譯軟件的質量都不是很好,譯文讓人看后有種不知所云的感覺。由此可見,對于文學作品的翻譯,目前對機器翻譯來說還是一個很大的挑戰(zhàn)。

      通過對當前市場上常用的四款機器翻譯軟件譯文與人工譯文的對比分析,我們可以發(fā)現,雖然目前機器翻譯對于文學作品和一些專業(yè)性較強的文本的翻譯質量還不盡如人意,但是對于一些簡單常見的文本的翻譯,機器翻譯的質量幾乎和人工翻譯不相上下。

      3.4 人工智能背景下機器翻譯前景展望

      人工智能技術在機器翻譯領域的應用與發(fā)展,為機器翻譯質量的提升帶來了新的跨度。當前基于神經網絡的神經機器翻譯系統(tǒng),翻譯的準確度和流暢度都比傳統(tǒng)機器翻譯系統(tǒng)有了一個很大的提升。Google全球技術總監(jiān)、中國上海研發(fā)院院長陳曉認為,“這個提升的跨度比近十年來在原來系統(tǒng)中所有的質量優(yōu)化所提高的總和還要多, 也看到某些語言已經達到了人工翻譯的水平,相當喜人?!盵4]同時人們也開始擔心隨著人工智能技術的飛速發(fā)展,未來的人工智能機器翻譯是否會替代人工翻譯?

      通過對上述四款常用機器翻譯軟件譯文與人工譯文的對比分析,我們可以發(fā)現,目前的機器翻譯軟件還無法完全替代人工翻譯。這主要是因為對于一些翻譯質量要求較高的翻譯,比如高端的商務活動、專業(yè)論文或是文學作品等的翻譯,目前機器翻譯還無法勝任,只能依靠人工翻譯。目前機器翻譯最勝任的是簡單的旅游外語翻譯,因此目前機器翻譯與人工翻譯還不構成競爭關系,機器翻譯僅僅可以替代翻譯過程中的一些初級和簡單的翻譯工作,但是還無法替代高端翻譯人才。

      蘇州大學熊德意教授認為,“機器翻譯效果仍需通過不斷研究來去提高,未來機器翻譯研究人員一定會找到新的課題。而做人工翻譯的人也不用擔心,但要掌控人機協(xié)同技術。機器翻譯可以提升效率,做以前做不了的事情,會挖掘出更多的翻譯需求。翻譯公司可以擁抱機器翻譯,嘗試與AI技術企業(yè)去合作?!盵5]

      4 結語

      盡管目前人工智能技術背景下的機器翻譯質量仍有不足之處,但是當前基于神經網絡的神經機器翻譯系統(tǒng)的翻譯質量已經比傳統(tǒng)機器翻譯系統(tǒng)有了一個很大的提升。從目前來看,人工翻譯仍有著機器翻譯無法替代的地方,未來的機器翻譯將會朝著機器翻譯與人工翻譯相結合的方向發(fā)展,更好地輔助人工翻譯,提高翻譯效率。相信隨著技術的深入發(fā)展,人工智能必將再次賦能機器翻譯,機器翻譯的質量定會取得新的突破與提升,為人類的融合與交流做出更大的貢獻。

      猜你喜歡
      源語言語料庫譯文
      Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
      《語料庫翻譯文體學》評介
      譯文摘要
      水利經濟(2020年3期)2020-02-22 11:38:33
      林巍《知識與智慧》英譯分析
      淺析日語口譯譯員素質
      北方文學(2018年18期)2018-09-14 10:55:22
      把課文的優(yōu)美表達存進語料庫
      I Like Thinking
      跨文化視角下對具有修辭手法諺語英譯漢的研究
      速讀·下旬(2016年7期)2016-07-20 08:50:28
      以口譯實例談雙語知識的必要性
      考試周刊(2015年36期)2015-09-10 15:03:38
      基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      泉州市| 兴城市| 常熟市| 剑川县| 湟中县| 新竹县| 福鼎市| 广东省| 潍坊市| 望奎县| 临颍县| 长寿区| 驻马店市| 九龙县| 永仁县| 民县| 格尔木市| 昆明市| 绵阳市| 平塘县| 曲水县| 玉门市| 山西省| 房产| 合作市| 江达县| 都江堰市| 邓州市| 洛浦县| 天水市| 六盘水市| 饶河县| 临猗县| 盐津县| 梁山县| 基隆市| 潜江市| 嘉义市| 锦州市| 安龙县| 阿尔山市|