任新平 童凱汀
【摘 要】智能語言技術(shù)的快速發(fā)展,為跨語種交流帶來了許多便利,將降低社會對外語人才的需求,使外語學(xué)習(xí)成為一個小眾市場。迫使中國英語教育走向萎縮,促使外語教育進行改革,外語培訓(xùn)行業(yè)在未來或?qū)⑾?。智能語言技術(shù)在未來將更具智能化,使跨語種的信息獲取和交流更加便利。
【關(guān)鍵詞】智能語言技術(shù);外語教育;同聲傳譯
Analysis of Intelligent Language Technology Impact on Foreign Language Education
--English Case
REN Xin-ping TONG Kai-ting
(Henan University of Technology, Zhengzhou Henan 450000, China)
【Abstract】With the development of intelligent language technology,bring a lot of convenience to cross-lingual exchanges , will reduce the social demand for foreign language professionals,may make foreign language learning become a niche market. Development of intelligent language technology forcing Chinese English language education to shrink, prompting foreign language education reform, foreign language training industry in the future or will die. Intelligent language technology in the future will be more intelligent, so that cross-lingual commuication and information exchange more convenient.
【Key words】Intelligent language technology; English language education; Simultaneous interpretation
0 引言
語音識別技術(shù),也叫自動語音識別Automatic Speech Recognition(ASR),通過語音識別從人類的語音中提取出詞匯并轉(zhuǎn)換為例如二進制編碼、按鍵或者字符序列等計算機可讀的輸入。語音識別技術(shù)可應(yīng)用與語音撥號、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音文檔檢索、簡單的聽寫數(shù)據(jù)錄入等。
語音識別技術(shù)與其他自然語言處理技術(shù)如語音合成技術(shù)及機器翻譯相結(jié)合,構(gòu)建出更加復(fù)雜的應(yīng)用,例如同聲傳譯,即語音到語音的翻譯,諸如此類技術(shù)的綜合運用就構(gòu)成智能語言技術(shù)。智能語言技術(shù)最關(guān)鍵的是語音識別技術(shù)、機器翻譯和語音合成技術(shù)。簡單來說,識別技術(shù)將聲音轉(zhuǎn)化為文字,讓機器長上耳朵;合成技術(shù)將文字轉(zhuǎn)化為聲音,讓機器開口說話。同聲傳譯的過程大致可以分為三段,首先是通過語音識別系統(tǒng)將收集到的語音轉(zhuǎn)化為文本;然后是將文本從A語種轉(zhuǎn)換成B語種的機器翻譯;最后將B語種的文字利用個性化的文語轉(zhuǎn)換系統(tǒng)合成與發(fā)音人音色、語速相近的語音,并朗誦出來。
智能語言技術(shù),幫助人類破除語言壁壘,方便了不同語種間的交流,實現(xiàn)無障礙的信息獲取,它讓我們身處于這樣的一個世界——語言將不再是我們挖掘信息和與他人溝通交流的障礙。
1 智能語言技術(shù)發(fā)展現(xiàn)狀
1.1 國外研發(fā)如火如荼
目前,國外有多家企業(yè)對智能語言技術(shù)進行探索,谷歌、微軟等各大科技公司都加入了智能語言技術(shù)的研發(fā)熱潮中,并取得初步成效。
在2012年,微軟首席研究官里克·雷斯特博士在 “21世紀的計算大會”的英文演講,被實時轉(zhuǎn)換成與他的音色相近、字正腔圓的中文。他演示的是微軟最新的研究成果——同聲傳譯,流暢的效果贏得了現(xiàn)場觀眾的掌聲。另外雷斯特表示,微軟的同聲傳譯不僅僅能英譯漢,還能翻譯西班牙語等26種語言。
谷歌在2015年1月宣布為iOS和安卓更新了谷歌的翻譯應(yīng)用,可以把相機拍攝內(nèi)容進行文字翻譯,并且可以支持不同語種間的通話,讓智能手機成為真正意義上的“同聲傳譯”。另外Twitter和Facebook扮演著重要的跨境溝通角色,所以他們自然不甘落后,同樣在開發(fā)自己的翻譯服務(wù),為他們的用戶提供同聲翻譯服務(wù)。
1.2 國內(nèi)探索方興未艾
在國內(nèi),百度一直在機器翻譯、語音識別等人工智能領(lǐng)域進行探索和布局,而實現(xiàn)中、英、日、韓多語實時翻譯的小度機器人則被視為百度在人工智能領(lǐng)域的探索先鋒。
計算語言學(xué)國際2015年年會上,百度研制的智能語音機器人“小度”擔(dān)任了ACL終身成就獎獲得者,首位華人獲獎?wù)呃钌淌诘摹吧衩丶钨e”,并承擔(dān)“同聲傳譯”的職責(zé)。對語義的準確理解以及流暢的翻譯,模仿真人聲音的同聲傳譯能力,使小度機器人受到所有觀眾的好評。百度擁有海量自然語言的語料庫,機器可以從單詞、短語和句子等不同方面自動學(xué)習(xí)并進行理解,突破“調(diào)序”和“消歧”等之前難以解決的問題,不斷優(yōu)化自身系統(tǒng)。另外,百度從海量網(wǎng)頁資源庫中,挖掘出數(shù)以萬計的雙語句對,制作成訓(xùn)練模型的數(shù)據(jù)。這種基于深度學(xué)習(xí)的翻譯模型是提升小度機器人翻譯能力的重要因素。機器實現(xiàn)了“理解語言,生成譯文”這種類似人腦的思維過程,使翻譯質(zhì)量得到“躍進式”提升。
2 智能語言技術(shù)對外語教育的沖擊
2.1 迫使正規(guī)英語教育萎縮
培養(yǎng)具有扎實的英語語言基礎(chǔ)知識和語言基本技能,較熟練的英語語言運用能力的人才,是英語教育的最初目的。一般來說,社會對外語人才需求可分為兩類:對專門外語人才的需求和對一般外語人才的需求,針對這兩種社會需求,中國的英語教育被分為英語專業(yè)和非英語專業(yè)。
但是英語作為工具學(xué)科,在浪費了國人大量時間、精力、金錢并耗費大量的社會資源后,卻未帶來國人英語交流能力的大幅度提升,許多人的英語是“啞巴英語”、“聾子英語”。但是,隨著智能語言技術(shù)在“同聲傳譯”運用中的不斷進步,讓不懂外語的人說出一口流利的外語,實現(xiàn)零外語無障礙交流,在未來必將廣泛運用于生活、工作當(dāng)中,這意味著英語作為交流工具的存在已經(jīng)失去了意義,而英語也不再是人才國際化的必備條件。目前,市場上的機器翻譯產(chǎn)品,有文本翻譯、拍照翻譯和語音翻譯,不管是其中一種翻譯產(chǎn)品,還是兼具三種功能的翻譯產(chǎn)品,都具有較高的智能水平。翻譯的準確度和流暢度都很好,國人不需要通過接受英語教育來獲得與英語使用者交流溝通的能力,這將導(dǎo)致社會對英語人才的需求下降。大面積的英語教育將變得毫無意義,對我國外語教育造成巨大的沖擊,迫使外語學(xué)習(xí)成為小眾市場。這或許引發(fā)中國英語教育又一次重大改革,“2億多學(xué)生,以及難以數(shù)計的社會人在學(xué)英語”的現(xiàn)象或不復(fù)存在,屆時英語或?qū)⒊蔀橄褚魳?、美術(shù)一樣的學(xué)科,一門興趣或特長學(xué)科存在于中國教育領(lǐng)域。
2.2 英語培訓(xùn)行業(yè)或?qū)⑾?/p>
由于正規(guī)學(xué)校外語教育的萎縮,“全民死磕英語”的盛景或?qū)⒊蔀橛洃?,服?wù)于正規(guī)外語教育的培訓(xùn)行業(yè)面臨危機是必然的。學(xué)生應(yīng)試英語培訓(xùn)的需求大幅下降,在英語考試中考得高分不再是參加培訓(xùn)的目的,從這個意義上來說,英語培訓(xùn)市場的暴利時代將會結(jié)束。從長遠看,英語培訓(xùn)的這塊蛋糕會減小,英語培訓(xùn)行業(yè)或?qū)⑾觥?/p>
而對于服務(wù)于實際應(yīng)用的英語培訓(xùn),智能語音技術(shù)對其的影響將是更加直接的。中文與英文之間的口語實時互譯已經(jīng)出現(xiàn),不同語種之間文本互譯的準確程度也得到大幅提升,隨著計算能力的指數(shù)級增長,以及人工智能的算法不斷升級,語音到語音的翻譯即同聲傳譯廣泛運用于各個領(lǐng)域。
智能語言技術(shù)在專業(yè)領(lǐng)域是否能達到很好的效果?對于這個問題不少人抱有疑慮,有人認為機器翻譯終究是“機械”的,它永遠取代不了人類對自然語言的了解。事實上,專業(yè)領(lǐng)域的翻譯并沒有想象的那么難,每個領(lǐng)域都有其專有詞匯,以及慣用的句式、句法。并且由于智能機器能夠通過嚴密訓(xùn)練的方式進行探索,并作出相應(yīng)的調(diào)整,不同領(lǐng)域使用的智能語言技術(shù)可以使用不同的模型訓(xùn)練適合該領(lǐng)域的“同聲傳譯”,并且可以隨著使用量的加大不斷改進。
所以,不管是服務(wù)于正規(guī)教育還是服務(wù)于實際運用的外語培訓(xùn)都面臨智能語言技術(shù)的發(fā)展所帶來的危機,也許一大部分外語培訓(xùn)機構(gòu)會被淘汰,或?qū)?dǎo)致外語培訓(xùn)行業(yè)消失。
3 智能語言技術(shù)前景展望
3.1 技術(shù)將會日益成熟
近幾年,智能語言技術(shù)不斷進步,但是目前仍然存在一些問題:嘈雜環(huán)境下,如何提高語音識別的準確性;現(xiàn)有模型存在瓶頸;系統(tǒng)尚缺乏適合某個特定主題的領(lǐng)域數(shù)據(jù);濃重的口音會影響識別效果等等。該如何有效解決這些問題,使智能語音技術(shù)更好地為社會服務(wù),相關(guān)領(lǐng)域工作人員仍然面臨諸多挑戰(zhàn)。當(dāng)然,在巨頭科技公司的努力下,這些問題在未來都會被解決,并會有如下發(fā)展:
第一,提高可靠度,即使在嘈雜的環(huán)境中,智能語言技術(shù)也可以像人類一樣有意識的排除非需要的聲學(xué)環(huán)境因素,并排除日常生活中人類語言的不確定性、隨意性,更加智能化準確識別所需語音,包括帶有明顯的言語習(xí)慣的句子;第二,增加詞匯量,伴隨海量數(shù)據(jù)庫搜索算法效率的不斷提高、系統(tǒng)建模方法的改進以及硬件資源的開發(fā),未來的智能語言系統(tǒng)可以做到詞匯量不限制以及多種語言混合,那么就能大大降低詞匯量對語音識別的限制,進一步突破智能語言技術(shù)使用的聲學(xué)模型和語音模型的局限;第三,降低成本減小體積,在微小的芯片或模塊上固化智能語言技術(shù)應(yīng)用系統(tǒng),產(chǎn)品體積大幅度降低,使其可以很好地運用于手機和智能穿戴設(shè)備上,推廣智能語言技術(shù)的商業(yè)應(yīng)用。
3.2 交流將會更加順暢
在未來,隨著智能語言技術(shù)的不斷發(fā)展,它將服務(wù)于各個領(lǐng)域,不同語種之間的互譯準確程度也將大幅提升,語音到語音的翻譯將得到更加廣泛的運用。智能語言技術(shù)在智能手機和智能穿戴設(shè)備上的廣泛運用,使得未來的手機和智能穿戴設(shè)備能夠精準地翻譯各種語言,因此人們可以毫無障礙地交流。
在未來,語言也不再是出國旅行的阻礙因素,拿出手機就可以快速解決交流障礙癥,再也不用通過比手畫腳這種尷尬的方式進行信息交流;在中國境內(nèi)的老外向你問路,你卻只能說“Sorry,my English is poor”的尷尬局面也不會再出現(xiàn),一切吃喝住行方面的表達,都能夠通過智能語言技術(shù)解決。
除了日常生活中的交流,智能語言技術(shù)的進步使其在商務(wù)、學(xué)術(shù)等領(lǐng)域也發(fā)揮著重大作用。智能語言技術(shù)可以作為不同國家之間的企業(yè)的交流、溝通、磋商的工具,幫助企業(yè)獲取商業(yè)信息,獲得利益價值,促進國際間的貿(mào)易發(fā)展。另外各國學(xué)術(shù)交流的開展也將變得更加容易,有利于國與國之間的人才培養(yǎng)和科學(xué)研究方面的合作。
4 結(jié)束語
不同語種之間文本互譯準確程度大幅提升,加上隨著智能語言技術(shù)的發(fā)展,口語的實時互譯已經(jīng)出現(xiàn),對中國外語教育造成沖擊是必然的。隨著計算能力的增長,以及人工智能的算法不斷升級,智能語言技術(shù)將得到更加廣泛的運用。隨著智能語言技術(shù)不斷優(yōu)化,“跨域語言,溝通無礙”的美好藍圖,相信在不久的將來就可以實現(xiàn)。
【參考文獻】
[1]禹琳琳.語言識別技術(shù)及其應(yīng)用綜述[J].現(xiàn)代電子技術(shù),2013(13).
[2]余凱.深度學(xué)習(xí)——機器學(xué)習(xí)的新浪潮[J].程序員,2013(02).
[3]Benjamin.通無障礙 機器翻譯漫談[J].大眾軟件,2013(02).
[4]劉雪娟.淺析機器翻譯[J].新課程,2015(21).
[5]魏勇鵬.人工+智能:機器翻譯應(yīng)用的未來[J].程序員,2012(07).
[6]盧鶇翔.DNN與微軟同聲傳譯系統(tǒng)背后的故事[J].程序員,2013(06).
[7]王挺.自然語言處理及其應(yīng)用前景的研究[J].桂林航天工業(yè)高等專科學(xué)報,2006(04).