崔啟亮
(對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué) 英語(yǔ)學(xué)院,北京 100029)
人工智能(AI)是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的技術(shù)。人工智能是引領(lǐng)未來(lái)的戰(zhàn)略性技術(shù),在移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、超級(jí)計(jì)算、傳感器、腦科學(xué)等新的理論和技術(shù)以及社會(huì)經(jīng)濟(jì)發(fā)展強(qiáng)烈需求的共同推動(dòng)下,人工智能得到迅速發(fā)展,呈現(xiàn)出深度學(xué)習(xí)、跨學(xué)科融合、群智開(kāi)放、自主操控等特征(馮志偉,2018:48)。語(yǔ)言服務(wù)企業(yè)是提供翻譯服務(wù)、本地化服務(wù)和語(yǔ)言技術(shù)產(chǎn)品/服務(wù)的企業(yè)群體,語(yǔ)言服務(wù)企業(yè)是提供翻譯和本地化服務(wù)的市場(chǎng)主體。人工智能時(shí)代技術(shù)發(fā)展速度驚人,隨著人工智能、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)技術(shù)不斷融入,翻譯技術(shù)從最初基于規(guī)則的機(jī)器翻譯發(fā)展到依托云技術(shù)、大數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯,小至手機(jī)的翻譯APP,大至翻譯行業(yè)乃至語(yǔ)言服務(wù)領(lǐng)域中的云翻譯,翻譯技術(shù)不斷推陳出新,迭代更替。人工智能的迅速發(fā)展將深刻改變語(yǔ)言服務(wù)企業(yè)的服務(wù)模式和生態(tài)體系(王華樹(shù),2020:87)。
那么,人工智能技術(shù)在語(yǔ)言服務(wù)企業(yè)中應(yīng)用現(xiàn)狀如何呢?語(yǔ)言服務(wù)企業(yè)的產(chǎn)品使用了哪些人工智能技術(shù)呢?人工智能技術(shù)如何改變語(yǔ)言服務(wù)企業(yè)的服務(wù)模式呢?本文先介紹人工智能的基本內(nèi)容,然后從語(yǔ)言服務(wù)行業(yè)調(diào)查報(bào)告以及人工智能在語(yǔ)言服務(wù)企業(yè)產(chǎn)品應(yīng)用兩個(gè)方面進(jìn)行研究,以期探索人工智能對(duì)語(yǔ)言服務(wù)企業(yè)的影響,推動(dòng)語(yǔ)言服務(wù)企業(yè)提升服務(wù)能力和模式變革。
人工智能是自然科學(xué)和社會(huì)科學(xué)交叉的科學(xué),人工智能技術(shù)涉及計(jì)算機(jī)、信息論、控制論、數(shù)學(xué)、語(yǔ)言學(xué)和哲學(xué)等多個(gè)學(xué)科的技術(shù)。
當(dāng)前學(xué)者們比較認(rèn)同的人工智能起源于1956年在美國(guó)召開(kāi)的達(dá)特茅斯(Dartmouth)大學(xué)研討會(huì),會(huì)上首次提出了“人工智能”的術(shù)語(yǔ)。此后人工智能技術(shù)與計(jì)算機(jī)技術(shù)相互促進(jìn),得到快速發(fā)展。近十年來(lái),機(jī)器學(xué)習(xí)、計(jì)算智能、人工神經(jīng)網(wǎng)絡(luò)和行為主義的研究成為熱點(diǎn)。
我國(guó)的人工智能研究起步較晚。納入國(guó)家計(jì)劃的研究(“智能模擬”)始于1978年;1984年召開(kāi)了智能計(jì)算機(jī)及其系統(tǒng)的全國(guó)學(xué)術(shù)討論會(huì);1998年起把智能計(jì)算機(jī)系統(tǒng)、智能機(jī)器人和智能信息處理(含模式識(shí)別)等重大項(xiàng)目列入國(guó)家高技術(shù)研究計(jì)劃。2017年國(guó)務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》文件中,發(fā)展人工智能技術(shù)成為國(guó)家重大發(fā)展戰(zhàn)略。
人工智能具有交叉學(xué)科的特征,產(chǎn)生了不同學(xué)派,其中代表性的學(xué)派包括符號(hào)主義、連接主義和行為主義。符號(hào)主義認(rèn)為人工智能來(lái)自數(shù)理邏輯,連接主義認(rèn)為人工智能源于仿生學(xué),特別是對(duì)人腦模型的研究。行為主義認(rèn)為人工智能源于控制論。
人工智能的研究領(lǐng)域包括自然語(yǔ)言處理、自動(dòng)定理證明、智能數(shù)據(jù)檢索系統(tǒng)、機(jī)器學(xué)習(xí)、模式識(shí)別、視覺(jué)系統(tǒng)、問(wèn)題求解、人工智能方法、程序語(yǔ)言、自動(dòng)程序設(shè)計(jì)(蔡自興 等,2003:9)。人工智能的研究和應(yīng)用可以分為問(wèn)題求解、邏輯推理與定理證明、自然語(yǔ)言理解、自動(dòng)程序設(shè)計(jì)、專家系統(tǒng)、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、機(jī)器人學(xué)、模式識(shí)別、機(jī)器視覺(jué)、智能控制、智能檢索、智能調(diào)度與指揮、分布式人工智能與Agent、計(jì)算智能與進(jìn)化計(jì)算、數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)、人工生命、系統(tǒng)與語(yǔ)言工具。
2017年國(guó)務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》文件中,列出了我國(guó)重點(diǎn)發(fā)展的人工智能技術(shù),包括:知識(shí)計(jì)算引擎與知識(shí)服務(wù)技術(shù)、跨媒體分析推理技術(shù)、群體智能關(guān)鍵技術(shù)、混合增強(qiáng)智能新架構(gòu)與新技術(shù)、自主無(wú)人系統(tǒng)的智能技術(shù)、虛擬現(xiàn)實(shí)智能建模技術(shù)、智能計(jì)算芯片與系統(tǒng)、自然語(yǔ)言處理技術(shù)。
人工智能是復(fù)雜的學(xué)科和技術(shù)體系,融合了移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、超級(jí)計(jì)算、傳感網(wǎng)、腦科學(xué)等技術(shù)。人工智能不同學(xué)派、領(lǐng)域、技術(shù)和應(yīng)用互相交織,構(gòu)成了不斷發(fā)展的人工智能全景。
語(yǔ)言服務(wù)行業(yè)是以促進(jìn)跨語(yǔ)言、跨文化交流為目標(biāo),提供信息轉(zhuǎn)換服務(wù)和產(chǎn)品,以及相關(guān)研究咨詢、技術(shù)研發(fā)、工具應(yīng)用、資產(chǎn)管理、教育培訓(xùn)等專業(yè)化服務(wù)的現(xiàn)代服務(wù)業(yè)(中國(guó)翻譯協(xié)會(huì),2016:16)。本文的研究重點(diǎn)是人工智能在語(yǔ)言服務(wù)企業(yè)的應(yīng)用狀況,語(yǔ)言服務(wù)企業(yè)是提供語(yǔ)言信息轉(zhuǎn)換服務(wù)和提供語(yǔ)言技術(shù)服務(wù)的企業(yè)總稱,語(yǔ)言服務(wù)企業(yè)是語(yǔ)言服務(wù)行業(yè)的重要組成部分。
為了全面了解人工智能在語(yǔ)言服務(wù)企業(yè)中的應(yīng)用,先從國(guó)內(nèi)外語(yǔ)言服務(wù)行業(yè)的市場(chǎng)調(diào)查報(bào)告揭示的數(shù)據(jù)進(jìn)行分析,這些行業(yè)報(bào)告以語(yǔ)言服務(wù)企業(yè)為調(diào)查對(duì)象,從報(bào)告數(shù)據(jù)中可以揭示語(yǔ)言服務(wù)企業(yè)的人工智能應(yīng)用狀況。我們選擇了最近三年(2017—2019)國(guó)際和國(guó)內(nèi)發(fā)布的語(yǔ)言服務(wù)行業(yè)的調(diào)查報(bào)告,國(guó)外以卡門(mén)森斯咨詢公司(CSA Research)的語(yǔ)言服務(wù)市場(chǎng)報(bào)告為例,國(guó)內(nèi)選擇中國(guó)翻譯協(xié)會(huì)(Translators Association of China,TAC)的語(yǔ)言服務(wù)行業(yè)發(fā)展報(bào)告進(jìn)行分析。
卡門(mén)森斯咨詢公司是提供全球語(yǔ)言服務(wù)研究、調(diào)查和咨詢的公司,該公司每年開(kāi)展全球語(yǔ)言服務(wù)企業(yè)的調(diào)查,根據(jù)調(diào)查研究結(jié)果發(fā)布全球語(yǔ)言服務(wù)市場(chǎng)(The Language Services Market)調(diào)查報(bào)告,在國(guó)際語(yǔ)言服務(wù)行業(yè)具有廣泛的影響力。表1是CSA Research發(fā)布的2017—2019年國(guó)際語(yǔ)言服務(wù)企業(yè)機(jī)器翻譯的譯后編輯市場(chǎng)數(shù)據(jù)。表2是CSA Research發(fā)布的2017—2019年國(guó)際語(yǔ)言服務(wù)企業(yè)的語(yǔ)言技術(shù)應(yīng)用數(shù)據(jù)。
表1 國(guó)際語(yǔ)言服務(wù)企業(yè)機(jī)器翻譯的譯后編輯數(shù)據(jù)
表1表明,全球范圍內(nèi),提供機(jī)器翻譯的譯后編輯的語(yǔ)言服務(wù)企業(yè)比例不斷提高,從2019年的29.86%到2019年的36.53%。但是,2019年的數(shù)據(jù)與2018年相差無(wú)幾,說(shuō)明出現(xiàn)了增長(zhǎng)放緩的現(xiàn)象;從全球語(yǔ)言服務(wù)企業(yè)的業(yè)務(wù)占比情況來(lái)看,機(jī)器翻譯的譯后編輯業(yè)務(wù)在波動(dòng)中增長(zhǎng),2017年機(jī)器翻譯的譯后編輯業(yè)務(wù)占全部業(yè)務(wù)的比例是3.74%,2018年小幅下滑到3.64%,2019年又回升到3.81%。
表2 國(guó)際語(yǔ)言技術(shù)服務(wù)企業(yè)的語(yǔ)言技術(shù)應(yīng)用數(shù)據(jù)
表2是2017—2019年CSA Research語(yǔ)言服務(wù)市場(chǎng)報(bào)告關(guān)于人工智能技術(shù)的應(yīng)用數(shù)據(jù),包括機(jī)器翻譯、音頻可視化和語(yǔ)音處理三部分。其中,音頻可視化技術(shù)在全球語(yǔ)言技術(shù)服務(wù)企業(yè)的產(chǎn)品和服務(wù)中持續(xù)增長(zhǎng),從2017年的2.00%到2019年的6.5%;語(yǔ)音處理技術(shù)雖然在2018年小幅下降,但是2019年又回升到1.20%。機(jī)器翻譯技術(shù)在經(jīng)過(guò)2017—2018年的增長(zhǎng)后,2019年略有下降。值得注意的是,2019年的CSA Research調(diào)查報(bào)告首次出現(xiàn)機(jī)器口譯業(yè)務(wù),占0.01%,這個(gè)數(shù)據(jù)雖然不大,但是意義顯著,表明機(jī)器口譯技術(shù)是國(guó)際語(yǔ)言服務(wù)的新需求,表明機(jī)器口譯技術(shù)已經(jīng)開(kāi)始商業(yè)應(yīng)用。
中國(guó)翻譯協(xié)會(huì)是語(yǔ)言服務(wù)領(lǐng)域的全國(guó)性社會(huì)團(tuán)體,自2012年開(kāi)始中國(guó)翻譯協(xié)會(huì)發(fā)布中國(guó)語(yǔ)言服務(wù)行業(yè)發(fā)展報(bào)告,行業(yè)報(bào)告以全面詳實(shí)的數(shù)據(jù),完整呈現(xiàn)了中國(guó)語(yǔ)言服務(wù)行業(yè)的現(xiàn)狀,在國(guó)內(nèi)外的語(yǔ)言服務(wù)行業(yè)具有積極的影響。根據(jù)中國(guó)翻譯協(xié)會(huì)的調(diào)查報(bào)告,分析我國(guó)語(yǔ)言服務(wù)企業(yè)的人工智能技術(shù)應(yīng)用及發(fā)展趨勢(shì),與CSA Research的調(diào)查報(bào)告進(jìn)行對(duì)比,可以更清晰地了解中外語(yǔ)言服務(wù)企業(yè)人工智能的應(yīng)用現(xiàn)狀。
由于中國(guó)翻譯協(xié)會(huì)的各個(gè)調(diào)查報(bào)告結(jié)構(gòu)不一致,內(nèi)容詳略不同,不便于按年度對(duì)同一個(gè)問(wèn)題進(jìn)行對(duì)比分析。因此,我們針對(duì)我國(guó)語(yǔ)言服務(wù)企業(yè)的人工智能應(yīng)用進(jìn)行研究。圖1是根據(jù)中國(guó)翻譯協(xié)會(huì)2016年、2018年和2019年的調(diào)查報(bào)告數(shù)據(jù)。
中國(guó)翻譯協(xié)會(huì)的行業(yè)報(bào)告中,人工智能的應(yīng)用表現(xiàn)在機(jī)器翻譯和譯后編輯方面。從圖1可以發(fā)現(xiàn),2016年17.2%的語(yǔ)言服務(wù)企業(yè)使用了機(jī)器翻譯,2018年27.1%的語(yǔ)言服務(wù)企業(yè)使用機(jī)器翻譯,2019年41.0%的語(yǔ)言服務(wù)企業(yè)經(jīng)常使用機(jī)器翻譯。對(duì)比發(fā)現(xiàn),機(jī)器翻譯的應(yīng)用呈現(xiàn)連續(xù)較大增長(zhǎng)的現(xiàn)象。
具有自主研發(fā)翻譯工具的語(yǔ)言服務(wù)企業(yè)中,使用機(jī)器翻譯的譯后編輯完成語(yǔ)言服務(wù)項(xiàng)目的情況如何呢?2018年中國(guó)翻譯協(xié)會(huì)的行業(yè)調(diào)查報(bào)告顯示,42.7%的語(yǔ)言服務(wù)企業(yè)的21%~40%的項(xiàng)目使用機(jī)器翻譯的譯后編輯;22.5%的語(yǔ)言服務(wù)企業(yè)的41%~60%的項(xiàng)目使用機(jī)器翻譯的譯后編輯。這些數(shù)據(jù)說(shuō)明機(jī)器翻譯的譯后編輯方式已經(jīng)成為越來(lái)越多企業(yè)的翻譯方式。
圖1 我國(guó)語(yǔ)言服務(wù)企業(yè)機(jī)器翻譯使用情況
人工智能技術(shù)正在影響和改變翻譯行業(yè)的生態(tài)面貌,改變著翻譯職業(yè)能力,如翻譯對(duì)象、翻譯角色、翻譯能力、翻譯策略、翻譯方式、翻譯流程、翻譯標(biāo)準(zhǔn)、翻譯環(huán)境、翻譯教育及翻譯研究(孔令然 等,2018:55)。傳統(tǒng)翻譯工作進(jìn)行升級(jí)改造,才能提供高效專業(yè)的語(yǔ)言翻譯服務(wù)。我國(guó)語(yǔ)言服務(wù)企業(yè)從數(shù)量到服務(wù)能力不斷增長(zhǎng),越來(lái)越多的語(yǔ)言服務(wù)企業(yè)研發(fā)和應(yīng)用基于人工智能技術(shù)的產(chǎn)品,這些產(chǎn)品在語(yǔ)言服務(wù)實(shí)踐中應(yīng)用越來(lái)越廣泛,不僅提高了工作效率,而且提高了語(yǔ)言服務(wù)質(zhì)量,體現(xiàn)了人工智能技術(shù)賦能語(yǔ)言服務(wù)的特征。
根據(jù)企業(yè)核心業(yè)務(wù)類型分類,我國(guó)語(yǔ)言服務(wù)企業(yè)分為以提供翻譯與本地化服務(wù)的企業(yè)(稱為“翻譯與本地化企業(yè)”)和提供語(yǔ)言服務(wù)技術(shù)和產(chǎn)品的企業(yè)(稱為“語(yǔ)言技術(shù)企業(yè)”)。相比較而言,以開(kāi)發(fā)語(yǔ)言服務(wù)技術(shù)和產(chǎn)品為核心業(yè)務(wù)的企業(yè)數(shù)量較少,國(guó)內(nèi)還沒(méi)有這方面的權(quán)威數(shù)據(jù),而以翻譯與本地化服務(wù)為主營(yíng)業(yè)務(wù)的在營(yíng)企業(yè)9734家(中國(guó)翻譯協(xié)會(huì),2019:2)。
人工智能在語(yǔ)言服務(wù)企業(yè)的應(yīng)用是本文的研究主題,為此我們選擇的語(yǔ)言服務(wù)企業(yè)滿足三個(gè)條件:(1)公司具有知識(shí)產(chǎn)權(quán)的人工智能產(chǎn)品。(2)人工智能產(chǎn)品具有行業(yè)和專業(yè)領(lǐng)域創(chuàng)新特色。(3)人工智能產(chǎn)品已經(jīng)在語(yǔ)言服務(wù)實(shí)踐中廣泛應(yīng)用。
本文作者長(zhǎng)期在語(yǔ)言服務(wù)企業(yè)和行業(yè)協(xié)會(huì)從事語(yǔ)言技術(shù)與管理工作,與多家語(yǔ)言技術(shù)企業(yè)的高級(jí)管理者、企業(yè)技術(shù)部門(mén)保持密切溝通,多次前往這些企業(yè)進(jìn)行培訓(xùn)、交流、研討,對(duì)語(yǔ)言技術(shù)產(chǎn)品應(yīng)用具有多年的使用體驗(yàn)。根據(jù)選擇語(yǔ)言服務(wù)企業(yè)的三個(gè)條件,篩選出七家企業(yè)的產(chǎn)品,作為我國(guó)語(yǔ)言服務(wù)企業(yè)的代表產(chǎn)品,對(duì)其進(jìn)行研究具有典型性、專業(yè)性、客觀性。人工智能技術(shù)在語(yǔ)言服務(wù)企業(yè)產(chǎn)品的應(yīng)用狀況如表3所示。
這七家語(yǔ)言服務(wù)企業(yè)中,一者、優(yōu)譯、小牛、語(yǔ)帆可以歸為語(yǔ)言技術(shù)公司,譯訊、傳神、精藝達(dá)可以歸為翻譯與本地化服務(wù)公司。從公司地理分布來(lái)看,這些公司的總部分別位于上海、成都、沈陽(yáng)、北京、武漢和廈門(mén),具有廣泛的區(qū)域代表性。
表3 人工智能技術(shù)在語(yǔ)言服務(wù)企業(yè)產(chǎn)品的應(yīng)用
YiCAT和譯馬網(wǎng)是在線翻譯管理平臺(tái)的代表將計(jì)算機(jī)輔助翻譯、機(jī)器翻譯、人工翻譯相結(jié)合,將翻譯技術(shù)與項(xiàng)目管理技術(shù)集成于一體。從應(yīng)用的人工智能技術(shù)來(lái)看,深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)、記憶庫(kù)智能匹配技術(shù)、智能機(jī)器人的流程自動(dòng)化技術(shù)和智能質(zhì)量保證技術(shù)是在線翻譯管理平臺(tái)應(yīng)用的主要技術(shù)。翻譯記憶庫(kù)和術(shù)語(yǔ)管理技術(shù)的底層是語(yǔ)言大數(shù)據(jù)技術(shù),機(jī)器翻譯技術(shù)的底層技術(shù)是自然語(yǔ)言處理技術(shù)。
小??熳gAPP是快速口筆譯APP的代表,支持文本翻譯、語(yǔ)音翻譯、拍照翻譯、多種文檔翻譯,應(yīng)用的人工智能技術(shù)包括深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)、機(jī)器翻譯技術(shù)、語(yǔ)音識(shí)別、圖像識(shí)別和語(yǔ)音合成等技術(shù)。
術(shù)語(yǔ)寶可以完成在線術(shù)語(yǔ)提取、術(shù)語(yǔ)標(biāo)注、術(shù)語(yǔ)分享與管理,以良好的術(shù)語(yǔ)抽取效果,受到越來(lái)越多譯者的歡迎。術(shù)語(yǔ)寶設(shè)計(jì)用到的人工智能技術(shù)包括自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、機(jī)器翻譯、信息抽取、語(yǔ)言大數(shù)據(jù)處理技術(shù)。
譯圖是語(yǔ)言服務(wù)的電子文檔智能自動(dòng)化排版產(chǎn)品的代表,可以完成文件格式轉(zhuǎn)換和自動(dòng)化排版,格式轉(zhuǎn)換和排版質(zhì)量和效率領(lǐng)先于同類產(chǎn)品。譯圖設(shè)計(jì)應(yīng)用的人工智能技術(shù)包括計(jì)算機(jī)視覺(jué)的文字識(shí)別、模糊圖像增強(qiáng)、智能機(jī)器人、流程自動(dòng)化的智能排版。
云譯客之Twinslator(孿生譯員)是人工智能技術(shù)在筆譯翻譯應(yīng)用中的創(chuàng)新產(chǎn)品,該產(chǎn)品在線采集譯員信息、創(chuàng)建孿生譯員(Twinslator)、自動(dòng)采集譯員翻譯的語(yǔ)料、術(shù)語(yǔ)和翻譯行為數(shù)據(jù),訓(xùn)練適合譯員的機(jī)器翻譯。Twinslator應(yīng)用到的人工智能技術(shù)包括機(jī)器學(xué)習(xí)、智能機(jī)器人、機(jī)器翻譯、流程自動(dòng)化和語(yǔ)言大數(shù)據(jù)技術(shù)。
九九譯是為個(gè)人和中小語(yǔ)言服務(wù)需求公司提供在線人機(jī)結(jié)合翻譯和本地化服務(wù)的產(chǎn)品,提供證件翻譯、文檔翻譯、機(jī)器翻譯、音視頻語(yǔ)言服務(wù)。應(yīng)用到的人工智能技術(shù)包括語(yǔ)音識(shí)別、機(jī)器翻譯、語(yǔ)音合成、圖像識(shí)別和機(jī)器學(xué)習(xí)。
以上七家公司的產(chǎn)品只是我國(guó)語(yǔ)言服務(wù)行業(yè)的代表,還有更多的人工智能語(yǔ)言服務(wù)產(chǎn)品沒(méi)有在本文中提到,例如,中譯語(yǔ)通、文思海輝、語(yǔ)言橋、UTH國(guó)際等公司的產(chǎn)品和服務(wù)都具有良好的應(yīng)用和技術(shù)能力。
從這些產(chǎn)品設(shè)計(jì)應(yīng)用的人工智能技術(shù)分類看,各個(gè)產(chǎn)品都集成了多項(xiàng)人工智能技術(shù),它們共同服務(wù)于語(yǔ)言服務(wù)任務(wù)或項(xiàng)目需求。其中,自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)是應(yīng)用最廣泛的人工智能通用技術(shù)。機(jī)器翻譯、圖像識(shí)別、語(yǔ)音識(shí)別是最常用的人工智能應(yīng)用技術(shù)。
需要強(qiáng)調(diào)的是技術(shù)不是萬(wàn)能的,技術(shù)是完成任務(wù)的手段,技術(shù)、業(yè)務(wù)和人員結(jié)合是語(yǔ)言服務(wù)產(chǎn)品和人工智能技術(shù)發(fā)揮更大功用的有效形式。張愛(ài)玲等(2018:92-93)指出當(dāng)前人工智能技術(shù)在筆譯領(lǐng)域已經(jīng)得到廣泛應(yīng)用,但是在同傳口譯中人工智能技術(shù)還不成熟。人工智能技術(shù)應(yīng)用的深度和廣度,不僅取決于技術(shù)本身的成熟度和產(chǎn)品質(zhì)量,而且還受用戶習(xí)慣和法律法規(guī)的制約,從這個(gè)意義來(lái)說(shuō),研究人工智能技術(shù)倫理可以更好地應(yīng)用技術(shù)服務(wù)社會(huì)需求(任文,2019:51)。
人類社會(huì)已進(jìn)入人工智能時(shí)代,作為人工智能技術(shù)應(yīng)用分支的翻譯技術(shù)對(duì)翻譯行業(yè)帶來(lái)深刻影響(崔啟亮,2019:82),前面分析的七個(gè)人工智能產(chǎn)品反映了這種影響。雖然七個(gè)產(chǎn)品各有特色,但是從人工智能技術(shù)在語(yǔ)言服務(wù)產(chǎn)品的創(chuàng)新應(yīng)用來(lái)看,傳神云譯客的Twinslator是最具行業(yè)創(chuàng)新的產(chǎn)品,它的本質(zhì)是通過(guò)深度學(xué)習(xí)和智能機(jī)器人等技術(shù),訓(xùn)練和生成適合譯者的機(jī)器翻譯系統(tǒng),Twinslator工作原理如圖2所示。云譯客協(xié)作翻譯平臺(tái)可以讓每一個(gè)志愿譯者共同創(chuàng)建和維護(hù)語(yǔ)言和文化的多樣性,共享翻譯記憶軟件,分享多語(yǔ)種平行語(yǔ)料,促進(jìn)翻譯在文化層面和技術(shù)層面上的發(fā)展(邵璐 等,2020:108)。
圖2 傳神孿生譯員(Twinslator)工作原理
語(yǔ)言大數(shù)據(jù)是訓(xùn)練機(jī)器翻譯的重要數(shù)據(jù),早在2013年翻譯自動(dòng)化用戶協(xié)會(huì)(TAUS,2013:41)即發(fā)布報(bào)告指出:“給予足夠和適當(dāng)?shù)姆g數(shù)據(jù),有可能在一天內(nèi)為具體行業(yè)、組織乃至產(chǎn)品創(chuàng)建計(jì)算機(jī)翻譯引擎?!睍r(shí)至今日,這種預(yù)測(cè)正在成為現(xiàn)實(shí)。傳神Twinslator以翻譯過(guò)程數(shù)據(jù)和場(chǎng)景信息數(shù)據(jù)為語(yǔ)言知識(shí)庫(kù)的知識(shí)來(lái)源,其中,語(yǔ)料數(shù)據(jù)和術(shù)語(yǔ)數(shù)據(jù)是語(yǔ)言數(shù)據(jù)的兩種類型。它是以開(kāi)放互聯(lián)、數(shù)據(jù)共享和自定義機(jī)器翻譯引擎為設(shè)計(jì)理念的創(chuàng)新產(chǎn)品,目標(biāo)是實(shí)現(xiàn)機(jī)器翻譯速度和人工翻譯質(zhì)量的平衡,譯員加入后即可激活專屬機(jī)翻引擎訓(xùn)練特權(quán),擁有專屬Twinslator機(jī)器翻譯引擎。
Twinslator可以根據(jù)譯員擅長(zhǎng)的行業(yè)和語(yǔ)種創(chuàng)建一個(gè)或多個(gè)Twinslator,譯者可以隨時(shí)上傳和維護(hù)翻譯語(yǔ)料庫(kù)和術(shù)語(yǔ)庫(kù),在線創(chuàng)建、編輯和保存翻譯任務(wù)和譯文。Twinslator通過(guò)術(shù)語(yǔ)同步、語(yǔ)料同步以及在線翻譯功能使用過(guò)程中產(chǎn)生的翻譯特征及行為數(shù)據(jù)的自動(dòng)采集實(shí)現(xiàn)譯員DNA克隆。通過(guò)人機(jī)共譯交互層和應(yīng)用層的數(shù)據(jù)傳輸和處理,實(shí)現(xiàn)人賦慧于機(jī)器,機(jī)器賦能于人的目標(biāo)。譯員持續(xù)貢獻(xiàn)的術(shù)語(yǔ)、語(yǔ)料以及翻譯特征、翻譯行為等數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)分析和處理后,輔以云譯客語(yǔ)言處理技術(shù),實(shí)現(xiàn)Twinslator引擎的翻譯質(zhì)量從量變到質(zhì)變,形成譯員專屬的機(jī)器翻譯系統(tǒng),不斷提高譯者翻譯效率和質(zhì)量。譯員可以隨時(shí)選擇將Twinslator的譯文與谷歌翻譯、百度翻譯、有道翻譯和搜狗翻譯等機(jī)器翻譯譯文進(jìn)行對(duì)比。
Twinslator是多種人工智能技術(shù)集中應(yīng)用的產(chǎn)物,它集成了自然語(yǔ)言處理、深度學(xué)習(xí)、人機(jī)交互和智能機(jī)器人等技術(shù),已經(jīng)在翻譯服務(wù)中取得了積極應(yīng)用。至2020年12月11日,Twinslator術(shù)語(yǔ)對(duì)總量23764529條,語(yǔ)料庫(kù)68304088句對(duì)。其中,中英通用術(shù)語(yǔ)對(duì)為97561條,中英語(yǔ)料庫(kù)1195228句對(duì);工程行業(yè)的中英術(shù)語(yǔ)86012條,中英語(yǔ)料庫(kù)1277631句對(duì)。應(yīng)用領(lǐng)域涵蓋建筑、文化、財(cái)經(jīng)、電商、法律、文學(xué)、機(jī)械和信息技術(shù)等領(lǐng)域。Twinslator的應(yīng)用將機(jī)器處理的效率和人工翻譯的創(chuàng)造性相互賦能,將改變傳統(tǒng)人工翻譯的方式,將譯者、語(yǔ)料、術(shù)語(yǔ)、技術(shù)和管理融合,形成翻譯服務(wù)新模式、新產(chǎn)品、新應(yīng)用。
人工智能技術(shù)在語(yǔ)言服務(wù)企業(yè)的產(chǎn)品中已經(jīng)較為廣泛應(yīng)用。其中,自然語(yǔ)言處理和機(jī)器學(xué)習(xí)是應(yīng)用最廣泛的人工智能領(lǐng)域。機(jī)器翻譯、圖像識(shí)別、語(yǔ)音識(shí)別是語(yǔ)言服務(wù)企業(yè)產(chǎn)品中應(yīng)用較多的具體技術(shù)。“AI技術(shù)+流程+團(tuán)隊(duì)”推動(dòng)語(yǔ)言服務(wù)模式變革,改變了語(yǔ)言服務(wù)的實(shí)施方式、服務(wù)能力、翻譯行為和管理方式。隨著智能化、數(shù)字化、自動(dòng)化的快速發(fā)展,更多人工智能技術(shù)將在語(yǔ)言服務(wù)企業(yè)產(chǎn)品中得到應(yīng)用,推動(dòng)語(yǔ)言服務(wù)行業(yè)和企業(yè)不斷發(fā)展進(jìn)步,提供更智能、更敏捷、更專業(yè)的信息服務(wù)。