摘 要:涉海翻譯關(guān)涉國(guó)家海洋形象的構(gòu)建和國(guó)家海洋話語的全球化傳播,是國(guó)家對(duì)外傳播中國(guó)海洋文化、中國(guó)海洋發(fā)展方案,推動(dòng)“一帶一路”倡議的重要手段。ChatGPT作為一種新型生成式人智能,擁有強(qiáng)大的語義解析能力、語境理解能力、知識(shí)生成能力和多語言支持能力,因此具有優(yōu)越的自動(dòng)翻譯性能,應(yīng)用于涉海翻譯具有多方面優(yōu)勢(shì)。以ChatGPT為例,研究生成式人工智能在涉海翻譯方面的應(yīng)用,分析其翻譯機(jī)理、優(yōu)勢(shì)、挑戰(zhàn)和前景,旨在為國(guó)家涉海翻譯能力建設(shè)提供參考。
關(guān)鍵詞:生成式人工智能;ChatGPT;涉海翻譯;國(guó)家翻譯能力
中圖分類號(hào):H315.9文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-335X(2024)02-0012-09
DOI:10.16497/j.cnki.1672-335X.202402002
涉海翻譯是一切與海洋相關(guān)的文本翻譯的總稱。從內(nèi)容類型看,其翻譯對(duì)象包括與海洋相關(guān)的政治、經(jīng)濟(jì)、文化、法律、外交、國(guó)防、科技等領(lǐng)域的文本。從翻譯方向看,既指向以域外知識(shí)引進(jìn)為主要目標(biāo)的譯入活動(dòng),也指向旨在對(duì)外傳播中國(guó)海洋文化、構(gòu)建中國(guó)海洋強(qiáng)國(guó)形象的譯出活動(dòng)。海洋是國(guó)家發(fā)展的戰(zhàn)略空間,黨的十八大從國(guó)家戰(zhàn)略高度提出維護(hù)國(guó)家海洋權(quán)益,建設(shè)海洋強(qiáng)國(guó)工作部署。習(xí)近平總書記在致2019中國(guó)海洋經(jīng)濟(jì)博覽會(huì)的賀信中指出,“海洋是高質(zhì)量發(fā)展戰(zhàn)略要地。要促進(jìn)海上互聯(lián)互通和各領(lǐng)域務(wù)實(shí)合作,積極發(fā)展‘藍(lán)色伙伴關(guān)系”。[1]2022年4月,習(xí)近平總書記在考察海南時(shí)強(qiáng)調(diào):“建設(shè)海洋強(qiáng)國(guó)是實(shí)現(xiàn)中華民族偉大復(fù)興的重大戰(zhàn)略任務(wù)?!盵2]在此背景下,涉海翻譯對(duì)于國(guó)家海洋知識(shí)體系的構(gòu)建、國(guó)家海洋文化的全球化傳播、中國(guó)參與全球海洋治理等,具有重要意義。以美國(guó)OpenAI公司開發(fā)的語言大模型ChatGPT為代表的生成式人工智能具有強(qiáng)大的交互能力,用戶可使用自然語言以對(duì)話的形式與ChatGPT進(jìn)行交互,使之完成自動(dòng)問答、自動(dòng)文摘、知識(shí)整理、資料收集、聊天對(duì)話、多模態(tài)信息識(shí)別等多種自然語言理解和內(nèi)容生成任務(wù)。這些能力使ChatGPT表現(xiàn)出卓越的翻譯能力,作為涉海翻譯工具具有廣泛的應(yīng)用前景。有鑒于此,本文以ChatGPT為例,就生成式人工智能應(yīng)用于涉海翻譯的優(yōu)勢(shì)、挑戰(zhàn)和前景進(jìn)行分析,以期推動(dòng)學(xué)界關(guān)注其對(duì)涉海翻譯的變革性影響。
一、ChatGPT翻譯原理及應(yīng)用優(yōu)勢(shì)
ChatGPT結(jié)合編碼器-解碼器結(jié)構(gòu)和自注意力機(jī)制,通過多層堆疊的Transformer單元實(shí)現(xiàn)文本翻譯任務(wù)。ChatGPT擁有強(qiáng)大語言處理和內(nèi)容生成能力,應(yīng)用于涉海翻譯,較之于人工翻譯或傳統(tǒng)機(jī)器翻譯模式具有獨(dú)特的優(yōu)勢(shì)。
(一)ChatGPT翻譯原理
ChatGPT是一個(gè)基于Transformer架構(gòu)的語言模型,使用編碼器—解碼器結(jié)構(gòu)以及自注意力機(jī)制實(shí)現(xiàn)翻譯。在翻譯過程中,ChatGPT將待翻譯的文本作為輸入,經(jīng)過編碼器進(jìn)行編碼,然后將編碼后的表示傳遞給解碼器。解碼器根據(jù)編碼的表示生成翻譯后的文本。同時(shí),使用注意力機(jī)制幫助模型在生成翻譯文本時(shí)關(guān)注輸入文本中的關(guān)鍵信息。具體而言,編碼器負(fù)責(zé)將待翻譯的文本序列轉(zhuǎn)換為一系列隱藏表示向量。它通過多層的自注意力機(jī)制捕捉輸入文本中各個(gè)詞之間的依賴關(guān)系和重要信息。自注意力機(jī)制可以幫助模型在編碼過程中同時(shí)考慮輸入文本中所有位置的信息,以更好地表示文本語義和結(jié)構(gòu)。解碼器接收編碼器生成的隱藏表示向量,并根據(jù)這些表示逐步生成目標(biāo)語言的文本序列。解碼器同樣使用自注意力機(jī)制,但在生成過程中還會(huì)結(jié)合編碼器的隱藏表示和目標(biāo)語言部分已生成的單詞來決定下一個(gè)單詞的生成。在編碼器和解碼器中,自注意力機(jī)制用于計(jì)算每個(gè)詞與其他所有詞之間的注意力權(quán)重。通過自注意力機(jī)制,模型可以根據(jù)輸入文本中不同詞之間的相關(guān)性動(dòng)態(tài)調(diào)整每個(gè)詞的表示,從而更好地捕捉文本的上下文信息。在解碼階段,模型通過逐步生成目標(biāo)語言的文本,并結(jié)合注意力機(jī)制來輸入文本的不同部分進(jìn)行關(guān)注,從而生成連貫且準(zhǔn)確的翻譯結(jié)果。
ChatGPT作為一個(gè)通用語言模型顛覆了傳統(tǒng)的機(jī)器翻譯模式,表現(xiàn)為:第一,主要采用無監(jiān)督預(yù)訓(xùn)練方式,不再區(qū)分雙語數(shù)據(jù)或者單語數(shù)據(jù),也不再區(qū)分語言種類,極大降低了數(shù)據(jù)獲取成本,并且可以通過深度學(xué)習(xí)機(jī)制獲得面向多語言的翻譯能力;第二,其核心模型是單向生成式解碼器,實(shí)質(zhì)上就是基于文本前綴預(yù)測(cè)下一個(gè)詞語,可利用任何類型的文本數(shù)據(jù)(包括代碼數(shù)據(jù)等)進(jìn)行訓(xùn)練,從而能夠?qū)W習(xí)到更加豐富、更加通用的語言知識(shí)和模式,因此具有更強(qiáng)的語言和領(lǐng)域泛化能力;第三,無監(jiān)督學(xué)習(xí)方式和巨大的上下文窗口使其可以學(xué)習(xí)到更豐富的上下文信息,從而在翻譯時(shí)具有更強(qiáng)的上下文理解能力,能夠更加準(zhǔn)確地翻譯含有歧義或復(fù)雜結(jié)構(gòu)的句子;第四,表現(xiàn)出更強(qiáng)的理解能力,生成的譯文更容易讓用戶接受,翻譯結(jié)果更加流暢、更加準(zhǔn)確;第五,不再局限于僅接收用戶待翻譯輸入然后輸出譯文結(jié)果,更擅長(zhǎng)遵循用戶交互意圖進(jìn)行實(shí)時(shí)修改和更新,實(shí)現(xiàn)了更加擬人的翻譯過程。
(二)ChatGPT應(yīng)用于涉海翻譯的優(yōu)勢(shì)
ChatGPT強(qiáng)大的語義解析能力、語境理解能力、內(nèi)容生成能力和快速響應(yīng)能力賦予其卓越的自動(dòng)翻譯功能,應(yīng)用于涉海翻譯具有多方面優(yōu)勢(shì)。
1.有助于提高翻譯準(zhǔn)確性
2020年面世的ChatGPT-3參數(shù)量高達(dá)1750億。谷歌開發(fā)的Switch Transformer模型的參數(shù)量首次超過萬億。[3]北京智源研究院研發(fā)的預(yù)訓(xùn)練模型“悟道2.0”參數(shù)量超過1.75萬億?;诰蘖繑?shù)據(jù)的預(yù)訓(xùn)練使ChatGPT類的新型生成式人工智能具有優(yōu)良的內(nèi)容生成能力、強(qiáng)大的語境析讀能力和自我學(xué)習(xí)能力,擁有豐富的知識(shí)面。指令微調(diào)機(jī)制使ChatGPT能忠實(shí)地響應(yīng)人的指令,類人對(duì)齊機(jī)制使之能避免輸出有害內(nèi)容和拒絕響應(yīng)知識(shí)范圍之外的提示,保證輸出的內(nèi)容符合用戶的期望。在翻譯過程中,ChatGPT基于自身海量預(yù)訓(xùn)練數(shù)據(jù),利用深度學(xué)習(xí)技術(shù),自動(dòng)學(xué)習(xí)和理解源語言文本,獲取源文本的語義和語法結(jié)構(gòu),并對(duì)上下文進(jìn)行推斷和理解,捕捉語言的復(fù)雜性,因此在處理長(zhǎng)句子、復(fù)雜語境和多義詞時(shí)表現(xiàn)良好。為驗(yàn)證翻譯的準(zhǔn)確性,抽取2023年《中華人民共和國(guó)和菲律賓共和國(guó)聯(lián)合聲明》第十三條內(nèi)容輸入ChatGPT,并指令“將本段翻譯成英文”。原文為:
兩國(guó)元首就南海局勢(shì)深入坦誠(chéng)交換意見,強(qiáng)調(diào)南海爭(zhēng)議不是雙邊關(guān)系的全部,同意妥善管控分歧。雙方重申維護(hù)及促進(jìn)地區(qū)和平穩(wěn)定、南海航行和飛越自由的重要性,同意在《南海各方行為宣言》以及《聯(lián)合國(guó)憲章》和1982年《聯(lián)合國(guó)海洋法公約》基礎(chǔ)上,以和平方式處理爭(zhēng)議。
譯文為:The heads of the two countries had a thorough and candid exchange of views on the South China Sea situation, emphasizing that the South China Sea dispute is not the whole of bilateral relations, and agreeing to properly manage differences. The two sides reiterated the importance of maintaining and promoting regional peace and stability, freedom of navigation and overflight in the South China Sea, and agreed to peacefully resolve disputes on the basis of the Declaration on the Conduct of Parties in the South China Sea, the United Nations Charter, and? 1982 United Nations Convention on the Law of the Sea.
分析上文可知,譯文的語法正確,句法自然,文件標(biāo)題翻譯準(zhǔn)確。整體上,譯文語言流暢地道,符合英語表達(dá)習(xí)慣。
2.有助于提高翻譯效率
ChatGPT是一個(gè)自動(dòng)化翻譯工具,可以快速響應(yīng)人的翻譯需求。在執(zhí)行涉海翻譯任務(wù)時(shí),ChatGPT龐大的預(yù)訓(xùn)練數(shù)據(jù)就會(huì)自動(dòng)成為背景性知識(shí)庫(kù)、語料庫(kù)、術(shù)語庫(kù)、信息庫(kù),為生成準(zhǔn)確譯文提供語言和專業(yè)層面的支撐。ChatGPT翻譯的底層邏輯主要基于Transformer模型,是一種基于自注意力機(jī)制的深度神經(jīng)網(wǎng)絡(luò)架構(gòu),可快速準(zhǔn)確地計(jì)算出原文和譯文之間的語義對(duì)應(yīng)關(guān)系,從而高效地完成翻譯任務(wù)。與傳統(tǒng)人工翻譯相比,可極大節(jié)省時(shí)間和人力成本,提高翻譯效率。與百度翻譯、有道翻譯、谷歌翻譯、DeepL等翻譯軟件相比,ChatGPT的微調(diào)機(jī)制賦予其更強(qiáng)的交互性,使之能在人的指令提示下調(diào)整譯文詞匯、句法、風(fēng)格特征,更能適應(yīng)多樣化的涉海翻譯場(chǎng)景需求。
3.有助于提升翻譯工作體驗(yàn)
ChatGPT以對(duì)話形式進(jìn)行翻譯,易于操作,具有極高的用戶友好性。譯者可直接與ChatGPT交互,輸入需要翻譯的內(nèi)容,一鍵即可獲取翻譯結(jié)果。在這一過程中,譯者無需付出太多的知識(shí)成本、注意力成本、時(shí)間成本。其次,ChatGPT基于大規(guī)模預(yù)訓(xùn)練模型開展工作,可通過迭代和持續(xù)學(xué)習(xí)不斷改進(jìn)和優(yōu)化翻譯效果。隨著時(shí)間推移,可從用戶反饋和相關(guān)數(shù)據(jù)中獲得更多信息,在此基礎(chǔ)上自我調(diào)整模型參數(shù),幫助譯者提升翻譯質(zhì)量。ChatGPT的訓(xùn)練語料涵蓋廣泛的領(lǐng)域、多種語篇類型和多種語言,因此具有很強(qiáng)的多樣性和靈活性。這使得ChatGPT與傳統(tǒng)的機(jī)器翻譯軟件或系統(tǒng)相比,擁有更高的泛化能力,可以更好地適應(yīng)不同語言、文化、專業(yè)背景,為譯者生成更為準(zhǔn)確的翻譯結(jié)果。此外,ChatGPT表現(xiàn)出很強(qiáng)的可擴(kuò)展性,可與谷歌、New Bing等搜索引擎集成,還可提供插件服務(wù),以獲取最新信息,運(yùn)行計(jì)算,使用第三方服務(wù)。例如,基于GPT-4,微軟發(fā)布了Copilot智能助手,大幅度提升了Office、GitHub等工具的智能水平和服務(wù)能力。良好的可拓展性,有利于譯者有效整合不同類型的翻譯服務(wù)工具,改善工作體驗(yàn)。
4.有助于提升國(guó)家涉海翻譯能力
ChatGPT支持多種語言對(duì)之間的互譯,包括中、英、法、德、西、阿、日等常用的國(guó)際語言,也可進(jìn)行荷蘭語、芬蘭語、烏克蘭語、蒙古語等小語種的互譯。過去十年,國(guó)家大力推動(dòng)“一帶一路”倡議。截至2023年8月,中國(guó)已同152個(gè)國(guó)家和32個(gè)國(guó)際組織簽署200余份共建“一帶一路”合作文件。[4]“海上絲路”合作共建國(guó)家眾多,涉及的語言具有多樣性,對(duì)我國(guó)涉海翻譯能力提出了新挑戰(zhàn)。ChatGPT的多語言翻譯功能突破了人工翻譯的語種數(shù)量局限,有助于我們拓展翻譯文本的語言對(duì)象,為復(fù)語、多語涉海翻譯提供助力,提高國(guó)家涉海翻譯能力。
二、ChatGPT涉海翻譯面臨的挑戰(zhàn)
如前所述,較之于谷歌翻譯、DeepL、Trados等翻譯軟件和翻譯平臺(tái),以及人工翻譯,ChatGPT具有無可比擬的優(yōu)勢(shì),有助于提高涉海翻譯質(zhì)量,提升譯者工作體驗(yàn),提高國(guó)家涉海翻譯能力,因而在國(guó)家涉海翻譯領(lǐng)域具有廣闊的應(yīng)用前景。任何事物都有兩面性,應(yīng)注意到,ChatGPT用于涉海翻譯也潛藏著風(fēng)險(xiǎn)。
(一)翻譯準(zhǔn)確性欠缺
ChatGPT翻譯具有較高的準(zhǔn)確性。語言具有復(fù)雜性,不同語言之間的表達(dá)方式和習(xí)慣用法可能存在差異。這可能導(dǎo)致ChatGPT的翻譯結(jié)果發(fā)生意義偏移或遺漏,影響翻譯的準(zhǔn)確性。其次,ChatGPT雖具有強(qiáng)大的語境理解能力,但畢竟是機(jī)器,語言感知能力、理解能力和邏輯思維能力無法與人相比,也不具備專業(yè)譯者的能動(dòng)性,因此在翻譯中處理具有多義性的詞匯、結(jié)構(gòu)復(fù)雜的句子或內(nèi)涵豐富的語境時(shí),可能忽略或誤解一些重要的上下文信息,導(dǎo)致翻譯結(jié)果不準(zhǔn)確或不連貫。第三,語言是文化的一部分,特定的文化背景和語言習(xí)慣可能給翻譯造成困難。ChatGPT可能無法理解文化異質(zhì)性因素,也就難以譯出文化負(fù)載項(xiàng)如典故、諺語或隱喻的原義。此外,ChatGPT翻譯的準(zhǔn)確性還受制于預(yù)訓(xùn)練語料。如果預(yù)訓(xùn)練語料沒有涵蓋特定領(lǐng)域的專業(yè)術(shù)語和行業(yè)特色詞匯,翻譯時(shí)就可能出現(xiàn)術(shù)語翻譯錯(cuò)誤。
為驗(yàn)證涉海術(shù)語翻譯的準(zhǔn)確性,將《中華人民共和國(guó)領(lǐng)海及毗鄰區(qū)法》第二條第二段內(nèi)容輸入ChatGPT進(jìn)行翻譯,原文為:
中華人民共和國(guó)的陸地領(lǐng)土包括中華人民共和國(guó)大陸及其沿海島嶼、臺(tái)灣及其包括釣魚島在內(nèi)的附屬各島、澎湖列島、東沙群島、西沙群島、中沙群島、南沙群島以及其他一切屬于中華人民共和國(guó)的島嶼。
譯文為:
The land territory of the People′s Republic of China includes the Chinese mainland and its coastal islands, Taiwan and its associated islands including Diaoyu Island, the Pescadores Islands, the Pratas Islands, the Paracel Islands, the Macclesfield Bank, the Spratly Islands, and all other islands belonging to the People′s Republic of China.
分析可得,澎湖列島、東沙群島、西沙群島、中沙群島、南沙群島的譯文均非中國(guó)官方譯文,如不經(jīng)審核加以采用,可能嚴(yán)重?fù)p害國(guó)家主權(quán)利益。
(二)翻譯倫理隱患
語言承載社會(huì)意識(shí),是社會(huì)價(jià)值觀的反映。ChatGPT大規(guī)模利用通用語料作為基底數(shù)據(jù)訓(xùn)練模型,這些語料不可避免地承載著人類社會(huì)的道德觀念、規(guī)范標(biāo)準(zhǔn)、倫理價(jià)值。ChatGPT擁有自主深度學(xué)習(xí)能力,大量數(shù)據(jù)通過無監(jiān)督式深度學(xué)習(xí)進(jìn)入訓(xùn)練數(shù)據(jù)庫(kù)?!盁o監(jiān)督式學(xué)習(xí)的輸入和輸出均為未知,使機(jī)器擁有更多的自主性,但這種方式極易將數(shù)據(jù)庫(kù)推進(jìn)更深的‘黑箱”,[5](P95)難以規(guī)避計(jì)算偏見問題。以性別偏見為例,國(guó)內(nèi)有研究表明,ChatGPT在算法層面存在性別歧視傾向。研究者在使用GPT-2進(jìn)行模型預(yù)測(cè)時(shí),其算法有70.59%的概率將教師預(yù)判為男性,將醫(yī)生預(yù)測(cè)為男性的概率也高達(dá)64.03%,女性被認(rèn)為上述職業(yè)的概率明顯低于男性。[6]國(guó)外也有研究發(fā)現(xiàn),使用帶有性別偏見的語料訓(xùn)練模型,可能導(dǎo)致訓(xùn)練后的詞向量具有性別歧視,例如,man與honorable的語義距離顯著地小于woman,woman與submissive的語義距離小于man。性別偏見在機(jī)器翻譯等自然語言處理任務(wù)中也普遍存在。[7]語言模型的偏見問題很大程度上是由訓(xùn)練數(shù)據(jù)中存在的偏見所導(dǎo)致的。語言模型的數(shù)據(jù)偏見會(huì)對(duì)其算法產(chǎn)生影響,容易使算法習(xí)得偏見,最終影響其內(nèi)容生成的決策。在執(zhí)行翻譯任務(wù)時(shí),ChatGPT的輸出是基于其在訓(xùn)練數(shù)據(jù)中獲得的信息。如果訓(xùn)練數(shù)據(jù)中存在不當(dāng)、歧視性或有害性的內(nèi)容,就可能生成類似的翻譯結(jié)果。當(dāng)翻譯的內(nèi)容涉及宗教、種族、性別、文化、政治等敏感問題時(shí),數(shù)據(jù)偏見會(huì)損害用戶權(quán)益,影響社會(huì)和諧和國(guó)際關(guān)系。在ChatGPT中提問“ChatGPT翻譯是否存在偏見”,得到的回答是:
ChatGPT是一種基于大規(guī)模訓(xùn)練數(shù)據(jù)的機(jī)器翻譯模型,本身并不具有偏見。但是,在訓(xùn)練數(shù)據(jù)中存在一些文化、社會(huì)和語言上的差異,這可能會(huì)導(dǎo)致模型產(chǎn)生某種形式的偏見。例如,現(xiàn)有的數(shù)據(jù)集中可能存在性別或種族方面的偏差,這可能會(huì)影響到ChatGPT生成的翻譯結(jié)果。另外,模型也可能因?yàn)檎Z言表達(dá)形式的差異,而產(chǎn)生某些誤解或誤譯。此外,由于模型的訓(xùn)練數(shù)據(jù)取自于互聯(lián)網(wǎng)或特定領(lǐng)域,對(duì)于一些場(chǎng)景的翻譯可能缺乏相關(guān)知識(shí)或背景信息,因而導(dǎo)致一定程度的偏見問題。
可見,ChatGPT自身并不否認(rèn)翻譯偏見發(fā)生的可能性。ChatGPT產(chǎn)生于美國(guó),根植于西方的社會(huì)文化土壤,其底層語料不可避免地帶有西方意識(shí)形態(tài)烙印而對(duì)中國(guó)存在政治、文化、價(jià)值觀偏見。在使用ChatGPT對(duì)外翻譯中國(guó)“海洋強(qiáng)國(guó)”“人類海洋命運(yùn)共同體”“一帶一路”倡議等國(guó)家涉海核心話語時(shí),要強(qiáng)化政治審核,避免翻譯偏見損害國(guó)家形象、國(guó)家利益。
(三)翻譯安全風(fēng)險(xiǎn)
翻譯安全研究是“從安全論視角審視翻譯、研究翻譯,對(duì)翻譯中的種種現(xiàn)象進(jìn)行安全剖析;或從翻譯研究角度審視安全、研究安全,對(duì)安全中的種種現(xiàn)象進(jìn)行翻譯及翻譯研究方面的剖析”,[8](P233)關(guān)注翻譯在國(guó)家安全中的作用、地位和影響。ChatGPT作為一種具有高交互性智能化翻譯工具,現(xiàn)在已經(jīng)日益介入翻譯行業(yè),表現(xiàn)出廣泛的應(yīng)用前景。經(jīng)由ChatGPT翻譯的內(nèi)容在國(guó)家的對(duì)外傳播中發(fā)揮著越來越重要的作用。在這種語境下,討論其翻譯安全問題十分重要。ChatGPT擁有海量的語言數(shù)據(jù)并且學(xué)會(huì)了人類的言說方式,在翻譯中不僅可以產(chǎn)生準(zhǔn)確的內(nèi)容,也可能因自身數(shù)據(jù)、算法、知識(shí)、理解力等方面的局限產(chǎn)生偏見性、負(fù)面的內(nèi)容。ChatGPT涉海翻譯的安全問題包括翻譯內(nèi)容安全、翻譯語言安全、翻譯話語安全和翻譯數(shù)據(jù)安全。翻譯內(nèi)容安全指向翻譯的準(zhǔn)確性,涉及源文本信息、知識(shí)、立場(chǎng)、態(tài)度、情感等方面內(nèi)容的忠實(shí)表達(dá),衡量的標(biāo)準(zhǔn)為是否忠實(shí)地傳達(dá)了原文意圖表達(dá)的內(nèi)容。誤譯漏譯越多,翻譯的內(nèi)容安全性越低。翻譯語言安全涉及語言使用規(guī)范,衡量的標(biāo)準(zhǔn)就是ChatGPT翻譯所用的語言是否對(duì)譯入社會(huì)的語言習(xí)慣、規(guī)范、標(biāo)準(zhǔn)造成損害。翻譯話語安全涉及國(guó)家海洋話語翻譯的準(zhǔn)確性問題。“中國(guó)特色海洋話語是經(jīng)由國(guó)家產(chǎn)生、被國(guó)家認(rèn)定、為國(guó)家所用、體現(xiàn)國(guó)家權(quán)威、具有中國(guó)本土氣質(zhì)的海洋話語”,是國(guó)家海洋治理理念的核心內(nèi)容。[9](P23)翻譯話語安全要求譯者準(zhǔn)確傳達(dá)國(guó)家海洋話語的內(nèi)涵,實(shí)現(xiàn)國(guó)家涉海話語對(duì)外傳播和國(guó)家海洋形象構(gòu)建目的。如將“一帶一路”倡議翻譯成“Belt and Road” Strategy,就有違源話語的本真意圖,對(duì)國(guó)家形象造成不利影響。ChatGPT從用戶提供的輸入數(shù)據(jù)中獲取潛在的個(gè)人信息、機(jī)構(gòu)業(yè)務(wù)信息或國(guó)家涉密信息,因此確保用戶的隱私信息和數(shù)據(jù)安全至關(guān)重要?!吨腥A人民共和國(guó)數(shù)據(jù)安全法》中第三條將“數(shù)據(jù)安全”定義為通過采取必要措施,確保數(shù)據(jù)處于有效保護(hù)和合法利用的狀態(tài),以及具備保障持續(xù)安全狀態(tài)的能力。涉海翻譯數(shù)據(jù)安全即確保涉海翻譯數(shù)據(jù)得到有效保護(hù)和合法利用的能力,包含翻譯數(shù)據(jù)本身的安全和翻譯數(shù)據(jù)防護(hù)的安全,防止“翻譯數(shù)據(jù)泄露、濫用、數(shù)據(jù)異化”,[10](P14-15)危害國(guó)家翻譯安全。
針對(duì)上述問題,可從多方面入手建立涉海翻譯質(zhì)量保障體系,提高國(guó)家涉海翻譯水平。
可從ChatGPT的運(yùn)行邏輯切入解決ChatGPT翻譯準(zhǔn)確性問題。一方面,在ChatGPT預(yù)訓(xùn)練數(shù)據(jù)中注入涉海語料,將有關(guān)中國(guó)海洋話語的知識(shí)、信息、術(shù)語、數(shù)據(jù)等納入語言模型,使之獲得巨量的不同語種、不同內(nèi)容類型、不同語言風(fēng)格的涉海文本,增強(qiáng)基底數(shù)據(jù)的專業(yè)性,從而增強(qiáng)ChatGPT涉海專業(yè)文本的語義解析、語境識(shí)別能力,提高翻譯準(zhǔn)確性。另一方面,優(yōu)化模型的反饋機(jī)制,設(shè)置合理的再訓(xùn)練策略,推動(dòng)ChatGPT的自我學(xué)習(xí)機(jī)制正向運(yùn)行,使之能持續(xù)改進(jìn)和優(yōu)化翻譯品質(zhì)。此外,建立人工涉海翻譯質(zhì)量保障體系,加強(qiáng)譯審工作,經(jīng)由人工的質(zhì)量管理體系,確保翻譯準(zhǔn)確性。
采取綜合性措施防范ChatGPT翻譯倫理風(fēng)險(xiǎn)。一方面,在模型的訓(xùn)練數(shù)據(jù)上,強(qiáng)化篩選和清洗,避免使用涉及種族、性別、宗教、政治、文化偏見方面的內(nèi)容,通過“去偏化”,實(shí)現(xiàn)基底數(shù)據(jù)的價(jià)值中立。同時(shí),對(duì)用戶提供的涉譯數(shù)據(jù)進(jìn)行保密,防止泄露隱私。強(qiáng)化知識(shí)產(chǎn)權(quán)保護(hù),確保涉譯數(shù)據(jù)的透明、合法使用。構(gòu)建適當(dāng)?shù)哪P捅O(jiān)督機(jī)制,開發(fā)翻譯倫理管理軟件、工具,構(gòu)建生成式人工智能翻譯倫理指南,使涉海翻譯有規(guī)可依。
OpenAI采用6種方法提高ChatGPT的安全性:從預(yù)訓(xùn)練數(shù)據(jù)中去除有害的文本內(nèi)容,如規(guī)模龐大的色情內(nèi)容等;通過指令微調(diào)方法約束模型對(duì)不安全問題的回復(fù),避免模型產(chǎn)生有害回答;通過獎(jiǎng)勵(lì)器給模型回復(fù)進(jìn)行偏好評(píng)分,并通過強(qiáng)化學(xué)習(xí)對(duì)安全內(nèi)容加以獎(jiǎng)勵(lì);通過分類器給模型回復(fù)進(jìn)行基于安全規(guī)則的評(píng)價(jià);通過人類專家進(jìn)行對(duì)抗測(cè)試,不斷找出安全薄弱環(huán)節(jié),不斷迭代加強(qiáng)模型;線上實(shí)時(shí)檢測(cè)生成回復(fù)的有害性,若意外生成有害回復(fù)則提示用戶或終止回復(fù)。[11](P1666-1667)我們也可借鑒這種思路用于解決涉海翻譯安全問題。此外,有必要強(qiáng)化翻譯安全研究,探究ChatGPT廣泛應(yīng)用于涉海翻譯語境下,翻譯內(nèi)容安全、語言安全、話語安全、數(shù)據(jù)安全問題的發(fā)生機(jī)制、典型特征和解決路徑,構(gòu)建系統(tǒng)的涉海翻譯安全觀,實(shí)現(xiàn)觀念層面的革新。另一方面,要建立“國(guó)家翻譯安全審查體系”,[12](P7)從國(guó)家安全高度界定涉海翻譯的安全問題,形成涉海翻譯安全監(jiān)理機(jī)制,提高翻譯治理能力和水平。
三、ChatGPT涉海翻譯研究前瞻
基于ChatGPT的涉海翻譯表現(xiàn)出獨(dú)特的優(yōu)勢(shì),也面臨著各種挑戰(zhàn),有必要從譯語、譯者、翻譯管理和ChatGPT本身切入,強(qiáng)化生成式人工智能語境下的涉海翻譯研究,以提升國(guó)家涉海翻譯能力。
(一)譯語特征研究
基于涉海翻譯具體場(chǎng)景,采用平行對(duì)比方式,系統(tǒng)分析ChatGPT翻譯與人工翻譯的語言特征。在語法、詞匯、語塊、句法、篇章、語用、修辭等層面對(duì)比二者異同,歸納譯語風(fēng)格特征,分析ChatGPT譯語表達(dá)的流暢性、地道性、適切性,考察ChatGPT的譯語表達(dá)能力及其形成機(jī)制。翻譯語言是翻譯研究的重要對(duì)象,研究基于ChatGPT的涉海翻譯語言特征,對(duì)于提升國(guó)家涉海翻譯水平具有重要意義。
(二)譯者行為研究
采用ChatGPT從事涉海翻譯,譯者需面對(duì)的全新工作語境衍生出大量值得研究的課題。例如,在生成式人工智能翻譯情景中,譯者行為有何特征?譯者的翻譯認(rèn)知發(fā)生何種變化?譯者的翻譯倫理與傳統(tǒng)翻譯模式存在哪些差異?新的翻譯模式對(duì)譯者的知識(shí)結(jié)構(gòu)、能力結(jié)構(gòu)提出了什么要求?譯者的翻譯決策過程與傳統(tǒng)翻譯模式有何差異?譯者對(duì)ChatGPT翻譯持何種態(tài)度,采用ChatGPT翻譯的動(dòng)機(jī)是什么?譯者是涉海翻譯的主要行動(dòng)者。研究生成式人工智能翻譯模式下的譯者行為、認(rèn)知、能力、態(tài)度、倫理、心理等,有助于揭示翻譯行為的發(fā)生過程和機(jī)制,助力譯者提升涉海翻譯能力。
(三)翻譯管理研究
生成式人工智能在涉海翻譯中的廣泛應(yīng)用,對(duì)翻譯管理提出了新的挑戰(zhàn)。ChatGPT改變了翻譯業(yè)態(tài)和模式,使涉海翻譯工作更加依賴語言模型、算法、大數(shù)據(jù)、人工智能、云技術(shù)等。因此,翻譯技術(shù)管理的重要性日益凸顯,其研究議題包括基于生成式人工智能翻譯的技術(shù)規(guī)格、技術(shù)標(biāo)準(zhǔn)的研制,翻譯工具、平臺(tái)、數(shù)據(jù)、資源的開發(fā),翻譯質(zhì)量保障體系的建設(shè),翻譯倫理、翻譯安全的維護(hù),翻譯人才培養(yǎng)體系的改革,翻譯產(chǎn)品對(duì)外傳播體制機(jī)制建設(shè),等等。翻譯技術(shù)管理需要著力做好兩個(gè)方面的工作,即加強(qiáng)對(duì)翻譯技術(shù)的管理和強(qiáng)化翻譯管理的技術(shù),前者強(qiáng)調(diào)管理能力,關(guān)鍵在于管理層面的制度化建設(shè),后者注重技術(shù)能力,關(guān)鍵在于提升翻譯管理的“軟技術(shù)”和“硬技術(shù)”。[13](P59)強(qiáng)化翻譯管理研究,有利于提高國(guó)家涉海翻譯管理水平。
(四)生成式人工智能翻譯本體研究
譯語特征、譯者行為、翻譯管理屬于外圍研究。ChatGPT作為翻譯手段和平臺(tái),本身蘊(yùn)含諸多研究議題。
1.ChatGPT翻譯能力提升路徑研究
語言模型的性能與模型參數(shù)量、數(shù)據(jù)量、訓(xùn)練時(shí)長(zhǎng)之間存在著一種規(guī)律性的關(guān)系,即模型的性能隨著參數(shù)量、數(shù)據(jù)量、訓(xùn)練時(shí)長(zhǎng)的指數(shù)級(jí)增加而呈現(xiàn)出線性提升。因此,要提升ChatGPT的翻譯能力,需要進(jìn)一步增大模型規(guī)模,增加訓(xùn)練數(shù)據(jù)。同時(shí),優(yōu)化數(shù)據(jù)結(jié)構(gòu),提升數(shù)據(jù)質(zhì)量,增強(qiáng)數(shù)據(jù)的專業(yè)化特征,提高語言模型翻譯的專業(yè)適應(yīng)能力。模型的規(guī)模對(duì)其知識(shí)表示能力、語義解析能力、抽象概念理解能力、內(nèi)容生成能力有直接影響?,F(xiàn)有模型大都以自回歸方式生成內(nèi)容,難以處理連續(xù)的、結(jié)構(gòu)化輸入,成文本生成的長(zhǎng)度受限。因此有必要通過優(yōu)化模型架構(gòu),提升其持續(xù)對(duì)話和長(zhǎng)文本生成能力,進(jìn)而提升翻譯能力。
2.ChatGPT翻譯應(yīng)用場(chǎng)景研究
ChatGPT等新型人工智能擁有強(qiáng)大的語言理解能力、知識(shí)求解能力、命題寫作能力、翻譯能力,這些能力可觸發(fā)更多的涉海翻譯應(yīng)用需求?;贑hatGPT運(yùn)行邏輯和工作機(jī)制,探索涉海翻譯新的應(yīng)用場(chǎng)景,將成為相關(guān)研究的重要議題。例如,(1)翻譯信息求解,在涉海翻譯過程中,譯者遇到專業(yè)術(shù)語、概念、知識(shí)問題時(shí),可通過與ChatGPT的多輪對(duì)話,獲取相關(guān)專業(yè)知識(shí),形成專題知識(shí)圖譜,解決背景知識(shí)問題,提高翻譯的準(zhǔn)確性。微軟的Bing搜索已集成ChatGPT能力并進(jìn)入公測(cè)階段,搜索引擎與生成式人工智能的有機(jī)融合,能極大提升譯者的翻譯信息求解能力。(2)虛擬譯審,ChatGPT通過深度學(xué)習(xí)機(jī)制學(xué)習(xí)了大量領(lǐng)域性知識(shí)和通用語言知識(shí),二者的結(jié)合使其具有超越人類譯者的翻譯能力。在涉海翻譯過程中,譯者通過系列指令可調(diào)動(dòng)ChatGPT利用其多方面能力審校涉海翻譯文本的語言、專業(yè)問題,充當(dāng)虛擬譯審的角色。(3)翻譯資料庫(kù)建設(shè),利用ChatGPT的內(nèi)容生產(chǎn)功能,構(gòu)建涉海翻譯的知識(shí)庫(kù)、數(shù)據(jù)庫(kù)、案例庫(kù)、術(shù)語庫(kù)、語料庫(kù)等,形成專業(yè)的翻譯資源支撐體系,服務(wù)國(guó)家涉海翻譯能力建設(shè)。
3.ChatGPT多模態(tài)翻譯能力研究
模態(tài)是指人類通過感官(如眼睛、耳朵等)跟外部環(huán)境(如人、機(jī)器、物件、動(dòng)物等)之間進(jìn)行互動(dòng)的方式。用單個(gè)感官進(jìn)行互動(dòng)的叫單模態(tài),用兩個(gè)的叫雙模態(tài),用三個(gè)或以上的叫多模態(tài)。[14](P3)多模態(tài)語義識(shí)解、多模態(tài)情感分析、多模態(tài)信息處理是當(dāng)前大數(shù)據(jù)、大模型、強(qiáng)算法等人工智能研究的熱點(diǎn)。微軟已提出能夠感知語音、語言和視覺信息的多模態(tài)大模型Kosmos-1。OpenAI最新發(fā)布的GPT-4已經(jīng)能準(zhǔn)確理解圖文多模態(tài)的輸入。多模態(tài)翻譯關(guān)涉不同語言文化背景的聲音、圖像、文字信息的識(shí)別與翻譯,對(duì)語言模型的算法、架構(gòu)、數(shù)據(jù)提出了更高的要求。海洋氣象、海洋工程、海洋管理、海洋開發(fā)、海洋生態(tài)等涉海文本往往具有融文字、聲音、圖片、視頻于一體的多模態(tài)特征。開發(fā)生成式人工智能的多模態(tài)翻譯功能是人工智能語言能力研究的前沿性熱點(diǎn)。
4.ChatGPT個(gè)性化涉譯服務(wù)
個(gè)性化技術(shù)在搜索、推薦和對(duì)話系統(tǒng)中已經(jīng)有廣泛應(yīng)用。購(gòu)物平臺(tái)搜索引擎可根據(jù)用戶的搜索歷史,推測(cè)其購(gòu)物偏好并推薦商品。Facebook、微信、微博等內(nèi)容分發(fā)平臺(tái)根據(jù)用戶的內(nèi)容消費(fèi)習(xí)慣,構(gòu)建精準(zhǔn)的用戶畫像,并利用算法推薦機(jī)制為用戶推送個(gè)性化內(nèi)容。個(gè)性化技術(shù)突出個(gè)體需求和精準(zhǔn)服務(wù),體現(xiàn)“以人為本”的原則。生成式AI如ChatGPT目前尚不具備個(gè)性化服務(wù)能力,僅能在一輪對(duì)話內(nèi)部進(jìn)行上下文學(xué)習(xí)。隨著個(gè)性化技術(shù)的更新迭代,未來ChatGPT有能力根據(jù)用戶使用記錄進(jìn)行建模,準(zhǔn)確描繪用戶畫像,并為用戶提供個(gè)性化的內(nèi)容生成服務(wù)。對(duì)于涉海翻譯而言,ChatGPT可基于譯者翻譯過的文獻(xiàn)、檢索詞、閱讀過的材料,形成譯者個(gè)性化興趣向量,構(gòu)建更為準(zhǔn)確的譯者畫像,提供更優(yōu)質(zhì)的翻譯、信息、知識(shí)服務(wù),提高譯者工作效率。
5.ChatGPT翻譯安全性研究
ChatGPT的內(nèi)容生成結(jié)果受其算法影響。算法不具備人的邏輯能力、理解能力、認(rèn)知能力,因此不可能保證ChatGPT產(chǎn)出的內(nèi)容完全準(zhǔn)確。ChatGPT內(nèi)容生產(chǎn)的準(zhǔn)確性還受制于其預(yù)訓(xùn)練語料的知識(shí)范圍。當(dāng)前以ChatGPT為代表的生成式人工智能還存在一些問題,如幻覺生成、信息錯(cuò)誤、邏輯沖突、刻板偏見等,表現(xiàn)為“一本正經(jīng)地胡說八道”。隨著ChatGPT在各領(lǐng)域的應(yīng)用日益廣泛,其影響力將越來越大。ChatGPT生成的知識(shí)、價(jià)值觀錯(cuò)誤可能引發(fā)嚴(yán)重后果。就涉海翻譯而言,對(duì)國(guó)家關(guān)鍵涉海話語的誤譯和對(duì)外傳播,容易損害國(guó)家海洋文明形象,不利于國(guó)家海洋話語權(quán)的構(gòu)建。未來基于生成式人工智能的翻譯安全性研究一方面將聚焦翻譯知識(shí)安全、語言安全、話語安全、文化安全問題,另一方面將更多地關(guān)注意識(shí)形態(tài)安全問題。前者屬于顯性問題,后者則更為隱蔽。涉海翻譯的意識(shí)形態(tài)安全關(guān)涉國(guó)家翻譯利益,對(duì)之進(jìn)行研究的重要性不言而喻。此外,ChatGPT翻譯的語義解析、譯本生成過程中的安全保障機(jī)制仍存在大量待解“黑箱”,目前還沒有令人信服的理論和方法揭示ChatGPT通過什么樣的方法保障翻譯的安全性,因而其翻譯安全保障機(jī)理也是一個(gè)值得探索的議題。
四、結(jié)語
生成式人工智能深度介入涉海翻譯給學(xué)者帶來諸多啟示。在涉海翻譯實(shí)踐方面,國(guó)家層面應(yīng)出臺(tái)相關(guān)政策、制度推動(dòng)基于人工智能技術(shù)的涉海翻譯能力建設(shè),強(qiáng)化翻譯技術(shù)創(chuàng)新和應(yīng)用,同時(shí)研制生成式人工智能翻譯技術(shù)規(guī)范和標(biāo)準(zhǔn),確保技術(shù)使用符合規(guī)范,保障翻譯安全;譯者應(yīng)直面人工智能給翻譯行業(yè)帶來的挑戰(zhàn),主動(dòng)學(xué)習(xí)、應(yīng)用新技術(shù),充分利用新技術(shù)帶來優(yōu)勢(shì),提升翻譯效能,適應(yīng)新的翻譯模式。在涉海翻譯研究方面,要重視新技術(shù)引發(fā)的翻譯業(yè)態(tài)變革,研究生成式人工智能對(duì)翻譯模式、翻譯心理、翻譯語言、翻譯過程、翻譯傳播、譯者行為等方面的影響,基于涉海翻譯的新場(chǎng)景、新需求、新挑戰(zhàn),發(fā)現(xiàn)新趨勢(shì)、新問題,構(gòu)建新概念、新理論,解決新問題。總之,基于生成式人工智能的涉海翻譯作為一個(gè)研究領(lǐng)域,蘊(yùn)含豐富的研究議題,因此有必要整合人工智能、翻譯學(xué)、語言學(xué)、傳播學(xué)、海洋科學(xué)等學(xué)科進(jìn)行深入理論研究。
參考文獻(xiàn):
[1] 秉承互信互助互利原則,讓世界各國(guó)人民共享海洋經(jīng)濟(jì)發(fā)展成果[EB].https://baijiahao.baidu.com/s?id=1647497189121418815&wfr=spider&for=pc,2022-10-16/2023-10-29.
[2] 嚴(yán)賦憬,陳煒偉.習(xí)近平在海南考察時(shí)強(qiáng)調(diào),解放思想開拓創(chuàng)新團(tuán)結(jié)奮斗攻堅(jiān)克難,加快建設(shè)具有世界影響力的中國(guó)特色自由貿(mào)易港[EB].https://politics.gmw.cn/2022-04-13/content_35657312.htm,2022-4-13/2023-10-29.
[3] Fedus W,Zoph B,Shazeer N.Switch transformers:scaling to trillion parameter models with simple and efficient sparsity[J].2021,ArXiv:2101.03961.
[4] 我國(guó)已與152個(gè)國(guó)家、32個(gè)國(guó)際組織簽署共建“一帶一路”合作文件[EB].https://baijiahao.baidu.com/s?id=1766233317036923747&wfr=spider&for=pc,2023-8-24/2023-10-29.
[5] 李昭熠.智能傳播數(shù)據(jù)庫(kù)偏見成因與規(guī)制路徑[J].當(dāng)代傳播,2020,(1):93-97.
[6] 鄒開亮,劉祖兵.ChatGPT的倫理風(fēng)險(xiǎn)與中國(guó)因應(yīng)制度安排[J].海南大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2023,(4):74-84.
[7] Bolukbasi T,Chang K W,Zou J Y,et al.Man is to computer programmer as woman is to homemaker?Debiasingword embeddings.Lee D D et al.(eds).Proceedings of the 30th International Conference on Neural Information Processing Systems[C].NY, United States: Curran Associates Inc.,2016:4356-4364.
[8] 許建忠.翻譯安全學(xué)·翻譯研究·翻譯教學(xué)[A].發(fā)揮社會(huì)科學(xué)作用促進(jìn)天津改革發(fā)展——天津市社會(huì)科學(xué)界第十二屆學(xué)術(shù)年會(huì)優(yōu)秀論文集(上)[C].天津:天津市社會(huì)科學(xué)界聯(lián)合會(huì),2017.
[9] 周忠良,任東升.基于語料庫(kù)的中國(guó)特色海洋話語譯傳研究:框架、內(nèi)容與原則[J].中國(guó)海洋大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2022,(4):23-31.
[10] 王華樹,劉世界.大數(shù)據(jù)時(shí)代翻譯數(shù)據(jù)倫理研究:概念、問題與建議[J].上海翻譯,2022,(2):12-17.
[11] 車萬翔,竇志成,馮巖松,等.大模型時(shí)代的自然語言處理:挑戰(zhàn)、機(jī)遇與發(fā)展[J].中國(guó)科學(xué):信息科學(xué),2023,(9):1645-1687.
[12] 任東升,高玉霞.國(guó)家翻譯實(shí)踐學(xué)科體系建構(gòu)研究[J].中國(guó)外語,2022,(1):33-42.
[13] 任東升.國(guó)家翻譯實(shí)踐工程初探[J].上海翻譯,2022,(3):56-60,95.
[14] 顧曰國(guó).多媒體、多模態(tài)學(xué)習(xí)剖析[J].外語電化教學(xué),2007,(2):3-12.
Generative AI-based Ocean-related Translation: Advantages, Challenges and Prospects
Zhou Zhongliang
(College of Foreign Languages, Ocean University of China, Qingdao 266100, China)
Abstract: Ocean-related translation has a great impact on the construction of China's maritime image and international communication of its state maritime discourse. Therefore, translation functions as an important means for China to disseminate its maritime culture and maritime development plan and facilitate the Belt and Road Initiative. As an emerging generative artificial intelligence, ChatGPT has a high semantic parsing, contextual understanding, knowledge generation, and multilingual support capability. Thus, it has superior automatic translation competence and boasts various advantages if applied to ocean-related translation. Taking ChatGPT as an example, the paper studies the application of generative AI in ocean-related translation, analyzes its translation mechanism, advantages, challenges, and prospects, hoping to shed some light on the construction of state ocean-related translation competence.
Key words: generative artificial intelligence; ChatGPT; ocean-related translation; state translation competence
責(zé)任編輯:王 曉
收稿日期:2024-01-04
基金項(xiàng)目:2021年度全國(guó)翻譯專業(yè)學(xué)位研究生教育指導(dǎo)委員會(huì)教育研究項(xiàng)目“《涉海法律英語》教學(xué)案例庫(kù)”(MTIJZW202149)
作者簡(jiǎn)介:周忠良(1981- ),男,江西上饒人,中國(guó)海洋大學(xué)外國(guó)語學(xué)院博士研究生,專業(yè)方向?yàn)閲?guó)家翻譯實(shí)踐和國(guó)家話語對(duì)外傳播。
中國(guó)海洋大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2024年2期