• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      全球化背景下地方外宣翻譯的平行語料庫構(gòu)建研究

      2024-01-19 09:01:38張傳鈺?劉玉澄
      校園英語·月末 2023年7期
      關(guān)鍵詞:外宣翻譯

      張傳鈺?劉玉澄

      摘 要:本文以江蘇省連云港市為例,研究平行語料庫的構(gòu)建過程,主要包括資料收集和整理、語料清洗和對齊、建立平行語料庫以及語料庫的維護(hù)和更新。在資料收集和整理階段,需要確定語料庫的主題和目標(biāo)語言,并收集和整理相關(guān)的文本數(shù)據(jù)。在語料清洗和對齊階段,需要進(jìn)行數(shù)據(jù)清洗、預(yù)處理和對齊操作,以確保語料庫的質(zhì)量和可用性。在建立平行語料庫階段,需要使用自動或人工方法進(jìn)行文本對齊,并對對齊結(jié)果進(jìn)行校驗和評估。在維護(hù)和更新階段,需要定期更新和維護(hù)語料庫,并對新增文本進(jìn)行對齊和校驗。本文還探討了平行語料庫在機(jī)器翻譯和自然語言處理中的應(yīng)用和作用,認(rèn)為平行語料庫可以提高機(jī)器翻譯和自然語言處理的精度和效率,促進(jìn)跨語言和跨文化交流和合作。本文研究對于平行語料庫的建設(shè)和利用具有一定的理論和實(shí)踐意義。

      關(guān)鍵詞:平行語料庫;外宣翻譯;語料庫構(gòu)建;語料處理

      作者簡介:張傳鈺(1990.08-),男,江蘇連云港人,南京醫(yī)科大學(xué)康達(dá)學(xué)院,講師,研究生,研究方向:翻譯,翻譯學(xué),教學(xué)法;劉玉澄(2002.01-),女,山東煙臺人,南京醫(yī)科大學(xué)康達(dá)學(xué)院英語專業(yè)本科在讀,研究方向:翻譯;翻譯技術(shù)。

      地方外宣翻譯平行語料庫是促進(jìn)城市對外交流、文化交流和經(jīng)濟(jì)發(fā)展的重要工具。近年來,隨著中國綜合國力的進(jìn)一步增強(qiáng)和“一帶一路”倡議的實(shí)施,外宣翻譯發(fā)生了新的變化, 呈現(xiàn)出新的特點(diǎn)。以連云港為例,連云港外宣翻譯平行語料庫可以為城市的發(fā)展提供重要的支持,包括推廣和宣傳城市資源、促進(jìn)文化交流、跨語言交流和推動經(jīng)濟(jì)發(fā)展等。

      首先,外宣翻譯平行語料庫可以為連云港的對外交流提供重要支持。連云港是一個重要的沿海城市,擁有豐富的經(jīng)濟(jì)、文化和旅游資源。通過建立外宣翻譯平行語料庫,可以將這些資源向國內(nèi)外更好地推廣和宣傳。通過語料庫中的雙語數(shù)據(jù),可以更方便地進(jìn)行翻譯和傳播,從而擴(kuò)大連云港的知名度和影響力,吸引更多的投資和人才進(jìn)入連云港。

      其次,外宣翻譯平行語料庫還可以促進(jìn)文化交流和跨語言交流。業(yè)界認(rèn)為,對于外宣翻譯質(zhì)量問題的討論不應(yīng)僅停留于對拼寫、語法等“低級錯誤”糾錯層面,而要從更為寬廣的層面探索優(yōu)化外宣翻譯的途徑增強(qiáng)外宣效果。語言是文化交流的重要媒介,通過翻譯平行語料庫,可以更方便地將連云港的文化資源進(jìn)行傳播,吸引更多的外國友人了解和體驗連云港文化。同時,通過與外國文化進(jìn)行交流,可以促進(jìn)連云港的文化創(chuàng)新和發(fā)展,打造更具特色的城市文化。

      最后,外宣翻譯平行語料庫還可以為連云港的經(jīng)濟(jì)發(fā)展提供支持。在全球化的背景下,跨國經(jīng)濟(jì)交流和合作越來越頻繁,而語言交流是其中不可或缺的環(huán)節(jié)。通過建立外宣翻譯平行語料庫,可以更方便地進(jìn)行商務(wù)翻譯和跨語言交流,促進(jìn)連云港與外國企業(yè)的合作和交流,推動連云港的經(jīng)濟(jì)發(fā)展。

      一、平行語料庫構(gòu)建——資料收集和整理

      語料庫, 從字面上看, 就是語言的倉庫, 專業(yè)的定義是“為語言研究和應(yīng)用而收集的, 在計算機(jī)中存儲的語言材料, 由自然出現(xiàn)的書面語或口語樣本匯集而成, 用來代表特定的語言或語言變體。”地方外宣翻譯平行語料庫是指由地方政府或機(jī)構(gòu)發(fā)布的外宣資料,通過翻譯變成了其他語言版本,這些語料可以用于機(jī)器翻譯等領(lǐng)域的研究。構(gòu)建這樣的平行語料庫需要以下幾個步驟:

      第一步是收集和整理資料。需要找到地方政府或機(jī)構(gòu)發(fā)布的宣傳資料,如新聞稿、政策文件、宣傳視頻等。然后將這些資料翻譯成需要的語言,例如英語、法語等。最好能夠保持翻譯的一致性和準(zhǔn)確性,可以請專業(yè)人士或?qū)I(yè)翻譯人員進(jìn)行翻譯。

      地方外宣翻譯平行語料庫的資料收集和整理是構(gòu)建平行語料庫的第一步。這一步驟的關(guān)鍵是找到適合的宣傳資料和合適的翻譯人員。

      首先,需要確定需要收集的宣傳資料類型。一般來說,地方政府或機(jī)構(gòu)發(fā)布的宣傳資料包括新聞稿、政策文件、宣傳視頻等。為了收集到全面、準(zhǔn)確的資料,可以定期瀏覽地方政府或機(jī)構(gòu)的官方網(wǎng)站,關(guān)注官方媒體發(fā)布的宣傳信息,或者通過社交媒體等渠道獲取信息。以下列舉了連云港市的部分官方外宣渠道及對外交流交往資源:

      連云港港口:連云港港口是中國東海岸最重要的港口之一,是中國“21世紀(jì)海上絲綢之路”的重要樞紐港口,擁有良好的航運(yùn)網(wǎng)絡(luò)和港口設(shè)施,是中國對外貿(mào)易的重要通道之一。

      連云港市人民政府外事與僑務(wù)辦公室:該辦公室是連云港市政府機(jī)構(gòu),負(fù)責(zé)處理涉外事務(wù)和僑務(wù)工作,為外籍人士和華僑提供服務(wù)和支持。

      連云港市文化廣電旅游局:連云港市文化廣電旅游局是連云港市政府機(jī)構(gòu),負(fù)責(zé)推廣連云港的旅游資源和文化,吸引國內(nèi)外游客前來旅游觀光,為城市的對外交流交往提供渠道和平臺。

      其次,需要確定翻譯人員的選擇標(biāo)準(zhǔn)。翻譯人員需要具備一定的語言能力和專業(yè)背景,能夠準(zhǔn)確理解原文并將其翻譯成目標(biāo)語言。為了保證翻譯質(zhì)量,最好選擇有翻譯經(jīng)驗、能夠熟練使用翻譯工具和技術(shù)的專業(yè)翻譯人員進(jìn)行翻譯。

      在資料收集和整理的過程中,還需要注意以下幾點(diǎn):

      保持原文的一致性和準(zhǔn)確性。對于原文中的錯別字、語法錯誤、不準(zhǔn)確的用詞等進(jìn)行修改和補(bǔ)充,確保原文質(zhì)量。

      翻譯人員需要準(zhǔn)確理解原文的意思,并根據(jù)目標(biāo)語言的語言特點(diǎn)和習(xí)慣進(jìn)行翻譯。同時,還需要注意翻譯的一致性和準(zhǔn)確性,避免出現(xiàn)歧義和錯誤。

      對于部分專業(yè)性很強(qiáng)的宣傳資料,可以邀請相關(guān)領(lǐng)域的專業(yè)人士或者翻譯公司進(jìn)行翻譯,以確保翻譯的準(zhǔn)確性和專業(yè)性。

      資料收集和整理是構(gòu)建地方外宣翻譯平行語料庫的關(guān)鍵步驟。需要通過科學(xué)、規(guī)范的方式來收集和整理宣傳資料,并選擇合適的翻譯人員進(jìn)行翻譯,以保證平行語料庫的質(zhì)量和可用性。

      二、平行語料庫構(gòu)建——語料清洗和對齊

      第二步是清洗和對齊語料。對于翻譯資料中的重復(fù)部分、錯誤信息、無關(guān)內(nèi)容等進(jìn)行清理,保證語料的質(zhì)量和準(zhǔn)確性。然后需要對原文和翻譯文本進(jìn)行對齊,即將原文和翻譯文本一一對應(yīng),這一步可以借助一些工具來輔助完成。

      地方外宣翻譯平行語料庫的語料清洗和對齊是構(gòu)建平行語料庫的重要步驟。語料清洗是指在語料庫中剔除掉無效的數(shù)據(jù),而語料對齊則是將源語言和目標(biāo)語言的句子進(jìn)行一一對應(yīng)。

      語料清洗的過程中,需要注意以下幾點(diǎn):

      剔除無效數(shù)據(jù)。例如,一些翻譯錯誤、缺失信息、格式不規(guī)范的數(shù)據(jù)可以進(jìn)行剔除。

      統(tǒng)一格式。將語料庫中的數(shù)據(jù)的格式統(tǒng)一化,方便后續(xù)的處理和使用。

      進(jìn)行去重。由于宣傳資料的發(fā)布可能會重復(fù),導(dǎo)致語料庫中存在相同的數(shù)據(jù),因此需要進(jìn)行去重處理。

      在進(jìn)行語料對齊的過程中,需要注意以下幾點(diǎn):

      1.對齊的精度。需要確保對齊的精度盡可能高,避免出現(xiàn)誤差。語料對齊是指將兩個或多個文本之間的相應(yīng)部分進(jìn)行匹配和對齊。它是許多自然語言處理任務(wù)的基礎(chǔ),例如機(jī)器翻譯、文本對齊和文本比較。提高語料對齊的精度可以提高這些任務(wù)的完成質(zhì)量和效率。下面是幾個提高語料對齊精度的方法:①使用更好的算法。語料對齊可以使用不同的算法,例如基于字符串匹配的算法、基于短語匹配的算法和基于神經(jīng)網(wǎng)絡(luò)的算法。不同算法的優(yōu)缺點(diǎn)不同,選擇適合數(shù)據(jù)的算法可以提高語料對齊的精度。②清洗數(shù)據(jù)。清洗數(shù)據(jù)可以去除文本中的噪聲和錯誤,例如拼寫錯誤和語法錯誤。這可以使文本更加規(guī)范,從而提高語料對齊的精度。③使用更多的訓(xùn)練數(shù)據(jù)。語料對齊的精度通常隨著訓(xùn)練數(shù)據(jù)的增加而提高。使用更多的訓(xùn)練數(shù)據(jù)可以提高模型的泛化能力,從而提高語料對齊的精度。④使用詞級別的對齊。在語料對齊時,可以使用詞級別的對齊來更準(zhǔn)確地匹配文本。詞級別的對齊可以考慮到單詞的含義和上下文,從而提高語料對齊的精度。⑤人工校對。在對齊的過程中,可以進(jìn)行人工校對以糾正錯誤。人工校對可以提高對齊的準(zhǔn)確性,但需要耗費(fèi)大量的時間和人力資源。

      2.處理語言差異。由于中英文語言存在差異,例如語序、句式等方面,可能會導(dǎo)致翻譯不準(zhǔn)確或不完整,需要進(jìn)行適當(dāng)?shù)奶幚怼T谔幚砜缯Z言語料庫時,語言差異是一個常見的問題。為了正確地處理跨語言數(shù)據(jù),需要考慮以下幾個方面:①語言學(xué)差異。不同的語言在語法結(jié)構(gòu)、詞匯、語義和文化背景等方面可能存在差異。了解和理解這些差異是處理跨語言數(shù)據(jù)的重要前提。②翻譯。對于跨語言數(shù)據(jù),可能需要進(jìn)行翻譯。這可以通過機(jī)器翻譯模型或人工翻譯來完成。但是需要注意的是,翻譯可能會引起誤譯,尤其是在涉及多義詞、語言的隱含含義、文化背景等方面的時候。③對齊。語言差異可能導(dǎo)致跨語言數(shù)據(jù)中的文本不對齊。對齊是指將兩個或多個文本之間的相應(yīng)部分進(jìn)行匹配。它是許多自然語言處理任務(wù)的基礎(chǔ)。對齊可以通過使用基于字符串匹配、基于短語匹配或基于神經(jīng)網(wǎng)絡(luò)的算法來完成。④數(shù)據(jù)清理。在處理跨語言數(shù)據(jù)時,需要清理數(shù)據(jù)以去除不必要的信息和錯誤。這可以通過自動或手動方法來完成。⑤語言模型的訓(xùn)練。處理跨語言數(shù)據(jù)的語言模型需要進(jìn)行跨語言訓(xùn)練。這可以通過使用跨語言的預(yù)訓(xùn)練模型或從頭開始訓(xùn)練一個跨語言模型來完成。

      3.使用專業(yè)工具??梢允褂脤I(yè)的語料對齊工具,例如Trados、MemoQ等,來提高對齊的精度和效率。

      三、平行語料庫構(gòu)建——建立平行語料庫

      第三步是建立平行語料庫。將清洗和對齊的語料按照一定的格式和標(biāo)準(zhǔn)組織起來,建立平行語料庫。語料庫應(yīng)該包括原文、翻譯文本和元數(shù)據(jù)等信息,如文本來源、發(fā)布時間、翻譯人員等。平行語料庫的格式和標(biāo)準(zhǔn)需要根據(jù)具體的應(yīng)用場景進(jìn)行調(diào)整。

      地方外宣翻譯平行語料庫的格式和標(biāo)準(zhǔn)是平行語料庫的重要組成部分,它們決定了平行語料庫的結(jié)構(gòu)和使用方式。下面,筆者將從以下幾個方面進(jìn)行闡述。

      格式:地方外宣翻譯平行語料庫可以采用多種格式,例如TMX、XLIFF、PO等格式。其中,TMX是一種行業(yè)標(biāo)準(zhǔn)的平行語料庫格式,支持多種語言和工具之間的互操作性,因此較為常用。而XLIFF和PO等格式則適用于特定的翻譯軟件和場景。

      標(biāo)準(zhǔn):為了確保平行語料庫的質(zhì)量和可用性,需要遵循一定的標(biāo)準(zhǔn)。例如,對于平行語料庫的命名和存儲路徑應(yīng)該進(jìn)行規(guī)范,以便于管理和維護(hù)。同時,平行語料庫中的元數(shù)據(jù)、句子對齊等信息也需要進(jìn)行規(guī)范化處理,以便于后續(xù)的信息處理和利用。

      元數(shù)據(jù):平行語料庫中的元數(shù)據(jù)包括源語言、目標(biāo)語言、創(chuàng)建時間、更新時間、創(chuàng)建者、描述信息等,可以通過這些元數(shù)據(jù)對平行語料庫進(jìn)行檢索、分類和管理。

      句子對齊:平行語料庫的句子對齊是平行語料庫的核心內(nèi)容之一。需要進(jìn)行精確的句子對齊,以確保源語言和目標(biāo)語言的句子一一對應(yīng),沒有遺漏或重復(fù)。

      地方外宣翻譯平行語料庫的格式和標(biāo)準(zhǔn)對于平行語料庫的構(gòu)建、管理和使用都具有重要的作用,需要根據(jù)實(shí)際需求和情況進(jìn)行選擇和制定,以保證平行語料庫的質(zhì)量和可用性。

      四、平行語料庫構(gòu)建——維護(hù)和更新

      最后一步是語料庫的維護(hù)和更新。平行語料庫需要進(jìn)行定期的維護(hù)和更新,包括對新發(fā)布的宣傳資料進(jìn)行翻譯和對齊,對已有語料進(jìn)行清理和更新等,以保證語料庫的構(gòu)建質(zhì)量和可用性。

      地方外宣翻譯平行語料庫的維護(hù)和更新是確保平行語料庫長期可用和保持高質(zhì)量的重要步驟。以下將從幾個方面進(jìn)行闡述。

      監(jiān)測和修復(fù)錯誤:在平行語料庫的使用過程中,可能會出現(xiàn)一些錯誤,例如句子對齊錯誤、譯文錯誤等。因此,需要對平行語料庫進(jìn)行監(jiān)測和修復(fù),以保證平行語料庫的準(zhǔn)確性和可用性。

      添加新的數(shù)據(jù):隨著時間的推移,地方外宣翻譯平行語料庫需要不斷地更新和添加新的數(shù)據(jù),以滿足新的翻譯需求和語言變化。因此,需要建立定期添加新數(shù)據(jù)的機(jī)制,以確保平行語料庫的時效性和覆蓋范圍。

      統(tǒng)計和分析:平行語料庫的統(tǒng)計和分析可以幫助用戶了解平行語料庫的內(nèi)容和特點(diǎn),以便于更好地利用平行語料庫進(jìn)行翻譯和研究。因此,需要對平行語料庫進(jìn)行統(tǒng)計和分析,并提供相應(yīng)的工具和接口,以便于用戶進(jìn)行數(shù)據(jù)挖掘和分析。

      標(biāo)準(zhǔn)和規(guī)范的更新:隨著翻譯和語言技術(shù)的不斷發(fā)展,平行語料庫的標(biāo)準(zhǔn)和規(guī)范也需要不斷更新和完善。因此,需要建立標(biāo)準(zhǔn)和規(guī)范的更新機(jī)制,以確保平行語料庫的格式和標(biāo)準(zhǔn)與最新的技術(shù)和需求保持一致。

      雖然地方外宣翻譯平行語料庫的構(gòu)建包含多個步驟,需要耗費(fèi)大量的時間和精力。但是,建立這樣的平行語料庫可以為機(jī)器翻譯等領(lǐng)域的研究提供有價值的資源。

      參考文獻(xiàn):

      [1]黃友義.中國站到了國際舞臺中央,我們?nèi)绾畏g[J].中國翻譯,2015(5):5-7.

      [2]胡興文,張健.外宣翻譯的名與實(shí):張健教授訪談錄[J].中國外語,2013(3):100-104.

      [3]王杭.茶文化外宣翻譯中的語料庫技術(shù)應(yīng)用[J].福建茶葉,2018(2):449.

      基金項目:本文系2022年度 “江蘇省社科應(yīng)用研究精品工程”外語類課題立項項目:《“一帶一路”背景下的地方外宣翻譯的平行語料庫構(gòu)建研究——以連云港為例》(立項號:22SWC-33)、2022年度 “江蘇省社科應(yīng)用研究精品工程”外語類課題立項項目(立項號:22SWC-33)、2022年度江蘇省社科應(yīng)用研究課題成果。

      猜你喜歡
      外宣翻譯
      生態(tài)翻譯視閾下非物質(zhì)文化遺產(chǎn)外宣翻譯
      國際傳播視閾下的外宣翻譯特點(diǎn)探析
      淺析高校簡介英譯中“認(rèn)同”的建構(gòu)
      江西省高校門戶網(wǎng)站外宣翻譯現(xiàn)狀研究
      英語實(shí)用翻譯研究
      考試周刊(2016年52期)2016-07-09 23:17:02
      順應(yīng)論視閾下的中國政府網(wǎng)外宣翻譯研究
      外宣翻譯中中國特色詞匯的翻譯
      跨文化意識下河北省非物質(zhì)文化遺產(chǎn)外宣翻譯的研究
      考試周刊(2016年25期)2016-05-26 19:15:00
      漢英外宣翻譯中的本土化順應(yīng)策略
      考試周刊(2016年6期)2016-03-11 08:23:58
      外宣翻譯“三貼近原則”指導(dǎo)下的河南省旅游翻譯研究
      通许县| 磐安县| 宁明县| 新乡市| 宜章县| 始兴县| 喀喇| 海门市| 慈溪市| 佳木斯市| 上虞市| 浦东新区| 修武县| 武强县| 苗栗市| 新化县| 长海县| 贵溪市| 赤水市| 柘城县| 平武县| 镇江市| 衢州市| 普洱| 改则县| 武穴市| 固阳县| 旬阳县| 通州区| 宁远县| 长汀县| 巴彦淖尔市| 武邑县| 荣昌县| 凤阳县| 宁都县| 新河县| 杭锦后旗| 射洪县| 怀远县| 定兴县|