• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      中韓雙語對(duì)譯平行語料庫的創(chuàng)建與應(yīng)用研究

      2018-05-26 10:40李丹
      讀與寫·教育教學(xué)版 2018年7期

      摘要:韓漢-漢韓平行語料庫是語料庫的一個(gè)重要類型, 可以在語言對(duì)比、翻譯研究、語言教學(xué)和詞典編纂方而發(fā)揮獨(dú)特作用。 該平行語料庫建庫的總體流程主要包括語料采集、整理和加工、存儲(chǔ)等籌劃,目前雖在設(shè)計(jì)上有突破,但還存在許多困難。

      關(guān)鍵詞:中韓平行語料庫;語料采集;語料整理

      中圖分類號(hào):G648 文獻(xiàn)標(biāo)識(shí)碼:B文章編號(hào):1672-1578(2018)03-0007-01

      1.引言

      近年來,平行語料庫正日益受到人們關(guān)注。平行語料庫是由源語文本原文及其平行對(duì)應(yīng)的譯語文本構(gòu)成的雙語或多語語料庫,其對(duì)齊程度有詞級(jí)、句級(jí)、段級(jí)和篇級(jí)幾種。平行語料庫按照翻譯方向的不同,可分為單向平行語料庫、雙向平行語料庫和多向平行語料庫。平行語料庫不僅可以廣泛運(yùn)用于翻譯研究與培訓(xùn)、雙語對(duì)比、雙語詞典編纂,還可用于外語教學(xué)和學(xué)生自主學(xué)習(xí)輔助平臺(tái)。在國內(nèi)許多學(xué)者開始嘗試西語語料庫的建設(shè)??梢哉f西語語料庫已經(jīng)初具規(guī)模,其中,北京外國語大學(xué)已建成了規(guī)模約2000萬字詞的英漢平行語料庫。

      目前,國內(nèi)外平行語料庫的建設(shè)和發(fā)展已經(jīng)取得很大成就,特別是漢英或者英漢雙語平行語料庫的數(shù)量及種類較多,語料的規(guī)模和語料的選取具有科學(xué)性、語料標(biāo)注具有規(guī)范性。中日,漢俄平行語料庫的建設(shè)由于有漢英平行語料庫作為參照,在語料規(guī)模、選材方法、標(biāo)注規(guī)范和深度等方面,具有后發(fā)優(yōu)勢,而中韓平行語料庫建設(shè)和應(yīng)用則剛剛起步,有待進(jìn)一步探討和研究。

      2.中韓雙語對(duì)譯平行語料庫的構(gòu)建方案

      2.1 設(shè)計(jì)理念

      2.1.1 服務(wù)對(duì)象:為從事韓國語教學(xué)的教師、學(xué)習(xí)韓國語的學(xué)生以及譯者提供可檢索的翻譯網(wǎng)絡(luò)數(shù)據(jù)庫應(yīng)用方面的服務(wù);

      2.1.2 設(shè)計(jì)目的:應(yīng)用于中韓語言對(duì)比研究、翻譯語言及規(guī)范研究;應(yīng)用于中韓(韓中)翻譯研究;應(yīng)用于中韓語言轉(zhuǎn)換規(guī)律的探討和韓國語外語教學(xué)、 雙語詞典編纂等;

      2.1.3 語庫規(guī)模: 先根據(jù)實(shí)際需要建立一個(gè)個(gè)小型語料庫,然后在小型語料庫基礎(chǔ)上逐步接近或達(dá)到千萬詞級(jí),最后建立理想型的語料庫。

      2.1.4 韓漢比例:語料收集中,在涉及面廣的基礎(chǔ)上,不僅要收集韓文原文和中文原文還要收集韓文譯文和中文譯文。從數(shù)量上通常韓譯漢的原文和譯文要多于漢譯韓的原文和譯文。

      2.1.5 語料要求:以共時(shí)(現(xiàn)代韓語和現(xiàn)當(dāng)代中文)書面語的語料為主,題材可按照正式公文、報(bào)刊雜志、文學(xué)作品、新聞消息、科學(xué)技術(shù)和經(jīng)濟(jì)貿(mào)易等,根據(jù)具體內(nèi)容分類采集或收集。

      2.1.6 標(biāo)注加工:利用軟件操作,讓句子層級(jí)自動(dòng)對(duì)齊。自動(dòng)對(duì)齊后需要人工再次校對(duì)。此外,還可選用詞性標(biāo)注半自動(dòng)和人工相結(jié)合的方式)

      2.1.7 評(píng)價(jià)標(biāo)準(zhǔn)(通過搜索引擎或?qū)<以u(píng)判方式進(jìn)行檢驗(yàn))。

      2.2 中韓平行語料庫的構(gòu)建方案。中韓平行語料庫的建立和應(yīng)用將語言學(xué)研究的客體對(duì)象定位于語料庫中的文本。也就是說,在語料庫的建設(shè)中,韓國語語料的選取、標(biāo)注、存儲(chǔ)、管理等建設(shè)都要圍繞韓國語語料庫的文本進(jìn)行。 此外,韓國語文本資料還是中韓平行語料庫的應(yīng)用、中韓子語料庫的生成、語料的分析統(tǒng)計(jì)的基礎(chǔ);也是構(gòu)建中韓平行語料庫的基礎(chǔ)。其主要內(nèi)容包括語料的采集、語料的加工、語料庫的組織和網(wǎng)絡(luò)檢索平臺(tái)的更新。

      2.2.1 韓國語語料采集。韓國語語料的采集應(yīng)盡量選用書面語文本,書面語越正式越好。之所以選用書面語文本,就是要考慮語言及其譯文的規(guī)范性。從可用性上來說,公文體文本的規(guī)范性最強(qiáng),其次是其他正式文本包括新聞文本和文學(xué)文本。中韓語料庫后續(xù)建設(shè)方向包括采集標(biāo)準(zhǔn)和應(yīng)用目標(biāo)。其中采集標(biāo)準(zhǔn)是指語料的質(zhì)量問題,在語言資料整理加工、收錄和保存過程中,要保證源語言本身的"質(zhì)量"、翻譯質(zhì)量和相應(yīng)的規(guī)范性,避免亂碼現(xiàn)象;而應(yīng)用目標(biāo)是指應(yīng)根據(jù)語料庫建設(shè)的近期目標(biāo)和長遠(yuǎn)目標(biāo),靈活安排語料的文本類型語料的內(nèi)容,注重原始語料中語言質(zhì)量、翻譯質(zhì)量及語料保存的規(guī)范性,以有助于翻譯教學(xué)為準(zhǔn)則。

      2.2.2 子庫的組成

      2.2.3 語料的采集。首先,發(fā)揮團(tuán)隊(duì)合作的精神,小組分工,廣泛應(yīng)用計(jì)算機(jī)、互聯(lián)網(wǎng)、掃描儀等現(xiàn)代化科學(xué)技術(shù),全面收集語料;通過和翻譯公司和旅游公司合作,將接手的翻譯項(xiàng)目完成之后,將語料進(jìn)行整理、歸類; 通過互聯(lián)網(wǎng)和共同興趣的人交換語料;組織學(xué)生收集整理語料等方法建立漢韓雙語平行語料庫平臺(tái)。中韓平行語料庫書面語料采集應(yīng)遵循權(quán)威性原則(原文應(yīng)具有代表性,典型性,譯者應(yīng)為該領(lǐng)域的權(quán)威)、共時(shí)性原則(只收錄現(xiàn)當(dāng)代中韓文本,且同一子庫的韓國語、漢語文本是同時(shí)一代的)、科學(xué)性原則(選擇語料不要求全、求大,應(yīng)科學(xué)抽樣,兼顧平衡)。然后,嘗試將中韓平行語料庫引入翻譯實(shí)踐與翻譯教學(xué)中,通過實(shí)驗(yàn)探討在現(xiàn)有技術(shù)條件下中韓平行語料庫用于翻譯實(shí)踐可能產(chǎn)生的積極效果,并通過教案的形式,說明中韓平行語料庫在翻譯教學(xué)中的具體應(yīng)用,旨在探討基于語料庫方法的翻譯教學(xué)模式。

      中韓語料庫擬要收錄的主要文本,從類型上可以分為正式文檔 、新聞文檔和文學(xué)作品及評(píng)論。其中,正式文檔包括"政府、經(jīng)貿(mào)、科技、法律文本及白皮書";新聞文檔包括"時(shí)政要聞、述評(píng)";其他文檔包括教學(xué)文檔、文教類文檔。文檔收集應(yīng)注重材料內(nèi)容的共時(shí)性,盡量收集現(xiàn)代或當(dāng)代的文本資料,如正式文檔可收集近幾年的文本資料;新聞文檔可收集最能反映社會(huì)現(xiàn)實(shí)的文本資料;其他教學(xué)文本資料最好以近十年的教學(xué)內(nèi)容為主。此外,收集文本資料時(shí)還要考慮文本資料的規(guī)范性。如文學(xué)作品文本資料盡量要求是經(jīng)典作家和現(xiàn)代作家的相關(guān)作品。

      2.2.4 翻譯文本庫。以實(shí)用性為著眼點(diǎn),該語料庫可以重點(diǎn)收錄旅游翻譯方面的語料。語料收集的初期,視工作量而定,漢韓和韓漢翻譯文本盡量均衡,語料不求多而求精。

      2.2.5 對(duì)譯語句庫。為保證語料庫語料的規(guī)范化,該語句庫收錄的句子或短語最好摘自公開發(fā)行的韓國各種讀物、韓國有名大學(xué)出版的教材、韓國常用的語法或詞匯工具書 。

      2.2.6 語料庫的管理。語料庫的管理是包括語料庫建設(shè)在內(nèi)的持續(xù)維護(hù)。這種維護(hù)包括根據(jù)實(shí)際的需要(根據(jù)語料庫的詞頻統(tǒng)計(jì)、搭配統(tǒng)計(jì)和平行語料庫狀態(tài)統(tǒng)計(jì)的需要),添加、刪除、修正該語料庫中的內(nèi)容以便使用者進(jìn)行索引與檢索 。

      2.3 中韓平行語料庫語料的整理和加工

      2.3.1 句子對(duì)齊。平行語料中的句級(jí)對(duì)齊。在對(duì)語料庫中的語料進(jìn)行句子對(duì)齊時(shí),可以選用SDL Tra-dos2007里的WinAlign軟件來進(jìn)行。第一步,語料采集。語料采集方式可通過人工輸入或掃描輸入(OCR軟件將掃描圖片或PDF轉(zhuǎn)成word格式文檔),還可以利用現(xiàn)有的"TXT,PDF,DOC"文檔。文檔建立后,對(duì)文檔中出現(xiàn)的錯(cuò)別字、亂碼進(jìn)行校對(duì);校對(duì)的同時(shí)刪除一些冗余信息;將語料保存為"WORD"文檔。第二步,利用軟件處理文本。啟動(dòng)SDL Trados2007里的WinAlign軟件,點(diǎn)擊源語言和目標(biāo)語言,并通過側(cè)對(duì)話框進(jìn)行選擇;點(diǎn)擊添加,找到中韓對(duì)照中的韓文文本打開后,再點(diǎn)擊添加,同樣出現(xiàn)右側(cè)對(duì)話框后,找到中韓對(duì)照中的中文文本打開。第三步,點(diǎn)擊中韓文本匹配文件名,就可以實(shí)現(xiàn)文本的相互匹配。在文本匹配中,假設(shè)左右兩欄的虛線水平筆直連接了,說明左右兩邊的中韓文相互匹配實(shí)現(xiàn)是句級(jí)對(duì)應(yīng)。文本匹配中如果出現(xiàn)的是斜線,則表明左右欄的中韓文不對(duì)應(yīng),那么就需要人工進(jìn)一步處理。

      2.3.2 語料的存儲(chǔ)。平行語料庫的語料可采用數(shù)據(jù)庫的方式進(jìn)行存儲(chǔ)。這種方式存儲(chǔ)語料可以支持平行語料的海量擴(kuò)充;方便使用者查找所需語料;也易于根據(jù)實(shí)際情況進(jìn)一步開發(fā)和擴(kuò)展各類子語料庫。

      2.3.3 輔助系統(tǒng)的開發(fā)。以上表述的中韓語料庫存儲(chǔ)框架建立之后,還需要設(shè)計(jì)包括平行語料庫建設(shè)系統(tǒng)和應(yīng)用管理系統(tǒng)相關(guān)的應(yīng)用系統(tǒng)。

      2.3.4 中韓平行語料庫建設(shè)系統(tǒng)。中韓平行語料庫檢索平臺(tái)的構(gòu)建。 借助一些輔助工具如關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(SQL/DS, DBZ,Oracle, SQLServer, dBase)構(gòu)建語料庫的檢索平臺(tái)??紤]到可自主控制中韓平行語料庫是否遠(yuǎn)程開放和控制用戶的權(quán)限;支持語料海量擴(kuò)充;易于開發(fā)擴(kuò)展;各類子語料庫分離等,中韓翻譯語料庫應(yīng)用管理系統(tǒng)應(yīng)包括語料 統(tǒng)計(jì)、語料庫管理、子語料庫的輸出、索引與檢索等功能。 考慮到建設(shè)中韓平行語料庫的復(fù)雜性和艱巨性,最初提倡從小型對(duì)應(yīng)語料庫做起。

      2.3.5 平行語料庫的運(yùn)用。以當(dāng)代先進(jìn)的教學(xué)理念為指導(dǎo)思想,利用現(xiàn)代信息技術(shù)建立的中韓雙語平行語料庫,在應(yīng)用于韓國語語翻譯教學(xué)時(shí),應(yīng)遵循應(yīng)用性(語料選用的實(shí)用性)、自主性(促進(jìn)學(xué)生自主學(xué)習(xí)的積極性)、實(shí)踐性(培養(yǎng)學(xué)生對(duì)比分析語料的能力)、針對(duì)性(翻譯語料要符合學(xué)生韓國語的實(shí)際水平)、開放性(不斷地更新和補(bǔ)充新的語料)原則。在實(shí)際運(yùn)用中,教師不是簡單地告訴學(xué)生譯文的對(duì)錯(cuò),使學(xué)生處于被動(dòng)的聽講地位,而是提供參與機(jī)會(huì),讓學(xué)生通過譯前分析,收集翻譯任務(wù)的相關(guān)背景資料、術(shù)語對(duì)照、平行文本采集等,形成譯文。使傳統(tǒng)的以教師為中心的講評(píng)法轉(zhuǎn)向以學(xué)生為中心的過程教學(xué)法,解決翻譯過程中產(chǎn)生的問題,了解并熟知翻譯過程,從而培養(yǎng)學(xué)生的獨(dú)立思考能力,提高學(xué)生的翻譯素養(yǎng)。

      3.結(jié)語

      隨著中國經(jīng)濟(jì)的發(fā)展,各行各業(yè)和各個(gè)領(lǐng)域?qū)Ψg需求也與日俱增。因此,培養(yǎng)高質(zhì)量的翻譯人才是學(xué)校教育的一大課題?;趯W(xué)校韓國語教育的語言類人才,對(duì)其他專業(yè)領(lǐng)域知識(shí)有限,因此研制中韓語料庫教學(xué)平臺(tái)使學(xué)生在中韓翻譯學(xué)習(xí)方面不在局限于課堂之中,學(xué)生可通過中韓雙語平行語料庫建立自學(xué)模式將語料庫看作為"學(xué)習(xí)資源庫",定期開展各類類型的文本翻譯, 便于學(xué)生自主學(xué)習(xí)。同樣韓國語教師在教學(xué)中也可以利用語料庫快速檢索到自己所需的語料,既方便于韓國語語言教學(xué)也可以解決韓國語翻譯教學(xué)語料缺乏的難題。

      參考文獻(xiàn):

      [1] 崔衛(wèi),李峰.俄漢-漢俄平行語料庫的構(gòu)建設(shè)想與應(yīng)用展望[J].中國俄語教學(xué),2014,33(01):1-5.

      [2] 李曉瀅.區(qū)域性高校翻譯人才培養(yǎng)模式構(gòu)建研究[J].佳木斯教育學(xué)院學(xué)報(bào),2014(03):337,340.

      [3] 李曉瀅.基于自建平行語料庫的翻譯教學(xué)探索[J].海外英語,2014(10):9-10.

      作者簡介:李丹(1980.1-),女,河南鶴壁人,博士,中南民族大學(xué)外語學(xué)院講師,研究方向?yàn)橹许n語言對(duì)比研究。

      武冈市| 合川市| 郯城县| 洱源县| 井研县| 板桥市| 和硕县| 张家港市| 绥芬河市| 大渡口区| 平遥县| 锡林郭勒盟| 昌都县| 西青区| 黄大仙区| 阳山县| 鹤庆县| 临夏县| 改则县| 水城县| 台安县| 江安县| 九龙坡区| 广宁县| 西充县| 馆陶县| 和顺县| 常德市| 鸡东县| 兴业县| 松原市| 望奎县| 察雅县| 丰镇市| 迭部县| 长岛县| 句容市| 漯河市| 邯郸县| 杭州市| 宜章县|