• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      計算機類論文摘要機器翻譯中的語篇銜接問題

      2022-05-09 01:05:45原晉鈺高玉芳
      中國新通信 2022年5期
      關(guān)鍵詞:機器翻譯

      原晉鈺 高玉芳

      【摘要】? ? 基于神經(jīng)網(wǎng)絡(luò)的新型翻譯系統(tǒng)使得機譯質(zhì)量大幅提升,為科研人員翻譯論文摘要提供了便利。為探究機器翻譯在英譯中文摘要語篇銜接手段中的問題,本文對比分析了計算機類論文摘要的人工譯文和谷歌譯文。結(jié)果表明,機器翻譯能識別出指示照應(yīng)、主語省略和顯性連接,但表現(xiàn)尚不穩(wěn)定;而機器翻譯無法識別出零照應(yīng)和隱性連接。

      【關(guān)鍵詞】? ? 計算機類論文摘要? ? 機器翻譯? ? 語篇銜接

      引言:

      科技類論文摘要是論文研究內(nèi)容和成果的縮影。隨著我國科技類研究成果不斷涌現(xiàn)以及國內(nèi)外學術(shù)交流日益密切,國內(nèi)許多著名核心期刊被國際大型檢索刊物所收錄。英文文摘的質(zhì)量則直接關(guān)乎這些期刊在國外數(shù)據(jù)庫的收錄和索引情況,影響其研究成果的國際推廣與傳播效果[1]。撰寫科技類論文雙語摘要對多數(shù)師生而言并非易事。因此,有些作者常先寫出中文摘要,解決摘要的內(nèi)容和結(jié)構(gòu)等問題,再將其譯成英文[2]。

      基于神經(jīng)網(wǎng)絡(luò)技術(shù)的機器翻譯迅速發(fā)展,機譯質(zhì)量不斷提高,為科研人員翻譯中文摘要提供了便利。陳妙虹等的一項問卷調(diào)查顯示78.44%的師生在翻譯中文摘要時會使用機器翻譯,但他們也認為機譯存在諸多問題[3]。孫逸群以材料類英語文摘為例分析了機器譯文的詞法和句法錯誤[4],又以海洋類文摘為例剖析了機譯中的術(shù)語翻譯問題和成因[5]。但是,既有研究鮮少討論機譯在語篇層面的銜接問題。而機譯錯誤類型研究不僅要關(guān)注詞匯和格式等微觀層面,還應(yīng)關(guān)注句法和語篇等宏觀層面[6]。鑒于此,本文以計算機類論文摘要為例,通過對比分析人工譯文和谷歌譯文對中文摘要語篇銜接手段的處理方式,探討機譯的語篇銜接問題。

      一、學術(shù)論文中英文摘要語篇銜接特征

      韓禮德和哈桑認為銜接是語篇中一種成分與另一種成分之間的語義聯(lián)系[7]。正確使用銜接手段是增強語篇連貫性的有效方式。二人提出語法和詞匯銜接兩種手段,前者通過照應(yīng)、替代、省略和連接來銜接語篇,后者則通過詞匯復現(xiàn)和搭配來銜接語篇。

      學術(shù)論文摘要內(nèi)容清晰、語義連貫、結(jié)構(gòu)規(guī)范、安置有序,因而是一個獨立完整的語篇。中英文摘在語篇層面都應(yīng)銜接良好,但二者呈現(xiàn)出不同的語篇銜接特征。

      國內(nèi)研究者通過對比分析均由母語作者撰寫的中英文摘要,發(fā)現(xiàn)省略和替代銜接均較少出現(xiàn)在中英摘要中,照應(yīng)和連接在英文摘要中的使用率更高,而詞匯銜接在中文摘要中的使用率更高[8-9]。

      二、學術(shù)論文摘要機器翻譯中的語篇銜接問題分析

      (一)研究方法

      本文以國內(nèi)計算機類核心期刊中的權(quán)威學報之一——《軟件學報》為語料來源,在該學報于2021年刊發(fā)的245篇論文中隨機選取10篇論文,以中文摘要作為原文本,已發(fā)表的英文摘要作為人工譯本,并使用谷歌翻譯獲取機器譯本。本文將首先分析計算機類論文中文摘要的語篇銜接手段,然后對比分析機器譯文與人工譯文,從而指出機譯的語篇銜接問題。

      (二)結(jié)果分析

      1.照應(yīng)

      照應(yīng)關(guān)系指語篇中某一表述為另一表述提供參照。計算機類論文中文摘要中多出現(xiàn)前指照應(yīng)關(guān)系,其一是使用“這”、“該”、“此”等指示代詞指代上文所述的研究內(nèi)容或方法,其二是使用零照應(yīng)(即沒有指示照應(yīng)詞)表示具有明確定指傾向的信息。如下例:

      中文摘要:……依次對這3個影響因素的已有研究成果進行總結(jié)……對未來值得關(guān)注的研究方向進行展望。

      人譯:…existing research achievements in these three key factors are discussed in sequence…a perspective of the future work in this research area is discussed.

      機譯:…summarize the existing research results of these three influencing factors…look forward to future research directions worthy of attention.

      分析:中文摘要中該句上文提到“3個重要因素”,該句用指示代詞“這”進行前指照應(yīng)。人譯和機譯均用代詞“these”保留原文的照應(yīng)關(guān)系,使譯文與上文之間形成深層語義聯(lián)系。因此,谷歌翻譯能識別出原文中的指示照應(yīng)詞,并通過復現(xiàn)照應(yīng)詞來銜接譯文。但它無法識別零照應(yīng)負載的語義信息?;谥形恼衔男畔?,該句中“研究方向”指代“該論文所涉研究領(lǐng)域的方向”,具有明確的定指傾向。人譯增加了指示照應(yīng)詞“this”使得該句與整個語篇形成連接,但機譯未能體現(xiàn)這一照應(yīng)關(guān)系,導致該句與上文語義之間出現(xiàn)銜接斷層,語篇連貫性減弱。

      2.替代和省略

      替代指語篇中的某一個成分被替代詞所取代。本研究分析的10篇計算機類論文中文摘要均未使用替代手段。

      省略又稱為零替代。如果語篇中某一個成分可以從上下文中找到,該成分有時就可省略不提。省略重復性成分,可使語言表達更加簡潔,語篇結(jié)構(gòu)更加緊湊。計算機類論文中文摘要中均出現(xiàn)省略“本文”或“作者”等主語的現(xiàn)象。這些無主句以省略的手段銜接句際關(guān)系,表達簡明且突出重要信息。

      例如:

      中文摘要:對近些年……取得的成果進行了系統(tǒng)的梳理和總結(jié)。

      人譯:This paper presents a systematic survey of existing research achievements…in recent years.

      機譯:This paper systematically sorts out and summarizes the achievements…in recent years.

      分析:中文摘要省略了主語“本研究”。但英語中完整獨立的句子必須有主語,因此在翻譯過程中譯者需增補邏輯主語或?qū)o主句轉(zhuǎn)換為被動句。在該例中,人譯和機譯均增補邏輯主語“this paper”,通過照應(yīng)銜接來處理原文的省略銜接,使譯文既符合英文語法規(guī)范,又在語篇層面銜接完好。

      又如:

      中文摘要:①以決策樹模型為例,②首先提出一種預篩選+驗證的執(zhí)行方法對查詢過程進行優(yōu)化,③之后給出了從決策樹中提取用于預篩選謂詞的離線算法,④最后在真實數(shù)據(jù)集上進行測試。

      人譯:①This work takes a specific kind of machine learning model, i.e., decision tree, as an example. ②Firstly, a pre-filtering and validation execution workflow is proposed. ③Then, an offline algorithm is used to extract pre-filtering predicates from the decision tree. ④Finally, the algorithm is tested on real world dataset.

      機譯:①Taking the decision tree model as an example, ②a pre-screening + verification execution method is first proposed to optimize the query process, ③and then an offline algorithm for extracting pre-screening predicates from the decision tree is given, ④and finally tested on a real data set.

      分析:在中文摘要中,四個分句都通過省略主語“本研究”來避免重復,結(jié)構(gòu)緊湊,重點突出。人譯在句①增補主語“this work”,同時將句②③④轉(zhuǎn)換為被動結(jié)構(gòu),其隱含的施事者便是句①的主語。被動結(jié)構(gòu)使譯文避免重復出現(xiàn)主語“this work”,符合英文摘要的語篇銜接特征,也使譯文四個分句銜接完好,語義連貫。谷歌翻譯雖識別出原文的主語省略手段,但譯文出現(xiàn)邏輯性錯誤。谷歌翻譯將句①譯為分詞短語,將句②、③譯為被動句,句④譯為句③被動結(jié)構(gòu)的并列成分。譯文看似結(jié)構(gòu)完整、語法規(guī)范,但實際上句①中現(xiàn)在分詞“taking”的邏輯主語并不是句②被動句的主語,因此二者之間的語義關(guān)聯(lián)邏輯有誤,與原文不符。

      3.連接

      連接手段可用來表達語篇中的各種邏輯關(guān)系。連接體現(xiàn)了句或段之間的語義關(guān)聯(lián),甚至可預示后續(xù)語篇的語義發(fā)展方向。漢英兩種語言的連接手段具有顯著差異:漢語偏好隱性連接,而英語則更傾向于顯性連接。但學術(shù)論文摘要力求語義明確,邏輯嚴密,因而在使用隱性連接的同時,也多使用顯性連接,如“還、此外”等遞進連接詞、“首先……其次……最后”等時序連接詞、“但是、然而”等轉(zhuǎn)折連接詞、“如果、即使”等假設(shè)連接詞、“由于、因此”等因果連接詞。以下兩個例子分別使用了隱性連接和顯性連接。

      中文摘要:針對 PR 數(shù)據(jù)集缺少人工標注的真實標簽而無法進行監(jiān)督學習的問題……

      人譯:…the supervised learning method cannot be used for training due to the lack of manually labeled tags in the dataset…

      機譯:…for the problem that the PR data set lacks artificially labeled real labels and cannot perform supervised learning…

      分析:中文摘要中連接詞“而”隱含了因果關(guān)系,即“無法進行監(jiān)督學習”的原因是“缺少人工標注的真實標簽”。人譯用顯性連接詞“due to”表達原文隱含的因果連接關(guān)系,句子內(nèi)部語義形成邏輯關(guān)聯(lián),銜接良好。然而,谷歌翻譯無法識別原文中的隱性連接,錯誤地將其翻譯成由“and”連接的并列關(guān)系,譯文前后語義關(guān)聯(lián)有誤,邏輯混亂。

      中文摘要:同時,基于系統(tǒng)文獻綜述的結(jié)果發(fā)現(xiàn),雖然大量微服務(wù)的研究都強調(diào)……,但是目前……學術(shù)文獻依然較少,因此將那些……灰色文獻也納入到工作中。

      人譯:At the same time, it is also found that although a lot of researches on microservices emphasize…, currently there are few scholarly literatures… Hence high quality grey literatures…are also included in this study.

      機譯:At the same time, based on the results of the systematic literature review, although a large number of microservices studies have emphasized…, there are still few academic literature… High-quality gray literature…is also included in the work.

      分析:中文摘要共包含時序、轉(zhuǎn)折、因果和遞進四種顯性邏輯關(guān)系。人譯用對應(yīng)的英文連接詞“at the same time”、“although”、“hence”和“also”來復現(xiàn)原文的語義聯(lián)系和邏輯關(guān)系,句際銜接完好。而谷歌翻譯識別原文顯性連接的表現(xiàn)則時好時壞。機譯復現(xiàn)出時序、轉(zhuǎn)折和遞進三種顯性連接,但漏譯了因果連接,導致該句與上句的因果關(guān)系丟失,影響讀者對語篇邏輯關(guān)系的理解。

      三、結(jié)束語

      從語篇層面出發(fā),本文通過對比分析計算機類論文摘要人工譯文和機器譯文對中文摘要語篇銜接手段的處理方式,發(fā)現(xiàn)機器譯文的表現(xiàn)時好時壞。機器系統(tǒng)能識別出中文摘要中的指示照應(yīng)、主語省略和顯性連接,但是,當原文句子較長且句中各個分句的銜接手段密集時,機器譯文可能引發(fā)語義邏輯錯誤,也可能在識別時發(fā)生缺漏,導致譯文語篇銜接出現(xiàn)斷層。這表明機器翻譯系統(tǒng)尚不穩(wěn)定。而機器系統(tǒng)無法識別出零照應(yīng)和隱性連接。

      參? 考? 文  獻

      [1]馮恩玉, 吳蕾. 國內(nèi)外光學類科技期刊論文英文摘要體裁對比分析[J]. 中國科技期刊研究, 2016, 27(02): 230-236.

      [2]于建平. 科技論文英文摘要的寫作與翻譯剖析[J]. 中國翻譯, 1999(05): 32-34.

      [3]陳妙虹, 鄭詠儀, 黃麗莎, 等. 機器翻譯輔助農(nóng)業(yè)科技類論文摘要翻譯的探討——以有道翻譯為例[J]. 廣州廣播電視大學學報, 2020, 20(06): 67-73+111.

      [4]孫逸群. 材料類文摘機助翻譯的錯誤剖析[J]. 中國科技翻譯, 2018, 31(03): 15-18.

      [5]孫逸群. 海洋類論文摘要機輔翻譯錯誤剖析[J]. 中國科技翻譯, 2019, 32(02): 31-33+30.

      [6]陳勝, 田傳茂. 在線翻譯平臺漢英翻譯的問題及譯后編輯——以石油地質(zhì)文獻為例[J]. 中國科技翻譯, 2021, 34(01):31-34+49.

      [7] Halliday M.A.K, Hasan R. Cohesion in English[M]. London: Longman, 1976.

      [8]張春芳, 董耐婷. 英漢學術(shù)論文摘要語篇銜接對比[J]. 現(xiàn)代語文(語言研究版), 2009(09): 110-113.

      [9]胡芳, 陳彧. 英漢學術(shù)期刊論文摘要銜接手段的對比研究[J]. 武漢科技大學學報(社會科學版), 2005(03): 83-86.

      原晉鈺(1996-),女,漢族,山西晉城,碩士在讀,研究方向:翻譯理論與實踐;

      高玉芳(1967-),女,漢族,山西大同,英語語言文學碩士,副教授,研究方向:翻譯理論與實踐。

      猜你喜歡
      機器翻譯
      海量數(shù)據(jù)機器單詞中關(guān)鍵語義篩選方法研究
      機器翻譯不可盲取
      青春歲月(2017年1期)2017-03-14 11:28:47
      信息時代下機器翻譯的“可譯”與“不可譯”
      互聯(lián)網(wǎng)+新時代下人機翻譯模式研究
      考試周刊(2017年2期)2017-01-19 09:13:50
      “語聯(lián)網(wǎng)+行業(yè)” 助力中國偉大復興
      考試周刊(2017年2期)2017-01-19 09:12:54
      大數(shù)據(jù)背景下石油科技翻譯
      智富時代(2016年12期)2016-12-01 17:03:10
      機器翻譯不可盲取
      基于免費在線翻譯工具的機器翻譯缺陷探討
      漢哈機器翻譯中的文字轉(zhuǎn)換技術(shù)研究
      機器翻譯句法錯誤分析
      沾化县| 拜泉县| 尤溪县| 营山县| 邻水| 甘谷县| 新营市| 延津县| 临高县| 姚安县| 同德县| 卢龙县| 陇川县| 潼关县| 靖边县| 丹巴县| 宜宾县| 防城港市| 大渡口区| 武宣县| 商城县| 宁乡县| 新密市| 马鞍山市| 祁连县| 福泉市| 阳山县| 阜南县| 保定市| 犍为县| 天峨县| 贺兰县| 炎陵县| 惠水县| 千阳县| 常山县| 景泰县| 潜江市| 乌拉特前旗| 略阳县| 武乡县|