• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      機(jī)器英語(yǔ)翻譯中的模糊語(yǔ)義最優(yōu)解選取方法

      2017-06-23 23:31:34孫霞沈韓
      現(xiàn)代電子技術(shù) 2017年12期

      孫霞++沈韓

      摘 要: 為了提高機(jī)器英語(yǔ)翻譯的準(zhǔn)確性和合理性,提出一種基于模糊語(yǔ)義最優(yōu)解選取的機(jī)器英語(yǔ)翻譯方法。構(gòu)建機(jī)器英語(yǔ)翻譯的信息抽取模型,建立機(jī)器英語(yǔ)翻譯的模糊語(yǔ)義主題詞屬性表,采用灰色關(guān)聯(lián)特征匹配方法計(jì)算英語(yǔ)翻譯的語(yǔ)義相似度,實(shí)現(xiàn)英語(yǔ)翻譯中前后文的語(yǔ)義模糊映射。建立語(yǔ)義映射關(guān)系,計(jì)算得到模糊語(yǔ)義最優(yōu)解。實(shí)驗(yàn)測(cè)試結(jié)果表明,采用該方法進(jìn)行機(jī)器英語(yǔ)翻譯,語(yǔ)義信息的召回性能較好,主題詞的特征匹配度較高。

      關(guān)鍵詞: 機(jī)器英語(yǔ)翻譯; 語(yǔ)義選??; 語(yǔ)義模糊映射; 信息抽取

      中圖分類號(hào): TN911?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)12?0031?03

      Abstract: In order to improve the accuracy and rationality of English machine translation, a machine translation method based on semantic fuzzy optimal solution selection is proposed. An information extraction model and an attribute table of fuzzy semantic subject words are made for English machine translation. The semantic similarity of English translation is calculated with the grey correlation feature matching method to realize the semantic fuzzy mapping of semantic context in English translation. The semantic mapping relation is established. The fuzzy semantic optimal solution is obtained by means of calculation. The experimental results show that the proposed method has better recall performance of semantic information for the English machine translation, and high feature matching rate of subject words.

      Keywords: English machine translation; semantic selection; semantic fuzzy mapping; information extraction

      隨著智能翻譯技術(shù)的發(fā)展,采用機(jī)器翻譯進(jìn)行英語(yǔ)翻譯,逐漸取代人工翻譯,且翻譯的準(zhǔn)確度不斷提高和改進(jìn)[1]。在采用機(jī)器軟件進(jìn)行英語(yǔ)翻譯中,需要進(jìn)行語(yǔ)義識(shí)別和特征分析,采用機(jī)器智能識(shí)別方法進(jìn)行英語(yǔ)上下文和前后文的語(yǔ)義信息抽取,構(gòu)建英語(yǔ)的英語(yǔ)信息模型,結(jié)合模糊語(yǔ)義識(shí)別技術(shù)提高英語(yǔ)翻譯的智能化水平[2?3]。采用模糊語(yǔ)義最優(yōu)解計(jì)算方法從語(yǔ)義上對(duì)英語(yǔ)翻譯的內(nèi)容進(jìn)行合理性組織和內(nèi)容創(chuàng)作,從主題內(nèi)容上體現(xiàn)了原文創(chuàng)作者的主觀性,提高英語(yǔ)翻譯的智能化和自動(dòng)化水平。為了提高機(jī)器英語(yǔ)翻譯的智能化水平,本文提出一種基于模糊語(yǔ)義最優(yōu)解選取的機(jī)器英語(yǔ)翻譯方法,構(gòu)建機(jī)器英語(yǔ)翻譯的信息抽取模型,進(jìn)行模糊語(yǔ)義最優(yōu)解選取,得出有效性結(jié)論。

      1 機(jī)器英語(yǔ)翻譯的語(yǔ)義模型

      1.1 機(jī)器英語(yǔ)翻譯的自然語(yǔ)言處理

      在構(gòu)建機(jī)器英語(yǔ)翻譯的語(yǔ)義模型[4]之前,首先考慮圖1所示的兩組英語(yǔ)翻譯實(shí)例集合的本體片段。

      以圖1為例,進(jìn)行機(jī)器英語(yǔ)翻譯的自然語(yǔ)言處理,英語(yǔ)單詞“image”可以表示一張圖片,同義詞“image”和“picture”具有模糊映射關(guān)系[5],英語(yǔ)翻譯中同義詞與語(yǔ)義信息相關(guān)的可能的語(yǔ)義映射關(guān)系描述為:

      結(jié)合圖1(a)機(jī)器英語(yǔ)翻譯的自然語(yǔ)言處理中左側(cè)的“Mountain”節(jié)點(diǎn)的兩個(gè)標(biāo)簽,使用概念之間的泛化關(guān)系(Is?less_than)對(duì)自然語(yǔ)言的上下文進(jìn)行處理和分析,改善機(jī)器語(yǔ)言翻譯中的智能化水平。

      1.2 機(jī)器英語(yǔ)翻譯的語(yǔ)義本體映射模型建立分析

      在上述進(jìn)行了機(jī)器英語(yǔ)翻譯的自然語(yǔ)言處理的基礎(chǔ)上,針對(duì)不同本體的概念之間的目標(biāo)(或?qū)ο蟆?zhǔn)則)進(jìn)行模糊評(píng)價(jià),分析領(lǐng)域知識(shí)中的最大語(yǔ)義相關(guān)度值符號(hào)集合,由二元組(sk,ak)來(lái)表示任意詞匯Wi和Wj之間機(jī)器英語(yǔ)翻譯的置信度。

      定義2 設(shè)是一個(gè)語(yǔ)義修飾目標(biāo)的二元特征組合,其中為集合S中第k個(gè)元素,,則在簡(jiǎn)單語(yǔ)義單元中存在英語(yǔ)翻譯的定語(yǔ)修飾函數(shù)為:

      假設(shè)和為兩個(gè)二元語(yǔ)義,在進(jìn)行機(jī)器英語(yǔ)翻譯中,將定語(yǔ)從句劃入到主句,在從句范圍選擇時(shí)得到一個(gè)關(guān)于二元語(yǔ)義的語(yǔ)法本體映射模型描述為:

      (1) 在語(yǔ)義分析時(shí),若,那么;

      (2) 若,那么有:,則; ,則;,則。

      2 模糊語(yǔ)義最優(yōu)解選取實(shí)現(xiàn)

      2.1 英語(yǔ)翻譯的語(yǔ)義相似度計(jì)算

      在上述構(gòu)建了機(jī)器英語(yǔ)翻譯的語(yǔ)義模型和進(jìn)行自然語(yǔ)言信息抽取處理的基礎(chǔ)上,進(jìn)行模糊語(yǔ)義最優(yōu)解選取方法改進(jìn)設(shè)計(jì),提高機(jī)器英語(yǔ)翻譯的智能化水平,建立機(jī)器英語(yǔ)翻譯的模糊語(yǔ)義主題詞屬性表如圖2所示。

      圖2 模糊語(yǔ)義主題詞屬性表

      在圖2建立機(jī)器英語(yǔ)翻譯的模糊語(yǔ)義主題詞屬性表中,采用灰色關(guān)聯(lián)特征匹配方法計(jì)算英語(yǔ)翻譯的語(yǔ)義相似度,設(shè)整個(gè)主題詞表中的語(yǔ)義二元組和為任意直接上位詞的英語(yǔ)翻譯信息,對(duì)各分向量的歐氏距離為:

      式中:。根據(jù)語(yǔ)義相似度計(jì)算結(jié)果,實(shí)現(xiàn)英語(yǔ)翻譯中前后文的語(yǔ)義模糊映射,建立語(yǔ)義映射關(guān)系。

      2.2 模糊語(yǔ)義最優(yōu)解選取計(jì)算

      在計(jì)算了語(yǔ)義相似度的基礎(chǔ)上,根據(jù)前述建立的機(jī)器英語(yǔ)翻譯的模糊語(yǔ)義主題詞屬性表,進(jìn)行英語(yǔ)翻譯過(guò)程中的主題詞語(yǔ)義最佳匹配搜索,采用循環(huán)堆??刂扑阉鞣椒ㄟM(jìn)行模糊語(yǔ)義匹配控制,英語(yǔ)翻譯的語(yǔ)義配準(zhǔn)搜索的示意圖如圖3所示。

      結(jié)合圖3給出的英語(yǔ)機(jī)器翻譯的語(yǔ)義搜索過(guò)程,對(duì)文檔di進(jìn)行英語(yǔ)翻譯的綜合權(quán)重的相似度計(jì)算,設(shè)是一組二元語(yǔ)義信息,設(shè)X,Y是兩個(gè)待比較的詞語(yǔ),計(jì)算出詞Y的語(yǔ)義抽取向量為, ,則二元語(yǔ)義加權(quán)算術(shù)平均算子φ2定義為:

      式中:。

      在英語(yǔ)翻譯中,將一些常用的短語(yǔ)被劃分為幾個(gè)詞語(yǔ),根據(jù)詞語(yǔ)在文本中的位置,計(jì)算出詞Y在文本中的語(yǔ)義中心向量C(Y),則X,Y在英語(yǔ)翻譯過(guò)程中的相似度為:

      通過(guò)機(jī)器語(yǔ)言識(shí)別方法對(duì)英語(yǔ)翻譯的用詞進(jìn)行特征過(guò)濾和位置標(biāo)注,對(duì)各分向量進(jìn)行標(biāo)準(zhǔn)化,得到機(jī)器英語(yǔ)翻譯的前后文的語(yǔ)義模糊概念集R(X)的中心向量C(X),兩個(gè)詞語(yǔ)的可靠性翻譯的聯(lián)合特征概率密度為:

      機(jī)器英語(yǔ)翻譯中模糊語(yǔ)義最優(yōu)解選擇的實(shí)現(xiàn)偽代碼算法描述為:

      BEGIN

      Word Formal t = NEW emantic fuzzy; //初始化短文檔集合

      grey correlation = NEW semantic topic;

      //初始化向量空間及主題詞(敘詞)款目

      Word = English translation (WordList); //語(yǔ)義信息抽取

      WHILE(semantic context IS NOT NULL){

      IF(Word emantic fuzzy optimal){

      Word = feature matching (semantic information);

      }

      //若不在主題詞表中,調(diào)整系數(shù)進(jìn)行翻譯的整體性搜索

      ELSE{

      Node = semantic information (reasonable);

      //翻譯合理性分析

      Sim = matching calculation (Word, Node);

      //語(yǔ)義相似度度量

      Sim_List.put(lauygdbgfOf(Sfgr));

      sefrhtje = lagthte(selhtjhtdNgthde);

      //選擇文本內(nèi)容最大相似度值的翻譯語(yǔ)義映射

      }

      Word.rfregvface(lf(Simregrfist).Nbtjuke); // 統(tǒng)計(jì)分詞

      Word = Nfrgvrrd(Wdefggfgrthgbtt);

      }

      END

      3 實(shí)驗(yàn)測(cè)試分析

      最后在Matlab仿真環(huán)境中進(jìn)行實(shí)驗(yàn)分析,分析通過(guò)模糊語(yǔ)義最優(yōu)解選取機(jī)器英語(yǔ)翻譯的準(zhǔn)確性和合理性建模的性能。實(shí)驗(yàn)中,采用標(biāo)準(zhǔn)度量指標(biāo):語(yǔ)義信息的召回率、主題詞的特征匹配度為測(cè)量值,通過(guò)綜合決策,采用10個(gè)本體實(shí)例進(jìn)行英語(yǔ)機(jī)器翻譯,得到不同閾值下的機(jī)器英語(yǔ)翻譯的特征匹配度如圖4所示,為了對(duì)比性能,采用不同方法得到機(jī)器英語(yǔ)翻譯的信息召回率對(duì)比結(jié)果如圖5所示。

      分析上述仿真結(jié)果得知,本文方法進(jìn)行機(jī)器英語(yǔ)翻譯的語(yǔ)義特征匹配性能較好,調(diào)整閾值系數(shù)進(jìn)行翻譯的整體性和合理性修正,提高了英語(yǔ)翻譯的準(zhǔn)確度;本文方法進(jìn)行機(jī)器英語(yǔ)翻譯的召回率較高,說(shuō)明英語(yǔ)翻譯的上下文映射能力較強(qiáng)、翻譯的整體質(zhì)量較高。

      4 結(jié) 語(yǔ)

      針對(duì)傳統(tǒng)的選取方法存在選取精度低的問(wèn)題,提出基于模糊語(yǔ)義最優(yōu)解選取的機(jī)器英語(yǔ)翻譯方法,并進(jìn)行了實(shí)驗(yàn)分析,結(jié)果表明,采用該方法進(jìn)行機(jī)器英語(yǔ)翻譯,語(yǔ)義信息的召回性能較好,主題詞的特征匹配度較高,說(shuō)明翻譯的合理性和準(zhǔn)確性較好。

      參考文獻(xiàn)

      [1] 辛宇,楊靜,湯楚蘅,等.基于局部語(yǔ)義聚類的語(yǔ)義重疊社區(qū)發(fā)現(xiàn)算法[J].計(jì)算機(jī)研究與發(fā)展,2015,52(7):1510?1521.

      [2] 匡桂娟,曾國(guó)蓀,熊煥亮.關(guān)注用戶服務(wù)評(píng)價(jià)反饋的云資源再分配方法[J].計(jì)算機(jī)應(yīng)用,2015,35(7):1837?1842.

      [3] LI Chenliang, SUN Aixin, ANWITAMAN D. TSDW: two?stage WSD using Wikipedia [J]. Journal of the American Society for Information Science and Technology, 2013, 64(6): 1203?1223.

      [4] 吳江,唐常杰,李太勇,等.基于語(yǔ)義規(guī)則的Web金融文本情感分析[J].計(jì)算機(jī)應(yīng)用,2014,34(2):481?485.

      [5] 鄒亮,徐德智,郭維.基于參考點(diǎn)的大規(guī)模本體擴(kuò)散映射算法[J].小型微型計(jì)算機(jī)系統(tǒng),2013,34(7):1507?1513.

      [6] 黃果,周竹榮.基于領(lǐng)域本體的概念語(yǔ)義相似度計(jì)算研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(10):2460?2463.

      [7] 石倩,陳榮,魯明羽.基于規(guī)則歸納的信息抽取系統(tǒng)實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(21):166?170.

      [8] 粟千.弱化語(yǔ)法規(guī)則下英文機(jī)器翻譯的優(yōu)化仿真[J].計(jì)算機(jī)仿真,2016,33(11):414?417.

      呼和浩特市| 仁化县| 盈江县| 宁远县| 项城市| 樟树市| 通道| 余庆县| 博湖县| 秭归县| 莱西市| 睢宁县| 北海市| 巩义市| 南投市| 潢川县| 磐石市| 丹江口市| 贵港市| 清水县| 茌平县| 平度市| 津南区| 五河县| 余庆县| 尖扎县| 塘沽区| 从化市| 慈溪市| 安新县| 彝良县| 凤庆县| 东海县| 兰西县| 车险| 略阳县| 策勒县| 岳池县| 三门峡市| 扬中市| 旬阳县|