• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于人機(jī)交互和特征提取的英漢翻譯系統(tǒng)研究

      2020-06-30 10:15:22吳曉麗
      微型電腦應(yīng)用 2020年4期
      關(guān)鍵詞:相似度人機(jī)交互特征提取

      吳曉麗

      摘 要:?為了提高英漢翻譯系統(tǒng)的翻譯精度,提出一種基于人機(jī)交互和特征提取的英漢翻譯系統(tǒng)模型。首先,為了實(shí)現(xiàn)翻譯特征語境特征的提取,通過特征提取算法提取語義翻譯語境矩陣和非語義翻譯語境矩陣;其次,為度量同一翻譯環(huán)境下的兩個(gè)語義向量之間的相似度,選擇余弦相似度函數(shù)計(jì)算翻譯相似度。將翻譯相似度引入英漢翻譯系統(tǒng)模型,通過比較兩個(gè)語義向量之間的翻譯相似度實(shí)現(xiàn)英漢之間的翻譯。與SOA、SCA和SLA對(duì)比可知,基于人機(jī)交互和特征提取的英漢翻譯具有更高的準(zhǔn)確率、精確率和召回率,為英語翻譯提供新的方法和途徑。

      關(guān)鍵詞:?人機(jī)交互; 特征提取; 翻譯系統(tǒng); 相似度; 語義向量

      中圖分類號(hào): TM 933.4? ? ? 文獻(xiàn)標(biāo)志碼: A

      Study on English-Chinese Translation System Based on Human-Computer Interaction and Feature Extraction

      WU Xiaoli

      (School of Humanities, Shangluo University, Shangluo, Shanxi 726000, China)

      Abstract:

      In order to improve the translation accuracy of English-Chinese translation system, combining feature extraction and human-computer interaction, an English-Chinese translation system model based on human-computer interaction and feature extraction is proposed. Firstly, in order to extract the context features of translation features, the semantic translation context matrix and non-semantic translation context matrix are extracted by feature extraction algorithm. Secondly, in order to measure the similarity between two semantic vectors in the same translation environment, the cosine similarity function is chosen to calculate the translation similarity. The translation similarity is introduced into the English and Chinese translation system model, and the translation similarity between the two semantic vectors is compared. Compared with SOA, SCA, and SLA, English-Chinese translation based on human-computer interaction and feature extraction has higher accuracy and recall rates, hence, it provides new methods and approaches for English translation.

      Key words:

      human-computer interaction; feature extraction; translation system; similarity; semantic vector

      0 引言

      隨著我國(guó)改革開放程度的加大和對(duì)外合作的程度進(jìn)一步加深,跨國(guó)的文化交流、旅游和商務(wù)活動(dòng)等日益頻繁,然而語言不同給交流和溝通帶來了極大不便。隨著計(jì)算機(jī)技術(shù)和機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,機(jī)器翻譯為解決語言不同溝通障礙問題提供了新的方法和途徑[1]。在機(jī)器翻譯中,名詞短語識(shí)別是機(jī)器翻譯句法分析的基礎(chǔ),其識(shí)別的精度直接關(guān)系機(jī)器翻譯結(jié)果的準(zhǔn)確性和可靠性。

      目前英語名詞短語識(shí)別的方法有基于機(jī)器學(xué)習(xí)的識(shí)別方法、基于統(tǒng)計(jì)的識(shí)別方法以及基于規(guī)則的識(shí)別方法[2]?;谝?guī)則的識(shí)別方法主要通過語料庫(kù)自動(dòng)獲取或者專家編寫,具有容易理解的優(yōu)點(diǎn),但是通用性差、費(fèi)時(shí)而容易產(chǎn)生歧義;基于統(tǒng)計(jì)的方法將名詞短語識(shí)別問題轉(zhuǎn)化為相似詞匯的標(biāo)注問題,該方法具有簡(jiǎn)單靈活,且不依賴具體的語言模型,目前是較為流行的主流翻譯算法;然而該方法基于大量樣本數(shù)據(jù),容易發(fā)生過擬合問題。隨著人工智能和機(jī)器學(xué)習(xí)方法的興起,基于神經(jīng)網(wǎng)絡(luò)的名詞短語識(shí)別方法被應(yīng)用于英語名詞短語識(shí)別,但是由于英語語法的規(guī)律較為復(fù)雜,因此英語名詞短語識(shí)別準(zhǔn)確率有待提高。

      為提高英漢翻譯系統(tǒng)的翻譯精度,提出一種基于人機(jī)交互和特征提取的英漢翻譯模型系統(tǒng)。結(jié)合人機(jī)交互的整體定性認(rèn)識(shí)和邏輯推理的能力[3],將翻譯相似度模型引入英漢翻譯系統(tǒng)模型,通過計(jì)算同一語義空間下兩個(gè)語義向量之間的翻譯相似度實(shí)現(xiàn)英漢翻譯結(jié)果的獲取。與SOA、SCA和SLA對(duì)比可知,基于人機(jī)交互和特征提取的英漢翻譯具有更高的準(zhǔn)確率Accuracy、精確率Precision和召回率Recall,為英語翻譯提供新的方法和途徑。

      1 特征提取算法

      為實(shí)現(xiàn)特征語境的標(biāo)準(zhǔn)提取,通過特征提取算法將最佳語境的映射提取到翻譯過程中[4]。假設(shè)翻譯過程中存在N個(gè)翻譯語境,其中有K類語義翻譯,翻譯語境數(shù)量為Ni(i=1,2,…,K),K類語義翻譯用概率為Xi={Xi1,Xi2,…, XiN},i=1,2,…,K是一個(gè)定向n維向量集合。通過限定過程能夠達(dá)到基本標(biāo)準(zhǔn)翻譯語境的翻譯如式(1)所示。

      其中,αi為能夠到翻譯語義翻譯語境,最佳語境α選定過程如式(2)所示。

      分別計(jì)算適合語義翻譯語境矩陣SB和非語義翻譯語境矩陣Sw[5]如式(3)所示。

      假設(shè)λ為語義語境關(guān)聯(lián)矩陣STwSB的最優(yōu)語境,而f是衡量語義語境關(guān)聯(lián)度的標(biāo)準(zhǔn),則α的值直接能夠反映關(guān)聯(lián)過程的映射。語義語境關(guān)聯(lián)矩陣STwSB最多有K-1個(gè)最佳翻譯語境,其提取的最優(yōu)語境為R(R≤K-1)個(gè),則最優(yōu)語境下的特征語義可用β表示如式(4)所示。

      2 翻譯相似度模型

      所謂翻譯相似度模型是指同一翻譯環(huán)境下兩個(gè)語義向量u和v的相似程度。如果兩個(gè)語義向量與的相似程度越高,則兩個(gè)語義向量u和v的語義更加接近。本文選擇余弦相似度函數(shù)度量同一翻譯環(huán)境下兩個(gè)語義向量u和v之間的翻譯相似度[6-7]如式(5)所示。

      其中,Sim(u,v)為同一翻譯環(huán)境下兩個(gè)語義向量u和v的翻譯相似程度。同一語義環(huán)境下,翻譯相似度計(jì)算結(jié)果如表1所示。

      表1中,D1、D2和D3分別為短語“舉行 選舉”、“hold election”以及“celebrate election”。D1與D2和D3的相似度分別為Sim(D1,D2)=0.86和Sim(D1,D3)=0.53,從而說明D1與D2的翻譯相似度高于D1與D3的翻譯相似度。因此,當(dāng)進(jìn)行翻譯時(shí),將D2作為源語言“舉行選舉”的翻譯結(jié)果。

      3 基于人機(jī)交互和特征提取的英漢翻譯模型

      3.1 人機(jī)交互

      為了充分發(fā)揮計(jì)算機(jī)的邏輯推理能力和人類的整體定性認(rèn)識(shí)能力,將計(jì)算機(jī)和人類結(jié)合起來的方法稱為人機(jī)交互[8-9]。

      3.2 設(shè)計(jì)框架

      基于人機(jī)交互和特征提取的英漢翻譯系統(tǒng)的人機(jī)交互模塊如圖1所示。

      基于人機(jī)交互和特征提取的英漢翻譯系統(tǒng)由圖形化界面、指標(biāo)加載、指標(biāo)計(jì)算、翻譯質(zhì)量評(píng)估等模塊組成。

      (1) 圖形化界面:提供人機(jī)交互界面,加載待翻譯語句、選擇評(píng)價(jià)指標(biāo)和指標(biāo)計(jì)算以及英漢翻譯結(jié)果評(píng)價(jià)和顯示。

      (2) 指標(biāo)加載:加載翻譯結(jié)果評(píng)價(jià)指標(biāo)。

      (3) 指標(biāo)計(jì)算:計(jì)算翻譯結(jié)果評(píng)價(jià)指標(biāo)。

      (4) 翻譯質(zhì)量評(píng)估模塊:根據(jù)翻譯結(jié)果評(píng)價(jià)指標(biāo),判定翻譯效果。

      3.3 算法步驟

      基于人機(jī)交互和特征提取的英漢翻譯模型的算法流程如圖3所示。

      其算法步驟可描述為:

      (1) 預(yù)處理翻譯數(shù)據(jù)語料庫(kù),提取語義向量(源端短語以及目標(biāo)端短語);

      (2) 根據(jù)語義向量映射模型,實(shí)現(xiàn)源端短語到目標(biāo)端短語的語義空間映射;

      (3) 根據(jù)翻譯相似度模型計(jì)算同一翻譯環(huán)境下不同語

      義向量的翻譯相似度;

      (4) 選擇翻譯相似度作為特征向量,并將其加入翻譯解碼得到翻譯結(jié)果。

      4 實(shí)證分析

      4.1 數(shù)據(jù)來源和評(píng)價(jià)指標(biāo)

      為了驗(yàn)證本文算法的有效性,選擇微軟研究院釋義語料庫(kù)[10](MSRP)數(shù)據(jù)集為研究對(duì)象,為評(píng)價(jià)本文算法的有效性,選擇準(zhǔn)確率、召回率、精確率作為評(píng)價(jià)指標(biāo)[11-12]如式(6)所示。

      其中,TP為正類判定為正類;FP為負(fù)類判定為正類;FN為正類判定為負(fù)類;TN為負(fù)類判定為負(fù)類。

      4.2 結(jié)果分析

      為了說明本文方法進(jìn)行英漢翻譯的有效性和可靠性,將本文算法與基于基礎(chǔ)詞項(xiàng)的余弦相似度算法[13](SCA)、基于詞項(xiàng)目重合的重疊相似度算法[14](SOA)以及基于語義詞典的詞典相似度算法[15](SLA),對(duì)比結(jié)果如表2所示。

      由本文算法和SOA、SCA以及SLA對(duì)比可知,本文算法進(jìn)行英語翻譯具有更高的準(zhǔn)確率Accuracy、精確率Precision和召回率Recall,分別為91.09%、88.57%和88.57%,優(yōu)于SOA的83.49%、75.71%和75.71%。其中,SLA的Accuracy、Precision和Recall分別為46.31%、45.71%和45.71%,在幾種算法中最低。與SOA、SCA和SLA對(duì)比可知,本文算法進(jìn)行英語翻譯具有更高的準(zhǔn)確率Accuracy、精確率Precision和召回率Recall,效果較好,為英語翻譯提供新的方法和途徑。

      5 總結(jié)

      為提高英漢翻譯系統(tǒng)的翻譯精度,提出一種基于人機(jī)交互和特征提取的英漢翻譯模型系統(tǒng)。結(jié)合人機(jī)交互的整體定性認(rèn)識(shí)和邏輯推理的能力,將翻譯相似度模型引入英漢翻譯系統(tǒng)模型,通過計(jì)算同一語義空間下兩個(gè)語義向量之間的翻譯相似度實(shí)現(xiàn)英漢翻譯結(jié)果的獲取。與SOA、SCA和SLA對(duì)比可知,本文算法進(jìn)行英語翻譯具有更高的準(zhǔn)確率Accuracy、精確率Precision和召回率Recall,效果較好,為英語翻譯提供新的方法和途徑。

      參考文獻(xiàn)

      [1] 黃登嫻. 英語翻譯軟件翻譯準(zhǔn)確性矯正算法設(shè)計(jì)[J]. 現(xiàn)代電子技術(shù), 2018, 41(14):180-185.

      [2] 張瑩. 基于英語在線翻譯平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 自動(dòng)化與儀器儀表, 2017,6(7):253-255.

      [3] 王超超, 熊德意, 張民, 等. 基于雙語合成語義的翻譯相似度模型[J]. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版), 2015(2):1-6.

      [4] 王海燕, 楊鴻武, 甘振業(yè), 等. 基于說話人自適應(yīng)訓(xùn)練的漢藏雙語語音合成[J]. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013(6):776-780.

      [5] 周文, 徐國(guó)梁. 翻譯記憶中語句相似度計(jì)算方法的研究[J]. 計(jì)算機(jī)應(yīng)用, 2007, 27(5):1210-1213.

      [7] 費(fèi)洪曉, 莫天池, 林青, 等. 基于樹狀語料庫(kù)的中文短語相似度計(jì)算[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2013(8):24-28.

      [8] 徐小娟, 徐國(guó)梁, 黃新. 基于本體的英漢翻譯記憶系統(tǒng)的研究[J]. 科學(xué)技術(shù)與工程, 2008(10):202-204.

      [9] 鄧子齡. 基于粗糙集的翻譯方法的改進(jìn)仿真研究[J]. 科技通報(bào), 2013,12(10):26-29.

      [10] 于夏薇, 袁軍鵬. 融合語料庫(kù)的論文作者姓名中英自動(dòng)翻譯研究[J]. 情報(bào)工程, 2018,3(7):22-26.

      [12] 王清, 殷業(yè). 基于Globish的旅游用英漢翻譯系統(tǒng)的研究[J]. 企業(yè)科技與發(fā)展, 2008,5(12):17-22.

      [13] 李新福,趙蕾蕾,何海斌,等.使用Logistic回歸模型進(jìn)行中文文本分類[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(14):152-156.

      [14] 張玉芳,彭時(shí)名,呂佳.基于文本分類TFIDF方法的改進(jìn)與應(yīng)用[J].計(jì)算機(jī)工程,2006,32(19):76-78.

      [15] 王元珍,錢鐵云,馮小年.基于關(guān)聯(lián)規(guī)則挖掘的中文文本自動(dòng)分類[J].小型微型計(jì)算機(jī)系統(tǒng),2005,26(8):1380-1383.

      (收稿日期: 2019.07.28)

      猜你喜歡
      相似度人機(jī)交互特征提取
      基于Gazebo仿真環(huán)境的ORB特征提取與比對(duì)的研究
      電子制作(2019年15期)2019-08-27 01:12:00
      一種基于LBP 特征提取和稀疏表示的肝病識(shí)別算法
      改進(jìn)的協(xié)同過濾推薦算法
      模糊Petri網(wǎng)在油田開發(fā)設(shè)計(jì)領(lǐng)域的應(yīng)用研究
      某型柴油機(jī)虛擬維修系統(tǒng)研究
      人機(jī)交互課程創(chuàng)新實(shí)驗(yàn)
      人形交互式服務(wù)機(jī)器人研究現(xiàn)狀及發(fā)展趨勢(shì)
      相似度算法在源程序比較中的應(yīng)用
      一種靜態(tài)手勢(shì)數(shù)字識(shí)別的實(shí)現(xiàn)及應(yīng)用
      影響母線負(fù)荷預(yù)測(cè)的因素及改進(jìn)措施
      科技視界(2016年10期)2016-04-26 11:40:14
      铜陵市| 东海县| 惠州市| 仪征市| 商河县| 社旗县| 勐海县| 新乡市| 武邑县| 东莞市| 临湘市| 唐海县| 太仆寺旗| 黄大仙区| 孝感市| 衢州市| 娄烦县| 新龙县| 随州市| 临沭县| 榆树市| 北安市| 互助| 谷城县| 中卫市| 禹城市| 吴川市| 龙井市| 马鞍山市| 泰安市| 岗巴县| 唐海县| 江津市| 苍南县| 肃南| 潞西市| 阿克陶县| 左权县| 南投市| 宁安市| 茂名市|