• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于語音識別的英語名詞短語在線翻譯系統(tǒng)

      2022-08-17 02:44:10王少華
      自動化技術(shù)與應(yīng)用 2022年7期
      關(guān)鍵詞:識別率短語語音

      王少華

      (陜西能源職業(yè)技術(shù)學院人文與教育學院,陜西咸陽 712000)

      1 引言

      隨著人機交互技術(shù)不斷發(fā)展,語音識別技術(shù)已逐漸成為翻譯過程中備受關(guān)注和控制的技術(shù),為此在語音識別技術(shù)的支持下,設(shè)計了一種基于語音識別的英語名詞短語在線翻譯系統(tǒng),該系統(tǒng)能夠利用語音交互技術(shù)來顯示翻譯過程的智能化,利用多種語音算法,改變原有語音識別技術(shù)中存在的不足,實現(xiàn)了英語在線翻譯的智能化。國外研究語音識別技術(shù)較早,在設(shè)計在線翻譯系統(tǒng)時,如今的研究可劃分為大詞匯量的連續(xù)語音識別系統(tǒng)以及靈活性較強的語音交互系統(tǒng),設(shè)計得到了多種語音識別硬件載體。國內(nèi)在研究語音識別技術(shù)較晚,隨著硬件大規(guī)模集成電路技術(shù)不斷地發(fā)展,如今研究得到了多種識別算法,在分析得到的數(shù)據(jù)以及模式支持下,改善了原有識別算法模型中存在的不足,設(shè)計得到了多種語義識別技術(shù)。文獻[1]中設(shè)計了一種基于最長名詞短語分治策略的神經(jīng)機器翻譯系統(tǒng)。該系統(tǒng)根據(jù)分治法的原理,篩選句中的最長名詞短語并保留核心詞。然后將兩者與其余部分組建句子框架,再利用神經(jīng)機器網(wǎng)絡(luò)分別翻譯其句子框架,通過譯文重新組合實現(xiàn)對名詞短語的翻譯。文獻[2]設(shè)計了基于多語言交互的英語翻譯在線輔助系統(tǒng),該系統(tǒng)由系統(tǒng)收發(fā)單元、自動翻譯單元、人工校正單元、任務(wù)管理單元和記憶庫管理單元5 個部分組成,系統(tǒng)流程主要包括:基于多語言交互的英語翻譯服務(wù)流程和基于項目的多語言交互英語翻譯服務(wù)流程設(shè)計。但是以上兩種系統(tǒng)在線翻譯語音識別率較低,因此本文設(shè)計了一種基于語音識別技術(shù)的英語名詞短語在線翻譯系統(tǒng)。

      2 在線翻譯系統(tǒng)硬件

      2.1 語音識別硬件模塊

      選用ARM嵌入式處理器S3C2440作為語音識別模塊的中央處理器,并使用該單元外部兩個串行外設(shè)接口進行數(shù)據(jù)傳輸,實現(xiàn)英語名詞短語的轉(zhuǎn)換。開發(fā)板選擇了通用開發(fā)板TQ2440,使用其自帶的處理器,設(shè)定開發(fā)板內(nèi)部的SDRAM控制器和外部存儲控制器的主頻率設(shè)置為350MHz[3-4]。以開發(fā)板內(nèi)的GPIO口為外部拓展接口,將開發(fā)板中多個接口作為其他硬件接口,所設(shè)計的語音識別硬件模塊結(jié)構(gòu)如圖1所示。語音識別模塊可分為音頻芯片驅(qū)動模塊、音頻處理模塊、儲存模塊以及電源模塊[5]。音頻采集模塊以音頻芯片NAU85LC10 作為核心,使用芯片內(nèi)的MIC+和MIC-內(nèi)的引腳,連接外部電源模塊以及儲存模塊的接口。使用芯片內(nèi)部的數(shù)字音頻接口I2C、PCM,將控制數(shù)字音頻I2C接口連接到串行控制接口后,設(shè)定芯片的可變采樣率為20KHz[6]。

      圖1 設(shè)計得到的語音識別硬件模塊結(jié)構(gòu)

      該芯片內(nèi)部集成了數(shù)模轉(zhuǎn)換器和模數(shù)轉(zhuǎn)換器,其中控制數(shù)模轉(zhuǎn)換器與芯片I2C接口相連,控制I2S接口負責收發(fā)音頻數(shù)據(jù),語音識別模塊的主處理器與該音頻芯片間的連接結(jié)構(gòu)如下圖所示。

      圖2 連接結(jié)構(gòu)圖

      在上圖所示的連接結(jié)構(gòu)圖中,為了減少芯片引腳的占用,將I2C接口作為數(shù)據(jù)傳輸口,將連接結(jié)構(gòu)內(nèi)部的MCU作為主設(shè)備,實現(xiàn)硬件間的互通[7]。

      2.2 構(gòu)建硬件連接電路

      在圖1的語音識別模塊中,根據(jù)語音識別芯片的引腳功能,將LD_LOUTR和LD_LOUTL作為芯片輸出的左右端,將引腳LD_SPOP和LD_SPON作為語音麥克輸入的負極和正極[8],使用一條串行數(shù)據(jù)線SDA與時鐘線SCL連接語音芯片的引腳P1.6與P1.7,芯片的引腳分配情況如圖3所示。

      圖3 芯片的引腳分配情況

      由圖3所示的引腳分配情況可知,設(shè)定語音識別模塊的電源電壓為3.3V 后,為了抑制語音輸入硬件中產(chǎn)生的信號噪聲,在設(shè)計的開發(fā)板內(nèi),控制模擬電路與數(shù)字電路在電源處相連,在采集語音的元件模塊內(nèi)設(shè)置多個海綿口,通過海綿口與語音接收元件間的接觸,來消除接收語音外部的噪音。綜合上述設(shè)計,完成對在線翻譯系統(tǒng)的硬件設(shè)計[9]。

      3 在線翻譯系統(tǒng)軟件

      3.1 英語名詞短語語音信號采集

      在不同個體語音的影響下,使用上述設(shè)計硬件采集得到的英語名詞短語語音信號會產(chǎn)生一定的衰減,為了抑制該部分衰減,使用一階FIR 的高速數(shù)字濾波器,來構(gòu)建一個信號傳遞函數(shù),可表示為:

      其中,a表示預(yù)加重系數(shù),Z表示信號傳遞函數(shù)。在上述信號傳遞過程下,需要對每幀信號進行傅里葉變化,設(shè)定變化的周期為2,變化過程就可表示為:

      其中,w(n-m)表示窗口函數(shù)序列,m表示窗口長度,x(m)表示信號序列,j表示信號分量參數(shù),k表示窗口函數(shù)序列卷積。N代表窗口函數(shù)序列個數(shù),在上述短時變化處理下,語音信號產(chǎn)生了部分的信號分量,映射處理該部分分量至一個二維空間[10],產(chǎn)生的短時幅度譜,如圖4所示。采用梅爾標度濾波控制短時語音信號的頻率分辨力,可表示為:

      圖4 產(chǎn)生的短時幅度譜

      其中,β表示短時幅度參數(shù),f表示語音信號的頻率數(shù)值,ε表示轉(zhuǎn)化參數(shù)。增強語音信號的分辨力后,完成對英語名詞短語語音信號的采集,在實現(xiàn)在線翻譯系統(tǒng)功能時,構(gòu)建在線翻譯功能軟件框架。

      3.2 在線翻譯功能軟件框架

      在構(gòu)建在線翻譯功能軟件框架時,利用采集得到的語音信號數(shù)據(jù),建立一個本地詞庫,將該詞庫作為加載功能數(shù)據(jù)的查詢文件。使用JAVA 編程處理一個在線翻譯程序主頁面,細化得到的在線翻譯程序功能結(jié)構(gòu)如圖5所示。

      圖5 程序功能結(jié)構(gòu)

      在上圖所示的程序功能結(jié)構(gòu)下,采用MVC 應(yīng)用程序中的數(shù)據(jù)模型、視圖、控制器三個核心組件,將采集得到的數(shù)據(jù)與固定的聲音信號相結(jié)合。以XLM界面作為軟件功能的處理階段,形成的功能框架如圖6所示。

      圖6 建立的功能框架

      根據(jù)以上的功能框架上,在視圖層采用XML 文件作為在線翻譯頁面,并結(jié)合使用JavaScript+HTML 來實現(xiàn)語音識別結(jié)果的實時反饋。在控制層內(nèi)設(shè)置一個Activity 作為功能邏輯,在模型層內(nèi),采用SQLite3 作為英語名詞短語的數(shù)據(jù)庫結(jié)構(gòu),在服務(wù)器端內(nèi)實現(xiàn)的翻譯程序支持下,構(gòu)建得到一個在線翻譯過程。綜合上述分析,最終完成對基于語音識別的英語名詞短語在線翻譯系統(tǒng)的設(shè)計。

      4 系統(tǒng)測試

      4.1 實驗準備

      使用Eclipse集成開發(fā)環(huán)境,準備操作系統(tǒng)為Windows10、64 位操作系統(tǒng),處理器為Intel(R)Core(TM)i3 CPU M370@2.40GHZ、內(nèi)存為4G的計算機作為系統(tǒng)測試設(shè)備,調(diào)試在線翻譯系統(tǒng)的軟件結(jié)構(gòu)。

      在主程序頁面下,設(shè)置功能檢測在線翻譯系統(tǒng)的發(fā)音引擎后,調(diào)用在線翻譯系統(tǒng)的測試功能,使用Mel 譜圖生成模塊,將語音識別的音頻進行分幀、加窗、預(yù)處理后生成Mel譜圖。使用該Mel譜圖重建在線系統(tǒng)接收到的語音波形,在保存為wav格式的音頻文件后,形成的語音翻譯過程。

      在語音信號翻譯過程中,按照英語名詞短語的內(nèi)容,將在線翻譯系統(tǒng)的語料內(nèi)容劃分為三種,第一組為5s及以上的語音,第二組為7s~10s 的語音,第三組為11s 以上的語音,語料分組的詳細情況如表1所示。

      表1 使用的英語名詞短語分組信息

      以上述表格中所設(shè)置的英語名詞短語作為實驗對象,分別使用文獻[1]、文獻[2]中的在線翻譯系統(tǒng)以及文中設(shè)計的在線翻譯系統(tǒng)進行實驗,對比三種在線翻譯系統(tǒng)的性能。

      4.2 結(jié)果及分析

      在以上實驗準備的基礎(chǔ)上,控制三種在線翻譯系統(tǒng)同時處理實驗準備的英語名詞短語語料,定義三種在線翻譯系統(tǒng)的語音翻譯效果可表示為:

      其中,BP表示準備語料中懲罰因子的數(shù)值,Pn表示修正語料的元精度,wn表示元精度的權(quán)重。定義該數(shù)值越大則表示翻譯效果越好,在第一組輸入語音句子詞數(shù)內(nèi),統(tǒng)計得到三種在線翻譯系統(tǒng)的翻譯效果,結(jié)果如表2所示。

      表2 三種在線翻譯系統(tǒng)語音識別結(jié)果

      由圖7所示的實驗結(jié)果可知,在三種在線翻譯系統(tǒng)控制下,針對相同內(nèi)容的英語名詞語音內(nèi)容來講,文獻[1]中在線翻譯系統(tǒng)得到的平均BLUE 數(shù)值在0.25 左右,對應(yīng)得到的翻譯效果較差,文獻[2]中的在線翻譯系統(tǒng)得到的平均BLUE數(shù)值在0.27左右,數(shù)值較大,該種在線翻譯系統(tǒng)的翻譯效果較好。而該文設(shè)計的在線翻譯系統(tǒng)得到的平均BLUE 數(shù)值在0.31左右,與兩種文獻中的在線翻譯系統(tǒng)相比,該種在線翻譯系統(tǒng)的翻譯效果最佳。

      基于以上實驗環(huán)境,控制三種在線翻譯系統(tǒng)處理實驗準備的第二組英語名詞短語分組,使用相同參數(shù)的計算機承載三種在線翻譯系統(tǒng)后,當三種在線翻譯系統(tǒng)處理第二組名詞短語數(shù)據(jù)信息時,調(diào)用承載翻譯系統(tǒng)的任務(wù)管理器,設(shè)定系統(tǒng)CPU的占用率統(tǒng)計周期為60s,三種在線翻譯系統(tǒng)的CPU占用率結(jié)果如圖7所示。

      圖7 三種在線翻譯系統(tǒng)翻譯效果實驗結(jié)果

      由圖8所示的CPU 占有率結(jié)果可知,控制三種在線翻譯系統(tǒng)處理相同的英語名詞短語語音時,根據(jù)上圖結(jié)果,文獻[1]中的在線翻譯系統(tǒng)在相同統(tǒng)計時間內(nèi)CPU的占有率在80%左右,實際運行時占據(jù)的運行較高,文獻[2]中的在線翻譯系統(tǒng)在周期內(nèi),產(chǎn)生的CPU占有率在65%左右,實際運行時CPU的占有率數(shù)值較大,而文中設(shè)計的在線翻譯系統(tǒng),在相同的實驗周期內(nèi),英語名詞短語的CPU 占有率在40%左右,與兩種文獻中的在線系統(tǒng)相比,該種在線翻譯系統(tǒng)實際運行時,形成的CPU占有率最小。

      圖8 三種在線翻譯系統(tǒng)運行時的CPU占有率結(jié)果

      保持上述實驗環(huán)境不變,控制三種在線翻譯系統(tǒng)處理實驗準備的第三組英語名詞短語分組信息,采集十位人員讀取準備測試集內(nèi)的英語名詞短語,以三種在線翻譯系統(tǒng)對不同音調(diào)的識別結(jié)果作為對比指標,實際的語音識別率可計算為:

      其中,R表示在線翻譯系統(tǒng)已識別得到的英語名詞短語,Rn表示在線翻譯系統(tǒng)識別英語名詞短語總值。統(tǒng)計三種系統(tǒng)所對應(yīng)的語音識別率,最終三種在線翻譯系統(tǒng)的語音識別結(jié)果,如表2所示。

      由表2計算統(tǒng)計得到的語音識別率結(jié)果表明,在十五種不同的語調(diào)控制下,三種在線翻譯系統(tǒng)表現(xiàn)出了不同的識別率結(jié)果,文獻[1]中的在線翻譯系統(tǒng)的平均語音識別率在62.9%左右,實際語音識別率數(shù)值較小,在線翻譯結(jié)果不準確。文獻[2]中的在線翻譯系統(tǒng)的平均識別率在83.5%左右,實際語音的識別率數(shù)值較大,實際的翻譯結(jié)果較準確,而本文設(shè)計的在線翻譯系統(tǒng)的平均識別率在97.9%左右,與兩種文獻中的在線翻譯系統(tǒng)相比,該種在線翻譯系統(tǒng)對不同語調(diào)的語音識別能力較強,翻譯效果最佳。

      5 結(jié)束語

      隨著機械翻譯方法不斷地發(fā)展,在線翻譯系統(tǒng)逐漸成為了翻譯設(shè)計方向上研究的熱點,在語音識別技術(shù)的支持下,設(shè)計一種英語名詞短語在線翻譯系統(tǒng),能夠改善現(xiàn)有翻譯系統(tǒng)存在的不足,為今后在線翻譯系統(tǒng)的研究提供了一定的方向。但本文設(shè)計的在線翻譯系統(tǒng)并未對語音識別硬件進行改進,還需要不斷地研究改進。

      猜你喜歡
      識別率短語語音
      基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測
      計算機工程(2020年3期)2020-03-19 12:24:50
      魔力語音
      基于MATLAB的語音信號處理
      電子制作(2019年14期)2019-08-20 05:43:38
      基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識別率的關(guān)系
      基于MQ3與MP3的價廉物美的酒駕語音提醒器
      電子制作(2019年9期)2019-05-30 09:42:10
      對方正在輸入……
      小說界(2018年5期)2018-11-26 12:43:42
      提升高速公路MTC二次抓拍車牌識別率方案研究
      高速公路機電日常維護中車牌識別率分析系統(tǒng)的應(yīng)用
      塔城市| 顺昌县| 彝良县| 苗栗市| 梁河县| 呼图壁县| 临洮县| 龙岩市| 西青区| 修文县| 香格里拉县| 嘉义县| 漳浦县| 招远市| 甘谷县| 天水市| 白沙| 专栏| 商都县| 福海县| 永福县| 荔浦县| 中牟县| 孝昌县| 措美县| 来安县| 漳浦县| 万盛区| 固原市| 平遥县| 定日县| 邯郸县| 丹棱县| 漳浦县| 桐乡市| 江门市| 上林县| 苗栗县| 迁安市| 南充市| 西峡县|