(中國(guó)電子科技集團(tuán)公司第十研究所,成都 610000)
音響中心是機(jī)載航空電子系統(tǒng)的重要功能單元,它完成飛行員機(jī)內(nèi)通話、機(jī)外通話、指揮引導(dǎo)、飛行狀態(tài)告警等任務(wù),對(duì)飛機(jī)的安全和指揮控制起著關(guān)鍵的作用[1]。傳統(tǒng)的音響中心采用模擬音頻技術(shù)傳輸話音信號(hào)[2],由于模擬音頻設(shè)備存在易受干擾、頻帶窄、可靠性差、設(shè)備體積重量大等缺點(diǎn),已不再適用于有減重需求、電磁環(huán)境復(fù)雜的航空電子領(lǐng)域應(yīng)用,因而數(shù)字音頻處理技術(shù)[3]應(yīng)運(yùn)而生。數(shù)字音頻技術(shù)是將模擬聲音信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),通過(guò)現(xiàn)代數(shù)字處理方法處理、傳輸話音,數(shù)字音頻系統(tǒng)[4]具有抗干擾性強(qiáng)、設(shè)備體積小、重量輕、音頻信號(hào)質(zhì)量好等特點(diǎn),因而本文提出了一種基于FPGA+DSP架構(gòu)的數(shù)字音頻處理系統(tǒng)。前端通過(guò)模擬音頻電路完成模擬音頻信號(hào)的A/D、D/A轉(zhuǎn)換,后端通過(guò)FPGA和DSP構(gòu)建數(shù)字處理平臺(tái),完成數(shù)字音頻的抑制噪聲、話音增強(qiáng)等處理。
數(shù)字音頻處理系統(tǒng)由模擬音頻接口、數(shù)字音頻處理兩部分組成,系統(tǒng)框圖如圖1所示。其中模擬音頻接口包括輸入和輸出兩部分,輸入部分完成輸入模擬音頻信號(hào)的阻抗匹配、信號(hào)采集、濾波和預(yù)放大,并將處理后模擬音頻信號(hào)送入A/D芯片進(jìn)行模/數(shù)轉(zhuǎn)換;輸出部分完成D/A芯片輸出信號(hào)的濾波、隔直和放大,輸出的模擬音頻信號(hào)驅(qū)動(dòng)耳機(jī)、話筒等音頻設(shè)備。
數(shù)字音頻部分由FPGA、DSP及外圍存儲(chǔ)控制電路組成。FPGA作為A/D芯片與DSP間通信的橋梁,對(duì)A/D或D/A數(shù)據(jù)進(jìn)行緩存、組幀和串并轉(zhuǎn)換,轉(zhuǎn)換后的數(shù)據(jù)通過(guò)LocalBus總線接口傳輸給DSP進(jìn)行數(shù)據(jù)處理,同時(shí)FPGA單元完成A/D芯片初始化配置、DSP時(shí)鐘、復(fù)位信號(hào)輸出控制等功能;DSP單元作為系統(tǒng)的核心處理部分,完成數(shù)字音頻信號(hào)的混音、加權(quán)、編解碼和音頻處理算法等功能。
音頻接口電路主要包括輸入和輸出兩部分,輸入部分如圖 2所示。
圖1 數(shù)字音頻處理系統(tǒng)框圖
圖2 模擬音頻輸入接口電路
圖3 模擬音頻輸出接口電路
前端設(shè)計(jì)RC低通濾波器(由阻容網(wǎng)絡(luò)R3/C6、R6/C8組成),用于濾除音頻信號(hào)中的雜波干擾。由于音頻信號(hào)頻率范圍為300~3 400 Hz,為了有效濾除輸入音頻信號(hào)雜波并保證話音信號(hào)的平坦度,音頻輸入接口前端設(shè)計(jì)RC低通濾波器(由阻容網(wǎng)絡(luò)R3/C6,R6/C7組成),截止頻率設(shè)置為10 kHz左右,對(duì)輸入的差分音頻信號(hào)進(jìn)行濾波,濾波后的信號(hào)經(jīng)隔直電容(C2/C5組成)去除直流分量后送入芯片MAX4062進(jìn)行預(yù)放大,放大后的信號(hào)送入TPS721芯片進(jìn)行單端信號(hào)到差分信號(hào)轉(zhuǎn)換,轉(zhuǎn)換后通過(guò)雙絞屏蔽電纜將差分信號(hào)傳給后端設(shè)備進(jìn)行A/D采樣,這里采用差分信號(hào)傳輸有效降低了傳輸路徑電磁輻射對(duì)模擬信號(hào)的干擾和衰減,減小了信號(hào)的失真。
輸出音頻接口電路設(shè)計(jì)如圖3所示,由于D/A器件采用插值算法將數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào),D/A轉(zhuǎn)換后的模擬信號(hào)中含有低頻干擾和高頻雜波,音頻輸出接口前端由低通濾波器(阻容網(wǎng)絡(luò)C10/R10)和高通濾波器(阻容網(wǎng)絡(luò)C9/R8)組成,兩個(gè)濾波器疊加構(gòu)建了帶通濾波器,通帶設(shè)置為200~4 000Hz左右,這樣有效地濾除輸出音頻信號(hào)的雜波并保留了有用信息,濾波后的信號(hào)經(jīng)放大器(型號(hào)為OPA547)進(jìn)行負(fù)反饋放大,放大后信號(hào)經(jīng)隔直電容(C11)除去直流分量后驅(qū)動(dòng)耳機(jī)等音響設(shè)備。
A/D和D/A轉(zhuǎn)換電路完成模/數(shù)、數(shù)/模信號(hào)轉(zhuǎn)換功能,如圖4所示,采用TLV320AIC23B芯片完成A/D和D/A轉(zhuǎn)換,TLV320AIC23B是一款高性能的音頻編/解碼器,該芯片內(nèi)部集成A/D和D/A電路,由于TLV320AIC23B芯片由3.3 V電壓供電,單端輸入采樣,前端設(shè)計(jì)匹配電路,采用芯片INA2134及其周圍電阻網(wǎng)路完成信號(hào)匹配和差分單端轉(zhuǎn)換;
轉(zhuǎn)換后的單端信號(hào)送入TLV320AIC23B進(jìn)行A/D轉(zhuǎn)換;D/A電路為A/D的逆過(guò)程,F(xiàn)PGA端將數(shù)字信號(hào)送入TLV320AIC23B的控制端,經(jīng)D/A轉(zhuǎn)換后由TLV320AIC23B模擬輸出引腳(9/10引腳)輸出驅(qū)動(dòng)后端音響設(shè)備。
圖4 A/D和D/A電路
DSP和FPGA功能電路框圖如圖5所示,DSP作為系統(tǒng)的處理核心,采用ADI公司的高性能處理器ADSP-21368BBPZ,該款DSP是SHARC系列浮點(diǎn)處理器的產(chǎn)品,最高主頻為400 MHz,DSP最小系統(tǒng)包括時(shí)鐘單元、供電單元、復(fù)位邏輯和外擴(kuò)的SDRAM存儲(chǔ)器和FLASH存儲(chǔ)器,其中DSP外部片選0分配給FLASH存儲(chǔ)器,用于存儲(chǔ)DSP固化程序以及音頻報(bào)警等,掉電不丟失數(shù)據(jù);DSP外部片選1分配給SDRAM存儲(chǔ)器,用于暫存程序代碼和其他運(yùn)行數(shù)據(jù);DSP外部片選2分配給FPGA,用于對(duì)FPGA數(shù)據(jù)讀寫尋址;FPGA功能單元由時(shí)鐘、配置單元和FPGA組成,時(shí)鐘為FPGA工作提供時(shí)鐘源,配置單元存儲(chǔ)掉電不丟失的FPGA固化代碼,上電時(shí)完成FPGA配置加載,F(xiàn)PGA加載完成后輸出時(shí)鐘、復(fù)位信號(hào)完成DSP初始化配置;FPGA與DSP間通過(guò)LocalBus總線接口通信,F(xiàn)PGA完成A/D數(shù)據(jù)的緩存、組幀、串并轉(zhuǎn)換,并以中斷方式通知DSP取數(shù)。
圖5 DSP和FPGA功能電路框圖
話音活動(dòng)檢測(cè)算法原理是[5]:語(yǔ)音與噪聲歸一化自相關(guān)函數(shù)中極大值(即能量)的概率分布不同,因而可利用能量來(lái)對(duì)濁音及非濁音(包括清音和噪聲)進(jìn)行判斷。由于話音信號(hào)本身具有短時(shí)平穩(wěn)性,一般認(rèn)為10~30 ms的時(shí)間范圍是準(zhǔn)穩(wěn)態(tài)過(guò)程,在短時(shí)間內(nèi)把話音信號(hào)當(dāng)做一個(gè)穩(wěn)態(tài)過(guò)程,采用短時(shí)能量對(duì)話音信號(hào)進(jìn)行激活檢測(cè),假設(shè)第w幀話音信號(hào)Sw(n)的短時(shí)能量為Ew,計(jì)算短時(shí)能量公式如下所示:
其中N為幀長(zhǎng)。預(yù)先設(shè)定一個(gè)閾值Y,當(dāng)短時(shí)能量Ew>Y時(shí),判斷為話音;反之為噪聲。
基于短時(shí)能量的方法在信噪比較高時(shí)準(zhǔn)確性較高,但當(dāng)信噪比較低時(shí)誤差較高,需要結(jié)合其它方法綜合判決,本文采用短時(shí)能量和過(guò)零率結(jié)合的話音端點(diǎn)檢測(cè)方法。語(yǔ)音信號(hào)的短時(shí)過(guò)零率ZCR[6]是指單位時(shí)間內(nèi)信號(hào)波形穿過(guò)橫軸(零電平)的次數(shù)。抽樣后的語(yǔ)音信號(hào)是離散的時(shí)間序列,其過(guò)零即是相鄰兩個(gè)采樣改變符號(hào)的次數(shù),定義為:
圖7 音頻處理仿真環(huán)境
其中sgn[.] 表示符號(hào)函數(shù),即
研究表明信號(hào)過(guò)零率較噪聲過(guò)零率低,當(dāng)ZCR大于設(shè)定閾值Z時(shí),認(rèn)為是噪聲;反之判定為話音。這樣通過(guò)短時(shí)能量和過(guò)零率相結(jié)合的算法,能夠準(zhǔn)確檢測(cè)話音端點(diǎn),減少誤判率和漏判率。
圖6 音頻處理算法 流程圖
為了獲得更好的通話效果,采用數(shù)字處理算法對(duì)話音信號(hào)進(jìn)行處理。音頻處理算法流程圖如圖6所示。
如圖6所示DSP上電后運(yùn)行初始化程序,完成A/D芯片、FLASH、SDRAM等硬件資源的初始化配置,同時(shí)設(shè)置中斷函數(shù)實(shí)時(shí)監(jiān)測(cè)是否有FPGA的緩存中斷,當(dāng)監(jiān)測(cè)到有中斷到來(lái)時(shí)調(diào)用中斷響應(yīng)函數(shù),讀取FIFO內(nèi)音頻數(shù)據(jù)。每次中斷函數(shù)讀取8 ms話音數(shù)據(jù),為了滿足音頻準(zhǔn)平穩(wěn)信號(hào)特性,需將本次8 ms采集到的信號(hào)與前兩次(16 ms)采集的信號(hào)進(jìn)行組幀,構(gòu)成24 ms音頻數(shù)據(jù),對(duì)組幀后的數(shù)據(jù)進(jìn)行加窗,窗函數(shù)選擇Hanmming窗,加窗調(diào)制后的信號(hào)送入話音活動(dòng)檢測(cè)模塊,若檢測(cè)到無(wú)話音活動(dòng)送入舒適噪聲生成模塊重構(gòu)背景噪聲,噪聲生成模塊采用隨機(jī)白噪聲產(chǎn)生算法生成舒適白噪聲,以填補(bǔ)話音信號(hào)中無(wú)音段。若檢測(cè)到有話音活動(dòng)送入自適應(yīng)噪聲抑制模塊進(jìn)行降噪處理,經(jīng)噪聲抑制模塊去噪后的信號(hào)送入自動(dòng)增益控制模塊[7],經(jīng)上述算法模塊處理后的音頻信號(hào)送入音頻輸出模塊,對(duì)數(shù)字音頻進(jìn)行D/A變換、放大和匹配后輸出模擬音頻信號(hào),驅(qū)動(dòng)耳機(jī)、話筒等音響設(shè)備。
為了驗(yàn)證數(shù)字話音處理系統(tǒng)的功能和性能,搭建如圖7所示驗(yàn)證環(huán)境。實(shí)錄了一段在機(jī)載環(huán)境下信噪比為5 dB的飛行員話音信號(hào)作為輸入測(cè)試激勵(lì),該信號(hào)是飛行員通話無(wú)線電設(shè)備和飛機(jī)發(fā)動(dòng)機(jī)噪聲疊加的帶噪話音段,代表著一種常見、典型的機(jī)載音頻信號(hào)。話音信號(hào)處理前與處理后的結(jié)果如圖8所示。
圖8 數(shù)字話音處理系統(tǒng)效果圖
圖8(a)為信噪比為5 dB的輸入帶噪話音段,經(jīng)本系統(tǒng)處理后輸出的音頻信號(hào)如圖8(b)所示,從圖中可看出輸入信號(hào)為帶有強(qiáng)噪音的話音信號(hào),經(jīng)過(guò)系統(tǒng)處理后有音無(wú)音段被準(zhǔn)確地識(shí)別出來(lái),無(wú)音段的噪聲信號(hào)被有效抑制,有音段的話音被明顯增強(qiáng)。
為了進(jìn)一步評(píng)價(jià)話音信號(hào)質(zhì)量,采用主觀和客觀評(píng)價(jià)相結(jié)合的方法,其中主觀評(píng)價(jià)采用ITU組織在ITU-T P.800和P.830建議書中制定的測(cè)試標(biāo)準(zhǔn):MOS[8](Mean Opinion Score)評(píng)分測(cè)試;客觀評(píng)價(jià)采用ITU組織推薦的語(yǔ)音傳輸質(zhì)量測(cè)試標(biāo)準(zhǔn)P.862-PESQ算法[9],選用基于PESQ算法開發(fā)的商用話音質(zhì)量測(cè)試儀進(jìn)行測(cè)試,選取了10位受試者對(duì)不同信噪比的話音進(jìn)行MOS評(píng)分和測(cè)試儀測(cè)試,測(cè)試結(jié)果如表1所列。
表1 話音質(zhì)量評(píng)價(jià)表
從表1可看出,對(duì)比不同信噪比條件下處理前后的話音信號(hào),處理前話音信號(hào)評(píng)分較低,話音質(zhì)量較差;處理后話音信號(hào)評(píng)分有所提高,話音信號(hào)質(zhì)量較好,特別是在低信噪比條件下,處理前后的評(píng)分差值更大,話音質(zhì)量改善的效果更加明顯。另外通過(guò)多人主觀測(cè)試反映,輸入信號(hào)含有強(qiáng)噪聲的話音,音量強(qiáng)度忽強(qiáng)忽弱,舒適度差,處理后輸出的話音噪聲明顯減弱,話音平穩(wěn),可聽性好。試驗(yàn)結(jié)果表明,數(shù)字話音處理系統(tǒng)能夠有效抑制噪聲并改善話音質(zhì)量,特別是對(duì)低信噪比條件下話音的增強(qiáng)起到了較好的作用。
[1] 李成文,楊軍祥.新一代直升機(jī)綜合核心處理機(jī)技術(shù)研究與實(shí)現(xiàn)[J].電子技術(shù)應(yīng)用,2014(12):121-124.
[2] 楊坤.模擬音頻技術(shù)與數(shù)字音頻技術(shù)研究[J].科技傳播,2015(7):90-91.
[3] 孫育紅.數(shù)字多媒體數(shù)據(jù)采編系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2017,40(15):122-125.
[4] 趙力.語(yǔ)音信號(hào)處理[M].北京:機(jī)械工業(yè)出版社,2016.
[5] Yonemori H,Maruyama R.A study on the Noise Suppression in High Frequency Acoustic Noise of IH Cooking Heater[J].Journal of the Japan Society of Applied Electromagnetics&Mechanics,2015,23(1):213-218.
[6] 紀(jì)振發(fā),楊暉,李然,等.基于短時(shí)自相關(guān)及過(guò)零率的語(yǔ)音端點(diǎn)檢測(cè)算法[J].電子科技,2016,29(9):52-55.
[7] Khing P P,Swanson B A,Ambikairajah E.The effect of automatic gain control structure and release time on cochlear implant speech intelligibility[J].Plos One, 2013,8(11):e82263.
[8] ITU-T Recommendation P.800. Methods for Subjective Determination of 17 Transmission Quality,1996.
[9] 陳曉翔,陸保體,林嘉宇.PESQ算法在軍事語(yǔ)音評(píng)估中的性能分析[J].微處理機(jī),2014,35(1):35-40.
李聲飛(工程師),主要研究方向?yàn)楹娇諜C(jī)載音頻信號(hào)處理、總線技術(shù)。
單片機(jī)與嵌入式系統(tǒng)應(yīng)用2018年1期