提高車載語音識別的分析和優(yōu)化方法

2024-10-29 00:00:00張梅

汽車電器 2024年10期

【摘要】為了最大化實現(xiàn)智能座艙的語音識別準確率，提出一種提高語音識別的分析和優(yōu)化方法，在其他硬件條件相同時，可有效提高語音識別率，以便智能網(wǎng)聯(lián)車機更好地實現(xiàn)多模交互、主動交互，成為一個懂用戶的出行伙伴，為用戶帶來場景化、個性化體驗。

【關鍵詞】智能網(wǎng)聯(lián)車機；語音識別；麥克風

中圖分類號：U463.67 文獻標識碼：A 文章編號：1003-8639（ 2024 ）10-0026-03

Analysis and Optimization Methods for Improving Vehicle Speech Recognition

ZHANG Mei

（Jiangling Motors Co.，Ltd.，Nanchang 330001，China）

【Abstract】In order to maximize the accuracy of speech recognition in the intelligent cockpit，an analysis and optimization method to improve speech recognition is proposed，which can effectively improve the speech recognition rate when other hardware conditions are the same，so that the intelligent networked vehicle machine can better realize multi-mode interaction and active interaction，become a travel partner who understands users，and bring scenario-based and personalized experience to users.

【Key words】intelligent networked vehicle；speech recognition；microphone

作者簡介

張梅（1989—），女，工程師，主要從事智能座艙域控制器平臺、網(wǎng)聯(lián)IVI及配套零部件的開發(fā)工作，負責娛樂系統(tǒng)的功能定義和開發(fā)，包括電源管理、功放系統(tǒng)、語音生態(tài)系統(tǒng)等，負責與智能駕駛領域相關功能的交互和測試，推動自動泊車/記憶泊車以及高精度定位導航等智能駕駛相關功能按時完成開發(fā)工作。

伴隨著科技的發(fā)展和進步，汽車的功能也越來越多，用戶如今越來越關注環(huán)保健康、智能交互以及智能服務。而智能交互離不開語音識別功能。隨著解決多領域、多用戶、多場景下識別效果差、反應速度慢、系統(tǒng)構(gòu)建時間長等技術問題的解決，顯著提升了語音識別效果和識別精度，充分發(fā)揮了麥克風的性能，讓語音識別精度達到設計要求。

1 語音識別的原理

語音識別技術的工作原理可以分為3個主要步驟：語音信號處理、特征提取和識別輸出。其中，語音信號處理主要由麥克風拾音完成，涵蓋了發(fā)出的語音指令和環(huán)境噪聲等；聲學信號預處理的重點在于降噪濾波，以獲取有效的聲學特征。作為語音識別的前提與基礎，語音信號的預處理過程至關重要。在最終進行模板匹配時，會將輸入語音信號的特征參數(shù)與模板庫中的特征參數(shù)進行對比，所以，唯有在預處理階段獲取到能夠體現(xiàn)語音信號本質(zhì)特征的特征參數(shù)（如降噪濾波），才能對這些特征參數(shù)予以匹配，從而實現(xiàn)識別率高的語音識別?；诼晫W預處理后所獲得的語音波形，通過搭建一系列的算法函數(shù)模型算法，實現(xiàn)最終的語音識別。語音識別工作原理如圖1所示。

1.1 降噪濾波原理

降噪濾波的原理是消除麥克風拾音里的噪聲（環(huán)境底噪N、風噪W、揚聲器發(fā)出的聲音S）并保留有效語音P（人發(fā)出的語音指令）。一般情況下，環(huán)境底噪N、風噪W、揚聲器S均可通過建立適當?shù)臄?shù)學函數(shù)模型，在算法里把需要消除的音頻信號與其自身的反信號混合，從而實現(xiàn)對該音頻信號的消除，即P=M-f（N）-f（W）-f（S），其中M為麥克風接收到的聲音。降噪濾波原理圖如圖2所示。

1.2 麥克風

麥克風，又名傳聲器，用于拾取和傳送聲音，能夠?qū)⒙曇粜盘栟D(zhuǎn)換為電信號。作為語音識別的第一輸入端，麥克風識別的聲音品質(zhì)與語音識別的準確率緊密相關，在實際開發(fā)過程中，會通過調(diào)整麥克風參數(shù)，以達到一個較好的狀態(tài)，從而提升語音識別率。表1為某SUV選擇的典型麥克風參數(shù)。

2 問題描述

某SUV車型在研發(fā)過程中，綜合測試語音識別性能進行驗收時發(fā)現(xiàn)，在用戶常見場景下（0～76dB），嚴格按照設計的標準執(zhí)行，主要測試AEC、喚醒率、識別率、全局/運用免喚醒識別率、誤喚醒及全雙工交互等，結(jié)果全部通過。然而，在強噪聲89dB左右時，語音識別出現(xiàn)了較高概率的語音喚醒不了或語音指令不執(zhí)行等情況，綜合評估語音識別率低于達標線（90%），在音樂聲音24級時，車內(nèi)背景聲音為89dB，AEC（回聲消除）的成功率僅有60%。其導致的后果是，在高分貝狀態(tài)下，存在無法喚醒語音識別、喚醒后無法正確識別等問題。表2為某車型的測試結(jié)果，其測試場景為：車機播放音樂，對應語音音量（TTS）減小5dB。車窗關閉，空調(diào)中擋，根據(jù)分析分貝值設置對應音量。

經(jīng)過一系列的排查分析，在某一頻段（頻率點260Hz）附近時，門內(nèi)鈑金與揚聲器發(fā)生共振失真，共振失真產(chǎn)生的一連串諧波干擾，由于降噪模塊無法完全除噪，致使輸出給娛樂系統(tǒng)主機端的語音波形嚴重失真，從而造成語音識別功能障礙。進一步展開分析，測試頻率響應、輸出飽和度、AEC性能、語音品質(zhì)、信道噪聲、一致性以及左右麥克風差異等參數(shù)。通過對經(jīng)過實測得到的數(shù)據(jù)進行分析，發(fā)現(xiàn)左右麥克風語音品質(zhì)、信道噪聲、AEC性能等參數(shù)未達標。

2.1 語音品質(zhì)

滿分4.5分，分值越高，意味著品質(zhì)越佳。從測試結(jié)果看，左右麥克風語音品質(zhì)均未達到設計值。分析可能引起語音品質(zhì)差的原因：①信噪比低，底噪大，需要檢查車機系統(tǒng)電路噪聲及環(huán)境是否安靜；②信號丟包，需要保證將SPI速率設置為大于6Mb/s；③ASR點語音品質(zhì)與LOUT點輸出的差別大于0.1分，檢查LOUT到ASR點語音信號變化的原因，例如增益或者失真等。調(diào)整前語音品質(zhì)測試結(jié)果見表3。

2.2 信道噪聲

對MIC信號、LOUT和ASR節(jié)點底噪信號的平均功率值進行了計算。對于底噪過大這一情況，分析可能引起語音品質(zhì)差的原因為：檢查測試環(huán)境是否安靜，關閉聲源（空調(diào)、發(fā)動機、喇叭播放電流聲）；電路噪聲，需定位根源。調(diào)整前信道噪聲測試結(jié)果見表4。

2.3 AEC性能

線性消TTS回聲性能，正常音量，增大6dB，增大10dB音量。測試發(fā)現(xiàn)僅增大10dB未達標。分析可能引起語音品質(zhì)差的原因：喇叭本身失真或PA放大時使推出的信號矢量失真；MIC氣密性不良，腔體有泄露；回聲信號過大，測試結(jié)果見表5。

3 優(yōu)化驗證方案及驗證結(jié)果

3.1 優(yōu)化方案

MIC內(nèi)部設計可被視作一個可變的阻抗元器件，其一端固定，另一端可動。在MIC輸出端，可理解為會隨著外界音源輸入變化而變化的電信號。例如，當R3阻值增大時，輸入電流減小，MIC錄音輸出電平也隨之減小。在處理MIC輸出的電信號時，它可能會被當作噪聲或者無效輸入而不被處理，即靈敏度比較低，對于較小的聲音輸入，就無法獲取。反之，當R3阻值減小時，輸入電流增大，MIC錄音輸出電平也增大，靈敏度便提高了，對較小的聲音輸入也能拾取。根據(jù)經(jīng)驗設計，在硬件設計時，需要綜合考慮噪聲和靈敏度，我們通常采用的阻值參數(shù)在1～50Ω之間。

經(jīng)過多輪測試以及對麥克風參數(shù)的調(diào)整后，對其優(yōu)化效果予以驗證，測試方法與前面所述的測試方法相同，得到的測試數(shù)據(jù)如下：將電路原理圖中R3電阻的阻值由10Ω變?yōu)?7Ω，麥克風電路原理圖如圖3所示。

3.2 測試結(jié)果

在對麥克風調(diào)整R3阻值后，頻響曲線無明顯變化（曲線平滑，滿足設計要求），靈敏度有所降低，約-12dB（設計要求為-13～-7dB），失真度降低至約1.2%，信噪比無明顯變化，實測值約65dB，工作電流也無明顯變化，參數(shù)調(diào)整后失真度更低，參數(shù)處于已量產(chǎn)車型要求的范圍內(nèi)。調(diào)整前后參數(shù)對比見表6，參數(shù)調(diào)整前后的頻率響應如圖4所示。

調(diào)整參數(shù)后，測試左右麥克風語音品質(zhì)、信道噪聲、AEC性能等參數(shù)，從測量參數(shù)結(jié)果可知，性能已達標，詳見表7～表11。

4 結(jié)束語

影響語音識別的因素眾多，在語音性能測試驗收階段，此時已處于車型開發(fā)的后期，此階段結(jié)構(gòu)件基本處于凍結(jié)狀態(tài)，難以優(yōu)化和調(diào)整，或者說調(diào)整周期較長、代價較大，難以滿足優(yōu)化周期。文中提出通過電路優(yōu)化，并進行參數(shù)測量及驗收測試，使關鍵參數(shù)滿足設計要求，這樣既節(jié)約了優(yōu)化成本，縮短了優(yōu)化周期，又讓語音識別有了顯著的提升。

參考文獻：

[1] 張雪英. 數(shù)字語音處理及MATLAB仿真（第二版）[M]. 北京：電子工業(yè)出版社，2016.

[2] 崔勝民. 智能網(wǎng)聯(lián)汽車新技術[M]. 北京：化學工業(yè)出版社，2021.

[3] [加]Jacob Benesty，Jingdong Chen，Yiteng Huang. 麥克風陣列信號處理[M]. 鄒霞，周彬，賈沖，譯. 北京：國防工業(yè)出版社，2016.

[4] 洪青陽，李琳. 語音識別原理與應用[M]. 北京：電子工業(yè)出版社，2020.

[5] 陳光夢. 高頻電路基礎（第二版）[M]. 上海：復旦大學出版社，2016.

[6] [加]Simon Haykin. 自適應濾波器原理（第五版）[M]. 鄭寶玉，譯. 北京：電子工業(yè)出版社，2016.

（編輯凌波）

汽車電器2024年10期

汽車電器的其它文章: 儀表顯示雙閃異常處理方案; 某皮卡車型安全氣囊起爆故障分析; 燃料電池汽車絕緣故障排查; 新能源汽車交流充電的控制邏輯和故障檢修方法; 電動攪拌車無法啟動故障診斷與分析; 比亞迪e2純電動汽車直流充電無法充電故障檢測

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

提高車載語音識別的分析和優(yōu)化方法