高保真IP指揮調(diào)度系統(tǒng)關(guān)鍵技術(shù)應(yīng)用

2021-07-26 04:34:11牛曉華袁素華

計算機與網(wǎng)絡(luò) 2021年10期

牛曉華袁素華

關(guān)鍵詞：高保真;指揮調(diào)度系統(tǒng);關(guān)鍵技術(shù)

0 引言

指揮調(diào)度系統(tǒng)[1]是實現(xiàn)組織指揮、協(xié)同會商及信息溝通的專用特種通信系統(tǒng)，目前已經(jīng)廣泛應(yīng)用在交通、電力、消防及應(yīng)急救險等多個行業(yè)和領(lǐng)域，主要用于保障各相關(guān)單位及人員迅速、準確、不間斷地指揮調(diào)度、業(yè)務(wù)協(xié)調(diào)及協(xié)同通信，確保任務(wù)組織實施全過程中各項指令和各項工作按計劃按步驟、按流程順利實施，確保各級組織實施指揮調(diào)度順暢高效。

高保真IP 指揮調(diào)度系統(tǒng)是在繼承傳統(tǒng)話音指揮調(diào)度系統(tǒng)的體系架構(gòu)和業(yè)務(wù)應(yīng)用模式的基礎(chǔ)上，為更好地提升調(diào)度話音業(yè)務(wù)質(zhì)量，滿足未來指揮調(diào)度業(yè)務(wù)需求而研制的新一代話音指揮調(diào)度系統(tǒng)，以群為基本使用單位，以通播揚聲為基本調(diào)度功能，通過群與群之間的級連，實現(xiàn)上級用戶對下級用戶基于主叫控制方式的點到多點的通播和會議模式。

1 系統(tǒng)組成

高保真IP 指揮調(diào)度系統(tǒng)由調(diào)度主機、操作維護控制臺和調(diào)度單機組成[2]，系統(tǒng)組成如圖1 所示。

調(diào)度主機是高保真IP 指揮調(diào)度系統(tǒng)的核心設(shè)備，由公共控制模塊和業(yè)務(wù)模塊組成，2 個模塊以功能板卡的形態(tài)插入調(diào)度主機，其中公共控制模塊內(nèi)集成了會議控制、時隙交換、網(wǎng)絡(luò)交換及會議混音功能，并通過冗余控制模塊實現(xiàn)主、備公共控制模塊的冗余熱備份切換;業(yè)務(wù)模塊包含實現(xiàn)系統(tǒng)業(yè)務(wù)功能的各種板卡，主要實現(xiàn)調(diào)度單機等終端設(shè)備的接入、用戶發(fā)話電平信號采集及分發(fā)、多個調(diào)度群之間的級聯(lián)和多個主機間的中繼通道互聯(lián)互通等。

操作維護控制臺為用戶提供可視化的人機交互界面，用戶通過操作維護控制臺提供的系統(tǒng)操作界面，將各種調(diào)度指令發(fā)送給調(diào)度主機，調(diào)度主機執(zhí)行相應(yīng)的指令，對調(diào)度單機等終端設(shè)備進行各項調(diào)度功能及話音控制，并將終端設(shè)備的當前狀態(tài)返回給操作維護控制臺進行反饋和集中顯示。

調(diào)度單機作為用戶終端設(shè)備直接面向用戶使用，一方面采集模擬話音信號，經(jīng)過音頻編碼算法轉(zhuǎn)換為IP 話音包，通過IP 網(wǎng)絡(luò)發(fā)送至調(diào)度主機。調(diào)度主機對音頻解碼后，送入公共控制模塊混音，并將混音后的音頻流經(jīng)過用戶接入模塊編碼，轉(zhuǎn)換成IP 話音包發(fā)送至接收方調(diào)度單機，接收方調(diào)度單機將從網(wǎng)絡(luò)上收到的音頻解碼后揚聲播放，實現(xiàn)發(fā)送方和接收方之間的話音交互。

2 關(guān)鍵技術(shù)

與傳統(tǒng)音頻指揮調(diào)度系統(tǒng)相比，高保真IP 指揮調(diào)度系統(tǒng)在業(yè)務(wù)功能和性能優(yōu)化的基礎(chǔ)上，重點對話音采集、傳輸、混音、播放等音頻處理環(huán)節(jié)進行了性能提升和優(yōu)化[3]，其中涉及到的關(guān)鍵技術(shù)主要有國產(chǎn)自主可控技術(shù)、高保真話音編碼及大容量會議混音技術(shù)、AEC 回聲消除技術(shù)和多級降噪技術(shù)[4]等。

2.1 國產(chǎn)自主可控技術(shù)

國產(chǎn)自主可控是新一代高保真IP 指揮調(diào)度系統(tǒng)研制建設(shè)的基本要求，高保真IP 指揮調(diào)度系統(tǒng)的國產(chǎn)自主可控技術(shù)涉及硬件和軟件2 個方面。

（1）硬件自主可控

高保真IP 指揮調(diào)度系統(tǒng)調(diào)度主機、操作維護控制臺和調(diào)度單機等硬件設(shè)備全部自主研發(fā)設(shè)計和實現(xiàn)，其中調(diào)度主機的公共控制模塊及業(yè)務(wù)功能模塊采用自主可控的機框堆疊插卡結(jié)構(gòu)設(shè)計實現(xiàn)，由一個公共控制機框和3 個擴展機框組成，公共控制機框與擴展機框采用插槽設(shè)計，結(jié)構(gòu)設(shè)計完全一致，公共控制機框插槽可插入公共控制模塊板卡及業(yè)務(wù)功能模塊板卡，而擴展機框插槽可擴展插入業(yè)務(wù)功能模塊板卡，業(yè)務(wù)功能模塊板卡可根據(jù)不同的業(yè)務(wù)需求設(shè)計成不同的硬件板卡，但板卡與機框之間的硬件接口一致，可插入機框的任一槽位使用，方便用戶根據(jù)實際業(yè)務(wù)需求靈活配置相應(yīng)的功能板卡。此外，高保真IP 指揮調(diào)度系統(tǒng)硬件設(shè)備涉及的CPU，DSP，CODEC 等核心元器件在器件選型時首選國產(chǎn)元器件實現(xiàn)國產(chǎn)化，其硬件原理及PCB 設(shè)計時，將CPU 模塊、音頻處理模塊、按鍵模塊等功能獨立的模塊做成可插拔子板，便于在設(shè)備上靈活安裝使用。

（2）軟件自主可控

高保真IP 指揮調(diào)度系統(tǒng)軟件設(shè)計和開發(fā)研制采用自主可控的分層設(shè)計思想，軟件架構(gòu)主要分為操作系統(tǒng)層、設(shè)備驅(qū)動層、核心業(yè)務(wù)層及人機交互層，如圖2 所示。層與層之間采用消息傳遞機制，減少層與層之間的代碼耦合度，提高代碼的復(fù)用性，確保軟件的穩(wěn)定可靠。調(diào)度主機及操作維護控制臺等終端軟件全部自主開發(fā)研制，整個系統(tǒng)的業(yè)務(wù)應(yīng)用軟件基于國產(chǎn)麒麟操作系統(tǒng)運行，使系統(tǒng)的安全性和可控性進一步提高。

2.2 高保真話音編解碼及大容量會議混音技術(shù)

傳統(tǒng)話音編解碼的話音頻率范圍為300～3 400 Hz[5]，而高保真的話音頻率范圍為50 Hz～7 kHz，為適應(yīng)不同傳輸帶寬的要求，高保真IP指揮調(diào)度系統(tǒng)選用了2 種寬頻話音編碼算法，分別是非壓縮的256 kbps 線性PCM 編碼和壓縮的G.722 編碼。這2種算法均采用了16 kbps的采樣頻率，以及16位量化標準，其中256 kbps 線性PCM 編碼的數(shù)據(jù)帶寬為256 kbps，G.722壓縮編碼的數(shù)據(jù)帶寬為64 kbps。為實現(xiàn)高保真話音編解碼，外圍終端選用支持16 kbps 采樣16 bit 分辨率的CODEC 器件，調(diào)度主機的公共控制模塊將一個2.048 MHz 時鐘細分成32 時隙，每個時隙8 位的時隙顆粒，通過時隙綁定方式實現(xiàn)寬頻話音編解碼。

大容量會議混音處理技術(shù)的關(guān)鍵因素在于混音算法，傳統(tǒng)的混音算法如平均混音、對齊混音、箝位混音等，通常僅能實現(xiàn)小容量（≤6 方）會議混音，當會議方數(shù)超過6 時，隨著混音路數(shù)的增加，將會出現(xiàn)噪聲累加、音量突變等問題，嚴重影響音頻質(zhì)量，無法滿足音頻指揮調(diào)度業(yè)務(wù)使用要求。通過對傳統(tǒng)會議混音算法進行研究分析后，發(fā)現(xiàn)造成會議混音噪聲累加、音量突變的主要原因是混音權(quán)重因子不恒定，因此研究提出適合高保真IP 指揮調(diào)度系統(tǒng)的大容量會議混音算法，實現(xiàn)原理如下：

① 確定與混音方數(shù)無關(guān)的恒定權(quán)重因子：在音頻通信中，基于中低強度信號相比于高強度信號出現(xiàn)的機率更高的事實，大容量混音算法采取與混音方數(shù)量無關(guān)的恒定混音權(quán)重因子，從而使會議混音后的話音更加自然流暢、無噪聲，具有良好的主觀聽覺感受。

② 基本收縮因子取值范圍調(diào)整估計：采用新的會議混音算法后，通話音量雖略微減小，但通過調(diào)整基本收縮因子取值范圍后不影響聲音的識別，特別是在多方（>6 方時）會議混音后，仍然能保證優(yōu)良的話音質(zhì)量，有效避免了會議混音后噪聲累加、音量突變的問題。

大容量會議混音算法的實現(xiàn)流程如圖3 所示，首先對進入混音的音頻信號進行求和、取絕對值等一系列運算后，得到恒定混音權(quán)重因子，實現(xiàn)量化精度限幅，解決混音后音量突變（忽大、忽?。﹩栴}。同時，通過右移、強度限制運算，查表獲取當前音頻信號的收縮因子，解決混音時音頻信號溢出導(dǎo)致的失真問題。

2.3 AEC 回聲消除技術(shù)

在大容量音頻會議系統(tǒng)中，回聲是最常見，也是較難處理的問題。終端話音通過終端自帶的揚聲器播放后，經(jīng)空氣傳播、建筑物及家具等室內(nèi)裝飾物反射，形成多徑效應(yīng)，并經(jīng)終端自帶麥克風(fēng)再次進入系統(tǒng)，該話音經(jīng)過多方混音疊加后，容易導(dǎo)致多方會議話音雜亂無章，甚者產(chǎn)生嘯叫。因此，需要在調(diào)度主機、調(diào)度單機上對進入會議混音的話音進行回聲消除處理。AEC 回聲消除實現(xiàn)原理如圖4所示。

下行鏈路延時矩陣（DL Delay Matrix）、上行鏈路延時矩陣（UL Delay Matrix）屬于算法輸出延時矩陣，用于緩沖輸出信號的頻域數(shù)據(jù)，并作為回聲數(shù)據(jù)樣本，緩沖長度決定了可處理的回聲延時時長，緩沖越大可識別的回聲延時更長，運算量也更大。

x（）和y（）為兩端話音時域輸入信號，在經(jīng)過高通濾波器和分析濾波器（AFB）處理后得到多子帶頻域信號。此時，輸入信號可與延時矩陣Delay Matrix 中的回聲樣本信號進行回聲消除處理。AEC回聲消除算法的處理過程如下：

①延時矩陣話音信號經(jīng)過自適應(yīng)濾波器濾波后得到估計的回聲信號;

②輸入信號與回聲信號作差處理，得到去除回聲的輸出信號;

③計算估計回聲與實際回聲的誤差，更新自適應(yīng)濾波器;

④把輸出信號存入DelayMatrix緩沖，用于參與下一次回聲消除運算;

⑤經(jīng)過回聲消除的輸出信號，通過綜合濾波器（SFB）把多子帶頻域信號還原為時域信號并輸出，完成一幀話音處理。

上述AEC 回聲消除技術(shù)在應(yīng)用時采用專用DSP 芯片實現(xiàn)，具有功耗低、回聲收斂速度快、音質(zhì)損失小的特點，能有效解決回聲及嘯叫問題。

2.4 多級降噪技術(shù)

環(huán)境背景噪聲是干擾指揮調(diào)度系統(tǒng)音頻音質(zhì)的另一主要問題，由于環(huán)境背景噪聲與應(yīng)用場景密切相關(guān)，噪聲音頻特性多變，采用傳統(tǒng)的音頻降噪處理技術(shù)很難解決環(huán)境背景噪聲的問題。通過對傳統(tǒng)噪聲消除算法及噪聲消除的音頻特性進行分析，高保真IP 指揮調(diào)度系統(tǒng)采用了基于改進型自適應(yīng)濾波器設(shè)計出的噪聲抑制綜合處理系統(tǒng)，在調(diào)度主機- 用戶接入模塊- 調(diào)度終端的關(guān)鍵點嵌入相應(yīng)的抑制算法模塊，有效抑制環(huán)境背景噪聲、會議混音疊加噪聲等各種干擾噪聲，提升高保真IP 指揮調(diào)度系統(tǒng)通話的清晰度和舒適度。

由DSP 數(shù)字信號處理器實現(xiàn)控制PGA的快速AGC算法和上/下行DSP 音頻綜合處理的相關(guān)算法的主要功能如下：

① 自動增益控制（AGC）：消除拾音數(shù)字輸出對聲源與麥克風(fēng)間相對距離的依賴性。

②下行鏈路解封裝模塊：將接收到的數(shù)據(jù)包通過解封裝轉(zhuǎn)化為線性PCM碼流。

③ 上/ 下行鏈路分析濾波器組（AFB）/ 合成濾波器組（SFB）：AFB 和SFB 構(gòu)成一種時域與子帶域（頻域）間濾波器組變換對。AFB將信號從時域變換到子帶域，而SFB 則將信號從子帶域變換到時域。

④ 下行鏈路噪聲抑制器（DNS）：由AFB、下行核心DNS和SFB 組成的下行DNS用于環(huán)境噪聲抑制。

⑤ 下行鏈路參考信號獲?。航?jīng)A_clip 、AFB 、下行核心DNS 和預(yù)加重處理而獲得的信號，用作上行聲學(xué)回聲抵消器（AEC）的參考源。

⑥ 上行鏈路LMS 校正預(yù)處理：用于校正麥克風(fēng)，以實現(xiàn)其幅值及相位上的匹配。

⑦ AEC：由線性回聲抵消器（EC）和殘留回聲抑制器（RES）構(gòu)成的AEC，用以在子帶域中消除本地揚聲器輸出自聲學(xué)路徑饋入麥克風(fēng)的回聲。

⑧ 上行鏈路噪聲抑制器（DNS-SNS Combo）：由上行鏈路核心DNS、核心SNS 和噪聲抑制增益組合器構(gòu)成的DNS-SNSCombo模塊，用來抑制運行環(huán)境中平穩(wěn)和非平穩(wěn)噪聲，以改善發(fā)送話音音質(zhì)。

⑨ 上行鏈路舒適噪聲產(chǎn)生器（CNG）：屏蔽在背景噪聲中因殘留回聲抑制器模塊和上行鏈路噪聲抑制器模塊處理所致而不利于話音聽覺的人工品成分。

⑩狀態(tài)機模塊：用于估計會議系統(tǒng)的通話狀態(tài)和回波路徑是否發(fā)生變化，這些狀態(tài)將用于AEC、DNS 和CNG 處理模塊的有關(guān)控制。

上行鏈路移相模塊：用來對待發(fā)送話音信號進行隨機移相，以避免系統(tǒng)發(fā)生嘯叫。

上行鏈路音頻均衡器（AEQ）：對擬發(fā)送的話音信號的頻譜增益進行補償，以消除經(jīng)AEC 和DNS-SNS Combo 處理

所致的信號增益整體衰落，同時根據(jù)預(yù)設(shè)參數(shù)集（Presets）來調(diào)整頻響曲線，以適應(yīng)與會者的聽覺偏好。

上行鏈路封裝模塊：將上行鏈路擬發(fā)送信號，經(jīng)封裝模塊處理后形成適合于特定網(wǎng)路傳輸?shù)臄?shù)據(jù)包。

多級降噪技術(shù)的關(guān)鍵點在于降噪點選擇及自適應(yīng)濾波的設(shè)計，自適應(yīng)濾波器能否準確、快速地識別噪聲信號和正常信號，分離出正常信號發(fā)送給接收方。通過噪聲抑制綜合處理系統(tǒng)的運用，能有效解決較強背景噪聲下講話無法聽清問題，提高系統(tǒng)在強干擾環(huán)境背景噪聲下的通話效果。

3測試驗證

為測試高保真IP 指揮調(diào)度系統(tǒng)的技術(shù)指標[6]，搭建如圖5所示的測試環(huán)境，通過操作維護控制臺控制系統(tǒng)中的高保真IP 調(diào)度單機等終端設(shè)備，實現(xiàn)分群、分組、通播、會議、越級、屏蔽、分隔、專向等指揮調(diào)度功能。

測試表明，新一代高保真IP 指揮調(diào)度系統(tǒng)用戶接入能力可達512門，分群、分組參數(shù)設(shè)置正常，群間級聯(lián)和廣域中繼級聯(lián)功能正常;在通播和會議2 種模式下，越級、屏蔽、分隔、強拆、強插、單呼、點名、錄音、回放等各項調(diào)度功能正常;多群多用戶通播和會議模式下話音音色飽滿、音質(zhì)清晰可懂，話音質(zhì)量MOS評分可達4.8分;此外，調(diào)度單機之間的端到端話音延時小于200 ms，調(diào)度單機掉線恢復(fù)時間小于20 s;系統(tǒng)平均無故障時間大于3 500 h，維修時間（MTTR）小于0.5 h。

4結(jié)束語

新一代高保真IP 指揮調(diào)度系統(tǒng)在將話音采樣和編碼從8 kbps×8 bit提升到16 kbps×16 bit的同時，通過采用寬頻話音編碼技術(shù)、大容量會議混音技術(shù)、AEC 回聲消除技術(shù)和多級降噪技術(shù)等關(guān)鍵技術(shù)，使得調(diào)度話音音色飽滿、音質(zhì)出色、保真度高、還原度好，音質(zhì)效果在原來口令清晰的基礎(chǔ)上達到了人員可辨，進一步提升了指揮調(diào)度系統(tǒng)話音業(yè)務(wù)質(zhì)量和用戶體驗;此外，系統(tǒng)基于國產(chǎn)自主可控技術(shù)實現(xiàn)，在改善用戶體驗的同時，進一步確保了系統(tǒng)的安全性和可控性，有效滿足了工程研制要求和用戶使用要求，開啟了指揮調(diào)度系統(tǒng)應(yīng)用領(lǐng)域的新篇章。