■ 王曉東 王惠生 謝保鋒
自有通信技術(shù)開始,特別是移動(dòng)通信的發(fā)展,語音信息傳輸一直具有舉足輕重的地位。隨著移動(dòng)網(wǎng)絡(luò)發(fā)展的日趨成熟,客戶對(duì)網(wǎng)絡(luò)的性能質(zhì)量要求逐漸提高。因此,為了更好地定量分析和測(cè)量網(wǎng)絡(luò)的語音服務(wù)質(zhì)量,要根據(jù)電信網(wǎng)絡(luò)服務(wù)質(zhì)量(QoS)的要求,建立一套客觀評(píng)估標(biāo)準(zhǔn)。
語音質(zhì)量評(píng)價(jià)從主體上可分為主觀評(píng)價(jià)和客觀評(píng)價(jià)兩大類。主觀評(píng)價(jià)以人為主體,在某種預(yù)設(shè)原則基礎(chǔ)上對(duì)語音質(zhì)量作出主觀的等級(jí)意見或比較結(jié)果,反映聽評(píng)者對(duì)語音質(zhì)量好壞的主觀印象,常見的主觀評(píng)價(jià)方法有平均意見分方法、判斷韻字測(cè)試方法、失真平均意見分方法、判斷滿意度測(cè)試方法和漢語清晰度測(cè)試方法??陀^評(píng)價(jià)方法是為了彌補(bǔ)主觀評(píng)價(jià)的缺陷、適應(yīng)技術(shù)發(fā)展及運(yùn)營(yíng)服務(wù)的要求,是指用機(jī)器自動(dòng)判斷語音質(zhì)量?;谳斎?輸出的客觀評(píng)價(jià)比較輸出和輸入語音之間的差異(失真)程度,將差異量值作為語音質(zhì)量的衡量依據(jù)。在應(yīng)用中,輸入語音稱為參考語音,通過系統(tǒng)的輸出語音稱為失真語音??陀^評(píng)價(jià)方法具有不受人為主觀因素影響、成本低廉、靈活性好、效率高,具有可重復(fù)性且可實(shí)時(shí)使用等優(yōu)點(diǎn)。
為了評(píng)價(jià)語音的清晰度,ITU-TP.800和P.830定義了MOS(Mean Opinion Score)的主觀測(cè)試方法:具體實(shí)現(xiàn)方法和評(píng)判標(biāo)準(zhǔn)在ITU-TP.800有相應(yīng)規(guī)定,在ITU P.830中提供了更詳細(xì)的操作方法。由不同的人(不同性別、年齡、階層)分別對(duì)原始語音和經(jīng)過系統(tǒng)處理后有衰退的語音材料進(jìn)行主觀感覺對(duì)比,得出MOS分(見表1)。
ITU組織在2001年2月發(fā)布了新的語音傳輸質(zhì)量測(cè)量標(biāo)準(zhǔn):P.862 — PESQ(Perceptual Evaluation of Speech Quality)。PESQ是評(píng)價(jià)各類端對(duì)端網(wǎng)絡(luò)條件和語音編碼與解碼的最新標(biāo)準(zhǔn)。PESQ可以根據(jù)一些感知標(biāo)準(zhǔn)客觀評(píng)價(jià)語音信號(hào)質(zhì)量,從而提供可以完全量化的語音質(zhì)量衡量方法,這些衡量標(biāo)準(zhǔn)又與人類對(duì)語音質(zhì)量的感受完全吻合(見圖1)。
表1 MOS值對(duì)應(yīng)的語音性能
通過PESQ算法可以客觀地評(píng)價(jià)語音質(zhì)量,以此為基礎(chǔ),構(gòu)建語音質(zhì)量測(cè)試系統(tǒng),系統(tǒng)測(cè)試界面見圖2。語音質(zhì)量測(cè)試中,主叫模塊撥通被叫模塊后,通過語音盒播放計(jì)算機(jī)中的標(biāo)準(zhǔn)語音文件,再通過語音盒將錄制文件返回給計(jì)算機(jī)。測(cè)試軟件根據(jù)PESQ算法對(duì)原始語音和錄制語音進(jìn)行比較計(jì)算,得出MOS值。測(cè)試界面中可以看到接收和發(fā)送的語音波形、失真值、衰減值等參數(shù)。為了分析,所有原始語音信息和其他行車信息都進(jìn)行記錄。
高速鐵路GSM-R移動(dòng)通信系統(tǒng)與公共移動(dòng)通信網(wǎng)絡(luò)的應(yīng)用特性相差很大,因此語音評(píng)價(jià)標(biāo)準(zhǔn)不能完全適用鐵路。根據(jù)高速鐵路應(yīng)用特點(diǎn),對(duì)不同速度等級(jí)的數(shù)據(jù),采用相關(guān)性分析方法,確定影響語音質(zhì)量MOS的主要因素。
可能對(duì)MOS值產(chǎn)生影響的每個(gè)參數(shù)都計(jì)算相關(guān)系數(shù)并求出其于MOS一一對(duì)應(yīng)的值,然后可以將其以散點(diǎn)的形式做圖并分析其分布規(guī)律。
在采集大量測(cè)試數(shù)據(jù)的基礎(chǔ)上,通過分析已繪散點(diǎn)圖(見圖3),嘗試尋找參數(shù)與MOS的回歸模型,選擇合適的擬合模型,計(jì)算估計(jì)回歸系數(shù),畫出擬合后的回歸曲線,從而試證明參數(shù)與MOS值的關(guān)系。單參數(shù)擬合曲線見圖4。
為了更好地分析預(yù)測(cè)數(shù)據(jù)及其分布趨勢(shì),尋找合適的數(shù)學(xué)模型,對(duì)經(jīng)過處理的數(shù)據(jù)進(jìn)行曲線擬合。經(jīng)過初步分析原始數(shù)據(jù),擬采用最小二乘法實(shí)現(xiàn)對(duì)測(cè)試數(shù)據(jù)的曲線擬合。
制定語音分析測(cè)試方案,通過對(duì)比不同線路或不同速度等級(jí)下測(cè)得的數(shù)據(jù),分析速度等因素對(duì)MOS值的影響。在同一線路,不同速度等級(jí)下測(cè)試得到參數(shù)值的變化趨勢(shì),MOS值的上下浮動(dòng);對(duì)不同線路,在相同運(yùn)行速度下同樣比較參數(shù)和MOS值的變化。通過對(duì)比能夠確定或排除某些參數(shù)在特定條件下和語音質(zhì)量的關(guān)系及其對(duì)MOS影響的大小。
根據(jù)已知信息,頻偏變化越大對(duì)無線質(zhì)量的影響越大,因此,當(dāng)列車高速通過基站,經(jīng)過與基站垂直距離最近點(diǎn)時(shí),頻偏變化最大,多普勒效應(yīng)最顯著(見圖5)。
圖1 PESQ評(píng)估算法框圖
圖2 GSM-R系統(tǒng)語音測(cè)試界面
圖3 ReQual、FER與MOS的分布
圖4 單參數(shù)擬合曲線
圖5 多普勒效應(yīng)
由里程信息得到此位置所測(cè)的實(shí)際參數(shù)數(shù)據(jù),通過求其均值或范數(shù),與區(qū)間覆蓋中心點(diǎn)所測(cè)數(shù)據(jù)進(jìn)行比較,從而判斷多普勒頻移的影響。如圖6所示,分別測(cè)得x1、x2、…、xi、xi+1時(shí)各參數(shù)值,將頻率鎖定在基站A、B、C等時(shí)測(cè)得的y1、y2、…、yi、yi+1各參數(shù)值進(jìn)行比較,得出多普勒頻移在高速情況下對(duì)通信的影響。
移動(dòng)通信系統(tǒng)引入小區(qū)切換方式保持通話狀態(tài)下的語音連續(xù)性,切換時(shí)信令消息需要以FACCH偷幀方式在TCH上傳送。由于擠占了TCH信道,對(duì)語音質(zhì)量有所影響。MOS下降幅度與完成切換的時(shí)間有關(guān),過程越長(zhǎng),MOS值下降越大。
通過以上對(duì)語音檢測(cè)數(shù)據(jù)的分析,一次MOS值的計(jì)算時(shí)間(≈12 s)中存在切換會(huì)導(dǎo)致語音質(zhì)量急劇惡化,MOS值平均降低0.5左右,且速度越高,MOS值下降越快。如圖7所示,速度小于200 km/h的線路切換導(dǎo)致MOS值下降小于7%,速度為200 km/h的線路切換導(dǎo)致MOS值下降占10%左右,而列車速度在350~380 km/h之間切換導(dǎo)致MOS值下降的比率增長(zhǎng)到20%左右。可見,在速度影響下,切換對(duì)語音質(zhì)量的影響急速增大。
圖6 測(cè)試多普勒效應(yīng)方法
圖7 切換導(dǎo)致MOS下降
通過對(duì)不同運(yùn)行速度的高速鐵路GSM-R系統(tǒng)語音MOS值的測(cè)試和分析,可知運(yùn)行速度對(duì)MOS值的影響較大,主要是切換中斷對(duì)語音計(jì)算的影響。因此,評(píng)價(jià)線路GSM-R語音的MOS值還要與檢測(cè)的載體速度相關(guān)聯(lián),高速運(yùn)行測(cè)試MOS值比低速運(yùn)行測(cè)試時(shí)的MOS值低。對(duì)語音質(zhì)量的研究還需采集大量的測(cè)試數(shù)據(jù),通過對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析,研究高速鐵路語音質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)。