莫福源
4.1.3掩蔽曲線測量方法 掩蔽曲線都是通過測聽實驗得到,是在有無掩蔽音的情況下,測量能聽到聲音的極限,掩蔽曲線和掩蔽音及被掩蔽音的性質(zhì)有關(guān)。圖13是典型的掩蔽曲線,下面的鋸齒狀曲線是沒有掩蔽音時的聽覺域值,上面的鋸齒形曲線是存在掩蔽音時的聽覺域值;其掩蔽音是1 000 Hz、聲壓級60 dB的純音,當被掩蔽音也為1 000 Hz純音時最大聽覺域值約比掩蔽音低15 dB,隨著頻率偏離掩蔽音頻率,掩蔽效果迅速下降,低頻下降速度比高頻快[3]。
圖13 實測的掩蔽曲線
4.1.3.1窄帶噪聲掩蔽純音 圖14是一個純音被窄帶噪聲掩蔽的測量曲線,窄帶噪聲中心頻率分別為250、1 000和4 000 Hz,帶寬分別為100、160和700 Hz,圖上部水平虛線為掩蔽噪聲聲強級60 dB,中部實線表示剛好可聽到的純音聲級,下部的虛線是聽覺安靜域值。從圖中可以看出,被掩蔽純音的頻率偏離掩蔽噪聲中心頻率越大掩蔽效應下降越快;因為是平滑以后的數(shù)據(jù),故而不呈鋸齒狀。信號分量和掩蔽域值之間的聲級差,稱信號掩蔽比(signal to mask ratio,SMR),SMR越大,掩蔽效果越小。圖14中,250、1 000和4 000 Hz的最小SMR分別為2、3和5 dB,最小SMR是設計音頻編碼器很重要的參數(shù)[3]。
圖14 窄帶噪聲掩蔽純音實測曲線
掩蔽曲線的形狀(即掩蔽效果)與掩蔽音、被掩蔽音的聲級也有關(guān),圖15是實測1 000 Hz不同聲級窄帶噪聲掩蔽純音的掩蔽曲線,在兩者聲級較高時,掩蔽曲線發(fā)生彎曲,出現(xiàn)非線性。圖14 顯示測量得到的掩蔽曲線對不同的掩蔽音形狀各異,給設計一個音頻編解碼器帶來很大麻煩,因為計算的數(shù)學表達式隨頻率改變,計算機編程也十分瑣碎。如果用臨界帶的Bark刻度作為頻率座標,掩蔽曲線形狀完全一致,如圖16所示。(臨界帶的概念將在后面介紹)。
圖15 不同聲級1 000 Hz窄帶噪聲掩蔽純音時的掩蔽曲線
圖16 Bark刻度掩蔽曲線
4.1.3.2純音掩蔽純音 純音掩蔽純音的實驗較噪聲掩蔽純音難做,因為兩個純音會發(fā)生拍頻;測聽者除了聽到這兩個音外,還能聽到一個額外出現(xiàn)的拍頻音,拍頻音大多在掩蔽音附近,但它又和掩蔽音聲級有關(guān)。圖17是1 000 Hz不同聲級的純音作為被掩蔽音時測得的掩蔽曲線,為了避免在兩個音頻率相等時發(fā)生拍頻,被掩蔽音和掩蔽音之間有90度的相位差;在圖中可見被掩蔽音聲級低時,掩蔽域值向低頻擴展(斜率小),在高聲級時則相反,當掩蔽音聲級90 dB時,掩蔽曲線峰值75 dB,信號掩蔽比15 dB,較噪聲掩蔽純音的SMR大,這意味噪聲比純音有更好的掩蔽效果。
圖17 純音掩蔽純音的掩蔽曲線
4.1.3.3窄帶噪聲或純音掩蔽窄帶噪聲 通常一個信號的量化噪聲譜比純音復雜,對一個音頻編碼器而言,從實驗數(shù)據(jù)總結(jié)出來最適當?shù)难诒文P蛻撌钦瓗г肼暠徽瓗г肼暬蚣円粞诒蔚哪P?。很遺憾,文獻報道的這樣實驗數(shù)據(jù)很少,原因是在窄帶噪聲掩蔽窄帶噪聲情況下,兩者相位關(guān)系影響實驗結(jié)果,Hall等[12]建議寬帶噪聲掩蔽窄帶噪聲時,最小信號掩蔽比SMR約為26 dB。對純音掩蔽窄帶噪聲情況下,Zwicker[13]、Schroeder[14]等建議最小SMR約20~30 dB;一般而言,純音的最小SMR要高于類噪聲的最小SMR[3]。
4.1.3.4臨界帶(critical bandwidth) 測量掩蔽曲線時,科學家發(fā)現(xiàn)了十分有意義的現(xiàn)象,稱為臨界帶的現(xiàn)象。在測量兩個純音掩蔽一個窄帶噪聲時,兩個純音的頻率間隔在某個范圍內(nèi)掩蔽曲線很平坦,一旦超過這個間隔,掩蔽曲線急劇下降,這個頻率間隔稱為臨界帶。圖18是純音掩蔽窄帶噪聲時的臨界帶,兩個50 dB聲級的純音掩蔽一個中心頻率2 kHz的窄帶噪聲,當兩個掩蔽純音從2 kHz中心頻率逐漸向兩邊移開時,掩蔽域值無變化,都是33 dB;在它們離中心頻率各超過150 Hz時,掩蔽曲線急劇下降,它們的頻率間隔即為臨界帶帶寬300 Hz。
在噪聲掩蔽純音時也出現(xiàn)同樣的現(xiàn)象,圖19是兩個50 dB聲級的窄帶噪聲掩蔽一個2 kHz純音,在窄帶噪聲的間距小于300 Hz(各離純音頻率150 Hz)時,掩蔽曲線很平坦,為46 dB;當間距超過300 Hz時,掩蔽曲線也是急劇下降。
圖18 純音掩蔽窄帶噪聲時的臨界帶
圖19 窄帶噪聲掩蔽純音時的臨界帶
科學家H.Fletcher將此間隔定義為臨界帶[15],并認為臨界帶是聽覺器官分析聲音很合理的濾波器組。對臨界帶作為劃分人耳濾波器組的帶寬和形狀,因不同的實驗方法不同有些爭議。Zwicker等[13]認為中心頻率fc在500 Hz以下,臨界帶寬約為100 Hz;fc在500 Hz以上,帶寬約為中心頻率的1/5,并給出如下公式:
Δf(Hz)=25+75[1+1.4(fc(kHz))2]0.69
由于實驗方法不同,Greenwood[16]、Moore[17]等對耳分析濾波器的形狀和帶寬劃分有另一種提法,他們認為Zweicker等[13]的臨界帶劃分公式不精確,提出了等效矩形帶寬(equivalent rectangular bandwidth,ERB)的公式:
ERB(Hz)=24.7(4.37fc(kHz)+1)
上述兩種方法從20世紀60年代到90年代爭論了20~30年,莫衷一是。由于實驗方法不一致,難以判定何者更正確或更優(yōu),這和實驗方法有關(guān),也與需要設計和應用的信號處理系統(tǒng)有關(guān)。然而在耳蝸基底膜上進行頻譜分析是不爭的事實,實驗證明臨界帶劃分基底膜為24份,每份約100 Mel音高間隔,并包含大致相同的神經(jīng)纖維,足以說明臨界帶的劃分有較強的科學依據(jù)。Bark 刻度劃分臨界帶的中心頻率、上下截止頻率和帶寬見表1[3,10]。
(待續(xù))