王春蘭
摘 要:文章通過對正常、大聲兩種說話狀態(tài)下的普通話的聲強(qiáng)、基頻、共振峰等聲學(xué)參數(shù)的比對分析,綜合比較了各個參數(shù)的變化規(guī)律,經(jīng)過實驗之后,發(fā)現(xiàn)大聲說話時的語音并不是正常說話時語音的簡單放大,兩者不僅在聲強(qiáng)上存在著差別,同時在頻率域上也發(fā)生了重要的變化。同一人在不同狀態(tài)下發(fā)音時的頻譜特征差異較大,在同種狀態(tài)下發(fā)音時的相似性和可比性比較強(qiáng),為此,在聲紋鑒定的過程中應(yīng)當(dāng)盡量選取狀態(tài)相同的語音進(jìn)行比對分析。
關(guān)鍵詞:正常說話;大聲說話;聲紋鑒定;聲學(xué)分析
中圖分類號:O42 文獻(xiàn)標(biāo)志碼:A 文章編號:2095-2945(2017)35-0007-03
1 聲紋鑒定的優(yōu)勢、法律意義及研究現(xiàn)狀
聲紋鑒定的優(yōu)勢:
聲紋是由聲譜儀顯示出來的、帶有許多言語聲學(xué)信息的語音聲波圖譜的統(tǒng)稱,它是各種反映聲學(xué)特征的圖譜的綜合表現(xiàn),在語音學(xué)中將其形象地稱為語圖,在刑事科學(xué)技術(shù)和司法鑒定方面,人們比照著指紋把它形象地稱為聲紋[1],聲紋所具有的兩大特點較為突出且利用價值高,即特定性和相對穩(wěn)定性[2]。當(dāng)前我國的聲紋鑒定技術(shù)逐漸發(fā)展壯大為一門中獨立的學(xué)科,主要應(yīng)用于刑事科學(xué)技術(shù)的偵查以及司法鑒定,對于解決許多傳統(tǒng)刑偵手段無法解決的問題有無可比擬的優(yōu)勢,例如電話作案的電信網(wǎng)絡(luò)詐騙犯罪、鑒定法庭上的錄音證據(jù)的真?zhèn)蔚确矫鎇3]。
在聲紋鑒定技術(shù)的實踐或者偵破案件的過程中一般都會遇到這樣的情況:在檢材錄音的過程中,因為犯罪嫌疑人或者當(dāng)事人當(dāng)時的情緒比較激動,音量提高,有時由于憤怒可能還會喊叫;而嫌疑人或者當(dāng)事人在錄制語音樣本的時,情緒比較低落,說話音量會比較小,又或者情況會恰恰相反,語音檢材中的音量相對正常,語音樣本中的音量卻很大。本文通過實驗研究對比在大聲和正常兩種說話狀態(tài)下,聲紋特征的變化情況。
2 實驗設(shè)計
根據(jù)語音鑒定相關(guān)標(biāo)準(zhǔn),實驗以普通話中的四個漢字“辦”、“到”、“我”、“客”為研究對象,通過比對分析發(fā)音人在正常和大聲兩種不同說話狀態(tài)下的發(fā)音,找出聲學(xué)參數(shù)的變化規(guī)律,為在不同的音量狀態(tài)下的語音鑒定提供一定的理論依據(jù)。
2.1 實驗前準(zhǔn)備
設(shè)備、發(fā)音人、錄音內(nèi)容:
實驗需要VS99語音工作站和Praat語音分析軟件。找普通話標(biāo)準(zhǔn)的10個人(五個男生,五個女生),分別在正常與大聲狀態(tài)下說相同的內(nèi)容進(jìn)行錄音。最后選取8個人(四個男生,四個女生)的錄音進(jìn)行剪輯并實驗分析。錄音內(nèi)容為兩句話:“這事我辦不到!”“不要怪我不客氣!”。
2.2 實驗語音材料的處理
語音材料降噪剪輯:
在采樣頻率為44100Hz的情況下,對所錄的實驗語音材料進(jìn)行必要的降噪處理,并將降噪后的實驗語音材料中的“辦”、“到”、“我”、“客”進(jìn)行剪輯。
2.3 實驗分析過程
在以下分析中,B代表男生(Boy),G代表女生(Girl),N代表正常說話(Normal volume ), L代表大聲說話(Loud volume),在變化的平均數(shù)值中,+代表升高,-代表降低。
2.3.1 聲強(qiáng)(intensity)
實驗中測量了8位發(fā)音人(4位女生,4位男生)在正常和大聲說話時發(fā)“客”、“我”、“辦”、“到”時聲強(qiáng)的平均值,得到結(jié)論是8位發(fā)音人的4個漢字的聲強(qiáng)的平均數(shù)值均隨音量的增加而提高。
2.3.2 基頻(f0)
圖1(a)、(b)、(c)、(d)為分析基頻時的部分實驗截圖,分別代表B2與G1在正常與大聲兩種說話狀態(tài)時發(fā)“我”與“辦”的窄帶語圖,其他具體實驗數(shù)據(jù)見表1。
表1是8位發(fā)音人在兩種不同狀態(tài)下發(fā)四個漢字時的f0的平均值。從表中可以看出,相比正常說話而言,大聲說話時所有發(fā)音人的四個漢字的f0均有一定程度的提高。
共振峰是同一鑒定時非常重要的聲紋參數(shù),下面分別對F1~F4進(jìn)行分析。
2.3.3 第一共振峰(F1)
圖2(a)、(b)、(c)、(d)為分析第一共振峰F1時的部分實驗截圖,分別代表B3與G2分別在正常與大聲兩種說話狀態(tài)時發(fā)“到”與“客”的寬帶語圖。
表2是8位發(fā)音人兩種狀態(tài)下發(fā)四個漢字的F1的變化情況。很明顯,男生四個漢字的F1均隨音量的增加而提高。女生除“客”略有下降(-24.5Hz)外,其他三個漢字的F1普遍升高。
2.3.4 第二共振峰(F2)
對各發(fā)音人的兩種狀態(tài)下測量各音節(jié)的第二共振峰F2時發(fā)現(xiàn),男生除“辦”有所降低(-9.2Hz)外,其他三個漢字的F2均有所升高;女生除“我”略有下降(-12.5Hz),其他三個漢字均有不同程度的升高。
2.3.5 高級共振峰(F3、F4)
對各發(fā)音人的兩種狀態(tài)下測量各音節(jié)的第二共振峰F3時同樣發(fā)現(xiàn)男生除“辦”有所降低(-12.7Hz)外,其他三個漢字的F3均有所升高;女生除“我”略有下降(-8.0Hz),其他三個漢字均有不同程度的升高。經(jīng)過分析發(fā)現(xiàn),F(xiàn)4也有類似的結(jié)果。
3 實驗總結(jié)
由以上的實驗分析可知,大聲說話時的語音與正常語音經(jīng)過簡單地放大之后并不完全相同,因為大聲說話時聲強(qiáng)升高,在頻率和共振峰上也有明顯的變化。
第一,隨著音量的提高,聲帶的緊張程度會增大,同一個體的不同漢字的f0更趨于一致,因此,我們不能輕易依據(jù)發(fā)聲類型和f0的差異而做出同一鑒定的否定判斷。
第二,正常與大聲說話兩種狀態(tài)下的語音頻譜發(fā)生了不同程度的變化,共振峰不僅會發(fā)生整體規(guī)律性的變化(如F1,F(xiàn)2),同時還會發(fā)生個體性變化(如F3)。因此,在做同一鑒定時,應(yīng)該盡量保證樣本和檢材的音量相近。
最后,本次實驗是在較理想的環(huán)境下進(jìn)行的,實踐中往往還會伴有許多其他的影響因素,如發(fā)音人的情緒(比如高興、憤怒)、偽裝的方式、錄音環(huán)境、錄音器材等本文未加考慮。
參考文獻(xiàn):
[1]曹劍芬.現(xiàn)代語音研究與探索[M].北京:商務(wù)印書館,2007.
[2]孔江平.論語言發(fā)聲[M].北京:中央民族大學(xué)出版社,2001:23-27.
[3]王士元,彭剛.語言、語音與技術(shù)[M].上海:上海教育出版社,2006.endprint