鄧宗權(quán),邱立欣
(天津市公安局物證鑒定中心,天津 300061)
傳統(tǒng)錄音機(jī)和數(shù)碼錄音筆在信道中的差異
鄧宗權(quán),邱立欣
(天津市公安局物證鑒定中心,天津 300061)
語音是重要的法庭證據(jù)。隨著科學(xué)技術(shù)的進(jìn)步,各種各樣的語音采集設(shè)備出現(xiàn)在人們的日常生活中。從傳統(tǒng)的錄音機(jī)到數(shù)字錄音筆、手機(jī)、MP3,語音采集經(jīng)歷了由模擬信號(hào)到數(shù)字信號(hào)的轉(zhuǎn)換過程。不同的采集設(shè)備和方法會(huì)造成語音的信道差異。傳遞語音信號(hào)的通道,如:傳統(tǒng)錄音機(jī)和數(shù)碼錄音筆由于各自的頻率響應(yīng)性能不同,對(duì)信號(hào)施加的影響也不同。傳統(tǒng)錄音機(jī)傳遞的是連續(xù)變化的模擬信號(hào),數(shù)碼錄音筆傳遞的則是以有限個(gè)“1”和“0”的代碼組合成為信息的數(shù)字信號(hào),兩者是現(xiàn)在普遍應(yīng)用的兩種信號(hào)模式。研究表明:信號(hào)通道對(duì)于語音識(shí)別,特別是自動(dòng)語音識(shí)別的影響是明顯的,但是對(duì)于圖譜視覺檢驗(yàn)的影響、影響的程度如何還尚待進(jìn)一步的深入研究。
信道;模擬信號(hào);數(shù)字信號(hào)
引言
視聽資料(Audio-Video Materials,AVM)是以數(shù)字化形態(tài)為特征的、證明案件事實(shí)情況的新的證據(jù)形式,視聽資料包括數(shù)字化的語音、圖像資料,以及廣義的計(jì)算機(jī)存儲(chǔ)資料,在數(shù)字化的視聽性能方面達(dá)到了高度的統(tǒng)一①崔景旭等.《視聽資料檢驗(yàn)》.警官教育出版社.2004,第1頁。。視聽資料作為一種獨(dú)立的訴訟證據(jù),分別在1898年、1991年、1997年被列入中華人民共和國行政訴訟法、民事訴訟法和刑事訴訟法②崔景旭等.《視聽資料檢驗(yàn)》.警官教育出版社.2004,第3頁。。20世紀(jì)80年代中后期以后,錄音錄像設(shè)備的使用在社會(huì)各界逐漸普及,使得錄音、影像資料在各類案件中出現(xiàn)的頻率越來越高。隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和IT產(chǎn)業(yè)的發(fā)展,視聽資料取得了巨大的發(fā)展。視聽資料以其客觀、公正、真實(shí)和信息豐富,再現(xiàn)能力強(qiáng)等獨(dú)特的特點(diǎn)在公安司法中的作用越來越明顯。
語音、聲音資料是將言語聲波、非言語聲波以物理方法記錄下來而形成的。語音作為言語信號(hào)的物質(zhì)載體,既有社會(huì)性又有話者個(gè)體特征。它的社會(huì)意義可以反映說話人要表達(dá)的意志,而語音的個(gè)體特征可以表明話者的身份。通過對(duì)話者言語語音的采集進(jìn)行視覺檢驗(yàn),從而可以進(jìn)行身份、性別、年齡等的認(rèn)定。語音信號(hào)處理中,由于檢材和樣本的條件差異,會(huì)對(duì)語音檢驗(yàn)在基頻、音長、共振峰、強(qiáng)度等參數(shù)有很大的影響。檢材和樣本的條件差異太大會(huì)直接影響鑒定結(jié)果的準(zhǔn)確性。鑒于此,本文對(duì)信號(hào)通道對(duì)于語音識(shí)別,特別是自動(dòng)語音識(shí)別的影響、影響的程度如何進(jìn)行系統(tǒng)的研究。
傳統(tǒng)錄音機(jī)主要是由機(jī)器的內(nèi)置話筒、錄放磁頭、錄音磁帶、揚(yáng)聲器、放大電路、傳動(dòng)機(jī)構(gòu)等部分組成。錄音磁帶表面涂有磁粉,錄音機(jī)內(nèi)磁頭在錄音時(shí),磁頭內(nèi)的線圈因通過的錄音電流而產(chǎn)生的磁場,磁化了傳動(dòng)中的磁帶,在磁帶中留下了磁記錄信號(hào)。而在放音時(shí),磁帶中的磁記錄信號(hào),在放音磁頭的線圈上轉(zhuǎn)為電流信號(hào)而推動(dòng)后面的喇叭發(fā)聲。軟盤上有一個(gè)鍍有磁化材料的圓片狀塑料薄片,在軟驅(qū)中的磁頭從轉(zhuǎn)動(dòng)的薄片上讀取或?qū)懭氲氖菙?shù)字信號(hào),磁頭對(duì)軟盤進(jìn)行兩個(gè)數(shù)字命令;磁化和否磁化,以完成連續(xù)的數(shù)字信號(hào)讀?、酃膊咳耸掠?xùn)練局《公安信息通信技術(shù)教程》第367頁。。錄音機(jī)錄制聲音時(shí),聲音通過話筒而產(chǎn)生隨聲音變化的感應(yīng)電流(音頻電流),聲音通過放大電路的放大以后,進(jìn)入錄音磁頭的線圈中,隨即在磁頭縫隙處產(chǎn)生隨著音頻電流變化的磁場,錄音磁帶緊貼著磁頭縫隙不斷的移動(dòng),致使磁帶上的磁粉層被磁化,因此磁帶上就記錄下了聲音的磁信號(hào)。錄音機(jī)放出聲音時(shí)是錄音的逆過程,磁帶不斷緊貼著放音磁頭的縫隙通過,磁帶上變化磁場使磁頭線圈中產(chǎn)生感應(yīng)電流,因?yàn)楦袘?yīng)電流的變化線與磁信號(hào)相同,所以線圈中產(chǎn)生的就是音頻電流,在這個(gè)音頻電流經(jīng)過放大電路放大后,通過揚(yáng)聲器就將音頻電流還原成聲音。
數(shù)碼錄音筆是通過對(duì)模擬信號(hào)的采樣、編碼之后通過數(shù)模轉(zhuǎn)換器將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)的,后又進(jìn)行一定的壓縮進(jìn)行存儲(chǔ)。所以數(shù)字信號(hào)即便經(jīng)過多次復(fù)制,聲音信息也不會(huì)受到任何損失,將保持不變。
數(shù)碼錄音筆的特點(diǎn):1.體積小巧、重量輕便
數(shù)碼錄音筆是以存儲(chǔ)器為主題,加上閃存和超大規(guī)模的集成電路的內(nèi)核系統(tǒng)所組成的,因此整個(gè)產(chǎn)品重量輕便、體積小巧。
2.連續(xù)錄音的時(shí)間長
傳統(tǒng)錄音機(jī)使用的每一盒錄音磁帶的錄音時(shí)間長度是40~60分鐘,最長的也就是90分鐘。而目前存儲(chǔ)容量最小的數(shù)碼錄音筆的連續(xù)錄音時(shí)間長度都在5~8小時(shí),更高端的產(chǎn)品達(dá)到幾十個(gè)小時(shí)的連續(xù)錄音能力也是很常見的。
3.使用壽命長
傳統(tǒng)錄音機(jī)的內(nèi)部采用的是機(jī)械結(jié)構(gòu),使用時(shí)間長樂就會(huì)發(fā)生磨損的情況,因此壽命有限。一盒普通的磁帶,反復(fù)的錄、擦幾十次基本上就是報(bào)廢了,而且磁頭和傳動(dòng)裝置時(shí)間長了也會(huì)發(fā)生一定的磨損。而數(shù)碼錄音筆所采用的是電子結(jié)構(gòu),因此可以做到無磨損,使用的壽命也會(huì)比較長。
為了更好的了解傳統(tǒng)錄音機(jī)和數(shù)碼錄音筆的區(qū)別,我們根據(jù)以上內(nèi)容進(jìn)行了歸納總結(jié),詳見表1.3。
表1.3錄音機(jī)與錄音筆的區(qū)別情況
模擬數(shù)據(jù)也稱為模擬量,相對(duì)于數(shù)字量而言,指的是取值范圍是連續(xù)的變量或者在某個(gè)區(qū)間產(chǎn)生的連續(xù)值.例如,聲音、圖像、溫度、壓力。數(shù)字?jǐn)?shù)據(jù)也稱為數(shù)字量,相對(duì)于模擬量而言,指的是取值范圍是離散的變量或者數(shù)值.例如:計(jì)算機(jī)中使用二進(jìn)制代碼來表示的字符、音頻、圖形與視頻數(shù)據(jù)。
模擬信號(hào)指幅度的取值是連續(xù)的(幅值可由無限個(gè)數(shù)值表示)。時(shí)間上離散的模擬信號(hào)是一種抽樣信號(hào),它是對(duì)模擬信號(hào)每隔時(shí)間T抽樣一次所得到的信號(hào),雖然其波形在時(shí)間上是不連續(xù)的,但其幅度取值是連續(xù)的,所以仍是模擬信號(hào),稱之為脈沖幅度調(diào)制(PAM,簡稱脈幅調(diào)制)信號(hào)。平時(shí)我們聽到的聲音、看到的電視圖像都是模擬信號(hào)。數(shù)字信號(hào)采用斷續(xù)變化的電壓或光脈沖來表示,通信雙方則需要用電纜、雙絞線或光纖介質(zhì)將連接起來,這樣才能將信號(hào)從一個(gè)節(jié)點(diǎn)傳到另一個(gè)節(jié)點(diǎn)。
模擬信號(hào)和數(shù)字信號(hào)之間是可以相互轉(zhuǎn)換的,模擬信號(hào)中的不同幅度分別對(duì)應(yīng)數(shù)字信號(hào)中不同的二進(jìn)制值,實(shí)用中常采取24位或30位編碼;數(shù)字信號(hào)則通過采用載波進(jìn)行移相的方法,將其轉(zhuǎn)換為模擬信號(hào)。
信號(hào)是信息的載體,所以模擬信號(hào)和數(shù)字信號(hào)本質(zhì)上是相同的。不同點(diǎn)在于存貯,傳輸及其它處理的方式。模擬信號(hào)和數(shù)字信號(hào)有著很大的區(qū)別。模擬信號(hào)是用連續(xù)變化的數(shù)值來表示要說明的信息;數(shù)字信號(hào)是用有限個(gè)“1”和“0”的代碼來表示信息中某一個(gè)字符,當(dāng)很多字符組合起來時(shí),才能表達(dá)完整的信息。
1.傳統(tǒng)錄音機(jī)的信號(hào)轉(zhuǎn)化
如果從發(fā)射信號(hào)到接收信號(hào)都是模擬信號(hào)的話,那么這個(gè)通信系統(tǒng)就是一個(gè)模擬通信系統(tǒng)。
2.?dāng)?shù)碼錄音筆的信號(hào)轉(zhuǎn)化
如果將傳送的信號(hào)轉(zhuǎn)變?yōu)閿?shù)字信號(hào),經(jīng)過通信線路的傳輸,并且接收端所接收到的信號(hào)是數(shù)字信號(hào)的話,那么這個(gè)通信系統(tǒng)就是一個(gè)數(shù)字通信系統(tǒng)。
1.由于將信號(hào)進(jìn)行了數(shù)字化處理,所以就有可能對(duì)聲音、靜止圖像及其他各種數(shù)據(jù)進(jìn)行一些處理。
2.由于不容易受通信線路的噪聲和失真的影響,所以可以實(shí)現(xiàn)誤碼率低、可靠性高的通信。
3.為通信信號(hào)的復(fù)用提供了便利,可以提高效率。
4.由于可以利用數(shù)字信號(hào)處理器等各種數(shù)字技術(shù)成果,所以可構(gòu)成具有柔軟性的系統(tǒng)。
5.通過對(duì)數(shù)字信號(hào)進(jìn)行各種處理,使通信具有保密性。
傳遞語音信號(hào)的通道,如傳統(tǒng)錄音機(jī)和數(shù)碼錄音筆等,由于各自的頻率響應(yīng)性能不同,對(duì)信號(hào)施加的影響也就不同。而案件語音的樣本和檢材往往來自不同的信號(hào)通道,例如樣本和檢材分別用傳統(tǒng)錄音機(jī)和數(shù)碼錄音筆來采制和錄制。檢材和樣本來自不同信號(hào)通道是造成鑒別困難的主要原因。為了提高司法語音鑒定的精度和可信度,對(duì)于信號(hào)通道對(duì)話者語音的改變以及這種變化對(duì)識(shí)別的影響等問題,應(yīng)該進(jìn)行系統(tǒng)的實(shí)驗(yàn)研究。
1.發(fā)音人
共5名,男性,是中國刑警學(xué)院大學(xué)四年級(jí)的學(xué)生,普通話很好,無明顯言語障礙,發(fā)音清晰。
2.語料
選取有代表性的五個(gè)單元音作為發(fā)音語料。具體如下:
i、a、u、e、ü、
3.錄音方法
以話者正常發(fā)音為基準(zhǔn),研究傳統(tǒng)錄音機(jī)和數(shù)字錄音筆兩種信道語音的差異。首先選擇一個(gè)相對(duì)安靜無雜音的地方為錄音地點(diǎn)。讓每個(gè)話者在熟悉語料的基礎(chǔ)上按照語料正常發(fā)音,同時(shí)使用傳統(tǒng)錄音機(jī)和數(shù)碼錄音筆同時(shí)錄音。
對(duì)所錄制的語音輸入計(jì)算機(jī),然后利用Praat語音分析軟件作出寬帶圖譜進(jìn)行形態(tài)分析和數(shù)值比較。在視覺和聽覺檢驗(yàn)的基礎(chǔ)上,分別測(cè)出每個(gè)話者各個(gè)音節(jié)的基頻平均值、基頻最大值、強(qiáng)度平均值、強(qiáng)度最大值、音長和前四個(gè)共振峰的頻率值,然后利用SPSS統(tǒng)計(jì)分析軟件進(jìn)行統(tǒng)計(jì)處理。
首先提取了兩種信道下10個(gè)音節(jié)的基頻均值、基頻最大值和基頻最小值。由于篇幅所限,我們僅列出其中一個(gè)話者5個(gè)單元音的基頻數(shù)據(jù),詳見表4.1.1,
表4.1.1錄音機(jī)和錄音筆兩種信道語音的基頻(Hz)
統(tǒng)計(jì)數(shù)據(jù)表明:兩種信道語音的基頻值大體相當(dāng),基頻最大值和最小值上的差異要比均值大一些。但是,總的說來,兩種信道語音的基頻差異不大。為了深入比較二者的差異,我們利用SPSS軟件對(duì)兩種信道20個(gè)音節(jié)的語音基頻均值、基頻最大值和基頻最小值進(jìn)行了單因素方差分析(ANOVA)。
統(tǒng)計(jì)結(jié)果表明:兩種信道語音,無論是基頻均值、最大值還是最小值,它們的檢驗(yàn)概率P值都遠(yuǎn)遠(yuǎn)大于檢驗(yàn)水準(zhǔn)0.05。因此,兩種信道下語音的基頻差異不顯著,即信道改變不會(huì)引起語音基頻的顯著改變。圖4.1舉例說明了兩種不同信道的i、u的基頻曲線形態(tài)的細(xì)微差異。其中,實(shí)線代表錄音機(jī)信道,虛線代表錄音筆信道。
圖4.1在錄音機(jī)和錄音筆信道下的基頻圖譜
對(duì)兩種信道10個(gè)音節(jié)強(qiáng)度的平均值和強(qiáng)度最大值我們也進(jìn)行了統(tǒng)計(jì)測(cè)量,其中5個(gè)單元音音節(jié)的數(shù)據(jù)詳見表4.2.1。
表4.2.1錄音機(jī)和錄音筆兩種信道語音的強(qiáng)度(dB)
表4.2.1中的數(shù)據(jù)表明:在強(qiáng)度均值和強(qiáng)度最大值方面,各個(gè)音節(jié)上兩種信道的差異都最大,強(qiáng)度差均在20dB。由此可見,信道的不同造成了強(qiáng)度的很大差異。進(jìn)一步的單因素方差分析表明:都遠(yuǎn)遠(yuǎn)小于檢驗(yàn)水平0.05。因此,兩種信道語音的強(qiáng)度差異是非常顯著的。
見圖4.2.2舉例說明兩種不同信道下元音i和a的強(qiáng)度曲線差異。其中,實(shí)線為錄音機(jī)信道,虛線為錄音筆信道。
圖4.2.2在錄音機(jī)和錄音筆信道下的強(qiáng)度圖譜
為了深入研究兩種信道語音強(qiáng)度之間的關(guān)系和變化規(guī)律,我們對(duì)所有發(fā)音人的20個(gè)音節(jié)的強(qiáng)度均值和最大值進(jìn)行相關(guān)分析。相關(guān)分析的結(jié)果表明,兩種信道語音的強(qiáng)度均值的相關(guān)系數(shù)為0.44,強(qiáng)度最大值的相關(guān)系數(shù)為0.05。顯著性檢驗(yàn)表明前者呈顯著相關(guān)。因此,進(jìn)一步的回歸分析得到了兩種不同信道語音一元線性回歸模型為:Y=0.06X+87.37。其中,X代表錄音筆的強(qiáng)度平均值,Y代表錄音機(jī)的強(qiáng)度平均值。利用這個(gè)回歸公式,可以實(shí)現(xiàn)兩種信道下語音強(qiáng)度的互推。
對(duì)兩種信道10個(gè)音節(jié)的音長進(jìn)行了統(tǒng)計(jì)測(cè)量,其中5個(gè)單元音音節(jié)的數(shù)據(jù)結(jié)果見表4.3.1。
表4.3.1錄音機(jī)和錄音筆兩種信道語音音長(ms)
從表4.3.1可以看到:兩種信道下的相同語音音節(jié)的音長有一定的差異。方差分析(ANOVA)的結(jié)果(見表4.3.2)表明,顯著概率P值為.001,確實(shí)差異顯著。按照我們的預(yù)測(cè),由于語音的采集過程中采用的是錄音機(jī)和錄音筆同步錄音,音長不應(yīng)該出現(xiàn)差異。究其原因,可能使由于在實(shí)際的操作中對(duì)音節(jié)劃分時(shí)有較大誤差。
對(duì)語音圖譜仔細(xì)觀察的基礎(chǔ)上,我們測(cè)量了所有發(fā)音人全部語音音節(jié)的前四個(gè)共振峰的頻率值。表4.4.1僅列出了其中5個(gè)單元音兩種信道下的共振峰頻率值。
表4.4.1錄音機(jī)和錄音筆兩種信道5個(gè)單元音的共振峰(Hz)
比較兩種信道下各個(gè)音節(jié)的共振峰的頻率數(shù)據(jù)發(fā)現(xiàn):在兩種信道下每個(gè)元音的相應(yīng)共振峰的數(shù)值都非常接近,沒有明顯的差別。單因素方差分析的結(jié)果也表明了這一點(diǎn)(詳見表4.4.1)。
方差分析的結(jié)果表明:四個(gè)共振峰的顯著概率P值都遠(yuǎn)遠(yuǎn)大于檢驗(yàn)水準(zhǔn)0.05。因此,兩種信道下語音的四個(gè)共振峰的差異均不顯著,即信道改變不會(huì)引起語音共振峰的顯著改變。由此可以得出這樣的結(jié)論:盡管信道不同會(huì)對(duì)語音的部分聲學(xué)參數(shù)有影響,但是總的說來,這種影響不足以引起語音話者鑒別的基本參數(shù),如共振峰頻率的明顯改變以及由此導(dǎo)致的語音鑒定結(jié)論的錯(cuò)誤。從這個(gè)意義上講,在實(shí)際語音案件檢驗(yàn)鑒定中,當(dāng)檢材和樣本取自不同信道時(shí),除了對(duì)強(qiáng)度及與強(qiáng)度相關(guān)參數(shù)(如:功率譜)給予注意以外,對(duì)于其它參數(shù)的檢驗(yàn)采用常規(guī)方法即可。以下以元音i和u舉例說明共振峰的圖譜,如圖4.4.2和圖4.4.3。
圖4.4.2元音i在錄音機(jī)(左)和錄音筆(右)信道下的共振峰圖譜
圖4.4.3元音u在錄音機(jī)(左)和錄音筆(右)信道下的共振峰圖譜
結(jié)論
通過對(duì)傳統(tǒng)錄音機(jī)和數(shù)字錄音筆兩種不同信道的語音的比較研究和統(tǒng)計(jì)分析認(rèn)為:兩種信道下語音的基頻差異不顯著,信道不同沒有引起語音基頻的顯著改變。信道改變時(shí),語音的強(qiáng)度有很大變化,兩種信道下語音的強(qiáng)度差異顯著。因此,在比較和檢驗(yàn)來自不同信道的語音時(shí),對(duì)于信道不同導(dǎo)致的強(qiáng)度改變要給予充分的注意,使用強(qiáng)度參數(shù)對(duì)比時(shí)要慎重。信道的改變一般不會(huì)引起音長的顯著變化。我們的差異顯著結(jié)果是由于音節(jié)切分時(shí)的誤差所致。兩種信道下語音的共振峰差異不顯著,由此決定了不同信道語音是不存在本質(zhì)差異的。
綜上所述,盡管信道不同會(huì)對(duì)語音的部分聲學(xué)參數(shù)有影響,但是總的說來,這種影響不足以引起語音話者鑒別的基本參數(shù),如共振峰頻率的明顯改變以及由此導(dǎo)致的語音鑒定結(jié)論的錯(cuò)誤。從這個(gè)意義上講,在實(shí)際語音案件檢驗(yàn)鑒定中,當(dāng)檢材和樣本取自不同信道時(shí),對(duì)于話者識(shí)別來說不會(huì)有本質(zhì)的影響。當(dāng)然,對(duì)于語音強(qiáng)度及與強(qiáng)度相關(guān)的聲學(xué)參數(shù)(如:功率譜)要給予特殊的注意。
[1]高政.信號(hào)處理與系統(tǒng)分析[M].北京:中國水利水電出版社,2005.
[2]崔景旭等.視聽資料檢驗(yàn)[M].北京:警官教育出版社,2004.
[3]公安部人事訓(xùn)練局,公安部信息通信局.公安信息通信技術(shù)教程(上冊(cè))[M].北京:中國人民公安大學(xué)出版社,2001.
[4]韓紀(jì)慶,張磊,鄭鐵然.語音信號(hào)處理[M].北京:清華大學(xué)出版社,2004.
[5]姚天任.數(shù)字語音處理[M].武漢:華中理工大學(xué)出版社,1992.
Key works:voice channel;analogical signals;digital signals
The Differences in Transmission Channels of Traditional Tape Recorders and Digital Recorders
DENG Zong-quan QIU Li-xin
(The Material Evidence Identifying Center of Tianjin Public Security Bureau,Tianjing,300061)
Voice is one of the most important court evidences.With the development of science and technology,various voice recording equipments appear in people's daily life.From the traditional tape recorders to the digital recorders,mobile phones and MP3,the voice gathering has experienced the development from the analogical signals to digital signals.The different recording equipments and methods will result in.The transmission channels,such as traditional tape recorders and digital recorders,have different effects on voice signals due to different functions of response performances.The traditional tape recorder transmits simulate signals which change continuously while the digital recorder transmits the digital signal from the limited code combination of"1"and"0".Both of them are common models of signaling at present.Previous studies indicate that the effect of signal channel on speech recognition is obvious,especially on automatic speaker recognition.But there is few further study on its effects on visual examination of speech spectrum.
D918.2
A
2095-1140(2011)06-0120-05
2011-07-15
鄧宗權(quán)(1983- ),男,天津市公安局物證鑒定中心助理工程師,主要從事數(shù)字化模糊圖像處理和音頻處理工作;邱立欣(1982-),男,天津市公安局物證鑒定中心,助理工程師,主要從事數(shù)字化模糊圖像處理和音頻處理。
左小絢)