韓大偉 熊欣
摘 要:語(yǔ)音是人類傳遞信息的一種最主要、最有效、最方便的交流形式。語(yǔ)言是人類特有的交流方式,而聲音又是人類比較常用的交流工具,是傳遞信息的主要手段,所以,語(yǔ)音信號(hào)是人們感情交流以及思想溝通的主要途徑。目前,人們已經(jīng)進(jìn)入到了信息時(shí)代,利用一些現(xiàn)代先進(jìn)的技術(shù)方法分析語(yǔ)音信號(hào),加強(qiáng)對(duì)語(yǔ)音信號(hào)采集與處理的研究,使人們可以更加方便的傳輸、獲取、存儲(chǔ)以及使用相關(guān)的語(yǔ)音信號(hào),對(duì)于加快社會(huì)的發(fā)展與進(jìn)步有著非常重要的現(xiàn)實(shí)意義。
關(guān)鍵詞:語(yǔ)音信號(hào);采集;處理
對(duì)于語(yǔ)音信號(hào)的采集與處理一直就沒(méi)有斷過(guò)研究,不僅僅是因?yàn)槠渚哂幸欢ǖ膶?shí)用性,還有一個(gè)非常重要的原因就是,其始終與信息科學(xué)中最前沿的學(xué)科有著緊密的聯(lián)系,并且能夠共同發(fā)展。語(yǔ)音信號(hào)的采集與處理是一門涉及范圍比較廣的綜合性學(xué)科,其是以語(yǔ)音語(yǔ)言學(xué)以及數(shù)字信號(hào)處理為基礎(chǔ),并且與計(jì)算機(jī)技術(shù)、信息技術(shù)以及通信技術(shù)等均有緊密的聯(lián)系。所以,加強(qiáng)對(duì)語(yǔ)音信號(hào)采集與處理方法的分析與研究,有助于促進(jìn)社會(huì)的不斷發(fā)展以及科學(xué)技術(shù)的不斷進(jìn)步。
1 語(yǔ)音信號(hào)具有的特點(diǎn)
通過(guò)對(duì)大量實(shí)際語(yǔ)音信號(hào)的分析,我們可以明顯發(fā)現(xiàn)語(yǔ)音信號(hào)具有兩大特點(diǎn):一是從時(shí)域方面而言,語(yǔ)音信號(hào)具備“短時(shí)性”特點(diǎn),也就是說(shuō),從總體上而言,語(yǔ)音信號(hào)的特點(diǎn)是隨著時(shí)間的延續(xù)而發(fā)生不斷改變的,但是在一段比較短的時(shí)間范圍之內(nèi),語(yǔ)音信號(hào)還是可以保持不變的。通常情況下,在清音段表現(xiàn)出來(lái)的特點(diǎn)就是隨機(jī)噪聲,在濁音段表現(xiàn)出來(lái)的特點(diǎn)就是周期信號(hào)。二是從頻域方面而言,語(yǔ)音信號(hào)頻率主要集中的范圍就是300-3400赫茲之間。通常情況下,就可以利用這一特點(diǎn),采用帶通濾波器將這一區(qū)間的語(yǔ)音信號(hào)頻率提取出來(lái),之后根據(jù)8千赫茲的采樣頻率對(duì)提取出來(lái)的語(yǔ)音信號(hào)開(kāi)展相應(yīng)的采樣工作,這樣就可以得到相對(duì)比較離散的語(yǔ)音信號(hào)。
2 語(yǔ)音信號(hào)的采集
將語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)閿?shù)字信號(hào),就一定要采集到語(yǔ)音信號(hào),也就是要進(jìn)行語(yǔ)音信號(hào)的采樣與量化,進(jìn)而得到在幅度以及時(shí)間上都是離散的數(shù)字信號(hào)。采樣可以稱之為抽樣,是語(yǔ)音信號(hào)在時(shí)間上的離散過(guò)程,采樣的時(shí)候一定要滿足奈奎斯特定理,才可以對(duì)語(yǔ)音信號(hào)進(jìn)行有效的采樣。在語(yǔ)音信號(hào)采樣的時(shí)候,一定要重視采樣間隔的設(shè)定以及相關(guān)語(yǔ)音信號(hào)的混淆,也就是說(shuō),對(duì)語(yǔ)音信號(hào)的采集首先就要明確采樣間隔。通常情況下,采樣的頻率越高,采樣的點(diǎn)數(shù)就會(huì)越加密集,所得到的離散信號(hào)也就越加接近于原始的語(yǔ)音信號(hào)。但是采樣的頻率也不要太高,對(duì)于一些固定長(zhǎng)度的語(yǔ)音信號(hào),采集到太多的語(yǔ)音數(shù)據(jù),可能會(huì)給計(jì)算機(jī)系統(tǒng)帶來(lái)許多不必要的分析工作量以及占據(jù)過(guò)大的存儲(chǔ)空間;如果限定了數(shù)據(jù)量,而采樣的時(shí)間又太少,就會(huì)致使一些數(shù)據(jù)被排斥在外。采樣的頻率太低,采樣點(diǎn)的間隔距離又太遠(yuǎn),就會(huì)導(dǎo)致離散信號(hào)不足,無(wú)法反映原有語(yǔ)音信號(hào)的特征,進(jìn)而無(wú)法復(fù)原語(yǔ)音信號(hào),導(dǎo)致出現(xiàn)信號(hào)混亂的情況。根據(jù)相關(guān)的采樣定理,可以將采樣的頻率設(shè)置為大于語(yǔ)音信號(hào)的2倍帶寬,這樣在采樣的過(guò)程中就不會(huì)出現(xiàn)丟失信息的情況。量化就是對(duì)幅度進(jìn)行離散,也就是將振動(dòng)幅度用二進(jìn)制量化的方式予以表現(xiàn),其量化電平主要是根據(jù)級(jí)數(shù)進(jìn)行改變的,實(shí)際振動(dòng)的值是一種比較連續(xù)的物理量。完成語(yǔ)音信號(hào)的采集之后,就可以對(duì)其進(jìn)行相關(guān)的處理。
3 語(yǔ)音信號(hào)的處理
語(yǔ)音信號(hào)處理可以簡(jiǎn)單稱之為語(yǔ)音處理,是在數(shù)字信號(hào)處理以及語(yǔ)音學(xué)的基礎(chǔ)之上建立的一門綜合性比較強(qiáng)的學(xué)科,對(duì)其進(jìn)行處理的目的就是獲取一些語(yǔ)音參數(shù),進(jìn)而完成語(yǔ)音的傳輸或者存儲(chǔ),通過(guò)某種計(jì)算的處理,以此來(lái)實(shí)現(xiàn)某種用途的具體要求,比如:辨識(shí)說(shuō)話人、人工合成語(yǔ)音、識(shí)別講話內(nèi)容等。其包含了四大部分,語(yǔ)音編碼、語(yǔ)音識(shí)別、語(yǔ)音合成以及說(shuō)話人識(shí)別。語(yǔ)音是由人類發(fā)音器官發(fā)出來(lái)的聲音,并且具有一定的現(xiàn)實(shí)意義與社交作用,可以表達(dá)一部分特定的含義,這就是語(yǔ)音與自然界其它聲音的根本區(qū)別所在。語(yǔ)音與其所表達(dá)的現(xiàn)實(shí)意義是互相依賴的統(tǒng)一體,從一方面而言,發(fā)音器官發(fā)出來(lái)的聲音一定要帶有一定的現(xiàn)實(shí)意義,并且與現(xiàn)實(shí)意義緊密的聯(lián)系在一起,這樣的聲音表達(dá)才可以稱之為語(yǔ)音;從另外一方面而言,現(xiàn)實(shí)意義的表達(dá)一定要借助聲音的形式,才可以被人們感知以及接受,沒(méi)有聲音的表達(dá),就不會(huì)有相應(yīng)現(xiàn)實(shí)意義的體現(xiàn)。
4 語(yǔ)音信號(hào)采集與處理的方法
4.1 計(jì)算機(jī)系統(tǒng)中錄音機(jī)程序
計(jì)算機(jī)系統(tǒng)的附件中有一個(gè)錄音機(jī)程序,其可以驅(qū)動(dòng)聲卡進(jìn)行語(yǔ)音信號(hào)的采集、播放以及處理。對(duì)于語(yǔ)音信號(hào)的采集可以直接用麥克風(fēng)錄制人的語(yǔ)音,也可以利用人工輸入數(shù)據(jù)線或者音頻線將磁帶或者電視中的語(yǔ)音信號(hào)采集輸入到計(jì)算機(jī)當(dāng)中,這樣就可以根據(jù)輸入文件的屬性進(jìn)行文件格式、位數(shù)以及采樣頻率等方面的設(shè)置,同時(shí)也可以根據(jù)實(shí)際需要對(duì)語(yǔ)音信號(hào)進(jìn)行簡(jiǎn)單的處理,比如:加大或者減小音量、添加回音效果、加快或者減慢語(yǔ)音的速度以及聲音反轉(zhuǎn)等,其中加速或者減速完全可以實(shí)現(xiàn)變音的效果,反轉(zhuǎn)可以實(shí)現(xiàn)聲音文件加密的目的。利用錄音機(jī)程序采集與處理語(yǔ)音信號(hào)的優(yōu)點(diǎn)就是不需要進(jìn)行相應(yīng)的編程就可以實(shí)現(xiàn)語(yǔ)音的錄制與播放,并且對(duì)錄音材料的編輯與處理也比較方便、靈活,比如:復(fù)制、插入、剪切、回音、混響以及反轉(zhuǎn)等,同時(shí)還可以轉(zhuǎn)換聲音文件的格式,選擇相應(yīng)的壓縮方式以及采樣頻率等。其缺點(diǎn)就是一次錄制語(yǔ)音的時(shí)間不可以多于1分鐘,除此之外,對(duì)采集的語(yǔ)音信號(hào)處理一定要進(jìn)行另外的編輯工作或者利用其它相關(guān)軟件予以處理。
4.2 PRAAT語(yǔ)音學(xué)軟件程序
PRAAT語(yǔ)音軟件程序是由阿姆斯特丹大學(xué)大衛(wèi)·威寧克和保羅·博爾斯馬這兩位語(yǔ)音學(xué)教授一起研發(fā)出來(lái)的,可以對(duì)語(yǔ)音進(jìn)行分析、合成以及轉(zhuǎn)換。利用PRAAT語(yǔ)音學(xué)軟件程序可以直接將語(yǔ)音錄制下來(lái),可以從磁盤上直接讀取聲音文件或者使用算式的方法創(chuàng)建聲音,可以對(duì)一段聲音開(kāi)展頻譜特征分析、音強(qiáng)曲線分析、共振峰曲線分析以及音高曲線分析等工作,同時(shí)對(duì)語(yǔ)音的參數(shù)進(jìn)行變換與調(diào)整,對(duì)聲音進(jìn)行標(biāo)注。大部分的語(yǔ)音分析均可以在PRAAT語(yǔ)音學(xué)軟件程序中完成,并且不需要進(jìn)行編程,因此,受到許多語(yǔ)音處理人員的喜愛(ài)。
4.3 計(jì)算機(jī)系統(tǒng)中MATLAB軟件程序
MATLAB軟件程序是由美國(guó)Math Works公司推出的一種交互式計(jì)算機(jī)軟件,應(yīng)用的范圍非常廣泛,主要包括通訊、測(cè)量與測(cè)試、計(jì)算生物學(xué)、財(cái)務(wù)建模、控制系統(tǒng)設(shè)計(jì)以及信號(hào)與圖像的處理等眾多方面。在附加工具箱當(dāng)中擴(kuò)展了MATLAB環(huán)境,因此,可以在此環(huán)境當(dāng)中,通過(guò)不同的編程方式驅(qū)動(dòng)聲卡,以此來(lái)達(dá)到采集與播放語(yǔ)音信號(hào)的目的,其語(yǔ)音信號(hào)的分析與處理工具箱可以為分析語(yǔ)音信號(hào)提供非常充足的功能函數(shù),進(jìn)而利用功能函數(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行相應(yīng)的分析與處理,不僅非常方便,還非常的快捷。利用MATLAB軟件語(yǔ)言編程程序可以將需要的聲音文件轉(zhuǎn)換成相應(yīng)的離散數(shù)據(jù)文件,之后利用非常強(qiáng)大的矩陣計(jì)算能力對(duì)轉(zhuǎn)換的數(shù)據(jù)進(jìn)行一定的處理,比如:數(shù)字濾波、聲音回放、時(shí)域及頻域的分析、呈現(xiàn)各種分析圖以及傅里葉變換等。
總而言之,通過(guò)對(duì)這三種方法的介紹,我們可以看出,錄音機(jī)程序?qū)τ谡Z(yǔ)音信號(hào)的采集非常方便,但是在處理方面就有一些欠缺,只能進(jìn)行簡(jiǎn)單的操作,不能深入的進(jìn)行相關(guān)的處理;PRAAT語(yǔ)音學(xué)軟件程序?qū)τ谡Z(yǔ)音信號(hào)的采集與處理不需要編程就可以實(shí)現(xiàn),并且也可以通過(guò)編程完成復(fù)雜語(yǔ)音信號(hào)的采集與處理,深受大家的喜愛(ài);MATLAB軟件程序?qū)τ谡Z(yǔ)音信號(hào)的采集與處理,可以通過(guò)控件工具箱以及相應(yīng)的函數(shù)實(shí)現(xiàn),同時(shí)對(duì)于復(fù)雜語(yǔ)音信號(hào)的處理就需要通過(guò)編程予以實(shí)現(xiàn)。
5 結(jié)束語(yǔ)
綜上所述,通過(guò)對(duì)語(yǔ)音信號(hào)采集與處理方面的研究,使得我們更加了解語(yǔ)音信號(hào),對(duì)于語(yǔ)音信號(hào)的一些采集與處理方法也有了一定的認(rèn)識(shí)與了解,以及對(duì)語(yǔ)音信號(hào)的相關(guān)知識(shí)與作用也有了一定的掌握,所以,一定要加強(qiáng)對(duì)語(yǔ)音信號(hào)采集與處理方法的分析與研究,進(jìn)而推動(dòng)相關(guān)科學(xué)技術(shù)的發(fā)展與進(jìn)步,提出更多的新處理方法,進(jìn)一步應(yīng)用到其它相關(guān)的領(lǐng)域。
[參考文獻(xiàn)]
[1]張桂香,高愛(ài)國(guó).語(yǔ)音信號(hào)采集和處理方法的研究[J].高師理科學(xué)刊,2007(02).
[2]項(xiàng)勇,吳謹(jǐn).語(yǔ)音信號(hào)采集和播放的TCL 320 AD 50的實(shí)現(xiàn)[J].科學(xué)技術(shù)與工程,2008(12).
[3]齊子元,謝桂海,劉毅,等.一種實(shí)時(shí)語(yǔ)音信號(hào)采集處理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2005(09).
[4]齊子元,謝桂海,劉毅,等.基于TMS 320 C 30的實(shí)時(shí)語(yǔ)音信號(hào)采集與處理系統(tǒng)[J].測(cè)控技術(shù),2004(11).
[5]蔡蓮紅,黃德智,蔡銳.現(xiàn)代語(yǔ)音技術(shù)基礎(chǔ)與應(yīng)用[J].中國(guó)新技術(shù)新產(chǎn)品,2003(03).
[6]張明照,劉政波,劉斌.應(yīng)用MATLAB實(shí)現(xiàn)信號(hào)的分析和處理[J].哈爾濱學(xué)院學(xué)報(bào),2006(06).