• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      智能聲紋識(shí)別系統(tǒng)與技術(shù)分析

      2018-12-19 18:55:58蔣宗琎
      科技傳播 2018年23期
      關(guān)鍵詞:聲紋識(shí)別模式識(shí)別特征提取

      蔣宗琎

      摘 要 在傳統(tǒng)的兩種依靠生物特征進(jìn)行識(shí)別的技術(shù)(指紋與掌紋)之后,聲紋,作為一種新的生物特征識(shí)別技術(shù),逐漸出現(xiàn)并且應(yīng)用于許多實(shí)際領(lǐng)域。聲紋的識(shí)別與傳統(tǒng)的生物識(shí)別比起來,具有容易獲取、計(jì)算簡(jiǎn)便、耗資低等優(yōu)勢(shì)。聲紋也正因如此,吸引著大批專家與相關(guān)的技術(shù)人員進(jìn)行開發(fā)研究。文章主要結(jié)合了人工智能的方法,介紹了智能聲紋識(shí)別系統(tǒng),并對(duì)聲紋識(shí)別過程中涉及的特征提取 、模式識(shí)別進(jìn)行了技術(shù)分析,并闡述了人工智能在這兩個(gè)關(guān)鍵過程中的應(yīng)用,最后指出了如何將人工智能嵌入聲紋識(shí)別技術(shù)之中。

      關(guān)鍵詞 人工智能;聲紋識(shí)別;特征提取;模式識(shí)別

      中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2018)224-0073-03

      隨著信息技術(shù)的發(fā)展和人們對(duì)生活品質(zhì)的追求,聲紋識(shí)別技術(shù)近些年得到快速發(fā)展,與其他傳統(tǒng)的認(rèn)證方法相對(duì)比,基于人們自身的識(shí)別系統(tǒng)—聲紋識(shí)別系統(tǒng)具有更為優(yōu)越的安全性、穩(wěn)定性[ 1 ]。由于人們自身的各種生物特性(如指紋、聲紋、虹膜、DNA等)具有唯一性,相比容易丟失的重要識(shí)別物品(如鑰匙、身份卡等)更不容易被他人獲取并非法利用。加之聲紋識(shí)別技術(shù)所需要的設(shè)備簡(jiǎn)單、其操作方便且實(shí)用性強(qiáng),使得其在許多領(lǐng)域都有極大的發(fā)展?jié)摿 2 ]。

      文章結(jié)合聲紋識(shí)別技術(shù)與智能技術(shù)的交叉,重點(diǎn)探究分析智能聲紋識(shí)別技術(shù),圍繞技術(shù)原理與關(guān)鍵過程分析展開論述,并就其智能特征提取與智能模式識(shí)別技術(shù)進(jìn)行了深入研究分析,這將有助于人們對(duì)智能聲紋識(shí)別技術(shù)進(jìn)行更加深入的了解與掌握,為其深入應(yīng)用奠定基礎(chǔ)。

      1 聲紋識(shí)別系統(tǒng)

      1.1 聲紋識(shí)別系統(tǒng)的原理

      類似于人體的各種生物特征,聲紋也因人而異,很少存在聲紋相同的兩個(gè)人。聲紋識(shí)別便是從語(yǔ)音信號(hào)處理中提取聲紋的特征,并加以建模,最后便能與其他的聲紋加以比對(duì)并進(jìn)行諸如身份識(shí)別的判斷,其一般原理如圖1所示[ 2 ]。

      1.2 聲紋識(shí)別關(guān)鍵過程分析

      1.2.1 特征參數(shù)的提取[3]

      特征參數(shù),顧名思義,就是在一個(gè)人的日常語(yǔ)言中,能夠表達(dá)生物特別的特性和語(yǔ)言習(xí)慣、語(yǔ)音習(xí)慣等特征信息的參數(shù)。通過對(duì)這種參數(shù)進(jìn)行提取,就能夠?qū)φZ(yǔ)音進(jìn)行分析,從而能夠記錄與計(jì)算。由于這種參數(shù)是穩(wěn)定的,即使被分析者所在場(chǎng)合不同時(shí)間不同,這些參數(shù)也基本一致。同時(shí)這些參數(shù)是獨(dú)特的,這表現(xiàn)在它的不能模仿特性上。這使這種特征參數(shù)能夠完全區(qū)分不同的人,具有身份識(shí)別功能?,F(xiàn)在語(yǔ)音分析中,參數(shù)提取的方法有如下的幾種[ 3 ]。

      第一種:語(yǔ)音頻譜。語(yǔ)音頻譜更多地描繪了提取對(duì)象的生理結(jié)構(gòu),主要體現(xiàn)在它的發(fā)聲器官上。每個(gè)人的發(fā)聲器官都具有獨(dú)一無(wú)二的獨(dú)特構(gòu)造。這種參數(shù)的提取主要是基于說話人的基礎(chǔ)發(fā)聲器官,這種器官以聲道和鼻腔等為主,從而獲取測(cè)量對(duì)象的語(yǔ)音短時(shí)頻譜特征。這種數(shù)據(jù)能夠反映被測(cè)人的發(fā)音生理結(jié)構(gòu)和發(fā)聲的激勵(lì)源,能夠體現(xiàn)其生理器官的特殊性。短時(shí)頻譜和它的基本輪廓?jiǎng)t更加注重于反映被測(cè)人的語(yǔ)音上的習(xí)慣性動(dòng)作。

      第二種:線性預(yù)測(cè)參數(shù)的本質(zhì)是一種預(yù)測(cè),它的預(yù)測(cè)基于一些“過去”的語(yǔ)音抽樣,并在數(shù)學(xué)模型的基礎(chǔ)上來運(yùn)算當(dāng)前的語(yǔ)音,這種方式獲得的參數(shù)可以用來運(yùn)算語(yǔ)音特征。這種帶有預(yù)測(cè)性質(zhì)的運(yùn)算能夠極大降低成本、提升運(yùn)算的效率,它只需要很少的參數(shù)就能夠表現(xiàn)一種特殊的語(yǔ)音。

      第三種:小波特征。小波特征參數(shù)是一種運(yùn)用小波技術(shù)來提取語(yǔ)音特征信息的方式。這種技術(shù)的優(yōu)勢(shì)是可以接受分辨率的改變,對(duì)于語(yǔ)音材料的穩(wěn)定性要求交叉,可以與時(shí)頻域兼容表征。這種方式既快捷又應(yīng)用范圍廣,可以準(zhǔn)確得到被測(cè)人的語(yǔ)音特征信息。

      1.2.2 模式匹配識(shí)別[4]

      模式匹配識(shí)別是基于已經(jīng)獲得被測(cè)者語(yǔ)音特征參數(shù)的基礎(chǔ)上,進(jìn)行進(jìn)一步的分析與判斷。這種分析與判斷是一種比對(duì):將尚未識(shí)別處理的特征參數(shù)及其模板與已經(jīng)得到的模型庫(kù)進(jìn)行對(duì)照。二者的對(duì)比結(jié)果將以相似度的形式呈現(xiàn)出來,并記錄下相似度距離。在這個(gè)距離范圍中,選取一個(gè)適合的距離就可以作為一種門限值。有了門限值就可以根據(jù)它來篩選出一種最好的結(jié)果,最終的結(jié)果將由識(shí)別系統(tǒng)輸出。現(xiàn)在較為成熟較為常見的模式匹配識(shí)別判斷,主要是兩種模型。

      第一種:矢量化模型。矢量化模型是通過一種建立矢量的方法,對(duì)被測(cè)人的語(yǔ)音特征進(jìn)行進(jìn)一步的處理,也即矢量化。被測(cè)人的語(yǔ)音特征參數(shù)將被處理成一種能代表個(gè)人信息的矢量,當(dāng)需要對(duì)個(gè)體特征進(jìn)行識(shí)別的時(shí)候,這種矢量將提供一定的標(biāo)準(zhǔn)。

      第二種:隨機(jī)模型。隨機(jī)模型的建立是考慮到語(yǔ)音的變化范圍及其概率的方式。在充分考慮到轉(zhuǎn)移概率、傳輸概率的基礎(chǔ)上,隨機(jī)模型為每個(gè)被測(cè)者都建立起了其發(fā)聲模型。在訓(xùn)練的過程中,將獲取狀態(tài)轉(zhuǎn)移概率矩陣,此外還有符號(hào)輸出概率矩陣。當(dāng)被測(cè)者的語(yǔ)音在狀態(tài)轉(zhuǎn)移時(shí),計(jì)算機(jī)就能夠識(shí)別這種語(yǔ)音在轉(zhuǎn)移時(shí)所發(fā)生的最大概率,通過這種概率,對(duì)該被測(cè)人的模型進(jìn)行進(jìn)一步的分析。

      1.3 聲紋識(shí)別的應(yīng)用

      聲紋識(shí)別作為是一種新興的生物身份認(rèn)證技術(shù)[ 5 ]。在智能時(shí)代的發(fā)展過程中,將占據(jù)著越來越重要的地位。隨著信息技術(shù)的進(jìn)步,在信息更容易獲取的同時(shí),人們的信息也面臨各種危險(xiǎn)。因此,個(gè)人信息的安全需求越來越高。聲紋識(shí)別以其高度的安全特性和低成本、簡(jiǎn)單便捷的特點(diǎn),得到了越來越廣泛的應(yīng)用。聲紋識(shí)別與傳統(tǒng)的生物識(shí)別不同,它對(duì)識(shí)別設(shè)備的要求很低,從聲音的采樣到后期的建模、分析、處理,只需要帶有麥克風(fēng)的電腦即可完成。并且,聲紋識(shí)別的準(zhǔn)確性也很高,它不受到方言等因素的限制,更多地是關(guān)于一個(gè)人生理結(jié)構(gòu)、發(fā)音特征的記錄,因此,具有更高的普適性。同時(shí),聲音的便于傳輸也使聲紋識(shí)別能夠遠(yuǎn)程運(yùn)用,得到更加廣泛的應(yīng)用。

      2 聲紋識(shí)別系統(tǒng)中的智能技術(shù)分析

      2.1 人工智能技術(shù)[6]

      人工智能是通過模仿人的思維進(jìn)行運(yùn)算、判斷和分類等能力,通常借助建立人工神經(jīng)網(wǎng)絡(luò)(Artificial?Neural?Network,ANN)來實(shí)現(xiàn)目標(biāo)任務(wù)。人工神經(jīng)網(wǎng)絡(luò)是由大量的相互連接的處理單元組成的具有非線性與自適應(yīng)信息處理能力的智能系統(tǒng),近些年得到了大力的研究與應(yīng)用,常見的人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

      圖2表示的典型人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖是從信息處理角度對(duì)人腦神經(jīng)網(wǎng)絡(luò)進(jìn)行抽象得到的,并通過建立這種簡(jiǎn)單易懂的網(wǎng)絡(luò)模型示意,可以知道數(shù)據(jù)處理節(jié)點(diǎn)按不同的連接方式可以組成不同的網(wǎng)絡(luò),網(wǎng)絡(luò)中各個(gè)神經(jīng)元節(jié)點(diǎn)接受前一級(jí)的輸入,按照特定算法計(jì)算,并將結(jié)果輸出到下一級(jí)。典型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)分為3層:分別為輸入層、隱含層和輸出層。三層的主要功能如下。

      1)在輸入層中,輸入層節(jié)點(diǎn)接受大量的外部輸入信息,通常會(huì)表示成數(shù)組或向量形式。

      2)在隱含層中,由于隱含層是介于輸入層和輸出層之間的眾多神經(jīng)元節(jié)點(diǎn)和鏈接組成的眾多層面。隱含層可以是單層也可以是多層的,其神經(jīng)元節(jié)點(diǎn)數(shù)目不定,根據(jù)實(shí)際處理需要可能會(huì)十分復(fù)雜,隱含層節(jié)點(diǎn)數(shù)目越多人工神經(jīng)網(wǎng)絡(luò)的非線性越顯著。

      3)在輸出層中,信息從輸入層輸入經(jīng)過隱含層的神經(jīng)元節(jié)點(diǎn)運(yùn)算、分析和傳送,形成輸出結(jié)果,輸出通常也是以數(shù)組或向量的形式表達(dá)。

      借助人工神經(jīng)網(wǎng)絡(luò),通過處理器模擬實(shí)現(xiàn)的人的智能,是智能信息處理技術(shù)的思想,借助人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的智能信息處理設(shè)備將給信息化技術(shù)的發(fā)展增添新動(dòng)力。

      2.2 智能特征提取技術(shù)分析[7]

      在對(duì)被測(cè)者的語(yǔ)音信息處理中,這種參數(shù)的特別性與可識(shí)別度,都將決定這種技術(shù)的應(yīng)用范圍和可靠程度。在被測(cè)人聲音的參數(shù)提取中,必須排除干擾因素,使結(jié)果能夠具有充分的特別度和可區(qū)別性。通過人工神經(jīng)網(wǎng)絡(luò)智能信息處理,計(jì)算機(jī)可自主將所接受到的各種信息數(shù)字化后轉(zhuǎn)化為數(shù)據(jù)輸入,隨后在隱含層中進(jìn)行復(fù)雜的信息處理,從而完成特征提取并進(jìn)行分析篩選,最后輸出具有特異性的聲紋特征,減少了特征參量的維度,提高了訓(xùn)練和識(shí)別的效率。

      2.3 智能模式識(shí)別技術(shù)分析

      這種智能模式使用了神經(jīng)網(wǎng)絡(luò)模型。這種模型是一種具有一定擬生特性的模型。它能像生物一樣進(jìn)行感知,并且對(duì)數(shù)據(jù)進(jìn)行分布式處理,這種模型具有很強(qiáng)的自學(xué)習(xí)能力。同時(shí),這種神經(jīng)網(wǎng)絡(luò)模型能夠快速處理復(fù)雜的信息,并且能夠自我訓(xùn)練,對(duì)模型中的結(jié)構(gòu)與參數(shù)進(jìn)行自我修正與調(diào)整,實(shí)現(xiàn)系統(tǒng)的自動(dòng)優(yōu)化與環(huán)境的高度配適。這種神經(jīng)網(wǎng)絡(luò)模型的速度很快,識(shí)別度也達(dá)到了相當(dāng)?shù)某潭龋鼛啄陙?,不斷地被?yīng)用于對(duì)景象、語(yǔ)言與自然語(yǔ)言中包含模式識(shí)別問題的理解。在圖像處理過程中人工神經(jīng)網(wǎng)絡(luò)將識(shí)別對(duì)象數(shù)字化,將其轉(zhuǎn)化為可供計(jì)算機(jī)處理的數(shù)字信息。隨后通過特征提取從數(shù)字化后的輸入模式中選取一組含冗余信息的特征。在此后引入鑒別函數(shù),由特征矢量計(jì)算出各種類別的函數(shù)值,再進(jìn)行比較并分類得到有實(shí)際作用的數(shù)據(jù)。

      3 結(jié)論

      利用人工智能對(duì)聲紋進(jìn)行處理與分析,優(yōu)點(diǎn)一是人工智能可通過具有一定自主性的演算進(jìn)行更為精準(zhǔn)的特征提取和識(shí)別以得到更為精確的聲紋特征數(shù)據(jù),減小結(jié)果的誤差,使得到的聲紋特征具有更為強(qiáng)大的可靠性和利用性;優(yōu)點(diǎn)二是人工智能和聲紋識(shí)別技術(shù)都尚有廣闊的發(fā)展空間,出現(xiàn)的計(jì)算錯(cuò)誤或步驟差錯(cuò)可通過人工計(jì)算和人工智能自我演算來糾正并改進(jìn)分析計(jì)算模式,這使得智能聲紋識(shí)別的出錯(cuò)率得以逐步降低而容錯(cuò)率逐步上升;優(yōu)點(diǎn)三是人工智能在進(jìn)行聲紋識(shí)別的過程中也可進(jìn)行其他類別的工作,這使得智能聲紋演算擁有更大的應(yīng)用領(lǐng)域及利用價(jià)值。

      因此,智能聲紋識(shí)別系統(tǒng)在特定方面上具有傳統(tǒng)聲紋系統(tǒng)所無(wú)法比擬的優(yōu)點(diǎn),其技術(shù)發(fā)展難度也較傳統(tǒng)方法有所降低,通過人工智能和聲紋識(shí)別系統(tǒng)的共同結(jié)合,智能聲紋識(shí)別系統(tǒng)的功能也會(huì)有進(jìn)一步的增強(qiáng),使得智能聲紋系統(tǒng)對(duì)科研領(lǐng)域及人類生活有著更為重大的意義和影響。

      參考文獻(xiàn)

      [1]楊陽(yáng),陳永明.聲紋識(shí)別技術(shù)及其應(yīng)用[J].電聲技術(shù),2007,31(2):45-46.

      [2]鄭方,李藍(lán)天,張慧,等.聲紋識(shí)別技術(shù)及其應(yīng)用現(xiàn)狀[J].信息安全研究,2016,2(1):44-57.

      [3]朱浩冰,郭東輝.聲紋識(shí)別系統(tǒng)原理及其關(guān)鍵技術(shù)[J].計(jì)算機(jī)安全,2007(9):14-17.

      [4]黃成玉,張全柱,賴斌.聲紋識(shí)別中MEL參數(shù)的提取研究[J].電源技術(shù),2011,35(4):433-435.

      [5]李財(cái)蓮,趙小陽(yáng),王麗娟,等.說話人識(shí)別中關(guān)鍵技術(shù)的現(xiàn)狀與展望[J].軍事通信技術(shù),2005,26(2):62-65.

      [6]王永慶.人工智能原理與方法[M].西安:西安交通大學(xué)出版社,1998.

      [7]汪崢,連翰,王建軍.說話人識(shí)別中特征參數(shù)提取的一種新方法[J].復(fù)旦學(xué)報(bào)(自然科學(xué)版),2005,44(1):197-200.

      猜你喜歡
      聲紋識(shí)別模式識(shí)別特征提取
      基于Gazebo仿真環(huán)境的ORB特征提取與比對(duì)的研究
      電子制作(2019年15期)2019-08-27 01:12:00
      聲紋識(shí)別中的區(qū)分性訓(xùn)練
      淺談一種基于聲紋識(shí)別的教室上課點(diǎn)名系統(tǒng)
      基于i—vector聲紋識(shí)別上課點(diǎn)名系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
      淺談模式識(shí)別在圖像識(shí)別中的應(yīng)用
      一種基于LBP 特征提取和稀疏表示的肝病識(shí)別算法
      第四屆亞洲模式識(shí)別會(huì)議
      面向移動(dòng)終端的語(yǔ)音簽到系統(tǒng)
      第3屆亞洲模式識(shí)別會(huì)議
      基于MED和循環(huán)域解調(diào)的多故障特征提取
      广丰县| 上高县| 九江市| 新乐市| 清水河县| 宁乡县| 苏尼特左旗| 南郑县| 南昌县| 壤塘县| 邯郸县| 彭泽县| 通化县| 溆浦县| 台山市| 梁平县| 白银市| 双辽市| 梅河口市| 新邵县| 图们市| 清流县| 洛宁县| 松江区| 红桥区| 西丰县| 虹口区| 望城县| 正镶白旗| 临泽县| 大英县| 高雄市| 武宣县| 阜城县| 平陆县| 渝北区| 壶关县| 繁昌县| 河源市| 元谋县| 如东县|