• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于聲音采集與分類技術(shù)的報(bào)警系統(tǒng)設(shè)計(jì)

      2022-12-03 08:24:46沈丹丹朱習(xí)松
      電子與封裝 2022年11期
      關(guān)鍵詞:特征參數(shù)時(shí)鐘報(bào)警

      徐 婕,沈丹丹,潘 碩,朱習(xí)松

      (中科芯集成電路有限公司,江蘇無錫 214072)

      1 引言

      在現(xiàn)代環(huán)境質(zhì)量評(píng)價(jià)體系中,環(huán)境噪聲指標(biāo)日益受到重視,成為評(píng)價(jià)一個(gè)場(chǎng)所舒適度的重要標(biāo)準(zhǔn),準(zhǔn)確檢測(cè)、記錄環(huán)境聲音具有重要的現(xiàn)實(shí)意義[1]。在完成聲音能量檢測(cè)的同時(shí),確定主要聲音類別,一方面可以指導(dǎo)工作人員確定主要工作方向,盡量杜絕此類聲源以提升環(huán)境質(zhì)量;另一方面通過捕捉例如尖叫聲、哭喊聲等異常聲音[2],給出報(bào)警信息,配合視頻監(jiān)控,有利于安保人員第一時(shí)間判斷危險(xiǎn)源并進(jìn)行應(yīng)急處理,可以彌補(bǔ)視頻監(jiān)控的不足[3]。

      本文論述了一種聲音報(bào)警系統(tǒng),以模數(shù)轉(zhuǎn)換、控制、傳輸電路搭建硬件平臺(tái),以聲音的端點(diǎn)檢測(cè)、特征參數(shù)提取和分類技術(shù)為算法核心,實(shí)現(xiàn)對(duì)環(huán)境聲音大小的實(shí)時(shí)檢測(cè)及聲音分類、異常報(bào)警等功能。

      2 系統(tǒng)架構(gòu)

      報(bào)警系統(tǒng)的硬件部分主要選用國(guó)內(nèi)外成熟的元器件和設(shè)備,包括麥克風(fēng)(MIC)裝置、運(yùn)算放大器(AMP)、模數(shù)轉(zhuǎn)換電路(ADC)、電平轉(zhuǎn)換、FPGA、以太網(wǎng)PHY RJ45 芯片、電源、時(shí)鐘系統(tǒng)、配有識(shí)別算法及報(bào)警顯示的主控計(jì)算機(jī),系統(tǒng)結(jié)構(gòu)硬件如圖1 所示。

      圖1 系統(tǒng)硬件結(jié)構(gòu)

      遠(yuǎn)端采集部分器件的功能及選用原則如下:

      1)MIC 裝置實(shí)現(xiàn)聲音電信號(hào)的轉(zhuǎn)換,需要具有拾音準(zhǔn)、干擾小、采集范圍大的特點(diǎn),此處選用高性能拾音器;2)AMP 有調(diào)整模擬信號(hào)的作用,可根據(jù)后級(jí)器件調(diào)整信號(hào)幅度,其高輸出電阻特性可有效避免信號(hào)失配,考慮后級(jí)轉(zhuǎn)換器件的差分特性,選擇全差分AMP XX6362,其具有全差分、低失調(diào)、噪聲小、軌到軌傳輸?shù)奶攸c(diǎn),能夠滿足系統(tǒng)要求;3)ADC 是聲音采集的核心器件,它將模擬信號(hào)轉(zhuǎn)換為數(shù)字語音,因聲音變化量豐富,選用16 位高精度專用語音電路XX73311;4)電平轉(zhuǎn)換器件可適配不同電壓的總線互聯(lián),選用XX0108,其具有電壓范圍寬、工作速率快、自適應(yīng)方向的特點(diǎn),可應(yīng)用于推挽或開漏的不同總線信號(hào)傳輸;5)遠(yuǎn)端控制器主要完成模數(shù)轉(zhuǎn)換器的配置、數(shù)據(jù)讀取,按照以太網(wǎng)UDP 協(xié)議打包發(fā)送數(shù)據(jù),F(xiàn)PGA可以勝任此項(xiàng)工作,且設(shè)計(jì)簡(jiǎn)單,考慮成本及體積因素,選用XX25-363[4];6)計(jì)算機(jī)數(shù)據(jù)傳輸選用以太網(wǎng),其速率快且上位機(jī)設(shè)計(jì)方便,經(jīng)實(shí)際計(jì)算,選用百兆以太網(wǎng)PHY 電路XX83848,其性能穩(wěn)定、使用簡(jiǎn)單,協(xié)議部分由FPGA 完成;7)系統(tǒng)中的電源采用多路DC-DC,模擬電源單獨(dú)加低噪聲的LDO,時(shí)鐘以晶振直接提供,F(xiàn)PGA 的配置電路使用專用的PROM,型號(hào)為XX32P。

      3 采集終端實(shí)現(xiàn)

      3.1 硬件構(gòu)成

      考慮到系統(tǒng)鏈路較為復(fù)雜,本研究主要論述系統(tǒng)的聲音采集部分,XX73311 是一款功能強(qiáng)大的語音芯片,其內(nèi)部包括1 路16 位Σ-Δ 型ADC、1 路16 位DAC、輸入輸出增益模塊、基準(zhǔn)等結(jié)構(gòu),支持3.3 V 或5 V 2 種電源電壓。采用SPI 接口傳輸配置及數(shù)據(jù)信息,輸入可選交直流耦合模式,最終輸入端口信號(hào)需滿足電壓要求。考慮5 V 供電的共模電壓對(duì)AMP 的適配性更好,XX73311 及XX6362 均采用5 V 供電。XX6362 承接前端拾音器單端信號(hào),差分輸出給XX73311,XX73311 的數(shù)字接口電壓跟隨電源電壓,因FPGA 端口電壓為3.3 V,使用XX0108 適配兩端器件的接口電壓,時(shí)鐘選用16.384 MHz 典型頻率,采集終端硬件電路如圖2 所示。

      圖2 采集終端硬件電路

      3.2 XX73311 的配置

      XX73311 時(shí)鐘采用多級(jí)分頻,其中外部主時(shí)鐘MCLK 分頻后,DMCLK 作為內(nèi)部系統(tǒng)主時(shí)鐘,DMCLK 再次分頻后作為SPI 的時(shí)鐘SCLK,DMCLK/256 作為編碼時(shí)鐘。XX73311 的SPI 總線主要是主控型,SCLK 由其發(fā)出,每個(gè)信息須有FS 脈沖信號(hào)引領(lǐng)才能識(shí)別,并允許最多8 個(gè)器件級(jí)連,使用時(shí)需嚴(yán)格按照時(shí)序圖的設(shè)計(jì)。在總線中,XX73311 的讀寫使能位、地址位為1 個(gè)字節(jié),每個(gè)數(shù)據(jù)位或寄存器為1 個(gè)字節(jié),其內(nèi)部共有5 個(gè)功能寄存器。系統(tǒng)配置信息如表1 所示,寄存器用CR 表示,CR-E 默認(rèn)為初始值。

      表1 XX73311 配置表

      一般應(yīng)優(yōu)先配置寄存器B/C/D/E,然后配置寄存器A,使器件從編程模式轉(zhuǎn)為數(shù)據(jù)收發(fā)模式。XX73311可提供靈活的調(diào)試幫助,在編程模式中使能模擬回環(huán)(ALB)、數(shù)字回環(huán)(DLB)2 個(gè)回環(huán)模式,可輕松檢查模擬端或數(shù)字段的信號(hào)鏈路功能。

      4 聲音分類的實(shí)現(xiàn)

      4.1 工作流程

      本系統(tǒng)算法部分以計(jì)算機(jī)為平臺(tái),基于MATLAB完成,使用基于MATLAB GUI 的可視化設(shè)計(jì),既可以連續(xù)、實(shí)時(shí)地顯示聲音信號(hào),還可以對(duì)異常信息報(bào)警[5]。系統(tǒng)工作流程如圖3 所示。

      圖3 系統(tǒng)工作流程

      在研究階段選用部分公共場(chǎng)所常見聲音作為驗(yàn)證樣本,有汽車?guó)Q笛聲、人的說話聲、尖叫聲、哭聲、雷聲、狗叫聲、物體撞擊聲和爆炸聲等。根據(jù)聲音代表的信息,將其分為危險(xiǎn)聲源和一般聲源。尖叫聲和哭聲有可能表示有人受到侵害,爆炸聲則表示有人違反公共場(chǎng)所管理規(guī)定燃放煙花、爆竹等,將其列為危險(xiǎn)聲源,其余聲音為一般聲源[6]。

      4.2 聲音處理

      獲得聲音信號(hào)以后,為使信號(hào)的頻譜變得平坦,提高信號(hào)的高頻部分,保持在低頻到高頻的整個(gè)頻段中,能用同樣的信噪比求頻譜,系統(tǒng)需對(duì)聲音信號(hào)進(jìn)行預(yù)加重處理。預(yù)加重有多重形式,本設(shè)計(jì)選用數(shù)字濾波器實(shí)現(xiàn),對(duì)n 時(shí)刻的采樣值x(n)預(yù)加重,得值y(n)為:

      式中a 是預(yù)加重系數(shù)。

      根據(jù)聲音信號(hào)的短時(shí)平穩(wěn)性特點(diǎn),系統(tǒng)對(duì)聲音信號(hào)進(jìn)行分幀處理。為使特征參數(shù)平滑變化,在分幀過程中,系統(tǒng)采用部分重疊的辦法實(shí)現(xiàn)過渡,使聲音特征平滑過渡,保持其連續(xù)性。聲音分幀的效果如圖4所示。

      圖4 音頻分幀

      對(duì)聲音信號(hào)x(n)的處理中進(jìn)行分幀。

      式(2)采用卷積形式,相當(dāng)于通過一個(gè)單位沖激響應(yīng)為ω(m)的FIR 濾波器。

      4.3 聲音能量檢測(cè)

      短時(shí)能量高是異常聲音最突出的表現(xiàn),實(shí)時(shí)計(jì)算聲音能量既可監(jiān)測(cè)聲音強(qiáng)度,又可劃定異常聲音范圍。采用雙門限法可提取異常聲音段[7]。以一段0.3 s 的聲音信號(hào)為例,其聲音波形和對(duì)應(yīng)的短時(shí)能量波形如圖5 所示。

      圖5 中TH 為設(shè)定的高門限,TL 為設(shè)定的低門限,首先對(duì)聲音信號(hào)進(jìn)行逐幀判斷,當(dāng)某幀能量幅值高于TH 時(shí),往兩邊尋找聲音邊界TL,當(dāng)某幀能量幅值小于TL 時(shí),即認(rèn)為聲音結(jié)束。

      圖5 門限值與能量波形對(duì)比

      4.4 MFCC 特征參數(shù)提取

      在得到聲音段的起始幀以后,系統(tǒng)需要提取異常聲音段的特征參數(shù),常用的特征參數(shù)有線性預(yù)測(cè)倒譜系數(shù)(LPCC)和Mel 頻率倒譜系數(shù)(MFCC),鑒于MFCC 在信噪比降低時(shí)的良好識(shí)別性能,同時(shí)較好地利用聽覺模型的研究成果,本研究選用MFCC[8]。MFCC 是在Mel 標(biāo)度頻率域提取出來的倒譜系數(shù),其特征參數(shù)提取原理如圖6 所示。

      圖6 MFCC 特征參數(shù)提取原理

      對(duì)聲音樣本取幀長(zhǎng)256、幀移128 進(jìn)行預(yù)處理、端點(diǎn)檢測(cè)、提取MFCC,對(duì)樣本的參數(shù)按聲音類別合成匹配文件模板庫,由8 類模板庫組成總模板庫。部分聲音的MFCC 特征參數(shù)三維圖像如圖7 所示,從圖7 中可以很直觀地觀察到信號(hào)的MFCC 隨Mel 階數(shù)的變化情況,不同聲音類別之間區(qū)別明顯。

      圖7 MFCC 特征參數(shù)三維對(duì)比圖

      4.5 BP 神經(jīng)網(wǎng)絡(luò)分類

      聲音識(shí)別屬于模式識(shí)別的應(yīng)用范疇[9],在聲音識(shí)別的發(fā)展過程中,有動(dòng)態(tài)彎折算法[10]、隱馬爾可夫模型[11]、高斯混合模型[12]、神經(jīng)網(wǎng)絡(luò)[13]、支持向量機(jī)[14]等多種算法,本研究只需要識(shí)別出聲音的幾種類別,應(yīng)用相對(duì)簡(jiǎn)單,因此選用算法成熟、工具箱函數(shù)豐富的BP 神經(jīng)網(wǎng)絡(luò)算法。

      以MFCC 模板庫作為BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,對(duì)數(shù)據(jù)進(jìn)行歸一化處理。BP 算法建模包括BP 神經(jīng)網(wǎng)絡(luò)的構(gòu)建、BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和BP 神經(jīng)網(wǎng)絡(luò)分類3步。首先是BP 神經(jīng)網(wǎng)絡(luò)的初始化,模型拓?fù)浣Y(jié)構(gòu)包括輸入層、隱含層和輸出層,本研究采用12 階的MFCC,所以BP 神經(jīng)網(wǎng)絡(luò)輸入層的神經(jīng)元個(gè)數(shù)是12,網(wǎng)絡(luò)輸出神經(jīng)元取4 個(gè),目標(biāo)輸出一個(gè)4 位二進(jìn)制數(shù),足以表示8 類樣本,隱含層設(shè)置為15 個(gè)神經(jīng)元。取學(xué)習(xí)率0.1,訓(xùn)練誤差0.01,訓(xùn)練次數(shù)2000 次,2 次顯示之間的訓(xùn)練步長(zhǎng)為10,隱含層神經(jīng)元的傳遞函數(shù)采用S 型正切函數(shù),由于輸出模式為0-1,輸出層神經(jīng)元的傳遞函數(shù)采用S 型對(duì)數(shù)正切函數(shù)f(x),

      式中β 為常數(shù),用于控制曲線扭曲部分的斜率。

      在網(wǎng)絡(luò)訓(xùn)練階段根據(jù)預(yù)測(cè)誤差調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值。定向?qū)Ρ蠕浿频臉颖就惵曉?,輸入上述?xùn)練好的神經(jīng)網(wǎng)絡(luò),得到幀特征平均分類成功率,BP 神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果如表2 所示。

      表2 BP 神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果

      表2 是逐一輸入單一聲音源的識(shí)別結(jié)果,若要排除其他聲音尤其是混合聲音需要大量的聲音樣本做訓(xùn)練,有可能還需要提取更多特征參數(shù)以提高識(shí)別精度[15],并且隨著復(fù)雜度的增加,識(shí)別效果會(huì)降低。本試驗(yàn)主要驗(yàn)證系統(tǒng)的可行性,因此只是在音源位置等固定的情況下識(shí)別聲音信號(hào)。

      通過實(shí)測(cè),系統(tǒng)能夠檢測(cè)出異常聲音段并判斷是否為危險(xiǎn)信號(hào),如是危險(xiǎn)信號(hào)則給出報(bào)警信息。接到報(bào)警信息,值班人員可查看歷史記錄,重聽保存的報(bào)警信息,通過錄像或赴現(xiàn)場(chǎng)勘查異常并予以解決。

      5 結(jié)論

      本研究通過對(duì)聲音信號(hào)進(jìn)行預(yù)處理、計(jì)算幀短時(shí)能量,給出環(huán)境實(shí)時(shí)聲音幅度參數(shù),作為環(huán)境聲音的第一級(jí)監(jiān)測(cè);然后通過端點(diǎn)檢測(cè)技術(shù)區(qū)分出有別于常規(guī)環(huán)境噪聲的有聲段,提取有聲段MFCC 參數(shù),用BP神經(jīng)網(wǎng)絡(luò)對(duì)參數(shù)分類,對(duì)代表危險(xiǎn)信息的聲音給出報(bào)警信息,作為環(huán)境聲音的第二級(jí)監(jiān)測(cè)。

      今后的研究重點(diǎn)一是考慮遠(yuǎn)端直接識(shí)別,直接給出判斷信息,減小遠(yuǎn)距離數(shù)據(jù)傳輸量,為此考慮使用高性能DSP;二是提高復(fù)雜環(huán)境下的識(shí)別率,考慮從聲音的基音、共振峰、譜熵等多方面進(jìn)行分析,構(gòu)建包含多種特征信息的混合參數(shù)作為分類計(jì)算的依據(jù),將近年來模式識(shí)別學(xué)科的發(fā)展成果運(yùn)用到聲音識(shí)別中,以期獲得更好的效果。

      猜你喜歡
      特征參數(shù)時(shí)鐘報(bào)警
      故障診斷中信號(hào)特征參數(shù)擇取方法
      別樣的“時(shí)鐘”
      基于特征參數(shù)化的木工CAD/CAM系統(tǒng)
      古代的時(shí)鐘
      LKD2-HS型列控中心驅(qū)采不一致報(bào)警處理
      基于PSO-VMD的齒輪特征參數(shù)提取方法研究
      有趣的時(shí)鐘
      2015款奔馳E180車安全氣囊報(bào)警
      時(shí)鐘會(huì)開“花”
      死于密室的租住者
      龙南县| 壶关县| 绍兴县| 乌鲁木齐县| 中山市| 隆化县| 改则县| 淮南市| 子长县| 大兴区| 芒康县| 垣曲县| 连州市| 寿光市| 吴堡县| 娱乐| 南部县| 山阳县| 南投县| 临汾市| 兴国县| 临漳县| 淮北市| 铜鼓县| 凤凰县| 南岸区| 阳江市| 河南省| 梅河口市| 岳西县| 阜宁县| 孝义市| 如皋市| 浮山县| 开封县| 娄烦县| 关岭| 玛曲县| 砚山县| 西城区| 马山县|