• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      音頻信號(hào)高維矢量編碼算法研究

      2019-08-12 06:15楊超孫云黃雋逸徐向旭孫保良
      現(xiàn)代電子技術(shù) 2019年15期
      關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò)

      楊超 孫云 黃雋逸 徐向旭 孫保良

      摘 ?要: 在音頻信號(hào)編碼中,提出在線性預(yù)測(cè)編碼、SOM神經(jīng)網(wǎng)絡(luò)矢量編碼以及Huffman編碼相結(jié)合的聲音信號(hào)聯(lián)合編碼算法的基礎(chǔ)上,通過將聲音量化編碼算法中原有的2維量化矢量的維數(shù)增加,以進(jìn)一步減小聲音信號(hào)碼率的方法。利用Matlab軟件編程進(jìn)行不同量化矢量維數(shù)條件下的聲音信號(hào)編解碼實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,在保證聲音質(zhì)量的前提下,通過提高量化矢量維數(shù),可使聯(lián)合編碼的最低碼率在音頻編碼格式Opus碼率的范圍內(nèi),且接近Opus碼率的下限。文中提出的編碼算法可為音頻壓縮編碼的進(jìn)一步研究提供參考。

      關(guān)鍵詞: 音頻信號(hào); 矢量編碼; 神經(jīng)網(wǎng)絡(luò); 壓縮編碼; 高維矢量; 預(yù)測(cè)編碼

      中圖分類號(hào): TN911?34 ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2019)15?0043?04

      Research on high dimension vector encoding algorithm for audio signal

      YANG Chao1, SUN Yun2,HUANG Junyi1,XU Xiangxu3,SUN Baoliang1,

      (1. Naval Aeronautics and Aviation University, Yantai 264001, China;

      2. Unit 91604 of PLA, Longkou 265706, China; 3. Unit 92635 of PLA, Qingdao 266041, China)

      Abstract: On the basis of a combination of linear predictive coding, SOM neural network vector coding and Huffman coding (Hereinafter referred to as the joint coding for short), a method of reducing the coding rate of sound signals is proposed in the audio signal coding by means of increasing the dimension of the original 2D quantization vector in the audio quantization coding algorithm. Matlab software is used to carry out the experiment of sound signal coding and decoding under the condition of different quantization vector dimensions. The experimental results show that, on the premise of guaranteeing the sound quality, the method can make the minimum code rate of the joint coding be within the range of the Opus code rate in the audio coding format and close to the lower limit of the Opus code rate by improving the quantization vector dimension. The coding algorithm proposed in this paper can provide a reference for further research of audio compression coding.

      Keyword: audio signal; vector coding; neural network; compression coding; high dimensional vector; predictive coding

      0 ?引 ?言

      音頻壓縮已經(jīng)廣泛應(yīng)用于消費(fèi)類和專業(yè)級(jí)的音頻產(chǎn)品、互聯(lián)網(wǎng)應(yīng)用、遠(yuǎn)程醫(yī)療和錄放系統(tǒng)中。在現(xiàn)代通信系統(tǒng)中,隨著帶寬和存儲(chǔ)容量需求的不斷增長(zhǎng)[1?3],音頻編碼研究也越來越受到重視。當(dāng)前最新的低延時(shí)音頻編碼格式Opus對(duì)于互聯(lián)網(wǎng)上的交互式聲音和音樂傳輸來說是最佳的選擇,同時(shí)也應(yīng)用于存儲(chǔ)和流媒體中。一些新的音頻編碼算法也在不斷涌現(xiàn),例如,一種將預(yù)測(cè)編碼[4]、基于SOM自組織神經(jīng)網(wǎng)絡(luò)[5?8]的矢量編碼[4,9?10]及Huffman[11]編碼相結(jié)合的音頻編碼算法[12](以下簡(jiǎn)稱聯(lián)合編碼算法)。在保證聲音質(zhì)量的前提下,該編碼方法的碼率小于MEPG?1 Layer3的最低64 Kb/s標(biāo)準(zhǔn)碼率,本文通過提高聲音信號(hào)聯(lián)合編碼中的量化矢量的維數(shù)以減小聯(lián)合編碼的碼率。

      1 ?2維聯(lián)合編碼算法

      圖1是2維聯(lián)合編碼算法編碼程序流程圖。首先,將1列聲音采樣信號(hào)按照奇偶順序轉(zhuǎn)換成2列,即將原序號(hào)為([2×n-1])的信號(hào)組成新的第1列,原序號(hào)為[2×n]的信號(hào)組成新的第2列,其中[n]為正整數(shù)。每列信號(hào)分別按照線性預(yù)測(cè)編碼原理各自進(jìn)行預(yù)測(cè),計(jì)算當(dāng)前的預(yù)測(cè)值和誤差值,共得到2個(gè)誤差值,將該2個(gè)誤差值組成一組2維矢量,進(jìn)行基于自組織神經(jīng)網(wǎng)絡(luò)的矢量編碼。恢復(fù)聲音時(shí),譯碼過程與編碼過程相反得到誤差值,同時(shí)對(duì)兩列信號(hào)的誤差值進(jìn)行基于自組織神經(jīng)網(wǎng)絡(luò)的矢量編碼。恢復(fù)聲音時(shí),譯碼過程與編碼過程相反,最后對(duì)譯碼數(shù)據(jù)用切比雪夫Ⅰ型濾波器濾波。

      圖1 ?2維聯(lián)合編碼算法編碼程序流程圖

      2 ?高維聯(lián)合編碼算法實(shí)驗(yàn)結(jié)果與分析

      本文將提高2維聯(lián)合編碼算法中量化矢量的維數(shù),研究量化維數(shù)對(duì)碼率的影響,旨在尋找進(jìn)一步減小碼率的算法。考慮到編碼效率,一般維數(shù)選為[2n],[n]為正整數(shù)。實(shí)驗(yàn)中,選取量化維數(shù)分別為2維、4維和8維的編碼算法進(jìn)行實(shí)驗(yàn)。[m]維矢量編碼過程如下:首先將1列聲音采樣信號(hào)按照順序轉(zhuǎn)換成[m]列,即將原序號(hào)為([m×n+i])的數(shù)據(jù)組成為新的第[i]列,其中[n]取值為自然數(shù),[i]取值為[1~m]的整數(shù)。每列信號(hào)分別按照線性預(yù)測(cè)編碼原理各自進(jìn)行預(yù)測(cè),計(jì)算當(dāng)前的預(yù)測(cè)值和誤差值,共得到[m]個(gè)誤差值,將這[m]個(gè)誤差值組成一組[m]維矢量,進(jìn)行基于SOM自組織神經(jīng)網(wǎng)絡(luò)的4維矢量量化,然后進(jìn)行Huffman編碼;譯碼過程與編碼過程相反,最后對(duì)譯碼數(shù)據(jù)用切比雪夫Ⅰ型濾波器濾波。

      為了研究高維矢量聯(lián)合編碼,選擇標(biāo)準(zhǔn)聲音庫中“雷聲”這個(gè)日常生活中具有代表性的聲音作為研究對(duì)象。其中,聲音“雷聲”時(shí)域信號(hào)的采樣率為11 025 Hz,量化精度為8 bit。

      基于SOM的神經(jīng)網(wǎng)絡(luò)的碼本訓(xùn)練次數(shù)為300。聯(lián)合編碼的譯碼端低通濾波器的通帶截止頻率設(shè)為2 500 Hz,阻帶截止頻率設(shè)為3 750 Hz,通帶波紋設(shè)為0.3 dB,阻帶衰減設(shè)為10 dB。

      表1是對(duì)聲音“雷聲”信號(hào)譯碼結(jié)果,其中,第4列是MOS值,是主觀聲音質(zhì)量的定量描述。目前在國(guó)際上比較通用的音頻質(zhì)量主觀評(píng)價(jià)標(biāo)準(zhǔn)是平均意見得分(Mean Opinion Score,MOS),MOS評(píng)分標(biāo)準(zhǔn)分為五級(jí),在數(shù)字音頻通信中,一般高質(zhì)量數(shù)字化音頻的MOS值在4.0~4.5分之間,質(zhì)量滿足長(zhǎng)途電話網(wǎng)的要求,接近于透明信道編碼,也常稱為網(wǎng)絡(luò)質(zhì)量。音頻通信質(zhì)量一般MOS值在3.5分左右,此時(shí)能夠感覺到恢復(fù)的音頻質(zhì)量有所下降,但能夠知道聲音中的內(nèi)容,可以滿足多數(shù)音頻通信系統(tǒng)的適用要求。合成語音質(zhì)量MOS值一般在2.0~3.0分之間,是指一些聲碼器的合成語音所能達(dá)到的質(zhì)量,一般具有一定的可懂度,但是自然度和音色的確認(rèn)方面不夠理想。第5列是主觀聲音質(zhì)量的定性描述,質(zhì)量為“壞”,表示聲音質(zhì)量“不可忍受”;質(zhì)量為“差”,表示“明顯察覺且可厭但可忍受”;質(zhì)量為“可”,表示“有察覺且稍覺可厭”。第6列是碼率。

      表1 ?“雷聲”聲音信號(hào)譯碼結(jié)果

      由表1可知,2維聯(lián)合編碼在碼書長(zhǎng)度為2時(shí),雖然碼率為5.513 Kb/s,但是譯碼聲音質(zhì)量“壞”,不能用。當(dāng)碼元矢量為2維、碼書長(zhǎng)度為4時(shí),以及碼元矢量為4維、碼書長(zhǎng)度為16時(shí),碼率為11.025 Kb/s,譯碼聲音質(zhì)量為“差”,雖然音色不夠理想,但是具有可懂度,可以用于通信。由表1可知,當(dāng)碼元矢量為8維、碼書長(zhǎng)度為64時(shí),譯碼聲音質(zhì)量為“差”,但此時(shí)碼率值為8.268 Kb/s,比相同的譯碼聲音質(zhì)量碼元維數(shù)為2和4時(shí)的碼率值11.025 Kb/s要小。所以,將碼元矢量的維數(shù)提高,也就是采樣更高維的聯(lián)合編碼算法,在譯碼聲音質(zhì)量相同的條件下,高維聯(lián)合編碼的碼率較低維的聯(lián)合編碼算法可以達(dá)到更小的碼率。

      圖2是采用8維聯(lián)合編碼方法對(duì)聲音樣本“雷聲”的譯碼運(yùn)算結(jié)果,其中聯(lián)合編碼的碼書長(zhǎng)度為64,碼率為8.268 Kb/s,基于SOM的神經(jīng)網(wǎng)絡(luò)訓(xùn)練碼本的碼本訓(xùn)練次數(shù)為300。8維聯(lián)合編碼的譯碼端低通濾波器的通帶截止頻率設(shè)為2 500 Hz,阻帶截止頻率設(shè)為3 750 Hz,通帶波紋設(shè)為0.3 dB,阻帶衰減設(shè)為10 dB。

      圖2a)和圖2b)分別是原始聲音樣本信號(hào)“雷聲”的時(shí)域波形和頻譜;圖2c)和圖2d)分別是對(duì)圖2a)進(jìn)行聯(lián)合編碼所得到的聲音樣本“雷聲”的譯碼信號(hào)的時(shí)域波形和頻譜。由圖2a)和圖2c)可見,“雷聲”聲音信號(hào)譯碼信號(hào)的時(shí)域波形與原始信號(hào)的時(shí)域波形形狀基本一致;由圖2b)和圖2d)可見,“雷聲”聲音信號(hào)譯碼頻譜在頻率小于2 500 Hz的低頻部分與原始信號(hào)頻譜基本一致,大于2 500 Hz的高頻部分,能量較原始信號(hào)的小,但是,由于人耳對(duì)頻率大于2 500 Hz的高頻頻率部分敏感度小,所以,人耳聽到的譯碼聲音的內(nèi)容和原始聲音的內(nèi)容基本一致,但是音色略差。

      3 ?結(jié) ?論

      2維聯(lián)合編碼算法是一種預(yù)測(cè)編碼、SOM自主神經(jīng)網(wǎng)絡(luò)2維矢量編碼和Huffman編碼的聯(lián)合編碼,并在譯碼時(shí)用切比雪夫Ⅰ型濾波器對(duì)譯碼信號(hào)進(jìn)行濾波的算法。本文將2維聯(lián)合編碼算法中量化矢量的維數(shù)增加,研究了量化維數(shù)對(duì)壓縮率和碼率的影響,對(duì)同一聲音樣本分別用2維聯(lián)合編碼算法、4維聯(lián)合編碼算法和8維聯(lián)合編碼算法進(jìn)行編碼運(yùn)算,計(jì)算結(jié)果表明,在保證譯碼恢復(fù)聲音質(zhì)量良好的條件下,增加2維聯(lián)合編碼算法的量化矢量維數(shù)可以減小碼率。其中 ,采樣率為11 025 Hz、量化精度為8 bit、量化矢量為8維且碼書長(zhǎng)度為64的聯(lián)合編碼算法甚至可以達(dá)到最小碼率8.268 Kb/s。當(dāng)前用于存儲(chǔ)和流媒體應(yīng)用、互聯(lián)網(wǎng)上的交互式聲音和音樂傳輸?shù)淖钚碌牡脱訒r(shí)音頻編碼格式Opus的采樣率為8~48 kHz,它的碼率范圍為6~510 Kb/s,可見,高維聯(lián)合編碼的最低碼率在音頻編碼格式Opus碼率的范圍內(nèi),且接近Opus碼率的下限。因此,音頻高維聯(lián)合編碼算法將會(huì)有廣闊的應(yīng)用前景。

      圖2 ?“雷聲”聲音信號(hào)的原始信號(hào)和譯碼恢復(fù)信號(hào)

      參考文獻(xiàn)

      [1] 丁榮格.音頻編碼技術(shù)在數(shù)字化傳輸中的應(yīng)用[J].計(jì)算機(jī)與網(wǎng)絡(luò),2013,39(13):50?52.

      DING Rongge. The application of audio coding technology in digital transmission [J]. Computer and network, 2013, 39(13): 50?52.

      [2] 楊可歆.音頻編碼技術(shù)在數(shù)字化傳輸中的應(yīng)用探究[J].科技創(chuàng)新與應(yīng)用,2015(16):89.

      YANG Kexin. Application of audio coding technology in digital transmission [J]. Technology innovation and application, 2015(16): 89.

      [3] 張楊.音頻編碼技術(shù)及廣播電臺(tái)數(shù)字編碼壓縮傳輸系統(tǒng)建設(shè)[J].科技傳播,2015(11):113?115.

      ZHANG Yang. Audio coding technology and digital coding compression transmission system construction of radio station [J]. Science and technology communication, 2015(11): 113?115.

      [4] 樊昌信,曹麗娜.通信原理[M].7版.北京:國(guó)防工業(yè)出版社,2015:302?305.

      FAN Changxin, CAO Lina. Principle of communication [M]. 7th ed. Beijing: National Defense Industry Press, 2015: 302?305.

      [5] 陳明.神經(jīng)網(wǎng)絡(luò)原理與實(shí)例精解[M].北京:清華大學(xué)出版社,2013:246?250.

      CHEN Ming. The neural network principle and example [M]. Beijing: Tsinghua University Press, 2013: 246?250.

      [6] 王龍,杜敦偉,白艷萍.基于SVM和SOM的雷達(dá)目標(biāo)識(shí)別[J].科技視界,2015(16):505?509.

      WANG Long, DU Dunwei, BAI Yanping. Radar target recognition based on SVM and SOM [J]. Science & technology vision, 2015(16): 505?509.

      [7] 楊晨,閆薇.利用SOM網(wǎng)絡(luò)模型進(jìn)行聚類研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(2):44?45.

      YANG Chen, YAN Wei. Research on the clustering by using SOM network model [J]. Net security technologies and application, 2014(2): 44?45.

      [8] 鄒瑜,帥仁俊.基于改進(jìn)的SOM神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像分割算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2016,37(9):2533?2537.

      ZOU Yu, SHUAI Renjun. Improved segmentation algorithm of medical images based on SOM neural network [J]. Communication technology, 2016, 37(9): 2533?2537.

      [9] 楊超,賀一君,任建存,等.碼本均衡矢量編碼算法[J].現(xiàn)代電子技術(shù),2016,39(13):38?40.

      YANG Chao, HE Yijun, REN Jiancun, et al. Codebook equilibrium algorithm for vector coding [J]. Modern electronics technique, 2016, 39(13): 38?40.

      [10] 楊超,董世錕.矢量量化圖像壓縮方法[J]. 海軍航空工程學(xué)院學(xué)報(bào),2011,26(1):11?14.

      YANG Chao, DONG Shikun. Image compresion method beased on vector quantization [J]. Journal of Naval Aeronautical and Astronautic University, 2011, 26(1): 11?14.

      [11] 孟歡,包海燕,潘飛.Xilinx哈夫曼編碼系統(tǒng)設(shè)計(jì)[J].電子產(chǎn)品世界,2017(11):51?54.

      MENG Huan, BAO Haiyan, PAN Fei. Design of Xilinx Huffman coding system [J]. Electronic engineering & product world, 2017(11): 51?54.

      [12] 楊超,徐向旭,劉云飛,等. 音頻信號(hào)矢量編碼算法[J].海軍航空工程學(xué)院學(xué)報(bào),2018,33(2):201?204.

      YANG Chao, XU Xiangxu, LIU Yunfei, et al. Vector coding algorithm for audio signal [J]. Journal of Naval Aeronautical and Astronautic University, 2018, 33(2): 201?204.

      猜你喜歡
      神經(jīng)網(wǎng)絡(luò)
      基于遞歸模糊神經(jīng)網(wǎng)絡(luò)的風(fēng)電平滑控制策略
      BP神經(jīng)網(wǎng)絡(luò)在路標(biāo)識(shí)別上的應(yīng)用研究
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      基于Alexnet神經(jīng)網(wǎng)絡(luò)的物體識(shí)別研究
      基于BP神經(jīng)網(wǎng)絡(luò)的旋轉(zhuǎn)血泵生理控制
      基于神經(jīng)網(wǎng)絡(luò)MRAS的速度辨識(shí)仿真研究
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
      基于神經(jīng)網(wǎng)絡(luò)分?jǐn)?shù)階控制的逆變電源
      高邑县| 常山县| 巴青县| 阜宁县| 克山县| 遵化市| 乌鲁木齐县| 绥宁县| 正镶白旗| 海门市| 宁化县| 都江堰市| 富宁县| 荃湾区| 绥棱县| 龙口市| 万年县| 连城县| 灌阳县| 宁明县| 梁平县| 玉田县| 锡林郭勒盟| 克什克腾旗| 盱眙县| 吴川市| 崇明县| 正镶白旗| 安达市| 同江市| 时尚| 新乐市| 三明市| 太原市| 新泰市| 紫云| 怀仁县| 保亭| 讷河市| 通江县| 淮南市|