范凌云 周婧
摘 要: 音階識別方法不能結(jié)合樂音的物理和音樂特性,造成樂音處理信號量雜亂無序。針對該問題,通過復(fù)音音高確定轉(zhuǎn)錄音符集合,引入頻譜圖、譜平滑性和調(diào)和性估計(jì)建立HMM模型。分析對比實(shí)驗(yàn)結(jié)果表明,HMM模型可以完成樂音物理與音樂特性結(jié)合,改善樂音處理信號量雜亂無序現(xiàn)象。
關(guān)鍵詞: 音階識別; 合理性模式; 校對方法; HMM模型; 譜平滑性; 樂音處理
中圖分類號: TN781?34; TP277 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2018)08?0160?03
Abstract: In the musical scale recognition method, physical and musical features of the musical tone cannot be combined, which causes randomness of music tone processing signals. To resolve this problem, the notes set is determined and transcribed by using complex tone pitches. Diagram of spectrum and estimation of spectrum smoothness and harmonicity are introduced to construct the HMM model. The analysis results of comparison experiment show that the HMM model can complete the combination of musical tones′ physical and musical features, and improve the randomness phenomenon of music tone processing signals.
Keywords: musical scale recognition; rationality pattern; proofreading method; HMM model; spectrum smoothness; music tone processing
應(yīng)用專業(yè)的語音識別軟件,并結(jié)合計(jì)算機(jī)的專業(yè)分析,是現(xiàn)有音樂識別方法的主要校對形式。但由于操作手段上的局限性,這種方法不能很好地結(jié)合樂音的物理特性和音樂特性,這也使樂音處理信號量顯得十分雜亂無序[1?2]。本文針對上述問題,通過RFTI復(fù)音音高合理性識別,應(yīng)用頻率域和時間域?qū)σ舴M(jìn)行識別的方法,建立了復(fù)音音高的音階合理性識別方法。并基于此方法,獲取ISTFT和頻譜圖,引用譜平滑性和調(diào)和性估計(jì),建立HMM模型。由實(shí)驗(yàn)對比可知,本文所提出的HMM模型可完成樂音物理與音樂特性結(jié)合,改善樂音處理信號量雜亂無序現(xiàn)象。
1.1 用頻率域和時間域確定轉(zhuǎn)錄音符
首先,根據(jù)式(1)確定符合描述特征的音符譜峰,再將這些音符譜峰按照峰類別的不同進(jìn)行分類,最后確立可通過頻率域和時間域進(jìn)行轉(zhuǎn)錄的音符集合。令瞬時頻率與中心頻率的差值[RTFIr(t,?)]滿足譜峰選擇分類方法,則有:
1.2 RTFI復(fù)音音高合理性識別
RTFI復(fù)音音高合理性識別原理是一種基于頻率的時頻分析工具,通常情況下,該原理定義一個函數(shù)的頻率指數(shù)衰減因子,從濾波共鳴系統(tǒng)中衰減映射[5?6]。為了保證該原理的穩(wěn)定性,引入諧振濾波器的脈沖響應(yīng)用[I]表示,則:
上述步驟完成了可轉(zhuǎn)錄音符集合的確定,這也為后續(xù)過程音符的抓取提供了方便。為了更好地對音樂音階的合理性模式進(jìn)行識別校對[3],還需按照如下方法,搭建HMM音階識別模型。
2.1 STFT和頻譜圖的獲取
2.2 譜平滑性和調(diào)和性估計(jì)
通過循環(huán)的方式,找出上述頻譜圖中的基音和泛音,再將基音進(jìn)行存儲,并從頻譜圖中將此部分聲音消除。對于剩余部分的聲音信號來說,依然對其進(jìn)行上述循環(huán)處理,這樣就可以完成對聲音信號的譜平滑性和調(diào)和性估計(jì)[9]。其主要工作原理如圖1所示。
2.3 應(yīng)用HMM模型完成音階的校對
HMM音階識別模型,描述頻譜圖觀察情況與真實(shí)情況之間的關(guān)系,該模型解決了傳統(tǒng)模型信號不穩(wěn)定的問題,又利用統(tǒng)計(jì)學(xué)理論解決了各信號段之間的轉(zhuǎn)化問題。對于HMM模型來說,不僅可體現(xiàn)音階的瞬時變化,也可以利用這種動態(tài)的變化,促使音階在短時間內(nèi)達(dá)到平穩(wěn)狀態(tài)。
本文以專業(yè)表演用的立式鋼琴作為實(shí)驗(yàn)對象,分別彈奏do~si,7個單獨(dú)的音階,并應(yīng)用HMM模型和普通模型,對這7個音階進(jìn)行識別校對,具體實(shí)驗(yàn)過程如下。
3.1 實(shí)驗(yàn)參數(shù)設(shè)置
實(shí)驗(yàn)參數(shù)設(shè)置如表1所示。
3.2 音階物理特性檢測對比
在彈奏do~si七個音階的過程中,分別應(yīng)用HMM模型與普通模型,對各個音階的物理特性進(jìn)行檢測,檢測結(jié)果如圖2所示。
圖2中位于標(biāo)準(zhǔn)曲線上的各點(diǎn),從下到上依次代表do~si。通過觀察可以發(fā)現(xiàn),運(yùn)用HMM模式進(jìn)行檢測的結(jié)果,均勻分布與標(biāo)準(zhǔn)曲線兩側(cè),且各檢測結(jié)果與標(biāo)準(zhǔn)曲線的距離基本保持一致。而運(yùn)用普通模型進(jìn)行檢測的結(jié)果,下半部分與標(biāo)準(zhǔn)曲線距離遠(yuǎn),上半部分與標(biāo)準(zhǔn)曲線距離近,且各檢測結(jié)果與標(biāo)準(zhǔn)曲線距離也都不相同。應(yīng)用普通模型對音階進(jìn)行音樂特性檢測所得圖像,不會與其物理特性檢測圖像具有明顯的對稱關(guān)系,而所設(shè)計(jì)HMM模型可更好地表達(dá)音階物理特性。
3.3 音階音樂特性檢測對比
在記錄上述物理特性檢測結(jié)果的基礎(chǔ)上,再次彈奏do~si這7個音階,分別應(yīng)用HMM模型與普通模型,對各個音階的音樂特性進(jìn)行檢測,檢測結(jié)果如圖3所示。
通過觀察可以發(fā)現(xiàn),運(yùn)用HMM模式進(jìn)行檢測的結(jié)果,均勻分布與標(biāo)準(zhǔn)曲線兩側(cè),且各檢測結(jié)果與標(biāo)準(zhǔn)曲線的距離基本保持一致。而運(yùn)用普通模型進(jìn)行檢測的結(jié)果,上半部分與標(biāo)準(zhǔn)曲線距離遠(yuǎn),下半部分與標(biāo)準(zhǔn)曲線距離近,且各檢測結(jié)果與標(biāo)準(zhǔn)曲線的距離也都不相同。因此,本文所設(shè)計(jì)的HMM模型可以更好地表達(dá)音階的音樂特性。
本文通過復(fù)音音高確定轉(zhuǎn)錄音符集合,又在此基礎(chǔ)上,引入頻譜圖、譜平滑性和調(diào)和性估計(jì),并根據(jù)此建立了HMM音階檢測模型[10]。通過本文設(shè)計(jì)的分析對比試驗(yàn),證明HMM模型確實(shí)能夠完成樂音物理與音樂特性結(jié)合,改善樂音處理信號量雜亂無序現(xiàn)象。
參考文獻(xiàn)
[1] 張世超,陳琦,呂杰.基于DPP的自動音符切分識別研究[J].電子產(chǎn)品世界,2016,23(5):28?30.
ZHANG Shichao, CHEN Qi, L? Jie. The study of automatic notes segmentation and recognition based on DPP [J]. Qutlook of electronic technology, 2016, 23(5): 28?30.
[2] 崔瑋.改進(jìn)的D?S證據(jù)理論在海上目標(biāo)融合識別模型中的應(yīng)用[J].艦船科學(xué)技術(shù),2017(8):109?111.
CUI Wei. The application of improved D?S proof theory in the model of sea target fusion recognition [J]. Ship science and technology, 2017(8): 109?111.
[3] 石云波,楊志才,曹慧亮,等.高量程加速度計(jì)動態(tài)線性校準(zhǔn)系統(tǒng)[J].光學(xué)精密工程,2016,24(2):381?389.
SHI Yunbo, YANG Zhicai, CAO Huiliang, et al. Dynamic linearity calibration system for accelerometers with high measurement range [J]. Optics and precision engineering, 2016, 24(2): 381?389.
[4] 黃鵬,王青,俞慈君,等.飛機(jī)附件數(shù)字化校準(zhǔn)系統(tǒng)的開發(fā)與應(yīng)用[J].計(jì)算機(jī)集成制造系統(tǒng),2015,21(12):3271?3281.
HUANG Peng, WANG Qing, YU Cijun, et al. Development and implementation for digital alignment system of aircraft accessories [J]. Computer integrated manufacturing systems, 2015, 21(12): 3271?3281.
[5] 王楊,劉以安,張強(qiáng).改進(jìn)的D?S證據(jù)理論在戰(zhàn)場目標(biāo)識別中的應(yīng)用[J].彈箭與制導(dǎo)學(xué)報,2015(2):156?158.
WANG Yang, LIU Yian, ZHANG Qiang. Application of target identification in battlefield based on improved D?S evidence theory [J]. Journal of projectiles, rockets, missiles and guidance, 2015(2): 156?158.
[6] 馬云彤.數(shù)字出版時代電子化校對模式探討[J].中國科技期刊研究,2015,26(12):1282?1288.
MA Yuntong. Electronic proofreading modes in the digital publishing era [J]. Chinese journal of scientific and technical periodicals, 2015, 26(12): 1282?1288.
[7] 由睿.用“音符評價法”輔助音樂教學(xué):淺談低學(xué)段五線譜學(xué)習(xí)方法[J].中國音樂教育,2015(2):35?37.
YOU Rui. Stave learning method for the pre?schools [J]. China music education, 2015(2): 35?37.
[8] 崔立紅,趙維寧,顏昌翔.高斯光束與諧振腔基模模式光路諧振匹配的分析與校準(zhǔn)[J].物理學(xué)報,2015,64(22):206?214.
CUI Lihong, ZHAO Weining, YAN Changxiang. Analysis and alignment of the light path of Gauss beam matched to the fundamental mode of an optical resonator [J]. Acta physica sinica, 2015, 64(22): 206?214.
[9] 周蘇娟,趙斌,孟江,等.基于BP神經(jīng)網(wǎng)絡(luò)和遺傳算法優(yōu)化茺蔚子水蘇堿提取工藝的研究[J].廣州中醫(yī)藥大學(xué)學(xué)報,2015(4):735?738.
ZHOU Sujuan, ZHAO Bin, MENG Jiang, et al. Optimization of preparation technology of stachydrine in fructus leonuri based on back?propagation neural network and genetic algorithm [J]. Journal of Guangzhou University of Traditional Chinese Medicine, 2015(4): 735?738.
[10] 普布旦增,關(guān)白.基于統(tǒng)計(jì)的藏文音節(jié)字校對系統(tǒng)開發(fā)研究[J].西藏大學(xué)學(xué)報,2015,30(1):74?78.
PUBU Danzeng, GUAN bai. Development of proofreading Tibetan syllables word system based on statistics [J]. Journal of Tibet University, 2015, 30(1): 74?78.