王海龍,柳 林*,紀(jì)文璐,裴冬梅,賀 宇,梁慧珠
(1 內(nèi)蒙古師范大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,內(nèi)蒙古 呼和浩特 010020;2 內(nèi)蒙古師范大學(xué) 音樂學(xué)院,內(nèi)蒙古 呼和浩特 010020)
蒙古族是我國(guó)主要的少數(shù)民族之一,蒙古族人民留存了數(shù)量眾多讓世人嘆為觀止的文化遺產(chǎn),以音樂、歌舞為主的蒙古族特色傳統(tǒng)文化尤為突出[1]。2008年,蒙古族民歌被國(guó)務(wù)院列入第二批國(guó)家非物質(zhì)文化遺產(chǎn)[2]。但是,由于傳統(tǒng)方式的傳承缺陷和信息時(shí)代的快速發(fā)展,蒙古族經(jīng)典民間音樂的生存空間日益縮小,將蒙古族民間音樂數(shù)字化是保護(hù)其傳承和發(fā)展的重要手段。蒙古族民間音樂數(shù)字化不僅是對(duì)民族特色文化的守護(hù),也是對(duì)其社會(huì)影響、經(jīng)濟(jì)效益等的兼顧。當(dāng)前大數(shù)據(jù)、人工智能等計(jì)算機(jī)前沿技術(shù)已經(jīng)被廣泛地應(yīng)用于圖片、音視頻等系統(tǒng),但是針對(duì)具有鮮明民族特色的蒙古族音樂文化與信息技術(shù)相結(jié)合的相關(guān)研究尚處于摸索階段。
由于蒙古族傳統(tǒng)而淳樸的生活方式已被現(xiàn)代快節(jié)奏的信息交換方式逐漸同化,作為民族的標(biāo)志和展示蒙古族人民生活狀況的藝術(shù)作品也正面臨著無法保護(hù)和瀕臨失傳的危急境地。依托計(jì)算機(jī)行業(yè)的高速發(fā)展和信息化在各個(gè)領(lǐng)域的廣泛應(yīng)用,對(duì)蒙古族音樂資源有效地、科學(xué)地和數(shù)字化地分類,保護(hù)和收集蒙古族文化藝術(shù)遺產(chǎn)成為當(dāng)前迫切需要解決的問題[3]。數(shù)據(jù)庫技術(shù)的應(yīng)用與構(gòu)建不僅幫助文化的收集傳承步入正軌,而且豐富的數(shù)據(jù)資源可以提高數(shù)據(jù)庫的飽滿程度,用于音樂信息檢索(music information retrieval, MIR)研究。除此之外,資源收集的過程也需要對(duì)其質(zhì)量進(jìn)行專業(yè)的篩選和采錄,以確保蒙古族音樂數(shù)據(jù)庫(Mongolian music database system,MMDS)數(shù)據(jù)資源的專業(yè)性和嚴(yán)謹(jǐn)性。
本文首先以蒙古族音樂目前所面臨的問題為線索,對(duì)信息化技術(shù)在民族音樂傳承與保護(hù)中的作用進(jìn)行闡述;其次,對(duì)當(dāng)前應(yīng)用較廣泛的數(shù)據(jù)集和數(shù)據(jù)庫進(jìn)行歸納,分析當(dāng)前存在的問題;隨后,針對(duì)蒙古族音樂的藝術(shù)特點(diǎn),對(duì)蒙古族音樂資源庫建設(shè)過程中涉及的收集規(guī)范方式、特色標(biāo)簽標(biāo)準(zhǔn)和建庫應(yīng)用等進(jìn)行闡述;最后,對(duì)資源庫建設(shè)后期音樂科技應(yīng)用的發(fā)展方向做了簡(jiǎn)要展望。
目前,針對(duì)少數(shù)民族及地區(qū)特色音樂保護(hù)、傳播和傳承的重要方式之一是建立相應(yīng)的特色音樂數(shù)據(jù)庫,同時(shí)可以用于MIR研究。文獻(xiàn)[4]針對(duì)東北民間音樂進(jìn)行了數(shù)據(jù)庫建設(shè)的初探,從資料的收集、平臺(tái)的選擇和資源的加工處理幾個(gè)方面進(jìn)行了簡(jiǎn)要的探討,其數(shù)據(jù)庫由1個(gè)總庫、5個(gè)分庫、14個(gè)子庫構(gòu)成,為的是更便捷地進(jìn)行傳播教育與文化發(fā)展;文獻(xiàn)[5]通過探索建立潮州音樂數(shù)據(jù)庫,通過對(duì)音樂存儲(chǔ)標(biāo)準(zhǔn)的約束、功能的需求以及資料的獲取分類等方面的準(zhǔn)備工作,對(duì)潮州特色音樂進(jìn)行有效地保護(hù)和存儲(chǔ);文獻(xiàn)[6]提出了在現(xiàn)代語境下對(duì)閩臺(tái)兩地信奉的媽祖文化中的媽祖音樂進(jìn)行建庫的構(gòu)想,分別從祭祀音樂、民俗活動(dòng)音樂和媽祖題材創(chuàng)作音樂3個(gè)子庫入手,從資源收集要求、技術(shù)人員要求等方面進(jìn)行了探索,為更好地保護(hù)與發(fā)展媽祖文化做出了貢獻(xiàn)。
當(dāng)前的音樂資源數(shù)據(jù)庫只針對(duì)流傳甚廣的區(qū)域經(jīng)典音樂和民間音樂做收錄傳播,民族音樂資源收集相對(duì)短缺,數(shù)據(jù)資源規(guī)模明顯不足,這不利于民族音樂在信息檢索領(lǐng)域的研究。音樂信息檢索領(lǐng)域使用較為廣泛的數(shù)據(jù)集包括但不限于RWC(real world computing)、MSD(million song database)等。這些數(shù)據(jù)庫中容納了帶標(biāo)注的音樂數(shù)據(jù)、樂器音響數(shù)據(jù)和樂譜數(shù)據(jù)等信息,分別用于音高、節(jié)奏、和弦、調(diào)式和旋律信息的提取任務(wù)[7-8]。Nottingham Dataset也是一個(gè)較為經(jīng)典的音樂數(shù)據(jù)集,采用MIDI/ABC格式并帶有和弦標(biāo)記,數(shù)據(jù)內(nèi)容基本以民歌民謠為主,數(shù)量為一千多首,對(duì)風(fēng)格識(shí)別、旋律生成和和弦標(biāo)注具有一定的作用。
對(duì)于蒙古族音樂數(shù)據(jù)資源而言,現(xiàn)各數(shù)據(jù)平臺(tái)收集的內(nèi)容存在零星散落、數(shù)量少、質(zhì)量差、標(biāo)注不清晰不全面、采集不規(guī)范不標(biāo)準(zhǔn)、使用困難、無法為后續(xù)研究提供應(yīng)用價(jià)值等問題。以目前試運(yùn)行的一款少數(shù)民族音樂數(shù)據(jù)資源平臺(tái)——中華民族音樂資源數(shù)據(jù)庫為例,此數(shù)據(jù)庫是文化和旅游部下屬公司推出的最大、最專業(yè)、包含風(fēng)格最多的中華傳統(tǒng)音樂資源數(shù)據(jù)庫平臺(tái),但庫中有關(guān)蒙古族民族音樂的資源卻屈指可數(shù)。以“蒙古”為關(guān)鍵詞搜索,發(fā)現(xiàn)庫中僅收錄了152首,以“蒙古族”為關(guān)鍵詞則更為稀少,只有63首;收集的音樂資源出版年代均在1959—1969年,時(shí)間較久遠(yuǎn),資源質(zhì)量欠佳;歌曲時(shí)長(zhǎng)大多數(shù)為1~3 min,音樂素材過于簡(jiǎn)短,實(shí)際應(yīng)用價(jià)值較低;音樂內(nèi)容僅以我國(guó)蒙古族幾首經(jīng)典傳唱的民歌及其翻唱為主,也摻雜有少量樂器、戲曲等,種類豐富程度明顯不足;對(duì)音樂的標(biāo)注較為粗略,僅對(duì)部分歌曲的部分屬性進(jìn)行標(biāo)注,使得音樂定位模糊不清。
當(dāng)前絕大多數(shù)音樂資源數(shù)據(jù)庫信息標(biāo)注是研究者各自進(jìn)行標(biāo)簽自定義或利用數(shù)字信號(hào)音軌分析而進(jìn)行的,例如在部分知名流行音樂數(shù)據(jù)庫中,僅對(duì)歌曲的節(jié)奏、和弦、起始時(shí)間等進(jìn)行標(biāo)注[9]。這樣會(huì)產(chǎn)生標(biāo)簽信息不足、不準(zhǔn)確等問題,需要在已有的數(shù)據(jù)資源上重新進(jìn)行詳細(xì)標(biāo)注,導(dǎo)致很多后續(xù)研究無法進(jìn)行。蒙古族音樂區(qū)別于流行音樂的一點(diǎn)就是其豐富的演唱形式和情感背景,因此其標(biāo)簽屬性更加復(fù)雜,需要多種個(gè)性獨(dú)特的標(biāo)簽描述。由此可見,建立一個(gè)數(shù)據(jù)資源獨(dú)立、標(biāo)注信息翔實(shí)、可供研究及音樂傳承保護(hù)的蒙古族音樂數(shù)據(jù)資源庫已成為當(dāng)前民族文化資源數(shù)字化保護(hù)傳承中一個(gè)迫在眉睫的重要任務(wù)[10]。
2007年,斯坦福大學(xué)啟動(dòng)ImageNet項(xiàng)目,旨在將圖片進(jìn)行詳細(xì)的分類與標(biāo)注,以此來為機(jī)器學(xué)習(xí)算法提供更多更好的數(shù)據(jù)集,該項(xiàng)目標(biāo)志著數(shù)據(jù)處理在人工智能研究領(lǐng)域要比算法更為基礎(chǔ)和重要。數(shù)據(jù)標(biāo)注是數(shù)據(jù)處理的主要組成部分,數(shù)據(jù)標(biāo)注的主要內(nèi)容是根據(jù)用戶的使用要求,對(duì)圖像、語音以及文本等以不同的方式進(jìn)行加工處理。表1展示了各類標(biāo)注分類方法的定義及優(yōu)缺點(diǎn)[11]。
表1 數(shù)據(jù)標(biāo)注分類
蒙古族音樂有其獨(dú)有的民族地域音樂特色,因而存在著風(fēng)格迥異的演唱形式、歌曲風(fēng)格和音樂背景,所以簡(jiǎn)單化一的標(biāo)簽標(biāo)注方式無法全面地展現(xiàn)蒙古族音樂應(yīng)有的特色風(fēng)采。因此,結(jié)合ImageNet項(xiàng)目的數(shù)據(jù)標(biāo)注方式,在面向蒙古族音樂資源庫內(nèi)數(shù)據(jù)標(biāo)注的過程中,我們采用“半結(jié)構(gòu)化標(biāo)注+人工標(biāo)注”的標(biāo)注模式,來確保數(shù)據(jù)標(biāo)簽的飽滿程度和準(zhǔn)確程度。其中,在半結(jié)構(gòu)化的標(biāo)注過程中我們將標(biāo)簽標(biāo)注內(nèi)容一分為二,首先根據(jù)專業(yè)音樂人士的分析判斷對(duì)蒙古族音樂的標(biāo)簽標(biāo)準(zhǔn)進(jìn)行擬定,實(shí)現(xiàn)標(biāo)簽域的約束;其次結(jié)構(gòu)化的標(biāo)簽值標(biāo)注可以保證類別信息的準(zhǔn)確清晰,從而達(dá)到準(zhǔn)確標(biāo)注的目的。雖然由表1可知半結(jié)構(gòu)化標(biāo)注形式依然存在一些缺點(diǎn),但在專業(yè)音樂人士的協(xié)同幫助下,這些問題將迎刃而解。
區(qū)別于流行音樂,蒙古族音樂更多地體現(xiàn)在情感、技巧和背景等諸多高層音樂語義特征等方面,所以在標(biāo)注過程中我們放棄機(jī)器學(xué)習(xí)標(biāo)注方法,采用成本更高、時(shí)間更長(zhǎng)、速度更慢的人工標(biāo)注方式。雖然在數(shù)據(jù)標(biāo)注速率上落后于機(jī)器算法的標(biāo)注方式,但結(jié)合專業(yè)音樂人士的聽覺和主觀辨析所獲取的手工標(biāo)簽,對(duì)蒙古族音樂的標(biāo)注將更加清晰,并且有較高研究和運(yùn)用的價(jià)值。
本文對(duì)音樂的標(biāo)注內(nèi)容不限于對(duì)歌曲人聲、音樂伴奏或樂器素材的單一標(biāo)注,而是將整首音樂中所有具有蒙古族民族音樂特色的內(nèi)容通過專業(yè)人員的判斷,使用擬定的標(biāo)簽進(jìn)行標(biāo)注。主要標(biāo)注信息分為4類:音樂的基本信息標(biāo)簽、蒙古族特色音樂信息標(biāo)簽、音樂形態(tài)分析標(biāo)簽以及音樂演唱內(nèi)容分析標(biāo)簽。在獲取標(biāo)準(zhǔn)標(biāo)簽的過程中,結(jié)合了部分研究學(xué)者對(duì)音樂數(shù)據(jù)的標(biāo)注準(zhǔn)則,并且參照文獻(xiàn)[17]對(duì)蒙古族音樂發(fā)展歷程、音樂內(nèi)容以及藝術(shù)特性的一系列詳細(xì)介紹,由此獲得標(biāo)注內(nèi)容的特色標(biāo)簽。蒙古族音樂基本以不帶半音的五聲音階構(gòu)成,并且每個(gè)音階都可以作為調(diào)式的主音;其中以徵音和羽音為主音的調(diào)式最為常見,曲調(diào)起伏大、跳度大、音域?qū)?,給人展現(xiàn)出蒙古族人民豪放的性格特征,真假嗓以及顫音的使用使得蒙古族音樂具有極大的民族特色。MMDS擬定的音樂數(shù)據(jù)標(biāo)簽標(biāo)準(zhǔn)內(nèi)容如表2所示。
表2 蒙古族音樂數(shù)據(jù)資源庫數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)
音樂音頻的收集工作包含采集與處理,只有將音頻的收集標(biāo)準(zhǔn)規(guī)范化運(yùn)用到數(shù)據(jù)的采集中,得到的音頻數(shù)據(jù)才具有處理價(jià)值[13]。在音頻采集處理過程中, 用專業(yè)手段進(jìn)行錄制和存放,力求音樂的完整性和清晰度。再經(jīng)過降噪、混響、合成等處理方式,最終獲得高質(zhì)量的數(shù)據(jù)庫音頻資源。
2.1.1 音頻采集分類 音頻的采集分為兩類:一類是刻錄光盤聲音文件以及云端數(shù)據(jù)資源的數(shù)字化轉(zhuǎn)換;另一類是田野錄音棚自然采聲[14]。光盤音樂可以生成MP3、WMA、MIDI等多種文件格式的數(shù)字音頻文件,為保證質(zhì)量,提取后應(yīng)首先對(duì)完整性等屬性進(jìn)行核查;自然聲音采集則需要一系列標(biāo)準(zhǔn)化條件,以便在錄制過程中實(shí)時(shí)完成采集并生成所需格式的音頻文件。
2.1.2 自然采錄標(biāo)準(zhǔn) 采錄標(biāo)準(zhǔn)包括3個(gè)方面:錄音棚標(biāo)準(zhǔn)、采錄設(shè)備標(biāo)準(zhǔn)以及采錄操作標(biāo)準(zhǔn)。錄音棚由兩部分組成:錄音收音棚和錄音控制室。房間最佳比例為1.9∶1.4∶1,面積為20~50 m2,混響時(shí)間宜(0.4+0.1)s,隔聲門隔聲量>35 dB,隔聲窗隔聲量>50 dB,室內(nèi)溫度(20±2)℃。采錄設(shè)備包括計(jì)算機(jī)、話筒、AD/DA音頻接口、監(jiān)聽耳機(jī)、監(jiān)聽音箱、專業(yè)錄音筆(用于田野調(diào)查采錄)以及其他配件設(shè)備。計(jì)算機(jī)配置要求處理器Intel i5及以上,運(yùn)行內(nèi)存8 GB,硬盤空間1 TB以上,擁有音頻處理軟件可對(duì)音頻文件進(jìn)行高效加工。音頻記錄以16 bit、44.1 kHz格式記錄,監(jiān)聽等設(shè)備應(yīng)滿足基本采錄需求,錄音棚內(nèi)的采錄應(yīng)嚴(yán)格按照錄音棚內(nèi)工作標(biāo)準(zhǔn)進(jìn)行,設(shè)備擺放既要符合聲學(xué)基本規(guī)則又要保證高質(zhì)量采錄。以被錄曲目中的最大音為測(cè)試聲音,以此來調(diào)整電平大小,保證錄音設(shè)備不會(huì)出現(xiàn)音量過載問題。對(duì)田野調(diào)查采錄,選擇噪音盡量小的環(huán)境,使用專業(yè)高質(zhì)量錄音筆進(jìn)行純歌聲或歌聲加伴奏的采錄,設(shè)置相關(guān)參數(shù)。需要演唱者吐字清晰,伴奏節(jié)奏清楚,才能保證自然聲采樣的質(zhì)量。
2.1.3 音頻的處理 在計(jì)算機(jī)的幫助下,運(yùn)用音頻軟件,以及單軌、多軌音頻處理技術(shù)等都可以快速地對(duì)采錄的音頻進(jìn)行編輯加工操作,從而獲得宜于使用的音頻數(shù)據(jù),音頻的處理包含對(duì)聲音的修繕編輯、效果加注以及合成3個(gè)方面,更多具體的內(nèi)容則是對(duì)噪聲的處理、單/多軌的編輯、高音激勵(lì)處理、混響處理、歌聲合成、格式轉(zhuǎn)換等[15]。在錄音棚或是在田野采錄過程中,噪聲都是不可避免的,因此在處理噪聲過程中,使用數(shù)字噪聲處理器,利用回波對(duì)消的原理對(duì)錄制的音頻進(jìn)行降噪。在理想的情況下通過自適應(yīng)算法將噪聲全部消除,從而達(dá)到消除噪聲的目的[16]。通過諸如此類的技術(shù)操作,將采錄音頻實(shí)現(xiàn)高效高質(zhì)量處理,完成音頻數(shù)據(jù)的處理操作。
類似于其他類型音樂,將蒙古族音樂形態(tài)分為調(diào)號(hào)、調(diào)式、節(jié)拍、節(jié)拍起始點(diǎn)、發(fā)展手法、速度、旋律特征和歌曲音域等。每種形態(tài)又具有不同的屬性,例如調(diào)號(hào)可以分為C/D/A/E/B/#F/#C/F/bB/bE/bA/bD/bG/bC等屬性。數(shù)據(jù)庫中每首音樂均需要人工完成上述內(nèi)容的標(biāo)注。由于音樂形態(tài)分析標(biāo)注類型較為復(fù)雜,本標(biāo)注采用數(shù)據(jù)庫字典方式對(duì)上述標(biāo)注信息進(jìn)行處理。
音樂演唱分析規(guī)定標(biāo)注選項(xiàng)設(shè)計(jì)為布爾類型,包括演唱情況是否飽和、音樂是否完整、人聲與伴奏是否合拍、音色有無較高辨識(shí)度以及是否有特殊演唱技巧等。布爾類型的選擇有助于今后在音樂信息檢索等方面進(jìn)行分類。
音樂基本信息標(biāo)注標(biāo)準(zhǔn)即音樂通用的元數(shù)據(jù)信息,包括曲長(zhǎng)以及歌手漢語、蒙古語姓名等。音樂形態(tài)分析標(biāo)注標(biāo)準(zhǔn)從音樂的形態(tài)分析角度構(gòu)建音樂數(shù)據(jù)庫屬性,包括音樂的調(diào)號(hào)、節(jié)拍等。音樂演唱分析標(biāo)注屬于主觀認(rèn)知標(biāo)注,需要手工標(biāo)注。而整個(gè)MMDS數(shù)據(jù)庫的核心是蒙古族音樂特色信息標(biāo)準(zhǔn),該標(biāo)準(zhǔn)基于蒙古族音樂的地域特征、時(shí)間特征、所屬區(qū)域、音樂背景、色彩區(qū)域、樂器區(qū)域等定義數(shù)據(jù)屬性,以下簡(jiǎn)要介紹幾個(gè)重要音域特征屬性的定義機(jī)理。
2.3.1 地域特征 蒙古族音樂伴隨草原游牧生活產(chǎn)生了種類繁多的特色音樂,地域因素是影響其音樂風(fēng)格最重要的因素之一。目前按照地域區(qū)別蒙古族音樂風(fēng)格可劃分為5個(gè)特色風(fēng)格區(qū):鄂爾多斯、阿拉善、科爾沁、呼倫貝爾、錫林郭勒。相同的蒙古族音樂在不同的地域環(huán)境下會(huì)演繹出不一樣的地域性特色,例如蒙古長(zhǎng)調(diào)會(huì)在不同的地域風(fēng)格區(qū)增加不同的演唱技巧,從而產(chǎn)生鮮明的對(duì)比。
2.3.2 時(shí)間特征 蒙古族音樂自隋唐時(shí)期起就有了相關(guān)記載,基本演唱方式為“古短調(diào)”,音樂載體包括薩滿教舞蹈以及呼麥、狩獵歌曲等不同形式。公元840年左右,蒙古族音樂風(fēng)格由狩獵音樂逐步向草原游牧風(fēng)格轉(zhuǎn)變,并且演唱方式也由“短調(diào)”轉(zhuǎn)化為“長(zhǎng)調(diào)”,音樂風(fēng)格更加寬廣奔放,音樂體裁主要是長(zhǎng)調(diào)牧歌以及馬頭琴的使用等。時(shí)間特征也隨著民族的生活方式和朝代的更迭出現(xiàn)節(jié)點(diǎn)。
2.3.3 民族特有樂器 主要包括蒙古族四胡、馬頭琴、火不思、雅圖嘎、胡日、三弦、蒙古箏、蒙古琵琶、胡笳、笛子等。
本文以蒙古族著名女歌唱家德德瑪?shù)慕?jīng)典歌曲《牧歌》為例[18],分別從音樂基本信息、音樂形態(tài)分析和音樂演唱內(nèi)容進(jìn)行了詳細(xì)的標(biāo)注,這些標(biāo)簽分別從不同角度對(duì)蒙古族歌手在蒙古族音樂上的展示進(jìn)行了描述,內(nèi)容飽滿、屬性豐富,歌曲具體標(biāo)簽信息如圖1所示。
圖1 “牧歌”歌曲特色標(biāo)簽展示界面
使用數(shù)字化技術(shù)對(duì)資源進(jìn)行保護(hù)離不開數(shù)據(jù)庫的底層協(xié)助,而一個(gè)具有特色元素的數(shù)據(jù)庫是開展特色文化數(shù)字資源服務(wù)和資源共享的重要基礎(chǔ),對(duì)于傳統(tǒng)非物質(zhì)文化數(shù)字化進(jìn)程的建設(shè),數(shù)據(jù)庫的存在不僅為資源共享提供了平臺(tái),更為傳承和保護(hù)珍貴的民族文化資源提供了保障。作為文化藝術(shù)的傳播使用平臺(tái),其可搜索使用的數(shù)據(jù)內(nèi)容也應(yīng)是多元和豐富的,可以在資料庫的建設(shè)過程中將音樂的相應(yīng)文化背景知識(shí)、樂譜等內(nèi)容加入到資源庫中。例如文章上節(jié)提到的蒙古族歌曲《牧歌》,收納其音樂簡(jiǎn)譜等部分內(nèi)容信息以完善資源的飽滿程度,使其使用范圍更廣、效果更佳。資源數(shù)據(jù)庫建成后應(yīng)滿足但不限于以下幾個(gè)條件:可以通過音樂基本信息或者音樂標(biāo)簽信息關(guān)鍵字實(shí)現(xiàn)對(duì)音樂的索引和查找使用;可以使用標(biāo)簽的部分屬性對(duì)數(shù)據(jù)庫中所需要的音樂信息進(jìn)行分類獲??;可以選擇性地獲取音樂內(nèi)容進(jìn)行共享、瀏覽、使用和傳播。
特色數(shù)據(jù)庫建設(shè)過程中規(guī)范化和標(biāo)準(zhǔn)化必不可少,應(yīng)盡可能采取目前通用的數(shù)據(jù)著錄標(biāo)準(zhǔn)、格式標(biāo)準(zhǔn)等一系列規(guī)范操作和協(xié)議,收集資源的途徑和內(nèi)容應(yīng)如前文所提,以傳統(tǒng)傳承載體經(jīng)過數(shù)字化加工轉(zhuǎn)換后進(jìn)行標(biāo)注,或是將當(dāng)前的數(shù)字化形態(tài)內(nèi)容直接標(biāo)注,供數(shù)據(jù)庫檢索共享和資源傳播等使用。
面對(duì)種類多樣的蒙古族音樂資源,為了能夠更好地運(yùn)用到音樂信息檢索應(yīng)用環(huán)境中,用戶可以根據(jù)庫中給定蒙古族音樂的部分標(biāo)簽,例如:旋律特征、音樂情感風(fēng)格、音樂時(shí)間特征和音樂所屬地區(qū)等屬性檢索出自己喜愛的音樂。以音樂類型為例,在MMDS中,蒙古族音樂類型被分為3類:民間音樂、傳統(tǒng)音樂、宗教與祭祀音樂。在此基礎(chǔ)上,用戶可以繼續(xù)從中篩選出自己更為喜愛的音樂語言風(fēng)格,例如蒙語、漢語或蒙漢雙語的不同類型風(fēng)格。
因此,本文采用KNN(K-nearest neighbor)算法對(duì)蒙古族音樂類型與語言風(fēng)格進(jìn)行分類研究與實(shí)驗(yàn)。首先,選用庫中已經(jīng)人工手動(dòng)詳細(xì)標(biāo)記的100首蒙古族特色音樂作為訓(xùn)練樣本,選擇60首未標(biāo)記過的蒙古族音樂歌曲作為測(cè)試樣本。然后,利用歐幾里得距離公式計(jì)算訓(xùn)練樣本與測(cè)試樣本之間的相似度,根據(jù)KNN的投票決策原則,預(yù)測(cè)樣本類別。最后,通過觀察分類精確度并驗(yàn)證分類方法的有效性,分類原理如下。
對(duì)于給定的測(cè)試樣本,根據(jù)距離度量在訓(xùn)練集中找到最接近它的K個(gè)訓(xùn)練樣本,其次根據(jù)這K個(gè)“鄰居”的信息進(jìn)行預(yù)測(cè)。當(dāng)測(cè)試的特征數(shù)據(jù)與某些訓(xùn)練的特征數(shù)據(jù)完全匹配時(shí),可以對(duì)其進(jìn)行分類。但由于所有測(cè)試數(shù)據(jù)不能夠都找到完全匹配的訓(xùn)練數(shù)據(jù),因此可以通過相似性來判斷文本之間的相關(guān)性。本文使用歐幾里得距離方法來計(jì)算樣本之間的相似度,并根據(jù)KNN投票原則做出分類決策。歐幾里得距離的計(jì)算公式為
(1)
其中:x和y分別代表兩個(gè)特征向量;n代表特征向量維度;距離越小,相似度就越高,則判斷屬于同一類別的可能性就越大。
本測(cè)試實(shí)驗(yàn)基于蒙古族音樂資源數(shù)據(jù)庫真實(shí)的音樂數(shù)據(jù),按照文中擬定的標(biāo)簽內(nèi)容作為分類的依據(jù),實(shí)驗(yàn)采用KNN算法對(duì)庫中蒙古族音樂資源進(jìn)行分類,結(jié)果表明該算法對(duì)蒙古族音樂類型與語言風(fēng)格分類具有良好的分類性能(如圖2所示)。利用該方法并結(jié)合庫內(nèi)音樂數(shù)據(jù)標(biāo)注分類準(zhǔn)確度普遍較高,其中對(duì)傳統(tǒng)音樂中蒙語語言風(fēng)格分類精度最高,達(dá)到88.78%,由此證明MMDS數(shù)據(jù)庫標(biāo)注的必要性和準(zhǔn)確性。
圖2 MMDS音樂類型分類效果圖
目前,隨著流行音樂的日益風(fēng)靡,傳統(tǒng)蒙古族音樂缺乏傳承方式,通過數(shù)字化手段建立蒙古族音樂資源數(shù)據(jù)庫能夠促進(jìn)少數(shù)民族文化傳承與保護(hù),可以吸引更多的個(gè)性化音樂人在傳統(tǒng)音樂基礎(chǔ)上進(jìn)行多樣化的二次創(chuàng)新創(chuàng)作,使蒙古族音樂蓬勃發(fā)展[19]。蒙古族音樂資源數(shù)據(jù)庫的前期工作主要以收集和整理高質(zhì)量多種類音樂數(shù)據(jù)為主,隨著蒙古族音樂資源數(shù)量種類的日益豐富,將為音樂信息檢索(MIR)相關(guān)研究提供相關(guān)數(shù)據(jù)平臺(tái)[20]。構(gòu)建過程中原則上要保證數(shù)據(jù)庫數(shù)據(jù)的真實(shí)性、專業(yè)性,收集的資源要進(jìn)行嚴(yán)格合理的篩查選擇,遵循真實(shí)采錄規(guī)則,避免形式主義。對(duì)采錄信息及時(shí)處理,將數(shù)據(jù)資源予以適當(dāng)公開以進(jìn)行學(xué)術(shù)交流。遵守國(guó)家相關(guān)制度,做到數(shù)據(jù)使用采集合理規(guī)范,并保證數(shù)據(jù)庫的長(zhǎng)久穩(wěn)定,為MMDS的規(guī)范構(gòu)建和未來在MIR領(lǐng)域的研究做好基礎(chǔ)準(zhǔn)備工作。
音樂科技分為2個(gè)子類:基于科技的音樂作品創(chuàng)作和融合數(shù)字音頻及計(jì)算機(jī)技術(shù)的科學(xué)研究,我們主要針對(duì)后者展開相關(guān)研究,例如:解決蒙古族音樂中音色、旋律、節(jié)奏、歌聲信息等音樂基本要素的相關(guān)問題[21];解決蒙古族音樂特色情感分析、曲風(fēng)流派、特色樂器樂譜識(shí)別、情感識(shí)別及高層音樂語義分析等音樂內(nèi)容相關(guān)問題[22-23];解決蒙古族音樂自動(dòng)標(biāo)注、歌聲合成、歌聲歌詞同步、自動(dòng)譜曲等音樂未來前沿科技相關(guān)問題[24-25];解決入庫特色音樂的音頻認(rèn)證、音頻信號(hào)水印等音頻安全性相關(guān)問題[26-27];解決蒙古族音樂在搜索、音樂推薦、音樂教育以及在醫(yī)療輔助、音視頻融合等音樂應(yīng)用相關(guān)問題和其他未知領(lǐng)域[28-29]。
本文針對(duì)當(dāng)前蒙古族音樂資源庫建設(shè)的空白,提出了構(gòu)建蒙古族資源數(shù)據(jù)庫的方法,舉例并驗(yàn)證音樂資源庫在音樂分類中的有效性。針對(duì)蒙古族音樂與其他音樂類型的共性和特性,提出構(gòu)建蒙古族音樂數(shù)據(jù)的四大模塊:蒙古族音樂基本信息、蒙古族音樂形態(tài)分析、蒙古族音樂演唱分析和蒙古族音樂特色?;谏鲜鰳?gòu)建方法及模塊構(gòu)建的蒙古族音樂數(shù)據(jù)庫有利于豐富中華民族音樂類別,進(jìn)一步促進(jìn)民族藝術(shù)融合。