□李國瑛 盤婉婉 楊輝 李哲倫/文
本研究主要利用實驗來探討各種現(xiàn)今音樂檢索系統(tǒng)于網(wǎng)絡(luò)文創(chuàng)平臺中的查詢功能和系統(tǒng)架構(gòu),進行比較分析, 受試者僅能記得音樂曲目的部分片段,甚或僅能哼唱其中不甚正確的部分片段,在網(wǎng)絡(luò)文創(chuàng)多媒體數(shù)據(jù)庫平臺中進行測試,藉此來觀察音樂檢索系統(tǒng)的發(fā)展現(xiàn)狀,及未來音樂檢索系統(tǒng)潛在的應(yīng)用發(fā)展與趨勢。
音樂檢索系統(tǒng)稱為 MIR(Musical Information Retrieval),其主要功能在于擷取部分音樂內(nèi)容信息,將其建構(gòu)數(shù)據(jù)庫,幫助用戶能夠從廣泛龐大的音樂資料中,藉由輸入符合或匹配音樂數(shù)據(jù)庫的關(guān)鍵信息,來搜尋辨識出自己需要的音樂信息。這項技術(shù),現(xiàn)已被廣泛應(yīng)用在多種網(wǎng)絡(luò)文創(chuàng)平臺上,讓消費者或數(shù)據(jù)庫用戶,在搜尋目標(biāo)的過程中更加便捷,增進平臺的使用流量和能見度?,F(xiàn)有的音樂信息檢索系統(tǒng)從音樂截取內(nèi)容到匹配計算法都不同,這是因為各種系統(tǒng)提取的音樂屬性關(guān)鍵特征具有差異性,從擷取文字、符號、音訊、視頻、樂譜及頻譜聲學(xué)分析圖來比對匹配,到自動辨識哼唱內(nèi)容等各種方式作為搜索關(guān)鍵詞,產(chǎn)生了幾種不同類別的檢索系統(tǒng)。
從音樂檢索的發(fā)展歷史調(diào)查及信號處理發(fā)展進程研究顯示,最早的計算機音樂信息檢索系統(tǒng)源自布林邏輯檢索技術(shù),由此之后,陸續(xù)衍伸出許多基于文字語匯發(fā)展的系統(tǒng)。1988年起,國際組織動態(tài)影像專家小組正式成立,致力于多媒體編碼技術(shù),先后開發(fā)了與影片、音訊的壓縮編碼技術(shù)相關(guān)的一系列稽核程序。也于同期,國際標(biāo)準(zhǔn)化組織(IOS)制定了多媒體內(nèi)容描述接口及多媒體內(nèi)容索引。1990年,第一個實作音樂序列比對的自動化架構(gòu)首度亮相,1995年英國南安普敦大學(xué)提出一種哼唱查詢系統(tǒng) QBH(Query By Humming),用戶可以單憑記憶旋律,錄制一段哼唱旋律聲音作為查詢片段,再經(jīng)由計算機程序透過相關(guān)演算法獲得輸入聲音的音調(diào)輪廓分布圖,將音樂的旋律轉(zhuǎn)換為英文字母 U、D、R 組成的符號串,再從數(shù)據(jù)庫中以信息匹配相似度的方式進行檢索,最后按照匹配相似度的高低返回結(jié)果列表。由于這項研究在初期只限于辨識音樂曲調(diào)的音高,逐漸地,系統(tǒng)研發(fā)者開始用更多音頻的其他屬性特征,加入到匹配數(shù)據(jù)庫中進行檢索。至 2000年初,音樂數(shù)字界面(MIDI)的盛行促使音樂文創(chuàng)產(chǎn)業(yè)數(shù)位化,音樂信息檢索因此也開始發(fā)展由樂譜上的記號圖像,以及 MIDI 錄制音頻樣本為搜尋關(guān)鍵的檢索系統(tǒng)。這種系統(tǒng)能夠從網(wǎng)絡(luò)上自動定位搜尋到 MIDI 檔建立的數(shù)據(jù)庫,進行旋律、節(jié)奏和樂譜符號的比對。
現(xiàn)有的多模式索引系統(tǒng)建構(gòu)理論,結(jié)合了片段的音頻、視頻、文字、以及與音樂內(nèi)容相關(guān)的圖片等索引辨識功能來進行搜尋,這些設(shè)計有助于應(yīng)用在將來多媒體數(shù)位典藏館音樂教學(xué)中??v觀目前與音樂多模式索引檢索相關(guān)的研究,都是在追求檢索的精準(zhǔn)性,然而音樂檢索系統(tǒng)除了幫助用戶搜尋目標(biāo),與其相關(guān)的研發(fā)也有助于音樂市場在開發(fā)潛在客戶時,從歷史行為的數(shù)據(jù)來分析用戶喜好。透過這些歷史行為的數(shù)據(jù),應(yīng)用分析算法,將各種潛在用戶與其嗜好相關(guān)的音樂作連結(jié),拓展市場調(diào)研。同時,也可在推算數(shù)據(jù)的過程中使用人工智能方式學(xué)習(xí),隨時間推進,進一步精進檢索效能。
本研究將闡述各種音樂檢索系統(tǒng)于文創(chuàng)平臺上的應(yīng)用功能,分析各種信息檢索技術(shù)所適用的音樂類別和索引特征,期待能促進未來音樂檢索系統(tǒng)專利技術(shù)的發(fā)展和革新,讓豐富的影音資源數(shù)據(jù)庫更為完整普及。根據(jù)現(xiàn)存的調(diào)查研究顯示,多數(shù)關(guān)于音樂信息檢索的研究文獻側(cè)重于技術(shù)分析及演算法,許多與檢索技術(shù)相關(guān)的設(shè)計是從程序軟件開發(fā)者的視角來進行研究,然而,在諸多檢索功能的設(shè)計理論上,也有賴于建構(gòu)者將設(shè)計思維導(dǎo)向用戶思維,以更簡便的操作接口融合視覺和聽覺的辨識特征,獲取搜索資源。研究方法和結(jié)果討論如下:
針對國內(nèi)外目前提供在線服務(wù)的四種音樂搜尋網(wǎng)站,涵蓋“中華民族音樂資源數(shù)據(jù)庫”“Themefinder”“網(wǎng)易云”“Musipedia”音樂數(shù)據(jù)庫,通過電子計算機操作,調(diào)查四種檢索系統(tǒng)的搜尋效率情況、數(shù)據(jù)庫內(nèi)容,紀(jì)錄每種系統(tǒng)的平均搜尋分析時間。時間截錄的起始點自人工輸入完成之后,引擎搜索過程至排列出相似度比對順序,瀏覽并點選出準(zhǔn)確的作品為止,探討各種網(wǎng)絡(luò)音樂資源的使用效果,最后總結(jié)出各種系統(tǒng)的特色,并對于系統(tǒng)現(xiàn)存的瓶頸提出改善建議,提出音樂檢索系統(tǒng)于未來網(wǎng)絡(luò)文創(chuàng)平臺的潛在應(yīng)用領(lǐng)域。
研究過程將使用中國移動網(wǎng)絡(luò),比較分析網(wǎng)絡(luò)音樂文創(chuàng)平臺,設(shè)定進行搜尋實驗的網(wǎng)絡(luò)平臺包含:
2.2.1 基于文字敘述為內(nèi)容的檢索系統(tǒng)
測試網(wǎng)站:中華民族音樂資源數(shù)據(jù)庫。樂曲數(shù)目:三百首樂曲。
樂曲內(nèi)容選擇戲曲音樂、曲藝音樂、歌曲音樂、器樂音樂、歌舞音樂五大類作品各六十首。
2.2.2 基于音樂特征為內(nèi)容的檢索系統(tǒng):(輸入法)
測試網(wǎng)站:Themefinder音樂數(shù)據(jù)庫。樂曲數(shù)目:三百首樂曲。
樂曲內(nèi)容選擇文藝復(fù)興時期、古典時期、及中國民謠作品三種類音樂作品各一百首。
2.2.3 基于音樂特征為內(nèi)容的檢索系統(tǒng):(哼唱法)
測試網(wǎng)站:網(wǎng)易云音樂數(shù)據(jù)庫。
樂曲數(shù)目:三百首具有中文歌詞的歌曲。
樂曲內(nèi)容選擇20世紀(jì)70、80、90年代及現(xiàn)代華語歌曲各一百首。
2.2.4 基于鍵盤輸入法為內(nèi)容的檢索系統(tǒng)
測試網(wǎng)站:Musipedia。
樂曲數(shù)目:三百首樂曲。
樂曲內(nèi)容:世界民謠、世界國歌、古典音樂各一百首。
實驗過程由肇慶學(xué)院音樂學(xué)院的三位學(xué)生聯(lián)合進行,此三位音樂專業(yè)本科生分別主修民樂、聲樂及器樂,各自從上述網(wǎng)絡(luò)平臺數(shù)據(jù)庫中搜尋三百首歌單,并在采集歌單時以簡譜注記列出樂曲的開頭旋律,之后以交互進行檢索的方式,重復(fù)在平臺上進行檢索過程,達到采集檢索花費時間數(shù)據(jù)的平均值。鑒于大多數(shù)的在線音樂用戶在使用網(wǎng)絡(luò)音樂檢索系統(tǒng)時并不具備有音樂信息的完整性,搜尋用戶所花費的檢索時間與用戶本身對音樂信息的掌握程度相關(guān),故此實驗以三位不同主修的音樂本科學(xué)生作為搜尋用戶受試者,每位學(xué)生都僅對其中特定類別的音樂較為熟悉,其余種類的音樂搜尋過程僅依賴初步音樂知識來查詢樂曲,借此客觀條件對各類網(wǎng)絡(luò)音樂文創(chuàng)平臺進行檢索,以獲取最終檢索花費時間的平均值。實驗過程要求三位學(xué)生使用相同的電子計算機規(guī)格,以控制實驗環(huán)境的一致性。每一種網(wǎng)站的設(shè)計都有針對特定的音樂愛好者及客群,若輸入不存在于曲庫中的關(guān)鍵索引,則無法進行研究,要避免這個失誤的前提是必須先對曲庫內(nèi)的音樂類別和風(fēng)格特色深入了解后再進行檢索。此外,有些網(wǎng)站具有復(fù)合式信息檢索系統(tǒng),索引資料庫更多元。在搜尋基礎(chǔ)條件中,難以和其他僅具備單一檢索方式的網(wǎng)站基礎(chǔ)架構(gòu)比較,但可以就單一網(wǎng)站的多種功能進行檢索測試,分析其搜尋精準(zhǔn)度及應(yīng)用功效。
根據(jù)上述四種不同平臺網(wǎng)站的屬性,選擇進行檢索搜尋實驗的歌單后可以發(fā)現(xiàn),中華民族音樂資源數(shù)據(jù)庫是以文字輸入法進行檢索的平臺數(shù)據(jù)庫,數(shù)據(jù)庫內(nèi)容包羅萬象,除經(jīng)典民樂,也收錄絲綢之路少數(shù)民族音樂及中華曲藝老唱片,更有絕版京劇等專輯與電視文獻片,舉凡與華夏民族文化相關(guān)的歌曲或戲曲皆收錄在平臺中,其中更不乏多種器樂樂曲,對于受過專業(yè)音樂教育背景的用戶較實用。使用專業(yè)音樂數(shù)據(jù)庫則必須能夠精確輸入各種與搜尋項目有關(guān)的文字敘述,盡可能地輸入詳細的文字敘述信息,包括曲名、作曲者、體裁、風(fēng)格及編號等信息,若使用者有時在搜索資料時無法記憶完整的文字標(biāo)簽敘述,則使搜尋產(chǎn)生局限。Themefinder 網(wǎng)絡(luò)平臺的數(shù)據(jù)庫設(shè)計較為傾斜向古典音樂及民謠作品,除了以輸入概略簡譜旋律的形式,還搭配了其他相關(guān)音樂內(nèi)容描述的多重檢索系統(tǒng),包括作曲家姓名、曲名、關(guān)鍵字、音階、調(diào)性、音程概念、節(jié)奏拍號、音樂風(fēng)格時期等選項。目前由于此數(shù)據(jù)庫的搜索容量范圍值,能搜尋16世紀(jì)、古典時期部分樂曲,以及包含9個國家在內(nèi)的8382首地方民俗歌謠。然而,輸入音樂特征如旋律音高的檢索要求,對于檢索者具有專業(yè)知識的要求,因此這樣的檢索系統(tǒng)無法滿足多數(shù)未受過專業(yè)音樂訓(xùn)練的用戶。此平臺網(wǎng)站需要手動輸入的音樂參數(shù)較其他網(wǎng)站更多,檢索系統(tǒng)要求用戶在簡譜音高之間以“/”“”“—”來代表旋律輪廓走向,對搜尋者的音樂素養(yǎng)要求高。這個平臺成立于1984年,由斯坦福大學(xué)電子計算機研究中心研發(fā),搜尋網(wǎng)站系統(tǒng)還設(shè)有給使用者線上問卷調(diào)查,屬于早期成立的CBMR音樂信息檢索系統(tǒng)。網(wǎng)易云音樂數(shù)據(jù)庫是以收錄流行歌曲為主要音樂文創(chuàng)作品的網(wǎng)絡(luò)平臺,現(xiàn)為市占率較大的網(wǎng)絡(luò)音樂文創(chuàng)平臺,用戶不以音樂專業(yè)的搜尋者為主,是目前國內(nèi)較大型的流行音樂數(shù)據(jù)庫,具有大型流量客群的特性,收錄的歌曲也持續(xù)更新。網(wǎng)易云手機程序的操作方式,通過聽歌識曲選項,點擊識別音樂便能以哼唱旋律的方式搜尋歌曲。除了搜尋功能,這個平臺數(shù)據(jù)庫也增添了社交分享功能,并允許用戶在初期使用時,先選擇容量規(guī)格較小的數(shù)據(jù)庫來試用,之后依據(jù)用戶習(xí)慣和喜好,調(diào)整搜尋使用的數(shù)據(jù)庫規(guī)格。Musipedia 相較于前幾項音樂數(shù)據(jù)庫平臺,多了以虛擬鍵盤點擊音高來查找音樂的選項,主要以MIDI為搜尋引擎,也可作節(jié)奏搜尋和哼唱搜尋,提供各種用戶不同的搜尋管道。
音樂信息檢索系統(tǒng)主要功能除了讓用戶能藉由索引搜尋到網(wǎng)絡(luò)音樂資料及影音創(chuàng)作外,檢索系統(tǒng)的研發(fā)也有助于音樂市場在開發(fā)潛在客戶時,從歷史行為的數(shù)據(jù)來分析用戶喜好。而透過機械學(xué)習(xí)算法,這些歷史行為的數(shù)據(jù),正可使用人工智能方式學(xué)習(xí),隨時間推進,進一步精進檢索效能。音樂信息檢索技術(shù)于網(wǎng)絡(luò)文創(chuàng)平臺的應(yīng)用功效研究具有前瞻性,在互聯(lián)網(wǎng)迅速發(fā)展、影音資源蓬勃生產(chǎn)的時代,由平臺延伸出的多媒體互動教學(xué)也勢必將更頻繁應(yīng)用在各種學(xué)科中,借此達到促進我國科技文化產(chǎn)業(yè)的遠景。音樂的語意和形制,在許多層面上并不容易從單一面向被歸納數(shù)字化,未來音樂檢索系統(tǒng)的發(fā)展趨勢,將傾向于多模式檢索系統(tǒng),提取的索引特征范圍,甚至有可能延伸至每位音樂表演者的動作分析和演奏、演唱等特征,從更多層面去挖掘各種歸類音樂的可能性,試圖讓更多用戶在搜尋時更加得心應(yīng)手。另外,社群網(wǎng)站平臺在未來將會對更多用戶及多媒體檢索系統(tǒng)產(chǎn)生巨大的影響,與社群網(wǎng)站有關(guān)的用戶推薦及標(biāo)注等功能數(shù)據(jù),值得未來的學(xué)者進一步探討。希望本文的研究項目有助于網(wǎng)絡(luò)文創(chuàng)平臺的更新和開發(fā),期能制造出具有市場導(dǎo)向的創(chuàng)新性研究價值?!?/p>