• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于歌詞的流行音樂情感二值分類研究

      2016-02-13 07:03:28蔣旻雋
      現(xiàn)代計算機(jī) 2016年35期
      關(guān)鍵詞:特征向量流行音樂類別

      蔣旻雋

      (上海應(yīng)用技術(shù)大學(xué)計算機(jī)科學(xué)與信息工程學(xué)院,上海 201418)

      基于歌詞的流行音樂情感二值分類研究

      蔣旻雋

      (上海應(yīng)用技術(shù)大學(xué)計算機(jī)科學(xué)與信息工程學(xué)院,上海 201418)

      著眼于音樂情感的分類,使用計算機(jī)領(lǐng)域文本分類的技術(shù),利用KNN分類算法,對流行音樂中的情感進(jìn)行挖掘,從而實(shí)現(xiàn)基于中文歌詞的流行音樂情感的二值分類。主要借鑒文本處理的方法,將歌詞通過分詞、詞頻統(tǒng)計、權(quán)重計算等一系列的處理,變?yōu)榭捎嬎愕奶卣飨蛄?;并且在此基礎(chǔ)上使用KNN分類算法,對于流行音樂中的情感進(jìn)行了二值分類。通過實(shí)驗(yàn)結(jié)果可以看出,該方法有較高的準(zhǔn)確率。

      情感分類;流行音樂;歌詞文本處理;KNN算法

      0 引言

      音樂是人們休閑娛樂生活中必不可少的一部分,計算機(jī)與互聯(lián)網(wǎng)的發(fā)展使我們可以通過網(wǎng)絡(luò)方便地取得音樂資源,網(wǎng)絡(luò)上的海量音樂信息,對媒體內(nèi)容的管理和檢索提出了更高的要求。通過音樂所表達(dá)的情感進(jìn)行音樂檢索更方便,更智能,更貼近人們的日常生活。從前的音樂檢索方式大多忽略了用戶對于音樂情感上的需求,更多的是通過聲學(xué)、音頻等專業(yè)鄰域的特征檢索。有關(guān)基于情感的音樂檢索的研究工作較少,F(xiàn)eng等通過檢測音樂的演奏速度和清晰度,來分析音樂中所蘊(yùn)含的情感[1]。情感識別方法主要有基于知識的模型和基于數(shù)據(jù)的模型[2],使用統(tǒng)計分析或者機(jī)器學(xué)習(xí)的理論建立關(guān)鍵變量與其他可測變量的統(tǒng)計或者學(xué)習(xí)模型也是最常用的方法,例如基于支持向量機(jī)[3-5]的方法、高斯混合模型方法[6]。

      本文的重點(diǎn)在于挖掘流行音樂中的情感,基于流行音樂的歌詞對其進(jìn)行二值分類。本文主要從音樂歌詞所包含的情感分類技術(shù)出發(fā),在現(xiàn)有歌詞分類方法的基礎(chǔ)上,與音樂領(lǐng)域的相關(guān)知識相結(jié)合,構(gòu)建情感所對應(yīng)的詞匯表,將中文文本分類的方法應(yīng)用于流行音樂的情感分類中,結(jié)合KNN分類算法,實(shí)現(xiàn)流行音樂的情感二值分類。

      1 基于KNN算法的音樂情感分類

      對于情感的分類而言,最常見也是最直接簡單的情感分類方式便是好和壞,積極與消極。根據(jù)一定的調(diào)查和研究,大部分的流行音樂所帶給人們直觀的感覺便是表示積極情緒和表示消極情緒的音樂,所以本文將流行音樂中的情感分類兩大類,體現(xiàn)積極情緒的一類和表現(xiàn)消極情感的一類。

      K最近鄰(KNN,k-Nearest Neighbor)分類算法是數(shù)據(jù)挖掘分類技術(shù)中最簡單的方法之一。KNN算法的核心思想是如果一個樣本在特征空間中的k個最相鄰的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。該方法在確定分類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。KNN方法在類別決策時,只與極少量的相鄰樣本有關(guān)。由于KNN方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別的,因此對于類域的交叉或重疊較多的待分樣本集來說,KNN方法較其他方法更為適合。

      KNN算法的基本步驟為:(1)算距離:給定測試對象,計算它與訓(xùn)練集中的每個對象的距離;(2)找鄰近:圈定距離最近的K個訓(xùn)練對象,作為測試對象的鄰近;(3)做分類:根據(jù)這K個鄰近歸屬的主要類別,來對測試對象分類。

      2 音樂情感與特征向量

      2.1 音樂情感表達(dá)

      本文研究的對象是流行音樂的歌詞與音樂情感的對應(yīng)關(guān)系,已有的研究成果表明,漢語情感詞匯主要分布在名詞、動詞和形容詞中,本文根據(jù)查閱的相關(guān)資料,在已有的成果的基礎(chǔ)上,構(gòu)造了適用于本次實(shí)驗(yàn)的情感詞匯與類別對應(yīng)表。將感情分類積極和消極兩大情感大類,而其中又各細(xì)分了6類情感小類。詳見表1中的情感與形容詞的對應(yīng)關(guān)系。

      2.2 特征向量

      計算機(jī)無法直接處理文字、語言,必須通過一定的方法將文本形式的歌詞轉(zhuǎn)化為可以被計算機(jī)處理的形式化特征向量。利用向量空間模型,文本的數(shù)據(jù)就轉(zhuǎn)換成了計算機(jī)可以處理的結(jié)構(gòu)化數(shù)據(jù),兩個文檔之間的相似性問題轉(zhuǎn)變成了兩個向量之間的相似性問題。

      本文將歌詞的文檔以表示情感的特征詞用空間向量的形式表達(dá)出來特征向量表示為D=(t1,t2,…,tn),由于我們將情感細(xì)分為12小類,因此此處n的取值為12,即每個特征向量是12維的。另外,每一維表示某一文本中出現(xiàn)第i個小類中的形容詞的次數(shù)。例如,某首歌詞中出現(xiàn)了3次“笑容”,1次“甜蜜”,1次“溫馨”,對照表1,可以發(fā)現(xiàn)這幾個詞語都被歸納在第六個小類“快樂”這一情感中,因此對于這首歌詞的特征元素t6的計數(shù)值就為6。

      當(dāng)?shù)玫揭皇赘柙~文本后,首先要使用特殊工具對其進(jìn)行分詞,將完整的詞句變?yōu)橐粋€個單詞,隨后通過手動操作從中選取名詞、形容詞等富含情感因素的詞語,第三步是將這些詞語和下表的情感類別詞匯對比,統(tǒng)計任意一首歌詞,對于每一個情感小類中的詞語出現(xiàn)的次數(shù),最終得到每首文本歌詞所對應(yīng)的特征向量。

      表1 情感類別與詞匯對應(yīng)表

      3 實(shí)驗(yàn)分析

      3.1 總體設(shè)計

      本方法主要有預(yù)處理和分類處理兩大部分。預(yù)處理部分主要將文本型的歌詞進(jìn)行分詞以及一系列相關(guān)的后序處理,最終得到相關(guān)的特征向量;而實(shí)際的分類處理,則是利用KNN算法,通過計算測試的未知樣本與已知的訓(xùn)練樣本之間計算歐式距離,以及排序比對等處理,以得到未知樣本所在的類別。主要可以細(xì)分為以下幾個步驟:

      ①使用ICTCLA2014對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分詞,表示出使用數(shù)據(jù)的特征詞;

      ②進(jìn)行特征項(xiàng)的選取,選擇歌詞中的帶有明顯情感特征的詞匯,形容詞、名詞和動詞作為特征項(xiàng);

      ③詞頻統(tǒng)計,統(tǒng)計所選特征項(xiàng)在所需分類歌詞中文檔中出現(xiàn)的次數(shù),將所有的歌詞文本(包括訓(xùn)練樣本以及測試樣本)轉(zhuǎn)換為特征向量;

      ④手動將各個訓(xùn)練樣本的類別進(jìn)行標(biāo)注;

      ⑤利用KNN算法對各測試樣本進(jìn)行分類。

      3.2 實(shí)驗(yàn)與結(jié)果分析

      本次研究選用180首流音樂的中文歌詞。在180個實(shí)驗(yàn)數(shù)據(jù)中,有100首歌曲是情感類別已經(jīng)明確的訓(xùn)練樣本,而另外80首未標(biāo)注情感類別的歌詞文本作為測試樣本,主要用于對分類結(jié)果進(jìn)行觀察和分析驗(yàn)證分類方法的正確合理性。

      對于使用KNN算法有兩個關(guān)鍵點(diǎn),一是特征向量之間的距離計算公式的選擇,其二是關(guān)于關(guān)鍵參數(shù)k的取值。首先,我們選擇最為常用的歐氏距離來度量兩個向量之間的鄰近程度,計算公式為,d=。其中d為我們所求的距離,X=(x1,x2,…,xn)以及Y=(y1,y2,…,yn)為兩個特征向量,代表兩個歌詞文本。而對于k的選擇上,經(jīng)過反復(fù)實(shí)驗(yàn)對比k取值3的時候,分類的效果最佳。

      根據(jù)前面所設(shè)計的方案,所選用的音樂歌詞具有明顯的情感特征,語料庫主要收集近10年的流行音樂。本次實(shí)驗(yàn)中,測試樣本為80首歌曲,表示積極和消極各40首,積極類歌曲分類正確39首,正確率97.5%,消極歌曲分類正確38首,正確率95%??梢钥闯觯蟛糠智闆r屬于分類正確,少部分的語料分類不正確。

      4 結(jié)語

      本文主要研究如何利用KNN算法對流行音樂的情感進(jìn)行簡單的二值分類。文章首先探討了歌詞與音樂情感的關(guān)聯(lián),并借鑒文本處理的方法,將純粹文字記錄的歌詞通過分詞、詞頻統(tǒng)計等一系列的處理,變?yōu)榭捎嬎愕奶卣飨蛄?;并且在此基礎(chǔ)上使用KNN分類算法,對于流行音樂中的情感進(jìn)行了二值分類。通過實(shí)驗(yàn)結(jié)果的相關(guān)數(shù)據(jù)可以看出,該方法能夠得到較高的準(zhǔn)確率與覆蓋率。

      根據(jù)情感分類的方法在音樂信息檢索中有著重要的作用,同時也對理論的研究和應(yīng)用有著巨大的價值。還有很多知識和理論值的我們?nèi)ヌ剿魅W(xué)習(xí)。雖然歌詞與音樂情感有著很大的關(guān)聯(lián),但是旋律本身對于情感的體現(xiàn)也尤為重要,我們將在未來的研究中更著重旋律對于音樂情感的影響,并結(jié)合歌詞做進(jìn)一步的音樂情感分類研究。

      [1]Feng Y Z,Zhuang Y T,Pan Y H.Music Information Retrieval by Detecting Mood Via Computational Media Aesthetics[C].Proceedings of the IEEE International Conference on Web Intelligence.Beijing,China,2003:235-241.

      [2]童卡娜.基于音樂聯(lián)覺的聽覺金制度識別模型與算法研究[D].長沙:中南大學(xué)碩士學(xué)位論文,2007.

      [3]Umapathy K,Krishnan S,Jimaa S.Multigroup Classification of Audio Signals Using Time-Frequency Parameters[J].IEEE Trans.on Multimedia,2005,7(2):308-315.

      [4]Ogihara M.Content-Based Music Similarity Search and Emotion Detection[C].Proceedings on 2004 IEEE International Conference on Acoustics,Speech and Signal Processing,F(xiàn)airmont Queen Elizabeth Hotel,Montreal,Quebec,Canada,2004:17-21.

      [5]Wang M.User-Adaptive Music Emotion Recognition[C].IEEE Transactions on Audio,Speech and Language Processing,2008,16(2): 448-457.

      [6]Liu D,Lu L,Zhang HJ.Automatic Mood Detection from Acoustic Music Data[C].Proceedings of the 4th International Conference on Music Information Retrieval.Baltimore,Maryland,USA:Johns Hopkins University,2003.

      Research on Binary Classification of the Emotion of Pop Music on Lyric

      JIANG Min-jun

      (School of Computer Science and Information Engineering,Shanghai Institute of Technology,Shanghai 201418)

      Focuses on how to retrieve massive musical information on internet efficiently based on the emotions of different music,by using the techniques of text processing and KNN algorithm,it is possible to discover important information from pop music.Uses text processing method for reference to transform lyrics of music into feature vectors,applies KNN algorithm to classify musical emotion into two different categories.The proposed method is proved effective and correct by the experiments.

      Classification of the Emotion of Music;Pop Music;Lyric Text Processing;KNN Algorithm

      上海應(yīng)用技術(shù)學(xué)院引進(jìn)人才基金資助項(xiàng)目(No.YJ2011-69)

      1007-1423(2016)35-0055-04

      10.3969/j.issn.1007-1423.2016.35.011

      蔣旻雋(1981-),女,上海人,講師,博士,研究方向?yàn)槿斯ぶ悄?/p>

      2016-11-01

      2016-12-01

      猜你喜歡
      特征向量流行音樂類別
      二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計——以特征值和特征向量為例
      克羅內(nèi)克積的特征向量
      流行音樂里的新國潮
      一類特殊矩陣特征向量的求法
      EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用
      創(chuàng)新精神對流行音樂的作用
      北方音樂(2017年4期)2017-05-04 03:40:39
      多棱鏡中的流行音樂——兩岸四地“流行音樂文化高層論壇”述略
      人民音樂(2016年3期)2016-11-07 10:03:19
      服務(wù)類別
      新校長(2016年8期)2016-01-10 06:43:59
      和流行音樂有個約會
      論類別股東會
      商事法論集(2014年1期)2014-06-27 01:20:42
      北流市| 中阳县| 桂东县| 清新县| 太原市| 双流县| 泸水县| 疏附县| 长沙县| 长乐市| 洪泽县| 孟津县| 吴桥县| 澜沧| 罗田县| 沙湾县| 镇平县| 利津县| 平山县| 吉安市| 通许县| 神池县| 江西省| 丰台区| 莲花县| 湾仔区| 蒲江县| 从化市| 始兴县| 民乐县| 萨迦县| 兰坪| 府谷县| 岢岚县| 合肥市| 清徐县| 渑池县| 宾阳县| 广元市| 河西区| 张家界市|