李春雨 石虔韓 伍尚樂
【摘? 要】本文基于2021年美賽建模D題。為了量化音樂的影響,首先,我們創(chuàng)建一個(gè)表示音樂影響的加權(quán)鄰接矩陣,在這個(gè)矩陣網(wǎng)絡(luò)中,我們關(guān)注最后兩個(gè)指標(biāo):總和和出圈率。然后,我們創(chuàng)建一個(gè)子網(wǎng)絡(luò)來顯示我們的“音樂影響力”指標(biāo)揭示了什么。下一步為了找出音樂的相似度,我們采用了聚類分析的方法。該方法首先對(duì)給定的數(shù)據(jù)進(jìn)行預(yù)處理和距離歸一化。然后,利用歐幾里德距離對(duì)相似度進(jìn)行量化,距離越短,音樂家(或流派)之間就越相似。最后運(yùn)用時(shí)間序列模型分析音樂是如何隨著時(shí)間的推移而變化的。
【關(guān)鍵詞】鄰接矩陣;聚類分析;時(shí)間序列模型
1.概述
音樂自古以來就是人類文化的一部分。有時(shí),音樂會(huì)發(fā)生進(jìn)化和革命性的變化,這在音樂的發(fā)展過程中具有重要意義。因此,我們有必要建立一個(gè)衡量音樂影響的模型,并應(yīng)用它來研究音樂是如何隨著時(shí)間而變化的。首先,我們需要構(gòu)建加權(quán)鄰接矩陣來連接影響者和被影響者,并創(chuàng)建一個(gè)子網(wǎng)絡(luò)來顯示我們的“音樂影響”度量所揭示的內(nèi)容。然后,我們需要探討同一流派和不同流派音樂家的相似度,不同流派的相似度以及影響者和追隨者的相似度。最后我們需要分析音樂是如何隨著時(shí)間而發(fā)展的。
2.加權(quán)鄰接矩陣
2.1加權(quán)鄰接矩陣說明
鄰接矩陣是表示不同流派之間關(guān)系的方陣,其維度數(shù)是流派的個(gè)數(shù),而加權(quán)鄰接矩陣是賦予數(shù)值不同權(quán)重的鄰接矩陣。我們用Wij表示i行類型影響j列類型的次數(shù),用wij表示加權(quán)鄰接矩陣的條目,它對(duì)應(yīng)于i行類型對(duì)j列類型的影響程度。
說明:(1)取流派名稱的前幾位字母表示(2)wij由Wij加權(quán)后乘以10000獲得;(3) Sum是一行wij的和,Per是對(duì)其他流派的影響程度占總影響程度的百分比,即出圈率;(4) 大于20的數(shù)值標(biāo)為粗體。
2.2子網(wǎng)
使用上面的加權(quán)鄰接矩陣,我們現(xiàn)在創(chuàng)建它的子網(wǎng)絡(luò)。如表2所示:
說明:(1)SI是指對(duì)流派內(nèi)的影響程度;(2) OI是指對(duì)其他流派的影響程度;(3)TI表示影響的總程度。
通過對(duì)加權(quán)鄰接矩陣和子網(wǎng)絡(luò)的分析,得出結(jié)論:TI(Sum)越大,總影響程度越大;Per值越大,對(duì)其他流派的影響程度的占比越大,即越出圈。比如前衛(wèi)派(A),它的TI值很小,Per值最大,也就是說,這個(gè)流派雖然影響很小,但是主要是對(duì)其他大多數(shù)流派的影響。
3. 歐幾里德距離矩陣
聚類分析是多元統(tǒng)計(jì)分類學(xué)的一種形式,其基本思想是根據(jù)表征樣本的特征變量的相似度,將具有相似性質(zhì)的變量歸為一類,將具有不同性質(zhì)的變量歸為另一類。在對(duì)變量進(jìn)行排序之后,我們可以直接分析類別。該方法首先對(duì)給定的數(shù)據(jù)進(jìn)行預(yù)處理和距離歸一化。然后,利用歐幾里德距離對(duì)相似度進(jìn)行量化。距離越短,音樂家(或流派)就越相似。
3.1預(yù)處理
在預(yù)處理過程中,我們首先排除了一些不太相關(guān)的變量,如藝人姓名、藝人編號(hào)、人氣、發(fā)行日期和歌曲標(biāo)題。因此,我們得到了我們需要的12個(gè)樣本指標(biāo),它們是可舞性、能量、配價(jià)、節(jié)奏、響度、模式、音調(diào)、聲學(xué)、樂器性、活性、言語性。注意,因?yàn)橐粽{(diào)中沒有-1,即不存在缺失數(shù)據(jù)的情況,我們可以直接統(tǒng)一進(jìn)行下一步。
3.2 距離歸一化
我們注意到不同值之間的數(shù)量級(jí)不同,因此,我們對(duì)上述12個(gè)樣本指標(biāo)數(shù)據(jù)組執(zhí)行范圍歸一化。范圍歸一化是對(duì)一系列值(x1,x2,…,xk,…,xn)進(jìn)行歸一化的過程,其中max{x},min{x}分別表示最大項(xiàng)和最小項(xiàng),我們使用以下公式將xk轉(zhuǎn)換為xk?:
其中xk 屬于 [0,1].
3.3音樂相似性度量
在這一部分中,我們使用歐幾里德距離來量化相似度,相似度的計(jì)算公式如下:
3.4音樂家歐幾里德距離矩陣
為了探討音家之間的相似程度,我們隨機(jī)選取10位音樂家來計(jì)算他們的歐幾里德距離。它們是blink-182 (a1), Misfits (a2), Coldplay (a3), The Replacements (a4), Sarah Vaughan (a5), Julie London (a6), Michael Jackson (a7), The Isley Brothers (a8), John Lee Hooker (a9), and Johnny Cash (a10)。然后得到歐幾里德距離矩陣,如表3所示:
歐幾里德距離越小,音樂家就越相似。根據(jù)我們的計(jì)算,同一流派的平均歐氏距離為0.663,而不同流派的平均歐氏距離為1.178,這意味著同一流派的音樂家比不同流派的音樂家更相似。
3.5流派歐幾里德距離矩陣
為了進(jìn)一步探討不同流派之間的相似度,我們利用歐幾里德距離公式來計(jì)算不同流派之間的歐幾里德距離。然后得到流派之間的歐幾里德距離矩陣,如表4所示。同樣地,歐幾里德距離越小,流派間就越相似。因此,我們認(rèn)為歐幾里德距離的數(shù)值是區(qū)分流派的指標(biāo)。例如,藍(lán)調(diào)(B)和兒童音樂(CH),藍(lán)調(diào)(B)和鄉(xiāng)村音樂(COU),它們的歐幾里德距離很小,因此它們相對(duì)更相似。另一方面,宗教音樂(REG)和古典音樂(CL)、流行搖滾(P)和新生代音樂(N),它們的歐幾里德距離很大,因此它們的相似性相對(duì)較小。以圖1用樹狀圖進(jìn)行詳細(xì)展示:
3.6影響者和追隨者的歐幾里德距離
下面為了探討影響者與追隨者的相似度,我們使用歐幾里德距離公式來計(jì)算他們的歐幾里德距離。對(duì)于同一流派的影響者和追隨者,我們只是隨機(jī)選擇一對(duì),而對(duì)于不同流派的影響者和追隨者,我們隨機(jī)選擇一對(duì)來自不同流派的影響者和追隨者。然后,我們得到了影響者和追隨者的歐幾里德距離,如表5所示:
從表5可以看出,同一流派和不同流派的影響者和追隨者的歐幾里德距離平均值分別為0.656和0.831,表明影響者確實(shí)影響追隨者,但影響程度不同。同一流派內(nèi)的距離較小,表明影響程度較高,而不同流派的距離較大,影響程度較低。
4.時(shí)間序列模型
為了分析流派如何隨著時(shí)間的推移而變化,我們采用了時(shí)間序列模型。通過該模型,我們可以很容易地了解流派的變化趨勢。為了消除偶然因素影響下隨機(jī)波動(dòng)的影響,我們采用歷史數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,并對(duì)數(shù)據(jù)進(jìn)行適當(dāng)處理,預(yù)測趨勢。對(duì)于序列{t1,t2,…,tn}和α屬于(0,1),令t1?=t1,我們應(yīng)用以下公式,其中α=0.45:
因?yàn)橐粽{(diào)的變化雜亂且與時(shí)間無關(guān),可舞性和節(jié)奏等6種指標(biāo)相對(duì)穩(wěn)定,因此我們主要關(guān)注四個(gè)指標(biāo):能量、響度、人氣和聲學(xué)。可以看到能量、響度和人氣呈上升趨勢,而聲學(xué)指標(biāo)呈下降趨勢,表明音樂的確隨時(shí)間變化。如圖2所示:
5 .模型評(píng)價(jià)
(1)通過歸一化,成功地將因子轉(zhuǎn)換為同一維度[0,1]。因此,可以通過歐幾里德距離來衡量音樂家和流派之間的相似性。
(2)利用時(shí)間序列模型得到了一些因素的變化趨勢,消除不規(guī)則波動(dòng)。
參考文獻(xiàn)
[1]黃家慶。論音樂在社會(huì)文明發(fā)展中的作用[J]。新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),1990(02):92-95+105.
[2]鄒璐。音樂教育在社會(huì)發(fā)展中的作用[J]。現(xiàn)代傳播,2012(01):255.
[3]錢小剛、朱志強(qiáng)。聚類分析[J]。栽培與栽培,1987(06):44-48.
[4]司守奎、孫兆良。數(shù)學(xué)建模算法及應(yīng)用[M]。Beijing:National Defense 工業(yè)出版社,2020:167-171.