何國(guó)柱,喬曉艷
(山西大學(xué) 物理電子工程學(xué)院,山西 太原 030006)
情緒識(shí)別在人機(jī)交互、醫(yī)療健康、智能駕駛以及教育等領(lǐng)域都發(fā)揮著至關(guān)重要的作用.因此,非常需要一種利用計(jì)算機(jī)自動(dòng)識(shí)別人類情感狀態(tài)的方法.目前,自動(dòng)情緒識(shí)別的研究包括生理和非生理信號(hào)情緒識(shí)別.由于生理信號(hào)的情緒識(shí)別不易受被試主觀意志的影響,更接近于真實(shí)的內(nèi)在心理感受,因而生理信號(hào)情緒識(shí)別比非生理信號(hào)更加客觀、真實(shí)、具有說(shuō)服力,逐漸成為研究的熱點(diǎn).情緒識(shí)別常用的生理信號(hào)包括:腦電、心電、肌電、脈搏、皮膚電反應(yīng)等.其中,皮膚電反應(yīng)(Galvanic Skin Response, GSR)是皮膚電導(dǎo)隨皮膚電流大小而產(chǎn)生的變化,屬于人體交感神經(jīng)系統(tǒng)活動(dòng)的生理反應(yīng)[1].研究表明,人體皮膚電導(dǎo)的變化強(qiáng)度與情緒激動(dòng)程度有關(guān),皮膚電反應(yīng)可以作為衡量情緒狀態(tài)變化的生理指標(biāo).皮膚電反應(yīng)與腦電、心電相比更易于測(cè)量和采集,且不易受其他生理信號(hào)干擾,因此在情緒識(shí)別領(lǐng)域得到越來(lái)越多的研究和應(yīng)用.
目前,關(guān)于皮膚電信號(hào)情緒識(shí)別研究較多的是基于離散情感模型.Zhang[2]等人提取皮膚電信號(hào)時(shí)域、頻域的統(tǒng)計(jì)特征,對(duì)快樂(lè)、恐懼、悲傷、憤怒和平靜5種離散情緒,采用基于改進(jìn)的神經(jīng)網(wǎng)絡(luò)進(jìn)行情感識(shí)別研究,平均識(shí)別準(zhǔn)確率為84.9%.劉光遠(yuǎn)等人[3]用非線性分析方法,提取皮膚電信號(hào)的最大Lyapunov指數(shù),關(guān)聯(lián)維、近似熵等非線性特征,對(duì)高興、悲傷、恐懼3種離散情緒采用K近鄰、線性判別分析 、支持向量機(jī)(Support Vector Machine,SVM) 進(jìn)行情感識(shí)別研究,結(jié)果顯示SVM具有更好的分類正確率,其中高興情緒識(shí)別正確率達(dá)到了92.33%.目前,離散情感模型的情緒識(shí)別正確率高,但離散情感模型刻畫的情緒種類較單一、描述情緒的模糊性和復(fù)雜性較低.基于維度模型的連續(xù)情感較離散情感更能精確細(xì)致地刻畫人的復(fù)雜情緒狀態(tài),更符合實(shí)際應(yīng)用,因此越來(lái)越多的學(xué)者開(kāi)展維度情感模型的生理信號(hào)情緒識(shí)別;Sharma[4]等人在DEAP數(shù)據(jù)集[5]上提取皮膚電信號(hào)的時(shí)域、頻域統(tǒng)計(jì)特征以及小波系數(shù)特征,利用主成分分析進(jìn)行特征降維,基于維度情感模型采用多層感知機(jī)(Multilayer Perceptron,MLP)分別在喚醒度、效價(jià)和優(yōu)勢(shì)度上進(jìn)行分類,正確率最高分別達(dá)到了79%,69.8%和71.2%;Atefeh[6]等人在DEAP數(shù)據(jù)集中提取脈搏信號(hào)和皮膚電信號(hào)的最大Lyapunov指數(shù)、近似熵等非線性特征,基于維度情感模型采用概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,PNN)在喚醒度和效價(jià)兩個(gè)情感維度上進(jìn)行分類,識(shí)別準(zhǔn)確率分別為88.57%和86.8%.
鑒于目前維度情感模型的皮膚電信號(hào)情緒識(shí)別準(zhǔn)確率較低,情感類別標(biāo)簽劃分不統(tǒng)一,提取的生理信號(hào)情感特征不充分,而且實(shí)驗(yàn)中個(gè)體差異性較大,導(dǎo)致識(shí)別模型泛化能力差.所以,本文在DEAP維度情感生理數(shù)據(jù)集上,通過(guò)皮膚電信號(hào)構(gòu)建情緒識(shí)別機(jī)器學(xué)習(xí)模型,對(duì)音樂(lè)視頻情感誘發(fā)下的皮膚電信號(hào)進(jìn)行多維度特征提取、歸一化處理以及情感標(biāo)簽分析,在此基礎(chǔ)上采用基于樹(shù)模型的決策樹(shù)和隨機(jī)森林算法實(shí)現(xiàn)情緒的有效分類,獲得了較好的分類準(zhǔn)確率和泛化能力,為實(shí)現(xiàn)生理信號(hào)情緒自動(dòng)分析和機(jī)器識(shí)別奠定堅(jiān)實(shí)基礎(chǔ).
DEAP數(shù)據(jù)集[5]是Koelstra等人通過(guò)實(shí)驗(yàn)采集得到的多通道生理信號(hào)情感數(shù)據(jù)集,成為多數(shù)學(xué)者研究維度情感模型情緒識(shí)別算法的有力工具.該數(shù)據(jù)集記錄了32名被試者32個(gè)通道的腦電信號(hào)和8個(gè)通道的外周生理信號(hào),其中皮膚電信號(hào)為第37通道.
實(shí)驗(yàn)中,每個(gè)被試者分別觀看40個(gè)不同情感、時(shí)長(zhǎng)為60 s的音樂(lè)視頻,被試者根據(jù)喚醒度(Arousal)、效價(jià)(Valence)、優(yōu)勢(shì)度(Dominance)、喜好度(Liking)和熟悉度(familiarity)對(duì)每個(gè)音樂(lè)視頻分別進(jìn)行評(píng)分.實(shí)驗(yàn)人員利用生理信號(hào)測(cè)量?jī)x和對(duì)應(yīng)的傳感器或電極記錄了32名被試者觀看情感音樂(lè)視頻時(shí)的60s生理數(shù)據(jù)以及觀看視頻之前自然狀態(tài)下的3 s生理數(shù)據(jù),同時(shí)還錄制了前22名被試者觀看音樂(lè)視頻過(guò)程中的正面面部表情視頻.
實(shí)驗(yàn)以512 Hz的采樣率記錄腦電信號(hào)和外周生理信號(hào),并經(jīng)過(guò)預(yù)處理之后,將數(shù)據(jù)降采樣為 128 Hz.DEAP數(shù)據(jù)集中每名被試者的數(shù)據(jù)內(nèi)容包含了40個(gè)不同情感音樂(lè)視頻誘發(fā)下的40個(gè)通道的生理數(shù)據(jù)和4個(gè)情感維度的情感標(biāo)簽數(shù)據(jù),如表 1 所示.
表 1 DEAP數(shù)據(jù)集內(nèi)容
DEAP數(shù)據(jù)集中情感標(biāo)簽是對(duì)被試通過(guò)觀看不同情感音樂(lè)視頻產(chǎn)生的情感體驗(yàn)進(jìn)行評(píng)價(jià)獲得的.被試從喚醒度、效價(jià)、優(yōu)勢(shì)度、喜好度這4個(gè)維度,在自我情緒評(píng)定量表(Self-Assessment Manikin, SAM)上對(duì)情緒進(jìn)行量化.效價(jià)和喚醒度是目前大多數(shù)研究采用的情緒維度模式,效價(jià)表示情緒的正負(fù)性質(zhì),從悲傷、厭惡逐漸過(guò)渡到高興、愉悅,對(duì)應(yīng)的是由數(shù)字1到9的打分尺度來(lái)衡量;喚醒度表示情緒的強(qiáng)度程度,從放松、無(wú)聊逐漸過(guò)渡到激動(dòng)、全神關(guān)注,對(duì)應(yīng)的也是由數(shù)字1到9的打分尺度來(lái)衡量.每名被試者需要在每次實(shí)驗(yàn)后選擇代表情緒量化的分值.被試每次觀看不同視頻后產(chǎn)生的情緒,都可以用SAM表的標(biāo)準(zhǔn)來(lái)量化,用作后面的識(shí)別和分析.
在情緒識(shí)別過(guò)程中,情感標(biāo)簽的劃分對(duì)于情緒的正確分類至關(guān)重要,由于人的情緒不僅有正、負(fù)性情緒,還有介于兩者之間的中性情緒;在情緒的強(qiáng)烈程度上,不僅有情緒的強(qiáng)弱之分,還會(huì)出現(xiàn)平靜自然的狀態(tài),因此情緒識(shí)別要充分考慮到不同情緒的狀態(tài).只有確定情緒所處的狀態(tài),機(jī)器才能準(zhǔn)確地識(shí)別情緒.為了探索情緒的模糊性對(duì)情感分類結(jié)果的影響,本文在喚醒度和效價(jià)上分別采用不同的情感標(biāo)簽閾值進(jìn)行維度情緒狀態(tài)劃分.第Ⅰ類情況:情感標(biāo)簽分值大于或等于7作為高效價(jià)高喚醒度,小于或等于3作為低效價(jià)低喚醒度;第Ⅱ類情況:情感標(biāo)簽分值大于或等于6作為高效價(jià)高喚醒度,小于或等于4作為低效價(jià)低喚醒度.通過(guò)選取不同的閾值,分析情緒的模糊程度對(duì)識(shí)別結(jié)果的影響.在以上兩種不同情感閾值情況下,DEAP數(shù)據(jù)集中皮膚電信號(hào)對(duì)應(yīng)于效價(jià)和喚醒度情感標(biāo)簽的樣本數(shù)量也不同,如表 2 所示.
表 2 喚醒度和效價(jià)閾值劃分的樣本數(shù)量
在生理信號(hào)測(cè)量過(guò)程中,由于每一個(gè)被試個(gè)體差異性的影響,每一個(gè)人的生理信號(hào)是不相同的.即使是一個(gè)人在不同時(shí)間、不同環(huán)境下測(cè)量到的生理信號(hào)也會(huì)不相同,為了研究被試者的生理信號(hào)與情感反應(yīng)的關(guān)系,需要去除每一個(gè)被試者生理信號(hào)的基礎(chǔ)水平差異即個(gè)體差異性,才能有效降低由于個(gè)體差異造成的影響,得到生理信號(hào)與情感變化的內(nèi)在關(guān)系.本文采用的方法是:用每個(gè)被試在情緒視頻誘發(fā)下的GSR數(shù)據(jù)減去平靜狀態(tài)下的GSR數(shù)據(jù),然后對(duì)GSR信號(hào)的差值再進(jìn)行歸一化處理.
本文參照Augsburg大學(xué)[7]特征提取的方法,提取了皮膚電信號(hào)的22個(gè)時(shí)域特征,包括原始皮膚電信號(hào)經(jīng)過(guò)預(yù)處理后的平均值、中位數(shù)、標(biāo)準(zhǔn)差、最大值、最小值、最大值比率、最小值比率、最大值最小值之間的差值;一階差分的均值、一階差分的中位數(shù)、一階差分的標(biāo)準(zhǔn)差、一階差分的最大值、一階差分的最小值、一階差分的最大值比率、一階差分的最小值比率;二階差分的均值、二階差分的中位數(shù)、二階差分的標(biāo)準(zhǔn)差、二階差分的最大值、二階差分的最小值、二階差分的最大值比率、二階差分的最小值比率.
已有研究表明,皮膚電信號(hào)的功率譜密度可以衡量人體交感神經(jīng)系統(tǒng)的生理變化[8].由于皮膚電信號(hào)屬于非平穩(wěn)隨機(jī)信號(hào),本文利用AR模型功率譜估計(jì)方法進(jìn)行頻域分析和特征提取.
AR模型輸出的功率譜
(1)
式中:σ2為方差;p是AR模型的階數(shù);{ak(i),i=1,2,3…p}為AR模型的參數(shù).
利用Burg算法[9],可以快速遞推實(shí)現(xiàn)AR模型參數(shù)的估計(jì),經(jīng)過(guò)仿真測(cè)試,模型階數(shù)p選擇9.皮膚電信號(hào)的功率譜密度如圖 1 所示.
圖 1 皮膚電信號(hào)的功率譜密度
小波包變換是一種分析非平穩(wěn)信號(hào)更加細(xì)致、有效的方法.它將頻帶進(jìn)行多尺度劃分,對(duì)多分辨率分析沒(méi)有細(xì)分的高頻部分以二叉樹(shù)方式分解成等頻帶寬的子空間,并根據(jù)被分析信號(hào)的特性,自適應(yīng)地選擇相應(yīng)頻帶,使之與信號(hào)頻譜相匹配,從而提高時(shí)頻分辨率[10].
(2)
小波包節(jié)點(diǎn)能量可以有效表示信號(hào)分量的能量,是該節(jié)點(diǎn)小波包系數(shù)的平方和.小波包節(jié)點(diǎn)能量
(3)
該層節(jié)點(diǎn)的信號(hào)總能量為不同頻帶小波包節(jié)點(diǎn)能量之和,即
(4)
則小波包節(jié)點(diǎn)能量占比為
(5)
小波包熵反映了隨機(jī)序列的不確定性,小波包熵值越大表明序列無(wú)序性越強(qiáng).皮膚電信號(hào)的小波包熵與情緒狀態(tài)密切相關(guān),在不同情緒誘發(fā)下,交感神經(jīng)元興奮或抑制的狀態(tài)發(fā)生變化,導(dǎo)致皮膚電序列的無(wú)序性隨之發(fā)生變化,因此可提取皮膚電信號(hào)的小波包熵進(jìn)行情緒識(shí)別,小波包熵計(jì)算如式(6)
WEP=-∑pi,jlnpi,j.
(6)
DEAP數(shù)據(jù)集中GSR信號(hào)經(jīng)過(guò)預(yù)處理之后采樣頻率為128Hz.采用db5小波基函數(shù)對(duì)GSR信號(hào)進(jìn)行6尺度小波包分解,分解頻帶寬度為1 Hz,進(jìn)而得到第6尺度對(duì)應(yīng)頻段小波包系數(shù),計(jì)算皮膚電信號(hào)的小波包熵.
綜上所述,本文提取皮膚電信號(hào)的時(shí)域、頻域、非線性共24個(gè)特征.如表 3 所示.
表3 提取的皮膚電信號(hào)特征數(shù)據(jù)
決策樹(shù)(Decision Tree,DT)是一種通過(guò)分支對(duì)原數(shù)據(jù)依靠其屬性進(jìn)行分類的樹(shù)形結(jié)構(gòu),決策樹(shù)由節(jié)點(diǎn)和有向邊組成.葉結(jié)點(diǎn)表示最終的分類標(biāo)簽,非葉結(jié)點(diǎn)為評(píng)估條件.進(jìn)行分類或測(cè)試時(shí),將輸入的原始數(shù)據(jù)集與樹(shù)形結(jié)構(gòu)的節(jié)點(diǎn)進(jìn)行匹配,最終找到唯一的葉結(jié)點(diǎn),則該葉結(jié)點(diǎn)的類別標(biāo)簽就是該數(shù)據(jù)對(duì)應(yīng)的分類類別[11].目前,決策樹(shù)的主流算法有ID3,C4.5,CART 等.ID3算法的核心是在決策樹(shù)各個(gè)節(jié)點(diǎn)上用信息增益準(zhǔn)則選擇特征,遞歸構(gòu)建決策樹(shù);C4.5算法對(duì)ID3算法進(jìn)行了改進(jìn),在決策樹(shù)生成的過(guò)程中,用信息增益比來(lái)選擇特征.本文采用分類與回歸樹(shù)(Classification and Regression Tree, CART)模型,CART算法利用基尼系數(shù)來(lái)進(jìn)行特征選擇.
樣本集合D的基尼系數(shù)
(7)
式中:pk是樣本點(diǎn)屬于第k個(gè)類的概率;Ck是樣本集合D中屬于第k類樣本子集;K是類的個(gè)數(shù).
樣本集合D根據(jù)特征A是否取得某一可能值a,將集合D分成D1和D2兩部分,即
D1={(x,y)∈D|A(x)=a},D2=D-D1.
(8)
則集合D的基尼系數(shù)為
(9)
基尼系數(shù)Gini(D)表示集合D的不確定性,Gini(D,A) 表示經(jīng)A=a分割后集合D的不確性.CART算法具有選擇最小基尼系數(shù)的特性,基尼系數(shù)的值越小,樣本的“純凈度”越高,劃分效果越好.為了解決過(guò)擬合的問(wèn)題,提高決策樹(shù)泛化性能,需要對(duì)生成的決策樹(shù)進(jìn)行后剪枝處理.
隨機(jī)森林(Random Forest,RF)是以自舉匯聚法(bagging)為基礎(chǔ),由多個(gè)弱分類器(決策樹(shù))組成的強(qiáng)分類器.首先,通過(guò)自助法(bootstrap)放回抽樣并構(gòu)造子訓(xùn)練數(shù)據(jù)集,每個(gè)子訓(xùn)練數(shù)據(jù)集構(gòu)造一個(gè)決策樹(shù),然后隨機(jī)選取特征參數(shù)對(duì)決策樹(shù)進(jìn)行訓(xùn)練.每個(gè)決策樹(shù)互不相干,判決時(shí)將多個(gè)決策樹(shù)分類器的判決結(jié)果進(jìn)行投票,得到最終的結(jié)果[12].
設(shè)樣本屬性個(gè)數(shù)為Mm為大于零且小于M的整數(shù),RF算法實(shí)現(xiàn)步驟為:
1) 利用Bootstrap方法重采樣,隨機(jī)產(chǎn)生T個(gè)訓(xùn)練集S1,S2…,ST.
2) 利用每個(gè)訓(xùn)練集,生成對(duì)應(yīng)的決策樹(shù)N1,N2,…,NT;在非葉子節(jié)點(diǎn)(內(nèi)部節(jié)點(diǎn))上選擇屬性前,從M個(gè)屬性中隨機(jī)抽取m個(gè)屬性作為當(dāng)前節(jié)點(diǎn)的分裂屬性集,并以這m個(gè)屬性中最好的分裂方式對(duì)該節(jié)點(diǎn)進(jìn)行分裂.保證每棵樹(shù)都完整成長(zhǎng),不對(duì)其進(jìn)行剪枝處理.
3) 對(duì)于測(cè)試集樣本X,利用每個(gè)決策樹(shù)進(jìn)行測(cè)試,得到對(duì)應(yīng)的類別N1(x),N2(x),…,NT(x).
4) 采用投票的方法,將T個(gè)決策樹(shù)中輸出最多的類別作為測(cè)試樣本X所屬類別.
本文提取了皮膚電信號(hào)的時(shí)域、頻域以及非線性共24個(gè)特征,因此樣本屬性個(gè)數(shù)M=24.為了保證整個(gè)隨機(jī)森林算法的分類準(zhǔn)確率,需要設(shè)置合適的決策樹(shù)數(shù)量(Ntrees)來(lái)解決袋外錯(cuò)誤率(Out-of Bag Error,OOB Error)過(guò)高和不穩(wěn)定的現(xiàn)象.通過(guò)仿真實(shí)驗(yàn),本文決策樹(shù)數(shù)量設(shè)置為500.圖 2 是決策樹(shù)數(shù)量與袋外錯(cuò)誤率的關(guān)系,可以看出,隨著決策樹(shù)數(shù)量增加,袋外錯(cuò)誤率逐漸降低,當(dāng)決策樹(shù)數(shù)量為500時(shí)誤差較小且穩(wěn)定.
圖2 決策樹(shù)數(shù)量與袋外錯(cuò)誤率的關(guān)系
本文采用5折交叉驗(yàn)證的方法對(duì)決策樹(shù)和隨機(jī)森林算法進(jìn)行檢驗(yàn)以得到穩(wěn)定可靠的分類模型,即將皮膚電信號(hào)的特征樣本數(shù)據(jù)隨機(jī)均勻分成 5份,保留其中1份作為測(cè)試集,其余4份作為訓(xùn)練集,重復(fù)5次,并將這5次分類準(zhǔn)確率的結(jié)果取平均,得到最終的交叉驗(yàn)證分類準(zhǔn)確率.
4.1.1 模型評(píng)價(jià)指標(biāo)
對(duì)于二分類問(wèn)題常用的模型評(píng)價(jià)指標(biāo)是分類準(zhǔn)確率(Accuracy,Acc)、精確率(Precision,P)、召回率(Recall,R)和F1值以及混淆矩陣.
分類準(zhǔn)確率定義為
(10)
精確率定義為
(11)
召回率定義為
(12)
F1值定義為
(13)
式中:TP表示將正類預(yù)測(cè)為正類數(shù),即真正類;FN表示將正類預(yù)測(cè)為負(fù)類數(shù),即假負(fù)類;FP表示將負(fù)類預(yù)測(cè)為正類數(shù),即假正類;TN表示將負(fù)類預(yù)測(cè)為負(fù)類數(shù),即真負(fù)類.本文將情感標(biāo)簽為高喚醒度、高效價(jià)的樣本記為正類樣本,低喚醒度、低效價(jià)的樣本記為負(fù)類樣本.
4.1.2 仿真結(jié)果
將提取到的皮膚電信號(hào)的時(shí)域統(tǒng)計(jì)特征、頻域特征以及非線性特征,采用決策樹(shù)和隨機(jī)森林在喚醒度和效價(jià)兩個(gè)情感維度上進(jìn)行分類,分類結(jié)果的混淆矩陣如圖 3 和圖 4 所示,并利用式(10)~式(13)計(jì)算其分類準(zhǔn)確率Acc、精確率P、召回率R和F1值.
4.2.1 情感標(biāo)簽閾值對(duì)分類結(jié)果的影響
本文在喚醒度和效價(jià)兩個(gè)情感維度上對(duì)情感標(biāo)簽閾值進(jìn)行劃分,分為兩大類.通過(guò)選取不同的情感標(biāo)簽閾值來(lái)研究其對(duì)情緒識(shí)別結(jié)果的影響,模型評(píng)價(jià)指標(biāo)結(jié)果如表 4 所示.
表 4 不同情感標(biāo)簽閾值的分類結(jié)果對(duì)比
表 4 結(jié)果表明,在喚醒度維度上,利用決策樹(shù)算法在第Ⅱ類閾值設(shè)定下的分類準(zhǔn)確率和F1值分別為88.6%和0.901,而第Ⅰ類閾值的結(jié)果為80.9%和0.847;利用隨機(jī)森林算法在第Ⅱ類閾值設(shè)定下的分類準(zhǔn)確率和F1值分別達(dá)到了92.0% 和0.933,第Ⅰ類閾值的結(jié)果為86.8%和0.897.在效價(jià)維度亦是如此.由此可知:利用決策樹(shù)或隨機(jī)森林算法在喚醒度和效價(jià)上進(jìn)行情感分類時(shí),無(wú)論是分類準(zhǔn)確率Acc、還是精確率P、召回率R和F1值,第Ⅱ類閾值設(shè)定的情緒識(shí)別分類結(jié)果均優(yōu)于第Ⅰ類閾值的結(jié)果.原因主要在于第Ⅱ類閾值設(shè)定,無(wú)論在喚醒度還是效價(jià)維度上模型訓(xùn)練的樣本數(shù)量均多于第Ⅰ類閾值設(shè)定的樣本量,不會(huì)出現(xiàn)欠擬合,可以充分學(xué)習(xí)到情感豐富的特征,從而有利于情緒的識(shí)別.因此,在進(jìn)行情感標(biāo)簽閾值劃分時(shí),不僅需要考慮在喚醒度和效價(jià)上情緒表現(xiàn)的強(qiáng)烈程度,還需要考慮到樣本數(shù)量對(duì)于情緒分類的影響.由此表明,選擇合適的情感閾值和訓(xùn)練樣本數(shù)量有利于提高情緒識(shí)別準(zhǔn)確率.
4.2.2 分類算法對(duì)情緒識(shí)別結(jié)果的影響
本文分別采用了決策樹(shù)和隨機(jī)森林算法在喚醒度和效價(jià)上進(jìn)行情緒識(shí)別,分類結(jié)果如表5所示.
表5結(jié)果顯示,第Ⅱ類情感標(biāo)簽閾值情況下,在喚醒度維度采用隨機(jī)森林算法分類準(zhǔn)確率和F1值分別為92.0%和0.933,高于決策樹(shù)算法的88.6% 和0.901.在效價(jià)維度上亦是如此.因此,無(wú)論是分類準(zhǔn)確率Acc,還是精確率P、召回率R和F1值,采用隨機(jī)森林算法在喚醒度和效價(jià)上進(jìn)行情感分類的結(jié)果均優(yōu)于決策樹(shù)算法.由此表明,在皮膚電信號(hào)的情緒識(shí)別中,隨機(jī)森林基于集成學(xué)習(xí)的組合分類器相比單一的決策樹(shù)分類器可以提高分類準(zhǔn)確率,并有效減少過(guò)擬合現(xiàn)象,提高模型的泛化能力,同時(shí)該算法具有速度快、時(shí)間開(kāi)銷少、穩(wěn)健性好等特點(diǎn).
表 5 決策樹(shù)和隨機(jī)森林分類結(jié)果對(duì)比
4.2.3 與其他方法比較
將本文提取皮膚電信號(hào)的時(shí)域統(tǒng)計(jì)特征,功率譜密度最大值和小波包熵特征,采用決策樹(shù)和隨機(jī)森林算法在喚醒度和效價(jià)上進(jìn)行情感分類,并與其他機(jī)器學(xué)習(xí)方法相比,取得了較好的分類效果.如表 6 所示.
對(duì)于維度情感模型而言,采用決策樹(shù)和隨機(jī)森林算法在喚醒度和效價(jià)兩個(gè)情感維度上,分類結(jié)果均優(yōu)于文獻(xiàn)[4]采用多層感知機(jī)達(dá)到的分類準(zhǔn)確率.其中采用隨機(jī)森林算法在喚醒度和效價(jià)上的情感分類準(zhǔn)確率高于文獻(xiàn)[6]采用概率神經(jīng)網(wǎng)絡(luò)的情緒識(shí)別結(jié)果.本文采用的維度情感模型與基于離散情感模型的情緒識(shí)別相比較,采用隨機(jī)森林算法,在喚醒度和效價(jià)兩個(gè)情感維度上分類準(zhǔn)確率分別達(dá)到了92.0%和90.9%,接近文獻(xiàn)[3]基于離散情感模型的識(shí)別準(zhǔn)確率,遠(yuǎn)高于文獻(xiàn)[4]維度情感模型的識(shí)別準(zhǔn)確率.由此可知,皮膚電信號(hào)在維度模型進(jìn)行情緒識(shí)別時(shí),通過(guò)提取皮膚電信號(hào)的時(shí)域、頻域和時(shí)頻非線性特征,并采用隨機(jī)森林集成學(xué)習(xí)的樹(shù)模型算法可以獲得較好的情緒識(shí)別結(jié)果和性能.
表 6 不同分類方法的分類準(zhǔn)確率對(duì)比
本文基于DEAP數(shù)據(jù)集提取皮膚電信號(hào)的時(shí)域、頻域以及非線性特征,并利用決策樹(shù)和隨機(jī)森林算法在喚醒度和效價(jià)兩個(gè)情感維度上進(jìn)行情緒識(shí)別.仿真實(shí)驗(yàn)結(jié)果表明:在維度模型上進(jìn)行情感分類時(shí),選取合適的情感標(biāo)簽閾值和樣本數(shù)量可有效提高機(jī)器情緒識(shí)別正確率;利用基于集成學(xué)習(xí)的隨機(jī)森林算法在進(jìn)行情緒分類時(shí)獲得比單一決策樹(shù)分類器更好的識(shí)別效果;采用多特征融合以及GSR信號(hào)差值歸一化處理,模型的泛化能力更強(qiáng).該研究可以應(yīng)用于智慧醫(yī)療、人機(jī)情感交互、教育和娛樂(lè)領(lǐng)域.