• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      改進(jìn)的mRmR特征選擇方法在人體行為識(shí)別中的應(yīng)用

      2019-04-23 07:12:00王華華周遠(yuǎn)文趙永寬
      關(guān)鍵詞:特征選擇子集維數(shù)

      王華華,黃 龍,周遠(yuǎn)文,趙永寬

      (重慶郵電大學(xué) 移動(dòng)通信技術(shù)重慶市重點(diǎn)實(shí)驗(yàn)室,重慶 400065)

      0 引 言

      近年來,基于可穿戴傳感器的人體行為識(shí)別的研究吸引了越來越多國(guó)內(nèi)外學(xué)者的目光,通過將不同類型的傳感器穿戴于身體的不同位置可實(shí)現(xiàn)對(duì)一些日常人體行為的識(shí)別與監(jiān)測(cè),另外在智能家居方面也具有廣泛的應(yīng)用前景[1-5]?;趹T性傳感器的人體行為識(shí)別的整個(gè)流程中,隨著提取特征維數(shù)的不斷增加,必然會(huì)造成一些不相關(guān)及冗余特征的產(chǎn)生,那么特征選擇將是非常重要的一個(gè)環(huán)節(jié),提出一種行之有效的特征選擇方法至關(guān)重要。特征選擇數(shù)是從原始特征子集中選擇一個(gè)重要的子集以改進(jìn)學(xué)習(xí)系統(tǒng),降低實(shí)驗(yàn)計(jì)算復(fù)雜度,并能提高識(shí)別準(zhǔn)確率[6-9]。

      在基于慣性傳感器人體行為識(shí)別中,為了提高人體行為識(shí)別的準(zhǔn)確率,研究者們往往會(huì)提取大量的時(shí)域頻域特征,然而提取的特征維數(shù)不能無限增加,隨著特征維數(shù)的增多,可能導(dǎo)致維數(shù)災(zāi)難的后果,所以一般在提取特征后,需要對(duì)提取的特征集進(jìn)行降維,以達(dá)到去除不相關(guān)的冗余特征,降低計(jì)算復(fù)雜度并最終實(shí)現(xiàn)更好的分類效果。特征選擇方法一般可以分為2類:基于包裝器的方法與基于濾波器的方法[10]。文獻(xiàn)[11]提出了基于濾波器的特征選擇方法(Relief-F)[12]與基于封裝器的特征選擇方法相結(jié)合的使用方法。文獻(xiàn)[13]提出一種基于博弈論的特征選擇方法。文獻(xiàn)[14]提出一種不一致進(jìn)化特征選擇方法,該方法通過設(shè)計(jì)不一致度量方法并通過遺傳算法進(jìn)行優(yōu)化篩選特征子集。文獻(xiàn)[15]提出一種基于遺傳算法優(yōu)化的加速度特征選擇方法,達(dá)到一定的識(shí)別效果。但這些方法都存在著識(shí)別準(zhǔn)確率不高,特征選擇效果不好的問題。由于一些傳統(tǒng)的過濾式特征選擇方法只使用某一種相關(guān)性度量方法選擇和衡量與分類類別相關(guān)性大的特征,如距離度量、一致性度量、信息度量和依賴性度量等方式,并賦予與類別相關(guān)性大的特征較高的權(quán)重。這些方法一方面僅考慮了特征與類別之間的相關(guān)性而忽略了特征之間的相關(guān)性,從而無法去除特征之間的冗余性;另一方面該類方法忽略了特征之間的交互作用可能對(duì)分類帶來更好的效果,如一些特征在單獨(dú)用于分類時(shí)并不能達(dá)到很好的效果,但當(dāng)幾種特征相互結(jié)合使用時(shí)可能起到較好的分類作用。雖然每種相關(guān)度量方式各不相同,但各種相關(guān)度量方法在不同的特征選擇方法發(fā)揮著各自的作用,那么如何結(jié)合多種相關(guān)度量方式對(duì)特征子集進(jìn)行特征選擇將是本文研究的重點(diǎn)。

      基于此,本文提出一種基于多種相關(guān)度量的特征選擇方法,該方法首先通過融合多種性能優(yōu)異的相關(guān)度量方法對(duì)篩選特征子集進(jìn)行初步粗略降維,然后通過設(shè)計(jì)適應(yīng)度函數(shù),利用遺傳算法搜索最優(yōu)或者次優(yōu)特征子集,從而進(jìn)一步實(shí)現(xiàn)精細(xì)降維,并最終能有效降低特征維數(shù),同時(shí)能實(shí)現(xiàn)較低的分類誤差和較好的識(shí)別準(zhǔn)確率。

      1 基本知識(shí)描述

      1.1 基于最小冗余與最大相關(guān)算法框架

      由于特征選擇方法的最終目的是通過有效的方法去除不相關(guān)特征和冗余特征,從而選擇出對(duì)分類有效的相關(guān)特征子集。因此,本文提出的特征選擇方法將基于經(jīng)典的最小冗余與最大相關(guān)準(zhǔn)則(mRmR)特征選擇方法的理論框架,可以用(1)式表示為

      J(F)=D(F)-R(F)

      (1)

      (1)式中:D(F)表示特征與類別之間的相關(guān)性;R(F)表示特征與類別之間的冗余性。

      1.2 相關(guān)性度量方法

      1)最大信息系數(shù)(maximal information coefficient,MIC)是一種有效的統(tǒng)計(jì)量度量方法,主要用于評(píng)估2個(gè)變量之間的關(guān)聯(lián)。MIC克服了互信息直接用于特征選擇時(shí)沒辦法歸一化,在不同數(shù)據(jù)集上的值無法做比較,且對(duì)連續(xù)變量計(jì)算麻煩的缺點(diǎn)。當(dāng)擁有足夠的統(tǒng)計(jì)樣本時(shí),MIC可以捕獲廣泛的關(guān)系,而不限定于特定的函數(shù)類型(如線性、指數(shù)型、周期型等)。一般的相關(guān)系數(shù)只能度量線性關(guān)系,然而在一些現(xiàn)實(shí)應(yīng)用中非線性是廣泛存在的,包括周期性、指數(shù)關(guān)系等。MIC不依賴測(cè)量數(shù)據(jù)的統(tǒng)計(jì)分布,與以前的研究相比,可以識(shí)別廣泛類型的關(guān)聯(lián)。為了解決這個(gè)問題,研究者們提出了一種新穎的相關(guān)度量方法“最大信息系數(shù)”,可以用(2)式表示為

      (2)

      (2)式中,I(X;Y)表示變量X與變量Y間的互信息量。

      2)皮爾遜相關(guān)系數(shù)(pearson correlation coefficient,PCC)是基于數(shù)據(jù)矩陣的協(xié)方差矩陣,是評(píng)估2個(gè)向量之間關(guān)系強(qiáng)度的一種方法。它的值為[-1,1],其中,1表示變量完全正相關(guān),0表示無關(guān);-1表示完全負(fù)相關(guān)。通常,2個(gè)變量X和變量Y之間的皮爾遜相關(guān)系數(shù)可以用(3)式表示為

      (3)

      1.3 遺傳算法

      遺傳算法是一種模擬自然界生物遺傳和進(jìn)化過程而形成的高效全局優(yōu)化搜索算法。該算法通過群體搜索來尋找群體最優(yōu)解。它具有魯棒性強(qiáng)、簡(jiǎn)單通用等優(yōu)點(diǎn),并在很多領(lǐng)域應(yīng)用廣泛。遺傳算法的主要步驟包括確定實(shí)際問題的參數(shù)集、遺傳編碼、初始化群體、設(shè)計(jì)適應(yīng)度函數(shù)及遺傳操作(包括選擇、交叉、變異)。其中,最重要的操作之一就是設(shè)計(jì)適應(yīng)度函數(shù),通過以適應(yīng)度函數(shù)作為評(píng)價(jià)標(biāo)準(zhǔn),主要用于評(píng)價(jià)個(gè)體的優(yōu)劣程度,因此,適應(yīng)值高的個(gè)體被選中的概率高,群體中的個(gè)體通過不斷的選擇、交叉、變異等迭代操作,最終可以獲取問題的最優(yōu)解。遺傳算法主要有以下幾個(gè)步驟。

      ①初始化群體。對(duì)于人體行為識(shí)別中的特征選擇問題,采用二進(jìn)制對(duì)問題的解進(jìn)行編碼是比較好的方法,本文對(duì)已實(shí)現(xiàn)部分降維的特征子集進(jìn)行二進(jìn)制編碼,通過二進(jìn)制數(shù)字1與0來表示對(duì)應(yīng)特征的有無。如果原始特征維數(shù)為G維,則問題的一個(gè)解可以通過一個(gè)G維0-1向量來表示。當(dāng)?shù)趇個(gè)特征為1時(shí)表示第i個(gè)特征被挑選為特征子集之一;反之,如果向量的第i個(gè)分量為0則表明沒有選擇第i個(gè)特征。如此,一個(gè)特征子集就可以通過一個(gè)G維0-1向量表示。

      ②適應(yīng)度函數(shù)設(shè)計(jì)。為了實(shí)現(xiàn)更好的分類識(shí)別準(zhǔn)確率,遺傳算法需要設(shè)計(jì)合適的適應(yīng)度函數(shù)。那么特征選擇的最終目的還是通過降低特征維數(shù),降低計(jì)算復(fù)雜度,進(jìn)而獲取更高的分類識(shí)別準(zhǔn)確率,所以本文將分類識(shí)別準(zhǔn)確率作為適應(yīng)度函數(shù),換句話說就是讓能使分類準(zhǔn)確率高的特征被選擇。

      ③選擇。通過選擇策略從群體中選出優(yōu)良個(gè)體,淘汰劣質(zhì)個(gè)體。本文采用適應(yīng)值比例選擇方法,那么個(gè)體的選擇概率可以用(4)式表示為

      (4)

      (4)式中:a表示群體規(guī)模;fk表示個(gè)體的適應(yīng)值。

      ④交叉。交叉是一個(gè)進(jìn)化過程,是指把2個(gè)父代個(gè)體的部分結(jié)構(gòu)加以替換重組而生成新的個(gè)體的操作。

      ⑤變異。變異是維持種群多樣性的遺傳算子,通過較小的概率對(duì)特征子集編碼串上的某些位的值進(jìn)行隨機(jī)翻轉(zhuǎn),如0變1或1變?yōu)?等操作,從而產(chǎn)生新的個(gè)體。

      2 本文方法描述

      本文提出的特征選擇方法主要分成2部分:第1部分提出基于mRmR準(zhǔn)則的多種相關(guān)度量系數(shù)融合的特征選擇方法,通過結(jié)合2種相關(guān)系數(shù)的優(yōu)點(diǎn),挑選部分相關(guān)性強(qiáng)且較少冗余的特征子集,以實(shí)現(xiàn)部分降維;第2部分,由于第1部分特征選擇方法主要考慮特征與類別的相關(guān)性和冗余性,沒有很好地考慮特征之間的交互作用,即一些特征在單獨(dú)用于分類時(shí)效果不佳,但當(dāng)幾種特征結(jié)合使用時(shí)卻可以實(shí)現(xiàn)較好的分類。因此,本文進(jìn)一步提出通過遺傳算法對(duì)第1部分提出的特征選擇方法提取的特征子集進(jìn)行優(yōu)化。

      2.1 多種相關(guān)系數(shù)融合

      相關(guān)是度量2個(gè)變量關(guān)系的重要指標(biāo)。它在信號(hào)處理中具有很多理論基礎(chǔ),例如匹配濾波,循環(huán)自相關(guān)檢測(cè)等。在統(tǒng)計(jì)學(xué)中,可以通過不同的相關(guān)系數(shù)來描述各種變量之間的關(guān)系。這些相關(guān)系數(shù)很多被應(yīng)用于特征選擇方法中,相關(guān)性度量方法有很多種,常見的包括距離相關(guān)系數(shù)、最大信息系數(shù)、組內(nèi)相關(guān)系數(shù)、決定系數(shù)、秩相關(guān)和皮爾遜相關(guān)系數(shù)等。基于此,為了更好地利用并結(jié)合2種不同相關(guān)度量方法的優(yōu)勢(shì),本文通過融合2種相關(guān)性度量系數(shù),即MIC和PCC,并定義該相關(guān)性度量系數(shù)MPC(X,Y)為

      (5)

      于是,若YL={y1,y2,…,yl}表示類別變量,l表示類別總數(shù),F(xiàn)={F1,F2,…,Fi,…,Fm}表示特征集合,m表示特征總數(shù),根據(jù)有監(jiān)督的特征選擇,特征Fi與類別標(biāo)簽YL的相關(guān)度量系數(shù)定義為

      (6)

      (6)式中:F表示特征集合;YL表示類別變量;Fi表示第i個(gè)特征。

      根據(jù)最大相關(guān)與最小冗余準(zhǔn)則中的最大相關(guān)原則,被選擇的特征Fi應(yīng)該與類別YL具有最大相關(guān)性,即為D(Fi,YL)取最大值時(shí)的Fi,記為Fmax,表示為

      Fmax=argmaxD(Fi,YL)

      (7)

      同理,根據(jù)mRmR中的最小冗余準(zhǔn)則,被挑選的特征Fi具有最小冗余性,計(jì)算冗余度大小可以表示為

      Fmin=argminR(F)

      (8)

      傳統(tǒng)的mRmR方法主要通過計(jì)算特征與類別之間的相關(guān)性及特征之間的冗余性進(jìn)行篩選,去除不相關(guān)及冗余特征,以獲取相關(guān)特征,而該方法沒有很好的考慮特征間的交互作用對(duì)分類產(chǎn)生的積極作用。然而,在實(shí)際應(yīng)用中通常使用增量搜索方法來獲取由Φ(·)定義的近似最佳特征,算子Φ(D,R,M)用來定義優(yōu)化最大相關(guān)和最小冗余信息。通過結(jié)合D與R,那么最優(yōu)選擇特征Fopt挑選準(zhǔn)則表示為

      Φ=D-R+M

      Fopt=argmaxΦ(D,R,M)

      (9)

      由此,如果實(shí)驗(yàn)已經(jīng)獲取了k-1個(gè)特征的特征子集Fk-1,那么第k個(gè)特征Fk需要從特征集合{F-Fk-1}中挑選,則通過Φ(D,R,M),F(xiàn)k的詳細(xì)挑選準(zhǔn)則表示為

      (10)

      2.2 初選特征獲取方法描述

      基于最大相關(guān)與最小冗余準(zhǔn)則(mRmR)框架下,獲取的特征子集是通過逐步更新挑選的。基于2種不同相關(guān)系數(shù)的融合,并通過(10)式獲取最大相關(guān)與最小冗余特征子集。該方法首先初始化將需要構(gòu)建的特征子集置為空集并設(shè)置預(yù)期獲取特征維數(shù)s,然后將(10)式作為程序獲取下一個(gè)特征的準(zhǔn)則。本文提出的詳細(xì)特征選擇方法的偽代碼如算法1所示。

      算法1基于最小冗余與最大相關(guān)準(zhǔn)則下的多種相關(guān)度量系數(shù)融合的特征選擇方法。

      輸入:數(shù)據(jù)集X∈Rn×m,類別標(biāo)簽為YL,特征全集為F,特征個(gè)數(shù)為s

      初始化:構(gòu)建目標(biāo)特征子集Fs=?,則剩余特征子集Fa=F-Fs

      fork=1 tosdo

      對(duì)于剩余特征集Fa中的任意特征Fj,特征全集為F中的任意特征Fi,當(dāng)挑選新的特征Fk的準(zhǔn)則為

      更新Fs=Fs∪Fk和Fa=Fa-Fk

      end for

      輸出:Fs

      2.3 基于遺傳算法優(yōu)化

      對(duì)2.2節(jié)獲取的初選特征進(jìn)行二進(jìn)制編碼,并通過遺傳算法搜索最優(yōu)或者次優(yōu)特征子集。本文提出的基于遺傳算法優(yōu)化的多種相關(guān)度量特征選擇的整體框圖如圖1所示。從圖1可以看出,首先通過提出的基于mRmR準(zhǔn)則下2種相關(guān)系數(shù)融合的特征選擇方法對(duì)m維的原始特征子集進(jìn)行降維,得到s(s

      圖1 基于遺傳算法優(yōu)化的特征選擇方法Fig.1 Feature selection method based on genetic algorithm optimization

      3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

      3.1 實(shí)驗(yàn)數(shù)據(jù)集

      本文使用的數(shù)據(jù)集是來自實(shí)驗(yàn)室設(shè)計(jì)的可穿戴慣性傳感器平臺(tái)。該平臺(tái)主要由2個(gè)模塊組成:數(shù)據(jù)采集模塊和數(shù)據(jù)接收模塊。數(shù)據(jù)采集模塊是由采集頻率為50 Hz的慣性傳感器、無線數(shù)據(jù)發(fā)送模塊、電源模塊、天線模塊及腰帶組成,如圖2。數(shù)據(jù)接收模塊由無線藍(lán)牙模塊、USB轉(zhuǎn)串口模塊及天線模塊組成,如圖3。有研究表明,人體行為頻率低于18 Hz,因此,采集頻率為50 Hz的傳感器模塊能滿足實(shí)驗(yàn)要求。本實(shí)驗(yàn)邀請(qǐng)了18名實(shí)驗(yàn)者參與了人體日常行為數(shù)據(jù)的采集工作,通過將傳感器數(shù)據(jù)采集平臺(tái)置于實(shí)驗(yàn)者腰部,分別提取了坐立、站立、躺臥、步行、上樓、下樓、跑步等7種人體行為數(shù)據(jù)。每位實(shí)驗(yàn)者的每種行為數(shù)據(jù)采集時(shí)間至少2 min,并建立基本人體行為數(shù)據(jù)庫(kù)。

      圖2 傳感器信號(hào)采集模塊Fig.2 Sensor signal acquisition module

      3.2 實(shí)驗(yàn)設(shè)置

      首先,在數(shù)據(jù)預(yù)處理階段,實(shí)驗(yàn)需要對(duì)原始數(shù)據(jù)信號(hào)進(jìn)行低通濾波,去除原始信號(hào)中由于傳感器抖動(dòng)、外界干擾信號(hào)產(chǎn)生的噪聲等成分,避免對(duì)最終的行為分類造成干擾;常見的去噪方式主要包括低通濾波、平滑濾波和取導(dǎo)數(shù)操作等方式,通過對(duì)3種不同方法去噪效果比較,本文采用的是FIR低通濾波器。有研究表明,人體動(dòng)作的信號(hào)頻率不超過18 Hz,因此,本文采用的低通濾波器截止頻率設(shè)置為18 Hz,以去除原始信號(hào)中的高頻噪聲成分。在數(shù)據(jù)分割階段,本實(shí)驗(yàn)采用的滑動(dòng)窗口長(zhǎng)度設(shè)置為2.5 s,考慮到傳感器的采集頻率為50 Hz,因此,每個(gè)數(shù)據(jù)窗口有125個(gè)數(shù)據(jù)點(diǎn),窗口重疊率設(shè)置為50%,本數(shù)據(jù)集一共包含6 048個(gè)特征樣本,每種行為包含864個(gè)特征樣本。為了建立與用戶無關(guān)的人體行為識(shí)別通用模型,實(shí)驗(yàn)采用留一交叉法(LOO)進(jìn)行測(cè)試。根據(jù)不同分類行為將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,分別用于訓(xùn)練和測(cè)試分類模型。將每種不同行為的特征向量平均分成6個(gè)特征子集,然后每次不重復(fù)地抽取其中的一個(gè)特征子集作為待測(cè)樣本集,剩余5個(gè)特征子集用于訓(xùn)練樣本集,這樣每次訓(xùn)練樣本和測(cè)試樣本分別包含720和144個(gè)特征樣本,循環(huán)進(jìn)行6次并對(duì)識(shí)別準(zhǔn)確率求均值得出最終識(shí)別結(jié)果。表1為每次用于訓(xùn)練與測(cè)試時(shí)的樣本數(shù)的劃分情況。

      圖3 傳感器數(shù)據(jù)接收模塊Fig.3 Sensor signal receiving module

      分類行為樣本總數(shù)訓(xùn)練集樣本數(shù)測(cè)試集樣本數(shù)坐立54051030躺臥54051030站立54051030步行54051030上樓54051030下樓54051030跑步54051030

      為了驗(yàn)證本文方法的性能,實(shí)驗(yàn)對(duì)濾波后的樣本信號(hào)提取了包括均值、方差、四分位值、相關(guān)系數(shù)等348種特征,包括164種時(shí)域特征和184種頻域特征,這樣每種加速度行為的特征維數(shù)為384維。由于這些高維數(shù)據(jù)中存在著大量的相關(guān)與冗余信息,所以實(shí)驗(yàn)主要分成2部分完成:①通過本文提出的基于最大相關(guān)與最小冗余(mRmR)框架下的2種相關(guān)度量系數(shù)融合的特征選擇方法進(jìn)行降維,從384維降至50維,即將算法中的選擇特征最大個(gè)數(shù)s設(shè)置為50;②為了進(jìn)一步降低特征向量的維數(shù),并保證人體行為識(shí)別的準(zhǔn)確率,實(shí)驗(yàn)通過遺傳算法對(duì)第1步獲取的50維特征子集進(jìn)一步優(yōu)化。遺傳算法的種群規(guī)模取值為20,最大進(jìn)化代數(shù)為50,采用適應(yīng)值比例選擇方法選擇產(chǎn)生下一代種群個(gè)體,交叉概率設(shè)置為0.8,變異概率為0.01。實(shí)驗(yàn)運(yùn)行10次后,取平均值作為結(jié)果。

      接著,為了方便對(duì)比實(shí)驗(yàn)結(jié)果,實(shí)驗(yàn)將通過SVM分類器和KNN分類器分別進(jìn)行分類。由于SVM分類器能有效解決非線性、小樣本、維數(shù)災(zāi)難和“過學(xué)習(xí)”等分類問題,常見的核函數(shù)包括有線性核函數(shù)、多項(xiàng)式核函數(shù)和徑向基核函數(shù)等,設(shè)有H種不同分類行為,則共需要P=H(H-1)/2個(gè)2類分類器。本實(shí)驗(yàn)采用的SVM模型選用徑向基核函數(shù),表示為

      K(x,xi)=exp(-γ|x-xi|2)

      (11)

      (11)式中,參數(shù)γ=1/H,本文中有7種分類行為,因此實(shí)驗(yàn)中H的值設(shè)為7。

      KNN分類器的基本工作原理是根據(jù)計(jì)算出的待分類樣本x與所有訓(xùn)練樣本間的距離,并從中選出x的k個(gè)近鄰,然后統(tǒng)計(jì)這k個(gè)近鄰的類別,并將x歸入k個(gè)近鄰中得票最多的那一類。根據(jù)經(jīng)驗(yàn)規(guī)則,k一般小于訓(xùn)練樣本數(shù)的平方根,因此本實(shí)驗(yàn)將k的值設(shè)為12。

      3.3 實(shí)驗(yàn)性能測(cè)量方法

      為了體現(xiàn)本文方法相比其他方法的優(yōu)勢(shì),本文將通過2方面對(duì)其進(jìn)行比較:最終獲取的特征個(gè)數(shù)和實(shí)驗(yàn)的分類性能。表2為3種不同行為混淆矩陣的舉例說明。相應(yīng)的,本文將通過識(shí)別準(zhǔn)確率衡量本方法的分類性能。

      表2 混淆矩陣舉例表

      Accuracy即平均識(shí)別準(zhǔn)確率,表示每個(gè)測(cè)試樣本被正確分類的可能性,即所有分類行為的平均識(shí)別準(zhǔn)確率,其計(jì)算公式如(12)式所示

      (12)

      3.4 實(shí)驗(yàn)結(jié)果與分析

      在實(shí)驗(yàn)中,通過本文提出的方法對(duì)7種常見人體行為提取的特征集進(jìn)行降維,并分別采用SVM分類器和KNN分類器進(jìn)行分類,實(shí)驗(yàn)采用留一交叉法檢測(cè)得到的混淆矩陣及分類識(shí)別準(zhǔn)確率分別如表3、表4所示。

      表3 通過SVM獲取的混淆矩陣及識(shí)別準(zhǔn)確率Tab.3 Confusion matrix and recognition accuracy obtained by SVM

      表4 通過KNN獲取的混淆矩陣及識(shí)別準(zhǔn)確率Tab.4 Confusion matrix and recognition accuracy obtained by KNN

      從表3和表4的混淆矩陣及各行為識(shí)別精度可以看出,本文方法對(duì)實(shí)驗(yàn)分類的7種行為實(shí)現(xiàn)較高識(shí)別準(zhǔn)確率,SVM分類器的平均識(shí)別正確率達(dá)到了97.02%,而通過KNN分類器也達(dá)到了95.73%;另外,從混淆矩陣可以看出,對(duì)2種易分類的靜止行為(站立、躺臥)沒有出現(xiàn)混淆,達(dá)到了100%的識(shí)別準(zhǔn)確率,而對(duì)于容易混淆的步行、上樓和下樓3種行為,本方法通過SVM和KNN也分別達(dá)到了96.53%和92.59%的高識(shí)別精度,3種行為之間也只有較少測(cè)試樣本發(fā)生了混淆。

      為了進(jìn)一步驗(yàn)證本文方法的有效性,實(shí)驗(yàn)將本文方法分別與另外4種特征選擇方法進(jìn)行對(duì)比,包括未使用特征選擇方法、mRmR方法、文獻(xiàn)[14]及文獻(xiàn)[15],其中,文獻(xiàn)[14]采用基于遺傳算法優(yōu)化的不一致相關(guān)度量方法,文獻(xiàn)[15]采用主成分分析(PCA)和基于遺傳算法優(yōu)化的線性鑒別(LDA)相結(jié)合的特征選擇方法,4種方法都選用SVM分類器和KNN分類器進(jìn)行分類測(cè)試,其中SVM和KNN分類器中參數(shù)設(shè)置都保持相同,文獻(xiàn)[14]、[15]中使用的遺傳算法的設(shè)置參數(shù)也與本文方法保持一樣,實(shí)驗(yàn)從分類精度及特征維數(shù)降低幅度2方面進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如表5、表6、表7及圖4和圖5,其中,表5和表6為本文方法與其他4種方法通過SVM和KNN分類識(shí)別的各行為分類精度,圖4和圖5分別為不同方法在通過SVM和KNN分類器分類時(shí)獲取的平均識(shí)別準(zhǔn)確率,表7為5種方法通過2不同分類器篩選出的特征維數(shù)。

      表5 不同特征選擇方法通過SVM獲取的總體識(shí)別精度Tab.5 Total recognition accuracy of different feature selection methods by SVM %

      表6 不同特征選擇方法通過KNN分類的各行為識(shí)別精度Tab.6 Total recognition accuracy of differentfeature selection methods by KNN %

      表7 不同方法降維后的特征維數(shù)Tab.7 Feature dimensions of differentmethods after dimensional reduction

      圖4 不同方法通過SVM的總體平均識(shí)別準(zhǔn)確率Fig.4 Total average recognition accuracyof different methods by SVM

      圖5 不同方法通過KNN的總體平均識(shí)別準(zhǔn)確率Fig.5 Total average recognition accuracyof different methods by KNN

      結(jié)合表5、表6及圖4、圖5的實(shí)驗(yàn)結(jié)果可以看出,與另外4種方法相比,從分類精度看,本文提出的方法有最高的平均識(shí)別準(zhǔn)確率,SVM分類器達(dá)到了97.02%,KNN分類器也達(dá)到了95.73%,與不使用特征選擇方法相比較,平均識(shí)別準(zhǔn)確分別提高了15.92%和14.63%;與傳統(tǒng)的mRmR方法相比較,也分別提高了13.72%和9.92%;與文獻(xiàn)[14]、文獻(xiàn)[15]對(duì)2種傳統(tǒng)方法的改進(jìn)方法比較,通過SVM分類器分類,分別提高了3.31%與1.76%,通過KNN分類,則分別提高了6.15%和3.37%。從圖4、圖5還可以看出,當(dāng)不選用特征選擇方法,直接進(jìn)行分類時(shí)識(shí)別準(zhǔn)確率最差,平均識(shí)別準(zhǔn)確率只有81.10%,所以從側(cè)面也體現(xiàn)出在一些行為分類中,隨著提取特征維數(shù)的增加,特征選擇方法在分類識(shí)別中的重要性。從表7的實(shí)驗(yàn)結(jié)果可以看出,當(dāng)使用本文提出的特征選擇方法,通過SVM分類時(shí)特征向量的維數(shù)從384維降到了37維,雖然高于另外2種方法降維后的特征維數(shù),即文獻(xiàn)[14]的19維和文獻(xiàn)[15]的23維,但本文方法的識(shí)別準(zhǔn)確率卻高于文獻(xiàn)[14]、文獻(xiàn)[15]的方法,由此,也可以看出特征維數(shù)并非降的越低越好。而通過KNN分類時(shí),特征維數(shù)降到了26維,比其他幾種方法所獲取的特征維數(shù)都要低,且獲得最好的識(shí)別準(zhǔn)確率。另外,與經(jīng)典的mRmR的特征選擇方法相比,本文方法也效果明顯,從側(cè)面也可以看出使用多種相關(guān)系數(shù)融合的特征選擇方法比僅使用單一的相關(guān)系數(shù)的效果好。

      圖6 本文方法與文獻(xiàn)[14]、文獻(xiàn)[15]方法通過SVM分類精度Fig.6 Classification accuracy of the proposed method andthe methods of literature [14], literature [15] by SVM

      由于文獻(xiàn)[14]、文獻(xiàn)[15]及本文方法中都采用了遺傳算法進(jìn)行優(yōu)化,所以實(shí)驗(yàn)進(jìn)一步對(duì)此3種方法在分類精度及收斂速度2方面進(jìn)行對(duì)比,實(shí)驗(yàn)通過SVM分類器分類時(shí)獲取的實(shí)驗(yàn)結(jié)果如圖6。

      從圖6的實(shí)驗(yàn)結(jié)果可以看出,相比于文獻(xiàn)[14]和文獻(xiàn)[15]中提出的特征選擇方法,本文方法在迭代次數(shù)上也是最快實(shí)現(xiàn)收斂的,并且最終的識(shí)別精度也是最高的。

      4 結(jié)束語(yǔ)

      針對(duì)在基于加速度傳感器人體行為識(shí)別的研究中,由于特征維數(shù)的增加會(huì)造成冗余,進(jìn)而降低分類識(shí)別準(zhǔn)確率的問題,本文提出一種基于遺傳算法優(yōu)化的多種相關(guān)系數(shù)融合的特征選擇方法,該方法在基于mRmR準(zhǔn)則下,通過多種相關(guān)系數(shù)融合的方法去除部分冗余、不相關(guān)特征,并利用遺傳算法搜索最優(yōu)或次優(yōu)特征子集,通過與其他4種典型特征選擇方法進(jìn)行對(duì)比,實(shí)驗(yàn)分別采用SVM分類器和KNN分類器進(jìn)行分類識(shí)別,結(jié)果表明:該方法具有優(yōu)異的特征降維性能,同時(shí)對(duì)實(shí)驗(yàn)分類的7種不同人體行為實(shí)現(xiàn)更好的分類效果,平均識(shí)別準(zhǔn)確率分別達(dá)到了97.02%和95.73%,與不使用特征選擇方法相比較,平均識(shí)別準(zhǔn)確分別提高了15.92%和14.63%;與傳統(tǒng)的mRmR方法相比較,分別提高了13.72%和9.92%;與文獻(xiàn)[14]、文獻(xiàn)[15]對(duì)2種傳統(tǒng)方法的改進(jìn)方法相比較,通過SVM分類器分類,分別提高了3.31%與1.76%,通過KNN分類,則分別提高了6.15%和3.37%。在收斂速度方面,相比于文獻(xiàn)[14]和文獻(xiàn)[15]中提出的特征選擇方法,本文方法在迭代次數(shù)上也是最快實(shí)現(xiàn)收斂的,并且最終的識(shí)別精度也是最好的。通過本文方法及實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),有效地利用多種相關(guān)度量方法不僅可以起到較好的特征選擇作用,而且對(duì)實(shí)驗(yàn)的平均識(shí)別準(zhǔn)確率也有顯著提高。

      猜你喜歡
      特征選擇子集維數(shù)
      由一道有關(guān)集合的子集個(gè)數(shù)題引發(fā)的思考
      β-變換中一致丟番圖逼近問題的維數(shù)理論
      拓?fù)淇臻g中緊致子集的性質(zhì)研究
      一類齊次Moran集的上盒維數(shù)
      關(guān)于奇數(shù)階二元子集的分離序列
      Kmeans 應(yīng)用與特征選擇
      電子制作(2017年23期)2017-02-02 07:17:06
      關(guān)于齊次Moran集的packing維數(shù)結(jié)果
      涉及相變問題Julia集的Hausdorff維數(shù)
      聯(lián)合互信息水下目標(biāo)特征選擇算法
      每一次愛情都只是愛情的子集
      都市麗人(2015年4期)2015-03-20 13:33:22
      东乌| 吉隆县| 大厂| 浮山县| 饶河县| 惠水县| 陆良县| 瑞安市| 洮南市| 新余市| 济宁市| 哈尔滨市| 保康县| 东辽县| 额济纳旗| 额敏县| 清原| 辛集市| 丰宁| 永嘉县| 若尔盖县| 贵南县| 中宁县| 兰州市| 滦南县| 自贡市| 泸定县| 彭州市| 重庆市| 广安市| 武鸣县| 柘荣县| 边坝县| 永仁县| 罗定市| 筠连县| 潼关县| 康乐县| 邵阳县| 于田县| 南靖县|