王忠民, 曹 棟
(西安郵電大學 計算機學院, 陜西 西安 710121 )
基于蟻群算法的行為識別特征優(yōu)選方法
王忠民, 曹 棟
(西安郵電大學 計算機學院, 陜西 西安 710121 )
為了降低特征冗余,提高移動用戶行為識別的準確率,提出一種基于蟻群算法的移動用戶行為識別加速度信號特征優(yōu)選方法。首先對樣本數(shù)據(jù)進行預(yù)處理,根據(jù)特征對不同行為的分類敏感度進行初次優(yōu)選,降低特征搜索空間的維度;然后利用蟻群算法結(jié)合神經(jīng)網(wǎng)絡(luò)分類器,以特征的分類準確度為評價準則對特征集合進行了二次優(yōu)選。實驗結(jié)果表明,該方法優(yōu)選出的特征集具有較好的識別性能。
蟻群優(yōu)化;行為識別;特征提??;特征優(yōu)選
行為識別研究是人工智能領(lǐng)域的一個重要課題。早期的研究主要通過構(gòu)建智能空間,特制各種可穿戴傳感器在實驗室環(huán)境開展的。隨著移動通信技術(shù)的快速發(fā)展和移動智能終端制造水平的不斷提高,內(nèi)置于智能手機內(nèi)的各類傳感器使開展基于智能手機的移動用戶行為識別研究成為可能[1]。為了增強用戶體驗,目前智能手機都有內(nèi)置加速度傳感器,近年來國內(nèi)外有不少學者開展了基于加速度信息的人體行為識別研究,但手機所放置的位置和方位,以及人的行為差異等都會對加速度信號產(chǎn)生影響[2-4]。如何從加速度信號的時域、頻域和時頻域特征中優(yōu)選出與手機放置位置和方位無關(guān)、算法復雜度低、與人體運動行為敏感度高的特征子集成為本領(lǐng)域急需解決的關(guān)鍵技術(shù)難題。
特征優(yōu)選方法已經(jīng)有很多研究,文獻[5]從搜索策略和評價準則兩個角度對特征選擇方法進行了分析和總結(jié);文獻[6]利用相關(guān)分析和K-NN 算法進行組合式特征選擇;文獻[7]提出了基于相關(guān)性和冗余度的聯(lián)合特征選擇算法;文獻[8]將互信息和模糊粗糙集結(jié)合提出最大互信息最大相關(guān)熵標準,并基于這一標準設(shè)計了一種新的特征選擇算法;文獻[9] 針對入侵檢測的需求,設(shè)計了一種攻擊特征的在線選擇方法。但以上方法針對移動用戶行為識別特征選擇這一特定問題,還缺乏有效的解決方法。
本文在蟻群算法[10-12]的基礎(chǔ)上,提出一種移動用戶行為識別特征優(yōu)選方法,把對某種行為最敏感的特征作為候選特征,使用蟻群算法進行特征子集優(yōu)選,并以神經(jīng)網(wǎng)絡(luò)分類器的分類效果作為特征子集優(yōu)劣的評價準則,根據(jù)分類錯誤率更新特征的信息素來指導搜索過程。
1.1 行為敏感特征選擇
加速度信號的時域、頻域和時頻特征很多,首先要從眾多的特征中迅速剔除冗余特征、選出敏感特征,以降低特征集維數(shù),從而縮小后續(xù)基于蟻群算法的特征子集二次優(yōu)選時的搜索空間。在對人體行為模式進行識別的過程中,每種特征值對于每種行為模式的識別度不同,提取對每種行為模式最敏感的特征值,剔除冗余特征,可降低無關(guān)特征影響,縮短算法搜索時間。
將候選特征集合中的特征值a所對應(yīng)特征向量樣本放入分類器訓練和測試,獲取特征值a對行為模式k的識別率r(a,k)以及特征值a致使其他行為模式錯分至行為模式k的錯分率w(a,k)。評價函數(shù)為
q(a,k)=r(a,k)-l×w(a,k)
(1)
其中l(wèi)為激勵因子,當q(a,k)高于規(guī)定閾值Q時,特征值a對行為模式k敏感,將特征值a添加進候選特征集合。遍歷每種特征值之后,得到最終候選特征集合H。
1.2 基于蟻群算法的特征子集優(yōu)選
1.2.1 問題描述
圖1 蟻群算法示意圖
1.2.2 螞蟻的路徑選擇
每只螞蟻搜索結(jié)束之后,得到一個局部解,每個解包含n個不同的特征值。每只螞蟻從隨機一個特征點出發(fā),根據(jù)信息素的強度和啟發(fā)規(guī)則選擇下一個特征點,直到尋找到n個特征值。每只螞蟻選擇特征點的轉(zhuǎn)移規(guī)則為
(2)
對于每一只螞蟻,p(j)為螞蟻選擇特征點j的概率值,概率值大的優(yōu)先選擇;u(j)為特征點j的信息素水平;ξ(j)為特征點的分類敏感度;α為信息素啟發(fā)因子,β為期望啟發(fā)因子,如果設(shè)為0,則表示此階段暫時不考慮特征值的分類敏感度;K為螞蟻的可選子集,即除了已被選擇剩余的特征集合。
螞蟻i搜索結(jié)束后,將每個局部解所對應(yīng)的特征向量樣本輸入分類器進行訓練和測試,得到分類正確率τ(i),用以評價特征子集的優(yōu)劣。
1.2.3 信息素更新策略
當蟻群完成一次搜索后,更新各特征點上的信息素。信息素更新規(guī)則為
(3)
其中ρ信息素參數(shù),τ(i)為最優(yōu)解的分類正確率,ε為概率變化系數(shù)。反復迭代MI次,以得到最優(yōu)特征子集及其分類正確率。
1.3 算法描述
優(yōu)選算法描述如下。
輸入:數(shù)據(jù)集S,候選特征集合H,特征全集G,閾值Q,激動因子I,行為模式B,螞蟻個數(shù)m,初始信息素水平u0,迭代次數(shù)MI,特征值個數(shù)n,蟻群算法的各參數(shù);
輸出:選擇的最優(yōu)特征子集F以及最終分類結(jié)果。
算法流程:
(1)H={};//初始化特征候選子集;
(3)ifq(a,k)>Q;//利用式(1);
(4)ifa?H;
(6)End for;
(7)?i∈H,ui=u0,u0∈[0,1],k=1;//初始化信息素,使每個節(jié)點的信息素相同;
(8)fori=1:n;//對于不同的特征值個數(shù),進行循環(huán);
(9)while (k 生成m個螞蟻,隨機選擇m個特征值,每只螞蟻根據(jù)式(2)選擇下一個概率值大的特征點; (10)k++; (11)End whlie; (12)用分類器評估每個解的優(yōu)劣,返回分類的正確率; (13)通過返回的最優(yōu)解的分類正確率進行信息素的更新,利用式(3); (14)重復(9)至(13),迭代MI次,得到最優(yōu)特征子集F及其分類正確率; (15)End for (16)得到最終的最優(yōu)特征子集FF及其分類正確率。 2.1 實驗數(shù)據(jù)集 所有實驗數(shù)據(jù)均利用Android智能手機采集。選取閾值為-2g~2g(g=9.8 m/s2)加速度傳感器的智能手機HTC G2,華為U8608等,由4名實驗人員分別利用這些智能手機對靜止、走路、跑步、上樓、下樓、乘車6種行為模式的加速度數(shù)據(jù)進行采集。實驗人員在不同的時間段,手機處于不同位置和不同方向的情況下,做了780次實驗,其中每種模式各進行了130次實驗,每次采集的持續(xù)時間為10 s,采樣頻率為20 Hz。不同的時間段主要考慮車流量對采集數(shù)據(jù)的影響,不同的位置主要分為手中,褲兜中,上衣口袋中以及包中,不同的方向主要分為手機橫放,顛倒放置,平放等。為了保證數(shù)據(jù)的有效性,并去除一定的噪音,只取每次采樣數(shù)據(jù)的第4~6 s之間的數(shù)據(jù)。對采樣數(shù)據(jù)頻譜分析發(fā)現(xiàn),六種行為采集到的加速度信號的能量主要處于1~5 Hz之間(如圖2所示)。因此,通過低通濾波對原始數(shù)據(jù)進行了去噪聲濾波。 圖2 行為模式濾波前后頻譜分析圖 2.2 實驗方法 實驗初始特征集合為{最大值,最小值,范圍,方差,均值,主系數(shù)和,直流分量,中間值,均方根},根據(jù)特征選擇方法,在對數(shù)據(jù)進行預(yù)處理之后,先進行了第一次行為敏感特征優(yōu)選,得到蟻群算法的初始特征全集,通過蟻群算法的二次優(yōu)選,得到最終特征集合。行為敏感特征選擇中參數(shù)設(shè)置為 l=0.8,Q=0.85, 蟻群算法的參數(shù)設(shè)置為 MI=5,u0=0.5,n=1,2,…,5, 2.3 實驗結(jié)果分析 實驗首先進行初次特征選擇,每種特征值的正確率和錯分率分別如表1和表2所示,其中Std代表標準差,Max代表最大值,Min代表最小值,Range代表范圍,Var代表方差,Mean代表均值,Sum代表主系數(shù)和,Dc代表直流分量,Med代表中間值,Rms代表均方根。經(jīng)過計算之后,選取{標準差,最大值,最小值,范圍,均方根}作為下階段的特征集合。 表1 每種特征值的正確率 表2 每種特征值的錯分率 確定特征候選集合之后,實驗利用蟻群算法進行二次特征選擇,經(jīng)過多次統(tǒng)計之后,得出最終結(jié)果如表3。 表3 蟻群算法測試結(jié)果 特征子集{范圍,標準差,最大值,均方根}為選出的最優(yōu)子集,正確率可達89%。相比單獨使用蟻群算法,時間復雜度得到了大幅度下降,證明了算法的有效性。 通過行為敏感特征選擇算法及蟻群算法從加速度信息中選出特征子集,利用BP神經(jīng)網(wǎng)絡(luò)算法對所選出的特征子集的有效性進行了驗證。實驗結(jié)果表明,該特征優(yōu)選方法可提高行為識別的正確率,證明了方法的有效性。 [1] Zheng Yu, Liu Like, Wang Long hao, et al.Learning transportation mode from raw gps data for geographic applications on the web[C]//World Wide Web.ACM Press,2008:247-256. [2] Wang Shuang quan , Chen Can feng , Ma Jian . Accelerometer based transportation mode recognition on mobile phones[C]//Asia-Pacific Conference on Wearable Computing Systems. ShenZhen: IEEE Press,2010:44-46. [3] Reddy S, Mun M,Burke J,et al.Using Mobile Phones to Determine Transportation Modes[J].ACM Transactions on Sensor Networks, 2010,6(2):13-27. [4] Davide F,Pedro C D,Diogo R F, et al.Preprocessing techniques for context recognition from accelerometer data[J].Pers Ubiquit Comput,2010,14(7):645-662. [5] 姚旭,王曉丹,張玉璽,等.特征方法綜述[J].控制與決策,2012,27(2):161-166. [6] Uncu O,Turksen IB. A novel feature selection approach: Combining feature wrappers and filters [J]. Information Sciences (S0020-0255), 2007, 177(2): 449-466. [7] 周城,葛斌,唐九陽,等.基于相關(guān)性和冗余度的聯(lián)合特征選擇方法[J].計算機科學,2012,39(4)181-184. [8] 趙軍陽,張志利.基于最大互信息最大相關(guān)熵的特征選擇方法[J].計算機應(yīng)用研究,2009,26(1):233-235. [9] 朱莉,李玲娟.攻擊特征在線選擇方法的研究[J].西安郵電學院學報,2009,14(3):72-74. [10] 溫文波,杜維.蟻群算法概述[J].石油化工自動化,2002,1(19):19-22. [11] 王璐,邱桃榮,何妞,等.基于粗糙集和蟻群優(yōu)化算法的特征選擇方法[J].南京大學學報,2010,5(46):487-493. [12] 黃丹鳳,祁云嵩,許姍娜.基于粗糙集和蟻群算法的特征基因選擇方法[J].計算機技術(shù)與發(fā)展,2012,6(22):68-74. [責任編輯:祝劍] A feature selection method for behavior recognition based on ant colony algorithm WANG Zhongmin, CAO Dong (School of Computer Science and Technology, Xi’an University of Posts and Telecommunications, Xi’an 710121, China) To reduce redundancy features and improve accuracy of mobile user behavior recognition, an acceleration signal feature selection method is proposed for mobile user behavior recognition based on ant colony algorithm. The sample data is preprocessed and features are optimized initially according to the classification sensitivity of every feature of the different behavior to reduce dimension of the feature search space. Then, ant colony algorithm combined with neural network classifier is used to make a secondary optimization and feature classification accuracy for evaluation criteria. Experiment results show that the feature set selected by the method has a better recognition performance. ant colony algorithm, behavior recognition, feature selection, feature optimization 10.13682/j.issn.2095-6533.2014.01.016 2013-11-26 國家自然科學基金資助項目(61100166);陜西省教育廳產(chǎn)業(yè)化培育基金資助項目(2012JC22) 王忠民(1967- ),男,博士,教授, 從事智能信息處理研究。E-mail:wzm_678@163.com 曹棟(1988- ),男,碩士研究生,研究方向為嵌入式系統(tǒng)設(shè)計與開發(fā)。E-mail:395812022@qq.com TP391 A 2095-6533(2014)01-0073-052 實驗設(shè)計與結(jié)果分析
α=0.8,β=0,ρ=0.3,
ε=0.9,m=3。3 結(jié)束語