李克宇 杜謙 曾祥正 周泓余 徐海森
摘 要:隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,智能家居技術(shù)不再僅僅是遠(yuǎn)程操控這么簡(jiǎn)單。對(duì)用戶(hù)行為進(jìn)行分析,個(gè)性化的控制體驗(yàn)將會(huì)成為未來(lái)發(fā)展的主流。文章通過(guò)建C4.5決策樹(shù)的方法建立用戶(hù)行為模型,通過(guò)統(tǒng)一用戶(hù)行為數(shù)據(jù)形式,以信息增益率的高低分裂屬性,直觀高效地對(duì)用戶(hù)行為進(jìn)行分析。對(duì)智能家居環(huán)境下高效且個(gè)性化的控制提供幫助。
關(guān)鍵詞:C4.5決策樹(shù);用戶(hù)行為分析;智能家居
中圖分類(lèi)號(hào):TP29 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2018)15-0015-02
Abstract: With the development of Internet of things technology, smart home technology is no longer just remote control. For the analysis of user behavior, personalized control experience will become the mainstream of future development. This paper establishes user behavior model by building C4.5 decision tree and analyzes user behavior directly and efficiently by unifying user behavior data form and splitting attributes of information gain rate. It is helpful to the high efficiency and individuation control in the smart home environment.
Keywords: C4.5 decision tree; user behavior analysis; smart home
引言
隨著互聯(lián)網(wǎng)技術(shù)的成熟,物聯(lián)網(wǎng)技術(shù)的興起,智能家居領(lǐng)域正迅速發(fā)展。在近幾年的智能家居技術(shù)發(fā)展過(guò)程中,環(huán)境數(shù)據(jù)檢測(cè),數(shù)據(jù)傳輸?shù)燃夹g(shù)已經(jīng)取得較為成熟的成果,但是大多數(shù)研究也僅是實(shí)現(xiàn)其網(wǎng)絡(luò)部署和遠(yuǎn)程操作,針對(duì)用戶(hù)行為分析定制個(gè)性化服務(wù)的研究較少。
本文介紹了一種基于決策樹(shù)的用戶(hù)行為分析算法,可以較為有效地對(duì)智能家居環(huán)境下的用戶(hù)行為進(jìn)行分析。
1 決策樹(shù)算法
1.1 算法概述
決策樹(shù)(Decision Tree)算法是在已有樣本數(shù)據(jù)概率已知的情況下,通過(guò)建立決策樹(shù)來(lái)判斷目標(biāo)事件的可行性,并且可以用圖表進(jìn)行表示,是一種直觀的概率分析算法。而決策樹(shù)算法又有很多不同的類(lèi)型,本文選擇C4.5算法[1]。
1.2 算法優(yōu)點(diǎn)
(1)可以通過(guò)圖表的方式建立模型,使用戶(hù)和開(kāi)發(fā)者一目了然。
(2)該算法有較好的魯棒性,可以較好的處理數(shù)據(jù)丟失和抗噪聲的干擾。
(3)與傳統(tǒng)算法相比學(xué)習(xí)過(guò)程快速。
2 基于C4.5決策樹(shù)的用戶(hù)行為分析算法
2.1 用戶(hù)行為數(shù)據(jù)表示
C4.5決策樹(shù)算法是對(duì)已有的數(shù)據(jù)進(jìn)行學(xué)習(xí),從而找到一個(gè)從屬性值到類(lèi)別的一一對(duì)應(yīng)關(guān)系[2]。在這個(gè)算法中,為了實(shí)現(xiàn)對(duì)用戶(hù)行為進(jìn)行分析,需要對(duì)數(shù)據(jù)的格式進(jìn)行統(tǒng)一規(guī)范,并提取有價(jià)值的特征屬性描述用戶(hù)行為。本文假設(shè)數(shù)據(jù)形式如下表所示:
2.2 分裂屬性選擇
想要將一個(gè)包含很多屬性的數(shù)據(jù)集建立成樹(shù),需要對(duì)數(shù)據(jù)集進(jìn)行屬性的分裂。本文以最大增益率為指標(biāo)選擇分裂屬性[3]。信息增益率(information gain ratio)為信息增益對(duì)所分割的信息量的比值。
2.3 建立決策樹(shù)
根據(jù)上文中假定的用戶(hù)行為數(shù)據(jù)樣例和通過(guò)信息增益率選擇分裂屬性的方法,可以得到初步的用戶(hù)行為決策樹(shù)模型如圖:
3 結(jié)束語(yǔ)
智能家居絕非遠(yuǎn)程控制開(kāi)關(guān)這么簡(jiǎn)單,分析用戶(hù)行為習(xí)慣,為用戶(hù)指定個(gè)性化的智能服務(wù)才應(yīng)該是智能家居的發(fā)展方向。本文介紹了一種基于決策樹(shù)的用戶(hù)行為分析算法,隨著用戶(hù)操作次數(shù)的增多,時(shí)間的延長(zhǎng),運(yùn)算結(jié)果將越接近用戶(hù)行為習(xí)慣,可以更好的聯(lián)系家居系統(tǒng)為用戶(hù)提供更加方便快捷個(gè)性化的服務(wù)。
參考文獻(xiàn):
[1]童世華,張昱東.基于用戶(hù)行為分析的智能家居控制軟件的設(shè)計(jì)[J].電視技術(shù),2017,41(z2):104-109.
[2]馬強(qiáng).數(shù)據(jù)挖掘中決策樹(shù)算法的優(yōu)化應(yīng)用研究[J].電子測(cè)試,2016(4x):30-31.
[3]鄒方林,冷晟,廉鵬飛,等.基于決策樹(shù)的制造瓶頸改善方法[J].現(xiàn)代制造工程,2016(6):121-128.
[4]李運(yùn)娣.大數(shù)據(jù)環(huán)境下決策樹(shù)算法并行化研究[J].河南工程學(xué)院學(xué)報(bào)(自然科學(xué)版),2017,29(2):57-61.
[5]胡金濤.基于C4.5決策樹(shù)的學(xué)生成績(jī)預(yù)測(cè)教學(xué)系統(tǒng)的研究與實(shí)現(xiàn)[D].西南交通大學(xué),2017.
[6]呂晨.基于用戶(hù)行為的網(wǎng)絡(luò)論壇水軍檢測(cè)研究與實(shí)現(xiàn)[D].西南交通大學(xué),2017.
[7]何芝蘭.無(wú)線(xiàn)通信在智能家居中的應(yīng)用分析[J].科技創(chuàng)新與應(yīng)用,2015(30):49.