孔英會(huì),沈丹鳳
(華北電力大學(xué)電子與通信工程系,河北保定 071003)
物聯(lián)網(wǎng)是計(jì)算機(jī)網(wǎng)絡(luò)的擴(kuò)展,是一個(gè)實(shí)現(xiàn)物物相聯(lián)的網(wǎng)絡(luò)。這些物體可以由IP地址嵌入到復(fù)雜系統(tǒng)中,通過傳感器從周圍環(huán)境獲取信息,并對獲取的信息進(jìn)行響應(yīng)和處理。它融合了傳統(tǒng)網(wǎng)絡(luò)、傳感器、Ad Hoc無線網(wǎng)絡(luò)、普適計(jì)算等的ICT(Information and Communications Technology)技術(shù)。隨著嵌入式傳感器的廣泛應(yīng)用,物聯(lián)網(wǎng)將信息與通信技術(shù)充分應(yīng)用到各行各業(yè),將傳感器嵌入到汽車、家電、電網(wǎng)、橋梁、建筑等物體中,通過網(wǎng)絡(luò)實(shí)現(xiàn)智能物體的互聯(lián)與信息采集。
當(dāng)前對傳感器感知實(shí)體的海量數(shù)據(jù)和信息進(jìn)行分析處理成為了物聯(lián)網(wǎng)應(yīng)用層發(fā)展的基礎(chǔ)。實(shí)體的狀態(tài)是人們直接關(guān)心的對象,而物聯(lián)網(wǎng)數(shù)據(jù)動(dòng)態(tài)性很強(qiáng),實(shí)時(shí)變化,存在著不確定性,比如每個(gè)對象有一個(gè)確定的可能存在性以及對象的屬性可能會(huì)有不同的可能值,要檢測出重要的物聯(lián)網(wǎng)事件是具有挑戰(zhàn)性的[1]。傳感器傳回來的數(shù)據(jù)都代表的是過去某一時(shí)間的事件,無法呈現(xiàn)人們預(yù)想時(shí)間的事件情況,物聯(lián)網(wǎng)中實(shí)體的實(shí)時(shí)狀態(tài)預(yù)測越來越重要。傳統(tǒng)預(yù)測方法雖取得了大量研究成果,但無法解決不確定性事件的預(yù)測問題。如文獻(xiàn)[2]中通過時(shí)間序列分析中的MWQAR修正模型向前預(yù)測信號的變化趨勢,文獻(xiàn)[3]從消除噪聲的角度對傳感器輸出時(shí)間序列進(jìn)行實(shí)時(shí)預(yù)測并模擬了一個(gè)連續(xù)信號進(jìn)行采樣處理分析,這些方法對于僅有事件發(fā)生記錄的傳感器并不適用,并不能給人們對于事件是否發(fā)生的明確判斷。關(guān)于事件發(fā)生的概率預(yù)測,文獻(xiàn)[4-5]采用貝葉斯網(wǎng)絡(luò)預(yù)測未來事件發(fā)生的概率,基于貝葉斯網(wǎng)絡(luò)的預(yù)測主要事件之間的相關(guān)性角度考慮,不適用于獨(dú)立事件的縱向預(yù)測。獨(dú)立事件的縱向預(yù)測需要對事件本身的規(guī)律進(jìn)行研究,文獻(xiàn)[6]中采用馬爾科夫模型預(yù)測未來事件發(fā)生的概率,馬爾科夫模型用事件現(xiàn)有狀態(tài)預(yù)測將來的狀態(tài),與過去事件狀態(tài)無關(guān),而針對一定周期性發(fā)生的事件,將來事件的狀態(tài)與過去的狀態(tài)緊密聯(lián)系,馬爾科夫模型不適用。文獻(xiàn)[7]中提到了3種關(guān)于周期性事件的預(yù)測方法,可以解決具有一定周期性的事件預(yù)測,但并未做出具體描述及模型建立。文獻(xiàn)[8]中對2種預(yù)測方法建立了模型,但沒有給出具體實(shí)現(xiàn)和預(yù)測結(jié)果。
本文針對有一定周期規(guī)律的物聯(lián)網(wǎng)監(jiān)測事件預(yù)測方法進(jìn)行研究,首先對傳感器返回的原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理,針對數(shù)據(jù)規(guī)律構(gòu)建周期預(yù)測模型,用過去某段時(shí)間的數(shù)據(jù)作為預(yù)測時(shí)間窗口預(yù)測將來某一時(shí)間點(diǎn)狀態(tài),同時(shí)給出了詳細(xì)的實(shí)現(xiàn)流程與預(yù)測結(jié)果。實(shí)驗(yàn)表明,本預(yù)測方法準(zhǔn)確性好,系統(tǒng)損耗小,實(shí)時(shí)性高,因此能根據(jù)用戶需要為用戶提供更有意義的信息。
物聯(lián)網(wǎng)中傳感器返回的數(shù)據(jù)具有很強(qiáng)的實(shí)時(shí)性和動(dòng)態(tài)性,利用過去海量的數(shù)據(jù)建立預(yù)測模型預(yù)測出將來實(shí)時(shí)動(dòng)態(tài)的實(shí)體狀態(tài)起到了舉足輕重的作用。人類的活動(dòng)通常是很有規(guī)律性的,這些規(guī)律從某種角度看都具有很強(qiáng)的周期性。因此,用來感知人類活動(dòng)的傳感器傳回的數(shù)據(jù)通常都顯示一定的周期特征[9]。根據(jù)這些周期特征,可以利用周期預(yù)測模型進(jìn)行物聯(lián)網(wǎng)實(shí)體實(shí)時(shí)預(yù)測。首先對于傳感器狀態(tài)概率作如下定義。
定義1 特定傳感器在特定時(shí)間點(diǎn)感知到特定狀態(tài)的概率是一個(gè)由3個(gè)參數(shù)構(gòu)成的函數(shù) p,即p(si,tj,ck)∈[0,1],其中 ck∈C={O,F(xiàn)},tj∈T,si∈S={s1,s2,s3,…,sn},S 為所有傳感器集合,T 為時(shí)間序列集合,C為傳感器可能狀態(tài)集合,即占用(Occupied)和空閑(Free)。由定義1可知,預(yù)測需要在時(shí)間序列T上建立模型預(yù)測函數(shù)p的值。
聚合預(yù)測模型[7](Aggregated prediction model,APM)是3種預(yù)測模型中最簡單的預(yù)測模型。根據(jù)文獻(xiàn)[7],本文總結(jié)了聚合預(yù)測模型的建立過程(見圖1)以及概率計(jì)算方法。
圖1 聚合預(yù)測模型序列圖Fig.1 Aggregated prediction model sequence diagram
圖中,[t0,tc]為建立模型選用的過去一段時(shí)間的時(shí)間窗口,tp為所需要預(yù)測概率的時(shí)間點(diǎn)。這個(gè)模型計(jì)算了時(shí)間窗口中傳感器狀態(tài)與預(yù)測時(shí)間點(diǎn)狀態(tài)相同的時(shí)間占時(shí)間窗口總時(shí)間的比例。
聚合預(yù)測模型對于選取的時(shí)間窗口的周期模式?jīng)]有針對性,適用于任何周期模式且原理簡單,計(jì)算量小,但是該預(yù)測模型的預(yù)測結(jié)果不精確,只能給用戶一個(gè)大致的導(dǎo)向,不適用于物聯(lián)網(wǎng)中的決策分析。
日常生活中周期性重復(fù)事件很多,如果一個(gè)事件經(jīng)過時(shí)間段l之后重復(fù)了,那么很可能在其他具有相同偏移(相對于時(shí)間段l來說)的不同時(shí)間點(diǎn),傳感器的感知狀態(tài)都是相同的[8]。單周期預(yù)測模型(Single- period Prediction Model,SPM)對這種情況具有很好的預(yù)測能力。
一般選取的時(shí)間窗口為周期l的整數(shù)倍,時(shí)間窗口大小表示為Tw,預(yù)測時(shí)間點(diǎn)tp時(shí)刻特定狀態(tài)時(shí),只看時(shí)間窗口Tw中與預(yù)測時(shí)間點(diǎn)tp有相同的相對于l的周期偏移的時(shí)間點(diǎn),預(yù)測概率如下:
實(shí)體的實(shí)際行為狀態(tài)中,事件的周期受到多種因素的影響,因此傳感器感知到的實(shí)體狀態(tài)很多時(shí)候是多周期混合影響的結(jié)果,這種情況下如果使用SPM,預(yù)測結(jié)果將會(huì)顯得不精確了。因此,對于這種情況多周期預(yù)測模型[8](Multi- period Prediction Model,MPM)能達(dá)到更好的預(yù)測效果。
多周期預(yù)測模型預(yù)測在tp時(shí)刻特定狀態(tài)的概率時(shí),用LStp表示在tp時(shí)刻的周期事件,則有LStp=為傳感器狀態(tài),li為周期,λi為相對周期li的偏移,φi為該事件的概率。在預(yù)測tp時(shí)刻狀態(tài)為ci的概率時(shí),用滿足條件的概率支持度最大的事件作為最有決定性作用的事件,該事件的概率就是tp時(shí)刻傳感器輸出狀態(tài)為ci的概率。
MPM中周期事件的發(fā)現(xiàn)采用卷積計(jì)算周期法[10],MPM對于周期事件能得到很好的精密的預(yù)測結(jié)果,但由于卷積周期發(fā)現(xiàn)算法涉及多次FFT及逆FFT計(jì)算,計(jì)算量大,耗時(shí)多,不適用于實(shí)時(shí)性要求高的物聯(lián)網(wǎng)研究中。
將以上預(yù)測模型運(yùn)用到物聯(lián)網(wǎng)實(shí)體實(shí)時(shí)預(yù)測,從而通過單個(gè)事件周期性發(fā)生規(guī)律預(yù)測出物聯(lián)網(wǎng)中實(shí)體事件發(fā)生的概率,判斷事件的發(fā)生與否,是本文研究的重點(diǎn),同時(shí)也是之前研究并未具體實(shí)現(xiàn)的,具有很強(qiáng)的現(xiàn)實(shí)意義。
物聯(lián)網(wǎng)中實(shí)體狀態(tài)實(shí)時(shí)預(yù)測對于實(shí)時(shí)性以及系統(tǒng)消耗要求較高,需要實(shí)時(shí)返回預(yù)測的狀態(tài)概率等信息。由以上分析可知,APM的預(yù)測結(jié)果不精確,不能給用戶提供準(zhǔn)確的決策支持。MPM中周期事件的發(fā)現(xiàn)采用卷積計(jì)算周期法,但由于卷積周期發(fā)現(xiàn)算法涉及多次FFT及逆FFT計(jì)算,計(jì)算量大,耗時(shí)多,不適用于實(shí)時(shí)性要求高的系統(tǒng),而SPM的實(shí)時(shí)性和精度方面都能滿足物聯(lián)網(wǎng)中實(shí)體實(shí)時(shí)預(yù)測的要求。因此,本文重點(diǎn)對SPM實(shí)現(xiàn)并進(jìn)行數(shù)據(jù)分析。將SPM的思想運(yùn)用到實(shí)際數(shù)據(jù)中,根據(jù)SPM實(shí)現(xiàn)事件發(fā)生概率預(yù)測。本文采用美國三菱電子研究實(shí)驗(yàn)室(Mitsubishi Electric Research Labs,MERL)公開的一個(gè)大規(guī)模傳感器數(shù)據(jù)集作為實(shí)驗(yàn)研究對象,通過軟件編程實(shí)現(xiàn)事件概率預(yù)測。
預(yù)測流程圖如圖2所示。首先對研究數(shù)據(jù)集進(jìn)行搜索,由傳感器的位置確定傳感器ID號,對傳感器ID號進(jìn)行篩選出特定位置的傳感器數(shù)據(jù)對象;然后對篩選出的數(shù)據(jù)逐條遍歷,提取出時(shí)間窗口中的事件數(shù),由于傳感器不斷被觸發(fā),每次間隔為1.5 s,因此,一個(gè)傳感器可能會(huì)對同一個(gè)事件感知到上百條數(shù)據(jù),所以這里設(shè)定當(dāng)相鄰兩個(gè)數(shù)據(jù)間隔時(shí)間大于40 min時(shí),則認(rèn)為是一個(gè)新的事件發(fā)生,記錄下新事件的開始和結(jié)束時(shí)間點(diǎn),判斷與預(yù)測時(shí)間點(diǎn)具有相同周期偏移的時(shí)間點(diǎn)是否在這些記錄下的事件中,若在這些記錄下的事件中,則傳感器狀態(tài)統(tǒng)計(jì)加一;若不在這些記錄下的事件中,則將該事件舍棄,統(tǒng)計(jì)出具有相同周期偏移的時(shí)間點(diǎn)在這些記錄中的個(gè)數(shù),從而預(yù)測出所需的傳感器狀態(tài)概率。
圖2 預(yù)測實(shí)現(xiàn)流程圖Fig.2 Prediction flow chart
本文對實(shí)際物聯(lián)網(wǎng)傳感器數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)可以從網(wǎng)站 http://www.merl.com/wmd通過 FTP 獲得:ftp://wmd@ftp.merl.com/,username:wmd,password:w0rksh0Pwmd。這些數(shù)據(jù)是美國三菱電子研究實(shí)驗(yàn)室公開的一個(gè)大規(guī)模傳感器數(shù)據(jù)集。MERL主要是利用了200個(gè)傳感器來記錄實(shí)驗(yàn)室兩層建筑物辦公人員1年內(nèi)的不同時(shí)間不同位置的活動(dòng)情況。該數(shù)據(jù)集嚴(yán)格滿足周一到周五上班、周末休息的規(guī)律,所以它的一個(gè)內(nèi)在的并且起到?jīng)Q定性作用的周期就是一個(gè)星期。這樣可以節(jié)省MPM中周期事件發(fā)現(xiàn)而采用的卷積算法而消耗的時(shí)間和系統(tǒng)資源,直接采用一星期為一個(gè)周期,同時(shí)SPM的實(shí)時(shí)性和精度方面都能滿足物聯(lián)網(wǎng)中實(shí)體實(shí)時(shí)預(yù)測的要求。因此,針對物聯(lián)網(wǎng)的實(shí)時(shí)性要求,本實(shí)驗(yàn)中采用SPM進(jìn)行預(yù)測。
本文選取從2006年6月12日00∶00∶00到2006年9月10日23∶59∶59這3個(gè)月的7 675 404條數(shù)據(jù),來預(yù)測2006年9月11日00∶00∶00到2006年9月17日23∶59∶59之間的不同位置傳感器狀態(tài)概率。對8-North conf、Belady Conference room、Nitta Seminar room、Mall這4個(gè)地方的10個(gè)傳感器在2006年9月13日15∶31∶59時(shí)間點(diǎn)的狀態(tài)進(jìn)行預(yù)測的結(jié)果如表1所示,其中“O”代表占用,“F”代表空閑,下同。
表1 各位置預(yù)測結(jié)果Table 1 The predicted results at each point
實(shí)驗(yàn)中,將預(yù)測概率的臨界設(shè)為0.5,若預(yù)測到占用的概率大于0.5,則認(rèn)為該傳感器在預(yù)測時(shí)間點(diǎn)是有事件觸發(fā)的,也即被占用的;若預(yù)測到占用的概率小于0.5,則認(rèn)為該傳感器在預(yù)測時(shí)間點(diǎn)是沒有事件觸發(fā)的,也即空閑的。將這些預(yù)測結(jié)果與這10個(gè)傳感器的實(shí)際情況做比較,發(fā)現(xiàn)該預(yù)測結(jié)果與實(shí)際情況完全符合,因此該預(yù)測結(jié)果具有很好的指示性。同時(shí)搜索預(yù)測時(shí)間短,與文獻(xiàn)[7]中的預(yù)測排序均需產(chǎn)生20 s的延遲相比,本方法能在2~4 s之間完成一次搜索預(yù)測,大大提高了預(yù)測的速度,實(shí)時(shí)性好,符合物聯(lián)網(wǎng)實(shí)體實(shí)時(shí)預(yù)測的高實(shí)時(shí)性要求,通過以上概率預(yù)測可以及時(shí)告知會(huì)議室的占用情況,準(zhǔn)確性好,且能滿足實(shí)時(shí)搜索預(yù)測的要求,從而可以將該方法運(yùn)用到更多物聯(lián)網(wǎng)事件預(yù)測中,如教室占用情況、道路擁堵情況預(yù)測等,為生活生產(chǎn)帶來極大的便利。
另外,本文還對kitchen(廚房)2006年9月13日一天內(nèi)各個(gè)時(shí)間點(diǎn)占用狀態(tài)做預(yù)測,用2006年6月12日00∶00∶00到2006年9有10日23∶59∶59時(shí)間段中每周同一天的相同時(shí)間點(diǎn)來進(jìn)行預(yù)測實(shí)驗(yàn),預(yù)測各個(gè)時(shí)間點(diǎn)廚房被占用的概率。實(shí)驗(yàn)結(jié)果如表2所示。
表2 同一位置各時(shí)間點(diǎn)結(jié)果Table 2 The predicted results of each time point at the same position in kitchen
實(shí)驗(yàn)中給定閾值0.5,即預(yù)測概率大于0.5的就認(rèn)為被占用,而小于0.5則認(rèn)為是空閑狀態(tài)。同時(shí)對2006年9月13日各個(gè)時(shí)間點(diǎn)的實(shí)際占用情況也用數(shù)據(jù)表示,若實(shí)際為占用狀態(tài),則概率就為1;若實(shí)際為空閑狀態(tài),則概率就為0。將表2數(shù)據(jù)與實(shí)際情況擬合成曲線,如圖3所示。
圖3 預(yù)測值與實(shí)際值對比Fig.3 Comparison between the predicted value and the actual value
由圖3可得,實(shí)際值與預(yù)測值的曲線基本符合,其中預(yù)測值小于0.5的表示為空閑狀態(tài),在實(shí)際值中就為0;預(yù)測值大于0.5的表示為占用狀態(tài),在實(shí)際值中就為1,以0.5作為閾值進(jìn)行歸一化之后,預(yù)測情況與實(shí)際情況完全符合,可以很好地預(yù)測出廚房一天中任意時(shí)間的占用情況。
相對于文獻(xiàn)[7-8]中僅對預(yù)測方法的延遲、系統(tǒng)損耗等性能做比較而并未具體實(shí)現(xiàn)實(shí)體事件概率預(yù)測得出具體概率結(jié)果來說,通過以上實(shí)驗(yàn)方法,可以實(shí)現(xiàn)物聯(lián)網(wǎng)中特定實(shí)體的任意時(shí)間狀態(tài)概率預(yù)測,能給出預(yù)測事件發(fā)生的概率數(shù)據(jù)以及事件發(fā)生與否的判斷結(jié)果。同時(shí),經(jīng)過與實(shí)際情況的比對,得出該預(yù)測方法的可靠性和準(zhǔn)確度都很高,能滿足物聯(lián)網(wǎng)實(shí)時(shí)預(yù)測的要求。
本文針對物聯(lián)網(wǎng)中實(shí)體數(shù)據(jù)的強(qiáng)實(shí)時(shí)性和高動(dòng)態(tài)性,對實(shí)體將來狀態(tài)進(jìn)行了實(shí)時(shí)預(yù)測,介紹了3種預(yù)測模型,利用過去海量的數(shù)據(jù)建立預(yù)測模型預(yù)測出將來實(shí)時(shí)動(dòng)態(tài)的實(shí)體狀態(tài),從而實(shí)現(xiàn)了實(shí)體實(shí)時(shí)事件概率的預(yù)測以及事件發(fā)生與否的判斷。其中單周期預(yù)測模型能很好地滿足物聯(lián)網(wǎng)實(shí)體狀態(tài)的實(shí)時(shí)性和動(dòng)態(tài)性,能在2~4 s內(nèi)完成一次搜索預(yù)測,且預(yù)測結(jié)果精確,均與實(shí)際情況吻合,能為人們對物聯(lián)網(wǎng)實(shí)體實(shí)時(shí)搜索提供很好的指示作用。在以后的研究中,應(yīng)將周期預(yù)測模型運(yùn)用到更多的物聯(lián)網(wǎng)實(shí)體中,如交通數(shù)據(jù)流等,以實(shí)現(xiàn)更有意義的預(yù)測。
[1] Chen L,Tseng M,Lian X.Development of foundation models for Internet of Things[J].Frontiers of Computer Science in China,2010,4(3):376-385.
[2] 姚俊章,余永,葛運(yùn)建.基于實(shí)時(shí)預(yù)測的傳感器信號倍頻算法[J].傳感技術(shù)學(xué)報(bào),2011,24(3):376-381.YAO Jun-zhang,YU Yong,GE Yun-jian.Frequency multiplying algorithm for sensor signal based on realtime predicting[J].Sensing Technology,2011,24(3):376-381.(in Chinese)
[3] 劉志成,彭紅星.傳感器輸出時(shí)間序列實(shí)時(shí)預(yù)測方法的比較研究[J].電子測量與儀器學(xué)報(bào),2011,25(11):946-951.LIU Zhi-cheng,PENG Hong-xing.Comparison study on real time prediction method of sensor output time series[J].Electronic Measurement and Instrument,2011,25(11):946 -951.(in Chinese)
[4] 裘江南,王延章,董磊磊,等.基于貝葉斯網(wǎng)絡(luò)的突發(fā)事件預(yù)測模型[J].系統(tǒng)管理學(xué)報(bào),2011,20(1):98-103,108.QIU Jiang-nan,WANG Yan-zhang,DONG Lei-lei,et al.A model for predicting emergency event based on Bayesian Networks[J].Systems Management Journal,2011,20(1):98 -103,108.(in Chinese)
[5] Mietz R,Romer K.Exploiting correlations for efficient content- based sensor search[C]//Proceedings of 2011 IEEE International Conference on Sensors.Limerick:IEEE,2011:187-190.
[6] Letchner J,Re C,Balazinska M,et al.Access methods for markovian streams[C]//Proceedings of IEEE 25th International Conference on Data Engineering.Shanghai:IEEE,2009:246-257.
[7] Ostermaier B,Romer K,Mattern F,et al.A real- time search engine for the web of things[C]//Proceedings of 2010 IEEE International Conference on Internet of Things(IOT).Tokyo:IEEE,2010:1 -8.
[8] Elahi B M,Romer K,Ostermaier B,et al.Sensor ranking:A primitive for efficient content-based sensor search[C]//Proceedings of 2009 International Conference on Information Processing in Sensor Networks.San Francisco,CA:IEEE,2009:217 -228.
[9] Reades J,Calabrese F,Sevtsuk A,et al.Cellular census:Explorations in urban data collection[J].IEEE Pervasive Computing,2007,6(3):30-38.
[10] Elfeky M G,Aref W G,Elmagarmid A K.Using convolution to mine obscure periodic patterns in one pass[C]//Proceedings of 9th International Conference on ExtendingDatabase Technology. Heraklion,Crete,Greece:IEEE,2004:605 -620.