褚云霞 吳曉娜 王海成 趙澤強(qiáng) 張軍
【摘 ?要】目前,在物聯(lián)網(wǎng)監(jiān)測(cè)中,傳感器數(shù)據(jù)和現(xiàn)場(chǎng)設(shè)備數(shù)據(jù)均和云端進(jìn)行交互,這使得云服務(wù)器的帶寬負(fù)載和實(shí)時(shí)性反饋等方面壓力增大。針對(duì)以上問(wèn)題,論文設(shè)計(jì)了一種邊緣計(jì)算網(wǎng)關(guān),邊緣計(jì)算網(wǎng)關(guān)既保留了連接多種傳感器、設(shè)備和云端交互等基礎(chǔ)功能,也增加了為節(jié)點(diǎn)設(shè)備提供本地服務(wù)、通過(guò)傳感器相關(guān)性分析屏蔽異常數(shù)據(jù)、分流服務(wù)器的計(jì)算任務(wù)從而減少數(shù)據(jù)上傳量等新功能。在邊緣端利用詞袋模型實(shí)現(xiàn)數(shù)據(jù)異常檢測(cè),詞袋模型中輸入信息是多傳感器數(shù)據(jù),輸出結(jié)果是數(shù)據(jù)異?;蛘!W詈?,論文對(duì)農(nóng)業(yè)大棚中傳感器監(jiān)測(cè)的濕溫度、光照等數(shù)據(jù)進(jìn)行了對(duì)比分析,結(jié)果表明,基于詞袋模型的異常檢測(cè)方法能夠利用采集數(shù)據(jù)的時(shí)空相關(guān)性準(zhǔn)確檢測(cè)異常數(shù)據(jù)。
【關(guān)鍵詞】詞袋模型;異常檢測(cè);邊緣計(jì)算;物聯(lián)網(wǎng)
【中圖分類(lèi)號(hào)】TP391 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文獻(xiàn)標(biāo)志碼】A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號(hào)】1673-1069(2023)01-0133-04
1 引言
隨著物聯(lián)網(wǎng)技術(shù)的日新月異,有數(shù)以萬(wàn)計(jì)的在線節(jié)點(diǎn)被部署在各種環(huán)境監(jiān)測(cè)和控制工作當(dāng)中,由此,節(jié)點(diǎn)連接數(shù)量的快速增加也為物聯(lián)網(wǎng)整體系統(tǒng)提出了更高的要求。邊緣計(jì)算技術(shù)應(yīng)運(yùn)而生,邊緣計(jì)算常用的設(shè)備有智能網(wǎng)關(guān)、輕量級(jí)服務(wù)器以及小型基站等,網(wǎng)關(guān)位于整個(gè)系統(tǒng)的中間,發(fā)揮著連接節(jié)點(diǎn)和云端的作用;網(wǎng)關(guān)為終端節(jié)點(diǎn)提供本地化服務(wù)與實(shí)時(shí)服務(wù),降低終端節(jié)點(diǎn)的時(shí)延;網(wǎng)關(guān)對(duì)節(jié)點(diǎn)數(shù)據(jù)進(jìn)行初級(jí)處理,分擔(dān)云端任務(wù),減少云端交互數(shù)據(jù)量,降低鏈路負(fù)載。但在物聯(lián)網(wǎng)系統(tǒng)中,經(jīng)常發(fā)生數(shù)據(jù)異常,為保證采集數(shù)據(jù)的準(zhǔn)確和物聯(lián)網(wǎng)系統(tǒng)的安全,利用數(shù)據(jù)自身的時(shí)空特性,本文提出了一種基于詞袋的人工神經(jīng)網(wǎng)絡(luò)模型的異常檢測(cè)方法。人工神經(jīng)網(wǎng)絡(luò)模型詞袋具有處理復(fù)雜數(shù)據(jù)的能力,既能夠分析線性相關(guān)的數(shù)據(jù),也能夠處理非線性相關(guān)的數(shù)據(jù)。由于神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的復(fù)雜性,訓(xùn)練過(guò)程被安排在云端,所得到的模型及參數(shù)將被回傳至邊緣計(jì)算網(wǎng)關(guān)用以進(jìn)行后續(xù)的異常檢測(cè)[1]。
2 基于邊緣計(jì)算的物聯(lián)網(wǎng)監(jiān)測(cè)系統(tǒng)
在本文中,按照節(jié)點(diǎn)、網(wǎng)關(guān)和云端3層結(jié)構(gòu),設(shè)計(jì)了無(wú)線傳感器監(jiān)測(cè)節(jié)點(diǎn)、LoRaWAN邊緣計(jì)算網(wǎng)關(guān)和MQTT服務(wù)器。利用LoRa無(wú)線技術(shù)低成本、廣覆蓋的特征,開(kāi)發(fā)出具有多種傳感特性及故障保護(hù)功能的線路監(jiān)控單元以及基于大數(shù)據(jù)技術(shù)的具有故障診斷功能的云儲(chǔ)存和云服務(wù)平臺(tái),以構(gòu)建完整的物聯(lián)網(wǎng)解決方案?;谶吘売?jì)算的物聯(lián)網(wǎng)監(jiān)測(cè)系統(tǒng)如圖1所示。
2.1 無(wú)線傳感器監(jiān)測(cè)節(jié)點(diǎn)
在物聯(lián)網(wǎng)監(jiān)測(cè)系統(tǒng)中,節(jié)點(diǎn)是整個(gè)系統(tǒng)的基礎(chǔ)。在監(jiān)測(cè)區(qū)域,大量的無(wú)線傳感器節(jié)點(diǎn)被用來(lái)實(shí)時(shí)感知周邊環(huán)境數(shù)據(jù),用來(lái)實(shí)時(shí)監(jiān)測(cè)環(huán)境。在基于邊緣計(jì)算的物聯(lián)網(wǎng)系統(tǒng)框架中,無(wú)線傳感器節(jié)點(diǎn)主要與邊緣網(wǎng)關(guān)進(jìn)行通信,與MQTT服務(wù)器的通信也由邊緣計(jì)算網(wǎng)關(guān)作為中繼進(jìn)行。整個(gè)監(jiān)測(cè)系統(tǒng)采用LoRa無(wú)線傳輸,連接傳感器的接口類(lèi)型為RS485接口,通信距離可達(dá)1 200 m;傳感器設(shè)備采用進(jìn)口探頭,具有精度高、量程寬、一致性好等優(yōu)點(diǎn);由于無(wú)線傳輸?shù)奶攸c(diǎn),監(jiān)測(cè)系統(tǒng)的安裝更加簡(jiǎn)單。本系統(tǒng)采用的是標(biāo)準(zhǔn)MODBUS RTU協(xié)議,該無(wú)線傳感器監(jiān)控系統(tǒng)具有超強(qiáng)的穩(wěn)定性、抗干擾能力以及較強(qiáng)的保護(hù)性能和一流的防雷保護(hù)。
2.2 邊緣計(jì)算網(wǎng)關(guān)
在大規(guī)模的物聯(lián)網(wǎng)監(jiān)測(cè)系統(tǒng)中,邊緣計(jì)算網(wǎng)關(guān)作為中間層,向下連接傳感器節(jié)點(diǎn),向上連接云端。同時(shí),對(duì)采集的數(shù)據(jù)進(jìn)行異常檢測(cè),一旦檢測(cè)出數(shù)據(jù)發(fā)生異常,邊緣計(jì)算網(wǎng)關(guān)會(huì)立即將異常報(bào)告給MQTT服務(wù)器,并驅(qū)動(dòng)位于底層的控制器,提供緊急應(yīng)對(duì)方案。該網(wǎng)關(guān)采用被譽(yù)為“世界上最流行最便宜的小型電腦”的樹(shù)莓派,由于樹(shù)莓派的體積很小、質(zhì)量很輕,而且功能豐富強(qiáng)大,其屬于一款性?xún)r(jià)比超高的迷你電腦主機(jī)。系統(tǒng)采用Raspbian;網(wǎng)關(guān)數(shù)據(jù)接收采用LoRaWAN SX1302;傳輸模塊采用4G或5G。在檢測(cè)算法上采用離群點(diǎn)算法或自編碼神經(jīng)網(wǎng)絡(luò)進(jìn)行傳感器異常數(shù)據(jù)檢測(cè)。
2.3 云計(jì)算平臺(tái)
云平臺(tái)因其超強(qiáng)的計(jì)算性能和超高的存儲(chǔ)能力,發(fā)揮著遠(yuǎn)程數(shù)據(jù)處理和控制中心的作用。在異常檢測(cè)方法中,使用詞袋模型檢測(cè)環(huán)境監(jiān)測(cè)數(shù)據(jù)并分析數(shù)據(jù)的空間相關(guān)性。物聯(lián)網(wǎng)終端數(shù)量的快速增加為物聯(lián)網(wǎng)整體系統(tǒng)提出了更高的要求,支撐設(shè)備的網(wǎng)絡(luò)環(huán)境要求越來(lái)苛刻,由此對(duì)于物聯(lián)網(wǎng)的協(xié)議選擇和平臺(tái)的負(fù)載要求也越來(lái)越高。為提供更優(yōu)良的信息服務(wù),綜合現(xiàn)有的通信協(xié)議,選擇基于TCP協(xié)議的MQTT協(xié)議作為主要的通信協(xié)議,使用EMQX消息服務(wù)器作為設(shè)備的物聯(lián)網(wǎng)平臺(tái)的接入層,由此建立一套完整的物聯(lián)網(wǎng)系統(tǒng),滿(mǎn)足小型物聯(lián)網(wǎng)平臺(tái)或個(gè)人開(kāi)發(fā)者的各類(lèi)需求,賦予此系統(tǒng)更多的現(xiàn)實(shí)意義。該系統(tǒng)采用前后端分離的B/S架構(gòu)以及跨平臺(tái)應(yīng)用技術(shù)開(kāi)發(fā),前端主要采用Vue框架構(gòu)建用戶(hù)界面,使用Axios獲取數(shù)據(jù)并渲染到頁(yè)面;后端主要使用Django Web框架,使用ORM進(jìn)行數(shù)據(jù)操作,同時(shí),安裝REST framework庫(kù)來(lái)構(gòu)建REST API,只向前端頁(yè)面提供JSON數(shù)據(jù);使用EMQX中間件實(shí)現(xiàn)物聯(lián)網(wǎng)設(shè)備與平臺(tái)的連接,實(shí)現(xiàn)終端設(shè)備與平臺(tái)的數(shù)據(jù)交換;用戶(hù)APP使用跨平臺(tái)技術(shù)開(kāi)發(fā),減少維護(hù)成本與開(kāi)發(fā)難度。
3 異常檢測(cè)方法
邊緣計(jì)算網(wǎng)關(guān)的設(shè)計(jì)目標(biāo)是利用分布式的網(wǎng)絡(luò)設(shè)施來(lái)執(zhí)行異常判斷以減輕云服務(wù)器的壓力,即盡可能靠近數(shù)據(jù)源,在邊緣計(jì)算網(wǎng)關(guān)上直接處理部分異常數(shù)據(jù),以減少傳輸?shù)綌?shù)據(jù)中心的數(shù)據(jù)量。
3.1 多元時(shí)間序列(MTSS)分類(lèi)
當(dāng)多個(gè)變量的測(cè)量序列存在時(shí),時(shí)間序列是多元的。不同傳感器在不同時(shí)間采集的值,形成多變量時(shí)間序列,輸出結(jié)果分為兩類(lèi):數(shù)據(jù)正常和數(shù)據(jù)異常。因此,多傳感器數(shù)據(jù)傳輸可以表述為MTSS分類(lèi)問(wèn)題。
MTSS分類(lèi)器分為3類(lèi):基于相似度的分類(lèi)器、基于特征的分類(lèi)器和深度學(xué)習(xí)的分類(lèi)器?;谙嗨菩缘姆椒ɡ孟嗨菩远攘浚ㄈ鐨W幾里得距離)來(lái)比較兩個(gè)MTSS。動(dòng)態(tài)時(shí)間規(guī)整(DTW)使用K最近鄰算法來(lái)計(jì)算相似度,也稱(chēng)kNN-DTW。MTSS的kNN-DTW有兩種算法:被動(dòng)的DTWD和主動(dòng)的DTWI,二者沒(méi)有明顯的差別。DTWI使用DTW獨(dú)立測(cè)量的所有維度的累積距離。DTWD利用一維時(shí)間序列進(jìn)行類(lèi)似的計(jì)算,它考慮了多維上的平方歐氏累積距離[2]。
基于特征的方法包括形狀元和詞袋BoW模型。形狀元模型使用子序列(形狀元)將原始時(shí)間序列轉(zhuǎn)換為更易于分類(lèi)的低維空間。gRSF和UFS是MTSS分類(lèi)中當(dāng)前最先進(jìn)的形狀元模型。這兩種模型放寬了時(shí)間限制,通過(guò)隨機(jī)選擇形狀元在多維空間中尋找有區(qū)別的子序列(形狀元探索)。gRSF在隨機(jī)抽取的形狀元素上創(chuàng)建決策樹(shù),gRSF在隨機(jī)抽取的shapelets上創(chuàng)建決策樹(shù),平均表現(xiàn)出比UFS更好的性能(14MTSS數(shù)據(jù)集)。同時(shí),BoW模型、mv ARF、SMTSS和WEASEL+MUSE將時(shí)間序列轉(zhuǎn)換成一個(gè)離散的詞袋,并利用一個(gè)詞的直方圖表示來(lái)進(jìn)行分類(lèi)。與gRSF、LPS、mv ARF和SMTS相比,WEASEL+MUSE的平均結(jié)果最好(20 MTSS數(shù)據(jù)集)。WEASEL+MUSE通過(guò)在每個(gè)離散維(符號(hào)傅立葉近似)上應(yīng)用不同大小的滑動(dòng)窗口來(lái)捕獲特征生成詞袋。
深度學(xué)習(xí)方法使用長(zhǎng)短期記憶(LSTM)和/或卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)提取潛在特征。當(dāng)前,最先進(jìn)的模型(MLSTM-FCN)由LSTM層和層疊CNN層以及擠壓和激發(fā)塊組成,以生成潛在特征。MLSTM-FCN在大數(shù)據(jù)集上的平均表現(xiàn)優(yōu)于WEASEL+MUSE(相對(duì)于測(cè)試的20個(gè)MTSS數(shù)據(jù)集)。
因此,在這項(xiàng)工作中,我們?cè)谝陨?類(lèi)MTSS分類(lèi)器中選擇了同類(lèi)中最好的分類(lèi)器DTWD、DTWI、WEASEL+MUSE和MLSTM-FCN分類(lèi)器。
3.2 網(wǎng)關(guān)的分布式機(jī)器學(xué)習(xí)算法
本文介紹了分布式多傳感器網(wǎng)關(guān)算法,這是一種新的兩步疊加集成方法。疊加集成是一種將子模型的預(yù)測(cè)作為輸入,再?lài)L試學(xué)習(xí)如何最好地組合輸入,從而作出更好的輸出預(yù)測(cè)的方法。網(wǎng)關(guān)根據(jù)每個(gè)傳感器收集的數(shù)據(jù)預(yù)測(cè)數(shù)據(jù)是否正常,并且使用詞袋聚合并表示這些類(lèi)預(yù)測(cè),以便計(jì)算最終類(lèi)別的最佳預(yù)測(cè)。第一步,在傳感器級(jí)別預(yù)測(cè)MTSS類(lèi)別:系統(tǒng)中有多種類(lèi)型的傳感器,在實(shí)驗(yàn)中為每種傳感器類(lèi)型訓(xùn)練一個(gè)MTSS分類(lèi)器。分類(lèi)器使用固定時(shí)間長(zhǎng)度組成的數(shù)據(jù)集進(jìn)行訓(xùn)練,其中時(shí)間長(zhǎng)度可在網(wǎng)關(guān)中設(shè)置。在圖2的上半部分說(shuō)明了訓(xùn)練方法的第一步。為了在單個(gè)傳感器水平上預(yù)測(cè)異常類(lèi)別,采用了WEASEL+MUSE MTSS分類(lèi)器。WEASEL+MUSE在每個(gè)維度上創(chuàng)建一個(gè)MTSS符號(hào),生成一組由長(zhǎng)度、單圖、雙圖、維度構(gòu)成的混合特征,最后形成基于MTSS的熱度編碼。WEASEL+MUSE有以下3個(gè)特征:第一,它的符號(hào)表示過(guò)濾掉數(shù)據(jù)集中的噪聲;第二,它是相位固定的,這提高了泛化能力;第三,它保持了相互作用,這允許描述不同維度上事件的同時(shí)發(fā)生。第二步,通過(guò)組合傳感器來(lái)預(yù)測(cè)數(shù)據(jù)異常:收集來(lái)自不同傳感器的類(lèi)預(yù)測(cè),并形成詞袋。將每個(gè)傳感器預(yù)測(cè)類(lèi)別作為一類(lèi)詞,利用每個(gè)異常詞的相對(duì)頻率向量對(duì)其進(jìn)行分類(lèi)。該頻率向量通過(guò)實(shí)例數(shù)進(jìn)行歸一化,以獲得相對(duì)頻率向量。最后結(jié)合各個(gè)傳感器異常性的文字包來(lái)描述具有破壞潛力的異常的全譜。在圖2的下半部分說(shuō)明了訓(xùn)練方法的第二步。
分布式算法需要分兩步執(zhí)行。算法的第一步執(zhí)行在基礎(chǔ)設(shè)施的傳感器層級(jí),在每個(gè)傳感器上運(yùn)行MTSS分類(lèi)器,以便根據(jù)每個(gè)傳感器產(chǎn)生的數(shù)據(jù)生成傳感器層級(jí)的預(yù)測(cè),再將來(lái)自每個(gè)傳感器的MTSS分類(lèi)器的輸出通過(guò)網(wǎng)絡(luò)傳輸?shù)骄W(wǎng)關(guān)的云數(shù)據(jù)中心部分,隨后在云數(shù)據(jù)中心層執(zhí)行第二部分算法,即先匯總來(lái)自傳感器的所有類(lèi)預(yù)測(cè),再利用機(jī)器學(xué)習(xí)的方法,形成最終的類(lèi)預(yù)測(cè)。與傳統(tǒng)的集中式EEW網(wǎng)絡(luò)結(jié)構(gòu)相比,這種方法減少了網(wǎng)絡(luò)上的數(shù)據(jù)量,因?yàn)閭鞲衅鳟a(chǎn)生的大多數(shù)數(shù)據(jù)與異常事件無(wú)關(guān),因此,可以過(guò)濾掉。此外,傳感器級(jí)別的預(yù)測(cè)實(shí)際上是數(shù)據(jù)的聚合,因此,這有助于減少發(fā)送到數(shù)據(jù)中心的數(shù)據(jù)量。
3.3 異常問(wèn)題
在物聯(lián)網(wǎng)監(jiān)測(cè)系統(tǒng)中,異常問(wèn)題主要是指?jìng)鞲衅鲾?shù)據(jù)的異常,即在時(shí)域或空間域中具有高度規(guī)律性的傳感器數(shù)據(jù)中出現(xiàn)不符合規(guī)律的數(shù)據(jù)。造成數(shù)據(jù)異常的原因很多,既可能是監(jiān)測(cè)區(qū)域的突發(fā)事件,也包括傳感器節(jié)點(diǎn)自身的異常如硬件模塊損壞、節(jié)點(diǎn)電量偏低以及無(wú)線通信過(guò)程中的干擾等。本文只針對(duì)數(shù)據(jù)異常進(jìn)行檢測(cè),不對(duì)造成異常的原因進(jìn)行分析。
3.4 基于詞袋的異常檢測(cè)方法
潛在的主題模式pLSA適用于容量為V的詞匯表,為了學(xué)習(xí)詞匯表中的時(shí)空詞,假定在訓(xùn)練數(shù)據(jù)集中,描述符集合對(duì)應(yīng)所有檢測(cè)到的傳感器時(shí)空數(shù)據(jù)。利用K-means算法和歐氏距離作為聚類(lèi)尺度來(lái)生成代碼本。每個(gè)聚類(lèi)的中心定義一個(gè)時(shí)空詞,這樣每個(gè)傳感器檢測(cè)到的值被劃分到唯一的類(lèi)成員,也就是時(shí)空詞,因而每一類(lèi)傳感器可以從代碼表中找出一個(gè)時(shí)空詞的集合與之對(duì)應(yīng)。在文本字典中,潛在主題模型pLSA依賴(lài)于M個(gè)傳感器。
LSA是通過(guò)詞之間的關(guān)聯(lián)意思來(lái)對(duì)長(zhǎng)文本進(jìn)行解讀的一種理論方法。假設(shè)有M(j=1,2,…,M)個(gè)數(shù)據(jù)序列包含詞匯表V(1,2,…,V)個(gè)時(shí)空詞。數(shù)據(jù)的集合可以表示為V×M的共生表M,其中,m(wi,dj)表示在數(shù)據(jù)dj出現(xiàn)時(shí)空詞wi的數(shù)量,一個(gè)潛在的主題變量zk與在數(shù)據(jù)dj中出現(xiàn)的時(shí)空詞wi相聯(lián)系。每個(gè)主題對(duì)應(yīng)著傳感器類(lèi)別,如溫濕度、照度等傳感器。聯(lián)合概率P(wi,dj,zk)的圖模型由圖3水平部分表示。節(jié)點(diǎn)表示隨機(jī)變量,帶陰影的節(jié)點(diǎn)是觀察變量,不帶陰影的是隱含量。在本節(jié)中,d是數(shù)據(jù)序列;z是傳感器類(lèi)別;w是時(shí)空詞。模型的參數(shù)使用最大期望值來(lái)進(jìn)行無(wú)監(jiān)督數(shù)的學(xué)習(xí)[3,4]。
P(dj,wi)=P(dj)P(wi|dj) ? ? ? ? ? (1)
觀察值(dj,wi)假定是獨(dú)立的,可以忽略主題詞zk來(lái)獲取條件概率P(wi|dj)。
P(wi|dj)=P(zk|dj)P(wi|zk) ? ? ?(2)
式中,P(zk|dj)是主題詞zk發(fā)生在數(shù)據(jù)dj中的概率;P(wi|zk)是時(shí)空詞wi劃分為傳感器zk的概率?,F(xiàn)在有K個(gè)主題詞,也就是有K個(gè)傳感器,這個(gè)模型就有K種傳感器種類(lèi)組合,即通過(guò)表面凸組合或行為概率P(wi|zk)得到指定數(shù)據(jù)詞分布P(wi|dj)。使用權(quán)重特定因子P(zk|dj)來(lái)表示特定的數(shù)據(jù)。每個(gè)數(shù)據(jù)流作為傳感器類(lèi)別建模,由混合柱狀圖組成特殊數(shù)據(jù)的柱狀圖對(duì)應(yīng)傳感器種類(lèi)。通過(guò)計(jì)算得到模型直方圖P(wi|zk)和混合系數(shù)P(zk|dj)來(lái)確定傳感器種類(lèi)。通常,每個(gè)傳感器數(shù)據(jù)都被建模為異常類(lèi)別的混合物:特定傳感器數(shù)據(jù)的直方圖由對(duì)應(yīng)于每個(gè)異常類(lèi)別的直方圖的混合物組成,此后通過(guò)確定異常類(lèi)別直方圖P(wi|zk)(所有傳感器數(shù)據(jù)通用)和混合系數(shù)P(zk|dj)(每個(gè)傳感器數(shù)據(jù)專(zhuān)用)來(lái)擬合模型。為確定出現(xiàn)在數(shù)據(jù)中時(shí)空詞最大可能性概率模型,對(duì)目標(biāo)函數(shù)使用最大期望值算法來(lái)得到參數(shù)的最大相似度估計(jì)值:
(3)
由于算法已經(jīng)學(xué)習(xí)了異常類(lèi)別模型,下一步的任務(wù)是對(duì)新的傳感器數(shù)據(jù)序列進(jìn)行分類(lèi)。從一組不同的訓(xùn)練序列中獲得了特定于異常類(lèi)別的傳感器數(shù)據(jù)單詞分布P(wi|zk),當(dāng)接收到一個(gè)新的傳感器數(shù)據(jù)時(shí),看不見(jiàn)的傳感器數(shù)據(jù)通過(guò)P(w|z)投射到簡(jiǎn)單的平面。接著找出混合系數(shù)P(zk|dtest),需要找到混合系數(shù),以使測(cè)量的經(jīng)驗(yàn)分布與實(shí)際分布之間的KL偏差最小化。與學(xué)習(xí)場(chǎng)景類(lèi)似,使用EM算法來(lái)尋找解決方案。因此,通過(guò)選擇最能解釋觀察結(jié)果的行動(dòng)類(lèi)別來(lái)作出分類(lèi)決策,arg為變?cè)醋宰兞縜rgument)的英文縮寫(xiě),即:
Action Category=arg P(zk,dtest) ? ? (4)
此外,我們?nèi)栽谶M(jìn)一步研究如何在一個(gè)傳感器數(shù)據(jù)序列中定位多個(gè)異常。盡管時(shí)空詞包模型本身并不能明確地表示局部傳感器數(shù)據(jù)區(qū)域的空間或時(shí)間關(guān)系,但它能夠在每個(gè)傳感器數(shù)據(jù)中定位不同的類(lèi)型。
4 測(cè)試實(shí)驗(yàn)
在本節(jié)實(shí)驗(yàn)中,采用農(nóng)業(yè)大棚的數(shù)據(jù)進(jìn)行實(shí)驗(yàn),選取250 m×200 m的區(qū)域,模擬布設(shè)30套無(wú)線傳感器節(jié)點(diǎn),節(jié)點(diǎn)MCU為STM32,傳輸芯片為L(zhǎng)oRa 1278,傳感器包括溫度、濕度、光照和二氧化碳傳感器。放置了兩套樹(shù)莓派網(wǎng)關(guān),搭載SX1302芯片,WAN口為RJ45有線傳輸,一臺(tái)內(nèi)置有詞袋異常檢測(cè)算法,一臺(tái)為透?jìng)骶W(wǎng)關(guān)。在Windows 10系統(tǒng)上布設(shè)MQTT服務(wù)器。異常的詞袋學(xué)習(xí)訓(xùn)練為單個(gè)節(jié)點(diǎn)單個(gè)溫度傳感器異常訓(xùn)練,當(dāng)網(wǎng)關(guān)檢測(cè)出數(shù)據(jù)異常時(shí),不向MQTT發(fā)送消息。所有實(shí)驗(yàn)在此環(huán)境中分別測(cè)試。
實(shí)驗(yàn)方法1:通過(guò)人為突然改變單個(gè)節(jié)點(diǎn)單個(gè)傳感器的值,用手電筒突然照射固定照度傳感器,檢查邊緣計(jì)算網(wǎng)關(guān)能否檢測(cè)出異常值。實(shí)驗(yàn)方法2:通過(guò)人為突然改變單個(gè)節(jié)點(diǎn)多個(gè)傳感器的值,在固定傳感器邊上點(diǎn)火,檢查邊緣計(jì)算網(wǎng)關(guān)能否檢測(cè)出異常值。實(shí)驗(yàn)方法3:通過(guò)人為突然改變多個(gè)節(jié)點(diǎn)單個(gè)傳感器的值,用手電筒突然照射多個(gè)照度傳感器,檢查邊緣計(jì)算網(wǎng)關(guān)能否檢測(cè)出異常值。實(shí)驗(yàn)方法4:通過(guò)人為突然改變多個(gè)節(jié)點(diǎn)多個(gè)傳感器,在多個(gè)傳感器邊上點(diǎn)火,檢查邊緣計(jì)算網(wǎng)關(guān)能否檢測(cè)出異常值。
本次實(shí)驗(yàn)節(jié)點(diǎn)設(shè)定每2 min采集發(fā)送數(shù)據(jù),實(shí)驗(yàn)時(shí)長(zhǎng)為4 h,以上每種實(shí)驗(yàn)方法人為控制發(fā)生次數(shù)為50次。以透?jìng)骶W(wǎng)關(guān)發(fā)送的消息數(shù)為基數(shù),帶詞包網(wǎng)關(guān)檢測(cè)異常后消息不發(fā)送,二者的差就是網(wǎng)關(guān)檢測(cè)出的異常次數(shù)。實(shí)驗(yàn)結(jié)果如表1所示。
以上實(shí)驗(yàn)表明,基于詞包的網(wǎng)關(guān)異常數(shù)據(jù)檢測(cè)能有效地檢測(cè)異常數(shù)據(jù),對(duì)減輕服務(wù)器壓力具有一定的作用,減少了網(wǎng)關(guān)不必要的通信量。由于訓(xùn)練集和方法的問(wèn)題,網(wǎng)關(guān)對(duì)單一傳感器異常的檢測(cè)效果較好,但對(duì)多節(jié)點(diǎn)多傳感器異常的識(shí)別能力仍有待提高,傳感器異常相關(guān)性問(wèn)題也有待研究。
【參考文獻(xiàn)】
【1】于天琪,朱詠絮,王現(xiàn)斌.基于邊緣計(jì)算的物聯(lián)網(wǎng)監(jiān)測(cè)系統(tǒng)中利用自編碼神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的異常檢測(cè)[J].物聯(lián)網(wǎng)學(xué)報(bào),2018,2(4):14-21.
【2】Kevin Fauvel,Daniel Balouek-Thomert,Diego Melgar,et al.A Distributed Multi-Sensor Machine Learning Approach to Earthquake Early Warning[J].Proceedings of the AAAI Conference on Artificial Intelligence,2020,34(1):403-411.
【3】張軍,劉志鏡.可變場(chǎng)所的異常行為識(shí)別方法[J].中國(guó)圖象圖形學(xué)報(bào),2009,14(10):2097-2101.
【4】Juan Carlos Niebles,Hongcheng Wang,Li Fei-Fei.Unsupervised Learning of Human Action Categories Using Spatial-Temporal Words[J].International Journal of Computer Vision,2008,79(3):299-318.