陳昆倫
摘要:為了全面了解物聯(lián)網(wǎng)車道設(shè)備實(shí)時(shí)狀態(tài),而進(jìn)行可預(yù)防性的養(yǎng)護(hù)保養(yǎng),根據(jù)物聯(lián)網(wǎng)車道數(shù)據(jù),利用貝葉斯分類器對設(shè)備狀態(tài)分析判斷,從而實(shí)現(xiàn)設(shè)備針對性的維護(hù),節(jié)約人力物力、并實(shí)現(xiàn)高速暢通。
關(guān)鍵詞:物聯(lián)網(wǎng)、車道、貝葉斯分類
一、背景
隨著物聯(lián)網(wǎng)技術(shù)的普及,省內(nèi)高速公路已經(jīng)逐漸使用了物聯(lián)網(wǎng)車道,通過物聯(lián)網(wǎng)車道實(shí)時(shí)數(shù)據(jù)的采集,可以了解車道的實(shí)時(shí)狀態(tài),可以直觀了解車道是否有重大故障,但是如果發(fā)生了故障才去維修,還是會(huì)導(dǎo)致高速出入口的車輛擁堵,造成交通堵塞隱患。管理部門為了減少設(shè)備的故障率,依然需要定期對所有車道設(shè)備進(jìn)行巡檢保養(yǎng),工作盲目低效。為了保證車道最大程度的通暢,針對性的巡檢運(yùn)維,有必要對采集到的車道設(shè)備數(shù)據(jù)進(jìn)行智能全面的分析,對設(shè)備狀態(tài)進(jìn)行監(jiān)控,針對性的巡檢維護(hù),以提高設(shè)備的健康狀態(tài),實(shí)現(xiàn)高速公路安全、高效、通暢。
二、設(shè)備故障狀態(tài)的分析
在車道設(shè)備的生命周期中,設(shè)備狀態(tài)按順序可以分為正常、亞健康、故障。其中故障一般可分為缺陷故障、積累的故障和隨機(jī)故障。缺陷故障一般是由于設(shè)計(jì)、施工、生產(chǎn)等環(huán)節(jié)的問題導(dǎo)致設(shè)備故障,設(shè)備投入使用即可發(fā)現(xiàn)。對于隨機(jī)故障是由于各類偶然的因素導(dǎo)致的,通常不能通過分析確定由特定的實(shí)效機(jī)制導(dǎo)致其故障,例如,車道設(shè)備意外損壞故障,這類故障屬于小概率事件,不在本文的考慮之中。設(shè)備的故障主要是積累的故障,有一個(gè)漸變的過程,我們根據(jù)設(shè)備現(xiàn)有狀態(tài)數(shù)據(jù)建立貝葉斯分類模型進(jìn)行設(shè)備狀態(tài)的分析和故障預(yù)測。
三、基本模型
貝葉斯分類算法是統(tǒng)計(jì)學(xué)的一種分類方法,它是一類利用概率統(tǒng)計(jì)知識進(jìn)行分類的算法。其方法簡單、分類準(zhǔn)確率高、速度快。甚至在一定條件下可以與決策樹和神經(jīng)網(wǎng)絡(luò)等復(fù)雜的分類算法相媲美。其基本思路是給出待分類項(xiàng),求解在此項(xiàng)出現(xiàn)的條件下各個(gè)類別出現(xiàn)的概率,哪個(gè)最大,就認(rèn)為待分類項(xiàng)屬于哪個(gè)類別。
整個(gè)樸素貝葉斯分類分為三個(gè)階段:
準(zhǔn)備工作階段,主要工作是根據(jù)具體情況確定特征屬性,并對每個(gè)特征屬性進(jìn)行適當(dāng)劃分,然后由人工對待分類項(xiàng)決定分類,形成訓(xùn)練樣本。本階段的輸入是所有待分類數(shù)據(jù)集合,輸出是特征屬性和訓(xùn)練的樣本集合。分類器的質(zhì)量基本上取決于特征屬性、特征屬性劃分及訓(xùn)練樣本的質(zhì)量。
分類器訓(xùn)練階段,主要工作是計(jì)算每個(gè)類別在訓(xùn)練樣本集合中的出現(xiàn)頻率及每個(gè)特征屬性劃分對每個(gè)類別的條件概率估計(jì)。其輸入是特征屬性和訓(xùn)練樣本,輸出是分類器劃分。這一階段是根據(jù)前面討論的公式由程序自動(dòng)計(jì)算完成。
應(yīng)用階段。任務(wù)是使用分類器對待分類項(xiàng)進(jìn)行分類,其輸入是分類器和待分類項(xiàng),輸出是待分類項(xiàng)與類別的映射關(guān)系。本階段由計(jì)算程序自動(dòng)完成。
四、驗(yàn)證模型
1. 數(shù)據(jù)的采集
收集基礎(chǔ)的物聯(lián)網(wǎng)車道數(shù)據(jù),包括電壓、功率、實(shí)時(shí)溫度等。
數(shù)據(jù)清洗,去掉不符合的標(biāo)準(zhǔn)的垃圾數(shù)據(jù)或缺陷數(shù)據(jù)。
經(jīng)過以上兩步就得到訓(xùn)練樣本數(shù)據(jù)。
2. 條件概率估計(jì)
車道傳感器釆集車道設(shè)備的各項(xiàng)指標(biāo),根據(jù)目前狀態(tài)可以分為健康、亞健康、故障三個(gè)狀態(tài)。
設(shè)y1=健康狀態(tài),y2=亞健康狀態(tài),y3=故障狀態(tài),α1=電壓,α2=功率,α3=溫度
統(tǒng)計(jì)得到在各類別下各個(gè)特征屬性的條件概率估計(jì)。如表1
3. 確定特征屬性及劃分
4. 計(jì)算條件概率
對應(yīng)公式1,分母對于所有類別均為常數(shù),因?yàn)槲覀冎灰獙⒎肿幼畲蠡纯?。又因?yàn)楦鱾€(gè)特征屬性是條件獨(dú)立的,取得各種分類的條件概率數(shù)值,取得其最大值便是其分類。
數(shù)據(jù)舉例如表2、表3
表2根據(jù)特征屬性歸為正常分類中車道設(shè)備。
表3根據(jù)特征屬性歸為故障分類中車道設(shè)備。
5. 改進(jìn)
當(dāng)某個(gè)類別下某個(gè)特征項(xiàng)劃分沒有出現(xiàn)時(shí),就是產(chǎn)生概率為0的情況,這會(huì)令分類器分類質(zhì)量大大降低。為了解決這個(gè)問題,引入拉普拉斯平滑,它的思想是對沒類別下所有劃分的計(jì)數(shù)加1,這樣如果訓(xùn)練樣本集數(shù)量充分大時(shí),并不會(huì)對結(jié)果產(chǎn)生影響,并且解決了上述概率為0的情況。
6. 不足
1) 模型的訓(xùn)練數(shù)據(jù)是采樣集合范圍有局限性,可能不能代表整體數(shù)據(jù)情況。
2) 樣本的特征屬性值數(shù)量考慮較少,雖然基本能反應(yīng)設(shè)備狀態(tài),不過精確度還是略有偏差,降低了檢驗(yàn)?zāi)P偷臏?zhǔn)確度。
3) 局部樣本的分類配比可能與整體的分類配比不同,可能會(huì)對真實(shí)結(jié)果造成偏差。
4) 樣本的特征屬性取值較少,尚未考慮車流量及環(huán)境的因素。
五、結(jié)語
本文根據(jù)現(xiàn)有的物聯(lián)網(wǎng)車道數(shù)據(jù)建立了貝葉斯分類模型算法實(shí)時(shí)分析了車道設(shè)備的狀態(tài),從而實(shí)現(xiàn)了設(shè)備預(yù)防性的維護(hù),該模型基本解決了車道狀態(tài)預(yù)測分類的問題,雖然模型在數(shù)據(jù)和特征屬性的取樣有一定的局限性,但是依然對車道設(shè)備運(yùn)維提供了決策支持方案。
參考資料:
[1]《數(shù)據(jù)挖掘?qū)嵱脵C(jī)器學(xué)習(xí)工具與技術(shù)》原書第3版Ian H.Witten Eibe Fank Mark A. Hall著 機(jī)械工業(yè)出版社 2014年5月 第1版 187-192頁
[2]《神經(jīng)網(wǎng)絡(luò)與機(jī)器學(xué)習(xí)》原書第3版 Simon Havkin著 機(jī)械工業(yè)出版社 2011年第1版 477-478頁
[3]Allen B. Downey著《貝葉斯思維》 人民郵電出版社 2015年4月第1版。第3-5頁