高文濱, 趙聯(lián)文, 任芮彬*, 廖群英
(1. 西南交通大學 系統(tǒng)可信性自動驗證國家地方聯(lián)合工程實驗室, 四川 成都 610031; 2. 四川師范大學 數(shù)學科學學院, 四川 成都 610066)
隨著社會經(jīng)濟和城市現(xiàn)代化的快速發(fā)展,高層建筑在城市建筑中占比越來越大,電梯作為高層建筑必備運輸工具也越來越多.當今社會出現(xiàn)了各種電梯的安全問題,促使電梯的第三方檢測快速發(fā)展.由于不同品牌電梯的系統(tǒng)、硬件的不同以及電梯應用的環(huán)境不同,目前還沒有通用的電梯樓層檢測方法,故急需一種泛化能力強、與機械硬件不相關的電梯樓層智能識別方法.
由于大氣壓數(shù)據(jù)具有時效性,且采集簡單,現(xiàn)有的電梯智能識別算法大多是基于大氣壓數(shù)據(jù).首先建立氣壓值與海拔高度之間的函數(shù)關系,再通過海拔高度對電梯??繕菍舆M行識別.文獻[1]提出了基于JY901姿態(tài)角度傳感器的氣壓測量的語音報站系統(tǒng),將目標運行狀態(tài)下的電梯氣壓差轉換成海拔高度的變化,從而換算出樓層高度.文獻[2]提出一種基于JY901B姿態(tài)傳感器的電梯智能語音提示系統(tǒng),在氣壓變化差值轉變?yōu)楹0胃叨葴y算樓層高度的基礎上,改進標準氣壓海拔關系式,推算出誤差小且速度快的優(yōu)化算法模型.上述方法具有所需裝備體積小、功耗低、測量精度高的優(yōu)點,但需要提前測定樓層高度以及電梯1樓的初始氣壓值等數(shù)據(jù),實際使用時較為麻煩,針對外部環(huán)境的變化泛化性能較差.文獻[3]提出了一種基于Wi-Fi、氣壓計組合的樓層定位方法,使用密度聚類區(qū)分不同區(qū)域的信號特征,在線接收信號與指紋庫從而進行匹配,以此識別樓層.該方法需要Wi-Fi數(shù)據(jù)的配合,實施較為復雜,且電梯中可能存在Wi-Fi數(shù)據(jù)無法傳輸?shù)那闆r,不利于實際電梯樓層識別工程的實施.文獻[4]提出了部署縱向定位設備,再建立室內各層樓梯口的LoRa信號指紋庫,劃定對應不同樓層信號強度特征的判定閾值,最后結合LoRa-RSSI(received signal strength indication,接收信號強度指示)動態(tài)識別和樓層判定方法,捕捉室內動態(tài)下無線信號強度的實時變化,進行樓層識別,該方法的識別準確率是97.9%.文獻[5-6]是基于指紋的室內定位方法,需要較多在設備硬件上的花費.文獻[7]提出了通過傳感器采集本地的氣壓和溫度信息,利用附近基站廣播信號中的基站氣象信息和高程信息進行解算結合差分氣壓測高方法.該方法考慮到了溫度這個外部因素對氣壓值的影響,但是沒有考慮其他因素對氣壓值的影響,也沒有直接運用到電梯樓層識別的實例.文獻[8]提出了基于無線指紋和氣壓混合樓層識別的算法,利用無線AP(access point)分布和氣壓信息進行計算,通過離線訓練指紋提取不同樓層的AP分布規(guī)律并采用貝葉斯分類法進行識別.該方法是從無線AP分布中獲得樓層信息進行初始化和校準氣壓的樓層識別技術,在實驗中,該方法的識別準確率超過96.1%,但尚未達到100%.文獻[9]提出使用智能手機的內置氣壓傳感器來研究移動設備的高度,并將該高度與建筑物的樓層高度進行比較從而獲得樓層的數(shù)量.為了解決不同性能手機氣壓計帶來的誤判問題,還提出了鄰域的壓力傳感器相對標定方法.該方法需測量樓層高度,在工程應用問題上相對復雜.文獻[10]提出一種結合水平儀和氣壓計的多層建筑物室內環(huán)境中行人樓層高度識別算法,識別準確率可達93%,其需要的設備更多,且準確率未達到100%.
現(xiàn)有的方法為保證電梯樓層識別精度需要較高維度的數(shù)據(jù),或需要較為復雜、昂貴的設備,不利于實際工程項目的應用.
本文將大氣壓數(shù)據(jù)與電梯停靠樓層之間建立直接聯(lián)系.通過半監(jiān)督學習的方法,初次采集帶標簽數(shù)據(jù),后續(xù)數(shù)據(jù)均為無標簽數(shù)據(jù),建立參數(shù)自適應的回歸模型.通過考慮機器學習中的半監(jiān)督模型,更加注重目標識別的泛化能力,提出首先利用帶標簽訓練數(shù)據(jù)擬合電梯??繕菍优c氣壓值的回歸方程,再通過上個時間段的數(shù)據(jù)對當前時間的回歸模型的參數(shù)進行調整,得到新的回歸模型,從而進行精準判別.該方法數(shù)據(jù)簡單易于采集,在不同情景下,可以根據(jù)實際情況,自適應地調整參數(shù),具有較高的識別精度.而且該方法的模型復雜度不高,使用設備功耗低、數(shù)量少、成本低廉,便于在工程項目中實際運用.
在電梯樓層識別模型中,自變量為大氣壓值,因變量為電梯??繕菍?經(jīng)查閱文獻[1-2,11-12]及對回歸方程做F檢驗與擬合優(yōu)度檢驗證明,在較短的時段內,大氣壓值與電梯??繕菍又g,存在明顯的線性關系(分析見4.2小節(jié)的顯著性檢驗).但是隨著時間的推移,普通的線性回歸模型無法對電梯的??繕菍舆M行準確的識別.因此,本文將基于實地采集的實驗數(shù)據(jù),建立改進的回歸模型,以實現(xiàn)電梯所在樓層的智能識別.
但模型的建立有以下困難:
1) 實際工程應用中用于建模的帶標識的數(shù)據(jù)極少,實時收集的數(shù)據(jù)為無標識數(shù)據(jù);
2) 用于識別電梯??繕菍拥奶卣鬏^少,數(shù)據(jù)維度較低;
3) 自變量大氣壓值與溫度呈正相關,還與天氣、樓梯間的通風情況等因素有一定的關系.在實際工程應用中缺少描述大氣壓值變化的特征,無法考慮到所有導致大氣壓變化的影響因素.
針對以上問題,本文提出了基于參數(shù)自適應的電梯樓層自動識別模型.該模型可以使用較少的數(shù)據(jù),實現(xiàn)對電梯??繕菍拥闹悄茏R別,且算法具有較強的泛化能力.
由于線性回歸模型無法對長時段的目標進行識別,本文通過模型參數(shù)的自適應調整,根據(jù)t時段數(shù)據(jù)蘊含的信息特性,對t+1時段的模型進行修正,使模型準確識別樓層的時效性在參數(shù)的持續(xù)更新下得以保證.
2.1 模型數(shù)據(jù)實際情況中,可能存在采集數(shù)據(jù)量較小且?guī)撕灁?shù)據(jù)不易收集的問題.該半監(jiān)督學習模型只需少量初始數(shù)據(jù)帶有標簽信息,后續(xù)數(shù)據(jù)均不含標簽.本方法將訓練數(shù)據(jù)分為兩個部分.第一部分為n對帶標簽訓練數(shù)據(jù),記為(x1,y1),(x2,y2),…,(xn,yn),用以學習模型的參數(shù).第二部分數(shù)據(jù)需現(xiàn)場定時采集,每tmin時段內采集一組容量為k的無標簽數(shù)據(jù)(假設tmin時段內數(shù)據(jù)的變化很小,模型可以對目標進行準確識別)用于在訓練中調整模型參數(shù),共采集T個時段(t=1,2,…,T),其中訓練數(shù)據(jù)記為
Xt=(xt1,xt2,…,xtk),
t=1,2,…,T,k?n.
2.2 模型假設針對半監(jiān)督學習的參數(shù)自適應回歸模型有下述3個假設:
1) 各因變量間距保持一致;
2) 自變量與因變量之間的變化關系不受外部環(huán)境影響;
3) 外部條件的改變過程緩慢,在某種意義上,短時間內認為模型可以進行準確判斷,即t時刻的模型可以對[t,t+tmin]內的數(shù)據(jù)進行準確識別.
假設1)保證了自變量與因變量間的線性關系;假設2)在回歸模型中自變量與因變量間的相對變化規(guī)律是固定的,即回歸系數(shù)不變;假設3)保證了參數(shù)迭代的可行性.在電梯??繕菍幼詣幼R別實際問題中,滿足以上3條假設(詳細情況請見第3節(jié)).
2.3 線性回歸模型回歸模型的輸入是n組帶標簽數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn).
一元線性回歸模型是考慮兩個變量間的相關關系[13-17],自變量x與因變量y之間的關系可解釋為兩個部分:y的變化一部分是由x的變化導致的,另一部分是由其他一切隨機因素產生,記為ε.在實際問題中,更關注y由于x的改變產生的變化,而不是其他一切隨機因素所產生的變化,即
y=β0+β1x+ε.
(1)
(1) 式稱為y對x的一元線性理論回歸模型.式中β0與β1是待估參數(shù),稱β0為回歸常數(shù),β1為回歸系數(shù).
在電梯停靠樓層識別問題中,對于獲得的訓練數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),xi表示??繕菍訉拇髿鈮褐?yi表示停靠的樓層,則得到模型
yi=β0+β1xi+εi,i=1,2,…,n.
(2)
(3)
2.4 回歸模型參數(shù)β0和β1的估計利用最小二乘估計對β0,β1進行估計,定義
(4)
(5)
對(5)式進行求解得
(6)
2.5 參數(shù)自適應回歸模型的參數(shù)β0和β1調整預測模型中,是回歸系數(shù),代表的是大氣壓與樓層之間的相對關系;是外部擾動,代表的是其他一切隨機因素的變化,對回歸方程造成的統(tǒng)一影響.所以需要調整預測模型的和來更精確地擬合實時數(shù)據(jù),提升電梯樓層智能識別的精確度.
(Xt,Yt)={(xt1,yt1),(xt2,yt2),…,(xtk,ytk)},
t=1,2,…,T.
(Xt,Yt)={(xt1,yt1),(xt2,yt2),…,(xtk,ytk)},
t=1,2,…,T,
可以通過最小二乘法得
(7)
上式中
(8)
(9)
3.1 回歸模型參數(shù)學習算法在電梯??繕菍幼R別中,面臨著訓練模型的帶標簽數(shù)據(jù)量不夠的問題,為了解決該問題,本文提出了基于回歸分析的參數(shù)調整方法.
本文將訓練模型的數(shù)據(jù)分為兩個部分:一部分為大氣壓值與其對應的樓層的帶標簽的訓練數(shù)據(jù);另一部分為定時采集、數(shù)據(jù)量較少、用于參數(shù)調整的不帶標簽的大氣壓訓練數(shù)據(jù).
在實際工程中,由于用于訓練的數(shù)據(jù)量較少且存在溫差不定、相對海拔不同等問題,使得一般的回歸模型泛化能力較差.如果關注臨時采集的數(shù)據(jù)所蘊含的信息,會造成模型參數(shù)的偏差,不易通過假設檢驗,無法準確預測電梯停靠樓層.本文通過事先采集到的大氣壓值及其對應的樓層數(shù)據(jù)訓練模型的初始參數(shù),在假設條件1)和2)下,可以通過實驗驗證,回歸系數(shù)β1不會產生改變,只需要調整外部擾動β0,以此適應外部環(huán)境的變化,顯示未知變量造成的影響.
下面給出建立回歸模型的算法:
輸入:n組訓練集數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn).輸出:回歸模型參數(shù)^β0和^β1.㊣Step? 1 進行數(shù)據(jù)預處理,去除異常數(shù)據(jù).㊣Step? 2 建立線性回歸模型,進行擬合優(yōu)度檢驗,判斷Y與X間是否存在線性關系.yi表示??繕菍?xi表示停靠樓層對應的大氣壓值.㊣Step? 3 線性回歸模型y=β0+β1x+ε,外部擾動ε需滿足零均值性、方差齊次性、互不相關性、同期外生性的假設.㊣Step? 4 對模型的參數(shù)進行估計,^β0= y-^β1 x,^β1=∑?n?i=1(x?i- x)(y?i- y)∑?n?i=1(x?i- x)2, 其中, y=1n∑?n?i=1yi, x=1n∑?n?i=1xi.㊣Step? 5 輸出β0和β1的估計值^β0和^β1.
3.2 參數(shù)自適應算法針對參數(shù)調整的3個假設:
1) 樓層間的距離是一樣的;
2) 外部環(huán)境的改變不會影響大氣壓與樓層間的相對變化;
3) 大氣壓相對外部一切隨機因素間的變化過程緩慢,在某種意義上說,短時間內認為回歸模型可以針對樓層進行準確的識別,長時間會導致回歸模型無法進行精準地識別,即t時間的模型可以對t+tmin時間的數(shù)據(jù)進行準確判斷.
參數(shù)迭代后的回歸模型通過n組事先準備的訓練集數(shù)據(jù)(xi,yi)(i=1,2,…,n)與t時刻的數(shù)據(jù)(Xt,Yt)={(xt1,yt1),(xt2,yt2),…,(xtk,ytk)}(t=1,2,…,T),對β0和β1進行估計.下面給出參數(shù)調整模型的算法:
輸入:t時刻的數(shù)據(jù)Xt=(xt1,xt2,…,xtk).輸出:調整后的參數(shù)^β'0和^β'1與回歸方程.㊣Step? 1 利用t-1時刻的回歸模型對輸入數(shù)據(jù)Xt=(xt1,xt2,…,xtk)進行識別得到(X?t,Y?t)={(x?t1,y?t1),(x?t2,y?t2),…,(x?tk,y?tk)},t=1,2,…,T.㊣Step? 2 計算 yt=1n∑k?i=1yti, xt=1n∑k?i=1xti.㊣Step? 3 令^β't1=^β1,^β't0= yt-^β'1 xt.㊣Step? 4 得到β0和β1的估計值^β't1和^β't0.㊣Step? 5 輸出t時段回歸方程:^yt=^β't0+^β't1x.
實際工程項目實施時需要注意該方法收集的數(shù)據(jù)均為在樓層??繒r收集,在電梯運行過程中,收集數(shù)據(jù)會導致模型識別失效.
具體的模型參數(shù)自適應方法如圖1所示.
圖1 參數(shù)自適應模型
3.3 不嚴格滿足假設的情況在實際情況中,存在部分樓層的底層間距較大的情況,假設1)不是嚴格滿足的.在這種情況下,本文的方法稍加修改即可滿足,即將二樓作為參與迭代最低樓層,并設置氣壓最低閾值,當氣壓小于該閾值時,因變量目標樓層顯示為1樓,閾值記為α.
下面給出此情況下的算法:
輸入:n組訓練集數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)、t時刻的數(shù)據(jù)Xt=(xt1,xt2,…,xtk).輸出:t時刻的數(shù)據(jù)Xt對應的Yt=(yt1,…,ytk).㊣Step? 1 在在所有數(shù)據(jù)中刪除y=1的所有數(shù)據(jù),令其他所有y=y-1.㊣Step? 2 建立回歸模型.㊣Step? 3 計算t時刻調整后的參數(shù)^β'0、^β'1和回歸方程^yt=^β't0+^β't1x.㊣Step? 4 計算閾值α=^β't0+^β't1(1-1)=^β't0.㊣Step? 5 計算yt=1, xt<α;^β't0+^β't1x+1, xt≥α.
本文使用的數(shù)據(jù)均來自于四川省成都市西南交通大學內部教學樓、宿舍樓實時采集的氣壓值數(shù)據(jù),數(shù)據(jù)采集的時間間隔為每秒1次.為驗證該方法,在西南交通大學犀浦校區(qū)3號教學樓以及鴻哲齋9棟,共進行50次實驗.本節(jié)展示在西南交通大學犀浦校區(qū)3號教學樓進行的部分實驗.
4.1 確定初始回歸參數(shù)隨機選擇n個樓層的大氣壓值數(shù)據(jù)進行采集,以擬合初始參數(shù),采集到的部分大氣壓數(shù)據(jù)如表1所示.
表1 初始數(shù)據(jù)
為了方便計算與分析,對采集到的大氣壓數(shù)值進行變換:x=x-90 000,對數(shù)據(jù)進行擬合,得到回歸方程
y1=-0.022 661x1+107.456 655.
4.2 模型顯著性檢驗對模型進行F檢驗和擬合優(yōu)度檢驗,得到結果如表2所示.
表2 模型的檢驗
4.3 參數(shù)迭代若參數(shù)迭代時間間隔較短,則計算量過大,不易于實際工程實施;若迭代時間間隔較長,則t時段模型無法準確識別t+1時段電梯??繕菍?經(jīng)實地實驗驗證,時間間隔為4min為在保證模型識別準確率的情況下的最大時間間隔.
表3 參數(shù)迭代過程
4.4 結果分析對第50個時段的數(shù)據(jù)進行分析,部分結果如表4所示.
表4 模型判別結果
圖2 樓層識別結果
圖3 樓層識別結果
圖4是不同監(jiān)督模型對樓層識別的準確率對比圖.在圖4中可以發(fā)現(xiàn)在短時間40min內,線性回歸、多分類Logistic回歸和多分類SVM(support vector machines,支持向量機)[21-22]的識別準確率也達到了100%.但是由于監(jiān)督學習模型的特點,模型由訓練集數(shù)據(jù)訓練完畢,對目標識別判斷的規(guī)則不會進行改變,即無法感知外部環(huán)境的變化并做出相應的調整.這導致上述的模型進過一段時間后,識別準確率急速下降,最后完全無法對樓層進行正確的識別.
本文直接建立大氣壓與電梯??繕菍又g的關系,利用短時間內模型對樓層正確識別的能力,將短時間內無標簽的大氣壓值,識別出其對應的樓層,從而獲得帶標簽數(shù)據(jù).再利用最小二乘法思想,使用識別后的帶標簽數(shù)據(jù)對模型的參數(shù)進行自適應迭代調整,保證了模型長時間也可以進行正確的目標識別.
在實驗驗證中,通過基于參數(shù)自適應的回歸模型與線性回歸模型進行對照實驗,發(fā)現(xiàn)普通的線性回歸模型在20min左右開始出現(xiàn)錯誤,在30min時無法對目標進行準確的識別;而基于參數(shù)自適應的回歸模型可以長時間對目標進行準確識別,識別的正確率為100%.特別地,在測試時間增加的情況下,普通的回歸模型會出現(xiàn)無規(guī)律錯誤,無法通過數(shù)值的增減簡單改進.當晝夜溫差較大時,普通的監(jiān)督學習模型由于沒有對外部環(huán)境的感知能力,導致樓層識別出現(xiàn)錯誤.本模型的特性是根據(jù)外部環(huán)境進行參數(shù)自適應迭代,充分考慮外部環(huán)境變化產生的影響.雖然晝夜溫差較大,但是溫度短時間內不會急劇變化,依照模型假設條件,本模型可以有效地針對外部環(huán)境的變化,進行參數(shù)的自適應調整,保持識別的正確率.實驗結果表明,基于參數(shù)自適應的回歸模型具有較好的泛化能力,對溫度、濕度、樓梯間通風情況等因素不敏感,能夠較好地適用于工程項目.
當樓層高度不是一致時,可以使用分段式回歸模型,用同樣的方法考慮外部擾動造成的影響,針對更普適的情況進行樓層識別.
本文實驗的數(shù)據(jù)僅采集了大氣壓數(shù)據(jù),為一維數(shù)據(jù),在數(shù)據(jù)維數(shù)變高時,怎樣解決更一般的問題.本文的思想是通過t時刻的數(shù)據(jù)對t+1時刻的模型進行調整,運用這種思想是否可以應用到更一般的模型.對上述兩個方面進行深入研究可以作為下一步的研究計劃.