郗 濤,徐偉雄,高宗帥,王莉靜
(1.天津工業(yè)大學機械工程學院,天津300387;2.天津城建大學控制與機械工程學院,天津300384)
施工升降機是建筑工程中必不可少的施工設備,在超高層建筑的使用過程中供電電壓一般為有級調節(jié),即在低高層時使用的是380 V,在超高層時隨能耗的增加使用690 V,但實際需要的輸入電壓遠低于供電電壓,造成了嚴重的電能浪費問題。針對以上問題,國內有人在控制方法方面做了研究。其中,文獻[1]利用比例-積分(PI)自調整與模糊邏輯補償的復合控制方法對控制系統(tǒng)進行改進,但PI自調整與模糊邏輯控制方法多適用于液位、壓力、流量等控制系統(tǒng),對電壓的控制效果較差;文獻[2]采用BP神經網絡PID控制方法使電梯的運行更加穩(wěn)定,系統(tǒng)動態(tài)性能有所提高,但BP神經網絡算法的收斂速度慢且存在過擬合的問題,對于多因素影響的電壓預測準確性較低;文獻[3]采用模糊BP神經網絡的電梯群控系統(tǒng)改善了運行效能,模糊控制改善了BP神經網絡控制的準確性,但算法本身的特性限制了控制準確性的提高;文獻[4]計算出能量目標函數,使用蟻群算法建立蟻群模型,并驗證了算法在減少能耗方面是有效的,但蟻群算法的收斂速度較慢,對于電壓的快速控制效果較差。雖然以上研究對電壓控制進行了改進,但考慮的因素較少,算法的優(yōu)良性較弱,沒有從根本上改善問題,還有優(yōu)化空間。
針對影響輸入電壓的多因素問題,本研究基于物聯網平臺采集的歷史數據,考慮環(huán)境因素和能量傳遞中的多因素數據,提出一種基于數據挖掘的RF-GASVM輸入電壓的控制方法。利用隨機森林算法(RF)計算各個因素的重要度,并根據計算結果進行因素選擇,再將選取后的樣本約簡集合進行歸一化處理,通過遺傳算法(GA)對支持向量機(SVM)的參數進行優(yōu)化,采用優(yōu)化后的SVM算法進行回歸計算,得到預測輸入電壓,并對預測和原始輸入電壓進行回歸評價,分析該輸入電壓控制模型的準確性。
施工升降機多是露天使用,且使用時各地環(huán)境差別很大,因此,環(huán)境因素將對運行產生很大影響。其中,溫度、風速、空氣密度和瞬時風向是主要影響因素。風速、空氣密度和瞬時風向將產生空氣阻力,影響相對運動速度,空氣阻力公式為:
式中:C為空氣阻力系數;ρ為空氣密度;S為物體迎風面積;V為物體與空氣的相對運動速度。在考慮空氣阻力時,施工升降機安裝時的傾斜角會影響空氣阻力的方向,所以安裝傾斜角也是影響因素之一。
環(huán)境溫度升高將使電機內部損耗增大,導致效率降低,影響電機的輸出功率[5],在額定負載時,環(huán)境溫度差(t2-t1)與電機溫升差Δθ之間的簡化關系為:
式中:θ為電機溫升;K為等效的發(fā)熱損耗系數。
施工升降機的結構如圖1所示。能量傳遞過程為供電電壓經過滑觸線傳遞到控制箱,控制箱通過變頻器變電壓和頻率后輸出到三相異步電機,電機再將轉速和轉矩傳遞給減速器,經過減速器降速度,提轉矩,驅動齒輪齒條使吊籠運動。
圖1 施工升降機的結構Fig.1 Structure of construction elevator
滑觸線隨著運行高度變化以及電流的變化將產生壓降,滑觸線壓降公式為:
式中:I為負荷電流;Z為阻抗;L為滑觸線長度;電阻R為電抗;cosφ為功率因數。
三相異步電機的溫升產生的溫度場對電機內部損耗有影響[6],轉速和轉矩對吊籠穩(wěn)定運行有影響,轉速公式為:
式中:f為供電頻率;s為轉差率;p為電機的級對數。
轉矩表達式為:
式中:m1為電機相數;np為極數;U1為額定電壓;R1為相電阻;R'2為轉子電阻;X1σ為漏抗;X'2σ為漏電抗;n1為同步轉速。
減速器中的傳動比、油壓和溫度對齒輪傳遞效率有重要作用[7-9]。
綜上所述,在考慮影響因素時,應將環(huán)境因素和能量傳遞過程中的影響因素都考慮在內,做出因素決策表,如表1所示,通過物聯網平臺對各個因素進行數據的采集,作為算法分析的初始數據。
表1 因素決策表Tab.1 Factor decision table
由于輸入電壓受多因素影響,在進行回歸分析時容易造成維數災難、準確度下降、時間增加等問題,所以應該對多因素屬性進行分類和因素選擇。常用的分類選擇算法有隨機森林算法、樸素貝葉斯網絡和鑒別分析分類器等。由于隨機森林算法具有分類精度高、訓練速度快、抗過擬合能力強、可處理高維度數據等優(yōu)點,并且在訓練完成后,能夠檢測屬性間的影響及計算屬性的重要性,所以本文選擇隨機森林算法。
隨機森林算法是由Breiman L等[10-14]提出的,利用裝袋(Bagging)算法優(yōu)化的決策樹模型,提升決策樹的泛化能力。其利用自舉法(bootstrap)和隨機抽樣法產生訓練集和特征集,并構建決策樹模型,通過投票方法計算出分類結果。
訓練樣本的生成是通過從訓練集中隨機且有放回地重復抽取K次,組成隨機森林為f={h1,h2,…,hk}。從所有特征中隨機抽m個特征子集構建決策樹,并使用CART(分類與回歸樹)算法進行計算,其使用基尼指數(Gini,用G表示)挑選特征。設隨機樣本集D中第i類別樣本占比為pi(i=1,2,…,m),且1,m表示類別總數,則D的基尼系數為:
假如某屬性a將樣本集D二元劃分為D1、D2,則屬性a的基尼系數為:
袋外數據(out-of-bag,OOB)指在生成訓練集時,約有37%不會被抽到的樣本。利用OOB對某個特征的重要性進行分析[15-17],設OOB數據集在第s棵樹上的準確率為As,對任意變量U進行重要性分析,詳細步驟為:
(1)重新隨機排列訓練集中變量U的值,得出新訓練集NU,再次投入隨機森林中,在決策樹hs中OOB的分類準確率為AUs,s=1,2,…k;
(2)計算OOB在排列前后的分類準確率之差:
(3)變量U的重要性得分:
本文通過隨機森林算法對多因素進行選擇后,再進行回歸預測。支持向量機算法是最常用的回歸方法,但傳統(tǒng)參數確定方法還需要進行優(yōu)化。本研究采用精度高、準確率好的遺傳算法對參數進行優(yōu)化。
支持向量機(SVM)通過求解最優(yōu)分類超平面來確保劃分樣本的正確性,并使樣本與超平面的誤差最小,其計算常需要引入不敏感損失函數和核函數。本研究使用的支持向量機算法具體步驟[18-19]為:
(1)設已知訓練集
式中:xi∈X=Rn,xi為特征向量;yi=Y[1,-1](i=1,2,…,l)。
(2)恰當選擇核函數K(x,x')和懲罰因子C,構造和計算最優(yōu)化問題
近年來,隨著高校信息化水平逐步提高,智慧校園建設已成為高校建設發(fā)展的重要內容,面向學校校務管理及服務的各類信息系統(tǒng)逐漸建立并應用起來,這些獨立的MIS系統(tǒng)在一定程度上解決了學校行政管理與服務方面的問題[3]。但隨著業(yè)務數據的積累和各業(yè)務的不斷變化,圍繞學校主要業(yè)務(包括人事、科研、財務、學工、教務等)建設信息系統(tǒng)的高校信息化模式存在以下問題。
計算出最優(yōu)解a*=(a1*,…,al*),式中:x為空間中的點;g為徑向基半徑。
(3)選擇a*的一個正分量0 (4)構造決策函數 因為SVM回歸的準確率和精度取決于懲罰因子C和徑向基半徑g的值,傳統(tǒng)支持向量機是通過經驗來尋找最優(yōu)參數值的,準確度較低,本文利用遺傳算法對傳統(tǒng)支持向量機進行參數優(yōu)化。 遺傳算法(GA)主要用來尋找最優(yōu)解,過程模擬了生物進化。計算的過程需要首先使用到計算機的編碼方法,確定適應度函數;其次個體染色體通過隨機生成初始種群,并計算個體的適應度值,根據生物進化原則,挑選出適應度好的個體;最后經過遺傳算子選擇出最優(yōu)參數。利用GA優(yōu)化SVM的參數C和g,基本步驟如圖2所示。通過這些步驟可以找到最優(yōu)的參數[20],通過參數優(yōu)化使支持向量機的精度提高,結果達到最優(yōu)。 圖2 GA優(yōu)化SVM參數的建模流程圖Fig.2 Modeling flow chart of GA optimizing SVMparameter 在回歸模型中,對預測的結果進行評價,常用RMSE、MAE、MAPE和R2這幾個評價指標。其中,RMSE、MAE主要是對預測的穩(wěn)定性進行評價,MAPE和R2是對預測的準確性進行評價。R2的數值越接近1,模型越準確;其它指標計算結果越小,回歸模型越穩(wěn)定、準確。 利用RF算法進行分類計算時,將12個因素變量作為輸入量,輸入電壓作為輸出量,參數設置為決策樹個數200,特征屬性用log2M+1計算,決策樹迭代過程如圖3所示,出袋錯誤量在決策樹數量為12后趨于恒定值,說明RF算法具有較強的泛化能力。 圖3 決策樹迭代過程Fig.3 Iteration process of decision tree 利用OOB數據對輸入量進行重要度計算,得到結果如圖4所示,由圖4可以得出各個因素的重要度值如表2所示。 圖4 輸入因素重要度分析Fig.4 Importance analysis of input factors 表2 重要度屬性表Tab.2 Importance attribute table 根據表2中的重要度值可以得出:傾斜角、齒輪箱油溫、瞬時風向、吊籠溫度等為負值即干擾因素;減速比、齒輪箱油壓由于數值較小可以忽略;因此,選取運行高度、減速器轉速、負載轉矩、實時風速、空氣密度和電機溫度這6個因素作為回歸預測的樣本數據。 用ROC曲線和AUC面積來評價分類的準確率,ROC曲線下方的面積即AUC面積,其面積越大,分類模型準確性越好。沒有經過因素選擇和經過因素選擇的數據,通過SVM訓練的ROC曲線對照如圖5所示。由圖5可以看出,經過因素選擇之后,分類的準確率提高,說明因素選擇是合理的。 圖5 ROC曲線Fig.5 ROC curve 通過RF算法計算重要度值并進行因素選擇后分類準確率升高,維數降低。因素選擇后的樣本約簡集合如表3所示,此集合作為GA-SVM回歸模型的樣本數據。 表3 因素選擇后的約簡集合Tab.3 Reduction set after factor selection 對數據進行歸一化處理,使用GA優(yōu)化SVM的參數C和g,GA算法的參數設置為最大進化代數為300,交叉概率為0.4,變異概率為0.01,最大種群數量為40,代溝為0.9,懲罰因子C的變化范圍為[0,100],徑向基半徑g的變化范圍為[0,100],計算得到適應度曲線如圖6所示。 圖6 適應度曲線Fig.6 Fitness curve 由圖6可以看出,終止迭代代數為150,進化代數在12代之后最佳適應度值達到穩(wěn)定并有小幅波動,且與平均適應度的間距較小,說明收斂速度快,適應度較好。運行得到的最優(yōu)參數C=3.565 3,g=0.040 3,并且適應度曲線的均方差MSE=0.001 518 1,說明參數計算的精確度較高。 SVM利用最優(yōu)的C和g參數進行回歸預測,結果如圖7和圖8所示,并對圖7、圖8中的數據進行回歸分析,計算得到的評價指標值如表4所示。由表4可知,RMSE、MAE、MAPE數據較小,說明本文回歸模型較準確;訓練樣本的R2為0.980 263,檢測樣本的R2為0.982 326,說明本文回歸模型的預測正確性和穩(wěn)定性很好。 表4 回歸評價指標表Tab.4 Index table of regression evaluation 圖7 訓練樣本的回歸預測Fig.7 Regression prediction of training samples 圖8 檢測樣本的回歸預測Fig.8 Regression prediction of test samples 針對施工升降機供電電壓有級調節(jié)帶來的能耗浪費問題,將RF算法與GA-SVM算法相結合,提出RF-GA-SVM算法輸入電壓控制模型: (1)通過RF算法選擇出運行高度、減速器轉速、負載轉矩、實時風速、空氣密度和電機溫度等6個重要度較高的因素,采用SVM得出ROC曲線和AUC面積,結果表明,因素選擇后分類的準確率提高。 (2)采用GA算法對SVM進行優(yōu)化,計算得出最優(yōu)參數C為3.565 3,g為0.040 34,MSE為0.001 518 1。使用優(yōu)化后的SVM對訓練數據和測試數據進行回歸預測,并對輸入電壓的預測值進行回歸評價,檢測樣本的RMSE為1.493,MAE為0.899,MAPE為0.291%,R2為0.982,說明采用RF-GA-SVM算法進行輸入電壓的預測是準確、穩(wěn)定的,將算法用于控制系統(tǒng)中可以有效控制輸入電壓。3.2 遺傳算法(GA)優(yōu)化支持向量機(SVM)
3.3 回歸模型的評價指標
4 實例分析
4.1 因素選擇
4.2 回歸預測
5 結論