趙鐵成,謝麗蓉?,范協(xié)誠(chéng),王智勇,鄧佑剛,李 朋,葉金鑫
(1.新疆大學(xué) 電氣工程學(xué)院,新疆 烏魯木齊 830017;2.新特能源股份有限公司,新疆 烏魯木齊 830011;3.新疆燚加華工業(yè)科技有限公司,新疆 烏魯木齊 830018)
多晶硅是光伏產(chǎn)業(yè)設(shè)備生產(chǎn)的主要原材料,其需求增長(zhǎng)迅速,年增長(zhǎng)率約為31.2%.多晶硅還原生產(chǎn)是生產(chǎn)多晶硅的關(guān)鍵過程,生產(chǎn)工藝總電耗的60%用于多晶硅還原生產(chǎn),約占綜合生產(chǎn)成本的30%[1].采取一定的措施來減少還原生產(chǎn)的能耗已經(jīng)成為各多晶硅企業(yè)關(guān)注的熱點(diǎn)問題.生產(chǎn)過程主要能耗是還原爐內(nèi)硅棒表面高溫所需的電耗,多晶硅的還原生產(chǎn)是一個(gè)隨機(jī)、動(dòng)態(tài)、復(fù)雜的過程.所需能耗時(shí)刻變化,在生產(chǎn)過程中很難確定下一時(shí)刻的能耗情況,這種復(fù)雜的生產(chǎn)過程給工藝人員的可控管理帶來了極大的困難[2].因此,對(duì)還原爐沉積生產(chǎn)過程的能耗展開了研究并對(duì)其生產(chǎn)過程中的下一時(shí)段的能耗進(jìn)行預(yù)測(cè),明確下一時(shí)段的能耗情況,以降低還原沉積過程能耗把控的不確定性,提高工藝人員對(duì)還原爐操作的可靠性、合理性.
關(guān)于多晶硅生產(chǎn)過程中還原爐能耗的研究目前大多從技術(shù)上提高工藝水平,改進(jìn)設(shè)備,并進(jìn)行模擬仿真.Nie等[3]采用數(shù)值模擬方法研究反應(yīng)堆焦耳加熱過程的熱能消耗分析,對(duì)降低多晶硅生產(chǎn)還原過程中的能耗具有重要的參考意義.沈琛[4]通過利用Aspen Plus過程仿真軟件對(duì)現(xiàn)有的再生氣體回收工藝和節(jié)能優(yōu)化過程進(jìn)行了模擬和能耗對(duì)比分析,從而降低了能耗.劉繼三等[5]提出“Aspen Plus模擬方案”,在傳統(tǒng)技術(shù)中優(yōu)化蒸汽消費(fèi)、水循環(huán)和能源消費(fèi),大大降低了能源消耗的成本.韓金豆等[6]利用三氯硅烷蒸餾和熱泵整流技術(shù)中的差分熱整合技術(shù)減少加熱和冷卻能耗約50%.楊金祥[7]、方文寶[8]、夏小霞[9]等探究了多晶硅還原爐中溫度對(duì)凝固速率、硅棒直流加熱模型和三氯氫硅氫還原過程的影響,對(duì)降低多晶硅生產(chǎn)還原過程中的能耗有一定指導(dǎo)意義.郭久俊[10]針對(duì)還原過程中能耗的復(fù)雜影響因素的問題,提出了一種基于LSTM-Adaboost遞歸神經(jīng)網(wǎng)絡(luò)多晶硅生產(chǎn)制造工藝的能耗預(yù)測(cè)模型,以實(shí)現(xiàn)能耗預(yù)測(cè).盡管在多晶硅生產(chǎn)制造過程中關(guān)于節(jié)能優(yōu)化的研究獲得了一些成果,但多晶硅生產(chǎn)過程的能耗預(yù)測(cè)研究仍相對(duì)較少、且預(yù)測(cè)精度低.
針對(duì)以上問題,本文提出了基于VMD與改進(jìn)麻雀算法優(yōu)化LSSVM的多晶硅生產(chǎn)能耗預(yù)測(cè)方法.從主成分分析算法(Principal Component Analysis,PCA)對(duì)多晶硅還原生產(chǎn)能耗影響因素降維入手,依次介紹了能耗序列的VMD序列分解方法、麻雀搜索算法原理及改進(jìn)后自適應(yīng)麻雀搜索算法(Adaptive Sparrow Search Algorithm,ASSA);自適應(yīng)麻雀搜索算法優(yōu)化LSSVM,尋找最優(yōu)懲罰系數(shù)與核函數(shù),提高其泛化能力.通過實(shí)驗(yàn)仿真分析得出所提組合預(yù)測(cè)模型可大大提高能耗預(yù)測(cè)的準(zhǔn)確性.
多晶硅還原生產(chǎn)能耗受多種因素影響,機(jī)理復(fù)雜、耦合性強(qiáng).若把所有參數(shù)直接輸入到預(yù)測(cè)模型中,會(huì)導(dǎo)致模型執(zhí)行效率低.因此,有必要消除多晶硅生產(chǎn)過程所有參數(shù)數(shù)據(jù)間多重共線性.本文采用主成分分析算法[11](PCA)對(duì)多晶硅還原生產(chǎn)能耗影響因素降維處理,PCA算法原理如下:
(1)構(gòu)成變量采樣的原始數(shù)據(jù)矩陣xn×p:
式中:n為樣本數(shù);p為樣本中指標(biāo)的數(shù)量.
(2)對(duì)矩陣xn×p標(biāo)準(zhǔn)正態(tài)分布化處理得到標(biāo)準(zhǔn)化矩陣R,且對(duì)其求解相關(guān)系數(shù)矩陣R.相關(guān)系數(shù)的計(jì)算公式如下:
式中:rij為xmi與xmj之間的相關(guān)系數(shù),且rij=rji.
(3)建立關(guān)系矩陣R,計(jì)算R的特征值及特征向量,由其特征值確定最小變量數(shù)量m.
式中:取η=0.85;既用m維的特征向量代表原始訓(xùn)練數(shù)據(jù)基本特征.
選取多晶硅公司實(shí)際生產(chǎn)數(shù)據(jù),包括H2(氫氣)流量、TCS(三氯氫硅)流量、尾氣溫度、尾氣壓力、混合氣溫度、相電流和相電壓等共24組數(shù)據(jù).通過主成分分析算法確定所需的最小變量數(shù)量,實(shí)現(xiàn)多晶硅還原生產(chǎn)能耗影響因素降維.利用公式(1)~(3),求出協(xié)方差矩陣的特征根及貢獻(xiàn)率,根據(jù)累計(jì)貢獻(xiàn)率提取主成分,計(jì)算結(jié)果如表1所示,各主成分分量的貢獻(xiàn)率如圖1所示.
表1 特征值及貢獻(xiàn)率
由表1可知,通過主成分分析計(jì)算結(jié)果得出結(jié)論:當(dāng)m=4時(shí),主成分累計(jì)貢獻(xiàn)率為85.14%,由公式(4)主成分累計(jì)貢獻(xiàn)率η≥85%,即W1~W4主成分可抓住數(shù)據(jù)主要信息.由圖1可知,各主成分分量的方差貢獻(xiàn)率快速下降,從W5開始方差貢獻(xiàn)率較低,對(duì)整個(gè)數(shù)據(jù)信息的影響很小,即W1~W4可有效包含原有生產(chǎn)數(shù)據(jù)的絕大部分信息,極大提升預(yù)測(cè)模型的執(zhí)行效率.
變分模態(tài)分解(Variational Mode Decomposition,VMD)是采用原始信號(hào)的非遞歸處理[12?13].利用交替方向乘子法更新模塊功能及其中心頻率,調(diào)整相應(yīng)的基頻帶[14],最大限度地減少帶寬估計(jì).具體構(gòu)造步驟如下:
(1)通過希爾伯特(Hilbert)變換計(jì)算每個(gè)模態(tài)函數(shù)uk(t)解析信號(hào),將中心頻率ωk的相應(yīng)指數(shù)項(xiàng)混疊,以獲得每個(gè)模態(tài)的頻譜.
式中:δ(t)是狄拉克函數(shù);?表示卷積運(yùn)算;表示中心頻率復(fù)平面向量描述.
(2)通過高斯平滑原理,對(duì)uk(t)信號(hào)帶寬解調(diào).
式中:{uk}={u1,u2,···,uk}為K個(gè)模態(tài)分量IMF;{ωk}={ω1,ω2,···,ωk}為各IMF的中心頻率.
(3)引入二次懲罰系數(shù)α和拉格朗日乘數(shù)λ,將約束性變分問題轉(zhuǎn)換為無約束變分問題.
(4)利用交替方向乘子法更新uk,ωk,λ并求取上述拉格朗日函數(shù)的鞍點(diǎn).
2.2.1 麻雀搜索算法
麻雀搜索算法[15](Sparrow Search Algorithm,SSA)是一種新型智能優(yōu)化算法,主要模擬麻雀群的覓食和防止被捕食過程,由發(fā)現(xiàn)者、跟隨者、預(yù)警者組成麻雀群覓食模型.在覓食過程中,發(fā)現(xiàn)最佳食物的個(gè)體為發(fā)現(xiàn)者,其余為追隨者,并選取一定比例的個(gè)體進(jìn)行預(yù)警.具體的搜索過程如下:
(1)發(fā)現(xiàn)者位置迭代更新數(shù)學(xué)表達(dá)式如下:
式中:t為迭代的數(shù)量,W為迭代次數(shù)最大閾值,為第t代的第i個(gè)麻雀的位置在第d維,α∈(0,1].預(yù)警值r∈[0,1],安全值β∈[0.5,1],q是服從正態(tài)分布的隨機(jī)數(shù),l是元素全部為1的矩陣.當(dāng)r<β時(shí),表明附近沒有捕食者,發(fā)現(xiàn)者進(jìn)行范圍性搜索.當(dāng)r≥β時(shí),表明發(fā)現(xiàn)捕食者并向種群發(fā)出警告,麻雀種群要立即飛往安全的地方覓食.
(2)追隨者位置迭代更新數(shù)學(xué)表達(dá)式如下:
(3)預(yù)警者意識(shí)到危險(xiǎn)時(shí),進(jìn)行反捕食行為,其數(shù)學(xué)表達(dá)式如下:
2.2.2 改進(jìn)麻雀搜索算法
麻雀搜索算法可用于不同領(lǐng)域解決優(yōu)化問題.麻雀在解空間中的位置是隨機(jī)分布的,當(dāng)前個(gè)體周圍沒有相鄰的麻雀時(shí),執(zhí)行隨機(jī)行走策略.這種模式在有限的迭代次數(shù)下減緩了收斂趨勢(shì),降低了收斂精度.本文提出適應(yīng)性學(xué)習(xí)解決該問題,改進(jìn)過程如下:
(1)麻雀的安全系數(shù)變化率:
式中:μ為極小常數(shù);為目標(biāo)函數(shù)值;為最佳適應(yīng)值.
(3)麻雀種群中發(fā)現(xiàn)者、追隨者、預(yù)警者的自適應(yīng)位置迭代更新:
發(fā)現(xiàn)者自適應(yīng)位置迭代更新:
追隨者自適應(yīng)位置迭代更新:
預(yù)警者自適應(yīng)位置迭代更新:
LSSVM是對(duì)SVM的改進(jìn)和擴(kuò)展,將低維空間中的線性不可分問題轉(zhuǎn)化到高維空間中去解決,避免了二次規(guī)劃問題[16?18],將最優(yōu)化問題的求解轉(zhuǎn)化為求解線性方程,降低算法的復(fù)雜度,同時(shí)提升收斂的精度[19?20].LSSVM的回歸過程如下:
(1)LSSVM的回歸模型:
式中:ω為特征空間中的權(quán)系數(shù)向量;?(x)為把x映射到高維特征空間的非線性映射函數(shù);b∈R為偏差.
(2)利用結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則[21],式(18)對(duì)應(yīng)的LSSVM優(yōu)化問題可以轉(zhuǎn)變成式(19),為解決帶約束問題,引入αi構(gòu)建Lagrange函數(shù):
式中:ei為誤差變量;ξ為懲罰系數(shù);αi為L(zhǎng)agrange乘法算子.
(3)通過KKT條件求解,并最終得到回歸函數(shù)[22]為:
式中:K(xi,xj)為核函數(shù);σ為核函數(shù)寬度.自適應(yīng)麻雀算法對(duì)LSSVM中的可調(diào)參數(shù)ξ和σ尋優(yōu).
自適應(yīng)麻雀算法優(yōu)化最小二乘支持向量機(jī)的流程如圖2所示,其具體運(yùn)行步驟如下所示:
步驟1:設(shè)置ASSA算法參數(shù):麻雀的種群規(guī)模為20、最大迭代次數(shù)為50、學(xué)習(xí)率控制參數(shù)為ρ.
式中:f(x)為目標(biāo)函數(shù);n為樣本數(shù);yi為真實(shí)觀測(cè)值;為預(yù)測(cè)值.
步驟3:根據(jù)公式(15)、(16)、(17)更新麻雀種群中發(fā)現(xiàn)者、追隨者、預(yù)警者的位置,根據(jù)公式(17)判斷麻雀是否進(jìn)行反捕食行為.
步驟4:更新個(gè)體最優(yōu)解Pbest和全局最優(yōu)解Gbest,檢查是否滿足尋優(yōu)停止條件的預(yù)設(shè)最大迭代次數(shù).若滿足則結(jié)束尋優(yōu),輸出ASSA尋找的全局最優(yōu)值.否則轉(zhuǎn)至步驟2繼續(xù)尋優(yōu).
步驟5:將ASSA尋找的最優(yōu)懲罰系數(shù)ξ和核函數(shù)寬度σ值賦值給LSSVM,建立最優(yōu)的LSSVM預(yù)測(cè)模型.
本文最大迭代次數(shù)設(shè)置為50次,為了提高實(shí)驗(yàn)結(jié)果的可靠性,算法獨(dú)立運(yùn)行30次,取30次的平均值作為最終展示結(jié)果,適應(yīng)度函數(shù)平均收斂曲線如圖3所示.
由圖3可知,ASSA算法平均在第20次迭代之后就找到了全局最優(yōu)值,并將最優(yōu)參數(shù)賦予LSSVM,構(gòu)成最優(yōu)的ASSA-LSSVM多晶硅還原生產(chǎn)能耗預(yù)測(cè)模型.
多晶硅還原生產(chǎn)能耗具有非線性、非平穩(wěn)性和隨機(jī)性的特點(diǎn),使得多晶硅還原生產(chǎn)能耗預(yù)測(cè)精度低.針對(duì)該問題,本文提出VMD-ASSA-LSSVM多晶硅還原生產(chǎn)能耗預(yù)測(cè)模型,如圖4所示.具體的多晶硅能耗預(yù)測(cè)過程如下:
步驟1:利用主成分分析方法(PCA)提取多晶硅還原生產(chǎn)過程的主要影響因素,實(shí)現(xiàn)降低影響因素?cái)?shù)據(jù)維數(shù),提升預(yù)測(cè)模型的執(zhí)行效率.
步驟2:利用變分模態(tài)分解(VMD)將多晶硅還原生產(chǎn)能耗序列分解,獲得K個(gè)不同尺度的本特征模態(tài)分量,為避免發(fā)生頻率混疊現(xiàn)象,采用觀察中心頻率方法確定模態(tài)分量的個(gè)數(shù).
步驟3:為解決麻雀搜索算法(SSA)當(dāng)個(gè)體周圍沒有相鄰的麻雀時(shí),在有限的迭代次數(shù)下減緩了收斂趨勢(shì)、降低了收斂精度,本文提出引入適應(yīng)性學(xué)習(xí)因子解決該問題.
步驟4:為提高模型在短尺度時(shí)序的預(yù)測(cè)能力,對(duì)各模態(tài)分別建立LSSVM預(yù)測(cè)模型.利用自適應(yīng)麻雀搜索算法(ASSA)對(duì)LSSVM中可調(diào)參數(shù)進(jìn)行尋優(yōu),極大提升模型的預(yù)測(cè)精度.
步驟5:將各模態(tài)預(yù)測(cè)模型的預(yù)測(cè)值相疊加作為最終預(yù)測(cè)結(jié)果,得到多晶硅生產(chǎn)過程能耗最終預(yù)測(cè)值.
數(shù)據(jù)來自某多晶硅公司GBAI-ICS系統(tǒng)平臺(tái)采集多晶硅還原生產(chǎn)的能耗數(shù)據(jù),實(shí)驗(yàn)選取多晶硅公司二分廠2018年9月1日到2018年10月20日的1 200組能耗數(shù)據(jù),其中前1 164組數(shù)據(jù)作為訓(xùn)練集,后36組數(shù)據(jù)作為測(cè)試集,樣本采樣間隔為1 h.多晶硅還原生產(chǎn)能耗樣本數(shù)據(jù)如圖5所示.由圖5可知,能耗數(shù)據(jù)具有非線性、非平穩(wěn)性和隨機(jī)性的特點(diǎn),為解決該問題,利用VMD對(duì)能耗數(shù)據(jù)分解處理.VMD需先選定模態(tài)個(gè)數(shù)K,模態(tài)分解的次數(shù)過少時(shí),信號(hào)中的一些重要信息被排除或者丟失.模態(tài)分解個(gè)數(shù)過多時(shí),相鄰模態(tài)分量的中心頻率彼此接近,導(dǎo)致頻率混疊.因此,采用觀察中心頻率方法[23?24]確定K的大小.
多晶硅還原生產(chǎn)能耗數(shù)據(jù)通過VMD分解可得K個(gè)IMF分量,其中心頻率呈低頻到高頻分布,選取分量的中心頻率取到最大值時(shí)的K值作為分解次數(shù).對(duì)K從小到大取值,檢驗(yàn)不同K值各模態(tài)對(duì)應(yīng)的中心頻率是否相近,判斷其是否過分解.K取不同值時(shí)的中心頻率如表2所示.
表2 K取不同值時(shí)的中心頻率
由表2可知,當(dāng)K=6時(shí),模態(tài)分量2的中心頻率為178,模態(tài)分量3的中心頻率為253,模態(tài)頻率相近,為避免頻率混疊,本文選取K值為5,采用VMD分解結(jié)果如圖6所示.
為驗(yàn)證本文提出預(yù)測(cè)模型的優(yōu)越性,以相同原始數(shù)據(jù)樣本為基礎(chǔ),分別選擇LSSVM、VMD-LSSVM、SSALSSVM、ASSA-LSSVM和VMD-ASSA-LSSVM預(yù)測(cè)模型進(jìn)行對(duì)比分析.五種模型預(yù)測(cè)結(jié)果對(duì)比如圖7所示、相對(duì)誤差如圖8所示,性能評(píng)價(jià)指標(biāo)如表3所示.
表3 誤差指標(biāo)對(duì)比
通過以上實(shí)驗(yàn)仿真結(jié)果可以得出:對(duì)比分析LSSVM模型與VMD-LSSVM模型,采用VMD將多晶硅能耗序列分解為不同特征的模態(tài),分別建模預(yù)測(cè)能有效改善預(yù)測(cè)精度.ASSA-LSSVM模型在SSA-LSSVM模型的基礎(chǔ)上,引入自適應(yīng)學(xué)習(xí)因子,解決SSA算法收斂速度慢、收斂精度下降的問題,提高了對(duì)LSSVM的優(yōu)化效果.VMDASSA-LSSVM模型比較好地解決了對(duì)于極端時(shí)刻的預(yù)測(cè)效果不佳的問題,預(yù)測(cè)效果更優(yōu),能夠更好地?cái)M合出能耗變化趨勢(shì).
為了增加仿真結(jié)果的可靠性,本文將10次仿真評(píng)價(jià)指標(biāo)數(shù)值的平均值作為預(yù)測(cè)模型的誤差評(píng)判結(jié)果,如表3所示.通過對(duì)比觀察,發(fā)現(xiàn)VMD-LSSVM模型相較LSSVM模型,誤差評(píng)價(jià)指標(biāo)MAPE降低了34.19%、MAE降低了25.40%、RMSE降低了24.46%;ASSALSSVM模型相較SSA-LSSVM模型,誤差評(píng)價(jià)指標(biāo)MA PE降低了15.72%、MAE降低了13.55%、RMSE降低了12.33%;VMD-ASSA-LSSVM模型相較ASSA-LSSV M模型,誤差評(píng)價(jià)指標(biāo)MAPE降低了21.52%、MAE降低了21.67%、RMSE降低了21.62%.實(shí)驗(yàn)結(jié)果表明:ASSA-LSSVM模型提升了LSSVM的泛化能力;VMDASSA-LSSVM模型預(yù)測(cè)精度最高.
為進(jìn)一步驗(yàn)證VMD-ASSA-LSSVM預(yù)測(cè)模型的預(yù)測(cè)精度,與VMD-PSO-LSSVM、VMD-BSO-LSSVM以及VMD-BAS-LSSVM等預(yù)測(cè)模型進(jìn)行仿真對(duì)比試驗(yàn).模型預(yù)測(cè)結(jié)果對(duì)比如圖9所示,預(yù)測(cè)誤差評(píng)價(jià)指標(biāo)對(duì)比如表4所示.
表4 誤差指標(biāo)對(duì)比
由圖9可知,相比其它對(duì)比預(yù)測(cè)模型,VMD-ASSA-LSSVM預(yù)測(cè)模型的預(yù)測(cè)值與能耗真實(shí)值的擬合程度最高、預(yù)測(cè)效果最好.即使在能耗的峰谷點(diǎn)附近,本文所提預(yù)測(cè)模型也能有較好的預(yù)測(cè)精度.
由表4可知,相比VMD-PSO-LSSVM、VMD-BSO-LSSVM、VMD-BAS-LSSVM預(yù)測(cè)模型,本文所提方法的誤差評(píng)價(jià)指標(biāo)MAPE分別降低了35.67%、27.45%和30.23%;MAE分別降低了31.04%、27.92%和28.73%;RMSE分別降低了29.42%、26.22%和28.07%,VMD-ASSA-LSSVM預(yù)測(cè)模型的各項(xiàng)預(yù)測(cè)誤差指標(biāo)值均最小.因此,本文所提預(yù)測(cè)模型預(yù)測(cè)性能優(yōu)于上述其它模型.
為了實(shí)現(xiàn)多晶硅生產(chǎn)過程能耗的管控,需要對(duì)多晶硅生產(chǎn)過程能耗進(jìn)行精準(zhǔn)、高效預(yù)測(cè),提出了一種基于VMD與改進(jìn)麻雀算法優(yōu)化LSSVM的多晶硅生產(chǎn)能耗預(yù)測(cè)方法,主要結(jié)論如下:
(1)考慮到多晶硅生產(chǎn)過程受復(fù)雜因素影響,通過主成分分析算法(PCA)對(duì)輸入多變量降維,客觀地反映多變量預(yù)測(cè)因子中所需的最小變量數(shù)量,在保證信息完整的前提下提高運(yùn)算速度.
(2)變分模態(tài)分解(VMD)可以更細(xì)致表征多晶硅生產(chǎn)過程能耗在不同頻率尺度上的變化特性,分解結(jié)果具有更好的規(guī)律性.LSSVM與SVM相比預(yù)測(cè)精度更高,預(yù)測(cè)速度更快,并且待優(yōu)化參數(shù)更少.同時(shí),自適應(yīng)麻雀搜索算法(ASSA)經(jīng)過引入自適應(yīng)學(xué)習(xí)因子,解決了原有算法收斂速度慢、收斂精度下降的問題.
(3)考慮VMD、LSSVM、ASSA各自優(yōu)點(diǎn),綜合設(shè)計(jì)了VMD-ASSA-LSSVM組合預(yù)測(cè)方法,通過選取的實(shí)驗(yàn)數(shù)據(jù),對(duì)模型進(jìn)行驗(yàn)證.實(shí)驗(yàn)結(jié)果表明,該模型可有效提高預(yù)測(cè)的精度.