崔劍 巴合提努爾·巴贊
(1馬鋼(集團(tuán))控股有限公司能源環(huán)保部安徽馬鞍山243002安徽工業(yè)大學(xué)能源與環(huán)境學(xué)院安徽馬鞍山24300)
Smooth函數(shù)平滑處理馬鋼SO2排放數(shù)據(jù)方法與應(yīng)用
崔劍1巴合提努爾·巴贊2
(1馬鋼(集團(tuán))控股有限公司能源環(huán)保部安徽馬鞍山243002安徽工業(yè)大學(xué)能源與環(huán)境學(xué)院安徽馬鞍山24300)
為了解決生產(chǎn)現(xiàn)場數(shù)據(jù)波動(dòng)大、數(shù)據(jù)處理困難,統(tǒng)計(jì)結(jié)果失真等問題,本文提出利用Smooth函數(shù)對(duì)數(shù)據(jù)樣本進(jìn)行預(yù)處理。針對(duì)馬鋼SO2排放數(shù)據(jù),通過對(duì)比研究不同方法的誤差,確定5點(diǎn)滑動(dòng)平均法效果最佳。
Smooth函數(shù);預(yù)處理;5點(diǎn)滑動(dòng)平均法
在進(jìn)行生產(chǎn)數(shù)據(jù)統(tǒng)計(jì)和模型計(jì)算分析時(shí),受生產(chǎn)過程、儀器儀表、人員操作等因素的影響,現(xiàn)場數(shù)據(jù)往往會(huì)出現(xiàn)異常波動(dòng),這些異常值進(jìn)入統(tǒng)計(jì)分析系統(tǒng)后,往往對(duì)計(jì)算結(jié)果產(chǎn)生重大偏差,造成結(jié)果失真,模型失效。
為了恢復(fù)現(xiàn)場采集數(shù)據(jù)的客觀真實(shí)性,同時(shí)為了將來得到更好的統(tǒng)計(jì)分析結(jié)果,有必要對(duì)現(xiàn)場采集的原始數(shù)據(jù)進(jìn)行響應(yīng)的預(yù)處理以剔除異常值[1]。另外,無論是人工觀測的現(xiàn)場數(shù)據(jù)又或者是由數(shù)據(jù)采集設(shè)備系統(tǒng)獲取的數(shù)據(jù),都不可避免疊加上“噪聲”干擾(反映在曲線圖上是一些明顯的“毛刺和尖峰”)[2]。而這些情況導(dǎo)致的最后模型計(jì)算結(jié)果較工序?qū)嶋H值的波動(dòng)較大,最大波動(dòng)值甚至達(dá)到60%。為提高模型精度與科學(xué)性,有必要對(duì)現(xiàn)場采集的數(shù)據(jù)進(jìn)行平滑預(yù)處理。
MATLAB軟件中有一個(gè)專門進(jìn)行數(shù)據(jù)平滑處理的smooth函數(shù),可以用于初步實(shí)現(xiàn)數(shù)據(jù)的平滑過程。在編程過程中,MATLAB軟件中的smooth函數(shù)主要有以下幾種常用的調(diào)用格式,如表1所示,smooth函數(shù)調(diào)用方法。
表1 MATLAB軟件中smooth函數(shù)的調(diào)用方法
其中,Smooth函數(shù)的指定方法中METHOD的方法共有6種類型[3],詳見表2。
表2 Smooth函數(shù)指定方法中METHOD的方法類型
MATLAB軟件中Smooth函數(shù)實(shí)現(xiàn)數(shù)據(jù)平滑過程的實(shí)質(zhì)是采用選定的平滑因子對(duì)數(shù)據(jù)曲線進(jìn)行濾波,選定的平滑因子的頻譜特性直接影響其平滑處理效果,選定的平滑因子相當(dāng)于一個(gè)低通濾波器[4],如果數(shù)據(jù)曲線不光滑,說明采集信號(hào)中高頻成分相應(yīng)比較豐富,信號(hào)中的高頻成分經(jīng)過平滑因子低通濾波后得到有效的過濾或者抑制,曲線就變得比較平滑。可以說,Smooth函數(shù)中信號(hào)的平滑處理過程,其實(shí)質(zhì)就是低通濾波處理所采集的信號(hào)的過程。
圖1為馬鋼三鐵廠燒結(jié)脫硫裝置在線數(shù)據(jù)和模型計(jì)算數(shù)據(jù)的對(duì)比圖。由圖可知,模型計(jì)算數(shù)據(jù)雖然能較好的反應(yīng)實(shí)際數(shù)據(jù)的整體趨勢,但是在個(gè)別點(diǎn)存在誤差較大的問題。需要對(duì)數(shù)據(jù)進(jìn)行平滑處理,去除數(shù)據(jù)壞點(diǎn)。
圖1 在線數(shù)據(jù)和模型計(jì)算數(shù)據(jù)對(duì)比圖
由于圖1表示形式不明顯,為了更加直觀的觀察誤差的變化,將誤差轉(zhuǎn)換成折線圖的形式,圖2為馬鋼三鐵廠燒結(jié)脫硫裝置在線數(shù)據(jù)和模型計(jì)算數(shù)據(jù)的相對(duì)誤差對(duì)比圖。從圖中可以看出,整體誤差范圍在40%左右,但是個(gè)別數(shù)據(jù)的誤差會(huì)急劇上升,最大誤差能到80%。這可能是由于生產(chǎn)工序不穩(wěn)定和檢測設(shè)備異常引起的。誤差波動(dòng)較大。由于誤差波動(dòng)造成模型的預(yù)測結(jié)果失真,不能有效指導(dǎo)脫硫工段的配料和操作。因此需要對(duì)此誤差進(jìn)行平滑處理。
圖2 誤差對(duì)比圖
利用MATLAB軟件中的Smooth函數(shù)對(duì)馬鋼數(shù)據(jù)庫中提取的原始數(shù)據(jù)進(jìn)行平滑處理,其結(jié)果如圖3所示。通過比較lowess、loess、5點(diǎn)滑動(dòng)平均法等6種方法的平滑效果可以看出,5點(diǎn)滑動(dòng)平均法對(duì)原始數(shù)據(jù)處理效果最好,對(duì)初始信號(hào)高頻干擾成分可以實(shí)現(xiàn)有效過濾,對(duì)初始數(shù)據(jù)的特征信號(hào)可以實(shí)現(xiàn)準(zhǔn)確提取。而對(duì)于lowess、rlowess、loess和sgolay等方法在指定同樣的窗寬值時(shí),其數(shù)據(jù)平滑處理效果一般,處理后的曲線中依舊存在較大程度的“噪聲干擾”現(xiàn)象。
圖3 數(shù)據(jù)的平滑處理結(jié)果
圖4 誤差五點(diǎn)法處理對(duì)比圖
從圖4誤差五點(diǎn)法處理對(duì)比圖分析結(jié)果看,通過5點(diǎn)滑動(dòng)平均法預(yù)處理后,減少了生產(chǎn)數(shù)據(jù)波動(dòng)對(duì)模型參數(shù)的影響,提高了預(yù)測結(jié)果的正確率,平均誤差降低到了5%以下,滿足了計(jì)算精度要求。
(1)Smooth函數(shù)具有平滑數(shù)據(jù)和濾除雜波的作用,對(duì)于生產(chǎn)數(shù)據(jù)波動(dòng)較大的數(shù)據(jù)進(jìn)行處理,可以有效提高模型的準(zhǔn)確率;
(2)通過對(duì)Smooth函數(shù)中的缺省參數(shù)(5點(diǎn)滑動(dòng)平均法)、lowess、rlowess、loess、和sgolay等幾種方法的平滑效果對(duì)比可以看出,5點(diǎn)滑動(dòng)平均法對(duì)于馬鋼SO2排放模型系統(tǒng)的數(shù)據(jù)處理效果最好,對(duì)初始信號(hào)高頻干擾成分的實(shí)現(xiàn)了有效過濾,模型的精確度得到了有效提升。
[1]鄒鯤,袁俊泉.MATLAB6.X信號(hào)處理[M].北京:清華大學(xué)出版社,2002
[2]趙紅怡,張常年.數(shù)字信號(hào)處理及其MATLAB實(shí)現(xiàn)[M].北京:化學(xué)工業(yè)出版社,2002
[3]張倩茹,殷奎喜,趙華,等.BPSK信號(hào)的平滑化方法及其比較[J].信息化研究,2010,36(1):12-15.
[4]劉哲,宋文愛,王俊峰.基于虛擬的信號(hào)預(yù)處理方法的研究[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2006,(2):234-235.作者簡介
崔劍(1971—),男,安徽省馬鞍山市人,大學(xué)本科,研究方向:環(huán)境保護(hù)。
Application and Method of Disposing Data of Smooth Function
Smooth function is used to pre-disposing data sample for solving the problem of fluctuation in production and data treating and result distortion.On the background of MaSteel of emission data of SO2,method of five point moving average is proved optimum by comparative error.
Smooth function;pre-disposing; method of five point moving average