李育發(fā)+閆慶慶
摘 要:由于CEMS系統(tǒng)工作在惡劣的環(huán)境下,監(jiān)測到的煙塵煙氣數(shù)據(jù)會受到影響,由人工定位系統(tǒng)問題的話會耗費大量的時間和精力。為了方便系統(tǒng)問題的定位,通過對燃煤電廠的大數(shù)據(jù)進行挖掘,采用基于離群點的檢測算法,甄別出數(shù)據(jù)中的異常點,發(fā)現(xiàn)可能存在的問題。
關鍵詞:CEMS系統(tǒng);離群點檢測;KNN;LOF;INFLO
中圖分類號:TM621.7 文獻標識碼:A 文章編號:1671-2064(2017)21-0153-03
隨著當前的生態(tài)環(huán)境不斷惡化,尤其是PM2.5日益嚴重,我國對燃煤電廠的排放物有了更加嚴格的要求,燃煤電廠向大氣排放的氣態(tài)(煙氣)污染物(二氧化硫、氮氧化物、一氧化碳等)和固體污染物(煙塵)需要控制在一定的范圍內(nèi)。CEMS固定污染物源排放連續(xù)監(jiān)測系統(tǒng)(Continuous Emissions Monitoring System)用于長期且連續(xù)監(jiān)測固定污染物源排放的煙氣和煙塵,反映煙塵在某一段時間內(nèi)的排放狀況。然而CEMS是一種工作在多塵、高濕、腐蝕性且流場不穩(wěn)定環(huán)境中的系統(tǒng),環(huán)境的惡劣、精密儀器的損壞都會造成系統(tǒng)采集污染物濃度數(shù)據(jù)的不準確性。良好的數(shù)據(jù)源能夠為電網(wǎng)對電廠污染物排放、脫硫脫硝設備運行監(jiān)視提供數(shù)據(jù)指導,為電網(wǎng)節(jié)能發(fā)電調(diào)度與脫硫脫硝電量考核提供決策支持。因而,需要使用離群點檢測的方法將異常數(shù)據(jù)點甄別出來,發(fā)現(xiàn)CEMS系統(tǒng)中的問題設備。
1 CEMS系統(tǒng)
1.1 系統(tǒng)簡介
CEMS系統(tǒng)是一種大型的在線分析成套系統(tǒng),大型燃煤電廠的鍋爐基本都安裝了煙氣脫硫裝置,在鍋爐的出口煙道上(即脫硫裝置的進口),CEMS通常監(jiān)測SO2、O2、煙塵、壓力、溫度五個參數(shù),而在脫硫裝置后的出口煙道上(即煙囪入口),CEMS通常監(jiān)測SO2、NOX、CO、O2、煙塵、流量、濕度、壓力、溫度九個參數(shù)。通過數(shù)據(jù)采集與控制系統(tǒng)匯總實時數(shù)據(jù),分析故障、自我校準、超時報警,實現(xiàn)系統(tǒng)的自診斷。
CEMS是燃煤電廠煙氣脫硫系統(tǒng)中不可或缺的一部分,是煙氣脫硫系統(tǒng)良好工作的保障。
1.2 系統(tǒng)工作流程
由采樣探頭在煙道上連續(xù)抽取煙氣,初步過濾后經(jīng)加熱管線加熱至150℃保溫傳送。之后進入煙氣預處理裝置進行過濾、干燥和冷凝,將冷凝后煙氣中的腐蝕性廢液進行收集排放,而干燥后的潔凈煙氣進入CEMS氣體分析儀進行各氣體濃度參數(shù)的測量。同時,通過CEMS配置的PLC和工業(yè)控制計算機,對煙氣采樣探頭每天定時用壓縮空氣進行反吹掃,對煙氣的加熱、伴熱和冷凝裝置進行溫度控制,對煙氣預處理系統(tǒng)電磁閥進行邏輯控制,以及對煙氣成分分析儀的各個測量通道進行準確度標定。
2 影響CEMS數(shù)據(jù)不準確的可能因素
2.1 CEMS安裝位置過短
煙氣連續(xù)監(jiān)測技術規(guī)范指出,安裝CEMS系統(tǒng)需要預留充足的空間,在實際的部署過程中,大多數(shù)電廠的直管煙道偏短,使得煙塵、流量的探頭無法安裝在合適的地方,這樣也就影響了采集和計量煙氣的數(shù)據(jù)的準確性。煙道太短,對氣態(tài)污染物無多大影響,即對二氧化硫、氮氧化合物的測量一般不會產(chǎn)生影響,但對在不同位置測量到的煙塵和流量數(shù)據(jù)會造成較大的影響,主要原因是煙道中的顆粒物分布不均勻,導致監(jiān)測點不具有代表性,獲得的數(shù)據(jù)不能反映真實的情況。
2.2 煙囪入口處煙塵監(jiān)測探頭被污染
將煙氣通過預處理裝置進行洗滌后,雖然使用除霧器除去了霧滴,但入口處的煙氣依然含有一定量的水分,二氧化硫、硫酸鹽等物質(zhì)溶于水中,這樣的煙氣流經(jīng)CEMS探頭時,煙氣中的水分可能形成液滴,對激光會產(chǎn)生折射和吸收,因此會影響測量結(jié)果。
目前,普遍存在燃煤發(fā)電廠中的CEMS監(jiān)測儀表探頭被污染的現(xiàn)象,污染源為煙氣中所含的水分,在低溫條件下,水分會凝結(jié)成水珠,水珠中含有少量的二氧化硫和硫酸鹽等物質(zhì),這些物質(zhì)在進入煙囪,通過探頭時,便會附著在探頭表面的過濾網(wǎng)上,物質(zhì)過多時還會完全堵住過濾網(wǎng),影響系統(tǒng)對煙氣中氣態(tài)污染物的監(jiān)測準確性。
2.3 采樣管路泄漏或分析儀表維護不合理
在監(jiān)測檢測中,有很多異常情況會影響儀表準確監(jiān)測數(shù)據(jù),比如管路泄露和后期維護的不合理。但是這些異常情況一般都可以從儀表的監(jiān)測數(shù)據(jù)中分析出來,當發(fā)現(xiàn)監(jiān)測地的儀表數(shù)據(jù)異常時,比如氧氣的測量值過高,二氧化硫的測量值過低,就能夠說明監(jiān)測的的管路泄露,需要及時進行處理。
儀表在安裝完成后仍需要進行定時檢修,對儀表進行科學的維護可以有效保證儀表監(jiān)測數(shù)據(jù)的準確性,定時檢修和監(jiān)測條件的選擇可以改變儀表在監(jiān)測數(shù)據(jù)是的精度。因此,為了確保監(jiān)測數(shù)據(jù)的精準,安裝監(jiān)測儀表前,要根據(jù)儀表的使用場景來規(guī)劃好維護方案,做到科學維護。
2.4 伴熱管線缺少報警
管道排除的煙氣含有大量水分,在遇到溫度較低環(huán)境時會放熱液化為水滴,當水滴附著在儀表上時,會使監(jiān)測結(jié)果產(chǎn)生誤差。為了解決這個問題,用伴熱管來維持煙體溫度,這樣就會使煙體保持氣體形態(tài),直到煙氣經(jīng)過分析儀分析完成。如果在排送煙氣的環(huán)節(jié)中,伴熱管線存在故障,煙氣就會凝成水滴附著在儀表上,會腐蝕儀表。在沒有相關報警裝置時,工作人員就無法及時發(fā)現(xiàn)異常,隨著時間的推移,儀表腐蝕家中,嚴重影響檢測儀表的準確度。
要使伴熱管線在監(jiān)測時發(fā)揮效果,就需要對伴熱管線持續(xù)加溫,因此要合理調(diào)控伴熱管線的加熱溫度,如果設置不當,會導致伴熱管線溫度不合適,不足以防止煙氣凝結(jié)成水滴;還可能導致繼電器的損壞,因此因此,合理的溫度控制邏輯可以直接影響到CEMS儀表的精度。
3 使用離群點檢測的方法對異常點進行甄別
所謂離群點,就是那些與眾不同的遠離常規(guī)數(shù)據(jù)對象的數(shù)據(jù)。由于離群點并不總是孤立出現(xiàn),很可能以小群體的形式出現(xiàn),即離群簇出現(xiàn)。在各類型檢測算法中,基于聚類的離群點檢測算法將不屬于任何聚類的點定義為離群點,對于離群檢測有較好的效果。endprint
3.1 使用KNN進行甄別
3.1.1 KNN
KNN是通過測量不同特征值之間的距離進行分類。它的思路是:如果一個樣本在特征空間中的K個最相似(即特征空間最鄰近)的樣本中的大多數(shù)屬于某一個類別,那么該樣本也屬于這個類別。K通常是不大于20的整數(shù)。KNN算法中,所選擇的鄰居都是已經(jīng)正確分類的對象。該方法在定類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。
3.1.2 實驗過程和結(jié)果
首先,將從燃煤電廠CEMS系統(tǒng)中獲取到的數(shù)據(jù)的前90%作為訓練集,后10%作為測試集。通過集成在Rapid Miner數(shù)據(jù)挖掘工具中的Est Anomaly Detection插件,計算測試集中每條數(shù)據(jù)的outlier值,并從中獲取前1000個最大outlier值的數(shù)據(jù)。每次抽取前100、200……1000條數(shù)據(jù),判斷其中確實為異常值的個數(shù),并繪制出如下的樣本檢測率曲線。從圖1中可以看出,隨著抽取數(shù)據(jù)條數(shù)的增加,異常點的檢測率逐漸提高。使用KNN算法求得的異常點檢測率在一定程度上達到了預期的效果,可以將絕大多數(shù)的異常點甄別出來,但也不排除誤報的情況。
3.2 使用LOF進行甄別
3.2.1 LOF
LOF算法即局部離群因子算法,該算法首先會計算每個對象與其他對象之間的歐幾里得距離,對歐幾里得距離進行排序后,計算每個對象的第k距離(距離該對象第k遠的對象的距離)以及第k鄰域(該對象第k距離以內(nèi)的點的集合)。而后計算每個對象的可達密度(該對象的第k鄰域內(nèi)的點到該對象的平均可達距離的倒數(shù))。最后計算局部離群因子(該對象的鄰域點的局部可達密度與該對象的局部可達密度比值的平均數(shù))。如果點p的局部離群因子趨近于1,說明p的鄰域點密度差不多,p可能與鄰域同屬一簇。如果局部離群因子越小于1,說明p的密度高于其鄰域點密度,p為密集點;如果局部離群因子越大于1,說明p的密度小于其鄰域點密度,p越可能是異常點。
3.2.2 實驗過程和結(jié)果
采用與在KNN算法中相同的數(shù)據(jù)源,通過集成在Rapid Miner數(shù)據(jù)挖掘工具中的Est Anomaly Detection插件,選擇LOF分析,計算測試集中每條數(shù)據(jù)的outlier值,并從中獲取到前1000個最大的outlier值的數(shù)據(jù)。每次抽取前100、200……1000條數(shù)據(jù),判斷其中確實為異常值的個數(shù),并繪制出如下的樣本檢測率曲線。從圖2中可以看出,隨著抽取數(shù)據(jù)條數(shù)的增加,異常點的檢測率呈現(xiàn)上升的趨勢,在選取不同k值的情況下,檢測率最多也只能達到75%。
3.3 使用INFLO進行甄別
3.3.1 INFLO
在計算數(shù)據(jù)點的離群因子時,INFLO會考察它的最近k鄰居,同時也會考察它的逆k鄰居。所謂逆k鄰居,即那些最近k鄰居包含該點的數(shù)據(jù)點。而數(shù)據(jù)點的鄰居和逆鄰居,構(gòu)成了該數(shù)據(jù)點的影響空間。INFLO值為對象的影響空間中的所有點的局部密度的均值/對象的局部密度。如果INFLO的值趨近于1。則說明該數(shù)據(jù)點就可能是一個正常的點,如果值比較高,那么該點是異常點的概率極大。
3.3.2 實驗過程和結(jié)果
采用與在KNN算法中相同的數(shù)據(jù)源,通過集成在Rapid Miner數(shù)據(jù)挖掘工具中的Est Anomaly Detection插件,選擇INFLO分析,計算測試集中每條數(shù)據(jù)的outlier值。繪圖規(guī)則與3.2.2中規(guī)則相同。從圖3中可以看出,隨著抽取數(shù)據(jù)條數(shù)的增加,異常點的檢測率一直在提升,而且相比于等量樣本數(shù)的LOF算法的檢測率,INFLO的檢測率都比LOF的高。在多次嘗試不同k值,達到最優(yōu)效果的檢測率也優(yōu)于等量樣本數(shù)的KNN算法。
4 結(jié)語
通過分析影響CEMS系統(tǒng)中能夠產(chǎn)生數(shù)據(jù)異常的原因,并提供三種不同的離群檢測算法,對可能包含異常點的數(shù)據(jù)集進行甄別,三種算法均可以達到基本檢測出異常點的目的。但從效果來看,INFLO算法的效果最優(yōu)。
參考文獻
[1]劉書志.基于密度的局部離群數(shù)據(jù)挖掘方法的研究和改進[D].重慶大學,2014.
[2]壽立新.臺州電廠煙氣脫硫CEMS異常分析與處理[J].浙江電力,2009,28(b07):58-59.
[3]張峻.CEMS測量準確率偏低的原因分析及解決措施[C].2011年電力環(huán)保學術年會論文集,2011.
[4]閆偉,張浩,陸劍鋒,袁磊.聚類分析理論研究及在流程企業(yè)中的應用[J].計算機工程,2006,32(17):19-21+27.endprint