劉彩利
(西安外事學院,陜西 西安 710077)
置身于互聯(lián)網大背景下,各領域都被貼上數字化的標簽,于電力行業(yè)而言亦是如此,正逐步朝著信息化的方向發(fā)展,現階段以監(jiān)控信息系統(tǒng)的應用最為廣泛,受惠于現代信息技術,可確保各類數據的完整性,實現對數據的有效存儲[1-2]。
Pawlak經研究后提出粗糙集理論,其基本應用對象為信息數據系統(tǒng),依托于粗糙集理論可實現高效化的數據分類,并確保信息分類能力的穩(wěn)定性,使其在較長一段時間內不發(fā)生改變[3]。相較于前人的研究理論而言,Pawlak所提出的理論能夠簡化問題解決思路,實際分析工作中無需得到除數據庫外的其他知識的支持,且具備與其余理論互補的條件。在長期發(fā)展之下,粗糙集理論已經得到廣泛應用,在臨床醫(yī)學等領域均見其身影。粗糙集理論的鮮明特點在于屬性約簡,選取原始特征,在此基礎上經篩選后獲得最佳子集,并進一步選擇突出特征,將大量無用數據刪除,達到有效縮小數據維度的效果,有助于提升數據的研究效益[4-6]。本文也充分運用了粗糙集理論,引入了決策表屬性約簡算法,從而達到屬性約簡的效果,具體流程如圖1所示。
圖1 屬性約簡的基本框架
依托于MapReduce主框架,可實現對數據的分析,此處采取的框架形式具有較強適用性,可實現對多類大數據問題的處理。其內置有Map和Reduce函數,具體指的是映射與歸約函數,在其支持下可實現對數據的高效處理。立足于實際情況,針對數據源展開分散處理,基于
圖2 MapReduce工作流程
通過上述提及的MapReduce,經順序組合后可得到特定程序,即RCK-means算法。類似于上述操作機制,需執(zhí)行屬性約簡操作,實現對數據原件的處理,隨后再一次執(zhí)行Canopy 與K-means子框架。關于各流程,具體內容如圖3所示。
圖3 RCK-means算法流程
(1)在粗糙集理論的支持下,可形成初始決策表,并判定具體的條件與決策屬性,通過對各自屬性依賴度的分析,實現進一步的屬性約簡處理,經此環(huán)節(jié)后可篩除大量無關數據,余下的有用數據便可構成特性集合。
(2)通過 Canopy 算法中的Map函數,可實現對新數據幾何的轉換,使其成為與
(3)通過Reduce 函數,可實現對上述Map結果的進一步處理,即并集操作,此時可以得到Q集合,隨后再運行Canopy流程,針對既有的程序展開多次處理,最終使得集合為空,便可求得聚類簇K,獲得此結果后可將其作為輸入值,以便做后續(xù)的處理。
(4)在上述基礎上,通過K-means算法中Map函數,可求得聚類簇,將所得結果通過
(5)基于Combine 函數,能夠實現對上述輸出值的處理,將其分類后再數據歸集,在求得各數據維度值的基礎上,做進一步的總和計算。
(6)通過K-means 算法中的Reduce函數,針對(5)中求得的結果加以分析,考慮各數據的維度值,為之實行總和計算,并明確數據的具體數量,隨后可創(chuàng)建新的聚類中心,以此為基礎重新迭代,最終收斂。
較為典型的優(yōu)化方式有兩種:第一,從燃燒器與受熱面入手,為之采取升級整改措施,從而達到提升運行效率的效果,或是適配先進設備,在其支持下實現對參數的監(jiān)測。盡管此方法的應用效果良好,但對于人力與財力的需求較大,因此經濟效益較低。第二,基于DCS的數據挖掘技術,從而實現對鍋爐性能的分析并確定合適的參數,此方式模型優(yōu)化工作量相對較大,且在實際處理中易出現樣本獲取難度大的情況,不具備較高的實用性。DCS系統(tǒng)儲有豐富的數據,將其作為實行大數據技術的基本支持,創(chuàng)建嚴密的計算流程,針對熱力系統(tǒng)中涉及到的大量數據展開分析,從中確定與鍋爐效率有關的幾項參數,分析具體參數值與理論的誤差,經此方式所得的參數值則具備作為最佳參數值的條件。對此,本文引入了K-means聚類算法,在此基礎上輔以Hadoop框架,通過集(簇)聚類中心點實現對龐大數據群的分析,從中檢驗最合適的參數,確保所得參數具有可行性,成為提升鍋爐運行效率的關鍵指導。
本文選取的是600 MW 燃煤機組鍋爐,該裝置適配的燃燒器采取的是擺動四角切圓形形式,數據總量129 600條,依據實際情況,重點從2018-10-01—2018-12-31時段內獲取相關數據。
(1)排煙氧量。又可稱為過量空氣系數,伴隨燃燒作業(yè)的持續(xù)發(fā)生,該值將隨之減小,在此過程中鍋爐未完全燃燒損失將呈現出明顯提升的趨勢,不利于鍋爐燃燒效率;若過量空氣系數偏大,有助于緩解不完全燃燒現象,但隨之出現明顯的排煙損失,也會對鍋爐運行效率造成影響。從這一角度來看,需確定合適的取值范圍,此舉對于提升鍋爐效率而言尤為關鍵。
(2)磨煤機給煤量。在特定負荷區(qū)間內,若磨煤機組合方式發(fā)生變化,或是煤量分配比隨之改變,都會使得火焰中心高度處于波動的狀態(tài)。若火焰中心高度偏高,則會對爐膛出口處造成影響,使得該處溫度急速提升,并伴隨大量的流換熱量,降低了鍋爐效率。
(3)一、二次風參數。鍋爐爐膛溫度的變化主要與一次風有關,若爐膛溫度處于較高水平,將會提升燃燒速度,從而達到充分燃燒的效果;若爐膛的溫度處于異常偏高的情況,將伴隨明顯的燃燒逆反應現象,也會出現燃燒不完全的問題。不僅于此,一次風還會影響到煤粉氣流溫度,會提早煤粉著火時間,在充分燃燒的作用下,將明顯減少飛灰含碳量。同時,二次風也是重要的影響因素,該參數也將決定燃燒效果。總體上,一、二次風的良好配合是創(chuàng)建高效空氣動力場的關鍵因素,在其支持下可提升煤粉與空氣的混合效果,確保煤粉得到充分的燃燒。當鍋爐處于穩(wěn)定運行狀態(tài)時,需以燃料量為基準合理調節(jié)一次風參數,由于兩大因素呈線性關系,因此一次風不具備作為選用參數的條件。
(4)燃燒器擺角。根據燃燒器的基本形狀,若為四角切圓形式,在該設備擺動之下,除了會引發(fā)火焰中心偏移現象外,還會對切圓直徑造成影響,從這一角度來看,燃燒器擺角的控制尤為關鍵,是影響鍋爐效率的重要因素。
引入粗糙集理論后,只具備分析離散型數據的能力,但無法滿足辨別數據關系的要求。而通過DCS歸集后,可獲得連續(xù)且具有非離散特性的信息,因此需要在分析之前實行DCS歸集,通過此方式達到對信息分散處理的效果。現階段,分散數據的方式較多,若基于傳統(tǒng)的方式展開,易出現數據分割點判別難度大的問題,在缺乏合理的數據分散處理后,后續(xù)數據處理工作將受到嚴重影響,有價值的數據易被視為無用數據而排除?;诖?,本文建議采用模糊粗糙集分散法,即兼顧了模糊集與粗糙集兩種典型的方式,在其支持下實現對數據的分散處理,以達到數據屬性約簡處理的效果。采取此方式后,能夠改變傳統(tǒng)方式下粗糙集的局限之處,且提升數據判別的準確性。
基于對數據的約簡處理后,可通過RCK-means 算法進一步處理,實現對數據深度挖掘的效果。在Hadoop平臺中,將支持度下限設置為2%。在此基礎上,執(zhí)行標準數據的處理流程,實現對約簡集合的進一步處理,從中挖掘具有應用價值的參數,明確聚類中心點與鍋爐效率間的最合適參數。基于實際分析得知,相較于排煙氧量最佳優(yōu)化值而言,預先設置的實際值與之存在較為明顯的偏差。若處于低負荷運行狀態(tài),相比于最佳優(yōu)化值而言,設定值將比其更小,這一現象與鍋爐難燃燒有關,伴隨排煙氧量的增加,可有效控制不燃燒熱,此時鍋爐的運行效率隨之提升。若負荷值處于較大水平,當超過500 WM時,將會顯著提升鍋爐燃燒效率,此時排煙含氧量最佳優(yōu)化值也會出現明顯的下降趨勢,可以得知的是設定值大于最佳優(yōu)化值。因此,若要達到效率最大化的目標,可通過設定值進行操作,針對各運行狀況下的數據展開深度優(yōu)化,基于此方式求得最佳參數值,提升鍋爐性能。
依托于大數據技術,在其支持下展開數據挖掘,明確影響鍋爐效率的主要因素,從中求得最佳參數值,以達到鍋爐效率最大化的效果。通過RCKmeans新算法,有助于剔除無效數據,在此基礎上求得最佳集合,確保了聚類準確率。從實際應用情況來看,為滿足不同環(huán)境下的運行要求,可設定最佳區(qū)間,隨后對各工作環(huán)境下的數據做針對性優(yōu)化,最終求得最具適用性的參數值。