• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于不同算法的高爐操作爐型聚類(lèi)效果對(duì)比

      2022-11-06 13:37:16閆炳基國(guó)宏偉
      工程科學(xué)學(xué)報(bào) 2022年12期
      關(guān)鍵詞:爐型高爐聚類(lèi)

      魯 杰,閆炳基,趙 偉,李 鵬,陳 棟,國(guó)宏偉

      蘇州大學(xué)沙鋼鋼鐵學(xué)院,蘇州 215137

      高爐操作爐型是高爐投入生產(chǎn)后,經(jīng)爐襯侵蝕、渣皮生成,由設(shè)計(jì)爐型逐漸演變而來(lái)的表征高爐狀態(tài)的高爐內(nèi)型.在高爐冶煉過(guò)程中,高爐操作人員大多通過(guò)冷卻壁參數(shù)、操作參數(shù),結(jié)合生產(chǎn)經(jīng)驗(yàn)間接分析高爐操作爐型的變化情況,以此判斷爐況的好壞[1-2].為保證高爐生產(chǎn)的優(yōu)質(zhì)、低耗、高產(chǎn)、長(zhǎng)壽,就需要一個(gè)合理的高爐操作爐型.通過(guò)高爐冶煉過(guò)程參數(shù),有效合理地表征高爐操作爐型的狀況及其變化過(guò)程,并分析造成變化的原因,有利于高爐操作者及時(shí)調(diào)節(jié)高爐操作制度,優(yōu)化生產(chǎn)過(guò)程.

      大數(shù)據(jù)分析平臺(tái)改善了傳統(tǒng)工業(yè)的生產(chǎn)模式,對(duì)高爐煉鐵生產(chǎn)具有重要指導(dǎo)意義.聚類(lèi)分析是大數(shù)據(jù)中重要一環(huán),借助大數(shù)據(jù)平臺(tái),國(guó)內(nèi)外學(xué)者探索了高爐料面控制、煤氣調(diào)度優(yōu)化、中心煤氣流分布情況監(jiān)測(cè)、高爐操作爐型監(jiān)控、鐵水溫度預(yù)測(cè)及鐵水硅含量預(yù)測(cè)等技術(shù)[3-12],有效優(yōu)化了高爐冶煉過(guò)程,是冶金工業(yè)向智能制造轉(zhuǎn)型的有力支撐.

      K-Means、TwoStep 是現(xiàn)階段常用的高爐操作爐型聚類(lèi)算法[13-16],但是對(duì)于不同聚類(lèi)算法,應(yīng)用效果的對(duì)照關(guān)系不甚明確.本文以高爐冶煉過(guò)程的冷卻壁熱電偶溫度為表征參數(shù),利用K-Means和 TwoStep 聚類(lèi)算法進(jìn)行聚類(lèi)分析,結(jié)合算法原理及聚類(lèi)結(jié)果研究不同聚類(lèi)算法的效果差異,以期為高爐煉鐵大數(shù)據(jù)分析中的聚類(lèi)算法選擇提供有利參考.

      1 聚類(lèi)算法

      1.1 聚類(lèi)算法的選擇

      聚類(lèi)分析是數(shù)據(jù)挖掘技術(shù)中的一項(xiàng)重要技術(shù),通過(guò)將數(shù)據(jù)集合劃分成多個(gè)類(lèi),基于數(shù)據(jù)的特征將相似的樣本歸為一類(lèi),而相異的樣本分置于不同的類(lèi)中,以此確保類(lèi)內(nèi)樣本的同質(zhì)性及類(lèi)間樣本的異質(zhì)性.隨著數(shù)據(jù)挖掘技術(shù)應(yīng)用方面愈發(fā)廣泛,國(guó)內(nèi)外學(xué)者將聚類(lèi)分析引入高爐操作爐型的管理中,通過(guò)采用不同聚類(lèi)算法對(duì)高爐冶煉數(shù)據(jù)進(jìn)行分析,有效合理地表征高爐操作爐型的變化,對(duì)高爐生產(chǎn)有著重要的指導(dǎo)意義.

      武森等[17]選擇了K-Means 算法與層次聚類(lèi)算法分別對(duì)高爐冶煉數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)了對(duì)高爐操作爐型波動(dòng)與變化的實(shí)時(shí)監(jiān)控,有利于操作人員及時(shí)準(zhǔn)確地調(diào)整高爐操作.García 等[18]和Saxena等[19]在K-Means 算法的基礎(chǔ)上引入了自組織特征映射(SOM),利用SOM 訓(xùn)練數(shù)據(jù)集,根據(jù)訓(xùn)練集的輸出結(jié)果采用K-Means 進(jìn)行聚類(lèi)以獲得更好的聚類(lèi)結(jié)果,在可視化、解釋模型方面取得了較好的效果.而在武鋼5 號(hào)高爐操作爐型管理系統(tǒng)的開(kāi)發(fā)過(guò)程中,陳令坤和李佳[16]針對(duì)K-means 算法對(duì)初始中心敏感、樣本分布有要求的特點(diǎn),對(duì)K-Means算法進(jìn)行了一定的改進(jìn),聚類(lèi)結(jié)果準(zhǔn)確表征了高爐銅冷卻壁的溫度變化,并借助爐型變化與高爐利用系數(shù)的對(duì)應(yīng)關(guān)系,初步獲得了武鋼5 號(hào)高爐的爐型變化規(guī)律.

      曹英杰等[15]選用了TwoStep 聚類(lèi)算法研究國(guó)豐1 號(hào)高爐操作爐型,對(duì)高爐冷卻壁熱電偶溫度值進(jìn)行聚類(lèi)分析,確定了高爐透氣性指數(shù)與爐型變化的規(guī)律,并通過(guò)實(shí)踐證明聚類(lèi)分析的結(jié)果能夠有效監(jiān)控爐型變化,指導(dǎo)高爐生產(chǎn)現(xiàn)場(chǎng).而閆炳基等[14]考慮到評(píng)價(jià)爐型的指標(biāo)多且重疊性大的問(wèn)題,曾在TwoStep 算法的基礎(chǔ)上引入主成分分析方法(Principal component analysis,PCA),從傳統(tǒng)評(píng)價(jià)爐型的指標(biāo)中生成3 個(gè)新的核指標(biāo)以評(píng)價(jià)聚類(lèi)結(jié)果,實(shí)踐結(jié)果表明生成的核指標(biāo)有效解決了指標(biāo)多且重復(fù)性大的問(wèn)題,優(yōu)化了高爐操作爐型的管理.

      上述研究進(jìn)展中涉及的聚類(lèi)算法特點(diǎn)如表1所示[20-25].K-Means 聚類(lèi)算法是經(jīng)典的基于劃分的聚類(lèi)算法,時(shí)間復(fù)雜度低,聚類(lèi)效率高,聚類(lèi)質(zhì)量好,在高爐操作爐型聚類(lèi)分析中應(yīng)用較多,同時(shí)KMeans 算法也存在對(duì)初始中心敏感、對(duì)數(shù)據(jù)分布有要求的缺點(diǎn),但陳令坤提出的改進(jìn)方法是行之有效的,在對(duì)高爐操作爐型的管理中獲得了優(yōu)異效果[16].層次聚類(lèi)算法的時(shí)間復(fù)雜度普遍較高,且ROCK、Chameleon 等典型算法并不支持大規(guī)模數(shù)據(jù)集[25],層次聚類(lèi)算法在高爐操作爐型的研究中應(yīng)用較少,武森等也僅在研究中提到該方法的可行性.SOM 是一種基于模型的聚類(lèi)算法,該算法存在時(shí)間復(fù)雜度高、不支持大規(guī)模數(shù)據(jù)集、聚類(lèi)結(jié)果對(duì)模型參數(shù)敏感的缺點(diǎn),其優(yōu)勢(shì)在于模型能夠提供充分描述數(shù)據(jù)的方法,Saxena 等[19]雖然結(jié)合了K-Means 與SOM 充分發(fā)揮了其在可視化、解釋模型方面的優(yōu)點(diǎn),但隨著聚類(lèi)算法的深入研究,判別分析、主成分分析等方法被用于聚類(lèi)結(jié)果的解釋中,Mckim 等[26]利用判別分析中的圖形技術(shù)幫助使用者理解和解釋集群,閆炳基等[14]則借助主成分分析解決了指標(biāo)重復(fù)性大的問(wèn)題,研究結(jié)果也表明判別分析與主成分分析方法在解釋聚類(lèi)結(jié)果時(shí)取得了良好的效果.TwoStep 算法是改進(jìn)的BRICH 算法(層次聚類(lèi)算法),降低了算法的時(shí)間復(fù)雜度,并能夠自動(dòng)確定最佳聚類(lèi)簇?cái)?shù),具有較好的擴(kuò)展性,在高爐操作爐型監(jiān)控管理的應(yīng)用中也表現(xiàn)出較好的效果.

      表1 聚類(lèi)算法分類(lèi)及特點(diǎn)Table 1 Classification and characteristics of clustering algorithms

      基于以上討論,本文結(jié)合所研究數(shù)據(jù)對(duì)象的特征,選擇了兩種現(xiàn)階段高爐操作爐型研究中常用的聚類(lèi)算法— —K-Means 和TwoStep 算法,對(duì)高爐爐身冷卻壁熱電偶數(shù)據(jù)進(jìn)行聚類(lèi)分析,并借助合適的聚類(lèi)有效性評(píng)價(jià)指標(biāo),研究不同算法的聚類(lèi)效果差異,以期為高爐煉鐵大數(shù)據(jù)分析中的聚類(lèi)算法選擇提供有力參考.

      1.2 K-Means 算法、TwoStep 算法原理

      (1)K-Means 聚類(lèi)的算法思想[27-28]是按照樣本之間距離,將n個(gè)樣本點(diǎn)劃分為k個(gè)類(lèi),使得相似的樣本盡量被分到同一個(gè)類(lèi),其衡量相似度的計(jì)算方法為歐氏距離.

      K-Means 算法的具體步驟為:

      ①對(duì)全部n個(gè)對(duì)象,隨機(jī)選擇k個(gè)對(duì)象作為一個(gè)類(lèi)的中心,代表將生成的k個(gè)類(lèi);

      ②計(jì)算其他對(duì)象到聚類(lèi)中心的距離,分派對(duì)象至距離最近的簇內(nèi);

      ③針對(duì)每個(gè)類(lèi)計(jì)算其所有對(duì)象的平均值,作為所有對(duì)象的新中心值;

      ④根據(jù)距離最近原則,重新分配數(shù)據(jù);

      ⑤返回③直至無(wú)變化,結(jié)束聚類(lèi).

      (2)TwoStep 兩步聚類(lèi)算法是BIRCH 層次聚類(lèi)算法的改良方法,加入了自動(dòng)確定最佳簇?cái)?shù)量的機(jī)制,使得TwoStep 算法更加實(shí)用[26].

      該聚類(lèi)算法可分為預(yù)聚類(lèi)階段和聚類(lèi)階段.在預(yù)聚類(lèi)階段,采用了BIRCH 算法中聚類(lèi)特征樹(shù)生長(zhǎng)的思想,先遍歷一遍數(shù)據(jù),生成聚類(lèi)特征樹(shù)的同時(shí),預(yù)先聚類(lèi)較為密集的數(shù)據(jù)點(diǎn),形成諸多子簇.在聚類(lèi)階段,以預(yù)聚類(lèi)階段的子簇為對(duì)象,利用凝聚法逐個(gè)合并子簇,通過(guò)AIC 準(zhǔn)則(Akaike information criterion)、BIC 準(zhǔn)則(Bayesian information criterion)以及類(lèi)別間最短距離確定最優(yōu)類(lèi)別數(shù)作為聚類(lèi)終止的條件.

      1.3 聚類(lèi)有效性評(píng)價(jià)指標(biāo)

      聚類(lèi)有效性評(píng)價(jià)指標(biāo)分為內(nèi)部指標(biāo)和外部指標(biāo)兩類(lèi),兩者的區(qū)別在于是否將外部信息用于聚類(lèi)評(píng)價(jià)[29].在不考慮外部信息時(shí),內(nèi)部指標(biāo)是利用數(shù)據(jù)集的空間幾何結(jié)構(gòu)信息評(píng)估聚類(lèi)結(jié)構(gòu)的優(yōu)劣.在許多場(chǎng)景中常有缺少外部標(biāo)簽可用的情況,內(nèi)部指標(biāo)是聚類(lèi)評(píng)價(jià)的唯一選擇.聚類(lèi)有效性評(píng)價(jià)的內(nèi)部指標(biāo)主要包括Compactness、Separation、Davies-Bouldin indicator、Dunn indicator 和Silhouette coefficient,這些評(píng)價(jià)指標(biāo)的計(jì)算公式或方法如表2所示[25,30-32].

      表2 聚類(lèi)評(píng)價(jià)指標(biāo)Table 2 Cluster evaluation index

      Compactness 計(jì)算了每一類(lèi)的類(lèi)內(nèi)各點(diǎn)到聚類(lèi)中心的平均距離,但并沒(méi)有考慮類(lèi)間距離;Separation 計(jì)算了各聚類(lèi)中心之間的平均距離,但沒(méi)有考慮類(lèi)內(nèi)效果;Davies-Bouldin indicator 和Dunn indicator 考慮了類(lèi)內(nèi)效果與類(lèi)間效果兩方面,對(duì)聚類(lèi)效果的評(píng)價(jià)更為全面;Silhouette coefficient 適用于數(shù)據(jù)結(jié)構(gòu)清楚、各簇樣本數(shù)目相差不大的情況[33],而本文所選兩種算法的聚類(lèi)結(jié)果中各簇樣本數(shù)目有明顯差異,故而Silhouette coefficient 并不適用.基于五種聚類(lèi)評(píng)價(jià)指標(biāo)的特點(diǎn),本文選用Davies-Bouldin indicator(DBI)和Dunn indicator(DI)作為評(píng)價(jià)依據(jù).

      2 基于不同聚類(lèi)算法的高爐操作爐型聚類(lèi)

      2.1 數(shù)據(jù)處理

      K-Means 和TwoStep 聚類(lèi)算法在聚類(lèi)過(guò)程中常會(huì)受到數(shù)據(jù)集中樣本或是相似性度量函數(shù)的影響,難以達(dá)到最佳的聚類(lèi)效果.因此,在聚類(lèi)分析前對(duì)數(shù)據(jù)集進(jìn)行處理能夠使聚類(lèi)結(jié)果更為理想,本文在借鑒張鴻雁等[27]與劉葉等[28]研究思路的基礎(chǔ)上,在聚類(lèi)前對(duì)數(shù)據(jù)集作如下處理:

      (1)對(duì)于聚凸數(shù)據(jù)集以及中心點(diǎn)的問(wèn)題,在數(shù)據(jù)集中確定一個(gè)端點(diǎn),對(duì)所有個(gè)案到端點(diǎn)的歐氏距離排序,從而可以根據(jù)新的有序樣本確定各個(gè)初始中心;

      (2)對(duì)于異常點(diǎn)敏感的問(wèn)題,聚類(lèi)分析前已經(jīng)去掉了缺失數(shù)據(jù)以及異常點(diǎn)數(shù)據(jù);

      (3)對(duì)于相似性度量函數(shù),由于在第(1)步中采用歐式距離對(duì)數(shù)據(jù)集重新排序,因此確定采用歐式距離作為相似性度量函數(shù),可以減少相似性度量函數(shù)對(duì)聚類(lèi)結(jié)果的影響.

      本文采用的數(shù)據(jù)是國(guó)內(nèi)某鋼鐵廠高爐爐身熱電偶的31986 條歷史冶煉數(shù)據(jù)(考慮數(shù)據(jù)缺失、中途休風(fēng)等影響已去掉無(wú)效數(shù)據(jù)),通過(guò)高爐爐身不同高度的冷卻壁及耐火材料處安裝的測(cè)量電偶,可以獲得高爐爐身沿縱向8 層熱電偶(第6、7、8、9、10、11、12、14 段冷卻壁,第13 段無(wú)熱電偶)測(cè)得的溫度變化,以冷卻壁溫度為原始數(shù)據(jù)集對(duì)高爐操作爐型進(jìn)行聚類(lèi)分析.高爐各段冷卻壁位置如圖1 所示.

      圖1 高爐各段冷卻壁位置示意圖Fig.1 Position of a cooling stave in each section of a blast furnace

      2.2 聚類(lèi)簇?cái)?shù)的確定

      本文利用DBI 和DI 指標(biāo)評(píng)價(jià)聚類(lèi)效果,選擇聚類(lèi)結(jié)果最佳時(shí)的聚類(lèi)簇?cái)?shù)為最優(yōu)方案.

      在用聚類(lèi)算法對(duì)高爐操作爐型聚類(lèi)分析時(shí),考慮到爐型分類(lèi)的具體情況,即聚類(lèi)簇?cái)?shù)過(guò)少時(shí)評(píng)價(jià)爐型的精度不夠,聚類(lèi)簇?cái)?shù)過(guò)多時(shí)會(huì)有部分類(lèi)數(shù)據(jù)過(guò)少不具備代表性,因此將聚類(lèi)簇?cái)?shù)的范圍限制在5 至12 類(lèi),DBI 和DI 評(píng)價(jià)指標(biāo)的結(jié)果如圖2 所示.

      圖2 不同聚類(lèi)簇?cái)?shù)的DBI 和DI 指標(biāo)結(jié)果.(a) DBI 評(píng)價(jià)指標(biāo);(b) DI 評(píng)價(jià)指標(biāo)Fig.2 Result calculation of a cluster evaluation index for various numbers of clusters: (a) Davies-Bouldin index;(b) Dunn validity index

      根據(jù)表2 中DBI 和DI 指標(biāo)的計(jì)算方法可以看出,DBI 評(píng)價(jià)指標(biāo)結(jié)果越小,DI 評(píng)價(jià)指標(biāo)越大,意味著更小的簇間相似性以及更大的簇內(nèi)相似性,代表了聚類(lèi)效果較優(yōu)的情況.從圖2(a)可以看出,TwoStep 算法的DBI 評(píng)價(jià)指標(biāo)在聚類(lèi)簇?cái)?shù)為6 時(shí)最低,聚類(lèi)結(jié)果在此處最優(yōu),而K-Means 算法的聚類(lèi)結(jié)果整體優(yōu)于TwoStep 算法的聚類(lèi)結(jié)果,當(dāng)聚類(lèi)簇?cái)?shù)在5 至7 時(shí),聚類(lèi)效果相差不大,聚類(lèi)簇?cái)?shù)>7 時(shí),DBI 評(píng)價(jià)指標(biāo)呈現(xiàn)上升的趨勢(shì).于圖2(b)中,DI 指標(biāo)的評(píng)價(jià)結(jié)果也呈現(xiàn)K-Means 算法聚類(lèi)結(jié)果整體優(yōu)于TwoStep 算法聚類(lèi)結(jié)果的趨勢(shì),Two-Step 算法的DI 評(píng)價(jià)指標(biāo)在聚類(lèi)簇?cái)?shù)為6 時(shí)最大,聚類(lèi)結(jié)果此處最優(yōu),K-Means 算法的DI 評(píng)價(jià)指標(biāo)在聚類(lèi)簇?cái)?shù)在5 和6 時(shí)較大,明顯優(yōu)于聚類(lèi)簇?cái)?shù)>6 時(shí)的聚類(lèi)結(jié)果.

      綜合TwoStep 和K-Menas 算 法的DBI 和DI 評(píng)價(jià)指標(biāo)結(jié)果,可以得到結(jié)論,在本文所選的樣本數(shù)據(jù)及數(shù)據(jù)特征基礎(chǔ)上,聚類(lèi)簇?cái)?shù)為6 時(shí),兩種算法的聚類(lèi)結(jié)果普遍更優(yōu).

      2.3 聚類(lèi)結(jié)果

      關(guān)于高爐操作爐型的監(jiān)控研究,由于對(duì)象高爐的不同,聚類(lèi)簇?cái)?shù)的差異是一定的.本文根據(jù)DBI 和DI 指標(biāo)運(yùn)算結(jié)果,確定目標(biāo)高爐操作爐型的最佳聚類(lèi)簇?cái)?shù)為6 類(lèi).K-Means 與TwoStep 算法的聚類(lèi)簇?cái)?shù)為6 類(lèi)時(shí),6 類(lèi)爐型冷卻壁各段溫度分布如圖3 和圖4 所示.

      圖3 K-Means 聚類(lèi)結(jié)果中6 類(lèi)爐型冷卻壁各段溫度分布Fig.3 Temperature distribution of each cooling stave of six furnace profiles by K-Means clustering algorithm

      圖4 TwoStep 聚類(lèi)結(jié)果中6 類(lèi)爐型冷卻壁各段溫度分布Fig.4 Temperature distribution of each cooling stave of six furnace profiles by TwoStep clustering algorithm

      從圖3 和圖4 可以看到,利用K-Means 與Two-Step 算法分別對(duì)高爐冷卻壁測(cè)溫?zé)犭娕紨?shù)據(jù)進(jìn)行聚類(lèi)分析,聚類(lèi)結(jié)果中各類(lèi)間區(qū)分明顯,均有效表征了高爐不同時(shí)期的操作爐型狀態(tài).K-Means 與TwoStep 的聚類(lèi)結(jié)果中高爐冷卻壁溫度有如下特點(diǎn):冷卻壁溫度于第11~12 段相對(duì)較高,第12 段冷卻壁溫度最高(K-Means 聚類(lèi)結(jié)果中第12 段溫度最大值為130.7 ℃,TwoStep 聚類(lèi)結(jié)果中第12 段溫度最大值為127.1 ℃);兩種聚類(lèi)結(jié)果中均存在一類(lèi)高爐特殊時(shí)期的爐型(K-Means 聚類(lèi)結(jié)果中Cluster 4 與TwoStep 聚類(lèi)結(jié)果中Cluster 1);K-Means聚類(lèi)結(jié)果中Cluster 3 與TwoStep 聚類(lèi)結(jié)果中各類(lèi)的相差最為明顯.對(duì)于這些特點(diǎn),只依賴(lài)聚類(lèi)結(jié)果難以分析,因此進(jìn)一步分別從聚類(lèi)簇內(nèi)數(shù)據(jù)分布、聚類(lèi)算法原理以及爐型物理含義的角度,分析KMeans 與TwoStep 的聚類(lèi)結(jié)果有何不同,并判斷當(dāng)聚類(lèi)簇?cái)?shù)為6 時(shí),K-Means 與TwoStep 的聚類(lèi)效果哪種更好,更適用于高爐操作爐型的管理.

      3 聚類(lèi)結(jié)果分析

      3.1 聚類(lèi)簇內(nèi)數(shù)據(jù)分布

      TwoStep 聚類(lèi)效果在簇?cái)?shù)為6 與7 時(shí)表現(xiàn)出很大差別,通過(guò)匯總簇內(nèi)數(shù)據(jù)的分布情況,分析簇?cái)?shù)由7 減少至6 時(shí)減少的一簇中數(shù)據(jù)流向.簇?cái)?shù)為6、7 時(shí)數(shù)據(jù)分布如圖5 所示.

      圖5 TwoStep 聚類(lèi)結(jié)果中簇?cái)?shù)為6、7 時(shí)數(shù)據(jù)分布Fig.5 Data distribution when the numbers of clusters are six and seven by TwoStep clustering algorithm

      從圖5 可以看到,簇?cái)?shù)為6 時(shí)的第4 類(lèi)數(shù)據(jù)量占比為24.64%,與簇?cái)?shù)為7 時(shí)的第4 類(lèi)和第7 類(lèi)的數(shù)據(jù)量占比之和(26.79%)基本接近,前者和后者的兩類(lèi)之間的數(shù)據(jù)對(duì)應(yīng)匹配情況超過(guò)90%,而其他各類(lèi)從數(shù)據(jù)量占比上也具有較好的對(duì)應(yīng)性.根據(jù)DBI 和DI 評(píng)價(jià)指標(biāo)的計(jì)算公式,可以認(rèn)為簇?cái)?shù)為7 時(shí)聚類(lèi)效果更差的原因在于其第4 類(lèi)與第7 類(lèi)的簇間距離較小.當(dāng)縮減聚類(lèi)簇?cái)?shù)時(shí),相似的兩類(lèi)被合并為了一類(lèi),使得簇?cái)?shù)為6 時(shí)的聚類(lèi)結(jié)果明顯優(yōu)于簇?cái)?shù)為7 時(shí)的結(jié)果.

      K-Means 算法在聚類(lèi)簇?cái)?shù)為6 時(shí)的數(shù)據(jù)分布如圖6 所示.

      圖6 K-Means 聚類(lèi)結(jié)果中簇?cái)?shù)為6 時(shí)數(shù)據(jù)分布Fig.6 Data distribution when the number of clusters is six by K-Means clustering algorithm

      比較圖5 與圖6 可以發(fā)現(xiàn),當(dāng)聚類(lèi)簇?cái)?shù)均為6 時(shí),K-Means 與TwoStep 聚類(lèi)算法的數(shù)據(jù)分布差別很大.K-Means 聚類(lèi)結(jié)果的數(shù)據(jù)分布更為集中,占比最多的一類(lèi)達(dá)到了37.426%,而TwoStep 聚類(lèi)結(jié)果占比最多的一類(lèi)占比只有24.636%.同時(shí),KMeans 聚類(lèi)結(jié)果中存在兩類(lèi)占比極少,數(shù)據(jù)的分布情況體現(xiàn)了K-Means 聚類(lèi)結(jié)果的簇內(nèi)數(shù)據(jù)更為集中,簇間差別較大,驗(yàn)證了DBI 和DI 評(píng)價(jià)指標(biāo)對(duì)聚類(lèi)簇?cái)?shù)為6 時(shí)的評(píng)價(jià)結(jié)果,可以得到結(jié)論:在本文所選的樣本數(shù)據(jù)及數(shù)據(jù)特征基礎(chǔ)上,K-Means 算法的聚類(lèi)結(jié)果優(yōu)于TwoStep 算法的聚類(lèi)結(jié)果.

      3.2 聚類(lèi)算法原理比較

      從聚類(lèi)結(jié)果的數(shù)據(jù)分布以及DBI、DI 評(píng)價(jià)指標(biāo)的比較,可以得到K-Means 聚類(lèi)結(jié)果更優(yōu)的結(jié)論.本節(jié)從聚類(lèi)算法原理角度,討論K-Means 算法與TwoStep 算法之間的優(yōu)劣[34].

      K-Means 算法根據(jù)事先確定的類(lèi)別數(shù)選取不同對(duì)象作為聚類(lèi)中心點(diǎn),以歐式距離為相似度標(biāo)準(zhǔn)分派數(shù)據(jù),再重新確定聚類(lèi)中心,直至聚類(lèi)結(jié)果收斂,這樣的聚類(lèi)過(guò)程與TwoStep 算法構(gòu)造CF 樹(shù)后采用凝聚法合并數(shù)據(jù)簇相比,有效地簡(jiǎn)化了算法,減少了K-Means 算法的時(shí)間復(fù)雜度.同時(shí),Two-Step 算法采用凝聚法合并數(shù)據(jù)簇也決定了其在大數(shù)據(jù)樣本處理能力上遜色于K-Means 算法,且由于算法在構(gòu)造CF 樹(shù)后采用凝聚法合并相似簇,這種合并子簇方法的不可逆性導(dǎo)致聚類(lèi)算法無(wú)法重新合并或分離簇優(yōu)化聚類(lèi)結(jié)果.

      在衡量相似度的標(biāo)準(zhǔn)上,K-Means 采用了歐氏距離,而TwoStep 使用了對(duì)數(shù)似然距離,這是統(tǒng)計(jì)理論中衡量簇與簇相異度的方法.不同的相似度衡量標(biāo)準(zhǔn)對(duì)聚類(lèi)結(jié)果的影響很大,需要選用合理的衡量指標(biāo)進(jìn)行聚類(lèi)分析.

      能夠自動(dòng)確定類(lèi)別數(shù)是TwoStep 算法的最大特點(diǎn),TwoStep 算法可以通過(guò)AIC、BIC 以及類(lèi)別間最短距離自動(dòng)確定類(lèi)別數(shù).而K-Means 算法需要事先給定聚類(lèi)數(shù)K值,K值的確定也會(huì)影響算法的最終聚類(lèi)結(jié)果.

      對(duì)于數(shù)據(jù)中的異常點(diǎn),TwoStep 可以自動(dòng)將其歸類(lèi)至最近簇中,但K-Means 對(duì)異常點(diǎn)沒(méi)有有效的解決方法,異常點(diǎn)的存在會(huì)對(duì)聚類(lèi)結(jié)果產(chǎn)生嚴(yán)重影響.本文在聚類(lèi)分析前剔除了數(shù)據(jù)集中的異常點(diǎn),因此K-Means 算法才得到了較好的聚類(lèi)結(jié)果.

      從聚類(lèi)算法原理來(lái)看,K-Means 和TwoStep 算法均有其優(yōu)點(diǎn),但算法本身也存在其不足之處.兩種算法本身并沒(méi)有優(yōu)劣之分,只是針對(duì)不同特性的數(shù)據(jù)集和特定應(yīng)用場(chǎng)景,兩種聚類(lèi)算法對(duì)數(shù)據(jù)集的處理能力與處理結(jié)果存在差異.

      3.3 爐型分類(lèi)的物理含義

      簇?cái)?shù)為6 時(shí),K-Means 與TwoStep 算法的聚類(lèi)結(jié)果如圖7 所示.

      圖7 K-Means、TwoStep 聚類(lèi)結(jié)果(簇?cái)?shù)為6)Fig.7 K-Means,TwoStep clustering results (number of clusters is 6)

      從圖7 可以看出,高爐爐型第6~9 段冷卻壁溫度相對(duì)10~14 段(除13 段無(wú)熱電偶)溫度較低.溫度差異明顯主要在于其冷卻制度的不同,6~9 段為軋制銅與鑄銅冷卻壁,冷卻效果較好,10、11 段為鑄鋼冷卻壁,12、14 段為鑄鐵冷卻壁,鑄鋼、鑄鐵冷卻壁的冷卻效果不如鑄銅冷卻壁[35-36].

      對(duì)比每段各自冷卻壁溫度,當(dāng)溫度變化,基于爐型聚類(lèi)結(jié)果可以判定操作爐型的變化狀態(tài),當(dāng)操作爐型發(fā)生變化時(shí),可能是由以下原因造成的:

      (1)該段渣皮脫落較多,脫落頻率較高,因此爐壁內(nèi)襯相對(duì)較薄,熱電偶溫度上升;

      (2)此段邊緣氣流有發(fā)展趨勢(shì),溫度上升,此時(shí)可以根據(jù)現(xiàn)場(chǎng)需要對(duì)上部布料角度進(jìn)行調(diào)整或加大邊緣負(fù)荷等操作抑制邊緣氣流發(fā)展;

      (3)如果出現(xiàn)溫度長(zhǎng)時(shí)間持續(xù)上升,則需要現(xiàn)場(chǎng)及時(shí)采取相應(yīng)措施,對(duì)高爐下部風(fēng)口進(jìn)行調(diào)整,避免爐溫繼續(xù)升高.

      因此,現(xiàn)場(chǎng)人員可以通過(guò)對(duì)高爐操作爐型的觀察和監(jiān)控,根據(jù)爐型整體變化情況采取相應(yīng)的調(diào)控措施.

      4 結(jié)論

      本文以國(guó)內(nèi)某鋼鐵廠高爐爐身熱電偶溫度值的31986 條歷史冶煉記錄為數(shù)據(jù)集,分別選擇KMeans、TwoStep 算法對(duì)高爐操作爐型進(jìn)行聚類(lèi).結(jié)合算法原理以及DBI、DI 評(píng)價(jià)指標(biāo)對(duì)兩種聚類(lèi)算法進(jìn)行比較,結(jié)果顯示:

      (1)通過(guò)DBI 和DI 評(píng)價(jià)指標(biāo)比較兩種算法在聚類(lèi)簇?cái)?shù)不同時(shí)的聚類(lèi)效果,確定了最佳聚類(lèi)簇?cái)?shù)為6,此時(shí)K-Means 和TwoStep 算法都能得到更好的聚類(lèi)結(jié)果.

      (2)從聚類(lèi)原理來(lái)看,K-Means 與TwoStep 算法并沒(méi)有優(yōu)劣之分.從聚類(lèi)結(jié)果上來(lái)看,在本文所選的樣本數(shù)據(jù)及數(shù)據(jù)特征基礎(chǔ)上,K-Means 算法的聚類(lèi)結(jié)果明顯優(yōu)于TwoStep 算法的聚類(lèi)結(jié)果.

      (3)分析爐身冷卻壁熱電偶溫度變化尤其是操作爐型發(fā)生變化時(shí)的原因,主要包括:渣皮脫落導(dǎo)致的爐壁內(nèi)襯變薄,邊緣氣流呈發(fā)展趨勢(shì),高爐下部風(fēng)口影響等;高爐操作爐型聚類(lèi)結(jié)果是對(duì)影響爐型狀態(tài)的各個(gè)原因的綜合顯現(xiàn),對(duì)其類(lèi)別變化的跟蹤,可為上下部調(diào)劑提供關(guān)鍵的指導(dǎo)信息,對(duì)于生產(chǎn)過(guò)程的及時(shí)調(diào)控具有重要的意義.

      猜你喜歡
      爐型高爐聚類(lèi)
      5100m3高爐長(zhǎng)期休風(fēng)快速恢復(fù)實(shí)踐
      山東冶金(2022年2期)2022-08-08 01:50:38
      對(duì)集團(tuán)公司3#高爐及部分冶煉知識(shí)的理解
      昆鋼2500m3高爐開(kāi)爐快速達(dá)產(chǎn)實(shí)踐
      昆鋼科技(2021年3期)2021-08-23 01:27:36
      昆鋼2500m3高爐停爐及開(kāi)爐快速達(dá)產(chǎn)實(shí)踐
      昆鋼科技(2021年3期)2021-08-23 01:27:34
      高爐前
      某生物質(zhì)電站鍋爐選型對(duì)比
      基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
      基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
      一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
      山東泰鋼1780m3高爐爐體長(zhǎng)壽設(shè)計(jì)與實(shí)踐
      开鲁县| 肥东县| 德惠市| 彭阳县| 侯马市| 仁化县| 嫩江县| 玉溪市| 肇源县| 措勤县| 鄂托克前旗| 曲松县| 武邑县| 沾化县| 论坛| 大同市| 穆棱市| 建湖县| 广东省| 太保市| 景宁| 育儿| 朝阳区| 张北县| 鄂托克旗| 陈巴尔虎旗| 临朐县| 瑞昌市| 德清县| 安泽县| 灌阳县| 溆浦县| 新野县| 黎川县| 滕州市| 响水县| 隆安县| 林州市| 葫芦岛市| 搜索| 锡林浩特市|