(華北電力大學(xué)電力工程學(xué)院,北京市,102200) 劉鈺蕊
變電設(shè)備作為變電站的核心部分,其日常維護(hù)與管理,對(duì)提高變電運(yùn)行的可靠性與安全性有重大意義,而電力設(shè)備中玻璃材料的老化問題正亟待解決。聚類分析是將物理或抽象對(duì)象的集合分組為由類似的對(duì)象組成的多個(gè)類的分析過程,在玻璃材料研究領(lǐng)域有良好適用條件,能準(zhǔn)確分類總結(jié)玻璃化學(xué)成分及其風(fēng)化規(guī)律,為后續(xù)相關(guān)電力設(shè)備的維護(hù)提供可靠依據(jù)。
聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個(gè)過程,一個(gè)類簇內(nèi)的實(shí)體是相似的,不同類簇的實(shí)體是不相似的。一個(gè)類簇是測(cè)試空間中點(diǎn)的會(huì)聚,同一類簇的任意兩個(gè)點(diǎn)間的距離小于不同類簇的任意兩個(gè)點(diǎn)間的距離,類簇可以描述為一個(gè)包含密度相對(duì)較高的點(diǎn)集的多維空間中的連通區(qū)域,它們借助包含密度相對(duì)較低的點(diǎn)集的區(qū)域與其他區(qū)域(類簇)相分離[1]。
聚類是一個(gè)無監(jiān)督的分類,它沒有任何先驗(yàn)知識(shí)可用,在分類的過程中,人們不必事先給出一個(gè)分類的標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動(dòng)進(jìn)行分類。聚類分析所使用方法的不同,常常會(huì)得到不同的結(jié)論。不同研究者對(duì)于同一組數(shù)據(jù)進(jìn)行聚類分析,所得到的聚類數(shù)未必一致。傳統(tǒng)的統(tǒng)計(jì)聚類分析方法包括系統(tǒng)聚類法、分解法、加入法、動(dòng)態(tài)聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。采用k-均值、k-中心點(diǎn)等算法的聚類分析工具已被加入到許多著名的統(tǒng)計(jì)分析軟件包中,如SPSS、SAS 等,本文中主要利用SPSS 軟件進(jìn)行分析[2]。
采用聚類分析的方法對(duì)電力設(shè)備玻璃材料進(jìn)行分類研究,可以準(zhǔn)確清晰地獲取玻璃材料的分類概況,為進(jìn)一步研究其類別規(guī)律,解決玻璃老化問題提供依據(jù)。
對(duì)于所獲取的玻璃樣品數(shù)據(jù),關(guān)鍵在于分析玻璃類型與各化學(xué)成分含量之間的關(guān)系,從而進(jìn)一步對(duì)已有類型的樣本進(jìn)行進(jìn)一步分類,但是變量過于冗余,因此可以將相關(guān)性高的分為一類,對(duì)各化學(xué)成分進(jìn)行降維處理,也就是對(duì)各個(gè)反應(yīng)產(chǎn)物進(jìn)行分類合并處理,考慮到高鉀類玻璃和鉛鋇類玻璃性質(zhì)上的不同,利用SPSS軟件的聚類分析功能對(duì)高鉀類樣本和鉛鋇類樣品的相關(guān)數(shù)據(jù)分別進(jìn)行聚類分析,針對(duì)樣品中各化學(xué)成分的含量進(jìn)行分類。由聚類分析可知:對(duì)于高鉀類樣品,可以將二氧化硅含量歸為一類作為主要化學(xué)成分,而將其余化學(xué)成分的總含量歸為一類稱為次要化學(xué)成分,從而實(shí)現(xiàn)數(shù)據(jù)的降維。因此在14種化學(xué)成分中,只需要考慮二氧化硅含量以及其余化學(xué)成分總含量這兩類指標(biāo)與玻璃類型之間的關(guān)系,將其作為高鉀類樣品的分類依據(jù)。
對(duì)于鉛鋇類樣品:可以將二氧化硅含量、氧化鉛含量、氧化鋇含量分別歸為一類,得到三類主要化學(xué)成分。而將其余化學(xué)成分的總含量分為一類稱為次要化學(xué)成分,故只需要考慮二氧化硅含量、氧化鉛含量、氧化鋇含量以及其余化學(xué)成分總含量這四類指標(biāo)與玻璃類型之間的關(guān)系即可,將其作為鉛鋇類樣品的分類依據(jù)。
分析高鉀玻璃和鉛鋇玻璃的分類依據(jù),同時(shí)考慮到樣品類型和風(fēng)化情況對(duì)于樣品化學(xué)成分的影響,將高鉀和鉛鋇兩種類型的樣品進(jìn)一步細(xì)分為高鉀未風(fēng)化,高鉀風(fēng)化,鉛鋇未風(fēng)化,鉛鋇風(fēng)化四種類型,對(duì)這四種類型樣品中各化學(xué)成分的含量范圍進(jìn)行統(tǒng)計(jì),并繪制多因子箱形圖如圖1 所示。以此來對(duì)比分析風(fēng)化狀態(tài)相同時(shí)高鉀玻璃和鉛鋇玻璃中各化學(xué)成分含量分布的不同以及兩者在風(fēng)化前后各化學(xué)成分比例變化情況的差異。
圖1 不同類型樣品各化學(xué)成分分布箱形圖
由圖1統(tǒng)計(jì)可知,在風(fēng)化狀態(tài)相同時(shí),高鉀和鉛鋇兩種類型的樣品中二氧化硅、氧化鉛、氧化鋇三者的成分含量范圍分布均相對(duì)集中,且兩者無重合部分。即在風(fēng)化情況一定時(shí),高鉀類與鉛鋇類玻璃中這三種材料的成分含量存在顯著差異,所以這三種化學(xué)成分在區(qū)分不同玻璃類型中起到重要作用。其中,高鉀類樣品中二氧化硅的含量在風(fēng)化后急劇上升且無論風(fēng)化前后,高鉀類樣品中二氧化硅的含量均高于鉛鋇類樣品。同時(shí)可以看出,氧化鉛、氧化鋇集中分布在鉛鋇類樣品中,在高鉀類樣品中幾乎沒有。除此之外還可以注意到,高鉀類玻璃風(fēng)化前氧化鉀的含量很高,風(fēng)化后氧化鉀的含量有相對(duì)明顯的下降,而鉛鋇玻璃在風(fēng)化前后氧化鉀的含量均相對(duì)較低,沒有明顯變化。
對(duì)高鉀玻璃和鉛鋇玻璃進(jìn)一步進(jìn)行亞類劃分,采用系統(tǒng)聚類法,系統(tǒng)聚類法可以直接對(duì)所有項(xiàng)目進(jìn)行綜合比較、分類和評(píng)價(jià)。系統(tǒng)聚類法中最佳聚類數(shù)的選定采用肘部法則。肘部法則的計(jì)算原理是成本函數(shù),成本函數(shù)是類別畸變程度之和,每個(gè)類的畸變程度等于每個(gè)變量點(diǎn)到其類別中心的位置距離平方和,若類內(nèi)部的成員彼此間越緊湊則類的畸變程度越小,反之,若類內(nèi)部的成員彼此間越分散則類的畸變程度越大。在選擇類別數(shù)量上,肘部法則會(huì)把不同聚類數(shù)對(duì)應(yīng)的總畸變程度以圖表的形式表現(xiàn)出來,即繪制聚合系數(shù)折線圖。隨著值的增大,平均畸變程度會(huì)減小;每個(gè)類包含的樣本數(shù)會(huì)減少,于是樣本離其重心會(huì)更近。但是,隨著值繼續(xù)增大,平均畸變程度的改善效果會(huì)不斷減低。值增大過程中,畸變程度的改善效果下降幅度最大的位置對(duì)應(yīng)的值就是肘部,依據(jù)肘部即可確定最佳聚類數(shù)[3]。下面以高鉀類樣品為例來進(jìn)行分析。
首先依據(jù)前期聚類分析得到的四個(gè)指標(biāo),采用系統(tǒng)聚類法對(duì)處理后的高鉀類樣品進(jìn)行聚類,隨后根據(jù)肘部法則的原理,將聚類數(shù)k 從1 開始依次增加,統(tǒng)計(jì)總畸變程度與聚類類別數(shù)k的關(guān)系,繪制聚合系數(shù)折線圖如圖2所示。
圖2 高鉀類樣品聚合系數(shù)折線圖
由圖可知,類數(shù)從1增加到3,總畸變程度下降速度較快,類數(shù)超過3 以后,總畸變程度變化變緩。因此k=3 為總畸變程度的“肘部”,最佳的樣品聚類數(shù)即為3。通過結(jié)合肘部法則和系統(tǒng)聚類分析,綜合分析比較所有項(xiàng)目,可以將高鉀類樣品進(jìn)一步劃分為三類,分類結(jié)果采用柱形圖來展示每一亞類各自的特征,其對(duì)應(yīng)的柱形分析圖如圖3 所示。對(duì)于鉛鋇類樣品,其分類的具體過程與高鉀類樣品相同。
圖3 高鉀類樣品亞類分析圖
對(duì)于高鉀類樣品:三種類別中,二氧化硅含量有著相對(duì)明顯的區(qū)別,由第一類至第三類,其二氧化硅的含量呈現(xiàn)下降趨勢(shì),故可以依據(jù)樣品中二氧化硅的含量將高鉀類樣品進(jìn)一步分為:高硅、中硅、低硅三類。
對(duì)于鉛鋇類樣品:對(duì)比五種類別,其二氧化硅的含量有明顯的的差異,而隨著二氧化硅含量的減少,樣品中鉛鋇的總含量總體呈現(xiàn)上升趨勢(shì),且在鉛鋇總含量上升的過程中,鉛鋇含量之間的占比大小關(guān)系也在發(fā)生著變化。由第一類至第五類,其二氧化硅的含量呈現(xiàn)下降趨勢(shì),而鉛鋇總含量總體呈現(xiàn)上升趨勢(shì),且鉛鋇含量占比大小關(guān)系發(fā)生了大于-近似相等-大于-近似相等-大于的變化,可以認(rèn)為該五種類別是按照樣品風(fēng)化程度進(jìn)行劃分的。依據(jù)以上的分析,可以根據(jù)每一類樣品的特點(diǎn)將鉛鋇類樣品進(jìn)一步分為:高硅、低硅、低鉛、鉛鋇、高鉛五類。
對(duì)于亞分類的結(jié)果,可以用圖4 的思維導(dǎo)圖來展示。
圖4 樣品分類示意圖
對(duì)通過系統(tǒng)聚類分析得到的亞分類結(jié)果進(jìn)行檢驗(yàn),主要衡量其合理性和敏感性。通過觀察分類結(jié)果,找出系統(tǒng)聚類分析所分類別的分類方法,故其具有一定合理性。對(duì)于其敏感性,采用啟用擾動(dòng)項(xiàng),設(shè)置擾動(dòng)范圍,將結(jié)果代回模型進(jìn)行計(jì)算,分析其與原始聚類中心點(diǎn)坐標(biāo)的歐氏距離,與真實(shí)值進(jìn)行比較得出模型的準(zhǔn)確率,設(shè)定干擾度變化分別為5%,10%,15%,20%,25%得出當(dāng)擾動(dòng)范圍為25%時(shí)模型的準(zhǔn)確率為93.2%,因此在一定程度上反映了分類的準(zhǔn)確性[4]。
綜上所述,聚類分析法在數(shù)據(jù)降維以及數(shù)據(jù)分類方面應(yīng)用廣泛,對(duì)簡化變量以及研究各類因素之間的關(guān)系具有一定參考價(jià)值。在用聚類分析法對(duì)玻璃類別進(jìn)行分類評(píng)價(jià)的工作中,反映出了高鉀類和鉛鋇類玻璃在成分含量上的差異,同時(shí)揭示了玻璃風(fēng)化對(duì)其成分含量的影響,這對(duì)于進(jìn)一步研究玻璃在不同狀態(tài)下化學(xué)成分的構(gòu)成規(guī)律有一定作用。因此,該方法可為解決電力設(shè)備玻璃老化問題提供思路,在電力設(shè)備維護(hù)方面具有重要作用與意義,將為未來電網(wǎng)的建設(shè)與發(fā)展作出貢獻(xiàn)。