雷 萌,李 翠,王 鑫,陳瑞成
(中國(guó)礦業(yè)大學(xué) 信息與電氣工程學(xué)院,江蘇 徐州 221116)
基于模糊聚類徑向基神經(jīng)網(wǎng)絡(luò)的煤質(zhì)分析模型
雷 萌,李 翠,王 鑫,陳瑞成
(中國(guó)礦業(yè)大學(xué) 信息與電氣工程學(xué)院,江蘇 徐州 221116)
為了實(shí)現(xiàn)煤炭指標(biāo)的快速智能預(yù)測(cè),建立了基于模糊聚類的徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,將已測(cè)定的收到基全水、收到基灰分、收到基揮發(fā)分和收到基全硫的含量作為分類指標(biāo)進(jìn)行模糊聚類,根據(jù)分類結(jié)果分別建立了基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的定量分析模型,對(duì)干燥無(wú)灰基揮發(fā)分、空干基全硫、收到基低位發(fā)熱量和空干基高位發(fā)熱量進(jìn)行了預(yù)測(cè),并與直接使用徑向基神經(jīng)網(wǎng)絡(luò)模型進(jìn)行比較。結(jié)果表明,該分析模型不僅精度高,且泛化能力強(qiáng),魯棒性好。
煤質(zhì)分析;分類指標(biāo);模糊聚類;徑向基函數(shù)神經(jīng)網(wǎng)絡(luò);定量分析模型
煤炭作為一種重要的化石能源,其質(zhì)量的優(yōu)劣對(duì)煤炭資源的生產(chǎn)、加工和應(yīng)用有著極大影響,從而使得煤質(zhì)分析工作顯得尤為必要。 在實(shí)際生產(chǎn)加工過(guò)程中,通常采用工業(yè)分析和發(fā)熱量等指標(biāo)來(lái)研究煤的性質(zhì)和組成[1-2]。根據(jù)文獻(xiàn)[1],反映煤質(zhì)的主要指標(biāo)有全水、灰分、揮發(fā)分、全硫、高位發(fā)熱量及低位發(fā)熱量,其中高位發(fā)熱量可以采用氫彈量熱法測(cè)得,低位發(fā)熱量可以根據(jù)相關(guān)指標(biāo)采用公式計(jì)算得到。對(duì)于上述指標(biāo),如果采用傳統(tǒng)的煤質(zhì)化驗(yàn)方法測(cè)得,則煤質(zhì)分析的過(guò)程繁瑣,分析時(shí)間較長(zhǎng),需要消耗大量的人力和物力,且無(wú)法實(shí)時(shí)反饋煤炭的質(zhì)量情況,具有一定局限性[3]。
由于煤炭的工業(yè)分析指標(biāo)存在復(fù)雜的對(duì)應(yīng)關(guān)系[4],因此可以根據(jù)部分指標(biāo)推算得到剩余指標(biāo)。例如:文獻(xiàn)[5]介紹了一種利用粒子群優(yōu)化算法進(jìn)行煤炭發(fā)熱量的預(yù)測(cè);文獻(xiàn)[6]介紹了一種基于機(jī)器學(xué)習(xí)的煤質(zhì)近紅外光譜分析的方法。文章利用模糊聚類的方法,將已測(cè)定的收到基全水、收到基灰分、收到基揮發(fā)分和收到基全硫的含量作為分類指標(biāo),對(duì)數(shù)據(jù)進(jìn)行分類,并根據(jù)分類結(jié)果分別建立徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,實(shí)現(xiàn)了干燥無(wú)灰基揮發(fā)分、空氣干燥基全硫、收到基低位發(fā)熱量和空氣干燥基高位發(fā)熱量的快速預(yù)測(cè)。
模糊聚類是按照一定的規(guī)則來(lái)對(duì)事物進(jìn)行區(qū)分和分類的過(guò)程,在這個(gè)過(guò)程中沒(méi)有任何關(guān)于分類的先驗(yàn)知識(shí)的指導(dǎo),僅據(jù)事物屬性的相似性作為類別劃分的依據(jù),它屬于無(wú)監(jiān)督的范疇。模糊聚類就是用數(shù)學(xué)的方法研究和處理給定對(duì)象的分類[7]。
模糊聚類的數(shù)學(xué)模型是使用數(shù)學(xué)語(yǔ)言及表達(dá)式對(duì)模糊聚類進(jìn)行描述[8-9]。設(shè)樣本集X={x1,x2,…,xn},它的每一個(gè)對(duì)象xk(k=1,2,…,n)有特征向量P(xk)=(xk1,xk2,…,xkn),其中xki是xk第i個(gè)特征上的值。聚類分析即為分析數(shù)據(jù)集X中的n個(gè)樣本所對(duì)應(yīng)的特征向量間的相似性問(wèn)題,按照樣本間的相似性關(guān)系,將樣本分成不相交的子集X1,X2,…,XC,該子集滿足條件:
X=X1∪X2∪……∪XC,
Xi∪Xj=Φ(1≤i≤j≤C)。
樣本點(diǎn)xk(k=1,2,…,n)對(duì)子集X1,X2,…,XC的隸屬關(guān)系可表示為:
(1)
模糊聚類的方法一般可分為以下幾種:譜系聚類方法、基于等價(jià)關(guān)系的聚類方法、基于圖論的聚類方法和基于目標(biāo)函數(shù)的聚類方法[10]。本研究主要采用譜系聚類法對(duì)樣本進(jìn)行分類。
徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)是一種兩層神經(jīng)網(wǎng)絡(luò),其隱含層的激活函數(shù)是高斯函數(shù),輸出層的激活函數(shù)是線性函數(shù)。由于高斯函數(shù)具有局部化接收輸入信息的特點(diǎn),所以RBF神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的局部映射能力,并且泛化能力較好,學(xué)習(xí)收斂速度很快,在非線性函數(shù)逼近、系統(tǒng)建模和模式識(shí)別等領(lǐng)域應(yīng)用較為廣泛。
隱含層第j個(gè)節(jié)點(diǎn)的輸出為:
(2)
式中:u1,j為隱含層第j個(gè)節(jié)點(diǎn)的輸出;x為n維輸入向量;w1,j為隱含層第j個(gè)高斯函數(shù)的中心;σ2j是反映第j個(gè)高斯函數(shù)的寬度;N1是隱含層的節(jié)點(diǎn)數(shù)。
輸出層第i個(gè)節(jié)點(diǎn)的輸出為:
yi=wT2,iu1(i=1,2,…,N2),
(3)
式中:yi為輸出層第i個(gè)節(jié)點(diǎn)的輸出;w2,i為隱含層指向輸出層第i個(gè)節(jié)點(diǎn)的權(quán)值向量;u1為隱含層的輸出向量;N2是輸出層的節(jié)點(diǎn)數(shù)。
由隱含層和輸出層節(jié)點(diǎn)的輸出表達(dá)式可以看出,RBF神經(jīng)網(wǎng)絡(luò)有三類可調(diào)參數(shù),分別為高斯函數(shù)的中心w1,i和寬度σ2i以及隱含層和輸出層之間的連接權(quán)值w2,i。RBF神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)就是以上三個(gè)參數(shù)的整定。1989年,Moody和Darken提出了一種由兩個(gè)階段組成的混合學(xué)習(xí)過(guò)程的思路[11]。兩個(gè)階段分別為:
(1)根據(jù)所有輸入樣本信息,利用聚類方法進(jìn)行隱含層徑向基函數(shù)(高斯函數(shù))中心和寬度的學(xué)習(xí),屬于無(wú)導(dǎo)師學(xué)習(xí)方法,常采用K均值聚類算法[12]。
(2)根據(jù)給定的訓(xùn)練樣本,利用有導(dǎo)師學(xué)習(xí)算法調(diào)整隱含層節(jié)點(diǎn)和輸出節(jié)點(diǎn)之間的連接權(quán)值,一般采用基于Delta學(xué)習(xí)規(guī)則的最小均方算法[13]。
利用譜系聚類的方法,將樣本中收到基全水分Mt(%)、收到基灰分Aar(%)、收到基揮發(fā)分Var(%)和收到基全硫St,ar(%)的含量作為分類指標(biāo),建立煤質(zhì)成分?jǐn)?shù)據(jù)分類模型,將樣本進(jìn)行分類。
煤質(zhì)成分?jǐn)?shù)據(jù)分類模型建立步驟:①樣本數(shù)據(jù)集X={x1,x2,…,xn}中的n個(gè)樣本點(diǎn)各自成為一類,計(jì)算任意兩個(gè)樣本點(diǎn)間的距離;②計(jì)算各類中的距離的最小值,如果兩類中的距離值最小,則兩類歸為一類,并由此建立新的分類;③計(jì)算合并后的新類別之間的距離值,此距離的計(jì)算準(zhǔn)則要和上步驟中計(jì)算距離的準(zhǔn)則一樣;④重復(fù)計(jì)算距離并合并類,一直將各類樣本歸為一類為止;⑤設(shè)置分類數(shù)目,將給定的樣本集合劃分成不同的類別[14]。
根據(jù)模糊聚類得到的分類結(jié)果,分別建立每一組樣本的RBF神經(jīng)網(wǎng)絡(luò)模型,輸入變量為收到基全水Mt(%)、收到基灰分Aar(%)、收到基揮發(fā)分Var(%)和收到基全硫St,ar(%);輸出變量為干燥無(wú)灰基揮發(fā)分Varf(%)、空干基全硫St,ad(%)、收到基低位發(fā)熱量Qnet,v,ar(kcal/kg)和干燥基高位發(fā)熱量Qgr,v,d(kcal/kg)。
RBF神經(jīng)網(wǎng)絡(luò)模型建立步驟:①初始化高斯函數(shù)的中心和寬度以及隱含層和輸出層的連接權(quán)值;②選擇均方誤差作為適應(yīng)度函數(shù)訓(xùn)練網(wǎng)絡(luò);③利用測(cè)試集樣本驗(yàn)證RBF網(wǎng)絡(luò)的性能。
根據(jù)國(guó)家標(biāo)準(zhǔn)[15],利用水分快速測(cè)定儀、灰分爐、揮發(fā)份爐、量熱儀、天平和干燥箱等設(shè)備測(cè)量煤炭樣本的收到基全水、收到基灰分、收到基揮發(fā)分、收到基全硫、干燥無(wú)灰基揮發(fā)分、空氣干燥基全硫、低位發(fā)熱量和干燥基高位發(fā)熱量[1]。所有測(cè)定指標(biāo)的精度均滿足相應(yīng)國(guó)家標(biāo)準(zhǔn)的要求,為預(yù)測(cè)模型提供了高可靠性的學(xué)習(xí)數(shù)據(jù)。
隨機(jī)抽取160組數(shù)據(jù)進(jìn)行分類,選取收到基全水、收到基灰分、收到基揮發(fā)分、收到基全硫作為分類指標(biāo),將數(shù)據(jù)分為兩類。模糊聚類分類模型的參數(shù)設(shè)置如下:樣本點(diǎn)距離采用歐氏距離d(xi,xj),類間距離采用類平均距離Dpq,分類數(shù)為2。d(xi,xj)和Dpq計(jì)算公式如下:
(4)
(5)
式中:xi、xj為兩個(gè)樣本點(diǎn);p為樣本容量;d(xi,xj)為兩個(gè)樣本點(diǎn)之間的距離;Gp、Gq為兩類不同的樣本;np、nq分別為各類樣本的樣本點(diǎn)數(shù)量;Dpq為類平均距離。
經(jīng)過(guò)仿真,得到前30個(gè)樣本點(diǎn)的譜系聚類圖,橫坐標(biāo)表示每個(gè)樣本點(diǎn),縱坐標(biāo)表示樣本點(diǎn)之間的距離,如圖1所示。圖1描述了樣本按距離準(zhǔn)則的聚集過(guò)程。
圖1 譜系聚類圖
模糊聚類的結(jié)果是:樣本被分為兩組,分別取名為樣本1和樣本2,樣本1容量為69,樣本2容量為91。每個(gè)樣本分別作為下一步驟中徑向基網(wǎng)絡(luò)預(yù)測(cè)模型的樣本集。
從樣本1中抽取60組樣本點(diǎn)作為訓(xùn)練集,8組樣本點(diǎn)作為測(cè)試集。建立RBF網(wǎng)絡(luò)模型,RBF網(wǎng)絡(luò)模型參數(shù)通過(guò)迭代法得到,參數(shù)設(shè)置結(jié)果如表1所示。
按照表1中設(shè)置的參數(shù),使用MATLAB軟件進(jìn)行仿真。圖2為樣本1各指標(biāo)徑向基網(wǎng)絡(luò)建立的訓(xùn)練過(guò)程,其中:圖2(a)為干燥無(wú)灰基揮發(fā)分訓(xùn)練過(guò)程,圖2 (b)為收到基低位發(fā)熱量訓(xùn)練過(guò)程,圖2 (c)為空干基全硫訓(xùn)練過(guò)程,圖2 (d)為空干基高位發(fā)熱量訓(xùn)練過(guò)程。從圖2中可看出,各指標(biāo)的訓(xùn)練過(guò)程在30步以內(nèi)均能完成,最終誤差小于0.000 4,即在設(shè)置的目標(biāo)誤差之下。
表1 迭代法得到的RBF網(wǎng)絡(luò)模型參數(shù)
圖2 樣本1各指標(biāo)訓(xùn)練過(guò)程
按照表1中設(shè)置的參數(shù),使用MATLAB軟件進(jìn)行仿真。圖3為樣本1各指標(biāo)徑向基網(wǎng)絡(luò)建立的訓(xùn)練過(guò)程。從圖3中可看出,各指標(biāo)的訓(xùn)練過(guò)程在30步以內(nèi)均能完成,最終誤差小于0.000 4,即在設(shè)置的目標(biāo)誤差之下。選取的評(píng)價(jià)指標(biāo)為相對(duì)誤差Eri,同時(shí)為了更好地觀察同一徑向基網(wǎng)絡(luò)的總體性誤差,定義一個(gè)標(biāo)準(zhǔn)誤差Emsr,其中Eri和Emsr計(jì)算公式如下:
(6)
(7)
式中:pi表示測(cè)試值;ti表示真實(shí)值;Eri表示相對(duì)誤差;Emsr為反映總體性的標(biāo)準(zhǔn)誤差;N表示每個(gè)樣本點(diǎn)的包含的指標(biāo)數(shù)量。
通過(guò)進(jìn)行了8次仿真實(shí)驗(yàn)得到了各類誤差結(jié)果。表2為該樣本的干燥無(wú)灰基揮發(fā)分、空氣干燥基全硫、收到基低位發(fā)熱量和空干基高位發(fā)熱量的相對(duì)誤差Er1、Er2、Er3、Er4,以及根據(jù)這四項(xiàng)指標(biāo)計(jì)算的反映總體性的標(biāo)準(zhǔn)誤差Emsr。從表2中可以看出,各指標(biāo)的相對(duì)誤差均較小,總體誤差在0.005~0.025之間。
表2 樣本1四項(xiàng)指標(biāo)相對(duì)誤差與總體的標(biāo)準(zhǔn)誤差
從樣本2中抽取60組樣本點(diǎn)作為訓(xùn)練集,8組樣本點(diǎn)作為測(cè)試集,建立RBF網(wǎng)絡(luò)模型,參數(shù)設(shè)置與樣本1相同。圖3為樣本2各指標(biāo)徑向基網(wǎng)絡(luò)建立的訓(xùn)練過(guò)程,圖3 (a)為干燥無(wú)灰基揮發(fā)分訓(xùn)練過(guò)程,圖3 (b)為收到基低位發(fā)熱量訓(xùn)練過(guò)程,圖3 (c)為空氣干燥基全硫訓(xùn)練過(guò)程,圖3 (d)為空氣干燥基高位發(fā)熱量訓(xùn)練過(guò)程。從圖3可以看出,和樣本1相似,訓(xùn)練網(wǎng)絡(luò)在30步以內(nèi)也可以達(dá)到目標(biāo)誤差。
圖3 樣本2各指標(biāo)訓(xùn)練過(guò)程
建立樣本2的訓(xùn)練網(wǎng)絡(luò),對(duì)測(cè)試樣本進(jìn)行測(cè)試,可得到各指標(biāo)相對(duì)誤差和標(biāo)準(zhǔn)誤差,如表3所示。從表3數(shù)據(jù)可看出,樣本2建立的RBF預(yù)測(cè)模型,預(yù)測(cè)誤差略大,但也在允許范圍內(nèi)。
對(duì)抽取的160組樣本數(shù)據(jù)不做聚類處理,從中隨機(jī)抽取60組樣本點(diǎn)作為訓(xùn)練集,8組樣本點(diǎn)作為測(cè)試集,建立RBF網(wǎng)絡(luò)預(yù)測(cè)模型,參數(shù)設(shè)置不變。在同一張圖上繪制不分類和分類后樣本1與樣本2的標(biāo)準(zhǔn)誤差,如圖4所示。
表3 樣本2四項(xiàng)指標(biāo)相對(duì)誤差與總體的標(biāo)準(zhǔn)誤差
圖4 樣本1、2與不分類樣本的總體標(biāo)準(zhǔn)誤差
從圖4可以明顯看出,不進(jìn)行模糊聚類,預(yù)測(cè)誤差遠(yuǎn)大于分類后的預(yù)測(cè)誤差。因此得出如下結(jié)論:基于模糊聚類的RBF網(wǎng)絡(luò)預(yù)測(cè)模型比僅僅使用RBF網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)更加準(zhǔn)確,效果更好。
煤質(zhì)分析在煤炭資源的生產(chǎn)、加工和利用中起著至關(guān)重要的作用,因此尋找一種預(yù)測(cè)精度更高的煤質(zhì)指標(biāo)分析預(yù)測(cè)模型尤為必要。實(shí)驗(yàn)證明,基于模糊聚類的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型對(duì)干燥無(wú)灰基揮發(fā)分、空氣干燥基全硫、收到基低位發(fā)熱量和空干基高位發(fā)熱量等煤質(zhì)指標(biāo)的預(yù)測(cè)較為準(zhǔn)確,為實(shí)現(xiàn)煤質(zhì)智能分析系統(tǒng)的設(shè)計(jì)提供了一種預(yù)測(cè)精度高的新模型。
[1] 張雙全, 吳國(guó)光. 煤化學(xué)[M].徐州:中國(guó)礦業(yè)大學(xué)出版社, 2004.
[2] 龔利華,劉廣新.用工業(yè)分析數(shù)據(jù)預(yù)測(cè)煤炭發(fā)熱量[C]. 工業(yè)技術(shù)委員會(huì)地質(zhì)分會(huì)/中國(guó)煤炭學(xué)會(huì)礦井地質(zhì)專業(yè)委員會(huì)2001年學(xué)術(shù)年會(huì)論文集.福建:煤炭工業(yè)技術(shù)委員會(huì)地質(zhì)分會(huì)、中國(guó)煤炭學(xué)會(huì)礦井地質(zhì)專業(yè)委員會(huì),2001:118-120.
[3] 施玉英.煤炭分析試驗(yàn)儀器設(shè)備的使用與維修[M].北京:煤炭工業(yè)出版社,2007.
[4] 江文豪,韋紅旗,屈天章,等.基于遺傳算法優(yōu)化參數(shù)的支持向量機(jī)燃煤發(fā)熱量預(yù)測(cè)[J].熱力發(fā)電,2011(3):14-19.
[5] 王建軍,王世營(yíng),雷 萌.粒子群優(yōu)化算法在煤炭發(fā)熱量中的應(yīng)用[J].工礦自動(dòng)化,2012(5):50-53.
[6] 雷 萌.基于機(jī)器學(xué)習(xí)的煤質(zhì)近紅外光譜分析[D].徐州:中國(guó)礦業(yè)大學(xué),2013.
[7] 高新波.模糊聚類分析及其應(yīng)用[M].西安:電子科技大學(xué)出版社,2004.
[8] 李晶皎,朱志良,王愛(ài)俠.模式識(shí)別(第二版)[M].北京:電子工業(yè)出版社,2004.
[9] 葉海軍. 模糊聚類分析技術(shù)及其應(yīng)用研究[D]. 合肥:合肥工業(yè)大學(xué),2006.
[10] 汪慶淼. 基于目標(biāo)函數(shù)的模糊聚類新算法及其應(yīng)用研究[D].鎮(zhèn)江:江蘇大學(xué), 2014.
[11] 鞏敦衛(wèi),孫曉燕.智能控制技術(shù)簡(jiǎn)明教程[M].北京:國(guó)防工業(yè)出版社,2010.
[12] 張 彬.基于聚類算法的RBF神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)綜述[J].綜述與評(píng)論,2012,31(12):1-7.
[13] 張 艷.基于RBF網(wǎng)絡(luò)辨識(shí)的模型參考自適應(yīng)控制系統(tǒng)分析與仿真[D].西安:西安交通大學(xué),2007.
[14] 葉海軍.模糊聚類分析技術(shù)及應(yīng)用研究[D].合肥:合肥工業(yè)大學(xué),2006.
[15] GB/T 213—2008煤的發(fā)熱量測(cè)定方法[S].
Coal assay analytical model based on fuzzy clustering RBF Neural Network
LEI Meng, LI Cui, WANG Xin, CHEN Rui-cheng
(School of Information and Electrical Engineering, China University of Mining and Technology, Xuzhou, Jiangsu 221116, China)
To achieve rapid and intelligent prediction of coal quality, a radial basis function (RBF) neural network prediction model based on fuzzy clustering was established. Based on measured contents of total moisture of as
basis, ash of as received basis, volatile matter of as received basis and total sulfur of as received basis in coal, fuzzy clustering was made; according to the results, several quantitative analytical models RBF based on neural network were established. The model can predict volatile matter of dry ash-free basis, total sulfur of air dried basis, low calorific value of as received basis and gross calorific value of dry basis in coal. And the comparison between the model and the direct use of RBF neural network model was made. The experimental results showed that the analytical model has high precision, strong generalization ability and good robustness.
coal assay; classification index;fuzzy cluster; RBF neural network; quantitative analytical modeling
TQ533
A
1001-3571(2015)04-0010-05
2015-04-09
10.16447/j.cnki.cpt.2015.04.003
江蘇省自然科學(xué)基金(BK20140215);中國(guó)博士后基金(2014M551695)
雷 萌(1987—),女,安徽省碭山市人,講師,博士,從事機(jī)器學(xué)習(xí)、煤質(zhì)智能在線分析等方面研究。
E-mail:leimengniee@163.com Tel:15895208707