鄒筱瑜 王福利 常玉清 鄭偉
過(guò)程運(yùn)行狀態(tài)評(píng)價(jià)在過(guò)程安全運(yùn)行的前提下,綜合考慮了產(chǎn)品質(zhì)量、物耗、能耗、經(jīng)濟(jì)收益等因素,對(duì)過(guò)程運(yùn)行性能優(yōu)劣進(jìn)行進(jìn)一步評(píng)價(jià),包括過(guò)程運(yùn)行狀態(tài)優(yōu)性在線評(píng)價(jià)和非優(yōu)運(yùn)行狀態(tài)原因追溯兩部分[1?5].優(yōu)性在線評(píng)價(jià)實(shí)時(shí)判斷運(yùn)行性能優(yōu)劣程度,非優(yōu)原因追溯診斷導(dǎo)致非優(yōu)運(yùn)行狀態(tài)的原因,指導(dǎo)操作人員進(jìn)行生產(chǎn)調(diào)整.理想的運(yùn)行狀態(tài)有助于提高綜合經(jīng)濟(jì)效益和生產(chǎn)效率、降低生產(chǎn)成本.因此,對(duì)過(guò)程運(yùn)行性能優(yōu)劣評(píng)價(jià)的研究具有重要的理論和應(yīng)用價(jià)值.
傳統(tǒng)的過(guò)程運(yùn)行性能評(píng)價(jià)方法可分為兩類:基于定量信息的評(píng)價(jià)方法和基于定性信息的評(píng)價(jià)方法,其中,定量信息指用數(shù)值大小描述的變量信息,定性信息指定性描述的變量信息,主要通過(guò)語(yǔ)義變量來(lái)描述.基于定量信息的評(píng)價(jià)方法處理以定量信息為主的過(guò)程性能評(píng)價(jià)問(wèn)題.多元統(tǒng)計(jì)方法是一種應(yīng)用最廣泛的定量評(píng)價(jià)方法,適用于過(guò)程先驗(yàn)知識(shí)較少的過(guò)程[6?8].Liu 等提出了基于主成分分析法(Principal component analysis,PCA)和多集合主成分分析法(Multi-set PCA,MsPCA)的運(yùn)行狀態(tài)優(yōu)性在線評(píng)價(jià)方法[9?10],但此類方法并沒(méi)有考慮過(guò)程變量與評(píng)價(jià)指標(biāo)之間的關(guān)系.基于指標(biāo)預(yù)測(cè)的評(píng)價(jià)方法,雖避免了此問(wèn)題,但所需數(shù)據(jù)量非常龐大[1?2].概率框架下的性能評(píng)價(jià)方法,如:基于高斯混合模型(Gaussian mixture model,GMM)[3,10]和貝葉斯理論(Bayesian theory)[11?12]的評(píng)價(jià)方法,已廣泛應(yīng)用于性能評(píng)價(jià)中.基于概率理論的評(píng)價(jià)方法需要先驗(yàn)知識(shí)輔助確定概率密度函數(shù).不同于經(jīng)典方法過(guò)于嚴(yán)苛的要求,智能評(píng)價(jià)方法,如基于人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)的評(píng)價(jià)方法,由于其學(xué)習(xí)能力和非線性處理能力強(qiáng),受到研究者的青睞[13?14].但是,此類方法容易陷入局部最優(yōu)值,可能出現(xiàn)過(guò)擬合現(xiàn)象.基于定性信息的評(píng)價(jià)方法處理以定性信息為主的過(guò)程性能評(píng)價(jià)問(wèn)題.最常用的處理定性信息的方法有貝葉斯網(wǎng)(Bayesian network,BN)、模糊理論(Fuzzy theory)和粗糙集理論(Rough set,RS)等.BN 通過(guò)建立表示因果關(guān)系的網(wǎng)絡(luò)和概率表來(lái)進(jìn)行性能評(píng)價(jià),BN 的構(gòu)建通常需要大量過(guò)程因果知識(shí)[15?16].模糊理論通過(guò)隸屬度函數(shù)來(lái)進(jìn)行評(píng)價(jià),但隸屬度函數(shù)和判定閾值的選取尚無(wú)嚴(yán)格的理論指導(dǎo)[17?18].RS 在保持分類能力不變的前提下,對(duì)數(shù)據(jù)表進(jìn)行約簡(jiǎn),去除冗余信息,提取啟發(fā)式規(guī)則,進(jìn)行評(píng)價(jià)[19].但經(jīng)典RS 并未考慮數(shù)據(jù)與目標(biāo)概念之間的覆蓋關(guān)系,因此,概率粗糙集(Probabilistic rough set,PRS)應(yīng)運(yùn)而生[20?22].PRS 定義了等價(jià)類與目標(biāo)概念的隸屬程度,以后驗(yàn)概率的形式量化數(shù)據(jù)與目標(biāo)概念之間的覆蓋關(guān)系.
定量方法的優(yōu)勢(shì)在于:精度高,能夠建立變量之間的相關(guān)性,預(yù)測(cè)性能較好,是提取過(guò)程內(nèi)部特性的方法,適用于變量測(cè)量準(zhǔn)確的過(guò)程.但是,傳統(tǒng)定量方法解釋性差,在樣本數(shù)目少時(shí),可能會(huì)出現(xiàn)病態(tài)的模型.定性方法的優(yōu)勢(shì)在于:解釋性強(qiáng),可以處理不精確的信息,模型建立容易,適用于過(guò)程存在定性信息的過(guò)程.但是,傳統(tǒng)定性方法精度低,要求數(shù)據(jù)類型覆蓋所有可能的運(yùn)行情況,是提取過(guò)程外部特性的方法,預(yù)測(cè)性能較差.若采用定性方法處理定量變量,需要將定量信息離散化,在信息離散化過(guò)程中,會(huì)損失有效信息,降低評(píng)價(jià)精度.綜上所述,定量與定性方法各有優(yōu)、劣勢(shì),相輔相成.在實(shí)際流程工業(yè)生產(chǎn)中,既有定量變量,又有定性變量.由于定性、定量變量共存的問(wèn)題,傳統(tǒng)評(píng)價(jià)方法難以直接應(yīng)用.
實(shí)際工業(yè)過(guò)程還可能面臨一個(gè)巨大的挑戰(zhàn),即流程工業(yè)特性.流程工業(yè)過(guò)程生產(chǎn)流程長(zhǎng),規(guī)模龐大,變量數(shù)目巨大,變量相關(guān)性復(fù)雜.一個(gè)流程工業(yè)生產(chǎn)過(guò)程,通常包含若干生產(chǎn)單元.同一個(gè)生產(chǎn)單元內(nèi),變量強(qiáng)耦合,不同生產(chǎn)單元間,變量弱耦合.生產(chǎn)過(guò)程從前至后,依序進(jìn)行,每一個(gè)生產(chǎn)單元的生產(chǎn)時(shí)間不盡相同.因此,將傳統(tǒng)的評(píng)價(jià)方法直接應(yīng)用于流程工業(yè)過(guò)程,常常難以得到令人滿意的準(zhǔn)確率.流程工業(yè)過(guò)程生產(chǎn)周期長(zhǎng)、變量眾多、機(jī)理復(fù)雜,難以建立準(zhǔn)確的全局模型.最常用的處理流程工業(yè)特性的方法就是將過(guò)程根據(jù)物理特性劃分層次和子塊,這種措施已廣泛應(yīng)用于安全性能評(píng)價(jià)中[23?24].Macgregor 等[25]和Jiang 等[26]分別提出了分塊的多元統(tǒng)計(jì)方法和分塊的概率論方法,來(lái)處理流程工業(yè)過(guò)程性能評(píng)價(jià)問(wèn)題.相比于分塊方法,分層的性能評(píng)價(jià)方法更注重子塊之間的相關(guān)性[27].在分層或分塊性能評(píng)價(jià)思想的基礎(chǔ)上,研究者在質(zhì)量預(yù)測(cè)[28]、自適應(yīng)[29]等方向進(jìn)行了進(jìn)一步探索.但目前對(duì)流程工業(yè)過(guò)程優(yōu)性評(píng)價(jià)的研究還較少.傳統(tǒng)的分層分塊性能評(píng)價(jià)方法難以直接應(yīng)用于實(shí)際流程工業(yè)過(guò)程運(yùn)行狀態(tài)評(píng)價(jià)中,主要原因如下:1)全流程的評(píng)價(jià)問(wèn)題難以分解為子塊的評(píng)價(jià)問(wèn)題;2)子塊的優(yōu)性難以定義;3)未考慮定量、定性變量共存問(wèn)題.
本文提出一種基于兩層分塊混合模型的流程工業(yè)過(guò)程運(yùn)行狀態(tài)評(píng)價(jià)方法.橫向上,將流程工業(yè)過(guò)程,根據(jù)其物理特性劃分子塊,將聯(lián)系緊密的設(shè)備或生產(chǎn)環(huán)節(jié)劃分至同一子塊內(nèi),將聯(lián)系相對(duì)較弱的設(shè)備或生產(chǎn)環(huán)節(jié)劃分至不同子塊;縱向上,形成兩個(gè)評(píng)價(jià)層次即子塊層和全流程層.本文所提兩層分塊方法與傳統(tǒng)方法不同之處在于,所提方法能夠評(píng)價(jià)子塊的優(yōu)劣程度,不需要顯式的全流程模型即可評(píng)價(jià)全流程的運(yùn)行狀態(tài),并快速定位非優(yōu)的子塊.這種靈活的分層分塊評(píng)價(jià)方式,為混合模型的建立提供了便利.在一個(gè)子塊內(nèi),綜合考慮評(píng)價(jià)精度需求、定量和定性變量的比例、模型建立的復(fù)雜度,來(lái)選擇定量或者定性方法進(jìn)行建模和評(píng)價(jià).不失一般性的,本文假設(shè):以定量信息為主的子塊,采用GMM 進(jìn)行建模,獲取子塊內(nèi)各運(yùn)行狀態(tài)等級(jí)數(shù)據(jù)分布的概率密度函數(shù);以定性信息為主的子塊,采用PRS 進(jìn)行建模,得到子塊內(nèi)各運(yùn)行狀態(tài)等級(jí)的推理規(guī)則;于是,可以建立兩層分塊GMM-PRS (Gaussion mixture model-probabilistic rough set)模型.該混合模型的優(yōu)勢(shì)在于,根據(jù)子塊的數(shù)據(jù)特性,靈活地選用恰當(dāng)?shù)脑u(píng)價(jià)方法,可減少有效信息的損失,保證方法的有效性.最后,本文將所提基于兩層分塊GMM-PRS模型的評(píng)價(jià)方法應(yīng)用于國(guó)內(nèi)某黃金濕法冶煉過(guò)程中,驗(yàn)證其有效性.此外,綜合經(jīng)濟(jì)效益是目前應(yīng)用最廣泛的過(guò)程運(yùn)行狀態(tài)評(píng)價(jià)指標(biāo)之一,本文采用綜合經(jīng)濟(jì)效益為全流程運(yùn)行狀態(tài)評(píng)價(jià)指標(biāo).
高斯分布是一種常見的數(shù)據(jù)分布,若高維空間點(diǎn)的分布近似為橢球體,則可用單一高斯密度函數(shù)來(lái)描述這些數(shù)據(jù)的分布特性.
令R1×J是服從高斯分布的J維過(guò)程數(shù)據(jù),該類數(shù)據(jù)的概率密度函數(shù)可以用高斯函數(shù)表示:
其中,參數(shù)θ{μ,Σ},μ為該類數(shù)據(jù)的均值向量,Σ為協(xié)方差矩陣[11].這些參數(shù)的取值決定了概率密度函數(shù)的特性,如函數(shù)的中心點(diǎn)、寬窄和形狀等.
一些過(guò)程數(shù)據(jù)不服從高斯分布,但可以用高斯混合模型描述其分布特性.假設(shè)該過(guò)程數(shù)據(jù)分布包含N個(gè)高斯分量,第n個(gè)高斯分量的概率密度函數(shù)表示為g(x|θn),其先驗(yàn)概率為ωn,n1,2,···,N.則此過(guò)程概率密度函數(shù)為:
數(shù)據(jù)x屬于各高斯分量的概率可用貝葉斯理論求得:
其中,Cn表示第n個(gè)高斯成分.
RS是一種在不需要過(guò)程先驗(yàn)知識(shí)的情況下進(jìn)行推理的方法,針對(duì)定性數(shù)據(jù),可進(jìn)行高效、準(zhǔn)確的推理.但是,RS存在沒(méi)考慮子集間相關(guān)性和定義過(guò)于嚴(yán)格的問(wèn)題.因此,PRS應(yīng)運(yùn)而生.
令U為目標(biāo)的非空有限集合,U稱作論域,A為一個(gè)有限的屬性集合,R是A的一個(gè)子集.對(duì)于任意,定義x在R上的等價(jià)類[x]R為[x]R(x,a)f(y,a)},其中,f(x,a)為x在屬性a上的取值.給定一個(gè)非空子集X ?U和一個(gè)等價(jià)類[x]R,可以計(jì)算如下概率:
其中,|S|表示集合S的基,即S中的元素個(gè)數(shù).P(X|[x]R)表示[x]R中,X的覆蓋程度.
給定閾值α和β,針對(duì)0≤β <α≤1的情況,X的下近似、上近似、R邊界域定義為:
針對(duì)αβ0的情況,X的下近似、上近似、R邊界域定義為:
X的下近似中,包含所有一定屬于X的元素;X的上近似中,包含所有可能屬于X的元素.如果邊界域BNR(X)為空,那么X稱為精確集;否則,X稱為粗糙集.如果取α1、β0,PRS退化為傳統(tǒng)RS.
根據(jù)流程工業(yè)特性,本文提出兩層分塊評(píng)價(jià)結(jié)構(gòu),并根據(jù)每個(gè)子塊的數(shù)據(jù)特性,分別用定量或定性方法,建立子塊評(píng)價(jià)模型.
過(guò)程運(yùn)行狀態(tài)的優(yōu)劣通??煞从吃诰C合經(jīng)濟(jì)指標(biāo)(Comprehensiveeconomicindex,CEI)上,CEI越高,運(yùn)行狀態(tài)越好,CEI 也成為了廣泛接受的運(yùn)行狀態(tài)優(yōu)性評(píng)價(jià)指標(biāo)[23].傳統(tǒng)評(píng)價(jià)方法對(duì)過(guò)程變量x和評(píng)價(jià)指標(biāo)CEI可建立一個(gè)單模型:
為了降低流程工業(yè)過(guò)程運(yùn)行狀態(tài)評(píng)價(jià)問(wèn)題的規(guī)模、提高模型解釋性,本文提出如圖1所示的兩層分塊結(jié)構(gòu);并且,對(duì)以定量和定性信息為主的子塊,分別進(jìn)行定量和定性建模.
在子塊層,一個(gè)流程工業(yè)過(guò)程根據(jù)其過(guò)程特性,劃分為多個(gè)有物理意義的子塊.子塊內(nèi),變量相關(guān)性強(qiáng);子塊間,變量相關(guān)性弱.在全流程層,提取各子塊間的相關(guān)性.因此,兩層分塊結(jié)構(gòu)增強(qiáng)了模型解釋性,減少了問(wèn)題規(guī)模,降低了建模難度,削弱了對(duì)子塊性能無(wú)關(guān)變量的影響,放大了對(duì)子塊性能有關(guān)變量的影響.
圖1 兩層分塊混合模型結(jié)構(gòu)示意圖Fig.1 The illustration of the two-level multi-block hybrid model structure
將過(guò)程進(jìn)行橫向分塊、縱向分層后,得到了兩層分塊結(jié)構(gòu),再根據(jù)每個(gè)子塊的特性建立相應(yīng)評(píng)價(jià)模型,為全流程的評(píng)價(jià)提供基礎(chǔ).按照子塊的數(shù)據(jù)特性選擇適當(dāng)?shù)慕7椒?保證了模型的有效性和精度.高斯分布是一種常見的數(shù)據(jù)分布,若高維空間點(diǎn)的分布近似為橢球體,則可用單一高斯密度函數(shù)來(lái)描述這些數(shù)據(jù)的概率密度函數(shù).針對(duì)以定量信息為主的單模態(tài)過(guò)程,同一運(yùn)行狀態(tài)等級(jí)的定量數(shù)據(jù)分布特性相似,近似服從單高斯分布,可視為所有定量數(shù)據(jù)分布的一個(gè)高斯成分.過(guò)程中,定性變量的數(shù)目和狀態(tài)種類都較少,因此,定性變量可能出現(xiàn)狀態(tài)組合種類不會(huì)很多,其分布可以用歷史數(shù)據(jù)進(jìn)行學(xué)習(xí).而對(duì)于定性信息占主導(dǎo)地位的過(guò)程,定性變量數(shù)目多,相應(yīng)定性狀態(tài)的組合數(shù)目也會(huì)大幅增大.那么,基于GMM 的方法,會(huì)面臨組合爆炸、建模數(shù)量龐大的問(wèn)題.也就是說(shuō),以定性變量為主的過(guò)程,不再適合用基于概率分布的方法來(lái)進(jìn)行評(píng)價(jià).Pawlak 教授提出的RS 理論是一種在不確定性存在的前提下,進(jìn)行推理的方法,現(xiàn)已廣泛應(yīng)用于安全性評(píng)價(jià)和風(fēng)險(xiǎn)評(píng)價(jià)等領(lǐng)域.為改進(jìn)RS 無(wú)法處理不一致規(guī)則的問(wèn)題,概率粗糙集PRS 方法應(yīng)運(yùn)而生.PRS 是一種具有嚴(yán)格理論支撐并且應(yīng)用廣泛的定性信息處理方法,因此本文采用PRS 對(duì)以定性信息為主的子塊進(jìn)行建模.值得注意的是,可選的子塊建模方法并不局限于GMM 和PRS 方法.
2.1.1 運(yùn)行狀態(tài)等級(jí)確定
本文所述定性信息指用語(yǔ)義變量對(duì)變量狀態(tài)進(jìn)行描述的信息,定量信息指用數(shù)值大小描述的變量信息.建模數(shù)據(jù)中,定量變量以變量取值的形式表示,定性變量以變量狀態(tài)等級(jí)序號(hào)的形式表示,如溫度的高、中、低三種狀態(tài),分別對(duì)應(yīng)狀態(tài)等級(jí)1、2、3.其中,定性變量狀態(tài)等級(jí)只與變量幅值大小趨勢(shì)相關(guān),與性能優(yōu)劣無(wú)關(guān).本文所使用的定量數(shù)據(jù)是經(jīng)過(guò)平滑處理后的數(shù)據(jù),定性數(shù)據(jù)根據(jù)其物理意義劃分為了不同狀態(tài),并用一系列連續(xù)的正整數(shù)對(duì)狀態(tài)等級(jí)進(jìn)行區(qū)分.其中,平滑處理的原理是用一定長(zhǎng)度的滑動(dòng)窗口內(nèi)數(shù)據(jù)的平均水平來(lái)代表該滑動(dòng)窗口的信息,這種預(yù)處理方法在一定程度上克服了噪聲的影響,使此均值更能反映滑動(dòng)窗口內(nèi)的主要信息.針對(duì)變化快速或噪聲水平較低的過(guò)程,為避免過(guò)程動(dòng)態(tài)特性被淹沒(méi),滑動(dòng)窗口長(zhǎng)度不宜過(guò)長(zhǎng).針對(duì)變化緩慢或噪聲水平較高的過(guò)程,為減少系統(tǒng)正常波動(dòng)導(dǎo)致的誤評(píng)價(jià),滑動(dòng)窗口長(zhǎng)度不宜過(guò)短.
根據(jù)過(guò)程知識(shí),建立兩層分塊結(jié)構(gòu)之后,基于兩層分塊GMM-PRS 的評(píng)價(jià)模型離線建立包括運(yùn)行狀態(tài)等級(jí)確定和模型建立,其中,模型建立分定量GMM 和定性PRS 模型.
針對(duì)一個(gè)復(fù)雜的流程工業(yè)過(guò)程,在劃分單元子塊之后,如果各子塊存在獨(dú)立的評(píng)價(jià)指標(biāo),那么可以對(duì)每個(gè)子塊建立以子塊生產(chǎn)指標(biāo)為評(píng)價(jià)標(biāo)準(zhǔn)的模型,再在子塊生產(chǎn)指標(biāo)的基礎(chǔ)上,進(jìn)行全流程的運(yùn)行狀態(tài)評(píng)價(jià).但是,本文旨在解決無(wú)子塊評(píng)價(jià)指標(biāo)的流程工業(yè)過(guò)程運(yùn)行狀態(tài)優(yōu)性評(píng)價(jià)問(wèn)題.此時(shí),子塊的優(yōu)性定義變得十分困難.本文利用唯一的評(píng)價(jià)指標(biāo)– 全流程綜合經(jīng)濟(jì)指標(biāo)CEI,作為子塊運(yùn)行狀態(tài)等級(jí)劃分標(biāo)準(zhǔn).企業(yè)通常會(huì)在一定周期內(nèi)對(duì)CEI 進(jìn)行估算并作為生產(chǎn)考核的標(biāo)準(zhǔn),但是估算周期比較長(zhǎng),無(wú)法直接根據(jù)該估算結(jié)果實(shí)時(shí)指導(dǎo)生產(chǎn).所以,我們可以將CEI 視作定性變量,只需確定其在一定周期內(nèi)的定性狀態(tài).根據(jù)全流程CEI 的定性狀態(tài),過(guò)程運(yùn)行狀態(tài)被劃分為若干等級(jí),等級(jí)數(shù)目通常由過(guò)程評(píng)價(jià)的精度需求、過(guò)程檢測(cè)情況等因素共同決定.本文假設(shè)全流程綜合經(jīng)濟(jì)指標(biāo)包含N個(gè)狀態(tài),對(duì)應(yīng)的全流程運(yùn)行狀態(tài)等級(jí)由1 至N,優(yōu)性依次降低.在劃分子塊后,就一個(gè)子塊的一類運(yùn)行情況而言,定義此類運(yùn)行情況下所能達(dá)到的最好全流程運(yùn)行狀態(tài)等級(jí)為這種運(yùn)行情況下該子塊的運(yùn)行狀態(tài)等級(jí).從另一個(gè)角度看,該運(yùn)行情況下,當(dāng)其他子塊都處于最好匹配狀態(tài)時(shí),該子塊使全流程所能達(dá)到的最好等級(jí)代表了該子塊所處運(yùn)行情況的極限最好情況,是子塊所處運(yùn)行情況固有特性的一種體現(xiàn).如圖2 所示,建模數(shù)據(jù)的運(yùn)行狀態(tài)等級(jí)離線確定方法包括以下三個(gè)步驟:1)數(shù)據(jù)塊劃分,2)全流程層等級(jí)確定,3)子塊層等級(jí)確定.
1)數(shù)據(jù)塊劃分
令建模數(shù)據(jù)為RH×J,H表示樣本個(gè)數(shù),J表示變量個(gè)數(shù).根據(jù)變量和子塊之間的關(guān)系,將建模數(shù)據(jù)XXX劃分為I個(gè)子塊,用XXXiRH×Ji(i1,2,···,I)表示第i個(gè)子塊的建模數(shù)據(jù),Ji為第i個(gè)子塊的變量數(shù)目.
2)全流程層等級(jí)確定
根據(jù)全流程評(píng)價(jià)指標(biāo)CEI,過(guò)程運(yùn)行狀態(tài)被劃分為若干等級(jí),如:優(yōu)/良/中/差等.那么,每一個(gè)子塊數(shù)據(jù)XXXi,可以根據(jù)全流程評(píng)價(jià)指標(biāo)CEI,劃分為不同等級(jí),記為其中,表示子塊i中全流程等級(jí)為n的數(shù)據(jù),i1,2,···,I,n1,2,···,N,I為子塊數(shù)目,N為全流程等級(jí)數(shù)目.
圖2 離線數(shù)據(jù)劃分示意圖Fig.2 The diagram of data processing
3)子塊層等級(jí)確定
由于全流程層運(yùn)行狀態(tài)等級(jí)不能單獨(dú)取決于一個(gè)子塊的運(yùn)行狀態(tài),所以,相似的子塊數(shù)據(jù)可能被標(biāo)記了不同的全流程層運(yùn)行狀態(tài)等級(jí).對(duì)于一個(gè)子塊:若該子塊運(yùn)行于最優(yōu)運(yùn)行狀態(tài),并且其他子塊運(yùn)行于最優(yōu)匹配狀態(tài)時(shí),全流程層運(yùn)行狀態(tài)可能達(dá)到最優(yōu)等級(jí);若該子塊運(yùn)行于一個(gè)非優(yōu)運(yùn)行狀態(tài)中,無(wú)論其他子塊是否運(yùn)行于最優(yōu)匹配狀態(tài),全流程層運(yùn)行狀態(tài)都不可能達(dá)到最優(yōu)等級(jí).因此,一個(gè)子塊數(shù)據(jù)的子塊層運(yùn)行狀態(tài)等級(jí)定義為:該子塊內(nèi)相同數(shù)據(jù)所能達(dá)到的最好全流程層運(yùn)行狀態(tài)等級(jí).所以,全流程層的等級(jí)數(shù)目和子塊層的等級(jí)數(shù)目相等.假設(shè)運(yùn)行狀態(tài),等級(jí)1 到N的優(yōu)性依次降低.確定子塊層運(yùn)行狀態(tài)等級(jí)n中數(shù)據(jù)的具體做法為:以全流程層等級(jí)n,n+1,···,N中數(shù)據(jù)為基礎(chǔ),將等級(jí)n+1,n+2···,N中與等級(jí)n中數(shù)據(jù)相似度大于閾值ε的數(shù)據(jù),從原來(lái)的等級(jí)中轉(zhuǎn)移至等級(jí)n的數(shù)據(jù)集中,更新后的等級(jí)n中的數(shù)據(jù)為子塊層運(yùn)行狀態(tài)等級(jí)為n的數(shù)據(jù),記為,更新后的等級(jí)n+1,n+2,···,N中的數(shù)據(jù)為確定下一等級(jí)數(shù)據(jù)的基礎(chǔ).兩條數(shù)據(jù)的相似度定義如下:
x1,j(x2,j)是x1(x2)的第j個(gè)變量;若第j個(gè)變量為定量變量,是該變量的工藝最大值(最小值);若第j個(gè)變量為定性變量,|x1,j?x2,j|表示x1,j和x2,j對(duì)應(yīng)定性狀態(tài)等級(jí)的等級(jí)差值的絕對(duì)值;Aj是第j個(gè)變量的狀態(tài)等級(jí)數(shù)目,為變量數(shù)目.
根據(jù)上述三個(gè)步驟,子塊數(shù)據(jù)的全流程層等級(jí)和子塊層等級(jí)能相應(yīng)確定.由于上述等級(jí)劃分規(guī)則,并不需要建立顯式的全流程層模型.全流程層運(yùn)行狀態(tài)等級(jí)由子塊層中最劣的子塊運(yùn)行狀態(tài)等級(jí)決定,原因?qū)⒃诘? 節(jié)的全流程運(yùn)行狀態(tài)在線評(píng)價(jià)方法中闡述.
2.2.1 定量建模
針對(duì)以定量信息為主的子塊,將每一個(gè)運(yùn)行狀態(tài)等級(jí)的數(shù)據(jù)作為一個(gè)高斯分量,分別建立單高斯模型,擬合各等級(jí)數(shù)據(jù)的概率密度函數(shù).但由于少數(shù)定性變量的存在,無(wú)法直接建立高斯模型.
假設(shè)x來(lái)自于第i個(gè)子塊的第n個(gè)等級(jí),即.令其中,表示定性變量,表示定量變量.根據(jù)定性變量狀態(tài)的不同,存在多種組合形式.以定量信息為主的子塊所含定性變量數(shù)目少,一個(gè)定性變量的狀態(tài)種類一般不會(huì)很多,不是每一種理論上存在的定性組合都會(huì)在實(shí)際應(yīng)用中出現(xiàn).所以,中可能出現(xiàn)的定性狀態(tài)組合種類一般不會(huì)很多.用表示中,定性變量對(duì)應(yīng)為的樣本的定量變量部分,其中,k1,2,···,K,K為定性變量組合的數(shù)目.假設(shè)則針對(duì)定性變量為的情況,第i個(gè)子塊第n個(gè)等級(jí)的概率密度函數(shù)可用高斯函數(shù)表示為:
其中,Num[ψ]表示矩陣ψ中的樣本個(gè)數(shù).
2.2.2 定性建模
針對(duì)以定性信息為主的子塊,采用PRS 進(jìn)行建模.基于PRS 的離線建模包含以下三個(gè)主要步驟:1)數(shù)據(jù)預(yù)處理;2)決策表組織;3)屬性約簡(jiǎn).
1)數(shù)據(jù)預(yù)處理
PRS 是一種以定性或離散數(shù)據(jù)為基礎(chǔ)的推理方法,因此,需要將數(shù)據(jù)進(jìn)行相應(yīng)預(yù)處理.針對(duì)定性數(shù)據(jù),為后文計(jì)算方便,將變量的各定性狀態(tài)用一系列整數(shù)表示.針對(duì)以定性信息為主的子塊中少數(shù)的定量數(shù)據(jù),需要將定量數(shù)據(jù)進(jìn)行離散化,得到一系列離散數(shù)值.離散化處理方法很多,如等距離劃分、等頻率劃分、Naive Scaler 算法、基于斷點(diǎn)重要性的離散化算法、基于屬性重要性的離散化算法等[30].
2)決策表組織
決策表的每一列表示一個(gè)屬性,每個(gè)屬性的取值被劃分為若干離散狀態(tài).通常,屬性可分為條件屬性和決策屬性.決策表每一行代表論域中的一個(gè)元素和一種推理規(guī)則.以子塊內(nèi)過(guò)程變量為條件屬性,以子塊層運(yùn)行狀態(tài)等級(jí)為決策屬性,分別建立各子塊決策表.
3)屬性約簡(jiǎn)
屬性約簡(jiǎn)目的在于簡(jiǎn)化決策表,在保持分類能力不變的前提下,刪除對(duì)決策沒(méi)有影響的條件屬性.常用的屬性約簡(jiǎn)方法有:一般約簡(jiǎn)算法、基于差別矩陣和邏輯運(yùn)算的屬性約簡(jiǎn)算法、歸納屬性約簡(jiǎn)算法等[30].
基于兩層分塊GMM-PRS 的過(guò)程運(yùn)行狀態(tài)在線評(píng)價(jià)方法,先在子塊層,對(duì)各個(gè)子塊分別進(jìn)行評(píng)價(jià),再在全流程層,綜合各子塊信息得到最終評(píng)價(jià)結(jié)果.針對(duì)非優(yōu)運(yùn)行狀態(tài),在非優(yōu)的子塊內(nèi)進(jìn)行原因追溯.
用xt表示t時(shí)刻子塊i的數(shù)據(jù).若子塊i為以定量變量為主的子塊,xt可分解為xt中的定性變量取值與的相似度為sim針對(duì)等級(jí)n,如果max小于一個(gè)事先定義的判定閾值δ(0<δ ≤1),那么認(rèn)為xt不可能處于此等級(jí),令否則,可以根據(jù)式(12)獲得.
若子塊i為以定性變量為主的子塊,在子塊內(nèi),首先,對(duì)定量變量進(jìn)行離散化.然后,從歷史數(shù)據(jù)中得到xt的等價(jià)類[xt]R,其中,R為條件屬性集合.最后,根據(jù)式(4)計(jì)算[xt]屬于子塊層第n等級(jí)的概率:
其中,n1,2,···,N,i1,2,···,I.
t時(shí)刻,子塊i所處運(yùn)行狀態(tài)等級(jí)為:
在獲得所有子塊的子塊層運(yùn)行狀態(tài)等級(jí)后,全流程層運(yùn)行狀態(tài)等級(jí)與子塊層最劣的子塊運(yùn)行狀態(tài)等級(jí)相等.假設(shè)全流程層等級(jí)1 至N,優(yōu)性依次遞減.那么全流程層運(yùn)行狀態(tài)等級(jí)表示為:
顯然,根據(jù)子塊等級(jí)定義,由于各子塊運(yùn)行狀態(tài)等級(jí)被定義為相似度大于閾值ε的同類數(shù)據(jù)所能達(dá)到的歷史最好全流程層等級(jí),所以全流程層運(yùn)行狀態(tài)等級(jí)不可能比任何一個(gè)子塊的運(yùn)行狀態(tài)等級(jí)更優(yōu).也就是說(shuō),全流程層運(yùn)行狀態(tài)等級(jí)不會(huì)比子塊層最劣的子塊運(yùn)行狀態(tài)等級(jí)更優(yōu).從另一個(gè)角度看,如果全流程層運(yùn)行狀態(tài)等級(jí)比子塊層最劣的子塊運(yùn)行狀態(tài)等級(jí)更劣,說(shuō)明全流程層運(yùn)行狀態(tài)等級(jí)比所有子塊運(yùn)行狀態(tài)等級(jí)都更差.這種情況在實(shí)際生產(chǎn)中較少出現(xiàn),大部分子塊運(yùn)行狀態(tài)應(yīng)與全流程運(yùn)行狀態(tài)相一致.所以,定義全流程層運(yùn)行狀態(tài)等級(jí)為子塊層最劣運(yùn)行狀態(tài)等級(jí),如式(15)所示.
針對(duì)以定性變量為主的子塊,直接在最優(yōu)運(yùn)行狀態(tài)等級(jí)歷史數(shù)據(jù)中,查找與當(dāng)前非優(yōu)數(shù)據(jù)xt相似度最高的數(shù)據(jù),記為與上述追溯方法類似,用式(16)中的公式,計(jì)算變量貢獻(xiàn)率,貢獻(xiàn)率較大的屬性為非優(yōu)屬性.
濕法冶金過(guò)程是現(xiàn)代工業(yè)生產(chǎn)中金屬富集、分離與提取的重要手段和技術(shù).濕法冶金,又稱之為化學(xué)冶金,是相對(duì)于火法冶金和電解法冶金而言,一種利用液相環(huán)境的特點(diǎn),通過(guò)一定的化學(xué)反應(yīng),進(jìn)行目標(biāo)金屬的提煉和萃取的技術(shù).黃金濕法冶煉通過(guò)液相環(huán)境,將礦石中固相的金,浸出至礦漿中,形成液相的金氰絡(luò)合物離子.在浸出子塊中,氰化鈉是一種重要的添加藥劑,并通過(guò)影響浸出率來(lái)影響綜合經(jīng)濟(jì)效益.然后,通過(guò)洗滌進(jìn)行固液分離,得到礦渣和富含金氰絡(luò)合物離子的貴液.其中,貴液經(jīng)過(guò)鋅粉,發(fā)生置換反應(yīng),得到金泥.在置換環(huán)節(jié)中,鋅粉的添加量和質(zhì)量對(duì)運(yùn)行狀態(tài)影響較大.
本文將所提評(píng)價(jià)方法應(yīng)用于國(guó)內(nèi)某黃金濕法冶煉過(guò)程中,該過(guò)程可劃分為五個(gè)子塊:第一次浸出、第一次洗滌、第二次浸出、第二次洗滌和第二次置換,分別對(duì)應(yīng)子塊層的五個(gè)子塊.兩浸兩洗的工藝設(shè)置是為了提高浸出率.黃金濕法冶煉過(guò)程是一個(gè)復(fù)雜的流程工業(yè)過(guò)程,同時(shí)包含定量和定性變量.第一次浸出和第二次浸出子塊以定量信息為主,因此,用GMM 對(duì)這兩個(gè)子塊進(jìn)行建模.第一次洗滌和第二次洗滌子塊以定性信息為主,因此,用PRS 對(duì)這兩個(gè)子塊進(jìn)行建模.至于置換子塊,定性和定量信息大量共存,沒(méi)有某種信息占主導(dǎo)地位的現(xiàn)象.但是,其影響優(yōu)性的關(guān)鍵變量均為定性變量,故采用PRS 對(duì)置換子塊進(jìn)行建模.
選取36 個(gè)過(guò)程變量,列于表1.根據(jù)綜合經(jīng)濟(jì)效益先將黃金濕法冶煉全流程層運(yùn)行狀態(tài)劃分為優(yōu)、中、差3 個(gè)等級(jí),分別對(duì)應(yīng)等級(jí)1、2、3.從濕法冶金仿真平臺(tái),選取3 000 組數(shù)據(jù)進(jìn)行離線建模,其中,每個(gè)等級(jí)的數(shù)據(jù)各1 000 組,建模數(shù)據(jù)量充分,可以建立準(zhǔn)確的離線模型.然后,確定每個(gè)子塊各個(gè)等級(jí)所包含的數(shù)據(jù),即確定數(shù)據(jù)子塊層等級(jí).根據(jù)5個(gè)子塊的特性,分別建立GMM 或PRS 模型.設(shè)置相似度判定閾值ε0.9.
重新選取400 組數(shù)據(jù)進(jìn)行在線測(cè)試,實(shí)驗(yàn)設(shè)計(jì)如表2 所示.在實(shí)驗(yàn)1 中,前100 組數(shù)據(jù)運(yùn)行狀態(tài)等級(jí)為優(yōu)(等級(jí)1),后100 組數(shù)據(jù)由于氰化鈉添加量2 (子塊3,定量)不足,導(dǎo)致運(yùn)行狀態(tài)等級(jí)變?yōu)椴?等級(jí)3).在實(shí)驗(yàn)2 中,前100 組數(shù)據(jù)運(yùn)行狀態(tài)等級(jí)為優(yōu),后100 組數(shù)據(jù)由于鋅粉添加量(子塊5,定性)過(guò)量,導(dǎo)致運(yùn)行狀態(tài)等級(jí)變?yōu)橹?其中,在實(shí)際生產(chǎn)中,鋅粉添加量只能獲得8 小時(shí)的累積量,因此,在本實(shí)驗(yàn)中,將該變量作為定性變量進(jìn)行處理.用所提方法進(jìn)行運(yùn)行狀態(tài)在線評(píng)價(jià)和非優(yōu)原因追溯,以驗(yàn)證其有效性.
表1 過(guò)程變量列表Table 1 The process variable list
表2 實(shí)驗(yàn)設(shè)計(jì)Table 2 The experiment design
實(shí)驗(yàn)1 的評(píng)價(jià)結(jié)果如圖3 所示,在評(píng)價(jià)時(shí)間內(nèi):子塊1、2、4、5 都處于等級(jí)1;子塊3 前100 個(gè)評(píng)價(jià)點(diǎn)處于等級(jí)1,后100 個(gè)評(píng)價(jià)點(diǎn)處于等級(jí)3;全流程運(yùn)行狀態(tài)評(píng)價(jià)結(jié)果為前100 個(gè)評(píng)價(jià)點(diǎn)處于等級(jí)1,后100 個(gè)評(píng)價(jià)點(diǎn)處于等級(jí)3.顯然,評(píng)價(jià)結(jié)果與實(shí)際運(yùn)行狀態(tài)等級(jí)設(shè)置一致.從第101 個(gè)評(píng)價(jià)點(diǎn)起,全流程運(yùn)行狀態(tài)等級(jí)為非優(yōu)等級(jí),導(dǎo)致全流程非優(yōu)的是子塊3,第二次浸出子塊.因此,在子塊3 中,進(jìn)行非優(yōu)原因追溯.第101 個(gè)評(píng)價(jià)點(diǎn)的非優(yōu)原因追溯結(jié)果如圖4 所示,顯示非優(yōu)原因變量有第二次浸出氰化鈉添加量、第二次浸出后氰根離子濃度和第二次浸出后金氰絡(luò)合物離子濃度.事實(shí)上,由于第二次氰化鈉添加量不足,會(huì)導(dǎo)致第二次浸出后氰根離子和金氰絡(luò)合物離子濃度下降.因此,非優(yōu)原因追溯結(jié)果與實(shí)際情況一致.
圖3 實(shí)驗(yàn)1 運(yùn)行狀態(tài)等級(jí)在線評(píng)價(jià)結(jié)果Fig.3 The assessment result in Case 1
實(shí)驗(yàn)2 的評(píng)價(jià)結(jié)果如圖5 所示,在評(píng)價(jià)時(shí)間內(nèi):子塊1、2、3、4 都處于等級(jí)1;子塊5 前100 個(gè)評(píng)價(jià)點(diǎn)處于等級(jí)1,后100 個(gè)評(píng)價(jià)點(diǎn)處于等級(jí)2;相應(yīng)的,全流程評(píng)價(jià)結(jié)果為前100 個(gè)評(píng)價(jià)點(diǎn)處于運(yùn)行狀態(tài)等級(jí)1,后100 個(gè)評(píng)價(jià)點(diǎn)處于等級(jí)2.評(píng)價(jià)結(jié)果與實(shí)際運(yùn)行狀態(tài)等級(jí)設(shè)置一致.然后,在非優(yōu)的子塊中,進(jìn)行原因追溯.非優(yōu)的子塊為置換子塊,是一個(gè)定性建模的子塊,其追溯結(jié)果展示于圖6.實(shí)際上,鋅粉添加量過(guò)多,置換率已無(wú)法再提升,反而會(huì)增加置換物耗,降低總經(jīng)濟(jì)效益,導(dǎo)致運(yùn)行狀態(tài)等級(jí)變?yōu)榉莾?yōu).
圖4 實(shí)驗(yàn)1 子塊3 中非優(yōu)原因追溯結(jié)果Fig.4 The cause identification result within Sub-block 3 in Case 1
與傳統(tǒng)評(píng)價(jià)方法相比,兩層分塊GMM-PRS 主要在分層分塊和混合模型兩方面做了改進(jìn).分層分塊使得評(píng)價(jià)難度降低,解釋性強(qiáng),可以直接在非優(yōu)子塊中進(jìn)行原因追溯,快速定位原因變量.混合模型充分利用不同變量提供的信息,提高了評(píng)價(jià)精度.將PRS、兩層分塊PRS、GMM、兩層分塊GMM 和兩層分塊GMM-PRS 方法分別應(yīng)用于黃金濕法冶煉過(guò)程運(yùn)行狀態(tài)評(píng)價(jià)中,經(jīng)過(guò)多次試驗(yàn),評(píng)價(jià)準(zhǔn)確率均值如表3 所示.其中,基于PRS 的評(píng)價(jià),對(duì)全流程建立一個(gè)PRS 模型;基于兩層分塊PRS 的評(píng)價(jià),將全流程進(jìn)行層次和子塊的劃分,對(duì)每個(gè)子塊分別建立一個(gè)PRS 模型;基于GMM 的評(píng)價(jià),針對(duì)全流程不同定性變量的組合,分別建立全流程的GMM;基于兩層分塊GMM 的評(píng)價(jià),將全流程進(jìn)行層次和子塊的劃分,在子塊內(nèi),針對(duì)不同定性變量的組合,分別建立GMM.從準(zhǔn)確率的對(duì)比可以看出,相比于PRS、兩層分塊PRS、GMM 方法,本文所提兩層分塊GMM-PRS 具有明顯優(yōu)勢(shì).兩層分塊GMM 方法,由于應(yīng)用了本文所提的分層分塊和針對(duì)不同定性變量組合分別建立GMM 的思想,具有與兩層分塊GMM-PRS 相當(dāng)?shù)恼_率.但是,相比于兩層分塊GMM 方法,所提兩層分塊GMM-PRS 具有模型數(shù)量少、計(jì)算量小、計(jì)算時(shí)間短的優(yōu)勢(shì).
圖5 實(shí)驗(yàn)2 運(yùn)行狀態(tài)等級(jí)在線評(píng)價(jià)結(jié)果Fig.5 The assessment result in Case 2
圖6 實(shí)驗(yàn)2 子塊5 中非優(yōu)原因追溯結(jié)果Fig.6 The cause identification result within Sub-block 5 in Case 2
表3 不同方法評(píng)價(jià)準(zhǔn)確率對(duì)比Table 3 The assessment accuracy rate comparison of different methods
針對(duì)定量、定性變量共存的流程工業(yè)過(guò)程運(yùn)行狀態(tài)評(píng)價(jià)問(wèn)題,本文提出了基于兩層分塊混合模型的評(píng)價(jià)方法.將流程工業(yè)過(guò)程,根據(jù)其物理特性劃分為運(yùn)行子塊,同時(shí),形成了子塊層和全流程層,兩個(gè)評(píng)價(jià)層次.在子塊層,對(duì)于以定量信息為主的子塊,根據(jù)不同的定性變量狀態(tài)組合,分別建立GMM.對(duì)于以定性信息為主的子塊,將定量變量進(jìn)行離散化,建立PRS 模型.全流程層運(yùn)行狀態(tài)等級(jí)由子塊層最劣運(yùn)行狀態(tài)等級(jí)決定.當(dāng)過(guò)程運(yùn)行于非優(yōu)運(yùn)行狀態(tài)等級(jí),非優(yōu)的子塊可根據(jù)子塊運(yùn)行狀態(tài)評(píng)價(jià)結(jié)果進(jìn)行確定.在非優(yōu)的子塊內(nèi),本文提出了基于貢獻(xiàn)率的原因追溯方法.最后,本文將所提方法應(yīng)用于濕法冶金過(guò)程運(yùn)行狀態(tài)評(píng)價(jià)中,并與傳統(tǒng)方法進(jìn)行了比較.仿真結(jié)果證明了所提方法的有效性和優(yōu)勢(shì).