楊 慧 芳
(廣東工業(yè)大學(xué)計(jì)算機(jī)學(xué)院 廣東 廣州 510006)
我國鋁型材產(chǎn)業(yè)是高能耗產(chǎn)業(yè),鋁擠壓工藝平均能耗約為1 571~5 405 kg標(biāo)煤每噸[1],是歐洲的1.43倍。而且近幾年的發(fā)展十分迅速,有數(shù)據(jù)顯示,截止至2015年我國鋁加工型材總量已達(dá)到26 000 kt/a,居世界第一,另鋁合金擠壓材產(chǎn)量也達(dá)到14 000 kt/a[2]。擠壓機(jī)作為鋁型材生產(chǎn)過程中的核心設(shè)備,發(fā)展日趨大型化、復(fù)雜化及自動化,在生產(chǎn)過程中一旦發(fā)生異?;蚬收?,將會造成極大的停產(chǎn)損失,耗費(fèi)大量的維護(hù)費(fèi)用,甚至造成嚴(yán)重的安全事故。設(shè)備故障檢測方面的研究,一直是國內(nèi)外學(xué)者關(guān)注的重點(diǎn)。賀惠新[3]對燃?xì)廨啓C(jī)故障模式的點(diǎn)形式及序列形式的異常行為的檢測方式進(jìn)行了深入研究;周珂儀[4]研究了復(fù)雜結(jié)構(gòu)系統(tǒng)長時間運(yùn)行產(chǎn)生的一維以及多維時間序列的異常檢測方法;Soner Emec等[5]提出了一種用于制造設(shè)備的故障監(jiān)控框架,以解決面對復(fù)雜情況下不可擴(kuò)展的問題。標(biāo)桿法[6]和人工免疫算法[7]在設(shè)備故障檢測方面也有不錯的效果。針對擠壓機(jī)的異常檢測問題近期也得到了廣大學(xué)者的關(guān)注,并有了研究成果。周理[8]針對大型擠壓機(jī)設(shè)備的多回路復(fù)雜液壓系統(tǒng)提出一種混雜鍵合圖與時間因果圖的故障診斷方法;江海昌[9]為解決檢測擠壓機(jī)點(diǎn)異常和模式異常的問題,分別提出了基于GA-SVR的擠壓機(jī)能耗點(diǎn)異常檢測模型和基于免疫算法的模式異常檢測模型;曾利云[10]研究了擠壓機(jī)能耗數(shù)據(jù)的特性,提出基于時間序列和聚類的異常檢測方法,通過改進(jìn)的K-means算法和K-MDOF算法,在點(diǎn)異常和模式異常方面的檢測準(zhǔn)確率有所提高。
現(xiàn)有針對擠壓機(jī)異常檢測的方法雖然有一定的效果,但面對傳感器故障或者歷史數(shù)據(jù)缺失嚴(yán)重等不確定性的情況,實(shí)驗(yàn)效果達(dá)不到預(yù)期,準(zhǔn)確率較低,而且只能判斷異常是否發(fā)生,不能定位異常原因,不能滿足車間生產(chǎn)的實(shí)際需求。
貝葉斯網(wǎng)絡(luò)作為一種人工智能技術(shù),是不確定知識表達(dá)和推理領(lǐng)域最有效的理論之一[11],已經(jīng)被運(yùn)用到很多領(lǐng)域,特別是機(jī)械設(shè)備故障檢測和預(yù)測方面。國內(nèi)外學(xué)者通過分析機(jī)械設(shè)備的參數(shù)信息或者生產(chǎn)過程中的歷史數(shù)據(jù)[12]為軌道電路[13]、飛機(jī)[14]、冷水機(jī)組[15]、電力系統(tǒng)[16]、空氣制動系統(tǒng)[17]等建立貝葉斯網(wǎng)絡(luò)異常診斷模型,并在實(shí)驗(yàn)中取得了不錯的效果。
擠壓機(jī)設(shè)備為高能耗裝置,生產(chǎn)過程中能源消耗情況最能真實(shí)反映設(shè)備狀態(tài)。本文提出通過分析擠壓機(jī)運(yùn)行過程中的能耗傳遞機(jī)制,建立能耗模型,得到影響擠壓機(jī)能耗的關(guān)鍵因素。并以此為依據(jù)構(gòu)建貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),不僅克服結(jié)構(gòu)學(xué)習(xí)算法占用內(nèi)存的問題[18],也減去單純依靠專家知識構(gòu)造網(wǎng)絡(luò)的弊端。利用歷史數(shù)據(jù)中的先驗(yàn)知識獲得條件概率表,構(gòu)造完成貝葉斯網(wǎng)絡(luò),再利用貝葉斯網(wǎng)絡(luò)推理算法檢測擠壓過程中設(shè)備異常狀態(tài)并做原因分析。結(jié)果表明,本文方法構(gòu)造的貝葉斯網(wǎng)絡(luò)可以有效地檢測擠壓擠異常情況、分析出引起異常的原因,并且大大提高了檢測效率。
擠壓是使裝入擠壓筒內(nèi)的坯料,在擠壓筒一端擠壓軸的推力作用下,使金屬從擠壓筒某一端的??琢鞒?,從而獲得與擠壓??仔螤?、尺寸相同的產(chǎn)品的一種塑性[19]。擠壓原理如圖1所示。
液壓系統(tǒng)的能源裝置是液壓泵,液壓系統(tǒng)共有三次能量轉(zhuǎn)化:1) 電動機(jī)通電,電能被轉(zhuǎn)化為機(jī)械能;2) 通過聯(lián)軸裝置,驅(qū)動液壓泵運(yùn)轉(zhuǎn)將機(jī)械能轉(zhuǎn)換為液壓能,輸出高壓油,液壓泵工作時由于泄露和摩擦力等因素會造成一定的能量損耗;3) 通過控制各種閥門改變擠壓油缸中液壓油的流量,從而進(jìn)行擠壓工作。期間由于液壓油進(jìn)入閥門,在閥芯處的過流面積迅速變小,形成壓差,造成能耗損失。鋁型材的成型質(zhì)量主要與擠壓溫度和加油速度有關(guān),但在幾十秒乃至幾分鐘的擠壓周期內(nèi),擠壓溫度不好控制,可以通過控制擠壓速度平穩(wěn)變化來控制擠壓溫度。
液壓系統(tǒng)的每次擠壓過程使用的總功率可以表示為[20]:
Pw=Pci+ΔPfh+ΔPmh
(1)
式中:Pci表示擠壓油缸的輸入功率,ΔPfh表示液壓系統(tǒng)閥門組的損失能量,ΔPmh表示液壓泵的損失能量,可通過液壓泵輸入功率與輸出功率之差計(jì)算得到。液壓泵得到輸入功率用Pmi表示[20]:
Pmi=2·π·nv·Tn
(2)
式中:nv代表液壓泵泵軸的轉(zhuǎn)速,Tn代表液壓泵的輸入轉(zhuǎn)矩。
液壓泵的輸出功率用Pmo表示[20]:
Pmo=p·Qm
(3)
式中:p代表液壓泵的泵口壓力,Qm代表液壓泵的實(shí)際流量,用公式表示為[20]:
(4)
式中:Vm是液壓泵的移動速度,Dm是液壓泵的直徑。
液壓泵的能量損耗ΔPmh可以表示為:
ΔPmh=Pmi-Pmo=2·π·nv·Tn-p·Qm
(5)
液壓閥門組的能耗損失表示為[20]:
ΔPfh=n·Δpf·ΔQf
(6)
式中:n代表閥門個數(shù),Δpf代表閥口壓差,ΔQf代表閥口流量。
擠壓油缸輸入功率用Pci表示:
Pci=F·V
(7)
式中:F表示擠壓桿受到的力,V表示擠壓桿移動的速度[20]。
(8)
(9)
Q=εQm
(10)
式中:A表示液壓缸的有效面積;ηm表示液壓缸的機(jī)械效率;ηv液壓缸的容積效率;D表示活塞直徑;d表示活塞桿直徑;Q表示輸入液壓缸的流量;pa表示主缸壓力;ε表示擠壓油缸的容積效率。
貝葉斯網(wǎng)絡(luò)又稱為貝葉斯置信網(wǎng)絡(luò)(Bayesian Belief Networks)、信念網(wǎng)[21],是一種基于網(wǎng)絡(luò)結(jié)構(gòu)的有向圖解描述,適用于表達(dá)和分析不確定和概率性事物,可從不完全或不確定的知識或信息中作出推理。構(gòu)建一個完整的貝葉斯網(wǎng)絡(luò)主要需要完成兩個任務(wù):結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)。通過結(jié)構(gòu)學(xué)習(xí)得到貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),通過參數(shù)學(xué)習(xí)得到節(jié)點(diǎn)的條件概率表。最后利用貝葉斯網(wǎng)絡(luò)推理方法得到需要查詢的變量的后驗(yàn)概率并更新網(wǎng)絡(luò)的概率參數(shù)。
在構(gòu)建貝葉斯網(wǎng)絡(luò)時,主要采用基于評估函數(shù)和搜索算法的結(jié)構(gòu)學(xué)習(xí)方法和基于節(jié)點(diǎn)依賴關(guān)系的結(jié)構(gòu)學(xué)習(xí)方法[16]?;谠u估函數(shù)和搜索算法的結(jié)構(gòu)學(xué)習(xí)的主要缺點(diǎn)是參數(shù)間因果關(guān)系的建立過程不夠明確,需要經(jīng)過多次學(xué)習(xí)-評估的過程才能找到最優(yōu)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),最后的結(jié)果很大程度上是由評估算法的好壞決定。在貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)的過程中,為提高模型的精準(zhǔn)度而造成網(wǎng)絡(luò)模型的復(fù)雜度不斷變大,復(fù)雜度適合的網(wǎng)絡(luò)模型往往實(shí)驗(yàn)結(jié)果的精準(zhǔn)度不夠高?;诠?jié)點(diǎn)依賴關(guān)系的結(jié)構(gòu)學(xué)習(xí)的主要缺點(diǎn)需要先計(jì)算節(jié)點(diǎn)間的條件獨(dú)立性,而對于本身決定因素較多的節(jié)點(diǎn),因?yàn)樾枰?jì)算節(jié)點(diǎn)間的條件概率得到依賴關(guān)系強(qiáng)弱,而產(chǎn)生大量的冗余工作,不僅工作量巨大,還會耗費(fèi)很多的存儲空間。
為提高貝葉斯網(wǎng)絡(luò)構(gòu)建的效率和優(yōu)越性,本文將通過第1節(jié)得到的能耗公式來構(gòu)造能耗異常檢測的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)圖B(I,E),I代表節(jié)點(diǎn),E代表連接邊。構(gòu)建貝葉斯網(wǎng)的節(jié)點(diǎn)如表1所示。
表1 節(jié)點(diǎn)表
通過分析能耗公式,得到節(jié)點(diǎn)間的相互依賴關(guān)系,以式(1)為例,可得Pw的值是ΔPmh、ΔPfh和Pci這三個節(jié)點(diǎn)取值之和,即Pw依賴于這三個節(jié)點(diǎn),這三個節(jié)點(diǎn)為Pw節(jié)點(diǎn)的父節(jié)點(diǎn)。以此類推,構(gòu)建的的網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2所示。
圖中認(rèn)知不確定、分布未知的節(jié)點(diǎn)指節(jié)點(diǎn)概率分布未知;偶然不確定、分布已知的節(jié)點(diǎn)指節(jié)點(diǎn)概率分布已知,但存在偶然不確定性;有觀察值的節(jié)點(diǎn)指節(jié)點(diǎn)值可被人為觀測或有傳感器能采集數(shù)據(jù)。
貝葉斯網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)[22],即學(xué)習(xí)得到貝葉斯網(wǎng)絡(luò)節(jié)點(diǎn)的條件概率表。貝葉斯公式為:
(11)
式中:X1,X2,…,Xn是E的一個互不相容的完備事件組,且P(Xi)>0,Y是E的任意事件。
由式(11)可得要計(jì)算節(jié)點(diǎn)的條件概率,必須在之前計(jì)算得到先驗(yàn)概率和聯(lián)合概率。步驟如下:
(1) 首先對節(jié)點(diǎn)進(jìn)行預(yù)處理,根據(jù)歷史數(shù)據(jù)分析所有節(jié)點(diǎn)變量的取值集合。
(2) 處理證據(jù)變量,可通過分析歷史數(shù)據(jù)得到節(jié)點(diǎn)的概率分布情況,得到概率分布表。對于沒有觀測數(shù)據(jù)的節(jié)點(diǎn),假設(shè)服從均勻分布,這也稱為貝葉斯假設(shè)。
(3) 對于非證據(jù)變量,要精確計(jì)算節(jié)點(diǎn)的條件概率幾乎不可能。因此,對于這些節(jié)點(diǎn)條件概率的學(xué)習(xí),就是計(jì)算對于不同證據(jù)變量下節(jié)點(diǎn)條件概率的后驗(yàn)分布。參數(shù)學(xué)習(xí)便轉(zhuǎn)換成貝葉斯網(wǎng)絡(luò)推理問題。
本文采用Gibbs抽樣算法[21]進(jìn)行網(wǎng)絡(luò)的近似推理。假設(shè)抽樣m次,抽樣算法步驟如下:
(1) 首先根據(jù)要推理的結(jié)果,確定一個證據(jù)變量E=e,然后隨機(jī)生成與證據(jù)一致的樣本為起始樣本D1。
(2) 復(fù)制上一個樣本數(shù)據(jù)得到新的樣本數(shù)據(jù),設(shè)定非證據(jù)變量的抽樣順序,根據(jù)抽樣順序,對非證據(jù)變量進(jìn)行抽樣。
(3) 根據(jù)抽樣結(jié)果對當(dāng)前樣本數(shù)據(jù)進(jìn)行更新,若有k個非證據(jù)變量,則要依次抽樣k次,得到最終樣本。
(4) 重復(fù)進(jìn)行步驟2-步驟3),生成m個樣本,設(shè)m個樣本中,滿足查詢變量A=a(a為查詢變量的取值)的個數(shù)是n個,則可按下式近似計(jì)算查詢變量后驗(yàn)概率。
(12)
貝葉斯網(wǎng)絡(luò)推理是指利用貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)及其條件概率表,在給定證據(jù)變量后計(jì)算部分變量或者所有變量的邊緣概率或者最大概率狀態(tài)等問題。貝葉斯網(wǎng)絡(luò)的推理包括正向推理和逆向推理。正向推理是根據(jù)觀測到的節(jié)點(diǎn)的變化,修正貝葉斯網(wǎng)絡(luò)中其他節(jié)點(diǎn)的參數(shù)值,即在貝葉斯網(wǎng)絡(luò)推理過程中,網(wǎng)絡(luò)節(jié)點(diǎn)的信度參數(shù)會跟隨推理結(jié)果進(jìn)行更新,通過貝葉斯網(wǎng)絡(luò)的自學(xué)習(xí)能力保證網(wǎng)絡(luò)的可信度;逆向推理是通過調(diào)整節(jié)點(diǎn)的參數(shù),觀察其他節(jié)點(diǎn)參數(shù)的變化,從而分析得到各節(jié)點(diǎn)的狀態(tài)。貝葉斯網(wǎng)絡(luò)推理問題包括后驗(yàn)概率問題、最大可能解釋問題(MPE)和最大后驗(yàn)假設(shè)問題(MAP)。本文通過貝葉斯網(wǎng)絡(luò)模型要解決異常檢測與原因定位,即通過網(wǎng)絡(luò)推理解決后驗(yàn)概率問題和最大可能解釋問題。計(jì)算在給定證據(jù)變量后,查詢變量異常狀態(tài)的概率。在判定設(shè)備異常情況下,計(jì)算節(jié)點(diǎn)在不同狀態(tài)下組合導(dǎo)致異常發(fā)生的概率,分析實(shí)際情況與更改狀態(tài)后概率值變化度,找出與實(shí)際情況下后驗(yàn)概率的變化度最大的節(jié)點(diǎn)狀態(tài)組合,該狀態(tài)組合與實(shí)際情況下的差別狀態(tài)即是異常原因所在。
設(shè)R={Pa,ηm,ηv,nv,Tn,p,F,ΔV,Q,ΔPfh,ΔPmh,Pci,ε},根據(jù)貝葉斯公式,判斷異常狀態(tài)的后驗(yàn)概率公式如下:
P(Pw=0|R)=
(13)
根據(jù)鏈?zhǔn)揭?guī)則:
P(X1X2…Xn)=P(X1)P(X2|X1)P(X3|X1,X2)…
P(Xn|X1X2…Xn-1)
(14)
將異常檢測網(wǎng)絡(luò)模型中的節(jié)點(diǎn)代入式(12),得到的聯(lián)合分布的公式如下:
P(R,Pw)=P(Pw|ΔPmh,ΔPfh,Pci)P(Pci|F,ΔV)P(Q|ε)
P(p)P(ΔPmh|nv,Tn,p)P(F|,pa,ηm)P(ΔV|Q,ηv)
P(ε)P(ηv)P(ΔPfh)P(pa)P(ηm)P(nv)P(Tn)
(15)
本文以佛山某鋁型材企業(yè)擠壓車間SY-3600Ton型擠壓機(jī)為例,該車間每月生產(chǎn)鋁型材3 000噸,其中合格率在89%左右,經(jīng)常由于不易察覺的異常出現(xiàn)導(dǎo)致鋁型材質(zhì)量不合格,造成嚴(yán)重?fù)p失。本次實(shí)驗(yàn)選擇了2018年2月-2018年3月的能耗數(shù)據(jù)庫中600個能耗數(shù)據(jù)樣本,并將其均勻分成3組,分別為A組、B組和C組。目前已知A組、B組和C組中的發(fā)生異常次數(shù)分別為15次、10次和12次,現(xiàn)對這些樣本數(shù)據(jù)進(jìn)行能耗異常檢測。
為了評估本方法檢測異常的效果,現(xiàn)定義三個評估標(biāo)準(zhǔn):一是誤檢率,即本方法檢測出現(xiàn)異常但實(shí)際并非異常情況的個數(shù)與總異常次數(shù)之比;二是漏檢率,即實(shí)際出現(xiàn)異常但本方法沒有檢測出來的異常次數(shù)與總異常次數(shù)之比;三是正確率,即本方法正確檢測到的異常次數(shù)與總異常次數(shù)之比。實(shí)驗(yàn)操作步驟如下:
(1) 數(shù)據(jù)預(yù)處理:根據(jù)先驗(yàn)知識和以往得到的歷史數(shù)據(jù)以及現(xiàn)場調(diào)研,得到在擠壓機(jī)運(yùn)轉(zhuǎn)周期內(nèi),周期時間約為208 s,擠壓時間約為163 s,空機(jī)時間、空載前進(jìn)時間、快速后退時間分別為12、20、12 s。不同狀態(tài)下擠壓力有所變化,因此對數(shù)據(jù)離散化后,節(jié)點(diǎn)有三個取值,1表示壓力為零,2表示空載前進(jìn)或者快速后退階段(壓力在9~12 MPa),3表示擠壓前進(jìn)階段(壓力在16~20 MPa)。其余節(jié)點(diǎn)為兩個取值,其中1表示所采集的數(shù)據(jù)不處于正常范圍,2表示數(shù)值處于正常范圍區(qū)間。最后得到的節(jié)點(diǎn)數(shù)據(jù)統(tǒng)計(jì)表如表2所示。通過分析歷史數(shù)據(jù)得到觀測節(jié)點(diǎn)的概率分布和非觀測節(jié)點(diǎn)的假設(shè)先驗(yàn)分布表,如表3和表4所示。
表2 節(jié)點(diǎn)數(shù)據(jù)統(tǒng)計(jì)結(jié)果
表3 邊緣概率結(jié)果
表4 節(jié)點(diǎn)的先驗(yàn)分布
表5 節(jié)點(diǎn)條件概率結(jié)果
(3) 異常檢測與原因推理:本文選擇連接樹精確推理方法計(jì)算查詢變量的后驗(yàn)概率,利用貝葉斯工具箱的推理算法計(jì)算結(jié)果。在計(jì)算模型中對擠壓機(jī)系統(tǒng)的異常情況的推理,假定目前可以通過觀測得到的證據(jù)變量擠壓油缸容積效率(ε)、主缸壓力(pa)、液壓泵的機(jī)械效率(ηm)的狀態(tài)都為異常狀態(tài),其他傳感器數(shù)據(jù)丟失,未被記錄,則保持狀態(tài)不改變,推理擠壓機(jī)功率處于異常狀態(tài)的后驗(yàn)概率為0.502 3,判定為發(fā)生異常。若判定異常發(fā)生,則采用控制變量法進(jìn)行對比試驗(yàn),逐個改變當(dāng)前輸入證據(jù)變量中某個變量的狀態(tài),計(jì)算節(jié)點(diǎn)不同狀態(tài)下異常發(fā)生的概率。實(shí)驗(yàn)結(jié)果如表6所示。
表6 實(shí)驗(yàn)結(jié)果及對比實(shí)驗(yàn)結(jié)果
(4) 重復(fù)試驗(yàn),分析A組、B組、C組的數(shù)據(jù),計(jì)算本方法的正確率,如表7所示。
表7 貝葉斯網(wǎng)絡(luò)異常檢測算法結(jié)果
表6中的輸入d1、d2、d3分別代表擠壓油缸容積效率(ε)、主缸壓力(pa)、液壓泵的機(jī)械效率(ηm)??梢钥闯觯?1)ε、pa、ηm的狀態(tài)都為異常狀態(tài)時,設(shè)備異常的概率為0.502 3;(2)ε、pa、ηm的狀態(tài)分別為異常狀態(tài)、異常狀態(tài)、非異常狀態(tài)時,設(shè)備異常的概率為0.500 1;(3)ε、pa、ηm的狀態(tài)分別為異常狀態(tài)、空載前進(jìn)或快速后退階段、異常狀態(tài)時,設(shè)備異常的概率為0.485 8;(4)ε、pa、ηm的狀態(tài)分別為異常狀態(tài)、擠壓前進(jìn)、異常狀態(tài)時,設(shè)備異常的概率為0.490 5;(5)ε、pa、ηm的狀態(tài)分別為非異常狀態(tài)、異常狀態(tài)、異常狀態(tài)時,設(shè)備異常的概率為0.501 9。由此可得,ε、pa、ηm的狀態(tài)分別為異常狀態(tài)、空載前進(jìn)或快速后退階段、異常狀態(tài)時,后驗(yàn)概率值與當(dāng)前實(shí)際證據(jù)變量下得到的后驗(yàn)概率之間的差值最大,即主缸壓力異常是設(shè)備異常主要原因。
(1) 針對影響擠壓機(jī)因素復(fù)雜且原因存在不確定性的問題,通過分析擠壓機(jī)能流機(jī)制構(gòu)建的能耗模型而構(gòu)建的貝葉斯網(wǎng)絡(luò),較好地結(jié)合了專家知識與物理模型,避免了純粹依靠專家信息造成的信息錯誤率較高的問題,提高了貝葉斯網(wǎng)絡(luò)的可靠性。
(2) 針對傳統(tǒng)構(gòu)建貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)兩大步驟,充分利用專業(yè)領(lǐng)域的知識,建立能耗模型,簡化結(jié)構(gòu)學(xué)習(xí)步驟,極大地縮短了網(wǎng)絡(luò)構(gòu)建周期。
(3) 結(jié)合專家知識與歷史數(shù)據(jù)得到貝葉斯網(wǎng)絡(luò)的條件概率表,通過仿真實(shí)驗(yàn)得到貝葉斯網(wǎng)絡(luò)模型在異常檢測方面的效率在數(shù)據(jù)越來越豐富的情況下,會逐步上升并趨于穩(wěn)定,基本可以檢測所有的異常點(diǎn),漏檢率趨于0。印證了貝葉斯網(wǎng)絡(luò)的自學(xué)習(xí)能力使得它能較好處理實(shí)際應(yīng)用場景中不完整數(shù)據(jù)集,且本文提出的通過擠壓機(jī)能耗模型構(gòu)建貝葉斯網(wǎng)絡(luò)的方法有實(shí)際應(yīng)用意義。