曹 潔,祝令凱,張?jiān)?,李洪海,劉守?/p>
(1.國(guó)家電投集團(tuán)河南電力有限公司沁陽發(fā)電分公司,河南 焦作 454150;2.國(guó)網(wǎng)山東省電力公司電力科學(xué)研究院,山東 濟(jì)南 250003;3.山東魯能軟件技術(shù)有限公司,山東 濟(jì)南 250002;)
近年來,隨著GPU、云計(jì)算等技術(shù)的快速發(fā)展,計(jì)算機(jī)計(jì)算速度與計(jì)算能力得到大幅提高,有力推動(dòng)了工業(yè)大數(shù)據(jù)技術(shù)和神經(jīng)網(wǎng)絡(luò)算法的發(fā)展應(yīng)用[1-3],為推動(dòng)國(guó)家新一代人工智能技術(shù)的發(fā)展奠定基礎(chǔ)。人工智能技術(shù)在商業(yè)互聯(lián)網(wǎng)行業(yè)應(yīng)用廣泛而且技術(shù)成熟,工業(yè)行業(yè)由于積累了龐大數(shù)據(jù)量,為響應(yīng)國(guó)家新一代人工智能技術(shù)的發(fā)展,轉(zhuǎn)變工業(yè)生產(chǎn)制造模式,我國(guó)工業(yè)正在積極探尋人工智能技術(shù)與大數(shù)據(jù)在工業(yè)設(shè)備智能診斷、預(yù)警以及工業(yè)生產(chǎn)指標(biāo)尋優(yōu)等方向的運(yùn)用。其中,設(shè)備智能診斷技術(shù)在工業(yè)領(lǐng)域得到很大重視,生產(chǎn)設(shè)備的安全運(yùn)行關(guān)系著企業(yè)的安全責(zé)任和經(jīng)濟(jì)效益。
設(shè)備故障往往是宏觀的、系統(tǒng)的,而設(shè)備故障原因卻是部件級(jí)、材料級(jí)的。近幾年來在設(shè)備故障診斷方面的技術(shù)層出不窮,如基于故障樹、基于規(guī)則、基于案例推理、基于神經(jīng)網(wǎng)絡(luò)、基于粗糙集理論、基于Petri 網(wǎng)絡(luò)等,由于上述理論技術(shù)均脫離業(yè)務(wù)邏輯,難以實(shí)現(xiàn)行業(yè)通用,尤其面對(duì)復(fù)雜的設(shè)備系統(tǒng)時(shí),現(xiàn)有算法在準(zhǔn)確性和穩(wěn)定性方面存在諸多問題,因此,大型設(shè)備的故障原因查找還需要依賴專家進(jìn)行問題推導(dǎo)和定位。
基于業(yè)務(wù)邏輯和推薦算法結(jié)合的思想,通過修正關(guān)聯(lián)分析值,構(gòu)造設(shè)備故障診斷邏輯,進(jìn)行設(shè)備故障相似因素的推薦。以某核電站冷卻劑泵為例,進(jìn)行實(shí)例分析,分析結(jié)果表明該算法在故障定位方面具有較高準(zhǔn)確性。
推薦算法主要分為3 類:經(jīng)典推薦算法、特定推薦算法和混合推薦算法。其中,經(jīng)典推薦算法包含協(xié)同過濾推薦算法和基于內(nèi)容的推薦算法[4-6],設(shè)備故障診斷邏輯主要采用經(jīng)典推薦算法。在工業(yè)生產(chǎn)中,基于內(nèi)容的相關(guān)設(shè)備故障推薦算法需要故障設(shè)備大量歷史數(shù)據(jù)作為挖掘?qū)ο?,由于生產(chǎn)實(shí)踐過程中積累的正樣本與負(fù)樣本數(shù)據(jù)往往是不平衡的,單個(gè)設(shè)備的故障數(shù)據(jù)量少,在實(shí)際使用故障推薦算法時(shí)優(yōu)先使用基于協(xié)同過濾的故障相關(guān)設(shè)備推薦算法。
協(xié)同過濾推薦算法的基本假設(shè)是:為用戶推薦感興趣的內(nèi)容,找到與該用戶偏好相似的其他用戶,將他們感興趣的內(nèi)容推薦給該用戶。文獻(xiàn)[7]將協(xié)同過濾方法分為基于記憶方法和基于模型方法。
基于記憶方法采用所有的設(shè)備歷史數(shù)據(jù)或1 個(gè)樣本集來生成預(yù)測(cè)。每個(gè)設(shè)備都有1 個(gè)與其有著關(guān)聯(lián)性較強(qiáng)的設(shè)備,被稱為鄰居,通過識(shí)別設(shè)備的鄰居狀態(tài),可以預(yù)測(cè)設(shè)備在該狀態(tài)下的發(fā)展趨勢(shì)。
基于模型方法采用統(tǒng)計(jì)、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等方法,根據(jù)設(shè)備歷史數(shù)據(jù)構(gòu)造狀態(tài)模型,并據(jù)此進(jìn)行推薦,適合樣本量較大的場(chǎng)景。
協(xié)同過濾推薦算法的核心是計(jì)算目標(biāo)設(shè)備與評(píng)分矩陣中各設(shè)備的相似度,然后將各個(gè)相似度進(jìn)行排序,較高相似度的設(shè)備作為目標(biāo)設(shè)備的近鄰集。計(jì)算關(guān)聯(lián)度時(shí),僅從算法方面解決或僅從業(yè)務(wù)邏輯方面解決都難免顧此失彼,結(jié)合相關(guān)系數(shù)計(jì)算的關(guān)聯(lián)度與業(yè)務(wù)邏輯分析的關(guān)聯(lián)度,使用加權(quán)平均的方法將兩種關(guān)聯(lián)度計(jì)算結(jié)果結(jié)合,得到最終的關(guān)聯(lián)度,可彌補(bǔ)業(yè)務(wù)和算法在關(guān)聯(lián)分析中的不足。
使用相似度指標(biāo)計(jì)算方法如相關(guān)系數(shù)、互信息以及相關(guān)距離公式等[8],依托歷史大數(shù)據(jù)計(jì)算參數(shù)兩兩之間的關(guān)聯(lián)度,進(jìn)一步計(jì)算關(guān)聯(lián)設(shè)備各指標(biāo)之間關(guān)聯(lián)度的均值,得到設(shè)備之間的關(guān)聯(lián)度。取Pearson 相關(guān)系數(shù)作為相似度度量,其計(jì)算公式為
式中:Iuv為設(shè)備u 與設(shè)備v 共同評(píng)分的項(xiàng)目集合;Ru,i與Rv,i分別為設(shè)備u和設(shè)備v對(duì)項(xiàng)目i的評(píng)分;分別為設(shè)備u 和v 設(shè)備對(duì)已評(píng)價(jià)項(xiàng)目的評(píng)分均值。
基于算法計(jì)算出的設(shè)備關(guān)聯(lián)度需要由具體業(yè)務(wù)邏輯支撐和修正。以核反應(yīng)堆冷卻劑泵業(yè)務(wù)邏輯為例,其邏輯關(guān)聯(lián)情況如圖1 所示。主泵設(shè)置的冷水入口流量直接影響主泵設(shè)置的冷水出口流量,而主泵設(shè)置的冷水流量差值也間接影響了設(shè)置的冷水溫差,從而影響對(duì)溫度敏感的主泵定子線圈以及主泵振動(dòng)等相關(guān)部件與參數(shù)。實(shí)際分析中,需要業(yè)務(wù)人員根據(jù)業(yè)務(wù)邏輯中各相關(guān)因素相關(guān)強(qiáng)度賦予相應(yīng)關(guān)聯(lián)度值。
圖1 冷卻劑泵冷水流量與主泵狀態(tài)關(guān)聯(lián)示例
通過業(yè)務(wù)專家對(duì)設(shè)備關(guān)聯(lián)性分析,并賦予相應(yīng)的關(guān)聯(lián)度值D(u,v),結(jié)合式(1),進(jìn)行加權(quán),修正算法相似度計(jì)算的不足,其修正公式為
式中:σ 為調(diào)節(jié)參數(shù),取值范圍為(0,1),可通過歷史數(shù)據(jù)交叉驗(yàn)證,當(dāng)專家推理結(jié)果可靠性較大時(shí),增大σ 值,反之減小。
計(jì)算出設(shè)備之間的關(guān)聯(lián)度之后,還應(yīng)挖掘設(shè)備之間歷史故障的頻繁項(xiàng)。以故障類型作為分組依據(jù),找出導(dǎo)致設(shè)備故障發(fā)生的指標(biāo)作為頻繁項(xiàng)集,計(jì)算相關(guān)概率作為該頻繁項(xiàng)集對(duì)于該故障發(fā)生的支持度。以主泵振動(dòng)和設(shè)備冷卻水系統(tǒng)熱交換器異常為例,各頻繁項(xiàng)支持度值如表1 所示。
通過關(guān)聯(lián)度值找到異常設(shè)備的鄰近設(shè)備,由關(guān)聯(lián)度值和支持度的乘積得到各設(shè)備的推薦評(píng)分矩陣,取最佳推薦評(píng)分對(duì)應(yīng)的設(shè)備作為推薦結(jié)果。
根據(jù)上述理論,提出協(xié)同過濾推薦算法與業(yè)務(wù)邏輯相結(jié)合的設(shè)備故障診斷方法,該方法以協(xié)同過濾推薦算法為核心,結(jié)合業(yè)務(wù)邏輯修正關(guān)聯(lián)度分析值,實(shí)現(xiàn)業(yè)務(wù)和算法相結(jié)合,提高故障診斷的效率和準(zhǔn)確性。協(xié)同過濾推薦打分流程如圖2 所示。
表1 頻繁項(xiàng)集支持度
圖2 協(xié)同過濾推薦打分流程
通過上述流程,關(guān)聯(lián)分析找到異常設(shè)備相關(guān)的近鄰設(shè)備,并結(jié)合頻繁項(xiàng)集,獲得鄰居設(shè)備推薦評(píng)分。當(dāng)頻繁項(xiàng)集的支持度為0,則支持度不參與推薦評(píng)分計(jì)算,取最佳推薦評(píng)分作為設(shè)備故障診斷的最終結(jié)果。當(dāng)某個(gè)故障設(shè)備的歷史數(shù)據(jù)較少,無法挖掘出故障頻繁項(xiàng)時(shí),系統(tǒng)基于設(shè)備關(guān)聯(lián)度值,找出與故障設(shè)備關(guān)聯(lián)度高的相似設(shè)備,即同類型設(shè)備?;趨f(xié)同過濾的故障相關(guān)設(shè)備推薦邏輯如圖3 所示。
以冷卻劑泵為例,使用協(xié)同過濾推薦算法與業(yè)務(wù)邏輯相結(jié)合的設(shè)備故障推薦方法進(jìn)行故障診斷推進(jìn)分析,并通過準(zhǔn)確率ra和推薦率rr進(jìn)行指標(biāo)評(píng)價(jià)。
圖3 基于協(xié)同過濾的故障相關(guān)設(shè)備推薦
準(zhǔn)確率越高表明冷卻劑泵故障診斷推薦系統(tǒng)的推薦質(zhì)量越高。準(zhǔn)確率計(jì)算公式為
式中:N 為故障診斷推薦系統(tǒng)正確預(yù)測(cè)的故障頻繁項(xiàng)集數(shù);M 為頻繁項(xiàng)集總數(shù)。
項(xiàng)目推薦率rr主要用于衡量同類型設(shè)備的查找效率,在相同準(zhǔn)確率下,項(xiàng)目推薦率的數(shù)值越大說明算法的推薦效率越高。項(xiàng)目推薦率在項(xiàng)目推薦時(shí),設(shè)一個(gè)故障設(shè)備的故障頻繁項(xiàng)目集為W={w1,w2,…,wP},P 表示故障頻繁項(xiàng)目集合的數(shù)量,wi(i=1,…,Q)為待推薦的故障頻繁項(xiàng)目集,Q 為待推薦的故障頻繁項(xiàng)目集數(shù)量,由于該故障設(shè)備同類型設(shè)備中沒有發(fā)現(xiàn)關(guān)于wi的頻繁項(xiàng)目集,而導(dǎo)致wi無法被推薦,故不能被推薦的項(xiàng)目總數(shù)為Q(Q≤P),則稱比值為關(guān)于該故障設(shè)備的推薦率。
考慮到反應(yīng)堆冷卻劑泵涉及核安全,因此核電站所使用的冷卻劑泵質(zhì)量要求高,故在收集數(shù)據(jù)進(jìn)行試驗(yàn)時(shí),考慮到算法對(duì)數(shù)據(jù)量的需求,選取的反應(yīng)堆冷卻劑泵歷史數(shù)據(jù)集來自同類型的設(shè)備數(shù)據(jù),使其盡可能反映大數(shù)據(jù)規(guī)律。選取數(shù)據(jù)集中75%的數(shù)據(jù)作為訓(xùn)練樣本,對(duì)其采用業(yè)務(wù)邏輯與算法結(jié)合的方式進(jìn)行挖掘以生產(chǎn)推薦的關(guān)聯(lián)度,其余25%的數(shù)據(jù)集作為測(cè)試集進(jìn)行測(cè)試,與只使用業(yè)務(wù)邏輯和只使用算法挖掘關(guān)聯(lián)度推薦相比較,試驗(yàn)結(jié)果如圖4和圖5 所示。
由此可知,隨著同類型設(shè)備樣本的數(shù)據(jù)逐漸增多,協(xié)同過濾推薦算法與業(yè)務(wù)邏輯相結(jié)合的故障設(shè)備診斷系統(tǒng)的準(zhǔn)確率相比于只使用業(yè)務(wù)邏輯或只使用協(xié)同過濾推薦算法的故障推薦系統(tǒng)要高得多。而且基于業(yè)務(wù)邏輯與算法結(jié)合的故障設(shè)備診斷系統(tǒng)相應(yīng)的推薦率隨著樣本的數(shù)量增多相比其他兩種推薦系統(tǒng)也更有優(yōu)勢(shì)。
圖4 不同分析方法對(duì)應(yīng)的設(shè)備故障診斷準(zhǔn)確率
圖5 不同分析方法對(duì)應(yīng)的設(shè)備故障診斷推薦率
采用基于協(xié)同過濾的故障推薦方法,通過引入業(yè)務(wù)邏輯,將專家經(jīng)驗(yàn)和算法相結(jié)合,改進(jìn)了傳統(tǒng)協(xié)同過濾算法關(guān)聯(lián)度計(jì)算的方法,在樣本量充足的條件下,該方法表現(xiàn)出了較高的推薦精度,可為生產(chǎn)過程中的設(shè)備故障診斷提供理論參考。