王 勛, 喬 佳, 于燕平, 袁理想, 孫俊芳
(北京市燃氣集團研究院,北京100011)
城市燃氣企業(yè)每年需投入資金對老化程度較高或發(fā)生事故頻率較高的隱患管道進行技術改造。僅憑借管道服役年限及泄漏次數(shù)等因素判定是否需要改造不夠科學,有部分管道開挖后發(fā)現(xiàn)并沒有達到需要改造的程度,造成人力物力浪費,還可能使需進行改造的管道沒有優(yōu)先改造,留下安全隱患。因此有效評估燃氣管道使用狀態(tài)非常重要。
在天然氣管道完整性管理過程中,對管道壽命預測及泄漏風險評估是兩個重要研究內容。李增杰等人[1]提出基于BP神經網絡模型的統(tǒng)計模型對城市燃氣管道進行剩余壽命預測,用差值模型修正BP神經網絡模型預測值;薛吉明等人[2]針對運行多年的輸氣管道出現(xiàn)防腐層龜裂、破損和剝離以及管道承壓能力下降的狀況,提出以多種檢測方法為基礎,采用相關理論和標準解決管道防腐層問題及對管道剩余壽命進行評估;羅富緒[3]論述了管道剩余使用壽命預測和評估的必要性,介紹國外對管道剩余使用壽命的預測方法和評估理論,提出應該把對管道剩余使用壽命的預測工作作為管道運行和技術維護管理系統(tǒng)的組成部分;龐洪晨等人[4]采用Modified B31G和Kastner評價方法計算了管道剩余強度,并進行了剩余壽命預測;朱晏萱[5]對Muhlbauer風險評價法在天然氣埋地管道的評分應用進行了探討;袁雄軍等人[6]提出一種基于模糊邏輯系統(tǒng)的管道風險評估方法。以上研究均基于管道失效的相關因素,或賦予權重[7],或采用專家評分[8]方式得到評價結果,屬于非監(jiān)督學習建模過程。本文針對某企業(yè)燃氣管道,以相關標準為指導,量化燃氣管道相關參數(shù),結合運營巡檢數(shù)據(jù)及歷史開挖管道技改等級實際評估結果,提出一種決策樹分類監(jiān)督學習模型,有效評估燃氣管道使用狀態(tài),解決燃氣管道技改大修資金重點使用問題。
在城市燃氣管道運營巡檢搶修過程中,會記錄大量燃氣管道數(shù)據(jù),如漏氣點數(shù)量(自投運以來每年的漏氣點數(shù)量之和)、漏氣點間距(位于管道最兩端漏氣點的距離,單位為m)、投運時間(以年計)、管徑、運行壓力、長度(單位為km)、漏氣點密度(漏氣點數(shù)量與管道長度之比)、防腐層漏點數(shù)量、防腐層缺陷級別,其中防腐層缺陷級別來源于檢測結果,其余特征參數(shù)來源于巡檢數(shù)據(jù)。當只有1個漏氣點時,漏氣點間距為0。將這9個特征參數(shù)或其量化值作為模型的輸入變量。對管徑、運行壓力、防腐層缺陷級別進行量化。管徑量化:如果管道是單一管徑,公稱直徑為a(單位為mm),則量化值為DNa;如果管道非單一管徑,則量化為“多種管徑”4個字。運行壓力量化:如果管道是單一運行壓力,則根據(jù)壓力量化為以下文字:高壓A、高壓B、次高壓A、次高壓B、中壓、低壓;如果管道非單一運行壓力,則量化為“多種壓力”4個字。防腐層缺陷級別量化:參照CJJ 95—2013《城鎮(zhèn)燃氣埋地鋼質管道腐蝕控制技術規(guī)程》表4.3.1進行,將防腐層缺陷級別量化為輕、中、重級別。
根據(jù)以往管道開挖后的實際評估和改造情況,將管道隱患評估等級分為立即整體改造、暫緩整體改造、局部換管、局部修補、加強運行和情況尚可6個等級,這6個等級作為模型的輸出變量。對特征參數(shù)不全的管道信息予以剔除后,共收集到該企業(yè)歷年技改大修中250條燃氣管道的特征參數(shù)和隱患評估等級,部分管道的特征參數(shù)和隱患評估等級見表1。
表1 部分管道的特征參數(shù)和隱患評估等級
決策樹[9]分類技術在眾多分類技術中占有重要地位,屬于統(tǒng)計學分類范疇,是一種非規(guī)則的分類方法。決策樹分類技術通過對已分類的樣本集進行訓練,學習歸納出分類函數(shù),從而確定分類器。利用訓練得到的分類器實現(xiàn)對未分類數(shù)據(jù)的分類。通過對比分析不同的分類算法,發(fā)現(xiàn)決策樹分類算法的應用效果比神經網絡分類算法和判定樹分類算法好,特別是待分類數(shù)據(jù)量非常大時,決策樹分類算法較其他分類算法準確率高。
決策樹分類技術的原理是相似的輸入特征得到相似的輸出結果,決策樹分類用于燃氣管道隱患評估等級分類,可以理解為在類似的管材及外部環(huán)境條件下,管道運營狀態(tài)類似,則管道隱患評估等級相同。即已知某些條件、狀態(tài)下管道的隱患評估等級,對某管道進行隱患評估等級評定時,根據(jù)管道特征參數(shù)通過模型找到與它最相似的一類已知隱患評估等級的管道,便可知道被評定管道的隱患評估等級。
該企業(yè)完成了對歷史技改管道特征參數(shù)及隱患評估等級實際評判結果等數(shù)據(jù)的積累,為建立模型奠定了數(shù)據(jù)基礎。
建模采用Python語言編程,實現(xiàn)平臺采用anaconda notebook,建模步驟如下。
① 輸入上述輸入變量和輸出變量,其中輸出變量為管道開挖后根據(jù)管道實際情況及企業(yè)業(yè)務需求對管道隱患的綜合評估結果。數(shù)據(jù)整理為csv文件,并讀入。
② 引入sklearn包中的tree模塊。
③ 每條管道對應的9個特征參數(shù)和隱患評估等級作為1個樣本,共250個樣本。將250個樣本按照7∶3分為訓練集和測試集,訓練集和測試集分別有175和75個樣本。采用訓練集訓練模型,采用測試集評判模型效果。
④ 調用tree模塊中的DecisionTreeClassifier對象建立決策樹模型,主要參數(shù)設置見表2。
表2 主要參數(shù)設置
⑤ 模型評價。將測試集中的輸入變量輸入模型,得到輸出變量,與測試集中的輸出變量對比。評估正確的樣本數(shù)除以參與評估的總樣本數(shù)得到模型評價準確率(簡稱score得分)。某企業(yè)燃氣管道的決策樹模型score得分為0.8,說明模型效果較好。
⑥ ①~⑤步為單棵決策樹的步驟。為進一步提高準確率,本文通過集成算法優(yōu)化,采用隨機森林[10]算法。隨機森林是通過集成學習思想將多棵樹集成的一種算法,它的基本單元是決策樹。將250個樣本按照7∶3的比例隨機產生訓練集和測試集N次,會得到N棵決策樹,每棵決策樹都是一個分類器。對于每1條管道,會得到N個管道隱患評估等級。本文N取100。隨機森林集成了所有決策樹的隱患評估等級,將最多的隱患評估等級判定為最終隱患評估等級。將250個樣本隨機抽取30%構成隨機森林模型的測試集,對隨機森林模型進行測試,效果良好。隨機森林的score得分提高到0.9,模型效果較好。
將管道的漏氣點數(shù)量(自投運以來每年的漏氣點數(shù)量之和)、漏氣點間距(位于管道最兩端漏氣點的距離)、投運時間(以年計)、管徑、運行壓力、長度、漏氣點密度(漏氣點數(shù)量與管道長度之比)、防腐層漏點數(shù)量、防腐層缺陷級別9個特征參數(shù)或其量化值作為輸入變量,將立即整體改造、暫緩整體改造、局部換管、局部修補、加強運行和情況尚可6個管道隱患評估等級作為輸出變量,建立決策樹、隨機森林分類監(jiān)督學習模型。該模型在某企業(yè)進行應用,效果良好。