高巖 (大慶油田有限責任公司第五采油廠)
目前,我國大部分陸上油田的開發(fā)已經進入中后期,地面生產設施逐漸完善,但投產設計規(guī)模與現(xiàn)階段的處理規(guī)模往往存在較大出入,耗能大于產能,油氣損耗及無用功耗逐漸加劇,能源浪費現(xiàn)象日益嚴重[1]。其中,聯(lián)合站作為地面集輸系統(tǒng)的主要組成部分,具有采出液匯集、原油脫水、采出水處理及氣工藝處理等諸多功能,是油氣田開發(fā)中油氣消耗、電能消耗的重要環(huán)節(jié),運行過程中存在資源利用不合理、設備負荷率低等問題[2-3]。
以大慶某采油廠聯(lián)合站為例,工藝流程為井口來液通過站內匯管輸送至三相分離器進行油、氣、水分離。分離出的氣,一部分進入加熱爐系統(tǒng),為站內日用、摻水加熱、原油加熱等提供能量,一部分進入氣處理系統(tǒng),處理合格后的干氣外輸;分離出的水進入水處理系統(tǒng),通過過濾、沉降、增壓、回注,完成注水流程;含水油先后進入電脫水器和沉降罐分離、凈化,待原油含水率低于0.5%時外輸至煉廠。2022 年1 月1 日—12 月31 日,以天為單位,共收集各項運行參數(shù)365 條,包括但不限于原油密度、來液含水率、匯管壓力、出站壓力、匯管溫度、出站溫度、加熱爐耗氣量、外輸泵耗電量等。
首先,對數(shù)據(jù)進行完整性檢驗,識別缺失類型和缺失字段,計算每種參數(shù)的缺失數(shù)量和缺失比例。缺失統(tǒng)計結果見圖1。可見原油密度、含水率和外輸泵耗電量參數(shù)的缺失數(shù)量較大,這是由于原油取樣化驗存在周期性,站內外輸泵為兩用一備,當運行外輸泵檢修時,電表在記錄和遠傳上存在數(shù)據(jù)缺失。
圖1 數(shù)據(jù)缺失統(tǒng)計結果Fig.1 Statistical results of data missing
其次,對數(shù)據(jù)中的重復值進行檢驗,聯(lián)合站異常數(shù)據(jù)箱線圖法檢驗結果見圖2。即對數(shù)據(jù)報表中相鄰日期內屬性值相同的記錄進行識別,共得到21條重復數(shù)據(jù),將重復數(shù)據(jù)合并,共得到有效數(shù)據(jù)344 條。
圖2 聯(lián)合站異常數(shù)據(jù)箱線圖法檢驗結果Fig.2 Test results of box plot method of abnormal data from combined station
最后,對數(shù)據(jù)中的異常值采用箱線圖法檢驗,存在異常值的數(shù)據(jù)類型有匯管壓力、匯管溫度、加熱爐耗氣量和外輸泵耗電量[4-7]。其中:除加熱爐耗氣量外,其余數(shù)據(jù)的均值大于中位數(shù),表現(xiàn)為正偏態(tài);加熱爐耗氣量表現(xiàn)為負偏態(tài)??紤]到匯管直接連接三相分離器,分離器的承壓能力有限,故要求匯管壓力不大于1 MPa,對于大于1 MPa 的10 個異常值采用中位數(shù)0.60 MPa 替代。該站所屬區(qū)塊的原油凝點為25 ℃,為實現(xiàn)流動保障,匯管溫度應高于凝點3~5 ℃,其中有5 個異常點溫度大于50 ℃,3 個異常點溫度小于23 ℃,可能與現(xiàn)場傳感器數(shù)據(jù)漂移有關,將異常點采用中位數(shù)34.8 ℃替代。加熱爐日耗氣量和外輸泵日耗電量分別存在3個、11 個異常點,雖然處理液量和環(huán)境溫度的變化,均會影響站內水力和熱力消耗,但異常點不符合現(xiàn)場實際工況,故對其分別采用中位數(shù)4 522 m3和57 kWh 替代。
聯(lián)合站數(shù)據(jù)中的缺失值較為集中,采用三次樣條曲線,建立合適的分段函數(shù),對缺失信息進行重構。以外輸泵耗電量為例,2022 年3 月1—30 日的數(shù)據(jù)存在2 處缺失,分別為3 月15 日和3 月23 日,通過Spline 函數(shù)完成光滑曲線構建,并根據(jù)橫坐標的缺失日期確定相應的耗電量,繪制外輸系統(tǒng)電量的三次樣條曲線(圖3)。最終,得到3 月15 日和3月23 日的耗電量分別為572 kWh 和563 kWh,重構數(shù)據(jù)位于前一個數(shù)據(jù)和后一個數(shù)據(jù)的發(fā)展趨勢上,具有較高的精確度。對于其余缺失值的數(shù)據(jù)重構,采用相同方法。
圖3 外輸泵耗電量的三次樣條曲線Fig.3 Cubic spline curve of power consumption of external pump
涉及聯(lián)合站的能耗指標有單位液量綜合能耗、單位液量氣耗、單位液相電耗、單位原油氣耗、單位原油電耗等??紤]到采出水處理系統(tǒng)中涉及分壓注水和加熱摻水流程,氣處理系統(tǒng)中涉及再生塔、重沸器和換熱器等,故在此采用單位液量綜合能耗作為聯(lián)合站能耗評價的綜合性指標。
將單位液量綜合能耗作為參考序列,將經數(shù)據(jù)清洗后的因素作為比較序列,采用灰色關聯(lián)法驗證不同因素與單位液量綜合能耗的關系,灰色關聯(lián)度結果見圖4(分辨系數(shù)取0.5)。
圖4 不同因素的灰色關聯(lián)度Fig.4 Grey correlation degree of different factors
單位液量綜合能耗與加熱爐耗氣量的關聯(lián)度最大(0.757 1),兩者為強正相關。這是由于一方面氣耗用于加熱站內原油脫水,決定著處理深度,另一方面氣耗用于加熱站外摻水,與流動保障密切相關,這也直觀體現(xiàn)了熱力損失在總能耗中占比較大的特點。單位液量綜合能量與處理液量的關聯(lián)度也較大(-0.678 9),兩者為強負相關。這是由于該聯(lián)合站的設計規(guī)模與實際處理液量差較多,處理液量增大,設備負荷率會顯著提升,但能耗不會顯著增加,故兩者呈負相關。單位液量綜合能耗與原油密度和來液含水率的關聯(lián)度較小,均呈極弱正相關。
篩選灰色關聯(lián)度大于0.4 的數(shù)據(jù)作為影響聯(lián)合站單位液量綜合能耗的關鍵因素,按照灰色關聯(lián)度絕對值從大到小排列,依次為加熱爐耗氣量、處理液量、出站溫度、外輸泵耗電量、匯管壓力、匯管溫度、出站壓力和電脫水器電壓等。
為增加數(shù)據(jù)的擴展能力,實現(xiàn)未來任意時刻單位液量綜合能耗的預測,將上述篩選得到的8 個自變量作為輸入,將單位液量綜合能耗作為輸出,代入支持向量機(SVM)模型進行機器學習。在344條數(shù)據(jù)中任意抽取80%作為訓練集,20%作為測試集,訓練集用于尋找最優(yōu)超參數(shù),形成最佳SVM 模型,測試集用于驗證SVM 模型的準確性和魯棒性。其中,超參數(shù)的尋優(yōu)采用網(wǎng)格搜索法,設置懲罰因子∈[0,100],不敏感參數(shù)∈[0,10]。對SVM 模型的網(wǎng)絡結構及核函數(shù)類型采用試算法確定,隱含層節(jié)點數(shù)和核函數(shù)類型優(yōu)選結果見圖5。隨著隱含層節(jié)點數(shù)的增加,訓練誤差逐漸減小,核函數(shù)為Radial basis 函數(shù),隱含層節(jié)點為22 時,均方誤差最小,為6.50×10-3。最終,確定SVM 的模型結構為8-52-1 型。
圖5 隱含層節(jié)點數(shù)和核函數(shù)類型優(yōu)選Fig.5 Number of hidden layer nodes and kernel function type preference
為驗證SVM 模型對于單位液量綜合能耗預測結果的準確性,采用前饋神經網(wǎng)絡(BP)模型、隨機森林(RF)模型進行對比,以均方誤差EMS、均方根誤差ERMS和相關系數(shù)R2等三個統(tǒng)計學指標進行模型評價,評價指標對比結果見表1。其中,BP 模型在訓練階段的擬合效果較好,與SVM 模型的訓練效果相當,但在測試階段BP 模型的MSE 較訓練階段高出了一個數(shù)量級,說明BP 模型出現(xiàn)了過擬合現(xiàn)象,模型只是記住了數(shù)據(jù)類型和數(shù)值,從中未學到自變量與因變量之間的非線性關系;RF 模型在訓練階段和測試階段的表現(xiàn)相對較好;SVM 模型的預測效果最佳,在對未知測試集數(shù)據(jù)進行預測時,未出現(xiàn)明顯的過擬合和欠擬合現(xiàn)象,模型具有強魯棒性和泛化性。
表1 不同模型評價指標對比Tab.1 Comparison of evaluation indicators of different models
在滿足約束條件的前提下,以單位液量綜合能耗最低為目標函數(shù),將生產參數(shù)代入粒子群算法,以加熱爐耗氣量、出站溫度、外輸泵耗電量、匯管壓力、匯管溫度、出站壓力等為決策變量,實現(xiàn)優(yōu)化調整[8-10]。
約束條件如下:①三相分離器應滿足壓力約束,進站壓力不低于0.2 MPa;②三相分離器水相出口的含油質量濃度不超過1 000 mg/L,油相出口的含水率不高于10%,以分別滿足后續(xù)含水油和采出水的處理要求;③沉降罐出口應滿足原油含水率小于0.5%;④匯管溫度應高于原油凝點3℃,以保證原油在熱力條件下順利進站,不產生凝管現(xiàn)象;⑤出站溫度應低于原油初餾點,以保證原油進入外輸泵后不影響泵的吸入,如出站溫度過高還會對管道防腐層造成剝離影響。
粒子群算法流程具體步驟如下:①初始化粒子群算法的種群數(shù)量、問題維度和最大迭代次數(shù),將每個粒子的位置定義為待優(yōu)化的決策變量,種群數(shù)量等于粒子個數(shù),問題維度等于決策變量個數(shù);②將目標函數(shù)作為適應度函數(shù),計算隨機生成種群位置下的粒子適應度值,根據(jù)適應度值,計算種群中的個體極值位置和全局極值位置;③利用公式更新粒子的位置和速度;④判斷是否達到最大迭代次數(shù),如是則結束算法,輸出最佳適應度值對應的決策變量,如否則返回第②步進行重新計算。
單一時段的運行數(shù)據(jù)優(yōu)化結果見表2(優(yōu)化前為現(xiàn)場數(shù)據(jù),優(yōu)化后為預期數(shù)據(jù))。優(yōu)化后,預期各項優(yōu)化參數(shù)均有所降低, 按照工業(yè)電價0.8 元/kWh,燃料價格3.0 元/m3核算,每天可減少運行費用887.8 元,全年預計可節(jié)約26.6 萬元,節(jié)能效果顯著。
表2 運行數(shù)據(jù)優(yōu)化前后對比Tab.2 Comparison of operating data before and after optimization
1)通過灰色關聯(lián)度分析,得到影響聯(lián)合站單位液量綜合能耗的關鍵因素從大到小依次為加熱爐耗氣量、處理液量、出站溫度、外輸泵耗電量、匯管壓力、匯管溫度、出站壓力和電脫水器電壓等。
2)在核函數(shù)為Radial basis 函數(shù),SVM 模型結構為8-52-1 時對單位液量綜合能耗的訓練及預測效果最高,模型精度優(yōu)于BP、RF 等對比模型。
3)通過粒子群算法優(yōu)化后,出站溫度、出站壓力、加熱爐耗氣量、外輸泵耗電量等參數(shù)持續(xù)降低,預計全年節(jié)約運行費用26.6 萬元,節(jié)氣、節(jié)電效果明顯。