范振鐸
摘 要:在了解油水井生產(chǎn)狀況的基礎(chǔ)上,以集中式和數(shù)據(jù)流挖掘體系結(jié)構(gòu)為依據(jù),采用趨勢(shì)分析技術(shù)對(duì)油水井工況數(shù)據(jù)進(jìn)行實(shí)時(shí)分析預(yù)測(cè),實(shí)現(xiàn)分割點(diǎn)和異常點(diǎn)的檢驗(yàn)。利用油田采集的數(shù)據(jù)模擬形成數(shù)據(jù)流,通過實(shí)驗(yàn)驗(yàn)證,基于數(shù)據(jù)流的油水井工況分析系統(tǒng)總體框架可通用,VSW-PAA算法和趨勢(shì)分析方法很實(shí)用,進(jìn)行模式異常檢測(cè),檢測(cè)效果良好,能發(fā)現(xiàn)設(shè)備異常情況,為設(shè)備管理者提供決策依據(jù)。
關(guān)鍵詞:數(shù)據(jù)流;數(shù)據(jù)流聚類;模式異常;油水井工況
1 引言
油水井監(jiān)測(cè)系統(tǒng)在運(yùn)行的過程中會(huì)產(chǎn)生大量的實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),如何高效準(zhǔn)確的處理和利用這些數(shù)據(jù)完成油水井工況分析是油田的一大難題。示功圖可對(duì)油水井工況進(jìn)行分析,從而診斷設(shè)備是否正常運(yùn)行和分析故障產(chǎn)生的因素,為油水井正常生產(chǎn)提供技術(shù)保障。隨著通訊技術(shù)和檢測(cè)技術(shù)的發(fā)展,數(shù)據(jù)采集手段不斷豐富,數(shù)據(jù)流技術(shù)[1]已大范圍的推廣使用。在了解油水井工況分析技術(shù)的基礎(chǔ)上,利用相應(yīng)算法和數(shù)據(jù)流技術(shù),設(shè)計(jì)基于數(shù)據(jù)流技術(shù)的油水井工況分析系統(tǒng),實(shí)現(xiàn)油水井設(shè)備的實(shí)時(shí)監(jiān)測(cè)、異常診斷和故障診斷,同時(shí),為管理者提供決策依據(jù),為油水井管理提供了巨大的幫助。
2 油水工況分析系統(tǒng)的設(shè)計(jì)
數(shù)據(jù)挖掘[2]是從大量的數(shù)據(jù)中發(fā)現(xiàn)和搜尋有價(jià)值、可靠性和實(shí)用性的規(guī)律,這些規(guī)律是隱藏在數(shù)據(jù)中,充分的利用這些規(guī)律有利于生產(chǎn)分析。數(shù)據(jù)流現(xiàn)在沒有明確的定義,數(shù)據(jù)流的特性包括有序性、實(shí)時(shí)性、無限性、概要性和及時(shí)性,這些特性決定了數(shù)據(jù)處理的特點(diǎn),數(shù)據(jù)流結(jié)構(gòu)如圖1所示。數(shù)據(jù)流挖掘體系的對(duì)象是數(shù)據(jù)流,針對(duì)油水井工況分析的特殊情況,安裝相應(yīng)組件實(shí)現(xiàn)數(shù)據(jù)挖掘。油水井監(jiān)測(cè)系統(tǒng)在運(yùn)行的過程中會(huì)產(chǎn)生大量的實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),如何高效準(zhǔn)確的處理和利用這些數(shù)據(jù)完成油水井工況分析是油田的一大難題?,F(xiàn)在的數(shù)據(jù)處理模式不適用于動(dòng)態(tài)高速的數(shù)據(jù)處理,在分析現(xiàn)有技術(shù)弊端的基礎(chǔ)上,設(shè)計(jì)一種滿足油田需求的數(shù)據(jù)挖掘系統(tǒng)。針對(duì)動(dòng)態(tài)變化流速的數(shù)據(jù)流,我們提出可變滑動(dòng)窗口的數(shù)據(jù)流聚類算法[3],分為在線階段和離線階段,可進(jìn)行不同階段的數(shù)據(jù)流處理。數(shù)據(jù)挖掘常用技術(shù)有人工神經(jīng)網(wǎng)絡(luò)、決策樹、遺傳算法、近鄰算法和規(guī)則推導(dǎo)技術(shù)。數(shù)據(jù)挖掘是一種決策支持過程,關(guān)聯(lián)規(guī)則挖掘[4]必須先從資料集合中找出所有的高頻項(xiàng)目組,再由這些高頻項(xiàng)目組中產(chǎn)生關(guān)聯(lián)規(guī)則。數(shù)據(jù)流趨勢(shì)分析是建立在時(shí)間序列[5]的基礎(chǔ)上,研究現(xiàn)有數(shù)據(jù)流的規(guī)律,預(yù)測(cè)未來數(shù)據(jù)流的變化趨勢(shì)。數(shù)據(jù)流存在實(shí)時(shí)提取的困難,引入可變滑動(dòng)窗口調(diào)整現(xiàn)行回歸模型,實(shí)現(xiàn)基于分割點(diǎn)的最小二乘多元回歸趨勢(shì)分析方法[6]。采用趨勢(shì)分析技術(shù)對(duì)油水井工況數(shù)據(jù)進(jìn)行實(shí)時(shí)分析預(yù)測(cè),實(shí)現(xiàn)分割點(diǎn)和異常點(diǎn)的檢驗(yàn)。
3 油水工況分析系統(tǒng)的應(yīng)用
采用數(shù)據(jù)趨勢(shì)分析手段檢測(cè)數(shù)據(jù)流是否異常,設(shè)計(jì)數(shù)據(jù)流挖掘總體框架。采用時(shí)間序列數(shù)據(jù)流,提出分段聚類算法進(jìn)行去噪和壓縮處理,為數(shù)據(jù)趨勢(shì)分析打下良好基礎(chǔ)。在分析SW算法和OSD算法[7]優(yōu)缺點(diǎn)的基礎(chǔ)上,有針對(duì)性的結(jié)合并改進(jìn)相關(guān)算法,優(yōu)選最小二乘多元回歸趨勢(shì)分析算法,準(zhǔn)確提取數(shù)據(jù)流的相關(guān)趨勢(shì)特征和合理定位分割點(diǎn),實(shí)現(xiàn)趨勢(shì)準(zhǔn)確分析。在確定趨勢(shì)之后,進(jìn)行預(yù)測(cè)結(jié)果分析和異常檢測(cè)。由于很難做到數(shù)據(jù)流的實(shí)時(shí)提取,在分析數(shù)據(jù)分割算法和滑動(dòng)窗口算法優(yōu)缺點(diǎn)的基礎(chǔ)上,提出利用可變滑動(dòng)窗口調(diào)整線性回歸模型。數(shù)據(jù)流趨勢(shì)分析是根據(jù)數(shù)據(jù)流的特點(diǎn)進(jìn)行選擇模型,例如,周期性的動(dòng)態(tài)數(shù)據(jù)選擇線性回歸模型。故障趨勢(shì)分析技術(shù)主要是針對(duì)靜態(tài)數(shù)據(jù)進(jìn)行分析,對(duì)于實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù),已不適用,需要設(shè)計(jì)新的數(shù)據(jù)建模方法和數(shù)據(jù)處理技術(shù)。油水井工況分析系統(tǒng)主要有數(shù)據(jù)采集與傳輸、數(shù)據(jù)流監(jiān)測(cè)與表示和趨勢(shì)分析預(yù)測(cè)三大模塊。在設(shè)計(jì)完該系統(tǒng)之后,進(jìn)行系統(tǒng)調(diào)試和實(shí)驗(yàn)驗(yàn)證,效果良好。以油田采集到的數(shù)據(jù)為基礎(chǔ),模擬形成載荷數(shù)據(jù)流,利用該系統(tǒng)進(jìn)行數(shù)據(jù)流趨勢(shì)分析和異常檢測(cè),監(jiān)測(cè)效果良好,可提前發(fā)現(xiàn)油水井設(shè)備故障異常,為油田管理者提供決策依據(jù),可在其他油田進(jìn)行大范圍的推廣應(yīng)用。
4 結(jié)論
為實(shí)現(xiàn)油水井工況的實(shí)時(shí)監(jiān)測(cè)和故障診斷,結(jié)合數(shù)據(jù)流挖掘和集中式體系結(jié)構(gòu),搭建基于數(shù)據(jù)流技術(shù)的油水井工況分析框架。在分析數(shù)據(jù)流模式表示方法和趨勢(shì)分析方法優(yōu)缺點(diǎn)的基礎(chǔ)上,優(yōu)選能進(jìn)行去噪和壓縮的模式表示方法和趨勢(shì)分析方法。采集相關(guān)工況數(shù)據(jù)模擬形成數(shù)據(jù)流,了解數(shù)據(jù)流的挖掘方法,利用數(shù)據(jù)流分段聚類算法表示數(shù)據(jù)流模式。結(jié)合SW算法和OSD算法,采用最小二乘數(shù)據(jù)流趨勢(shì)分析方法,實(shí)現(xiàn)異常點(diǎn)與分割點(diǎn)的檢測(cè)。通過實(shí)驗(yàn)驗(yàn)證,不斷進(jìn)行算法修改,總體框架可通用,趨勢(shì)分析方法實(shí)用性好,異常檢測(cè)效果良好,達(dá)到工況分析和節(jié)能減耗的目的。在某油田的應(yīng)用可知,油水井工況監(jiān)測(cè)效果良好,可提前發(fā)現(xiàn)油水井設(shè)備故障異常,為油田管理者提供決策依據(jù),可在其他油田進(jìn)行大范圍的推廣應(yīng)用。
參考文獻(xiàn):
[1]周曉云,張凈,孫志揮.高Turnstile型數(shù)據(jù)流聚類算法[J].計(jì)算機(jī)科學(xué),2006.
[2]張忠平,王浩,薛偉.動(dòng)態(tài)滑動(dòng)窗口的數(shù)據(jù)流聚類方法[J].計(jì)算機(jī)工程與應(yīng)用,2011.
[3]朱蔚恒,印鑒,謝益煌.基于數(shù)據(jù)流的任意形狀聚類算法[J].軟件學(xué)報(bào),2006.
[4]常建龍,曹鋒,周傲英.基于滑動(dòng)窗口的進(jìn)化數(shù)據(jù)流聚類[J].軟件學(xué)報(bào),2007.
[5]宋寶燕.基于滑動(dòng)窗口的支持泛在應(yīng)用的流聚類挖掘算法[J].小型微型計(jì)算機(jī)系統(tǒng),2008.
[6]李國徽,向軍,陳剛.基于概率模型的數(shù)據(jù)流預(yù)測(cè)查詢算法[J].計(jì)算機(jī)科學(xué),2008.
[7]汪成亮,陸志堅(jiān).一種數(shù)據(jù)流趨勢(shì)分析方法的研究與應(yīng)用[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010.