張可佳,李春生,姜海英,趙 森
ZHANG Kejia1,LI Chunsheng1,JIANG Haiying2,ZHAO Sen3
1.東北石油大學(xué) 現(xiàn)代教育技術(shù)中心,黑龍江 大慶163318
2.大慶油田有限責(zé)任公司 第二采油廠地質(zhì)大隊(duì),黑龍江 大慶163000
3.大慶油田有限責(zé)任公司 礦區(qū)服務(wù)事業(yè)部,黑龍江 大慶163000
1.College of Computer and Information Technology,Northeast Petroleum University,Daqing,Heilongjiang 163318,China
2.The Second Oil Plant Geological Brigade,Daqing Oil Field Co.,Daqing,Heilongjiang 163000,China
3.Services Department,Daqing Oil Field Co.,Daqing,Heilongjiang 163000,China
人工智能經(jīng)過(guò)數(shù)十年發(fā)展,已經(jīng)廣泛應(yīng)用于工業(yè)生產(chǎn)及工程施工的各領(lǐng)域,并發(fā)揮著極大的作用,如CNG-HSE 系統(tǒng)[1]、InterBay-System(IBS)[2]。由于信息化的普及,相關(guān)生產(chǎn)數(shù)據(jù)的完整性和準(zhǔn)確性不斷提高,伴隨時(shí)間增長(zhǎng)帶來(lái)的數(shù)據(jù)量與日俱增,于是發(fā)現(xiàn)領(lǐng)域內(nèi)數(shù)據(jù)內(nèi)部規(guī)律,挖掘數(shù)據(jù)變化模式成為提高智能化應(yīng)用準(zhǔn)確度和有效性的關(guān)鍵[3]。時(shí)間序列的提出將關(guān)聯(lián)關(guān)系以時(shí)間為維度建立,降低了大數(shù)據(jù)量分析過(guò)程中的數(shù)據(jù)間耦合度,突破數(shù)據(jù)關(guān)系分析的瓶頸,解決了模式挖掘過(guò)程中由數(shù)據(jù)關(guān)系帶來(lái)的繁冗和高復(fù)雜度,使分布式并行計(jì)算的可用性和高效性更有意義。
領(lǐng)域決策者和專(zhuān)家的經(jīng)驗(yàn)積累程度和較強(qiáng)業(yè)務(wù)能力對(duì)于智能化應(yīng)用至關(guān)重要[4]。雖然通過(guò)知識(shí)工程的手段可以很好的發(fā)現(xiàn)業(yè)務(wù)領(lǐng)域內(nèi)的影響因素變化規(guī)律和模式,較好地解決了相關(guān)領(lǐng)域內(nèi)的故障認(rèn)定、風(fēng)險(xiǎn)評(píng)價(jià)、措施優(yōu)選等問(wèn)題,但是依舊存在以下缺陷:(1)相比對(duì)于某種模式的描述,專(zhuān)家界定該模式涵蓋的影響因子集合的準(zhǔn)確程度更高,這將有利于模式挖掘中數(shù)據(jù)降維過(guò)程?,F(xiàn)有多數(shù)方法過(guò)多的將專(zhuān)家定性化經(jīng)驗(yàn)引入模式挖掘過(guò)程,增加了模式結(jié)果本身的不確定性因素,降低了模式挖掘結(jié)果的可靠性[5]。(2)多數(shù)模式挖掘結(jié)果的表達(dá)方式較為簡(jiǎn)單,應(yīng)對(duì)復(fù)雜情況下的模式表達(dá)能力較弱。(3)由于缺乏對(duì)數(shù)據(jù)本身表象特征分析,忽略數(shù)值計(jì)算方法的作用導(dǎo)致有效數(shù)據(jù)項(xiàng)的擬合算法選取過(guò)于簡(jiǎn)單,在高階擬合、余音處理等方面計(jì)算難度較大,響應(yīng)時(shí)間過(guò)長(zhǎng),計(jì)算結(jié)果不夠準(zhǔn)確[6]。
針對(duì)此問(wèn)題,設(shè)計(jì)時(shí)間序列下模式挖掘模型(TODM),提出FC 閉包模型表示由專(zhuān)家界定的原始影響因子集,以均方差收斂等方法清洗和過(guò)濾噪聲因子。通過(guò)對(duì)數(shù)據(jù)離散點(diǎn)分布圖進(jìn)行分析,采用科學(xué)的分段擬合方法基于時(shí)間序列進(jìn)行擬合,設(shè)計(jì)CCM-ECM 模型,實(shí)現(xiàn)對(duì)TODM 模型挖掘結(jié)果的量化特征描述,并提出一種置信度計(jì)算算法實(shí)現(xiàn)模型的校正和自適應(yīng)過(guò)程,提高模式挖掘結(jié)果的高精細(xì)化描述程度,深度挖掘數(shù)據(jù)內(nèi)部的潛在規(guī)律。
專(zhuān)家組對(duì)于領(lǐng)域內(nèi)與事務(wù)相關(guān)的影響因子界定較為準(zhǔn)確,其判定的子集往往包含真實(shí)集[7]。將專(zhuān)家對(duì)于影響因子界定轉(zhuǎn)化為抽象的邏輯表示形式是整個(gè)挖掘模型的基礎(chǔ)。
以n位專(zhuān)家組成的專(zhuān)家組,領(lǐng)域內(nèi)存在某事務(wù)W,針對(duì)W發(fā)生后數(shù)據(jù)變化模式進(jìn)行挖掘。取領(lǐng)域內(nèi)影響因子全集R,分別由專(zhuān)家給出相應(yīng)原始影響因子集,其表述形式為:
Efn={un1,un2,…,unp|u∈R}
其中Efn表示第n位專(zhuān)家的結(jié)果,u為全集R的元素,將專(zhuān)家的結(jié)果進(jìn)行并運(yùn)算,于是有原始影響因子集的一般表述形式為:Efa=Ef1∪Ef2∪…∪Efn。
為實(shí)現(xiàn)建立自然語(yǔ)言描述的影響因子與數(shù)據(jù)體內(nèi)數(shù)據(jù)實(shí)體的映射關(guān)系,引入FC 閉包模型。具體定義如下:
定義1包含影響因子的自然語(yǔ)言形式u,直接描述u的數(shù)據(jù)實(shí)體df及映射關(guān)系函數(shù)F的閉包結(jié)構(gòu)成為FC閉包。其一般表示形式為:
FC={u,df,F|df≠φ,u∈Efa}
其中,Efa為有專(zhuān)家組提供的原始影響因子集;df為數(shù)據(jù)實(shí)體,實(shí)例化后為數(shù)據(jù)體內(nèi)的數(shù)據(jù)單項(xiàng);F為映射關(guān)系函數(shù),在u可直述時(shí),F(xiàn)可為空,當(dāng)u不可直述,df由F進(jìn)行計(jì)算獲得。
FC閉包模型建立自然語(yǔ)言與邏輯語(yǔ)言間的映射關(guān)系,并將因子間相互獨(dú)立,可以清晰地描述其抽象結(jié)構(gòu),提高Efa集的松散度,易于分析和計(jì)算。
通過(guò)數(shù)據(jù)體模型獲取Efa集元素的目標(biāo)數(shù)據(jù)實(shí)體df,建立u與df間的映射關(guān)系F,結(jié)合數(shù)據(jù)集成思想,利用FC閉包模型表示形式,產(chǎn)生原始FC 閉包集FEfa,其一般表述形式為:
FEfa={FC1,FC2,…,FCn|n=len(Efa)}
FEfa集維度與Efa集維度相同,并存在一一對(duì)應(yīng)關(guān)系,F(xiàn)Efa集將作為模式挖掘后續(xù)擬合計(jì)算的基礎(chǔ)。
受到專(zhuān)家不確定性經(jīng)驗(yàn)及定性化知識(shí)影響,F(xiàn)Efa集往往包含真實(shí)集Tr,即Tr?FEfa。為了減少FEfa集內(nèi)無(wú)效元素,提出一種時(shí)序下的數(shù)據(jù)處理和清洗方法,去除FEfa集內(nèi)無(wú)效元素,降低模式維度,防止維災(zāi)。
以FEfa集內(nèi)元素FCn為例,在事務(wù)W發(fā)生后,給定時(shí)間序列T={t1,t2,…,tp}將FCn實(shí)例數(shù)據(jù)劃分為p段等長(zhǎng)數(shù)據(jù),對(duì)tp={tp1,tp2,…,tps}內(nèi)數(shù)據(jù)集合dp={dp1,dp2,…,dps}通過(guò)算法1 處理。
算法1
Begin:若dp原始數(shù)據(jù)長(zhǎng)度s>0
Step1:由公式(1)計(jì)算dp原始數(shù)據(jù)均值
Step2:將dp原始數(shù)據(jù)處理為局部距離數(shù)據(jù)
Step3:由公式(2)取局部距離的均方差
End
于是將FCn的數(shù)據(jù)處理為:
D={T,?},T={t1,t2,…,tp},?={?1,?2,…,?P}。
算法1只討論二維情況,當(dāng)然通過(guò)FC閉包模型可以較為容易的推廣到多維情況。值得注意的是,算法1 中步驟2 中局部距離數(shù)據(jù)dkp將作為后續(xù)擬合過(guò)程中的真實(shí)數(shù)據(jù)樣本,以此消除樣本基數(shù)[8]差異帶來(lái)的負(fù)面影響。
以經(jīng)過(guò)處理后數(shù)據(jù)D={T,?}為基礎(chǔ),根據(jù)切貝雪夫變形及均算術(shù)積函數(shù)[9]得到激巨判定函數(shù)如公式(3)所示:
將函數(shù)還原得:
其中dps為分段內(nèi)原始數(shù)據(jù),s為分段內(nèi)數(shù)據(jù)長(zhǎng)度,p為分段量。
取μ(?)=max(?)-min(?),給出全局閾值系數(shù)ξ作為有效權(quán)重,于是得到閾值μr(?)=ξμ(?),其中μr(?)表示某元素的閾值。
根據(jù)激巨判定函數(shù)F(?),閾值函數(shù)μr(?),給出如下定義:
定義2在FEfa集內(nèi)元素FCn內(nèi),以原始數(shù)據(jù)作為計(jì)算樣本,當(dāng)F(?)>μr(?),則認(rèn)為FCn發(fā)生了激巨變化,且判定元素FCn是FEfa集的有效元素。
通過(guò)對(duì)FEfa集的搜索,逐一認(rèn)定FCn的有效化,并去除無(wú)效元素,降低FEfa集的維度,并最終得到有效FEfa集(V-FEfa集,包含元素個(gè)數(shù)m)。在認(rèn)定元素FCn有效后,將直接保留元素FCn的局部距離數(shù)據(jù),并構(gòu)成距離數(shù)據(jù)集合:
作為模式挖掘模型中FCn的數(shù)據(jù)樣本。這種清洗和數(shù)據(jù)處理方式在降低維度的同時(shí)完成對(duì)時(shí)序擬合數(shù)據(jù)的預(yù)處理,降低后期時(shí)序擬合的復(fù)雜度。
數(shù)據(jù)體本身必定存在其內(nèi)部復(fù)雜度不同的數(shù)學(xué)關(guān)系[10]。數(shù)據(jù)變化模式的最優(yōu)計(jì)算方法是數(shù)值擬合進(jìn)行參數(shù)計(jì)算,但對(duì)于最終表達(dá)形式的設(shè)計(jì)和擬合函數(shù)的選取一直是影響模式表示精準(zhǔn)度的重要問(wèn)題[11]。通過(guò)大量實(shí)驗(yàn)數(shù)據(jù)的處理,對(duì)其離散點(diǎn)分布圖進(jìn)行分析,采用一種相似度較高,擬合復(fù)雜度較低的分段擬合模型作為通用擬合方法,引入CCM-ECM 模型對(duì)最終表達(dá)形式分別描述,解決上述問(wèn)題,完成模式挖掘。挖掘過(guò)程如圖1所示。
圖1 TODM 模式挖掘流程圖
以工程施工或工業(yè)生產(chǎn)為例,當(dāng)某重大行為(事務(wù))W發(fā)生后,依據(jù)前述方法獲取V-FEfa集及其各元素的距離數(shù)據(jù)集合作為樣本,通過(guò)離散點(diǎn)分布圖分析,得到如圖2 所示。
圖2 距離數(shù)據(jù)與時(shí)間序列(D-T)擬合曲線示意圖
在事務(wù)W發(fā)生后,對(duì)于V-FEfa集某元素進(jìn)行分析:在初始時(shí)間t0至最大效應(yīng)時(shí)間tmax區(qū)間內(nèi),曲線呈激增上升狀態(tài),峰值為dkmax,在tmax至tps區(qū)間,曲線呈緩減下降狀態(tài),同時(shí)?t?(w→p),t?至tp區(qū)間作為函數(shù)余音。通過(guò)對(duì)高斯(Gaussian)、多項(xiàng)式、瑞利(Rayleigh)等多種模型進(jìn)行分析匹配后,最終提出以P-L(普朗克-洛倫茲)模型進(jìn)行分段擬合。普朗克(Planck)模型前期擬合準(zhǔn)確度高[12],適用于激增上升部分的擬合;洛倫茲(Lorenzian)模型對(duì)于樣本量較大的擬合過(guò)程較為準(zhǔn)確[13],適用于緩減下降部分的擬合,同時(shí)洛倫茲模型處理余音的較強(qiáng)的魯棒性,震顫情況較少。其他模型的優(yōu)缺點(diǎn)分析在此不再累述。于是提出通用擬合方法的P-L模型表示形式,如公式(4)所示:
由擬合參數(shù)構(gòu)成參數(shù)集Vr={a,b,c,d1,d2,d3,d4,τ},并以{T,dk}進(jìn)行擬合,逐一對(duì)滿(mǎn)足P-L 模型元素FCm進(jìn)行參數(shù)求解,得到:
Vrm={am,bm,cm,d1m,d2m,d3m,d4m,τm}
其中m是滿(mǎn)足通用擬合模型的元素?cái)?shù)量。對(duì)于不滿(mǎn)足P-L 模型的元素可以進(jìn)行單獨(dú)分析結(jié)合業(yè)務(wù)或領(lǐng)域知識(shí),選擇適應(yīng)其變化規(guī)律的獨(dú)立擬合模型進(jìn)行函數(shù)擬合,并得到其參數(shù)集Vgl,l為不滿(mǎn)足通用擬合模型的元素?cái)?shù)量,不同事務(wù)可以選取相應(yīng)符合實(shí)際情況的通用擬合模型,具體過(guò)程不做累述。
在V-FEfa集各元素的擬合過(guò)程中,將元素序列依據(jù)是否滿(mǎn)足通用擬合模型進(jìn)行重新分類(lèi),并聚類(lèi)抽象得到CCM-ECM 模型。具體定義如下:
定義3TODM 模型挖掘結(jié)果的表達(dá)方式(MOE)可由Vrm構(gòu)成的特征矩陣CCM,及Vgl構(gòu)成的余項(xiàng)集ECM表示,其一般形式如下所示:
其中余項(xiàng)集ECM={(F1,Vg1,1),(F2,Vg2,2),…,(Fl,Vgl,l)},F(xiàn)l為獨(dú)立擬合模型或識(shí)別標(biāo)識(shí),Vgl為其參數(shù)集。由Vrm進(jìn)行合并得到CCM特征矩陣:
通過(guò)CCM-ECM 模型實(shí)現(xiàn)的模式挖掘結(jié)果表示方式以數(shù)值計(jì)算方法為基礎(chǔ)結(jié)合特征矩陣進(jìn)行表示,屏蔽了外界因素的干擾和不確定性影響,單純以數(shù)據(jù)角度反應(yīng)與時(shí)間序列的關(guān)系,發(fā)現(xiàn)數(shù)據(jù)間的潛在規(guī)律,提供更準(zhǔn)確的輔助決策支持。同時(shí),這種設(shè)計(jì)思想對(duì)當(dāng)下較為流行的大數(shù)據(jù)下的模式挖掘也具有較好的效果。
在獲得TODM 模型結(jié)果后,需要對(duì)模型結(jié)果進(jìn)行置信度校驗(yàn),設(shè)定允許偏離最大誤差率λ,以前述方法取得校驗(yàn)樣本,并根據(jù)距離偏移誤差公式得:
ψps=F(Tps)-dkps
其中ψps表示在某時(shí)間點(diǎn)Tps,預(yù)期結(jié)果F(Tps)與實(shí)際樣本值dkps的偏移差,得到平均誤差率的計(jì)算公式:
及最大誤差率λmax的計(jì)算公式:
當(dāng)λmax<λ時(shí),認(rèn)為模型結(jié)果正確可信,當(dāng)λ<λmax,時(shí),認(rèn)為模型結(jié)果發(fā)生局部偏差,將進(jìn)行局部重新擬合。當(dāng)λ<λmax,時(shí),認(rèn)為模型結(jié)果需要進(jìn)行重新計(jì)算,模型將直接根據(jù)V-FEfa集進(jìn)行取樣,重復(fù)前述步驟,重新擬合計(jì)算并校正模型結(jié)果以實(shí)現(xiàn)自適應(yīng)過(guò)程。
以TODM 模型為基礎(chǔ),設(shè)計(jì)措施作業(yè)后模式挖掘模型,通過(guò)對(duì)油田施工后生產(chǎn)數(shù)據(jù)及相關(guān)作業(yè)歷史數(shù)據(jù)進(jìn)行分析計(jì)算挖掘油田生產(chǎn)過(guò)程中措施作業(yè)數(shù)據(jù)與油藏地質(zhì)學(xué)相關(guān)的指標(biāo)的變化規(guī)律和模式,應(yīng)用在大慶油田某采油廠地質(zhì)大隊(duì)、作業(yè)大隊(duì)等相關(guān)單位,為了縮小地質(zhì)師和作業(yè)工程師的初次界定范圍,規(guī)避客觀環(huán)境影響,通過(guò)與油藏學(xué)家及上游生產(chǎn)信息系統(tǒng)(PCEDM)設(shè)計(jì)師的反復(fù)交流和推敲,對(duì)300 余項(xiàng)相關(guān)的指標(biāo)(影響因子)進(jìn)行篩選,遴選出40 余項(xiàng)具有典型變化特征和參照度極高的指標(biāo)構(gòu)成基礎(chǔ)指標(biāo)庫(kù)(BER),如表1 所示。
表1 基礎(chǔ)指標(biāo)庫(kù)信息表
表1 中指標(biāo)可由現(xiàn)場(chǎng)專(zhuān)家根據(jù)施工作業(yè)及地質(zhì)環(huán)境等實(shí)際情況提出疑義并討論研究后進(jìn)行增減,粒度程度表示指標(biāo)的實(shí)際數(shù)據(jù)以時(shí)間為粒度的劃分程度。
以強(qiáng)化采油(EOR)——酸化作業(yè)為例,為了提高效果的直觀性,具體采用基質(zhì)酸化作業(yè)為標(biāo)準(zhǔn)[14]。由6 位廠級(jí)地質(zhì)師及4 位作業(yè)工程師組成的臨時(shí)專(zhuān)家小組依據(jù)油藏?cái)?shù)值、經(jīng)驗(yàn)公式等知識(shí)對(duì)BER 分別篩選,并最后形成統(tǒng)一的原始指標(biāo)集,其結(jié)構(gòu)及組成如表2 所示。
表2 基質(zhì)酸化的原始指標(biāo)集(Efa)結(jié)構(gòu)及組成
由于當(dāng)前大慶地區(qū)主力油田處于高含水期和特高含水期[15],原油含水量較高,出于保證實(shí)驗(yàn)結(jié)果的真實(shí)性的目的,降低環(huán)境及氣候因素的影響,對(duì)于Z1 將進(jìn)行去除產(chǎn)水量計(jì)算,即針對(duì)同一時(shí)間點(diǎn)取產(chǎn)油與產(chǎn)水量差值。同時(shí),以已脫除地層水的薩爾圖區(qū)塊-薩二北淺層油層組初次完成基質(zhì)酸化的16 口作業(yè)井進(jìn)行取樣,規(guī)定取樣日期所處年月、季節(jié)及樣本所處區(qū)塊大致相同。將所有樣本進(jìn)行如下處理:
(1)以井為單位將數(shù)據(jù)分為16組樣本,取樣對(duì)象如表3所示,并隨機(jī)取12組樣本為訓(xùn)練樣本,4組樣本為校正樣本。
表3 取樣對(duì)象及相關(guān)屬性表
(2)將所有訓(xùn)練樣本以作業(yè)時(shí)間為準(zhǔn)進(jìn)行時(shí)間原點(diǎn)初始化,定義作業(yè)時(shí)間t=0。
(3)根據(jù)PCEDM 結(jié)構(gòu)設(shè)計(jì)特點(diǎn),根據(jù)指標(biāo)與數(shù)據(jù)實(shí)體的關(guān)系進(jìn)行原始數(shù)據(jù)采集,取生產(chǎn)日數(shù)據(jù)為指標(biāo)的原始數(shù)據(jù)以提高實(shí)驗(yàn)的準(zhǔn)確度,根據(jù)基質(zhì)酸化作業(yè)的業(yè)務(wù)特點(diǎn),取樣范圍為時(shí)間原點(diǎn)后900 日,并按30 日為周期將數(shù)據(jù)等長(zhǎng)劃分。
經(jīng)過(guò)以上步驟完成對(duì)所有樣本的原始數(shù)據(jù)采集和初步處理后,對(duì)樣本原始數(shù)據(jù)進(jìn)行有效化判定,最終將Z1-產(chǎn)油量、Z2-酸堿度、Z3-油壓、Z11-壁粘稠度等7個(gè)元素判定有效,并計(jì)算相應(yīng)的距離數(shù)據(jù)進(jìn)行時(shí)序擬合。
有效元素經(jīng)過(guò)數(shù)值匹配方法即可知Z1、Z2 等元素符合PL 模型,Z11 不符合PL 模型。圖3 以Z1 及Z11 為例分別展示其離散點(diǎn)分布圖。
圖3 Z1 與Z11 離散點(diǎn)分布圖
根據(jù)P-L 模型分段公式對(duì)符合通用模型的元素進(jìn)行擬合并進(jìn)行參數(shù)求解計(jì)算,參數(shù)計(jì)算結(jié)果構(gòu)成的CCM矩陣特征矩陣為:
對(duì)于Z11 采用指數(shù)函數(shù)擬合模型進(jìn)行擬合,構(gòu)成的余項(xiàng)集
ECM={(Fdxs,Vg1Z11,1)},VglZ11={2,1.7,6}
以校正樣本進(jìn)行校正,根據(jù)專(zhuān)家意見(jiàn),給出偏離最大誤差率不高于5%,污染點(diǎn)個(gè)數(shù)小于5%進(jìn)行校驗(yàn),結(jié)果如表4 所示。
表4 校正樣本誤差率表
經(jīng)過(guò)上述分析計(jì)算可知,最終得到基質(zhì)酸化措施后的模式挖掘結(jié)果(ACI-MOE)誤差精度不大于5%,同時(shí)可以發(fā)現(xiàn)非污染點(diǎn)數(shù)量越多,誤差精度越小,所以TODM 對(duì)于數(shù)據(jù)準(zhǔn)確率具有一定要求。
將上述ACI-MOE應(yīng)用在另外20余口已酸化井進(jìn)行同步數(shù)據(jù)監(jiān)測(cè),監(jiān)測(cè)域?yàn)榇胧┖?個(gè)月內(nèi)PH值、產(chǎn)量等數(shù)據(jù)項(xiàng),為節(jié)約篇幅,以PH值和產(chǎn)量為標(biāo)準(zhǔn),同時(shí)應(yīng)用模糊專(zhuān)家推理法(FS)進(jìn)行比對(duì),比對(duì)結(jié)果如表5 所示。
其中17 口井生產(chǎn)數(shù)據(jù)在開(kāi)井后實(shí)際情況基本滿(mǎn)足ACI-MOE 模式,N5-4-29X 井由于關(guān)停后轉(zhuǎn)注,導(dǎo)致無(wú)明顯變化從監(jiān)測(cè)范圍內(nèi)排除,SN2-10-1 等2 口井發(fā)生數(shù)據(jù)大規(guī)模偏移,經(jīng)作業(yè)大隊(duì)檢查,發(fā)現(xiàn)是由于抽油機(jī)故障和低溫等問(wèn)題發(fā)生了異常,由此可見(jiàn),TODM 模型可以應(yīng)用在故障排查、油田預(yù)警等領(lǐng)域。
根據(jù)TODM 模型開(kāi)發(fā)的模式挖掘系統(tǒng)——井下作業(yè)跟蹤監(jiān)測(cè)評(píng)價(jià)系統(tǒng)已經(jīng)正常工作,因?yàn)閷?duì)數(shù)據(jù)內(nèi)部潛在關(guān)系的深度挖掘和精確表達(dá),較為廣泛的應(yīng)用范圍和相對(duì)簡(jiǎn)單的應(yīng)用過(guò)程受到了應(yīng)用單位的較好評(píng)價(jià)。
提出了時(shí)間序列下的模式挖掘模型(TODM),以FC 閉包模型構(gòu)建原始影響因子的形式語(yǔ)言表達(dá)結(jié)構(gòu),采用距離均方差算法以時(shí)間序列為基礎(chǔ)將數(shù)據(jù)分段計(jì)算,根據(jù)數(shù)值計(jì)算方法及根據(jù)激巨變化函數(shù)實(shí)現(xiàn)對(duì)數(shù)據(jù)的預(yù)處理和有效化判定,同時(shí)根據(jù)數(shù)據(jù)特征和離散點(diǎn)分布圖的分析給出科學(xué)合理的擬合模型;結(jié)合CCM-ECM模型實(shí)現(xiàn)對(duì)模式特征的抽象描述,并以距離偏移誤差公式計(jì)算誤差率進(jìn)行置信度校驗(yàn)以驗(yàn)證結(jié)果的準(zhǔn)確性,達(dá)到深度挖掘數(shù)據(jù)內(nèi)部潛在規(guī)律,提高數(shù)據(jù)變化模式的高精細(xì)化描述程度的目的。
表5 應(yīng)用效果比對(duì)表
[1] 鄭言.我國(guó)天然氣與安全評(píng)價(jià)與預(yù)警系統(tǒng)研究[D].北京:中國(guó)地質(zhì)大學(xué),2013.
[2] 吳立輝,顏丙生,張潔.求解全局優(yōu)化問(wèn)題的混合智能算法[J].計(jì)算機(jī)工程與應(yīng)用,2006,42(16):9-11.
[3] 劉立坤.海量文件系統(tǒng)元數(shù)據(jù)查詢(xún)方法與技術(shù)[D].北京:清華大學(xué),2011.
[4] Negnevitsky M.人工智能智能系統(tǒng)指南[M].北京:機(jī)械工業(yè)出版社,2012.
[5] 吳信東.帶通配符和-條件的序列模式挖掘[J].軟件學(xué)報(bào),2013,24(8):1804-1815.
[6] Deng Xiaoming,Wu Fuchao,Wu Yihong.An easy calibration method for central catadioptric cameras[J].Acta Automation Sinica,2007,33(8):801-808.
[7] Lancichinetti A,F(xiàn)ortunato S.Consensus clustering in complex networks[J].Scientific Reports,2012,2:336-337.
[8] 楊一鳴,潘嶸,潘嘉林,等.時(shí)間序列分類(lèi)問(wèn)題的算法比較[J].計(jì)算機(jī)學(xué)報(bào),2007,30(8):1259-1265.
[9] 龍波涌.平均值與切貝雪夫泛函[D].長(zhǎng)沙:湖南大學(xué),2012.
[10] Liu W,Lv L.Link predicition based on local random walk[J].Europhysics Letters,2010,89(5):58007.
[11] 尹文怡,范通讓.離散數(shù)據(jù)擬合模型的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(31):227-228
[12] 王虎,丁世飛.序列模式挖掘研究與發(fā)展[J].計(jì)算機(jī)科學(xué),2009,36(12):14-17.
[13] 陳家鼎,陳奇志.關(guān)于洛倫茲曲線和基尼系統(tǒng)的統(tǒng)計(jì)推斷[J].應(yīng)用數(shù)學(xué)學(xué)報(bào),2011,34(3):385-398.
[14] Yan L,Wang J.Extraction regular behaviors from social media networks[C]//Proc of the 3rd Int’l Conf on Multimedia Information Networking and Security,2011:613-617.
[15] 伍曉林,楚艷蘋(píng).大慶原油中酸性及含氮組分對(duì)界面張力的影響[J].石油學(xué)報(bào),2013,29(4):681-686.