李 淑,王 鵬,郭怡曉,安 靜,毛 娜
(1.新疆油田重油開發(fā)公司,新疆 克拉瑪依 834000;2.新疆油田公司數(shù)據(jù)公司,新疆 克拉瑪依 834000)
油田企業(yè)在生產(chǎn)過程會產(chǎn)生大量的數(shù)據(jù)信息,如何將大量的數(shù)據(jù)信息進行有效整合并運用在企業(yè)生產(chǎn)和決策當中,已經(jīng)成為油田企業(yè)運用數(shù)據(jù)挖掘技術(shù)所要解決的重要難點問題。
數(shù)據(jù)挖掘是利用計算機算法來對大數(shù)據(jù)進行數(shù)據(jù)的篩選、轉(zhuǎn)換、挖掘等操作后,將收集的信息數(shù)據(jù)轉(zhuǎn)化為有效信息。但數(shù)據(jù)挖掘操作過程并不需要收集和處理數(shù)據(jù),只需要對結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)進行準備、挖掘、結(jié)果分析。在數(shù)據(jù)準備階段,通過對數(shù)據(jù)源進行數(shù)據(jù)選擇和篩選后,在數(shù)據(jù)挖掘階段,對轉(zhuǎn)換的數(shù)據(jù)進行結(jié)果分析和模式評估,最終獲取有效的信息數(shù)據(jù)。
數(shù)據(jù)挖掘技術(shù)主要具備以下四大特征:第一,雖然數(shù)據(jù)挖掘技術(shù)能夠提供數(shù)量龐大且真實的數(shù)據(jù)信息,但是數(shù)據(jù)源及數(shù)據(jù)內(nèi)容具有不確定性;第二,通過篩選、轉(zhuǎn)換、挖掘、結(jié)果分析后的數(shù)據(jù)運用在油田企業(yè)商業(yè)領(lǐng)域的價值具有相對性;第三,油田企業(yè)在生產(chǎn)過程中采用數(shù)據(jù)挖掘技術(shù)的目的是滿足客戶需要,并將客戶的需要作為企業(yè)數(shù)據(jù)提取和挖掘的主要關(guān)注對象;第四,挖掘和處理后的數(shù)據(jù)信息不僅具備有效性,同時更容易被客戶接受,并將挖掘和處理后的數(shù)據(jù)信息用于指導(dǎo)企業(yè)的生產(chǎn)和活動。
基于數(shù)據(jù)挖掘技術(shù)的專項數(shù)據(jù)庫內(nèi)的數(shù)據(jù)較為廣泛,其運用需求也非常多樣化,檢索需求也更為復(fù)雜,以往的數(shù)據(jù)庫結(jié)構(gòu)缺乏較高的靈活性來滿足此種較為繁復(fù)的使用需求。因此,油田企業(yè)需要切實從用戶層面來解析與規(guī)劃數(shù)據(jù)庫的體系結(jié)構(gòu),依據(jù)數(shù)據(jù)庫的使用需求來確認解析的主題和各項指標,數(shù)據(jù)正式在數(shù)據(jù)庫存儲之前,需要經(jīng)過數(shù)據(jù)抽取、轉(zhuǎn)化等有序的處理流程。之后,再挑選相對適宜的存儲模型,開展有效的組織,將數(shù)據(jù)存儲于數(shù)據(jù)庫之中,從而在其中解析挖掘具有價值的信息,為企業(yè)決策提供數(shù)據(jù)信息支持。
通常而言,基于數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)庫體系結(jié)構(gòu)可規(guī)劃出3 個相對獨立的數(shù)據(jù)層級,包括信息收集層、數(shù)據(jù)管控層與應(yīng)用服務(wù)層。文章所提出的油田生產(chǎn)決策支持系統(tǒng)是由數(shù)據(jù)源層、數(shù)據(jù)收集層、數(shù)據(jù)管控層、數(shù)據(jù)解析層與數(shù)據(jù)展示層5 個層級所組成的體系結(jié)構(gòu)。
數(shù)據(jù)源層主要存放油田生產(chǎn)過程中的大批量數(shù)據(jù)與解析決策階段所需的外部數(shù)據(jù)。數(shù)據(jù)收集層從數(shù)據(jù)源層中抽取解析決策所需要的有關(guān)信息,之后將精準化處理與解析之后的數(shù)據(jù)集合到油田生產(chǎn)專項數(shù)據(jù)庫之中。借助數(shù)據(jù)管控層對數(shù)據(jù)庫之中的數(shù)據(jù)與數(shù)據(jù)源進行有效的存儲與管控,依據(jù)多樣化的運用需求來創(chuàng)建有效的集中管控分組。結(jié)合相應(yīng)主題的數(shù)據(jù)集,數(shù)據(jù)解析層開展線上解析處理與數(shù)據(jù)挖掘工作,以實現(xiàn)數(shù)據(jù)的多層級解析與挖掘。之后利用數(shù)據(jù)挖掘工具將從數(shù)據(jù)庫中挖掘的信息傳入專家系統(tǒng)的專項庫中,有效借助知識推理,實現(xiàn)定性解析輔助決策;而模型庫則可以實現(xiàn)眾多模型的整體化決策。最后,數(shù)據(jù)展示層將最終的解析結(jié)果以圖表的形式更為直觀地展現(xiàn)在決策者的面前,以幫助其更為科學(xué)地開展決策。
油田企業(yè)在生產(chǎn)過程中,采用數(shù)據(jù)挖掘技術(shù)必須遵循可視化操作、運用流程、信息綜合三大原則。
油田企業(yè)在生產(chǎn)過程中,使用數(shù)據(jù)挖掘技術(shù)是為企業(yè)各部門及企業(yè)生產(chǎn)提供便利、科學(xué)、高效的操作指導(dǎo)和幫助,為企業(yè)的生產(chǎn)提供更為準確的數(shù)據(jù)信息服務(wù),這就要求其在數(shù)據(jù)挖掘技術(shù)的最終結(jié)果、挖掘模型及挖掘過程具備可視化操作原則,將各生產(chǎn)流程和數(shù)據(jù)信息轉(zhuǎn)變?yōu)榭梢暬膱D像和動態(tài)數(shù)據(jù),幫助油田企業(yè)更好地全面掌控各生產(chǎn)數(shù)據(jù)信息。
油田企業(yè)在生產(chǎn)過程中使用數(shù)據(jù)挖掘技術(shù)的基本要求,就是遵循運用流程原則。企業(yè)必須明確數(shù)據(jù)挖掘的目標并做好充分的準備,遵循運用流程原則,對數(shù)據(jù)信息進行挖掘,并將數(shù)據(jù)信息轉(zhuǎn)化為有效信息。
油田企業(yè)在生產(chǎn)過程中運用數(shù)據(jù)挖掘技術(shù)所要收集的信息內(nèi)容具有多元化、復(fù)雜化的特征,所以不同客戶所需要的信息要求存在內(nèi)容上的差距。因此,油田企業(yè)對不同客戶的信息采用數(shù)據(jù)挖掘技術(shù)時,需要遵循信息綜合原則來進行綜合性的信息處理,并對不同客戶的信息根據(jù)其特征進行分類并展開研究,對不同客戶的信息利用專門化的表格進行數(shù)據(jù)登記和整理。同時,根據(jù)石油的空間維度來對石油的分布情況和集中趨勢進行研究和掌握。從客戶角度進行數(shù)據(jù)挖掘和分析,能夠幫助單位內(nèi)部各部門進行有效的規(guī)劃生產(chǎn),并為決策者提供有效的信息依據(jù),確保油田企業(yè)生產(chǎn)環(huán)節(jié)各項數(shù)據(jù)的公開化、透明化,以滿足客戶根據(jù)實際需要了解企業(yè)信息,以及提升油田企業(yè)的服務(wù)質(zhì)量和企業(yè)社會形象的需求。
數(shù)據(jù)挖掘技術(shù)在油田企業(yè)生產(chǎn)中的應(yīng)用,主要體現(xiàn)在企業(yè)信息化建設(shè)和財務(wù)分析兩個方面。
3.1.1 數(shù)據(jù)準備
將數(shù)據(jù)挖掘技術(shù)運用在信息化建設(shè)當中的首要工作,就是要明確信息化建設(shè)的目標和面臨的問題,對油田企業(yè)生產(chǎn)所面臨的異?,F(xiàn)象和問題采用分類分析法和聚類分析法進行數(shù)據(jù)分析。當油田企業(yè)數(shù)據(jù)信息出現(xiàn)異常變化以及超注欠注等異常問題時,油田企業(yè)需要及時對出現(xiàn)問題的異常井和泄露井進行檢查,并根據(jù)實際的生產(chǎn)情況,優(yōu)化和整合生產(chǎn)作業(yè)方案,及時對出現(xiàn)異常情況的井進行處理,確保油田企業(yè)的正常生產(chǎn),切實提高油田企業(yè)生產(chǎn)的安全性與經(jīng)濟性。
3.1.2 數(shù)據(jù)庫與數(shù)據(jù)模型構(gòu)建
收集、存儲油田企業(yè)生產(chǎn)過程中所產(chǎn)生的一系列數(shù)據(jù)構(gòu)建數(shù)據(jù)庫后,需要建立與收集信息匹配的數(shù)據(jù)模型,為下一步的數(shù)據(jù)挖掘工作做好準備。企業(yè)創(chuàng)建相應(yīng)的數(shù)據(jù)模型用于數(shù)據(jù)挖掘工作,通過采用神經(jīng)網(wǎng)絡(luò)、模糊聚類、統(tǒng)計分析、關(guān)聯(lián)規(guī)則等方法對油田企業(yè)生產(chǎn)過程中所產(chǎn)生的各類數(shù)據(jù)進行集成處理,將油田企業(yè)生產(chǎn)數(shù)據(jù)收集整理的信息按照一定的劃分層次分為校驗數(shù)據(jù)和訓(xùn)練數(shù)據(jù)。前者主要用于對匹配的模型進行檢驗,后者主要用于確定模型的求解參數(shù)。通過對油田企業(yè)各生產(chǎn)環(huán)節(jié)所產(chǎn)生的數(shù)據(jù)進行收集檢驗,并配套建立相應(yīng)的數(shù)據(jù)模型,觀察數(shù)據(jù)的各類變化,這是油田企業(yè)數(shù)據(jù)挖掘技術(shù)模型檢驗階段的最終目的。
3.1.3 分析數(shù)據(jù)
企業(yè)各生產(chǎn)環(huán)節(jié)的數(shù)據(jù)在采集過程中容易出現(xiàn)樣本誤差,而較大的樣本誤差則會直接影響企業(yè)網(wǎng)絡(luò)搭建的準確度和全面性,從而對企業(yè)網(wǎng)絡(luò)識別功能造成巨大的破壞。因此,油田企業(yè)信息化建設(shè)運用數(shù)據(jù)挖掘技術(shù)進行信息采集時,必須要收集和篩選與分析階段配套且合適的訓(xùn)練樣本,通過油田企業(yè)財務(wù)部門技術(shù)人員豐富的工作經(jīng)驗和扎實的專業(yè)技術(shù)能力,以及對客戶的實際需求來進行對應(yīng)數(shù)據(jù)的整理和挖掘。一旦客戶的實際需求無法通過數(shù)據(jù)采集模式獲取時,客戶會重新篩選適合自身實際需求的數(shù)據(jù)信息,從而進行參數(shù)的確定以及配套數(shù)據(jù)模型的構(gòu)建。
3.2.1 財務(wù)指標中的具體應(yīng)用
油田企業(yè)財務(wù)分析工作階段采用數(shù)據(jù)挖掘技術(shù),主要是對傳統(tǒng)的財務(wù)分析進行改進。首先將傳統(tǒng)的財務(wù)事后分析方法轉(zhuǎn)變?yōu)閿?shù)據(jù)挖掘技術(shù)下的實時分析。過去,油田企業(yè)財務(wù)部門主要是依靠會計核算系統(tǒng),在對各項數(shù)據(jù)進行收集與分析的基礎(chǔ)上,進行各類數(shù)據(jù)指標的計算。而現(xiàn)階段采用以數(shù)據(jù)挖掘技術(shù)為主要手段的財務(wù)分析能夠?qū)崿F(xiàn)物流、生產(chǎn)、財務(wù)各系統(tǒng)與部門之間的數(shù)據(jù)聯(lián)系和實時的數(shù)據(jù)交流,極大滿足了各部門和系統(tǒng)對于實時數(shù)據(jù)的需求。其次,以數(shù)據(jù)挖掘技術(shù)為主的財務(wù)分析能夠?qū)崿F(xiàn)對各生產(chǎn)階段的數(shù)據(jù)層級和作業(yè)成本進行精準的傳輸和分配,極大地提高了數(shù)據(jù)輸出與財務(wù)指標計算的精準度。
3.2.2 財務(wù)分析平臺的具體工作流程
基于數(shù)據(jù)挖掘技術(shù)構(gòu)建的企業(yè)財務(wù)分析平臺,需要為油田企業(yè)的決策和實際生產(chǎn)提供有價值的信息,而不是簡單地進行數(shù)據(jù)模型的構(gòu)建和套用復(fù)雜的數(shù)據(jù)算法。因此,基于數(shù)據(jù)挖掘技術(shù)的油田企業(yè)財務(wù)分析平臺,需要對油田企業(yè)生產(chǎn)的各類數(shù)據(jù)進行挖掘,主要內(nèi)容包括明確問題、數(shù)據(jù)集成和準備、數(shù)據(jù)結(jié)果分析和知識同化。
(1)明確問題
采用數(shù)據(jù)挖掘技術(shù),基于油田企業(yè)生產(chǎn)所產(chǎn)生的各類數(shù)據(jù),明確所要分析的問題,同時對油田企業(yè)內(nèi)外部信息和數(shù)據(jù)進行有效整合、提取和轉(zhuǎn)換,導(dǎo)入財務(wù)分析數(shù)據(jù)庫。
(2)數(shù)據(jù)集成和準備
只有實現(xiàn)財務(wù)數(shù)據(jù)信息在不同用戶和系統(tǒng)間的傳遞和共享,才能體現(xiàn)財務(wù)數(shù)據(jù)的價值,但在數(shù)據(jù)傳遞和共享過程中極易出現(xiàn)數(shù)據(jù)的破壞和泄露。油田企業(yè)需要在數(shù)據(jù)傳輸和共享過程中,重點關(guān)注財務(wù)數(shù)據(jù)信息存在的問題和解決方法的實效性,并根據(jù)不同用戶的需求和問題選擇合適的數(shù)據(jù)。
(3)數(shù)據(jù)結(jié)果分析和知識同化
油田企業(yè)在對財務(wù)分析所挖掘的數(shù)據(jù)信息進行結(jié)果的評價和分析過程中,財務(wù)部門工作人員憑借多年的工作經(jīng)驗,運用配套的數(shù)據(jù)模型對數(shù)據(jù)進行檢驗,一旦挖掘數(shù)據(jù)結(jié)果存在異常,財務(wù)部門需要及時調(diào)整數(shù)據(jù)挖掘模型,開展后續(xù)階段再挖掘工作。
油田企業(yè)在財務(wù)分析階段通過問題的識別、數(shù)據(jù)的集成和準備、模型的建立、結(jié)果的評價后,需要對數(shù)據(jù)挖掘最終結(jié)果進行分析并將有效知識運用到企業(yè)財務(wù)系統(tǒng)當中,實現(xiàn)知識的同化,為油田企業(yè)的生產(chǎn)和財務(wù)工作的開展提供重要的決策依據(jù)。
油田企業(yè)將數(shù)據(jù)挖掘技術(shù)運用到信息化建設(shè)和財務(wù)分析當中,可以對企業(yè)生產(chǎn)所過程中產(chǎn)生的各類數(shù)據(jù)進行有效挖掘、分析,配套構(gòu)建數(shù)據(jù)模型,并從大量的數(shù)據(jù)當中提取有效數(shù)據(jù),用于提高油田企業(yè)的生產(chǎn)效率和決策的全面性、科學(xué)性。