徐 鵬 高健祎 陳 溯 張旭光
(1.中國海洋石油集團有限公司信息技術(shù)中心;2.中國海洋石油集團有限公司科技信息部)
近年來,國際原油價格劇烈波動,數(shù)字化轉(zhuǎn)型成為國內(nèi)外大型石油企業(yè)應(yīng)對能源行業(yè)轉(zhuǎn)型變革、促進自身業(yè)務(wù)發(fā)展的重要手段。殼牌、康菲石油公司等國外大型石油企業(yè)正在加快實施數(shù)字化轉(zhuǎn)型策略,充分利用大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)、人工智能等數(shù)字技術(shù)改變生產(chǎn)組織模式、經(jīng)營管理方式,進一步降低生產(chǎn)運營成本,提升企業(yè)的核心競爭力。
數(shù)據(jù)是數(shù)字化轉(zhuǎn)型的基礎(chǔ),數(shù)據(jù)質(zhì)量關(guān)系企業(yè)數(shù)字化轉(zhuǎn)型成敗,數(shù)據(jù)管理一直是油氣企業(yè)信息化建設(shè)的重要內(nèi)容。在油田信息化建設(shè)早期,各業(yè)務(wù)部門分散建設(shè)專業(yè)數(shù)據(jù)庫進行數(shù)據(jù)管理,主要用于記錄特定專業(yè)、特定業(yè)務(wù)的運行過程信息。隨著業(yè)務(wù)和技術(shù)的發(fā)展,分散獨立的專業(yè)數(shù)據(jù)庫形成了一個個數(shù)據(jù)孤島,無法滿足油田跨專業(yè)數(shù)據(jù)查詢的需求。一體化數(shù)據(jù)中心是在專業(yè)數(shù)據(jù)庫基礎(chǔ)上,按照勘探開發(fā)一體化模型,重新整合、建立的標準化數(shù)據(jù)庫,通過集中統(tǒng)一的數(shù)據(jù)服務(wù)支撐不同專業(yè)的應(yīng)用需求。近年來,大數(shù)據(jù)、人工智能等新興數(shù)字技術(shù)日益成熟,智能油田建設(shè)對半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用需求日益增多,數(shù)據(jù)湖逐步成為油氣企業(yè)數(shù)據(jù)管理的重要手段[1]。
1989年成立的公共石油數(shù)據(jù)模型協(xié)會(Public Petroleum Data Model Association)提出了 PPDM 石油數(shù)據(jù)模型標準。PPDM數(shù)據(jù)模型采用面向?qū)ο笤O(shè)計,并采用嚴格的命名約定,涵蓋業(yè)務(wù)分析、數(shù)據(jù)庫表、列、類別和代碼等[2]。PPDM數(shù)據(jù)模型可以根據(jù)業(yè)務(wù)需求變化而不斷升級擴展,其3.9版本已包含2688張數(shù)據(jù)表、71171個數(shù)據(jù)項[3]。
由BP、雪佛龍、埃爾夫、美孚、挪威國家石油公司等發(fā)起成立的石油開發(fā)軟件協(xié)會(Petrotechnical Open Software Corporation)提出了勘探開發(fā)中心數(shù)據(jù)模型標準POSC Epicentre。該數(shù)據(jù)模型標準采用面向?qū)ο笤O(shè)計,建立了以“對象—活動—關(guān)聯(lián)—特性”為核心思想的數(shù)據(jù)模型,反映了石油勘探開發(fā)各業(yè)務(wù)關(guān)系及技術(shù)關(guān)系[4]。POSC數(shù)據(jù)模型標準是一個統(tǒng)一的、可擴充的模型標準,定義了大約1500個勘探開發(fā)技術(shù)領(lǐng)域的對象語義[5]。
殼牌公司將所有地下數(shù)據(jù)(特別是生產(chǎn)現(xiàn)場實時數(shù)據(jù))匯聚到勘探開發(fā)數(shù)據(jù)湖中,實現(xiàn)了上游智能應(yīng)用與地球物理、地質(zhì)等核心專業(yè)軟件的高度融合[6]??捣剖凸緲?gòu)建了一個包含生產(chǎn)、運營、研究等方面的綜合數(shù)據(jù)平臺(IDW),有助于提高生產(chǎn)井正常運行時間、縮短鉆井周期、優(yōu)化完井設(shè)計,幫助工程師加深對地下儲層的認識,采用IDW可平均節(jié)省業(yè)務(wù)人員80%的數(shù)據(jù)準備時間,可將更多精力用于數(shù)據(jù)分析工作[7]。
中國石油天然氣集團有限公司(簡稱中國石油)按照“兩統(tǒng)一、一通用”的總體路線建設(shè)上游業(yè)務(wù)統(tǒng)一數(shù)據(jù)庫和統(tǒng)一技術(shù)平臺——勘探開發(fā)夢想云,以統(tǒng)一數(shù)據(jù)庫和統(tǒng)一技術(shù)平臺為基礎(chǔ),管理多類型海量數(shù)據(jù),建立起支撐勘探開發(fā)全過程的協(xié)同研究工作環(huán)境。截至目前,勘探開發(fā)夢想云已管理48萬口井、600個油氣藏、7000個地震工區(qū)、4萬座站庫;橫跨60多年的數(shù)據(jù)資產(chǎn)、涵蓋6大領(lǐng)域、15個專業(yè),數(shù)據(jù)量共計1.7PB;實現(xiàn)上游業(yè)務(wù)核心數(shù)據(jù)全面入湖共享,形成了國內(nèi)最大的勘探開發(fā)數(shù)據(jù)湖[8]。中國石油長慶油田公司自主研發(fā)了企業(yè)級科研環(huán)境平臺——數(shù)字化油氣藏研究與決策支持系統(tǒng)(RDMS),采用油氣藏數(shù)據(jù)鏈整合集成了油田開發(fā)建設(shè)40余年來形成的鉆井、錄井、測井、試油氣、分析化驗、油氣生產(chǎn)、動態(tài)監(jiān)測等18類專業(yè)數(shù)據(jù)庫, 新建了地質(zhì)圖件、生產(chǎn)支撐、方案設(shè)計等五大類研究成果庫[9]。
中國石油化工集團有限公司(簡稱中國石化)以POSC Epicentre為基本框架,結(jié)合集團勘探開發(fā)全業(yè)務(wù)進行優(yōu)化和擴展,形成了中國石化勘探開發(fā)一體化數(shù)據(jù)模型 SPDM(Sinopec Data Model)[10-11];建立了覆蓋13大專業(yè)源頭數(shù)據(jù)的源點總庫,通過一體化設(shè)計消除數(shù)據(jù)冗余和重復(fù)存儲,將原有專業(yè)庫中3.4萬余個數(shù)據(jù)項減至1.6萬余個。
從國內(nèi)外油氣田企業(yè)的實踐來看,將原來分散獨立的勘探開發(fā)數(shù)據(jù)進行集中統(tǒng)一的管理,提升數(shù)據(jù)質(zhì)量和共享水平,已經(jīng)成為行業(yè)領(lǐng)先企業(yè)的共同選擇。
中國海洋石油集團有限公司(簡稱中國海油)的數(shù)據(jù)管理工作起步較早,但長期處于分散建設(shè)狀態(tài)??碧?、開發(fā)、生產(chǎn)等各業(yè)務(wù)領(lǐng)域形成大量的數(shù)據(jù)資產(chǎn)都分散存儲在各油田公司或服務(wù)公司,存在數(shù)據(jù)標準不一、重復(fù)錄入、共享困難等突出問題。勘探開發(fā)數(shù)據(jù)在采集、存儲、使用過程中,缺乏規(guī)范統(tǒng)一、可持續(xù)的資產(chǎn)化管理,是導(dǎo)致數(shù)據(jù)質(zhì)量不佳、價值難發(fā)揮的根本原因。數(shù)據(jù)管理僅依靠信息系統(tǒng)建設(shè)無法完成,需要形成全方位、全過程的勘探開發(fā)數(shù)據(jù)資產(chǎn)管理體系,才能保證數(shù)據(jù)質(zhì)量。
全方位是指標準體系、管控體系、支撐平臺3個方面,三者相輔相成。標準體系指制定覆蓋勘探、開發(fā)、鉆完井、工程全流程的統(tǒng)一標準。管控體系指建立數(shù)據(jù)管理的組織機構(gòu),制定數(shù)據(jù)管理的制度和流程,明確數(shù)據(jù)資產(chǎn)歸屬和相關(guān)方權(quán)責。支撐平臺指建立企業(yè)級數(shù)據(jù)平臺,提供集成、統(tǒng)一、共享的基礎(chǔ)環(huán)境,支撐數(shù)據(jù)標準和管控流程落地。
全過程包括數(shù)據(jù)采集、存儲、使用3個階段。在采集階段,業(yè)務(wù)部門負責將數(shù)據(jù)采集操作納入業(yè)務(wù)流程,建立數(shù)據(jù)質(zhì)量的檢查考核機制,落實到具體崗位。信息化部門統(tǒng)籌業(yè)務(wù)部門需求,建立數(shù)據(jù)采集標準,明確數(shù)據(jù)格式、精度、量綱等規(guī)范性要求,實現(xiàn)數(shù)據(jù)及時、準確、完整地進入數(shù)據(jù)平臺。在存儲階段,信息化部門按照數(shù)據(jù)模型,建立數(shù)據(jù)存儲標準,明確數(shù)據(jù)關(guān)聯(lián),消除數(shù)據(jù)冗余;根據(jù)數(shù)據(jù)的重要性建立分級分類的數(shù)據(jù)存儲、備份機制;按照數(shù)據(jù)存儲標準和管控要求,建設(shè)數(shù)據(jù)存儲能力,形成數(shù)據(jù)資產(chǎn)目錄,實現(xiàn)數(shù)據(jù)統(tǒng)一歸集、高效存取和安全可信。在使用階段,信息化部門統(tǒng)籌共享和安全需求,建立數(shù)據(jù)使用的申請、審批流程,明確各方責任和義務(wù);按照業(yè)務(wù)需求和數(shù)據(jù)標準格式來建設(shè)數(shù)據(jù)服務(wù)能力,實現(xiàn)查詢、下載、同步、加載等服務(wù)功能,為業(yè)務(wù)應(yīng)用系統(tǒng)提供高效、快捷、規(guī)范的數(shù)據(jù)服務(wù)。
標準體系、管控體系和支撐平臺貫穿數(shù)據(jù)采集、存儲、使用的3個階段,形成全方位、全過程的數(shù)據(jù)資產(chǎn)化管理體系。
2011年以來,中國海油開展勘探開發(fā)一體化數(shù)據(jù)中心建設(shè)(A2項目),按照統(tǒng)一的數(shù)據(jù)標準整合各專業(yè)歷史數(shù)據(jù),完成了16個專業(yè)庫1.02億條歷史數(shù)據(jù)的清理和遷移,完成了1062萬條歷史數(shù)據(jù)的補充采集,建成了地質(zhì)油藏數(shù)據(jù)服務(wù)共享平臺,實現(xiàn)了公司地質(zhì)油藏數(shù)據(jù)資產(chǎn)的統(tǒng)一管理(圖1)。
2.2.1 標準體系方面
A2形成了一套成熟、完整、可擴展的數(shù)據(jù)標準編制方法,圍繞業(yè)務(wù)模型、邏輯模型、物理模型開展數(shù)據(jù)標準體系建設(shè)。
業(yè)務(wù)模型是對勘探開發(fā)業(yè)務(wù)流程的建模。通過全面梳理勘探開發(fā)的業(yè)務(wù)情況,將地質(zhì)油藏相關(guān)業(yè)務(wù)劃分為物化探、井筒工程、綜合研究、油氣田生產(chǎn)和分析化驗5個業(yè)務(wù)領(lǐng)域,按業(yè)務(wù)類別和業(yè)務(wù)階段劃分為50個一級業(yè)務(wù)、140個次級業(yè)務(wù)、3740余個最小業(yè)務(wù)功能單元(業(yè)務(wù)活動)。對具體業(yè)務(wù)活動,采用6W(崗位Who、時間When、地點Where、活動內(nèi)容How、業(yè)務(wù)對象Which、產(chǎn)生結(jié)果What)描述,業(yè)務(wù)活動劃分流程及描述內(nèi)容見圖2。將每一個業(yè)務(wù)活動涉及的數(shù)據(jù)項進行定義,包括數(shù)據(jù)類型、精度、量綱、非空等標準項的約束,形成一套完整的勘探開發(fā)一體化業(yè)務(wù)模型。
圖1 A2系統(tǒng)總體功能架構(gòu)
圖2 業(yè)務(wù)活動劃分及描述內(nèi)容示意圖
邏輯模型是為了便于用戶訪問和使用,提高數(shù)據(jù)查詢效率,面向?qū)嶓w對象進行建模(圖3)。A2參考行業(yè)通用的POSC模型標準,構(gòu)建一套面向?qū)ο蟮倪壿嬆P停凑栈顒?、對象、屬性建立完整的?shù)據(jù)關(guān)系,形成了油氣田四維(三維空間及時間)的數(shù)字孿生體??梢詮臅r間、對象、屬性對孿生體進行切片分析。按照時間,可以了解整個油氣田隨時間推移的變化趨勢;按照對象,如一口井,可以查看從鉆井設(shè)計、建井、完井、鉆后評價到投產(chǎn)或廢棄的全生命周期的業(yè)務(wù)情況;按照屬性,可以了解高產(chǎn)井的分布等情況。
圖3 勘探開發(fā)核心業(yè)務(wù)對象邏輯模型示意圖
物理模型定義了數(shù)據(jù)在不同類型數(shù)據(jù)庫中的存儲結(jié)構(gòu),是業(yè)務(wù)模型及邏輯模型在具體數(shù)據(jù)庫環(huán)境下的投影結(jié)果,用于存儲有關(guān)數(shù)據(jù)的來源、說明、與其他數(shù)據(jù)的關(guān)系、用途和格式等信息。
2.2.2 管控體系方面
A2從梳理數(shù)據(jù)源頭出發(fā),明確采集職責、流程和規(guī)范,依托定制化采集工具,全面開展歷史數(shù)據(jù)資源補充采集工作(圖4)。制定了2000余個數(shù)據(jù)集的補充采集模板和采集流程、8000余項數(shù)據(jù)質(zhì)檢規(guī)則,補充采集1062萬條未管理數(shù)據(jù)。
圖4 數(shù)據(jù)采集及審核流程
通過A2項目實施,初步建成了地質(zhì)油藏數(shù)據(jù)的質(zhì)量考核機制,定期對各單位數(shù)據(jù)齊全性、準確性、及時性情況進行考核,保證數(shù)據(jù)質(zhì)量(圖5)。
經(jīng)過A2項目梳理,形成了包含各業(yè)務(wù)領(lǐng)域的數(shù)據(jù)資產(chǎn)編目,既方便業(yè)務(wù)人員了解有哪些數(shù)據(jù)可用,又讓數(shù)據(jù)管理人員掌握公司的數(shù)據(jù)資產(chǎn)情況,確定需要補充建設(shè)的數(shù)據(jù)內(nèi)容。在此基礎(chǔ)上,A2實現(xiàn)了數(shù)據(jù)分級分類管理,按照數(shù)據(jù)類型建立對應(yīng)的數(shù)據(jù)存儲及備份機制;規(guī)范了數(shù)據(jù)使用權(quán)限管理流程,實現(xiàn)了按照業(yè)務(wù)、數(shù)據(jù)集、業(yè)務(wù)對象的精準授權(quán)。
2.2.3 支撐平臺方面
模型驅(qū)動是A2系統(tǒng)建設(shè)的核心理念,將業(yè)務(wù)模型、質(zhì)檢規(guī)則等業(yè)務(wù)元數(shù)據(jù),與采集規(guī)范、考核制度等管理元數(shù)據(jù),以及邏輯模型、物理模型、映射數(shù)據(jù)等技術(shù)元數(shù)據(jù)結(jié)合起來,利用元數(shù)據(jù)管理工具,實現(xiàn)模型與系統(tǒng)聯(lián)動。業(yè)務(wù)模型隨著業(yè)務(wù)持續(xù)發(fā)展而產(chǎn)生變更,在此過程中,系統(tǒng)工具通過建立元數(shù)據(jù)關(guān)聯(lián)關(guān)系,自動識別受模型變更影響的功能模塊,并實現(xiàn)零代碼維護的元數(shù)據(jù)升級工作(圖6)。
圖5 數(shù)據(jù)質(zhì)量考核結(jié)果
圖6 A2模型驅(qū)動的設(shè)計思路
A2實現(xiàn)了面向不同應(yīng)用場景的4種數(shù)據(jù)服務(wù)方式。一是面向第三方專業(yè)軟件的數(shù)據(jù)支持服務(wù),可與Petrel等石油專業(yè)軟件進行數(shù)據(jù)交互;二是面向持續(xù)性庫對庫的數(shù)據(jù)推送,可以提供ETL數(shù)據(jù)交換服務(wù),實現(xiàn)與歷史數(shù)據(jù)庫數(shù)據(jù)交換過程的實時監(jiān)控;三是面向不同主題的集市投影服務(wù),可以根據(jù)業(yè)務(wù)需求投影建庫,為新建應(yīng)用系統(tǒng)統(tǒng)一提供數(shù)據(jù)標準、模型支持和數(shù)據(jù)推送;四是面向?qū)ο竽P偷腟DK服務(wù)引擎以及外端驅(qū)動的Rest數(shù)據(jù)調(diào)用接口,可支持綜合報表類型的數(shù)據(jù)分析。
中國海油的A2系統(tǒng)實現(xiàn)了跨專業(yè)數(shù)據(jù)的集中展示和共享應(yīng)用,業(yè)務(wù)人員可以按照不同維度的批量打包、數(shù)據(jù)下載,減少了80%的數(shù)據(jù)搜集和編排工作量,有效提高了工作效率。A2還可以為新建應(yīng)用系統(tǒng)提供統(tǒng)一的數(shù)據(jù)服務(wù),減少新建項目30%~50%的工作量和投資費用。目前,A2已經(jīng)為10余個新建應(yīng)用系統(tǒng)提供了一站式數(shù)據(jù)支持服務(wù),有效降低了系統(tǒng)的建設(shè)成本。
隨著智能油氣田建設(shè)的不斷深入,跨專業(yè)協(xié)同的工作需求不斷增多,業(yè)務(wù)人員對“一站式”數(shù)據(jù)服務(wù)需求不斷增強,現(xiàn)有的數(shù)據(jù)資產(chǎn)化管理水平與中國海油數(shù)字化轉(zhuǎn)型、智能化發(fā)展的發(fā)展要求仍有一定差距,需要從以下3個方面進行改進。
一是在現(xiàn)有基礎(chǔ)上,堅持A2建模的方法論,擴展實時數(shù)據(jù)、地面工程數(shù)據(jù)相關(guān)標準,實現(xiàn)勘探開發(fā)地下及地面業(yè)務(wù)流程的全面融合,構(gòu)建完整的勘探開發(fā)一體化數(shù)據(jù)標準體系。
二是借鑒中國石化勘探開發(fā)業(yè)務(wù)協(xié)同平臺(EPBP)的建設(shè)經(jīng)驗[12],在業(yè)務(wù)部門和IT部門的共同努力下,全面啟動勘探開發(fā)數(shù)據(jù)庫治理工作,將數(shù)據(jù)采集職責落實到具體崗位,固化到業(yè)務(wù)流程,推廣數(shù)據(jù)質(zhì)量考核機制,從源頭做好數(shù)據(jù)資產(chǎn)化管理。
三是堅持模型驅(qū)動建設(shè)理念,在A2系統(tǒng)基礎(chǔ)上,開展勘探開發(fā)數(shù)據(jù)湖平臺建設(shè),擴展所支持的數(shù)據(jù)類型,全面啟動勘探開發(fā)數(shù)據(jù)治理工作,構(gòu)建支撐業(yè)務(wù)智能分析(Business Intelligence,BI)、人工智能分析(Artificial Intelligence,AI)的大數(shù)據(jù)服務(wù)能力。