張?zhí)铮醭疥?/p>
(中國石油新疆油田公司 勘探開發(fā)研究院,新疆 克拉瑪依 834000)
在實際工作中,由于基礎資料類型繁多、數(shù)據零散,整理起來讓技術人員費盡腦汁[1],整理數(shù)據的時間約占項目周期的30%~40%[2]。通過前期調研,梳理了國內各大油田內部主要使用的資料整理軟件,見表1所列,可以歸納為六大類,分別是地質類、測井類、繪圖類、地震解釋類、地震反演類及建模數(shù)模類。在軟件使用過程中發(fā)現(xiàn),從建立工區(qū)到數(shù)據成圖,主要涉及到鉆井、錄井、測井、試油四大類基礎地質資料[3]。油田軟件對于數(shù)據加載格式主要包括以下四種[4-6],分別是.las,.txt,.lis,.xls格式。各大油田建立的資料數(shù)據庫中,原始數(shù)據格式類型多,包括文本文件格式、716存儲格式、表格格式等。除了數(shù)據格式的多樣性外,文件表頭也不統(tǒng)一,有中文表頭、英文表頭、中英文表頭。不同油田軟件對數(shù)據格式的要求,以及數(shù)據之間格式轉換都是資料預處理面臨的問題。
除了上述問題外,目前,油田內部使用的資料預處理軟件也有多種,見表2所列。該類軟件功能均過于單一,并未達到集成化和針對性解決油田資料預處理的目的,國內外已有的大型資料預處理平臺,比如斯倫貝謝推出的Geofram平臺[7],中國石油集團測井有限公司技術中心研發(fā)的LEAD平臺等[8],對于操作系統(tǒng)、運行環(huán)境都有嚴格的要求,并且維護難度較大[9-11]。除此之外,對于試油試采資料方面,暫未有相關的預處理軟件,該類資料在日常的工作中,不僅數(shù)據量龐大,而且整理耗時長,對試油試采資料的預處理,也是油田日常工作中需重視的問題。
表1 油田常用資料整理
表2 資料預處理軟件清單
目前,主流的編程語言主要有Java,C++,C,Python,Visual Basic等。從實際編譯方面出發(fā),歸納出5種編程語言的特點見表3所列。
表3 五種編程語言特點簡介
相比于其他編程語言,Python語言具有更加快捷的開發(fā)速度,語法簡潔易于擴展和嵌入,便于充分利用不同編程語言的優(yōu)勢[12]。因此,選用Python語言來開發(fā)油田生產資料預處理軟件——紅番茄,這也是將Python編程語言運用到油田生產中的探索性嘗試。
為充分調用Python語言的多種數(shù)據庫,進一步實現(xiàn)實際工作中對于資料預處理工作的需求,根據Python語言自身特點,提出功能集成化的軟件設計思路,如圖1所示。
圖1 紅番茄軟件設計思路示意
紅番茄軟件運用Python語言編寫,共有五大模塊,分別是: 試油參數(shù)提取模塊、原始數(shù)據轉Forward模塊、原始數(shù)據轉標準模塊、原始數(shù)據轉LAS模塊以及原始曲線拼接模塊。截止目前,紅番茄軟件一共可實現(xiàn)13項預處理功能,如圖2所示。同時,考慮到實際工作中問題的多樣性,紅番茄軟件預留了更新模塊,用于后續(xù)的軟件升級和優(yōu)化。
圖2 紅番茄軟件資料預處理功能框架示意
針對windows XP及以上版本測試了軟件模塊,均可正常運行,紅番茄軟件應用程序直接安裝后即可運行,無需其他配套要求。
試油參數(shù)提取模塊主要用于試油數(shù)據的提取工作,既可以提取整列數(shù)據,也可以通過設定首尾關鍵字提取關鍵字間的數(shù)據。原始數(shù)據轉Forward模塊,主要有4項功能: 為測井曲線批量添加Forward表頭;利用比例系數(shù)統(tǒng)一氣測曲線數(shù)量級;從測井曲線集中挑選所需曲線轉為Forward格式;對曲線重采樣并剔除奇異值。
原始數(shù)據轉標準模塊也具有4項功能: 批量去除特殊表頭,主要用于Forward工區(qū)導出的曲線數(shù)據,以及從原始數(shù)據庫中下載的716存儲格式曲線數(shù)據;將原始的巖性數(shù)據轉換為標準的石文軟件加載格式;從測井曲線中挑選所需曲線轉為標準格式;對曲線進行重采樣并剔除奇異值。原始數(shù)據轉LAS模塊,主要用于原始數(shù)據向LAS格式的批量轉換,同時也可以實現(xiàn)曲線重采樣以及異常值剔除。原始曲線拼接模塊,主要將多次測量的測井曲線進行深度拼接,該模塊提供自動和手動兩種拼接方式。
通過分模塊測試和集中封裝測試,紅番茄軟件對于原始數(shù)據加載、數(shù)據格式轉換、試油參數(shù)提取、測井曲線拼接均能很好實現(xiàn),尤其是從原始測井數(shù)據中自動拾取常規(guī)9條曲線的功能,提高了科研分析人員篩選有效數(shù)據的效率,為室內油田生產資料預處理提供新方法。
以新疆油田實際生產資料數(shù)據為例進行軟件測試,隨機選取154口開發(fā)井和312口評價井數(shù)據,利用紅番茄軟件分析數(shù)據加載格式和轉換耗時兩方面性能。
紅番茄軟件具有較好兼容性,主要表現(xiàn)在兩方面: 一方面對文件格式的兼容性好,可以直接轉換文本格式和Excel格式的文件;另一方面對數(shù)據格式兼容性好,如數(shù)據格式為中文表頭、英文表頭或中英文混合表頭的,均可直接批量轉換,以批量添加Forward表頭為例,通過使用Forward表頭添加功能,可批量將原先的中文表頭、英文表頭及中英文表頭轉換為標準的Forward格式,便于Forward軟件加載成圖。
利用紅番茄軟件兼容性好的特點,不僅簡化了資料預處理過程,而且為后期軟件數(shù)據加載提供了方便。
為進一步驗證紅番茄軟件的執(zhí)行效率,從X1井區(qū)選取了154口開發(fā)井的測井曲線,從X2井區(qū)評價系統(tǒng)數(shù)據庫中隨機選取了312口評價井的測井曲線分別進行了測試。測試結果表明,利用紅番茄軟件對生產資料進行預處理,相比于手工和半自動化處理的模式,大幅縮減至原耗時間的約33%。
總的來說,對于測井曲線快速批量格式轉換、有效信息提取、曲線批量挑選以及特殊表頭批量處理等,紅番茄軟件均能高效完成。隨著生產資料數(shù)量的增大、數(shù)據類型的增多、格式混雜程度的增加,紅番茄軟件兼容好、效率高的優(yōu)勢便會更加突顯。
在將計算機語言的優(yōu)勢應用到油田實際生產資料預處理過程中,得到以下結論:
1)將Python編程語言易擴展的優(yōu)點引入到油田生產資料預處理軟件中是能夠實現(xiàn)的。
2)利用Python語言編寫的紅番茄軟件,實現(xiàn)
了油田生產資料預處理功能集成化的目的,并添加了試油資料整理功能,進一步彌補了之前預處理軟件的不足。
3)紅番茄軟件對提高實際油田生產資料預處理工作效率能夠發(fā)揮積極作用,該結論也為國內面臨相同生產資料預處理問題的油田提供參考。