謝榮(西南油氣田通信與信息技術(shù)中心川北總站,四川 遂寧 629000)
用大數(shù)據(jù)技術(shù)進(jìn)行實(shí)時(shí)風(fēng)險(xiǎn)評(píng)估的設(shè)想
謝榮(西南油氣田通信與信息技術(shù)中心川北總站,四川 遂寧 629000)
隨著SCADA系統(tǒng)的普及,數(shù)據(jù)采集點(diǎn)、數(shù)據(jù)類型、數(shù)據(jù)保留時(shí)間的增加勢(shì)必會(huì)形成SCADA系統(tǒng)的大數(shù)據(jù)。本文以油氣集輸管道系統(tǒng)為例,講述應(yīng)用大數(shù)據(jù)分析技術(shù)對(duì)油氣輸送管道進(jìn)行風(fēng)險(xiǎn)評(píng)估、智能推薦和輔助決策的設(shè)想。通過(guò)SCADA系統(tǒng)的大數(shù)據(jù)分析處理,實(shí)現(xiàn)在事故發(fā)生前能提前預(yù)知事故,從而規(guī)避事故的發(fā)生,降低事故發(fā)生的可能性;而在事故發(fā)生中和事故發(fā)生后,能幫助決策者做出更合理的事故緩解措施和應(yīng)急救援,從而減輕事故的嚴(yán)重性和危害性。
SCADA系統(tǒng);大數(shù)據(jù);實(shí)時(shí)風(fēng)險(xiǎn)評(píng)估
我國(guó)油氣集輸管道所采用的監(jiān)控系統(tǒng)是數(shù)據(jù)采集與監(jiān)控系統(tǒng)(SCADA)。在實(shí)際運(yùn)行過(guò)程中,由于應(yīng)用方面的實(shí)際需求,通常需要把采集的數(shù)據(jù)保留很長(zhǎng)一段時(shí)間,用于查詢、分析和統(tǒng)計(jì)。另一方面,管道上的數(shù)據(jù)采集點(diǎn)和類型很多,包括溫度、流量、壓力、腐蝕等多項(xiàng)監(jiān)測(cè)數(shù)據(jù);采集要求實(shí)時(shí)性較高,需要保持著較高的采集頻率,形成了SCADA系統(tǒng)的大數(shù)據(jù)(big data)[1]?,F(xiàn)在所采集的數(shù)據(jù)大多只是用來(lái)產(chǎn)生班報(bào)、日?qǐng)?bào)、月報(bào)、年報(bào)等生產(chǎn)報(bào)表,或者用來(lái)實(shí)現(xiàn)追溯事故原因、責(zé)任等基本功能,還沒(méi)有很好地被用作預(yù)測(cè)事故等。
1.1 大數(shù)據(jù)
“大數(shù)據(jù)”是一個(gè)體量特別大,數(shù)據(jù)類別特別大的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集無(wú)法用傳統(tǒng)數(shù)據(jù)庫(kù)工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理。其滿足四個(gè)特點(diǎn):規(guī)模性(Volumes)、多樣性(Variety)、高速性(Velocity)、真實(shí)性(Veracity)。
1.2 大數(shù)據(jù)的分析
(1)可視化分析 大數(shù)據(jù)的可視化分析,是將集中的大型數(shù)據(jù)以圖形圖像的形式呈現(xiàn),并利用數(shù)據(jù)分析和開(kāi)發(fā)工具挖掘其中的未知信息與潛在價(jià)值的處理過(guò)程。
(2)數(shù)據(jù)挖掘算法 大數(shù)據(jù)分析的理論核心就是數(shù)據(jù)挖掘算法,各種數(shù)據(jù)挖掘的算法基于不同的數(shù)據(jù)類型和格式才能更加科學(xué)的呈現(xiàn)出數(shù)據(jù)本身具備的特點(diǎn),挖掘出公認(rèn)的價(jià)值。另一個(gè)方面也正是因?yàn)橛羞@些數(shù)據(jù)挖掘的算法才能更快速的處理大數(shù)據(jù),從中尋找出有助于輔助制定決策的信息。
(3)預(yù)測(cè)性分析能力 大數(shù)據(jù)分析最重要的應(yīng)用領(lǐng)域之一就是預(yù)測(cè)性分析,從大數(shù)據(jù)中挖掘出特點(diǎn),通過(guò)科學(xué)的建立模型,之后便可通過(guò)模型帶入新的數(shù)據(jù),從而預(yù)測(cè)未來(lái)的數(shù)據(jù),為實(shí)際生產(chǎn)中生產(chǎn)動(dòng)態(tài)的變化和事故發(fā)生的可能性進(jìn)行預(yù)先分析和測(cè)算。
(4)語(yǔ)義引擎 語(yǔ)義引擎需要被設(shè)計(jì)成能夠從“文檔”中智能提取信息,以MapReduce和Hadoop[2]為代表的分析技術(shù)在這方面取得了重大進(jìn)展,而優(yōu)化多值查詢的索引技術(shù)也可增加大數(shù)據(jù)的分析能力[3]。
(5)數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理 數(shù)據(jù)量大并不意味著信息量和數(shù)據(jù)價(jià)值就大,反之,很多時(shí)候會(huì)導(dǎo)致信息垃圾的泛濫,因此提高數(shù)據(jù)管理能力,改進(jìn)大數(shù)據(jù)的去冗降噪技術(shù)顯得尤為重要[4]。同時(shí),數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理是一些管理方面的最佳實(shí)踐,通過(guò)標(biāo)準(zhǔn)化的流程和工具對(duì)數(shù)據(jù)進(jìn)行處理可以保證一個(gè)預(yù)先定義好的高質(zhì)量的分析結(jié)果。
2.1 采集
大數(shù)據(jù)的采集是指利用多個(gè)數(shù)據(jù)庫(kù)來(lái)接收發(fā)自客戶端(Web、App或者傳感器形式等)的數(shù)據(jù),并且用戶可以通過(guò)這些數(shù)據(jù)庫(kù)來(lái)進(jìn)行簡(jiǎn)單的查詢和處理工作。
2.2 導(dǎo)入/預(yù)處理
雖然采集端本身會(huì)有很多數(shù)據(jù)庫(kù),但是如果要對(duì)這些海量數(shù)據(jù)進(jìn)行有效的分析,還是應(yīng)該將這些來(lái)自前端的數(shù)據(jù)導(dǎo)入到一個(gè)集中的大型分布式數(shù)據(jù)庫(kù),或者分布式存儲(chǔ)集群,并且可以在導(dǎo)入基礎(chǔ)上做一些簡(jiǎn)單的清洗和預(yù)處理工作。
2.3 統(tǒng)計(jì)/分析
統(tǒng)計(jì)與分析主要利用分布式數(shù)據(jù)庫(kù),或者分布式計(jì)算集群來(lái)對(duì)存儲(chǔ)于其內(nèi)的海量數(shù)據(jù)進(jìn)行普通的分析和分類匯總等,以滿足大多數(shù)常見(jiàn)的分析需求[5]。
2.4 挖掘
與前面統(tǒng)計(jì)和分析過(guò)程不同的是,數(shù)據(jù)挖掘一般沒(méi)有什么預(yù)先設(shè)定好的主題,主要是在現(xiàn)有數(shù)據(jù)上面進(jìn)行基于各種算法的計(jì)算,從而起到預(yù)測(cè)(Predict)的效果,實(shí)現(xiàn)一些高級(jí)別數(shù)據(jù)分析的需求。
3.1 油氣輸送管道主要存在的風(fēng)險(xiǎn)
(1)與時(shí)間相關(guān)的風(fēng)險(xiǎn) 與時(shí)間相關(guān)的風(fēng)險(xiǎn)主要為三種:內(nèi)力腐蝕、外力腐蝕、應(yīng)力腐蝕。我公司所產(chǎn)為高含硫、高壓、高溫的三高油氣,對(duì)管道的腐蝕尤為嚴(yán)重;其它事物對(duì)管道施加的非正常力對(duì)管道造成腐蝕;而由于輸送壓力波動(dòng)、流速變化、地層運(yùn)動(dòng)等對(duì)管道的腐蝕也是不可忽視的,這就要求要加強(qiáng)油氣管線的監(jiān)控,增加了實(shí)時(shí)數(shù)據(jù)的采集、傳輸、處理任務(wù)。
(2)與時(shí)間無(wú)關(guān)的風(fēng)險(xiǎn) 與時(shí)間無(wú)關(guān)的風(fēng)險(xiǎn)包括三類:第三方破壞(承包商作業(yè)等)、誤操作、自然環(huán)境因素。承包商作業(yè)、市政建設(shè)等對(duì)管道的破壞;管道工人、站場(chǎng)工人在日常生產(chǎn)、維護(hù)等操作時(shí)的失誤造成對(duì)管道的破壞;而南方的酸性土壤等外界因素對(duì)管道的腐蝕也是明顯的,這些都將增加管道輸送的風(fēng)險(xiǎn)。
(3)固有風(fēng)險(xiǎn) 固有風(fēng)險(xiǎn)是指制造缺陷、焊接制造缺陷、設(shè)備的因素(o型墊片、密封、填料)等。就是這些風(fēng)險(xiǎn)的存在才直接或間接導(dǎo)致管道泄漏、燃燒、爆炸等事故的發(fā)生,所以通過(guò)實(shí)時(shí)采集各種類型的數(shù)據(jù)并進(jìn)行相關(guān)的風(fēng)險(xiǎn)分析,得出減小風(fēng)險(xiǎn)的智能推薦和輔助決策從一定程度上就可以防止事故的發(fā)生。
3.2 智能推薦和輔助決策的內(nèi)容
(1)智能推薦 針對(duì)管道存在的風(fēng)險(xiǎn),得出的智能推薦主要包括五個(gè)方面:①運(yùn)用SCADA系統(tǒng)采集的腐蝕、流量等一系列信息分析進(jìn)行大數(shù)據(jù)分析,來(lái)確定管道腐蝕發(fā)展情況,向用戶及時(shí)推送管道腐蝕情況,并在腐蝕達(dá)到最大允許量時(shí)通知負(fù)責(zé)人及時(shí)維修與更換。②結(jié)合管道的振動(dòng)數(shù)據(jù),或者政府有關(guān)部門發(fā)出的有關(guān)第三方作業(yè)信息,及時(shí)告知工廠負(fù)責(zé)人有關(guān)第三方(承包商)作業(yè)的情況;通過(guò)定位施工作業(yè)位置與管道存在位置、作業(yè)人員相關(guān)資質(zhì)等來(lái)分析是否需要工廠派出相關(guān)人員去監(jiān)督或者警告第三方(承包商)作業(yè)。③連接網(wǎng)絡(luò)上發(fā)布的天氣狀況(暴雨、洪水、閃電、溫度、臺(tái)風(fēng)等),分析每一段管路上可能遭受的自然環(huán)境狀況,實(shí)時(shí)采集管道內(nèi)的各種數(shù)據(jù)并進(jìn)行數(shù)據(jù)相關(guān)分析,盡可能實(shí)時(shí)地預(yù)測(cè)可能發(fā)生的事故,警告工程師提前采取相應(yīng)措施。④記錄并分析操作人員的操作步驟,判斷操作人員是否應(yīng)該進(jìn)行安全培訓(xùn)以及確定安全培訓(xùn)的側(cè)重點(diǎn),實(shí)時(shí)分析并聯(lián)系操作人員的相關(guān)不安全行為、不良工作情緒,確定是否會(huì)導(dǎo)致人員誤操作引發(fā)事故。⑤關(guān)于消除固有風(fēng)險(xiǎn)的智能推薦,大數(shù)據(jù)分析技術(shù)可以做的是通過(guò)分析已有的第三方作業(yè)數(shù)據(jù),選擇合適、有資質(zhì)的承包商對(duì)管道進(jìn)行焊接。
(2)輔助決策 輔助決策主要包括:結(jié)合分析管道內(nèi)物質(zhì)危險(xiǎn)性、油氣泄漏量、泄漏處的周邊狀況(溫度、濕度、是否密閉等)、泄露處人員密集情況等方面的數(shù)據(jù),進(jìn)行事故的預(yù)測(cè)與后果分析,確定最佳的處理方式,進(jìn)而輔助負(fù)責(zé)人進(jìn)行應(yīng)急救援和人員疏散的決策。
在大數(shù)據(jù)的智能推薦和輔助決策的幫助下,可有效幫助生產(chǎn)經(jīng)營(yíng)單位實(shí)現(xiàn)風(fēng)險(xiǎn)的預(yù)測(cè)和規(guī)避,在事故發(fā)生前做到提前預(yù)知、提前預(yù)防從而避免事故的發(fā)生。而在事故發(fā)生中和事故發(fā)生后,可有效幫助決策者做出更合理、高效的事故緩解措施和應(yīng)急救援從而減輕事故的嚴(yán)重性和危害性。
要想實(shí)現(xiàn)大數(shù)據(jù)的智能推薦和輔助決策功能,首要克服大數(shù)據(jù)分析的局限性,其主要包括以下兩個(gè)方面:①對(duì)于智能推薦和輔助決策方面的結(jié)果沒(méi)有一個(gè)良好的標(biāo)準(zhǔn)進(jìn)行評(píng)定,或者其控制風(fēng)險(xiǎn)的功能也有待進(jìn)一步檢驗(yàn);②大數(shù)據(jù)技術(shù)存在嚴(yán)峻的信息安全問(wèn)題,尤其是對(duì)于石油天然氣行業(yè),屬于國(guó)家命脈,其控制數(shù)據(jù)與信息絕不能泄露,所以大數(shù)據(jù)在應(yīng)用過(guò)程中,必須要考慮其本身風(fēng)險(xiǎn)的問(wèn)題。
運(yùn)用大數(shù)據(jù)技術(shù)對(duì)管道風(fēng)險(xiǎn)進(jìn)行的實(shí)時(shí)分析雖然只是一個(gè)設(shè)想,實(shí)現(xiàn)大數(shù)據(jù)的智能推薦和輔助決策將大大降低我公司的安全事故,為生產(chǎn)保駕護(hù)航,促進(jìn)健康、安全、環(huán)境友好型企業(yè)的建設(shè)。
[1]李國(guó)杰,程學(xué)旗.大數(shù)據(jù)研究:未來(lái)科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國(guó)科學(xué)院院刊,2012.6,27(6):647-657.
[2]Borthakur D, Gray J, Sarma J S, et al. Apache Hadoop goes realtime at Facebook[C]//Prose of SIGMOD 2011. New York: ACM, 2011: 1071-1080.
[3]王珊,王會(huì)舉,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與發(fā)展[J].計(jì)算機(jī)學(xué)報(bào),2011,10,34(10):1741-1752.
[4]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.
[5]鄧仲華,李志芳.科學(xué)研究范式的演化——大數(shù)據(jù)時(shí)代的科學(xué)研究第四范式[J].情報(bào)資料工作,2013,4,19-23.