• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)技術(shù)在過程工業(yè)中的應(yīng)用研究進展

      2016-03-14 21:53:12蘇鑫吳迎亞裴華健藍興英高金森
      化工進展 2016年6期
      關(guān)鍵詞:數(shù)據(jù)分析大數(shù)據(jù)

      蘇鑫,吳迎亞,裴華健,藍興英,高金森

      (中國石油大學(xué)(北京)重質(zhì)油國家重點實驗室,北京 102249)

      ?

      大數(shù)據(jù)技術(shù)在過程工業(yè)中的應(yīng)用研究進展

      蘇鑫,吳迎亞,裴華健,藍興英,高金森

      (中國石油大學(xué)(北京)重質(zhì)油國家重點實驗室,北京 102249)

      摘要:近些年,大數(shù)據(jù)技術(shù)在金融、貿(mào)易和醫(yī)療健康等行業(yè)也得到了較好的應(yīng)用,但大數(shù)據(jù)技術(shù)在過程工業(yè)中的應(yīng)用還處于起步階段。本文分別從過程工業(yè)大數(shù)據(jù)的特點、分析方法以及應(yīng)用現(xiàn)狀3個方面進行介紹,簡述了過程工業(yè)數(shù)據(jù)除了具有一般大數(shù)據(jù)海量性、多樣性、高速性和易變性的4V特點外,還具有高維度、強非線性、樣本分布不均和低信噪比的特點?;谶^程工業(yè)數(shù)據(jù)的分析方法,按照功能劃分可以分為降維分析、聚類和分類分析、相關(guān)性分析和預(yù)測分析四大類。在此基礎(chǔ)上,綜述了近些年大數(shù)據(jù)技術(shù)在過程工業(yè)上的應(yīng)用,分別從過程工業(yè)優(yōu)化、過程監(jiān)測與故障診斷以及產(chǎn)品性能和產(chǎn)率預(yù)測3個方面介紹了其在過程工業(yè)中的應(yīng)用情況,并指出未來應(yīng)該將企業(yè)內(nèi)部的生產(chǎn)數(shù)據(jù)和原料與產(chǎn)品的市場數(shù)據(jù)等相結(jié)合進行分析和挖掘,這樣能夠更大程度地發(fā)揮大數(shù)據(jù)的價值。

      關(guān)鍵詞:大數(shù)據(jù);過程工業(yè);數(shù)據(jù)分析;過程系統(tǒng)

      第一作者:蘇鑫(1989—),男,碩士研究生。聯(lián)系人:高金森,博士,教授,研究方向為重質(zhì)油加工及計算化學(xué)工程。E-mail jsgao@cup.edu.cn。

      近年來,隨著計算機技術(shù)以及數(shù)據(jù)存儲手段的不斷發(fā)展,各行各業(yè)都積累了大量的數(shù)據(jù),如何利用這些大量的數(shù)據(jù)從中發(fā)現(xiàn)一些有價值的信息,已經(jīng)成為了目前的一個研究熱點。隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及云計算等技術(shù)的廣泛應(yīng)用,大數(shù)據(jù)(big data)時代已經(jīng)到來[1]。2001年,Gartner公司的一份研究報告首次出現(xiàn)“大數(shù)據(jù)”概念的提法,2008年《Nature》雜志第一次推出了《Big Data》??痆2]。2011年2月《Science》也推出了名為《Dealing with Data》的??痆3],圍繞科學(xué)研究中大數(shù)據(jù)的相關(guān)問題展開了一系列的討論。2013年被稱為“大數(shù)據(jù)元年”,此后,大數(shù)據(jù)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。同時,越來越多的政府、企業(yè)等機構(gòu)也開始意識到數(shù)據(jù)正在成為機構(gòu)最重要的資產(chǎn),數(shù)據(jù)分析能力正在成為它們的核心競爭力。大數(shù)據(jù)在物理學(xué)、生物學(xué)、環(huán)境生態(tài)學(xué)等學(xué)科以及軍事、金融、通訊等行業(yè)存在已有時日,近年來互聯(lián)網(wǎng)和信息行業(yè)應(yīng)用大數(shù)據(jù)取得了十分顯著的效果。大數(shù)據(jù)技術(shù)在我國也呈現(xiàn)了快速發(fā)展的趨勢,國內(nèi)金融業(yè)、互聯(lián)網(wǎng)、通訊、電子商務(wù)等行業(yè)應(yīng)用大數(shù)據(jù)技術(shù)都取得了良好的效果。近些年,O’DRISCOLL等[4]嘗試將云計算和Apache Hadoop等大數(shù)據(jù)技術(shù)應(yīng)用到大數(shù)據(jù)分析中;HERODOTOU 等[5]又在Hadoop的基礎(chǔ)上,提出了大數(shù)據(jù)分析的自動校正系統(tǒng)Starfish,該系統(tǒng)可以使用戶更容易達到自己需求。

      近兩年,隨著工業(yè)4.0和中國制造2025的提出,利用數(shù)據(jù)分析技術(shù)得到智能信息并創(chuàng)造和發(fā)現(xiàn)新的知識和價值成為了第四次工業(yè)革命的最終目標之一[6-7]。工業(yè)大數(shù)據(jù)是一個新的概念,泛指工業(yè)領(lǐng)域的大數(shù)據(jù),既包括企業(yè)內(nèi)部制造系統(tǒng)所產(chǎn)生的大量數(shù)據(jù),也包括企業(yè)外部的大數(shù)據(jù)。傳統(tǒng)意義上的大數(shù)據(jù)主要指商業(yè)和互聯(lián)網(wǎng)等行業(yè)的大數(shù)據(jù),這些數(shù)據(jù)多為離散相對獨立的數(shù)據(jù),因此采集這些數(shù)據(jù)的難度和工作量都很大,對所收集的數(shù)據(jù)進行簡單的關(guān)聯(lián)分析就可以獲取一些價值。恰恰相反,隨著測量技術(shù)和DCS等管理系統(tǒng)的廣泛普及,過程工業(yè)中的數(shù)據(jù)采集相對比較容易,但由于其各個參數(shù)之間還會存在著內(nèi)在的機理關(guān)系,因此其分析難度較大,而且工業(yè)生產(chǎn)過程對分析精度的要求也比較高[8-9]。針對海量數(shù)據(jù)的分析方法目前有很多種,按照功能可以大概分為降維分析、聚類與分類分析、相關(guān)性分析和預(yù)測分析四大類。每類分析方法中又包含眾多不同的算法,目前適合海量數(shù)據(jù)的分析方法尤其是針對工業(yè)大數(shù)據(jù)分析的方法仍處于初步發(fā)展階段,各個方法都有其特有的優(yōu)勢,但同時也存在一定的限制條件。

      商業(yè)和互聯(lián)網(wǎng)行業(yè)上的數(shù)據(jù)分析思路主要是從海量的數(shù)據(jù)中找到各變量之間的關(guān)系,根據(jù)得到的結(jié)果發(fā)掘人們沒有認識到的問題,這種思路對于分析商業(yè)和互聯(lián)網(wǎng)等方面的問題比較適用,并且已經(jīng)取得了較好的應(yīng)用。但對于過程工業(yè)大數(shù)據(jù)來說按照上述數(shù)據(jù)分析的思路,很可能會忽略數(shù)據(jù)與數(shù)據(jù)之間的機理關(guān)系。因此,過程工業(yè)大數(shù)據(jù)分析其實是計算機科學(xué)、統(tǒng)計學(xué)和工程學(xué)等多學(xué)科交叉的科學(xué),需要研究者具有全面而系統(tǒng)的知識[10-11]。

      1 大數(shù)據(jù)特點

      1.1 大數(shù)據(jù)的共同特點

      2011年,HOPKINS和EVELSON等[12]發(fā)布的名為“expand your digital horizon with big data”中提到了大數(shù)據(jù)的4個典型特點(4V),即海量性(volume)、多樣性(variety)、高速性(velocity)和易變性(variability)。

      (1)海量性 海量性是大數(shù)據(jù)的最重要的特點之一,也是大數(shù)據(jù)與以往存儲的數(shù)據(jù)最直觀的區(qū)別。隨著計算機存儲技術(shù)的發(fā)展,數(shù)據(jù)量正成指數(shù)倍增長,如2013年我國產(chǎn)生的數(shù)據(jù)總量已經(jīng)超過了0.8ZB(相當于8億TB),這個數(shù)值相當于2012年數(shù)據(jù)總量的2倍,相當于2009年全球的數(shù)據(jù)總量。有研究表明,預(yù)計到2020年,中國產(chǎn)生的數(shù)據(jù)總量將是2013年的10倍,超過8.5ZB。

      (2)多樣性 傳統(tǒng)的數(shù)據(jù)存儲和記錄方式?jīng)Q定了只能記錄生產(chǎn)過程中直接的數(shù)據(jù),但隨著材料科學(xué)、檢測技術(shù)、圖像處理和各類傳感技術(shù)的發(fā)展,重要的圖像、聲音等被記錄下來,這些非結(jié)構(gòu)化的數(shù)據(jù)也為以后的分析提供了較大的價值。

      (3)高速性 現(xiàn)代工業(yè)生產(chǎn)規(guī)模不斷擴大,工藝流程也逐漸復(fù)雜,各種測量和控制手段不斷更新,大型工業(yè)生產(chǎn)裝置中都有數(shù)以萬計的測量設(shè)備,它們每秒鐘都會記錄幾千甚至上萬MB的數(shù)據(jù)。如某企業(yè)一套生產(chǎn)裝置上就有500個測量點,每個測量點每5秒鐘就會記錄一次數(shù)據(jù),那么每分鐘就可以產(chǎn)生6000組的數(shù)據(jù)。

      (4)易變性 由于生產(chǎn)過程是多層次的結(jié)構(gòu),存在穩(wěn)態(tài)和動態(tài)兩種工況,設(shè)備出現(xiàn)故障時也會改變多個參數(shù)的數(shù)據(jù),這些因素都導(dǎo)致了大數(shù)據(jù)的易變性。

      1.2 過程工業(yè)大數(shù)據(jù)的特點

      隨著企業(yè)信息管理系統(tǒng)的不斷普及以及裝備物聯(lián)網(wǎng)和企業(yè)外部互聯(lián)網(wǎng)的不斷發(fā)展,工業(yè)也已經(jīng)進入了“大數(shù)據(jù)”時代,過程工業(yè)就是其中的一個典型的代表。目前,各個企業(yè)所管理和存儲的數(shù)據(jù)的規(guī)模、種類以及復(fù)雜程度都在不斷地增長[13-14]。根據(jù)麥克西全球研究院的統(tǒng)計,制造業(yè)的數(shù)據(jù)存儲量高于其他行業(yè)。但由于工業(yè)本身具有設(shè)備大型化,工藝連續(xù)程度高,各參數(shù)之間存在復(fù)雜的機理關(guān)系等特點,工業(yè)大數(shù)據(jù)除了具有以上的4V特性外,還具有以下其自身的特點[15]。

      (1)高維度 在工業(yè)生產(chǎn)過程中,常常伴隨著多種物理和化學(xué)變化,而且各參數(shù)之間高度耦合,它們共同構(gòu)成了一個復(fù)雜多變的系統(tǒng),對這些過程的描述是高維度的,這些因素也決定了工業(yè)大數(shù)據(jù)高維度的特點。

      (2)強非線性 過程工業(yè)中各類參數(shù)之間的關(guān)系都是非線性的,例如在熱力學(xué)中的壓力、溫度與熵值和焓值之間以及反應(yīng)溫度和反應(yīng)速度之間都是典型的非線性關(guān)系,這種強烈的非線性關(guān)系給數(shù)據(jù)的理解和知識的挖掘帶來了很大的挑戰(zhàn)。

      (3)樣本數(shù)據(jù)分布不均 在生產(chǎn)過程中各種設(shè)備和參數(shù)應(yīng)盡可能地運行在理想狀態(tài)下,但由于各種原因,各參數(shù)會發(fā)生一定的波動。例如化工生產(chǎn)裝置中在開工期間與正常運行時操作工況會存在一些差異;另外,由于原料的性質(zhì)不是固定不變的,所以操作條件也一直處于波動狀態(tài)。

      (4)低信噪比 雖然現(xiàn)如今測量和傳感技術(shù)已經(jīng)達到了較高的水平,但由于某些客觀原因,比如裝置測量儀表損壞,數(shù)據(jù)信號傳輸過程中失真等因素,所采集到的數(shù)據(jù)都會存在大量的噪聲。另外,測量環(huán)境也會給測量結(jié)果造成一定的影響,當測量壞境突變時也會產(chǎn)生大量的噪聲。過程工業(yè)大數(shù)據(jù)的低信噪比也給數(shù)據(jù)的分析帶來了一定的難度。

      總之,過程工業(yè)大數(shù)據(jù)除了具有各類大數(shù)據(jù)所共有的海量性、多樣性、高速性和易變性的4V特點外,還具有高維度、強非線性、樣本分布不均和低信噪比的特點。正是因為過程工業(yè)大數(shù)據(jù)這些獨有的特點,對于過程工業(yè)大數(shù)據(jù)的分析和挖掘與傳統(tǒng)的大數(shù)據(jù)分析方法也有一定的差異。

      2 大數(shù)據(jù)的分析方法

      目前,關(guān)于大數(shù)據(jù)的分析方法的研究還處于探索階段,存在多種分析方法,每種分析方法都具有其自身的特點和優(yōu)勢,但同時也存在一定的局限性,由于不同行業(yè)的工業(yè)數(shù)據(jù)特點和結(jié)構(gòu)存在著較大的差異,目前還沒有一種普適性的方法能夠適應(yīng)所有行業(yè)的大數(shù)據(jù)分析。按照數(shù)據(jù)分析的功能劃分,大數(shù)據(jù)分析方法可以大致分為降維分析、分類與聚類分析、相關(guān)性分析和預(yù)測分析。

      2.1 降維分析

      降維是將數(shù)據(jù)從高維度約減到低維度的過程,可以有效地克服過程工業(yè)大數(shù)據(jù)高維度的特點和所謂的“維數(shù)災(zāi)難”[16]。有研究學(xué)者認為,降維分析是聚類分析或分類分析的一種[17],但由于目前所需要處理的數(shù)據(jù)均為高維度的數(shù)據(jù),常常將其作為數(shù)據(jù)的前處理過程,所以本文將降維分析作為單獨的一種分析方法進行介紹。降維分析的算法可以分為兩大類:線性降維算法和非線性降維算法[18]。線性降維方法主要有主成分分析(PCA)[19-20]、投影尋蹤(PP)[21]、局部學(xué)習(xí)投影(LLP)[22]以及核特征映射法[23];非線性降維方法主要有多維尺度法(MDS)[24]、等距映射法(ISOMAP)[25]、局部線性嵌入法(LLE)[26]以及拉普拉斯特征映射法(LE)[27]等。

      2.2 聚類與分類分析

      首先,需要明確的是聚類分析和分類分析的定義、聯(lián)系與區(qū)別。所謂聚類分析就是指將數(shù)據(jù)區(qū)分為不同的自然群體,每個群體之間具有不同的特征,同時也可以獲得每個群體的特征描述[28]。它是數(shù)據(jù)挖掘算法中的一種非常重要的算法,是一種基于無監(jiān)督的學(xué)習(xí)方案,可以用來探索數(shù)據(jù)。同時,經(jīng)過聚類分析后的數(shù)據(jù)可以更進一步進行數(shù)據(jù)的預(yù)測和內(nèi)容檢索等,提高數(shù)據(jù)挖掘的效率和準確性[29]。聚類算法通??梢苑譃榛趧澐值木垲?、基于層次的聚類、基于密度的聚類、基于網(wǎng)格的聚類以及基于模型的聚類五大類[30]。

      分類分析是指根據(jù)數(shù)據(jù)集的特點構(gòu)造一個分類器,再根據(jù)這個分類器對需要分類的樣本賦予其類別[31]。與聚類分析最大的不同的就是分類分析在對數(shù)據(jù)進行歸類之前已經(jīng)規(guī)定了分類的規(guī)則,而聚類分析在歸類之前沒有任何規(guī)則,在歸類之后才得到每個類別的特點。目前分類算法也存在很多種,按照各算法的技術(shù)特點可以分為決策樹分類法、Bayes分類法、基于關(guān)聯(lián)規(guī)則的分類法和基于數(shù)據(jù)庫技術(shù)的分類法等。每類分類方法又存在多種算法,例如決策樹分類法中較早使用的是C4.5算法[32],后來為了適應(yīng)數(shù)據(jù)量的不斷擴大,又在其基礎(chǔ)上開發(fā)了SLIQ(supervised learning in quest)算法[33]和SPRINT(scalable parallelizable induction of decision trees)算法[34];Bayes分類法中應(yīng)用比較普遍的是NB(naive bayes)算法和TAN(tree augmented bayes network)算法[35];基于關(guān)聯(lián)規(guī)則的分類法中CBA (classification based on association)算法[36]應(yīng)用最為普遍;GAC-RDB(grouping and counting-relational database)算法[37]是基于數(shù)據(jù)庫技術(shù)分類法的典型代表。

      2.3 相關(guān)性分析

      相關(guān)性分析就是研究數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)程度。該分析方法一直是統(tǒng)計學(xué)中研究的熱點,已經(jīng)在金融、心理和氣象學(xué)中得到了廣泛的應(yīng)用。相關(guān)性主要用來表述兩個變量之間的關(guān)系,是兩變量之間密切程度的度量[38]。在分析兩個變量的相關(guān)性方面最傳統(tǒng)的方法就是使用Pearson相關(guān)系數(shù),但該方法只能表示兩個變量之間的線性相關(guān)程度,對于非線性的關(guān)系偏差較大,很明顯這種相關(guān)性分析方法無法對強非線性關(guān)系的過程工業(yè)數(shù)據(jù)進行處理分析。目前常使用的多變量相關(guān)性分析方法有Granger因果關(guān)系分析、典型相關(guān)分析、灰色關(guān)聯(lián)分析、Copula分析和互信息分析等,但是各種分析方法都存在一定的不足和缺陷,例如:Granger因果關(guān)系分析不能給出定量的描述;典型相關(guān)性分析不適用于分析時間序列的問題;Copula分析對數(shù)據(jù)分布的規(guī)則度要求很高;灰色關(guān)聯(lián)分析的理論基礎(chǔ)研究還有待進一步完善;互信息分析計算復(fù)雜度較高,但隨著計算手段和計算速度的不斷提高,目前互信息分析手段應(yīng)用十分廣泛[39-43]。

      2.4 預(yù)測分析

      基于數(shù)據(jù)的預(yù)測分析是一種從功能上定義的廣義概念,在工業(yè)生產(chǎn)中包括很大的范疇,例如過程工業(yè)中產(chǎn)品質(zhì)量和產(chǎn)率的預(yù)測、生產(chǎn)操作中的優(yōu)化、預(yù)警和裝置的故障診斷都可以歸屬于數(shù)據(jù)分析中的預(yù)測范疇。最常使用的預(yù)測分析方法就是應(yīng)用各種神經(jīng)網(wǎng)絡(luò)算法以及其與各種優(yōu)化算法的結(jié)合。目前,應(yīng)用相對成熟的神經(jīng)網(wǎng)絡(luò)有BP神經(jīng)網(wǎng)絡(luò)[44]、GRNN神經(jīng)網(wǎng)絡(luò)[45]、RBF網(wǎng)絡(luò)[46]等。神經(jīng)網(wǎng)絡(luò)具有以下優(yōu)點:①理論上能夠逼近任意非線性映射;②善于處理多輸入輸出問題;③能夠進行并行分布式處理;④自學(xué)習(xí)與自適應(yīng)性強;⑤可同時處理多種定性和定量的數(shù)據(jù)[47]。

      對于大數(shù)據(jù)分析方法的研究還不是十分成熟,現(xiàn)階段大部分的數(shù)據(jù)分析方法還是源于統(tǒng)計學(xué)中的基本概念和原理,其主要功能包括:對數(shù)據(jù)進行降維處理、聚類和分類;相關(guān)性分析以及用于預(yù)測未來的事件;實現(xiàn)各種功能的算法眾多并且各有特點。目前,在過程工業(yè)中得到應(yīng)用的實例都是將大數(shù)據(jù)分析方法中的多種功能和多種算法相結(jié)合而進行綜合應(yīng)用的。

      3 大數(shù)據(jù)技術(shù)在過程工業(yè)中的應(yīng)用現(xiàn)狀

      目前,大數(shù)據(jù)分析技術(shù)在過程工業(yè)中的應(yīng)用還處于起步階段,所采用的方法與核心分析手段還是圍繞數(shù)據(jù)挖掘技術(shù)的基本算法展開的,只是將該基本算法借助先進的計算機技術(shù)應(yīng)用到更大量的數(shù)據(jù)范圍內(nèi),從而發(fā)現(xiàn)更有價值的知識,獲得更有意義的信息。由于工業(yè)上已經(jīng)普及了各類控制管理軟件,因此與商業(yè)和互聯(lián)網(wǎng)行業(yè)不同的是工業(yè)數(shù)據(jù)的采集已經(jīng)沒有了難度,而對過程工業(yè)數(shù)據(jù)的分析和挖掘的重點和難點就是對海量數(shù)據(jù)的降噪處理以及應(yīng)用各種智能算法對其進行分析和挖掘。

      3.1 在過程工業(yè)優(yōu)化方面的應(yīng)用

      當今世界各類工業(yè)過程都面臨著巨大的挑戰(zhàn),尤其是過程工業(yè),隨著社會生產(chǎn)力的發(fā)展促使了企業(yè)不但要提高裝置的生產(chǎn)效率,提高產(chǎn)品的質(zhì)量,而且還需要將其對環(huán)境的危害降到最低。面對如此嚴峻的生產(chǎn)形勢,工業(yè)過程優(yōu)化則體現(xiàn)出極大的優(yōu)勢,因為過程優(yōu)化可以有效地跟蹤整個裝置或企業(yè)生產(chǎn)經(jīng)濟利益最優(yōu)的途徑,還可以有效地克服工業(yè)過程的干擾和設(shè)備性能變化所產(chǎn)生的影響,可以實現(xiàn)經(jīng)濟利益和生產(chǎn)目標的雙重最大化[48-49]。工業(yè)過程優(yōu)化分為動態(tài)優(yōu)化和穩(wěn)態(tài)優(yōu)化兩類情況。而進行過程優(yōu)化的方法也有很多,其中基于數(shù)據(jù)分析技術(shù)的過程工業(yè)優(yōu)化成為了一個新的研究思路[50]。

      鋼鐵工業(yè)是國民經(jīng)濟的支柱產(chǎn)業(yè)之一,是我國推動工業(yè)化進程的重要基礎(chǔ)。21世紀以來,我國鋼鐵生產(chǎn)已經(jīng)接近或基本達到了國際先進水平[51]。在煉鋼生產(chǎn)過程中溫度是其中重要的工藝參數(shù),溫度控制被認為是煉鋼系統(tǒng)運行平穩(wěn)性的“晴雨表”[52]。但在現(xiàn)場生產(chǎn)過程中采集的溫度數(shù)據(jù)量巨大、噪聲多,給基于這些數(shù)據(jù)進行優(yōu)化生產(chǎn)操作帶來一定的難度。宋輝[53]針對以上問題,提出了自組織映射神經(jīng)網(wǎng)絡(luò)和模糊C均值聚類分析算法對工業(yè)數(shù)據(jù)進行處理,分別將兩種算法應(yīng)用到某鋼廠煉鋼過程中的爐內(nèi)目標溫度、鋼液的溫度、目標出鋼溫度等重要溫度監(jiān)控點的數(shù)據(jù)中,結(jié)果顯示兩種算法均能夠有效地發(fā)現(xiàn)數(shù)據(jù)中的噪聲或異常數(shù)據(jù),同時將兩種算法的聚類結(jié)果進行對比,發(fā)現(xiàn)模糊C均值聚類算法比自組織映射神經(jīng)網(wǎng)絡(luò)算法的精度略差,但處理速度快。該研究為構(gòu)造數(shù)據(jù)模型,再利用所構(gòu)造的模型對現(xiàn)在甚至未來的同種數(shù)據(jù)研究,進而改進生產(chǎn)工藝,提高生產(chǎn)效率,奠定了堅實的基礎(chǔ)。

      石化行業(yè)是我國國民經(jīng)濟的另一個支柱產(chǎn)業(yè)之一,新世紀對石化行業(yè)的發(fā)展提出了新的要求,國內(nèi)的煉油工業(yè)面臨著嚴峻的挑戰(zhàn)[54-55]。常減壓蒸餾、催化裂化、焦化、催化重整、催化加氫等工藝是煉油過程的主要生產(chǎn)工藝[56]。常減壓蒸餾是煉油廠的龍頭裝置,是石油加工的第一道工序,而在進入該工序之前需要采用電脫鹽的方法對原油進行預(yù)處理[57-58],但目前各生產(chǎn)企業(yè)電脫鹽效果普遍偏低。因此,郭超[59]創(chuàng)造性地提出了運用決策樹的方法來提高煉油生產(chǎn)過程中原油電脫鹽效率的研究方案,基于原油電脫鹽的數(shù)據(jù)采用C4.5決策樹算法建立了決策樹模型,根據(jù)該模型對數(shù)據(jù)進行聚類并提取分類規(guī)則,進而找到影響工業(yè)上原油電脫鹽效果的關(guān)鍵性影響因素,該結(jié)果對改進電脫鹽裝置的操作提供了有效可行的指導(dǎo)方案。

      常減壓蒸餾屬于原油的一次加工過程,而隨著石油資源的不斷枯竭,則需要通過原油的二次加工來提高原油的利用率和產(chǎn)品的質(zhì)量。催化裂化就是其中一個重要的生產(chǎn)工藝[60]。隨著原油重質(zhì)化和劣質(zhì)化程度的不斷加深,為提高催化裂化產(chǎn)品的質(zhì)量,我國各煉油企業(yè)的催化裂化裝置多采用MIP工藝[61-62]。該工藝是將傳統(tǒng)的催化裂化提升管反應(yīng)器分成了兩個反應(yīng)區(qū),在第一反應(yīng)區(qū)和第二反應(yīng)區(qū)之間常加入急冷介質(zhì)來降低第二反應(yīng)區(qū)的溫度,因此在整個提升管上溫度變化較大,溫度監(jiān)控點較多,操作難度大[63-64]。藍興英教授團隊將互信息的概念應(yīng)用到某煉油企業(yè)提升管反應(yīng)器的溫度監(jiān)測點分析中,研究了提升管上催化劑溫度、原料油溫度、第一反應(yīng)區(qū)中部溫度、第一反應(yīng)區(qū)出口溫度、第二反應(yīng)區(qū)入口溫度以及第二反應(yīng)區(qū)出口溫度6個溫度點40天的生產(chǎn)數(shù)據(jù),得到兩兩溫度點之間的互信息熵并分析其數(shù)值,發(fā)現(xiàn)提升管反應(yīng)器的熱量主要來源于催化劑所攜帶的熱量,在提升管反應(yīng)器的操作過程中需要重點關(guān)注的溫度點是第一反應(yīng)區(qū)中部溫度和第二反應(yīng)區(qū)的入口溫度,極大地降低了提升管反應(yīng)器的操作難度,為工業(yè)生產(chǎn)提供了重要的指導(dǎo)意見。

      3.2 在過程監(jiān)測和故障診斷方面的應(yīng)用

      過程監(jiān)測和故障診斷源于20世紀60年代美國的航天和軍工方面[65]。當代過程工業(yè)生產(chǎn)不斷向大型化、連續(xù)化、高速化、智能化和精細化的方向發(fā)展,其工業(yè)過程和設(shè)備日益復(fù)雜,因此,過程監(jiān)測和故障診斷已經(jīng)成為了工業(yè)發(fā)展的必然趨勢。過程監(jiān)測和故障診斷一般分為信號采集、特征提取、狀態(tài)識別和診斷決策4個主要步驟,這4個步驟是一個循環(huán)的過程,對于復(fù)雜的故障通常需要多個循環(huán)過程才能提高診斷的準確度,進而解決問題[66]。現(xiàn)今故障發(fā)生的原因和機理復(fù)雜程度的不斷加深,傳統(tǒng)的方法已經(jīng)很難解決這些新的問題[67-68]。隨著數(shù)據(jù)庫的發(fā)展以及數(shù)據(jù)挖掘技術(shù)在商業(yè)、銀行等行業(yè)的成功應(yīng)用,該技術(shù)也開始向其他行業(yè)滲透,對大數(shù)據(jù)分析技術(shù)的降維處理、分類與聚類分析,相關(guān)性分析和預(yù)測分析方法充分體現(xiàn)了該技術(shù)在處理海量數(shù)據(jù)方面的優(yōu)勢。因此,將該技術(shù)與過程監(jiān)測和故障診斷相結(jié)合,有利于突破傳統(tǒng)方法在過程監(jiān)測和故障診斷方面的瓶頸。

      鋼鐵產(chǎn)品是人類社會最主要的結(jié)構(gòu)材料,高爐煉鐵工藝是一個典型的復(fù)雜工業(yè)系統(tǒng)[69]。控制好高爐煉鐵工藝過程對裝置的運行效率十分重要,但隨著工藝的逐漸復(fù)雜,控制難度也隨著增加,經(jīng)過長期的發(fā)展歷程,專家系統(tǒng)在高爐煉鐵過程控制中普遍應(yīng)用,并表現(xiàn)中極大的價值[70-74]。專家系統(tǒng)是工程師從領(lǐng)域?qū)<夷抢铽@取經(jīng)驗知識,通過歸納和整理再結(jié)合一定的算法開發(fā)的應(yīng)用系統(tǒng),但高爐煉鐵過程中每套高爐都具有其自身的特點,一個高爐特定的專家系統(tǒng)是不能直接將其應(yīng)用到其他高爐中的。因此,任盛怡[75]將數(shù)據(jù)挖掘的概念和方法引入到了高爐的專家系統(tǒng)中,在一定程度上解決了專家系統(tǒng)獲取知識時按照人為經(jīng)驗的技術(shù)瓶頸。她利用基于卡爾曼濾波的BP神經(jīng)網(wǎng)絡(luò)對高爐行程向涼、向熱進行分類來輔助專家系統(tǒng),識別的準確率得到很大的提高;再結(jié)合K-Means算法對高爐的狀態(tài)參數(shù)進行聚類分析,可以確定每個參數(shù)運行的理想?yún)?shù)值,在此基礎(chǔ)上確定其最優(yōu)閾值,從而可以有效準確地判斷高爐的運行狀態(tài)。

      目前,各類化工原料和合成材料大部分均來自石油化工工業(yè),其中乙烯生產(chǎn)裝置是石油石化工業(yè)的龍頭裝置,裂解爐是乙烯生產(chǎn)裝置的核心[76]。但隨著社會需求的不斷增加,乙烯裂解爐的單爐處理能力也隨之增加,設(shè)備大型化程度和復(fù)雜程度大幅增加,操作難度逐漸復(fù)雜,設(shè)備故障頻發(fā),一直沒有找到有效的故障診斷和分析方法。張曉丹[77]提出了將大數(shù)據(jù)分析方法應(yīng)用到乙烯裂解爐故障診斷中的新思路。她將免疫克隆算法和LVQ神經(jīng)網(wǎng)絡(luò)相結(jié)合建立的故障診斷模型具有很好的分類性能,結(jié)果表明使用經(jīng)免疫克隆算法優(yōu)化的LVQ神經(jīng)網(wǎng)絡(luò)診斷模型分類速度和準確度要遠高于未經(jīng)優(yōu)化的診斷模型,該模型可以準確地診斷乙烯裂解爐運行故障,提高了裝置運行的安全性和可靠性,同時也為乙烯收率和后續(xù)工段的操作穩(wěn)定性提供有效的保障。

      聚丙烯是一種性能優(yōu)良的合成樹脂,占世界合成樹脂總產(chǎn)量的18%左右,而我國則可以達到30%,廣泛應(yīng)用在電子、汽車、建筑材料、產(chǎn)品包裝等各個領(lǐng)域[78-79]。在聚丙烯生產(chǎn)過程中通常使用多尺度主元分析的方法進行丙烯聚合過程的監(jiān)測和設(shè)備故障診斷,但該方法還不是很成熟經(jīng)常出現(xiàn)錯報和漏報。夏陸岳等[80]使用小波變換閾值對生產(chǎn)數(shù)據(jù)進行去噪處理,再結(jié)合多尺度主元分析方法得到了改進的多尺度主元分析方法,并將其應(yīng)用到聚丙烯生產(chǎn)過程監(jiān)測和故障診斷過程中。應(yīng)用結(jié)果表明,使用改進的多尺度主元分析故障診斷模型能夠極大地降低傳統(tǒng)診斷方法的誤報率和漏報率,可以達到工業(yè)生產(chǎn)的要求,減少因設(shè)備突發(fā)故障造成的經(jīng)濟損失。

      3.3 在產(chǎn)品預(yù)測方面的應(yīng)用

      過程工業(yè)中產(chǎn)品的產(chǎn)率和質(zhì)量由裝置的操作過程所決定,但產(chǎn)品產(chǎn)率和產(chǎn)品質(zhì)量數(shù)據(jù)的測量具有嚴重的時間滯后性,不能及時地將該結(jié)果反饋到生產(chǎn)操作過程中,因此能夠快速準確及時地預(yù)測產(chǎn)品的產(chǎn)率和產(chǎn)品的質(zhì)量對提高裝置的運行效率具有重要意義。注塑成型是一種重要的塑料加工方法,可以在短時間內(nèi)生產(chǎn)出結(jié)構(gòu)復(fù)雜、尺寸精確的產(chǎn)品,其產(chǎn)品廣泛應(yīng)用于電子、醫(yī)療、建材等生活中的方方面面[81]。但在生產(chǎn)過程中一般都是每批生產(chǎn)結(jié)束后通過抽樣檢測的方法對產(chǎn)品的質(zhì)量進行檢測,存在嚴重的時間滯后性。趙斐等[82]針對這個問題,提出了利用拉普拉斯特征映射的方法對注塑過程的高維數(shù)據(jù)進行降維處理,再使用Mean Shift聚類方法對操作工況進行聚類分析,同時得到產(chǎn)品的分類規(guī)則,最后應(yīng)用基于粒子群算法參數(shù)尋優(yōu)的偏最小二乘支持向量機的方法建立了注塑過程的產(chǎn)品質(zhì)量軟測量模型。實驗結(jié)果顯示,該模型不但大幅提高了傳統(tǒng)的偏最小二乘支持向量機的方法預(yù)測產(chǎn)品質(zhì)量的精度和預(yù)測模型的泛化性能,同時還為企業(yè)生產(chǎn)提供了一種多工況下產(chǎn)品質(zhì)量在線預(yù)測方法。

      催化裂化是重質(zhì)油輕質(zhì)化的重要手段,通過分子篩催化劑的作用將重質(zhì)餾分油和渣油在適宜的溫度和壓力的作用下轉(zhuǎn)化為干氣、液化氣、汽油和柴油,同時副產(chǎn)焦炭。焦炭作為催化裂化的主要副產(chǎn)物,不僅影響催化裂化裝置的輕質(zhì)油收率同時還直接影響裝置的熱平衡,而目前大部分企業(yè)計算催化裂化焦炭產(chǎn)率的方法還是利用煙氣的組成進行粗略的估算,而且結(jié)果嚴重滯后[83]。為提高催化裂化裝置焦炭產(chǎn)率的預(yù)測準確程度并實現(xiàn)在線預(yù)測,蘇鑫等[47]通過分析催化裂化裝置反應(yīng)-再生系統(tǒng)篩選出了影響催化裂化焦炭產(chǎn)率的28個主要參數(shù),并將遺傳算法和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立了催化裂化裝置焦炭產(chǎn)率預(yù)測模型,并將該模型應(yīng)用到某煉廠的生產(chǎn)數(shù)據(jù)中,其結(jié)果表明該預(yù)測模型能夠準確地預(yù)測催化裂化裝置的焦炭產(chǎn)率,為優(yōu)化催化裂化裝置操作,提高催化裂化輕質(zhì)油收率提供了有效的保障。

      辛烷值是汽油的一個重要的評價參數(shù),它代表了汽油的抗暴性能。而傳統(tǒng)測定汽油辛烷值方法費時,測試設(shè)備龐大,操作難度大。周小偉等[84]針對該問題,將集總思想與數(shù)據(jù)分析技術(shù)相結(jié)合,他把汽油的辛烷值看成是汽油鏈烷烴、環(huán)烷烴、芳烴和烯烴的集總,在此基礎(chǔ)上使用BP神經(jīng)網(wǎng)絡(luò)建立了清潔汽油的研究法辛烷值預(yù)測模型,經(jīng)過實例計算驗證和對比分析發(fā)現(xiàn)該模型可以很好地反映汽油研究法辛烷值和各集總組分之間的復(fù)雜的非線性關(guān)系,可以十分準確地預(yù)測汽油的研究法辛烷值,為測定汽油的辛烷值提供了一種新的思路。

      大數(shù)據(jù)技術(shù)已經(jīng)在過程工業(yè)中得到了初步應(yīng)用,為解決過程工業(yè)中存在的問題提供了一種新的思路。目前該技術(shù)已在過程操作優(yōu)化,過程監(jiān)測與故障診斷以及產(chǎn)品質(zhì)量和產(chǎn)率的預(yù)測等方面得到了一定的應(yīng)用并取得了較好的效果。相信隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,未來該技術(shù)的應(yīng)用領(lǐng)域?qū)絹碓綇V泛,應(yīng)用效果將會越來越明顯。

      4 結(jié) 語

      綜上所述,大數(shù)據(jù)技術(shù)在分析過程工業(yè)中已經(jīng)有了初步應(yīng)用,同時取得了較好的效果。然而,這些大數(shù)據(jù)技術(shù)基本上還源于原有數(shù)據(jù)挖掘技術(shù)的原理和方法,沒有充分發(fā)揮出大數(shù)據(jù)的特點和潛在的價值。也就是說,目前已經(jīng)應(yīng)用的大數(shù)據(jù)技術(shù),其本質(zhì)還是數(shù)據(jù)挖掘技術(shù),雖然所處理的數(shù)據(jù)維度和數(shù)據(jù)量有所增加,但還沒有充分利用現(xiàn)有的數(shù)據(jù)量,在一定程度上不利于工業(yè)技術(shù)的發(fā)展和進步。

      此外,已有大數(shù)據(jù)技術(shù)的應(yīng)用基礎(chǔ)只涵蓋了一臺設(shè)備、一套裝置最多也只是一個車間的數(shù)據(jù)范圍,還沒有有效地將整個企業(yè)內(nèi)部生產(chǎn)制造系統(tǒng)的全部數(shù)據(jù)和企業(yè)外部的數(shù)據(jù)相結(jié)合。因此,如果能夠?qū)⒃虾彤a(chǎn)品的市場價格以及供需情況等數(shù)據(jù)與企業(yè)內(nèi)部的生產(chǎn)數(shù)據(jù)相結(jié)合,根據(jù)市場需求調(diào)整企業(yè)的生產(chǎn)方案,使企業(yè)生產(chǎn)能夠達到利潤最大化,這樣就可以更加充分地發(fā)揮大數(shù)據(jù)的價值。

      參 考 文 獻

      [1] 韓晶.大數(shù)據(jù)服務(wù)若干關(guān)鍵技術(shù)研究[D].北京:北京郵電大學(xué),2013.

      [2] CRASSO M,ZUNINO A,CAMPO M.Easy web service discovery:a query-by-example approach[J].Science of Computer Programming,2008,71(2):144-164.

      [3] CHIRITA P A,NEJDL W.13th International Conference, SPIRE 2006, Glasgow, UK, October 11-13, 2006 [C].Berlin:Springer, 2006:86-97.

      [4] O’DRISCOLL J,DAUGELAITE,SLEATOR R D.‘Big data’,Hadoop and cloud computing in genomics[J].Journal of Biomedical Informatics,2013,46(5):774-781.

      [5] HERODOTOU H,LIM H,LUO G,et al.5th Biennial Conference on Innovative Data Systems Research (CIDR), January 9-12, 2011[C].California:ACM Press,2011.

      [6] 李杰,劉宗長.中國制造2025的核心競爭力——挖掘使用數(shù)據(jù)[J].博鰲觀察,2015(4):52-55.

      [7] 彭訓(xùn)文.工業(yè)4.0:從自動生產(chǎn)到智能制造[J].大飛機,2014(7):40-42.

      [8] 王寧玲,付鵬,陳德剛,等.大數(shù)據(jù)分析方法在廠級負荷分配中的應(yīng)用[J].中國電機工程學(xué)報,2015,35(1):68-73.

      [9] 孔憲光,章雄,馬洪波,等.面向復(fù)雜工業(yè)大數(shù)據(jù)的實時特征提取方法研究[J].西安電子科技大學(xué)學(xué)報,2016,43(5):78-83.

      [10] HAND D J.Data mining:statistics and more?[J].The American Statistician,1998,52(2):112-118.

      [11] HAND D J.Statistics and data mining:intersecting disciplines[J].ACM SIGKDD Explorations Newsletter,1999,1(1):16-19.

      [12] HOPKINS B,EVELSON B,LEAVER S,et al.Expand your digital horizon with big data[R].Forrester,2011.

      [13] 王建民.探索走出符合國情的工業(yè)大數(shù)據(jù)自主之路——工業(yè)大數(shù)據(jù)的范疇、關(guān)鍵問題與實踐[J].中國設(shè)備工程,2015(9):36-37.

      [14] 高嬰勱.工業(yè)大數(shù)據(jù)價值挖掘路徑[J].中國工業(yè)評論,2015(s1):21-27.

      [15] 劉繼偉.基于大數(shù)據(jù)的多尺度狀態(tài)監(jiān)測方法及應(yīng)用[D].北京:華北電力大學(xué),2013.

      [16] DERMAN C.Adaptive control processes,a guided tour[J].Management Science,1961,7(4):450.

      [17] 畢達天,邱長波,張晗.數(shù)據(jù)降維技術(shù)研究現(xiàn)狀及其進展[J].情報理論與實踐,2013,36(2):125-128.

      [18] 譚璐.高維數(shù)據(jù)的降維理論及應(yīng)用[D].長沙:國防科學(xué)技術(shù)大學(xué),2005.

      [19] JACKSON,E J.A user’s guide to principal components[M].New York:Wiley-Interscience [Imprint];John Wiley & Sons,Incorporated,2005.

      [20] 李榮雨.基于PCA的統(tǒng)計過程監(jiān)控研究[D].杭州:浙江大學(xué),2007.

      [21] 成平,李國英.投影尋蹤——一類新興的統(tǒng)計方法[J].應(yīng)用概率統(tǒng)計,1986,2(3):267-276.

      [22] 曾群芳.基于拓撲結(jié)構(gòu)保持的線性降維方法研究及其應(yīng)用[D].廣州:華南理工大學(xué),2012.

      [23] BRAND M.18th International Joint Conference on Artificial Intelligence, 2003[C].San Francisco:Morgan Kaufmann Publishers,2003:547-552.

      [24] GRIFFITHS T L,KALISH M L.A multidimensional scaling approach to mental multiplication[J].Memory & Cognition,2002,30(1):97-106.

      [25] ZHA H Y,ZHANG Z Y.Twentieth International Conference on Machine Learning. 2003[C].Menlo Park, California:AAAI Press,2003.

      [26] SAUL L K,ROWEIS S T.Think globally,fit locally:unsupervised learning of nonlinear manifolds[J].Journal of Machine Learning Research,2003,4(2):119-155.

      [27] GRIGOR’YAN A.Estimates of heat kernels on Riemannian manifolds[M]// DAVIES E B,SAFAROW Y. Spectral theory and geometry. Cambridge:Cambridge Universty Press,1999:140–225.

      [28] 許麗利.聚類分析的算法及應(yīng)用[D].長春:吉林大學(xué),2010.

      [29] 戴濤.聚類分析算法研究[D].北京:清華大學(xué),2005.

      [30] 郭軍華.數(shù)據(jù)挖掘中聚類分析的研究[D].武漢:武漢理工大學(xué),2003.

      [31] 劉紅巖,陳劍,陳國青.數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J].清華大學(xué)學(xué)報(自然科學(xué)版),2002,42(6):727-730.

      [32] QUINLAN J R.C4.5:Programs for machine learning[M].San Mateo:Califomia Morgan Kaufmann,1993.

      [33] 欒麗華,吉根林.決策樹分類技術(shù)研究[J]. 計算機工程,2004,30(9):94-96,105.

      [34] RISSANEN J,AGRAWAL R,MEHTA M.International Conference on Very Large Data Bases[C].San Francisco:Morgan Kaufmann Publishers,1996.

      [35] FRIEDMAN N,GEIGER D,GOLDSZMIDT M.Bayesian network classifiers[J].Machine Learning,1997,29(1):131-163.

      [36] LIU B,HSU W,MA Y.The Fourth International Conference on Knowledge Discovery and Data Mining [C].Menlo Park, California:AAAI Press,1998.

      [37] 李偉衛(wèi),李梅,張陽,等.基于分布式數(shù)據(jù)倉庫的分類分析研究[J].計算機應(yīng)用研究,2013,30(10):2936-2939,2943.

      [38] 劉曉欣.互信息多元時間序列相關(guān)分析與變量選擇[D].大連:大連理工大學(xué),2013.

      [39] 何寬,陳森發(fā).基于一類因果關(guān)系圖的綜合評價方法及應(yīng)用[J].控制與決策,2010,25(10):1513-1518.

      [40] YAMAMOTO H,YAMAJI H,F(xiàn)UKUSAKI E,et al.Canonical correlation analysis for multivariate regression and its application to metabolic fingerprinting[J].Biochemical Engineering Journal,2008,40(2):199-204.

      [41] SUNGUR Engin A.An introduction to copulas[J].Journal of the American Statistical Association,2000,95(449):334-335.

      [42] TSENG F M,YU H C,TZENG G H.Applied hybrid grey model to forecast seasonal time series[J].Technological Forecasting and Social Change,2001,67(2):291-302.

      [43] KWAK N,CHOI C H.Input feature selection by mutual information based on parzen window[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(12):1667-1671.

      [44] 丁云,于靜江,周春暉.原油蒸餾塔的質(zhì)量估計和優(yōu)化管理[J].石油煉制與化工,1994,25(5):23-28.

      [45] 郭斌,孟令啟,杜勇,等.基于GRNN神經(jīng)網(wǎng)絡(luò)的中厚板軋機厚度預(yù)測[J].中南大學(xué)學(xué)報(自然科學(xué)版),2011,42(4):960-965.

      [46] 王文新,潘立登,李榮,等.常減壓蒸餾裝置雙模型結(jié)構(gòu)RBF神經(jīng)網(wǎng)絡(luò)建模與應(yīng)用[J].北京化工大學(xué)學(xué)報,2004,31(5):23-28.

      [47] 蘇鑫,裴華健,吳迎亞,等.經(jīng)遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測催化裂化裝置焦炭產(chǎn)率應(yīng)用[J].化工進展,2016,35(2):389-396.

      [48] 張健,陳丙珍,胡山鷹,等.復(fù)雜流程工業(yè)系統(tǒng)的優(yōu)化操作[J].計算機與應(yīng)用化學(xué),2000,17(6):481-488.

      [49] 柴天佑,丁進良,王宏,等.復(fù)雜工業(yè)過程運行的混合智能優(yōu)化控制方法[J].自動化學(xué)報,2008,34(5):505-515.

      [50] 牟盛靜.石化工業(yè)過程建模與優(yōu)化若干問題研究[D].杭州:浙江大學(xué),2004.

      [51] 殷瑞鈺.新世紀煉鋼科技進步回顧與“十二五”展望[J].煉鋼,2012,28(5):1-7.

      [52] 薛見新.煉鋼連鑄過程溫度流優(yōu)化的設(shè)計與分析[D].沈陽:東北大學(xué),2010.

      [53] 宋輝.聚類分析系統(tǒng)的設(shè)計與實現(xiàn)及在工業(yè)中的應(yīng)用[D].天津:天津科技大學(xué),2004.

      [54] 王基銘.21世紀我國煉油工業(yè)面臨的挑戰(zhàn)和對策[J].石油煉制與化工,1999,30(5):3-6.

      [55] 侯芙生.創(chuàng)新煉油技術(shù)推動21世紀我國煉油工業(yè)的發(fā)展[J].石油煉制與化工,2002,33(1):1-9.

      [56] 徐春明,楊朝合.石油煉制工程[M].4版.北京:石油工業(yè)出版社,2009.

      [57] 殷衛(wèi)兵,羅雄麟,史偉.原油常減壓蒸餾塔的流程模擬[J].化工自動化及儀表,2010,37(5):88-93.

      [58] 梁志勇,孫甲,劉政,等.原油電脫鹽脫水技術(shù)的研究現(xiàn)狀及進展[J].石油和化工設(shè)備,2012,15(8):26-29.

      [59] 郭超.決策樹方法在提高電脫鹽效果中的應(yīng)用[J].計算機工程與設(shè)計,2010,31(10):2372-2375.

      [60] 侯祥麟.中國煉油技術(shù)[M].2版.北京:中國石化出版社,2001.

      [61] 許友好.我國催化裂化工藝技術(shù)進展[J].中國科學(xué)(化學(xué)),2014,44(1):13-24.

      [62] 閆平祥,劉植昌,高金森,等.重油催化裂化工藝的新進展[J].當代化工,2004,33(3):136-140.

      [63] 許友好,張久順,龍軍.生產(chǎn)清潔汽油組分的催化裂化新工藝MIP[J].石油煉制與化工,2001,32(8):1-5.

      [64] 許友好,張久順,馬建國,等.生產(chǎn)清潔汽油組分并增產(chǎn)丙烯的催化裂化工藝[J].石油煉制與化工,2004(9);1-4.

      [65] 伍星,陳進,李如強,等.基于數(shù)據(jù)挖掘的設(shè)備狀態(tài)監(jiān)測和故障診斷[J].振動與沖擊,2004,23(4):72-76.

      [66] FAYYAD U,STOLORZ P.Data mining and KDD:promise and challenges[J].Future Generation Computer Systems,1997,13(2):99-115.

      [67] 周德澤.計算機智能監(jiān)測控制系統(tǒng)的設(shè)計及應(yīng)用[M].北京:清華大學(xué)出版社,2002.

      [68] 郭明.基于數(shù)據(jù)驅(qū)動的流程工業(yè)性能監(jiān)控與故障診斷研究[D].杭州:浙江大學(xué),2004.

      [69] 張殿偉,郭培民,趙沛.現(xiàn)代煉鐵技術(shù)進展[J].鋼鐵釩鈦,2006,27(2):26-32.

      [70] 劉祥官,曾九孫,郝志忠,等.多模型集成的高爐煉鐵智能控制專家系統(tǒng)[J].浙江大學(xué)學(xué)報(工學(xué)版),2007,41(10):1637-1642.

      [71] LIAO S H.Expert system methodologies and applications—a decade review from 1995 to 2004[J].Expert Systems with Applications,2005,28(1):93-103.

      [72] 周傳典.高爐煉鐵生產(chǎn)技術(shù)手冊[M].北京:冶金工業(yè)出版社,2002.

      [73] 劉祥官,劉芳.高爐過程優(yōu)化與智能控制模型[J].高校應(yīng)用數(shù)學(xué)學(xué)報A輯(中文版),2001,16(4):462-470.

      [74] BETTINGER D,SCHURZ B,STOHL K,et al.Expert system control of blast furnaces-the next step[J].Steel Times International,2005,29(7):14.

      [75] 任盛怡.基于數(shù)據(jù)挖掘的高爐異常爐況分析[D].重慶:重慶大學(xué),2009.

      [76] 何細藕.乙烯裂解爐技術(shù)進展[J].現(xiàn)代化工,2001,21(9):13-17.

      [77] 張曉丹.基于免疫克隆算法的LVQ神經(jīng)網(wǎng)絡(luò)研究及其在化工工業(yè)故障診斷過程中的應(yīng)用[D].上海:華東理工大學(xué),2014.

      [78] 于文秀.聚丙烯技術(shù)新進展[J].石油化工,2003,32(10):913-917.

      [79] 趙文明.對我國聚丙烯技術(shù)及市場發(fā)展的認識和思考[J].化學(xué)工業(yè),2009,27(12):10-16.

      [80] 夏陸岳,潘海天,周猛飛,等.基于改進多尺度主元分析的丙烯聚合過程監(jiān)測與故障診斷[J].化工學(xué)報,2011,62(8):2312-2317.

      [81] 李躍文.塑料注塑成型技術(shù)新進展[J].塑料工業(yè),2011,39(4):6-9.

      [82] 趙斐,陸寧云,楊毅.基于工況識別的注塑過程產(chǎn)品質(zhì)量預(yù)測方法[J].化工學(xué)報,2013,64(7):2526-2534.

      [83] 曹漢昌,郝希仁,張韓.催化裂化工藝計算與技術(shù)分析[M].北京:石油工業(yè)出版社,2000.

      [84] 周小偉,袁俊,楊伯倫.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)的二次反應(yīng)清潔汽油辛烷值預(yù)測[J].西安交通大學(xué)學(xué)報,2010,44(12):82-86.

      Recent development of the application of big data technology in process industries

      SU Xin,WU Yingya,PEI Huajian,LAN Xingying,GAO Jinsen
      (State Key Laboratory of Heavy Oil Processing,China University of Petroleum-Beijing,Beijing 102249,China)

      Abstract:Recently,the big data technology has been applied in many field widely,such as finance,trade and medical healthy. But the applications in process industries are only in the beginning stages. In this paper,the characteristics,analyzing methods and applications of the data in process industries are introduced. The data obtained by the process industry have the characteristics of high dimension,strong nonlinearity,uneven sample distribution and low signal-to-noise ratio except from the characteristics of volume,variety,velocity and variability. The big data technology has emerged and developed to be available in analyzing data from the process industries. The analyzing methods based on the industrial data include dimension reduction analysis,cluster and classification analysis,correlation analysis and prediction analysis according to their functions. In this paper,the applications of the big data technology in process industries are summarized from three aspects including process optimization,process monitoring and fault diagnosis and prediction of product properties and yield. It is found that the big data will play a more important role if the production data in the process industries can be combined with the market data of raw material and product. Key words:big data;process industry;data analysis;process systems

      中圖分類號:TQ 063

      文獻標志碼:A

      文章編號:1000–6613(2016)06–1652–08

      DOI:10.16085/j.issn.1000-6613.2016.06.006

      收稿日期:2016-02-01;修改稿日期:2016-02-29。

      猜你喜歡
      數(shù)據(jù)分析大數(shù)據(jù)
      我校如何利用體育大課間活動解決男生引體向上這個薄弱環(huán)節(jié)
      體育時空(2016年8期)2016-10-25 18:02:39
      Excel電子表格在財務(wù)日常工作中的應(yīng)用
      淺析大數(shù)據(jù)時代背景下的市場營銷策略
      新常態(tài)下集團公司內(nèi)部審計工作研究
      中國市場(2016年36期)2016-10-19 04:31:23
      淺析大數(shù)據(jù)時代對企業(yè)營銷模式的影響
      基于讀者到館行為數(shù)據(jù)分析的高校圖書館服務(wù)優(yōu)化建議
      科技視界(2016年22期)2016-10-18 14:37:36
      大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
      新聞世界(2016年10期)2016-10-11 20:13:53
      基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
      科技視界(2016年20期)2016-09-29 10:53:22
      數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
      中國記者(2016年6期)2016-08-26 12:36:20
      新乡市| 平原县| 丰镇市| 宕昌县| 疏勒县| 民勤县| 常山县| 汽车| 吴江市| 察哈| 浦东新区| 漳平市| 炎陵县| 徐闻县| 长沙市| 台山市| 卫辉市| 怀安县| 延吉市| 绥滨县| 稷山县| 深水埗区| 通化县| 石景山区| 沾化县| 海城市| 贵德县| 报价| 蓬莱市| 蒙自县| 徐闻县| 手游| 肃北| 云和县| 宝山区| 简阳市| 广东省| 望都县| 新乐市| 隆子县| 辽宁省|