史 斌,姜繼平,2*,王 鵬,3
?
基于高頻在線水質(zhì)數(shù)據(jù)異常的突發(fā)污染預(yù)警
史 斌1,姜繼平1,2*,王 鵬1,3
(1.哈爾濱工業(yè)大學(xué)環(huán)境學(xué)院,黑龍江哈爾濱 150090;2.南方科技大學(xué)環(huán)境科學(xué)與工程學(xué)院,廣東深圳518055;3.哈爾濱工業(yè)大學(xué)城市水資源與水環(huán)境國(guó)家重點(diǎn)實(shí)驗(yàn)室,黑龍江哈爾濱 150090)
在高頻水質(zhì)自動(dòng)監(jiān)測(cè)背景下,建立了基于軟測(cè)量和水質(zhì)時(shí)間序列異常檢測(cè)的水體突發(fā)污染預(yù)警預(yù)報(bào)技術(shù).假定突發(fā)污染事故會(huì)引起典型自動(dòng)監(jiān)測(cè)水質(zhì)參數(shù)變化,采用回歸分析建立水質(zhì)參數(shù)和在線高頻監(jiān)測(cè)水質(zhì)參數(shù)間的線性關(guān)系進(jìn)行軟測(cè)量,采用人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)短程水質(zhì)變化,建立基于預(yù)測(cè)殘差的異常判斷最小閾值,最終通過(guò)有序監(jiān)督聚類進(jìn)行水質(zhì)突變檢測(cè)從而對(duì)突發(fā)污染事故進(jìn)行預(yù)警.采用美國(guó)弗吉尼亞州的Potomac River流域在線監(jiān)測(cè)數(shù)據(jù)進(jìn)行算法驗(yàn)證和案例分析.分析受試者工作曲線(ROC)表明:該方法對(duì)2倍異常和3倍異常水平的檢測(cè)準(zhǔn)確率分別為62.7%和92.5%,且隨著異常水平的增加準(zhǔn)確率增加,通常突發(fā)污染事故中特定污染物濃度水平一般明顯高于3倍,該方法具有較高的準(zhǔn)確率.較其他突發(fā)污染水質(zhì)預(yù)警技術(shù),該技術(shù)有效縮短了平均檢測(cè)時(shí)間,為流域污染預(yù)警預(yù)報(bào)和快速應(yīng)急響應(yīng)提供了新途徑.
突發(fā)水污染事故;高頻水質(zhì)自動(dòng)監(jiān)測(cè);異常檢測(cè);軟測(cè)量;人工神經(jīng)網(wǎng)絡(luò)
當(dāng)前, 在世界范圍內(nèi)蓄意或非故意化學(xué)品泄露造成的水體突發(fā)污染仍不斷發(fā)生[1-2].尤其在中國(guó),幾十年來(lái)的經(jīng)濟(jì)高速發(fā)展,將我國(guó)帶入了突發(fā)環(huán)境污染事件的高發(fā)期[3-5].頻發(fā)的水污染事件及其伴隨的嚴(yán)重危害引起了各級(jí)政府關(guān)注,也促進(jìn)了管理部門(mén)和環(huán)境專家們致力于開(kāi)發(fā)污染預(yù)警響應(yīng)技術(shù),服務(wù)于水質(zhì)安全保障.
隨著國(guó)家對(duì)河流水質(zhì)管理的重視,水體監(jiān)測(cè)基礎(chǔ)設(shè)施日益健全,數(shù)據(jù)積累日漸豐富,實(shí)現(xiàn)大數(shù)據(jù)支撐下的水環(huán)境管理已經(jīng)日益成熟.在發(fā)達(dá)國(guó)家,如美國(guó)已經(jīng)實(shí)現(xiàn)了對(duì)河流水溫、DO、濁度、pH值、電導(dǎo)率和硝酸亞硝酸鹽等水質(zhì)指標(biāo)的每5~15min監(jiān)測(cè)一次并每小時(shí)發(fā)布[6].我國(guó)2008年以來(lái)也布設(shè)了國(guó)家水質(zhì)自動(dòng)監(jiān)測(cè)系統(tǒng),但是在采樣頻率、監(jiān)測(cè)指標(biāo)、覆蓋程度上還遠(yuǎn)遠(yuǎn)不夠.
湯鴻霄[7]指出,下一步環(huán)境科學(xué)與技術(shù)的研究要充分運(yùn)用衛(wèi)星遙感、數(shù)值信息、模擬模式、多媒體圖像等學(xué)科技術(shù),再加上互聯(lián)網(wǎng),大數(shù)據(jù),人工智能等新增創(chuàng)新手段,試圖以數(shù)字量化來(lái)描述大范圍環(huán)境體系變化,達(dá)到準(zhǔn)確闡釋和預(yù)報(bào)環(huán)境動(dòng)態(tài)和災(zāi)害.
基于高頻水質(zhì)監(jiān)測(cè),結(jié)合數(shù)據(jù)流異常檢測(cè)技術(shù),可以開(kāi)發(fā)新型的突發(fā)水污染預(yù)警技術(shù),用于流域的智能化管理.目前,基于高頻時(shí)間序列的異常檢測(cè)問(wèn)題廣泛應(yīng)用于衛(wèi)星遙測(cè)、金融詐騙、網(wǎng)絡(luò)入侵、安全防御、電信數(shù)據(jù)管理、傳感器異常分析等諸多領(lǐng)域[8-9][48, 49],隨著數(shù)據(jù)流異常檢測(cè)技術(shù)在各個(gè)領(lǐng)域的廣泛應(yīng)用[10]和目前水環(huán)境數(shù)據(jù)采集技術(shù)的不斷發(fā)展和豐富[11],基于水質(zhì)監(jiān)測(cè)數(shù)據(jù)的異常檢測(cè)研究開(kāi)始引起了環(huán)境專家們的興趣.目前大多研究是針對(duì)城市供水管網(wǎng)在線水質(zhì)監(jiān)測(cè)系統(tǒng)的異常檢測(cè)[12-13].而河流水質(zhì)由于受到水文、氣象、污染物等多種因素的綜合影響,其變化規(guī)律難以捕捉,目前為止國(guó)內(nèi)外基于河流在線水質(zhì)監(jiān)測(cè)數(shù)據(jù)的突發(fā)污染預(yù)警研究較少.
本研究針對(duì)目前突發(fā)污染事件中存在遲知、未知的問(wèn)題,基于在線水質(zhì)自動(dòng)監(jiān)測(cè)站高頻水質(zhì)監(jiān)測(cè)數(shù)據(jù),研究建立在線突發(fā)污染預(yù)警技術(shù),基于水質(zhì)參數(shù)多元回歸模型構(gòu)建關(guān)鍵非在線監(jiān)測(cè)水質(zhì)參數(shù)的軟測(cè)量方法,并結(jié)合神經(jīng)網(wǎng)絡(luò)水質(zhì)預(yù)測(cè)殘差和聚類分析檢測(cè)下一時(shí)刻的水質(zhì)異常變化,預(yù)報(bào)可能出現(xiàn)的突發(fā)污染.通過(guò)對(duì)建立的預(yù)警方法采用美國(guó)弗吉尼亞州的實(shí)際觀測(cè)數(shù)據(jù)構(gòu)建典型情景進(jìn)行驗(yàn)證,對(duì)所建立的方法在應(yīng)用過(guò)程可能存在的問(wèn)題也進(jìn)行了討論.
突發(fā)污染不同于常規(guī)污染情景,污染物種類存在極大的不確定性,目前整個(gè)自然界有超過(guò)10萬(wàn)種的毒性污染物質(zhì),即使世界上最先進(jìn)的檢測(cè)儀器也無(wú)法全部檢測(cè)出單個(gè)物質(zhì).但由于水質(zhì)常規(guī)高頻自動(dòng)監(jiān)測(cè)指標(biāo)對(duì)大部分污染物都會(huì)表現(xiàn)出不同程度的敏感性[14-15],開(kāi)展基于水質(zhì)常規(guī)高頻監(jiān)測(cè)指標(biāo)的污染物濃度軟測(cè)量是可行的[16].
回顧我國(guó)突發(fā)污染案例,其主要污染物可分為有機(jī)物、重金屬或酸堿性無(wú)機(jī)物等[17],結(jié)合自動(dòng)監(jiān)測(cè)指標(biāo)的類型,可以選用pH值、濁度、電導(dǎo)率和UV254等4個(gè)指標(biāo)作為監(jiān)測(cè)數(shù)據(jù)集,pH值代表水體的酸堿度,濁度代表水體受懸浮有機(jī)物污染的程度,電導(dǎo)率代表水中離子濃度,而UV254在一定程度上可以代表水體受有機(jī)污染程度.
基于上述在線水質(zhì)監(jiān)測(cè)指標(biāo),通過(guò)分析水質(zhì)參數(shù)之間的相關(guān)關(guān)系,找出水質(zhì)變化規(guī)律;并基于變化規(guī)律采用數(shù)據(jù)驅(qū)動(dòng)模型預(yù)測(cè)當(dāng)前水質(zhì)情況;與實(shí)際監(jiān)測(cè)數(shù)據(jù)進(jìn)行對(duì)比,計(jì)算預(yù)測(cè)殘差;以異常判斷最小閾值為基準(zhǔn),采用有序監(jiān)督聚類方法判斷水質(zhì)參數(shù)預(yù)測(cè)殘差與最小閾值的大小,來(lái)實(shí)現(xiàn)異常檢測(cè)判斷.
對(duì)于同一河段,水體中任何一種污染物組分的變化都可能會(huì)引起上述幾種自動(dòng)監(jiān)測(cè)指標(biāo)的變化[18].Jeffery等[19]研究了如何利用高頻水質(zhì)參數(shù)如電導(dǎo)率和濁度表示不能進(jìn)行高頻監(jiān)測(cè)的水質(zhì)參數(shù),總結(jié)出如下回歸方程:
回歸方程可以近似表達(dá)突發(fā)污染物進(jìn)入水體后引起常規(guī)水質(zhì)指標(biāo)的變化,然后結(jié)合指標(biāo)權(quán)重進(jìn)行疊加分析,通過(guò)比較該指標(biāo)預(yù)測(cè)時(shí)間序列和實(shí)際監(jiān)測(cè)時(shí)間序列的殘差,實(shí)現(xiàn)突發(fā)污染異常檢測(cè).
由于水質(zhì)異常通常由多種水質(zhì)參數(shù)綜合異常所致,而每種水質(zhì)指標(biāo)有不同的量綱,有必要在水質(zhì)指標(biāo)疊加之前對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理.我們選用Z-score 標(biāo)準(zhǔn)化將原始時(shí)間序列轉(zhuǎn)化為均值為0,方差為1正態(tài)分布的無(wú)量綱序列. 其處理方程如公式(2)所示:
進(jìn)一步采用人工神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)驅(qū)動(dòng)模型,對(duì)常態(tài)水質(zhì)時(shí)間序列進(jìn)行學(xué)習(xí)、計(jì)算、記憶、自適應(yīng)以及智能處理.對(duì)水質(zhì)發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),計(jì)算預(yù)測(cè)值和實(shí)際監(jiān)測(cè)值殘差,從而將殘差與指定閾值比較,判斷水質(zhì)異常變化情況.
閾值選擇的合理性對(duì)于異常檢測(cè)算法起著極其重要的作用[20],為盡量提高算法異常檢出率,本研究采用最低實(shí)際閾值法來(lái)確定閾值:
式中:和s分別為其殘差分布的平均值及標(biāo)準(zhǔn)差.
綜上,采用基于回歸分析的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法進(jìn)行異常檢測(cè)的流程如圖1所示,主要步驟包括:(1)分析變量的影響因素,并確定主要因素及其影響程度;(2)利用歷史數(shù)據(jù)建立預(yù)測(cè)變量與主要影響因素之間的回歸關(guān)系模型;(3)把預(yù)測(cè)期主要影響因素的指標(biāo)值,代入網(wǎng)絡(luò)進(jìn)行預(yù)測(cè);(4)基于預(yù)測(cè)水質(zhì)時(shí)間序列和實(shí)際監(jiān)測(cè)水質(zhì)時(shí)間序列的殘差序列與指定閾值對(duì)比判斷是否異常;(5)啟動(dòng)應(yīng)急監(jiān)測(cè)來(lái)監(jiān)測(cè)是否有特殊污染物超標(biāo),進(jìn)一步確定是否為突發(fā)污染事件.
由于目前國(guó)內(nèi)難以獲取河流高頻水質(zhì)監(jiān)測(cè)數(shù)據(jù),本研究所需的高頻水質(zhì)監(jiān)測(cè)數(shù)據(jù)來(lái)源于美國(guó)地質(zhì)調(diào)查局(http://waterdata.usgs.gov/nwis).正常情況下水質(zhì)監(jiān)測(cè)頻率為15min,監(jiān)測(cè)數(shù)據(jù)現(xiàn)場(chǎng)存儲(chǔ),并且每隔1~4h傳輸?shù)矫绹?guó)地質(zhì)調(diào)查局網(wǎng)站上.我們選擇了位于弗吉尼亞州的Potomac River流域01632900號(hào)站點(diǎn)最近3個(gè)月的監(jiān)測(cè)數(shù)據(jù)(1~3月,共55d),其水質(zhì)監(jiān)測(cè)指標(biāo)主要包括:水溫、電導(dǎo)率、溶解氧、pH、濁度和硝態(tài)亞硝態(tài)鹽氮等6個(gè).對(duì)于大量高頻監(jiān)測(cè)數(shù)據(jù),盡管每周都對(duì)自動(dòng)監(jiān)測(cè)站進(jìn)行維護(hù),但是也難以避免存在間斷性的數(shù)據(jù)缺失[21].對(duì)于單點(diǎn)缺失數(shù)據(jù)采用缺失點(diǎn)前后各兩個(gè)點(diǎn)求均值的方法補(bǔ)充.對(duì)于連續(xù)缺失數(shù)據(jù)采用數(shù)據(jù)平移的方法補(bǔ)充,即平移缺失點(diǎn)之前相同數(shù)量的數(shù)值填補(bǔ)缺失.另外,對(duì)原始數(shù)據(jù)中的冗余數(shù)據(jù)和單位不一致數(shù)據(jù),分別采用人工剔除和數(shù)值單位轉(zhuǎn)換的方法處理.
原始監(jiān)測(cè)數(shù)據(jù)首先進(jìn)行標(biāo)準(zhǔn)化處理,圖2為標(biāo)準(zhǔn)化后水質(zhì)時(shí)間序列的變化情況.其中水溫、pH值、DO和硝酸亞硝酸鹽氮4個(gè)指標(biāo)呈現(xiàn)出明顯的以天為單位的周期變化,而濁度和電導(dǎo)率變化受環(huán)境變化比較敏感,周期性變化不明顯.
采用包括當(dāng)前時(shí)刻的96個(gè)數(shù)據(jù)(共24h)預(yù)測(cè)下一時(shí)刻 (第97個(gè)數(shù)據(jù))的水質(zhì)監(jiān)測(cè)數(shù)據(jù),當(dāng)?shù)?7個(gè)監(jiān)測(cè)數(shù)據(jù)獲得后,進(jìn)行對(duì)比分析.
在本案例中采用BP神經(jīng)網(wǎng)絡(luò),設(shè)定兩個(gè)隱含層,分別選用Log-sigmoid(輸入值為任意值,輸出值在0和1之間)和Purelin傳遞函數(shù)(輸入輸出值均為任意值)作為激活函數(shù),采用標(biāo)準(zhǔn)梯度下降算法訓(xùn)練神經(jīng)網(wǎng)絡(luò).基于前35d共3360組監(jiān)測(cè)數(shù)據(jù),通過(guò)測(cè)試調(diào)整神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),依據(jù)“奧卡姆剃刀”原理,最后確定隱含層分別為5個(gè)和1個(gè)節(jié)點(diǎn)神經(jīng)元.以后20d共1920組監(jiān)測(cè)數(shù)據(jù)作為檢驗(yàn)集,驗(yàn)證所訓(xùn)練的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)能力.
圖2 標(biāo)準(zhǔn)化水質(zhì)自動(dòng)監(jiān)測(cè)數(shù)據(jù)時(shí)間序列
圖3 基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值與實(shí)際監(jiān)測(cè)值對(duì)比分布
以濁度為例,采用公式(4)計(jì)算檢驗(yàn)集預(yù)測(cè)殘差,檢驗(yàn)集的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)能力表現(xiàn)如圖3所示,其平均預(yù)測(cè)殘差為0.0104,中位數(shù)殘差為0.0052,平均相對(duì)誤差為1.54%,有很高的預(yù)測(cè)精度.
RE=|預(yù)測(cè)值-監(jiān)測(cè)值| (4)
圖4 水質(zhì)異常變化(濁度)的時(shí)間序列假設(shè)情景
確定啟動(dòng)預(yù)警閾值后,結(jié)合人工構(gòu)建的異常水質(zhì)監(jiān)測(cè)數(shù)據(jù)流,進(jìn)行異常檢測(cè)準(zhǔn)確性分析.
以濁度監(jiān)測(cè)數(shù)據(jù)為例,檢驗(yàn)集每天10:00~ 12:00間的樣本分別疊加2倍和3倍異常,即將觀測(cè)數(shù)據(jù)人為放大2倍和3倍,構(gòu)造出2組新的時(shí)間序列,記為情景I和情景II,可代表發(fā)生突發(fā)污染的水質(zhì)異常變化情形(例如每天上午10:00~ 12:00點(diǎn)有點(diǎn)源偷排),如圖4所示.
圖5 異常情景I(a)和情景II(b)時(shí)ROC曲線
非在線監(jiān)測(cè)水質(zhì)參數(shù),如總氮可采用類似公式(5)的回歸公式[13]進(jìn)行軟測(cè)量.結(jié)合軟測(cè)量技術(shù),本文提出的異常檢測(cè)方法應(yīng)用范圍更為廣泛.
結(jié)合(5)式,構(gòu)建接近真實(shí)情形的總氮高頻時(shí)間序列,進(jìn)行異常檢測(cè)分析.依據(jù)2.2中所述步驟訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),計(jì)算得到總氮的預(yù)測(cè)值,與實(shí)際監(jiān)測(cè)值,對(duì)比得到對(duì)應(yīng)的殘差序列,如圖6所示.基于殘差序列,利用公式(3)計(jì)算得到異常檢測(cè)最小閾值.
式中:TURB為濁度標(biāo)準(zhǔn)化值, WT為水體溫度標(biāo)準(zhǔn)化值, SC為電導(dǎo)率標(biāo)準(zhǔn)化值.
圖6 TN時(shí)間序列及預(yù)測(cè)殘差
基于神經(jīng)網(wǎng)絡(luò)訓(xùn)練后的異常判斷最小閾值標(biāo)準(zhǔn),針對(duì)需要檢測(cè)水質(zhì)參數(shù)時(shí)間序列,按照采樣時(shí)間順序,采用有序監(jiān)督聚類方法[19]進(jìn)行聚類,對(duì)小于最小閾值的判斷為正常事件,大于最小閾值的判斷為異常事件.從圖6可以看出,總體上預(yù)測(cè)殘差基本在最小閾值(Threshmin=0.1324)范圍內(nèi).在3月8日和3月19日出現(xiàn)了2次比較明顯的水質(zhì)突變,預(yù)測(cè)殘差值也均明顯高于指定閾值.通過(guò)查詢對(duì)應(yīng)時(shí)段的氣象條件以及該站點(diǎn)的流量監(jiān)測(cè)數(shù)據(jù):3月8日平均流量為1.06m3/s, 3月19日平均流量為1.38m3/s,均明顯高于預(yù)測(cè)期平均流量0.83m3/s.分析其原因可能是由于降雨沖刷地表,將陸地上的含氮有機(jī)物沖刷進(jìn)入水體造成,這種情況下應(yīng)當(dāng)啟動(dòng)應(yīng)急監(jiān)測(cè),監(jiān)測(cè)是否有特殊污染物進(jìn)入水體以判斷是否為突發(fā)污染事故.
3.1 本研究充分利用了水質(zhì)自動(dòng)監(jiān)測(cè)站高頻監(jiān)測(cè)數(shù)據(jù),與我國(guó)目前已有的水質(zhì)在線監(jiān)測(cè)方法和依據(jù)公眾投訴、公共安全檢查、常規(guī)抽樣分析等傳統(tǒng)異常檢測(cè)方法相比,其對(duì)污染物濃度變化更敏感, 檢測(cè)效率更高.
3.2 本研究所提出的異常檢測(cè)方法對(duì)較低濃度的水質(zhì)異常檢出準(zhǔn)確率低,而且還存在一些誤報(bào)現(xiàn)象,但是能夠全部檢測(cè)出實(shí)際異常時(shí)間序列,不會(huì)存在異常漏報(bào)現(xiàn)象.與后續(xù)的應(yīng)急監(jiān)測(cè)工作相結(jié)合即能夠提高檢出的準(zhǔn)確率,并為真正的突發(fā)污染事件提供基礎(chǔ)數(shù)據(jù)支持.
3.3 隨著河長(zhǎng)制的逐步推行,該方法在明確環(huán)境責(zé)任,提高預(yù)警判定的準(zhǔn)確性和時(shí)效性方面將會(huì)有廣泛的應(yīng)用.將來(lái)為了加強(qiáng)河段環(huán)境管理, 在目標(biāo)河段安裝包含pH值、濁度、電導(dǎo)率和UV254等指標(biāo)的高頻傳感器必將能夠更能充分發(fā)揮該異常檢測(cè)方法的優(yōu)勢(shì).
[1] 李堯遠(yuǎn),曹 蓉.我國(guó)應(yīng)急管理研究十年(2004~2013):成績(jī)、問(wèn)題與未來(lái)取向 [J]. 中國(guó)行政管理, 2015,(1):83-87.
[2] XUE P, ZENG W. Trends of environmental accidents and impact factors in China [J]. Frontiers of Environmental Science & Engineering in China, 2011,5(2):266-276.
[3] 劉仁濤,郭 亮,姜繼平,等.環(huán)境污染應(yīng)急處置技術(shù)的CBR- MADM兩步篩選法模型 [J]. 中國(guó)環(huán)境科學(xué), 2015,35(3):943- 52.
[4] 趙艷民,秦延文,鄭丙輝,等.突發(fā)性水污染事故應(yīng)急健康風(fēng)險(xiǎn)評(píng)價(jià) [J]. 中國(guó)環(huán)境科學(xué), 2014,34(5):1328-1335.
[5] Camp J V, Abkowitz M D, Leboeuf E J. Inland waterway resource and spill management needs in Southeastern USA [J]. Disaster Prevention And Management, 2010,19(4):483-497.
[6] US EPA, 2017. National hydrography dataset high-resolution flowline data [EB/OL]. The National Map. https://www.data.gov/.
[7] 湯鴻霄.環(huán)境科學(xué)與技術(shù)的擴(kuò)展融合趨勢(shì) [J]. 環(huán)境科學(xué)學(xué)報(bào), 2017,37(2):405-406.
[8] 李維錚,孟 橋.基于遙測(cè)數(shù)據(jù)動(dòng)態(tài)特征的衛(wèi)星異常檢測(cè)方法 [J]. 空間科學(xué)學(xué)報(bào), 2014,34(2):201-207.
[9] 田嘉瑞.傳感器網(wǎng)絡(luò)數(shù)據(jù)流異常數(shù)據(jù)檢測(cè)與修正 [D]. 哈爾濱:哈爾濱工程大學(xué), 2008.
[10] Zou S, Liang Y, Poor H V, et al. Nonparametric Detection of Anomalous Data Streams [J]. Computer Science, 2016,1:1-26.
[11] 黃樹(shù)成,曲亞輝.數(shù)據(jù)流分類技術(shù)研究綜述 [J]. 計(jì)算機(jī)研究應(yīng)用, 2009,26(10):3604-3609.
[12] 陳 玥.城市供水水質(zhì)異常檢測(cè)方法研究 [D]. 杭州:浙江大學(xué), 2013.
[13] 魏 媛,馮天恒,黃平捷,等.管網(wǎng)水質(zhì)多指標(biāo)動(dòng)態(tài)關(guān)聯(lián)異常檢測(cè)方法 [J]. 浙江大學(xué)學(xué)報(bào)(工學(xué)版), 2016,50(7):1402-1409.
[14] Christensen V G. Characterization of surface-water quality based on real-time monitoring and regression analysis, quivira national wildlife refuge, south-central kansas, december 1998 through June 2001 [R]. Center for Integrated Data Analytics Wisconsin Science Center, 2001.
[15] Horsburgh J S, Jones A S, Stevens D K, et al. A sensor network for high frequency estimation of water quality constituent fluxes using surrogates [J]. Environmental Modelling & Software, 2010,25(9):1031-1044.
[16] 姜繼平,王 鵬,劉 潔,等.突發(fā)水污染預(yù)警應(yīng)急響應(yīng)研究與實(shí)踐的方法學(xué)辨析[J]. 環(huán)境科學(xué)學(xué)報(bào), 2017,37(1):1-13.
[17] Liu J, Guo L, Jiang J P, et al. Evaluation and selection of emergency treatment technology based on dynamic fuzzy GRA method for chemical contingency spills [J]. Journal of Hazardous Materials, 2015,299:306-315.
[18] Helsel D R. Statistical methods in water resources / D.R. Helsel and R.M. Hirsch [M]. Amsterdam, New York: Elsevier, 1992.
[19] Parmar K S, Bhardwaj R. Water quality management using statistical analysis and time-series prediction model [J]. Applied Water Science, 2014,4(4):425-434.
[20] Mckenna S A, Hart D B, Murray R, et al. Testing and evaluation of water quality event detection algorithms [M]. Handbook of Water and Wastewater Systems Protection, 2011.
[21] PE A-AYALA A. Educational data mining: A survey and a data mining-based analysis of recent works [J]. Expert Systems with Applications, 2014,41(4):1432-1462.
致謝:感謝香港大學(xué)陳驥教授對(duì)論文英文部分的審閱和修訂.
Early warning of water pollution incidents based on abnormal change of water quality data from high frequency online monitoring.
SHI Bin1, JIANG Ji-ping1,2*, WANG Peng1,3
(1.School of Environmental, Harbin Institute of Technology, Harbin 150090, China;2.School of Environmental Science and Engineering, Southern University of Science and Technology, Shenzhen 518055, China;3.State Key Laboratory of Water Resources and Water Environment, Harbin Institute of Technology, Harbin 150090, China)., 2017,37(11):4394~4400
With the high frequency automatic monitoring of surface water quality, a technique for early warning of water pollution incidents was developed using the water quality soft measurement and abnormal detection of time series. This technique takes the assumption that water pollution incidents would cause the change of typical automatic monitoring water quality parameters, and then establishes the linear relationship between the water quality parameters and online high frequency monitoring water quality parameters. Using the artificial neural network, the change of water quality parameters in a short duration was predicted; using the time series of residual error, the threshold of abnormal change was determined. Finally, early warning of pollution incidents could be achieved through detecting abnormal change based on sequential leader clustering algorithm. To verify the technique, this study takes the online monitoring data obtained from the Potomac River in Virginia, USA as a case study. The analysis of the receiver operating characteristic curve (ROC) shows that the detection accuracies of double and triple abnormal levels can reach 62.7% and 92.5%, respectively. Because the concentration level of a water pollution incident is usually significantly higher than 3times, this technique can provide a relative high accurate early warning. Compared with traditional abnormal detection methods, this technique can shorten the detection time. Along with increasing improvement of automatic monitoring facilities, this study provided a new avenue for early warning of, and prompt response to, pollution incidents.
water pollution incident;high frequency automatic water quality monitoring;abnormal change;soft measurement;artificial neural network
X522
A
1000-6923(2017)11-4394-07
史 斌(1987-),男,山東鄆城人,哈爾濱工業(yè)大學(xué)博士研究生,主要從事環(huán)境數(shù)學(xué)模型與決策支持系統(tǒng)方向研究.發(fā)表論文10余篇.
2017-04-25
中國(guó)博士后科學(xué)基金資助項(xiàng)目(2014M551249);國(guó)家自然科學(xué)基金資助項(xiàng)目(51779066);中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)基金資助項(xiàng)目(HIT. NSRIF.2017060)
* 責(zé)任作者, 助理教授, jiangjp@sustc.edu.cn