郭慶春,楊旭,寇立群
(陜西廣播電視大學(xué),陜西 西安 710119)
?
【管理科學(xué)】
人工神經(jīng)網(wǎng)絡(luò)在大氣污染預(yù)測中的應(yīng)用*
郭慶春1,楊旭2,寇立群3
(陜西廣播電視大學(xué),陜西 西安 710119)
對大氣污染進(jìn)行預(yù)測具有十分重要的科學(xué)意義。人工神經(jīng)網(wǎng)絡(luò)模型在大氣污染預(yù)測預(yù)報(bào)領(lǐng)域廣泛應(yīng)用,可以通過選擇不同算法,設(shè)置學(xué)習(xí)率和動(dòng)態(tài)系數(shù)等參數(shù)使基于神經(jīng)網(wǎng)絡(luò)的大氣污染預(yù)測模型的精度得到提高,說明神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于大氣污染預(yù)報(bào)具有較高的預(yù)測精度和良好的泛化能力。
人工神經(jīng)網(wǎng)絡(luò);大氣污染;算法
環(huán)境空氣質(zhì)量密切關(guān)系到人們的生產(chǎn)、生活,歷史上很多關(guān)于大氣污染的“公害事件”給人類帶來了慘痛教訓(xùn),隨著人們生活水平的提高,對于大氣質(zhì)量有了更高要求,世界各國普遍重視大氣質(zhì)量問題。我國正處在經(jīng)濟(jì)迅速發(fā)展的時(shí)期,同時(shí)由主要污染物造成的大氣環(huán)境污染問題日趨嚴(yán)重,給人民生活和健康造成嚴(yán)重影響[1]。大氣污染對資源和環(huán)境的沖擊日益威脅著可持續(xù)發(fā)展的基礎(chǔ)。
近年來應(yīng)用較為廣泛的非線性方法主要有人工神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)的研究與應(yīng)用正成為人工智能、認(rèn)知科學(xué)、神經(jīng)生理學(xué)、非線性動(dòng)力學(xué)等相關(guān)專業(yè)的熱點(diǎn)。神經(jīng)網(wǎng)絡(luò)是一個(gè)高度復(fù)雜的非線性動(dòng)力學(xué)系統(tǒng),特別適合處理需要同時(shí)考慮許多因素和條件的、不精確和模糊的信息處理問題。由于這些特性,在一定程度上避開了“假定”,從數(shù)據(jù)本身找出規(guī)律性的、基于特定問題的解。神經(jīng)網(wǎng)絡(luò)在污染預(yù)測方面的應(yīng)用較為廣泛[2-3]。
人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)是由大量簡單的處理單元(或稱神經(jīng)元)廣泛地相互連接而形成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),是一種非線性的動(dòng)力學(xué)系統(tǒng)。它具有大規(guī)模的并行處理和分布式的信息存儲能力、良好的自適應(yīng)性、自組織性及很強(qiáng)的學(xué)習(xí)、聯(lián)想、容錯(cuò)及抗干擾能力,迄今為止,人們提出許多神經(jīng)網(wǎng)絡(luò)模型。較典型的有BP網(wǎng)絡(luò)、Hopfield網(wǎng)絡(luò)及CPN網(wǎng)絡(luò)等,其中應(yīng)用較多的是具有非線性傳遞函數(shù)神經(jīng)元構(gòu)成的前饋網(wǎng)絡(luò)中采用誤差反向傳播算法作為其學(xué)習(xí)算法的前饋網(wǎng)絡(luò)(Back Error Propagation,簡稱BP網(wǎng)絡(luò))。誤差反向傳播網(wǎng)絡(luò)(BP模型)是一種多層結(jié)構(gòu)的映射網(wǎng)絡(luò),它是目前應(yīng)用最為廣泛的一種人工神經(jīng)網(wǎng)絡(luò),在各門學(xué)科領(lǐng)域中都具有極其重要的實(shí)用價(jià)值,其學(xué)習(xí)能力和容錯(cuò)能力對于具有不確定性模式識別具有獨(dú)到之處。BP算法的中心思想是調(diào)整權(quán)值使網(wǎng)絡(luò)總誤差最小。BP模型學(xué)習(xí)過程的算法由正向傳播和反向傳播兩部分組成。通過反復(fù)的正向傳播和反向傳播,不斷地修改各層神經(jīng)元的權(quán)值和閾值來減少誤差函數(shù),直到與某一相當(dāng)小的正值或進(jìn)行迭代運(yùn)算時(shí)誤差函數(shù)不再減少。學(xué)習(xí)過程的實(shí)質(zhì)是求誤差函數(shù)的最小值,它通過反復(fù)訓(xùn)練已知樣本集,在沒有達(dá)到設(shè)定的誤差最小值之前,每訓(xùn)練一次,權(quán)值將沿誤差函數(shù)的最速下降方向改變,最終收斂到最小點(diǎn),然后將多個(gè)樣本訓(xùn)練所得的各層間連接權(quán)值及各層神經(jīng)元的偏置值(即閾值)信息保存起來,以便對未知樣本進(jìn)行處理。
標(biāo)準(zhǔn)的BP算法是基于梯度下降法,通過計(jì)算目標(biāo)函數(shù)對神經(jīng)網(wǎng)絡(luò)閾值和權(quán)值的梯度進(jìn)行修正。改進(jìn)算法多數(shù)是在標(biāo)準(zhǔn)梯度下降法的基礎(chǔ)上發(fā)展起來的,它們只是用到目標(biāo)函數(shù)對閾值和權(quán)值的一階導(dǎo)數(shù)(或者梯度) 信息。標(biāo)準(zhǔn)的BP 算法雖然為訓(xùn)練網(wǎng)絡(luò)提供了簡單而有效的方法,但是由于訓(xùn)練過程中學(xué)習(xí)速率為一較小的常數(shù),因而存在收斂速度慢和局部極小問題。為解決這些問題,研究人員提出很多改進(jìn)的算法。主要有:附加動(dòng)量法、彈性BP算法(RPROP)、自適應(yīng)學(xué)習(xí)速率法、共軛梯度法、擬牛頓算法(BFGS)、一步割線(OSS) 算法、Levenberg-Marquardt 優(yōu)化方法等。
人工神經(jīng)網(wǎng)絡(luò)在大氣污染預(yù)測中已經(jīng)得到廣泛應(yīng)用。朱國成通過對反向傳播人工神經(jīng)網(wǎng)絡(luò)的算法和網(wǎng)絡(luò)結(jié)構(gòu)的研究,發(fā)現(xiàn)擬牛頓算法訓(xùn)練速度較快,能夠較好地接近誤差目標(biāo)值,同時(shí)建立了包括輸入層、隱含層、輸出層的人工神經(jīng)網(wǎng)絡(luò)三層拓?fù)浣Y(jié)構(gòu)。通過對街道峽谷人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,模擬計(jì)算了街道峽谷NOx濃度分布值。結(jié)果顯示訓(xùn)練誤差和測試誤差比為1.11,訓(xùn)練樣本的模擬值與實(shí)測值的相關(guān)系數(shù)為0.93,測試樣本的模擬值與實(shí)測值的相關(guān)系數(shù)為0.87,模擬值與實(shí)測值的相關(guān)系數(shù)均高于顯著水平為α=0.05與α=0.01所對應(yīng)檢驗(yàn)性表的相關(guān)系數(shù)臨界值。該模型能夠用于街道峽谷污染物濃度的模擬計(jì)算,具有較好的泛化能力[4]。郭慶春等利用寶雞市2005年~2009年的逐日空氣污染指數(shù)作為神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練樣本,進(jìn)行訓(xùn)練,分別建立了相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型。因?yàn)椴煌竟?jié)的大氣污染規(guī)律有所不同,所以用2005年(6月1日)~2009年(8月31日)春季(3~5月)、夏季(6~8月)、秋季(9~11月) 、冬季(12~2月)的4組數(shù)據(jù)分別建立了4個(gè)季節(jié)的日空氣污染指數(shù)的預(yù)報(bào)模型,并用2009年(9月1日)~2010年(8月31日)春季、夏季、秋季、冬季的數(shù)據(jù)作為非訓(xùn)練樣本進(jìn)行預(yù)報(bào)檢驗(yàn)(注意此處不能過分地要求誤差很小,否則會造成過度訓(xùn)練,那樣,雖然能夠很好地?cái)M合學(xué)習(xí)樣本,但是會造成預(yù)測能力差)。仿真實(shí)驗(yàn)結(jié)果表明:訓(xùn)練樣本的日空氣污染指數(shù)的擬合值的平均相對誤差分別為15.4%、9.3%、10.1%、14.2%,非訓(xùn)練樣本的日空氣污染指數(shù)的預(yù)測值的平均相對誤差分別為25.3%、15.4%、21.1%、23.2%,非訓(xùn)練樣本的日空氣污染指數(shù)的預(yù)測值與真實(shí)值的線性相關(guān)系數(shù)分別為0.867、0.886、0.874、0.864。仿真結(jié)果表明改進(jìn)BP算法的神經(jīng)網(wǎng)絡(luò)經(jīng)有效訓(xùn)練后應(yīng)用于大氣污染預(yù)報(bào)具有較高的預(yù)測精度和良好的泛化能力[5]。郭慶春等利用西安市2005年~2010年逐日空氣污染指數(shù),建立了一個(gè)空氣污染指數(shù)的非線性時(shí)間序列神經(jīng)網(wǎng)絡(luò)模型。實(shí)驗(yàn)結(jié)果表明:獨(dú)立樣本的日空氣污染指數(shù)的預(yù)測值的平均相對誤差分別為27.4%、23.2%、12.2%、25.7%,獨(dú)立樣本的日空氣污染指數(shù)的預(yù)測值與真實(shí)值的線性相關(guān)系數(shù)高。該模型應(yīng)用于大氣污染預(yù)報(bào)具有較高的預(yù)測精度和良好的泛化能力[6]。郭慶春等以北京市為例,綜合考慮BP網(wǎng)絡(luò)的逼近能力和泛化能力,將時(shí)間序列作為BP神經(jīng)網(wǎng)絡(luò)的輸入,對空氣污染指數(shù)的預(yù)測做了建模研究。實(shí)驗(yàn)結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)的輸出值與實(shí)際值之間的誤差在可以接受的范圍,特別是對驟升驟降趨勢也能得到準(zhǔn)確度較高的預(yù)報(bào)結(jié)果。因此在實(shí)際應(yīng)用中,可以將BP網(wǎng)絡(luò)方法作為一種考慮采用的方法[7]。郭慶春等利用石家莊市2005年~2009年春季、夏季、秋季 、冬季的4組數(shù)據(jù)分別建立了4個(gè)季節(jié)的日空氣污染指數(shù)的預(yù)測模型,并用2009年~2010年春季、夏季、秋季、冬季的數(shù)據(jù)作為獨(dú)立樣本進(jìn)行預(yù)測檢驗(yàn),實(shí)驗(yàn)結(jié)果表明:通過設(shè)置初始權(quán)重、學(xué)習(xí)率、動(dòng)態(tài)系數(shù)等參數(shù)使基于BP神經(jīng)網(wǎng)絡(luò)的大氣污染預(yù)測模型的精度得到提高,預(yù)測值與實(shí)際值之間的平均相對誤差小,預(yù)測值與實(shí)際值的相關(guān)系數(shù)高,得到了較好的預(yù)報(bào)效果,說明該模型應(yīng)用于大氣污染預(yù)報(bào)具有較高的預(yù)測精度和良好的泛化能力,它為信息社會的城市空氣污染預(yù)報(bào)工作提供了一種全新的思路和方法[8]。
由于神經(jīng)網(wǎng)絡(luò)方法與傳統(tǒng)的統(tǒng)計(jì)方法相比具有自適應(yīng)學(xué)習(xí),非線性映射和容錯(cuò)性等多種優(yōu)良性能,因此隨著人工神經(jīng)網(wǎng)絡(luò)理論和技術(shù)的不斷發(fā)展,它在大氣污染預(yù)測的應(yīng)用研究領(lǐng)域也越來越廣泛,已成為國際上學(xué)科發(fā)展的競爭熱點(diǎn)。但是神經(jīng)網(wǎng)絡(luò)方法在大量的實(shí)際問題應(yīng)用中,也存在不少亟待解決的問題。特別是神經(jīng)網(wǎng)絡(luò)方法在大氣污染預(yù)測領(lǐng)域的應(yīng)用研究中,關(guān)于如何確定適宜網(wǎng)絡(luò)結(jié)構(gòu),如何提高網(wǎng)絡(luò)的收斂性,防止網(wǎng)絡(luò)訓(xùn)練出現(xiàn)振蕩和收斂于局域最小等問題都需要進(jìn)一步深入研究。而目前有關(guān)進(jìn)化計(jì)算的遺傳算法與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合的研究,小波分析與神經(jīng)網(wǎng)絡(luò)的結(jié)合以及模糊系統(tǒng)理論與神經(jīng)網(wǎng)絡(luò)方法的結(jié)合研究,已成為神經(jīng)網(wǎng)絡(luò)研究的重要方向,也為克服神經(jīng)網(wǎng)絡(luò)方法在大氣污染預(yù)測應(yīng)用研究中存在的問題提供了思路和方法。
[1]劉玲,張金良.我國大氣污染與兒童肺功能的關(guān)系[J].環(huán)境與健康雜志,2007,24(7):471-476.
[2]朱國成,方明建,鄭旭煦.基于人工神經(jīng)網(wǎng)絡(luò)的街道峽谷NOx濃度的數(shù)值模型研究[J].環(huán)境工程學(xué)報(bào),2010(4):875-880.
[3]王芳,程水源,李明君,等.遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)用于大氣污染預(yù)報(bào)[J].北京工業(yè)大學(xué)學(xué)報(bào),2009,35(9):1230-1234.
[4]朱國成,方明建,鄭旭煦.基于人工神經(jīng)網(wǎng)絡(luò)的街道峽谷NOx濃度的數(shù)值模型研究[J].環(huán)境工程學(xué)報(bào),2010(4):875-880.
[5]郭慶春,何振芳,李力. 人工神經(jīng)網(wǎng)絡(luò)在大氣污染預(yù)測中的應(yīng)用研究[J]. 工業(yè)儀表與自動(dòng)化裝置,2012(4):18-22.
[6]郭慶春,何振芳,李力. 西安市空氣污染指數(shù)的神經(jīng)網(wǎng)絡(luò)預(yù)測模型[J]. 河南科學(xué),2011(07):863-868.
[7]郭慶春,何振芳,寇立群,李力,張小永,孔令軍. BP神經(jīng)網(wǎng)絡(luò)在北京市API預(yù)報(bào)中的應(yīng)用[J]. 環(huán)境工程,2011(04):106-108.
[8]郭慶春,何振芳,李力,袁春瑩,寇立群. 人工神經(jīng)網(wǎng)絡(luò)在API預(yù)報(bào)中的應(yīng)用[J]. 陜西農(nóng)業(yè)科學(xué),2011(02):124-126.
[責(zé)任編輯 王愛萍]
Application of Artificial Neural Network in Atmosphere Pollution Forecast
Guo Qingchun, Yang Xu, Kou Liqun
(Shaanxi Radio & TV University, Xi'an 710119)
.Forecasting the level of air pollution has great significance. Artificial neural network forecast method is widely introduced in air pollution prediction. By choosing different algorithms, setting learning rate,and dynamic coefficient parameters, the precision of the model based on artificial neural network is improved,and the average relative errors of air pollution between forecasting and the monitoring are small therefore.Artificial neural network model is a simple and effective algorithm.
artificial neural network; atmospheric pollution; algorithm
2015-09-14
1.郭慶春(1979— ),山東省聊城市人,陜西廣播電視大學(xué)教務(wù)處講師,大氣污染預(yù)測在讀博士研究生。2.楊旭(1989— ),女,陜西省安康市人,陜西廣播電視大學(xué)財(cái)務(wù)處助教,大學(xué)本科。3.寇立群(1966— ),陜西省禮泉縣人,陜西廣播電視大學(xué)工程管理系副處長,副教授。
本文為陜西廣播電視大學(xué) 2013-2014年度科研課題“基于神經(jīng)網(wǎng)絡(luò)的大氣污染預(yù)測”(課題編號:13D-08-B01)、“陜西電大課程教學(xué)資源建設(shè)研究” ( 課題編號:13DJ-A12)、2015年陜西省教育廳科研計(jì)劃項(xiàng)目 “陜西省主要城市大氣污染預(yù)報(bào)模型研究”(項(xiàng)目編號:15JK1058,項(xiàng)目負(fù)責(zé)人:郭慶春)階段性成果之一。
P49
A
1008-4649(2015)04-0092-03