肖 琴, 陸鈺婷
(上海應(yīng)用技術(shù)大學(xué) 理學(xué)院, 上海 201418)
近年來(lái),隨著我國(guó)經(jīng)濟(jì)迅速發(fā)展、工業(yè)化進(jìn)程加快、人口增長(zhǎng)使能源消耗過(guò)快導(dǎo)致大氣污染尤為嚴(yán)重。我國(guó)空氣質(zhì)量呈現(xiàn)出下降的趨勢(shì),霧霾天氣頻繁出現(xiàn),而霧霾中的主要成分是大氣中顆粒物即 PM2.5,其濃度大大的超出了國(guó)家規(guī)定的范圍??諝馕廴咀钪饕奈:?lái)自于 PM2.5,它對(duì)人們的呼吸系統(tǒng)、神經(jīng)系統(tǒng)和皮膚組織等造成嚴(yán)重傷害[1],因此,PM2.5濃度指標(biāo)是環(huán)境空氣質(zhì)量的一項(xiàng)重要檢測(cè)指標(biāo)。如何有效地控制大氣污染是一個(gè)亟待解決的問(wèn)題。
值得注意的是,每次重污染都不是個(gè)別城市,而是涵蓋了多個(gè)城市,區(qū)域的空氣污染不僅僅與城市本地的污染有關(guān),還與區(qū)域附近的其他城市的空氣流通習(xí)性即相關(guān)性有關(guān)。空氣污染治理已刻不容緩,需要從分塊等各個(gè)方面[2-3]進(jìn)行研究來(lái)緩解、有效降低全國(guó)的 PM2.5指數(shù)。
PM2.5為極細(xì)顆粒,呼吸道無(wú)法屏蔽,這些細(xì)小的顆粒便在人們毫無(wú)防范的時(shí)候進(jìn)入人體呼吸道與肺部。誘發(fā)鼻炎、咽喉炎、支氣管炎、哮喘等一系列呼吸道疾病。長(zhǎng)期處于這種環(huán)境,進(jìn)入肺部的顆粒物還可能通過(guò)肺泡進(jìn)入血液,誘發(fā)肺癌、心肌缺血、高血壓等一系列的心血管疾病。關(guān)于 PM2.5的分析和整治的研究一直被人們所重視[4]。在國(guó)外,關(guān)于 PM2.5的研究開(kāi)展比較早,PM2.5的源頭分析以及特征譜等方向的研究展開(kāi)的較多[5]。2014年,Elangasinghe等[6]采用人工神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行了分析。我國(guó)的研究起步較晚,起初關(guān)于 PM2.5的統(tǒng)計(jì)數(shù)據(jù)較少且不完善統(tǒng)一。近幾年來(lái),數(shù)據(jù)逐步積累和統(tǒng)一,對(duì)于十分有限的空氣數(shù)據(jù),如何進(jìn)行有效合理的研究具有重要的意義[7]。楊洪斌等[8]對(duì)PM2.5的化學(xué)組成、來(lái)源分析等進(jìn)行了分析。Sun等[9]對(duì)北京冬夏季節(jié)的濃度分析發(fā)現(xiàn)北京冬季濃度較高。于興娜等[10]和宋宇等[11]提出 PM2.5與北京市空氣質(zhì)量能見(jiàn)度之間存在著負(fù)相關(guān)性。蘇福慶等[12]提出了北京空氣污染物具有外來(lái)輸送通道等。
降低 PM2.5指數(shù)首先需要選出主要的污染源城市,降低幾個(gè)嚴(yán)重污染區(qū)域,這樣治理污染能起到舉一反三的效果。如何通過(guò)各城市的 PM2.5指數(shù)找出主要污染源城市區(qū)域呢?本文運(yùn)用復(fù)雜網(wǎng)絡(luò)的方法對(duì)空氣污染地區(qū)做了一些分析。自然界的大部分復(fù)雜系統(tǒng)都可以用復(fù)雜網(wǎng)絡(luò)來(lái)描述。一般的,節(jié)點(diǎn)代表真實(shí)系統(tǒng)中不同的個(gè)體,邊用來(lái)表示個(gè)體間的某種連接。通過(guò)復(fù)雜網(wǎng)絡(luò)的研究和分析結(jié)果能加深對(duì)現(xiàn)實(shí)世界中存在的很多復(fù)雜系統(tǒng)的認(rèn)識(shí)。
最近十幾年來(lái),復(fù)雜網(wǎng)絡(luò)的研究有了快速發(fā)展。對(duì)復(fù)雜網(wǎng)絡(luò)進(jìn)行研究的文章非常多,復(fù)雜網(wǎng)絡(luò)的研究對(duì)象也具有多樣性,復(fù)雜網(wǎng)絡(luò)逐漸成為金融學(xué)、社會(huì)學(xué)、計(jì)算機(jī)科學(xué)、信息科學(xué)等多學(xué)科交叉領(lǐng)域的一個(gè)熱點(diǎn)研究領(lǐng)域[13-20]。但用復(fù)雜網(wǎng)絡(luò)研究空氣質(zhì)量的研究不多,尤其是網(wǎng)絡(luò)模體的研究較少[21]。
王麗[22]以北京市內(nèi)的8個(gè)監(jiān)測(cè)點(diǎn)的空氣質(zhì)量數(shù)據(jù)作為研究對(duì)象,對(duì)空氣質(zhì)量的時(shí)間序列進(jìn)行相空間重構(gòu),構(gòu)建復(fù)雜網(wǎng)絡(luò)。運(yùn)用K-means聚類(lèi)分析法,得到了北京空氣質(zhì)量的3類(lèi)聚類(lèi)結(jié)果。張仲勇等[23]分析了城市環(huán)境中各種因素的作用,對(duì) PM2.5區(qū)域性擴(kuò)散的物理過(guò)程進(jìn)行探索,以復(fù)雜網(wǎng)絡(luò)理論為基礎(chǔ),運(yùn)用最短增廣鏈算法構(gòu)建城市 PM2.5擴(kuò)散的容量網(wǎng)絡(luò)模型揭示西安市 PM2.5的擴(kuò)散途徑。薛安等[24]將161座城市作為網(wǎng)絡(luò)的點(diǎn),以城市間 PM2.5質(zhì)量濃度的相關(guān)性與距離的比值作為各個(gè)邊的權(quán)重,構(gòu)建加權(quán)網(wǎng)絡(luò),采用Girvan Newman算法對(duì)網(wǎng)絡(luò)進(jìn)行劃分,得到不同季節(jié)中國(guó) PM2.5污染的區(qū)域分布情況以及不同季節(jié)污染的區(qū)域性程度對(duì)各個(gè)季節(jié)的區(qū)域進(jìn)行劃分的差異性。
本文對(duì)2017年68個(gè)地區(qū)365天 PM2.5數(shù)據(jù)進(jìn)行了分析,這68個(gè)地區(qū)分別屬于我國(guó)的五大區(qū)域,分別是華東、華西、華南、華中、華北。通過(guò)計(jì)算各地區(qū)之間的相關(guān)性分析得到了復(fù)雜關(guān)系網(wǎng)絡(luò),對(duì)網(wǎng)絡(luò)中的度、社區(qū)、模塊進(jìn)行了分析,得到了主要污染源區(qū)域。這些結(jié)果對(duì)于主要污染城市區(qū)域可以提供治理污染的參考。
本文選取的 PM2.5指數(shù)以中國(guó)的68個(gè)地區(qū)作為研究對(duì)象。將這68個(gè)地區(qū)分成了5類(lèi),分別來(lái)自華東、華北、華中、華南和華西。其中華東地區(qū)有上海、合肥、黃山、蚌埠、南通、南京、蘇州、揚(yáng)州、杭州、寧波、溫州、嘉興、福州、廈門(mén)、泉州、濟(jì)南、青島、煙臺(tái)、南昌、景德鎮(zhèn)20個(gè)地區(qū)(序號(hào)分別為1—20)。華北地區(qū)有[24]北京、天津、錫林郭勒、保定、衡水、邢臺(tái)、邯鄲、唐山、滄州、張家口、承德、秦皇島、包頭、呼和浩特、石家莊、廊坊、太原、運(yùn)城18個(gè)地區(qū)(序號(hào)分別為21—38)。華中地區(qū)有長(zhǎng)沙、張家界、郴州、武漢、荊州、鄭州、開(kāi)封、洛陽(yáng)8個(gè)地區(qū)(序號(hào)分別為39—46)。華南地區(qū)有廣州、中山、深圳、桂林、北海、南寧、???、三亞8個(gè)地區(qū)(序號(hào)分別為47—54)。華西地區(qū)西寧、海南、烏魯木齊、阿克蘇、吐魯番、蘭州、天水、拉薩、成都、綿陽(yáng)、重慶、銀川、昆明、麗江共14個(gè)地區(qū)(序號(hào)分別為55—68)。序列長(zhǎng)度為2017-01-01~2017-12-31所有日期的 PM2.5指數(shù)。數(shù)據(jù)來(lái)源于天氣后報(bào)。華中地區(qū)序列圖,如圖1所示。
圖1 華中地區(qū)序列圖Fig.1 Series of central china
設(shè)各地區(qū)空氣污染數(shù)據(jù)為:
Y={Yij,i=1,2,…,I;j=1,2,…,J}
(1)
式中,Yij表示第i個(gè)地區(qū)第j天的 PM2.5數(shù)據(jù),I=68,J=365。為了具有可比性,每一個(gè)數(shù)據(jù)都除以該天其他地區(qū)數(shù)據(jù)的均方根,作為對(duì)于數(shù)據(jù)的去趨勢(shì)處理:
(2)
計(jì)算各地區(qū)數(shù)據(jù)的Pearson相關(guān)系數(shù)為:
(3)
式中,ρij(Δt)∈[-1,1](從完全負(fù)相關(guān)-1到完全正相關(guān)1)。若ρij(Δt)=0時(shí)空氣數(shù)據(jù)是不相關(guān)。相應(yīng)的相關(guān)系數(shù)矩陣是對(duì)稱(chēng)的。
定義距離矩陣
(4)
式中,dij滿(mǎn)足距離的3個(gè)定義要求并且dij∈[0,1]。dij表示各地區(qū)之間的相似性。相似性越大說(shuō)明距離越小。通過(guò)這個(gè)距離定義來(lái)建立復(fù)雜網(wǎng)絡(luò)。
以各個(gè)地區(qū)作為節(jié)點(diǎn),以地區(qū)之間的距離連邊,可以建立地區(qū)之間的復(fù)雜網(wǎng)絡(luò)[25]。構(gòu)建復(fù)雜網(wǎng)絡(luò)的方法有閾值方法、可見(jiàn)圖等[26]。在本文中,把距離最小的4個(gè)地區(qū)相連即相關(guān)性最大的4個(gè)地區(qū)相連,可以說(shuō)明地區(qū)之間的相關(guān)程度。相關(guān)性愈小,空氣污染的傳播性較小。
1.3.1 節(jié)點(diǎn)度
本文先考察復(fù)雜網(wǎng)絡(luò)性質(zhì)中的節(jié)點(diǎn)度大小。節(jié)點(diǎn)的度指直接與該節(jié)點(diǎn)相連的其他地區(qū)的數(shù)目,用k表示。k越大說(shuō)明它與其他地區(qū)越緊密,相關(guān)性愈大,越有可能是污染較為嚴(yán)重的地區(qū)。由表1可見(jiàn),北京的度最大,其次是蘇州、廊坊、長(zhǎng)沙、天水,然后是天津、石家莊等城市。
表1 在復(fù)雜網(wǎng)絡(luò)中前13個(gè)度較大的地區(qū)
1.3.2 社區(qū)分類(lèi)
復(fù)雜網(wǎng)絡(luò)的異質(zhì)性還表現(xiàn)為社區(qū)結(jié)構(gòu)的存在??梢园丫W(wǎng)絡(luò)分割為多個(gè)集團(tuán)[27-28],在集團(tuán)內(nèi)有很多的邊,內(nèi)部結(jié)構(gòu)致密;而集團(tuán)與集團(tuán)內(nèi)部有很少的連接邊,內(nèi)部結(jié)構(gòu)松散。一般情況下把集團(tuán)稱(chēng)為社區(qū)。社區(qū)的結(jié)構(gòu)形成了層次結(jié)構(gòu)。用Newman-Girvan的劃分方法對(duì)網(wǎng)絡(luò)進(jìn)行社區(qū)劃分,把網(wǎng)絡(luò)分成7個(gè)板塊,此時(shí)對(duì)應(yīng)的Q值最大,為 0.655。圖2所示為復(fù)雜網(wǎng)絡(luò)的社區(qū)分布,表2所示為社區(qū)分類(lèi)情況。
圖2 復(fù)雜網(wǎng)絡(luò)的社區(qū)分布Fig.2 Community distribution of complex network
社區(qū)地區(qū)1郴州(41)2運(yùn)城(38)、鄭州(44)、開(kāi)封(45)、洛陽(yáng)(46)3西寧(55)、烏魯木齊(57)、阿克蘇(58)、吐魯番(59)、蘭州(60)、天水(61)、拉薩(62)4黃山(3)、南昌(19)、景德鎮(zhèn)(20)、長(zhǎng)沙(39)、張家界(40)、武漢(42)、荊州(43)、桂林(50)、成都(63)、綿陽(yáng)(64)、重慶(65)5上海(1)、合肥(2)、蚌埠(4)、南通(5)、南京(6)、蘇州(7)、揚(yáng)州(8)、杭州(9)、寧波(10)、嘉興(12)、青島(17)6溫州(11)、福州(13)、廈門(mén)(14)、泉州(15)、廣州(47)、中山(48)、深圳(49)、北海(51)、南寧(52)、???53)、三亞(54)、海南(56)、昆明(67)、麗江(68)7濟(jì)南(16)、煙臺(tái)(18)、北京(21)、天津(22)、錫林郭勒(23)、保定(24)、衡水(25)、邢臺(tái)(26)、邯鄲(27)、唐山(28)、滄州(29)、張家口(30)、承德(31)、秦皇島(32)、包頭(33)、呼和浩特(34)、石家莊(35)、廊坊(36)、太原(37)、銀川(66)
由圖2和表2可見(jiàn),這7個(gè)社區(qū)的分布情況,其中加粗的為度較大的地區(qū)。社區(qū)1為華中地區(qū), 社區(qū)2為華北、華中地區(qū),社區(qū)3全為華西地區(qū),社區(qū)4為華東、華中、華南、華西地區(qū),社區(qū)5全為華東地區(qū),社區(qū)6為華東、華南、華西地區(qū),社區(qū)7為華東、華北、華西地區(qū)??梢钥闯觯諝馕廴九c地域還是有點(diǎn)關(guān)系的。
為了揭示復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu)原理, 引入了“模體”的概念[29-32]。模體是構(gòu)建網(wǎng)絡(luò)的基本模式,在網(wǎng)絡(luò)中反復(fù)出現(xiàn)的頻率遠(yuǎn)遠(yuǎn)高于其在隨機(jī)網(wǎng)絡(luò)中出現(xiàn)的概率。實(shí)際上,模體就是網(wǎng)絡(luò)中大量出現(xiàn)的具有相同結(jié)構(gòu)的小規(guī)模子圖。這種子圖從局部層次刻畫(huà)了網(wǎng)絡(luò)內(nèi)部相互連接的特定模式。Shenorr 等[33]在生物網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、食物鏈和技術(shù)網(wǎng)絡(luò)等中找到了各種模體,開(kāi)展了對(duì)復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)原理的研究。圖3所示為15種常見(jiàn)的子圖,以3節(jié)點(diǎn)為例,就有13種常見(jiàn)模體。
圖3 15種主要的有向子圖Fig.3 The fifteen major directed sub-graphs
使用文獻(xiàn)[34]中的方法在五大地區(qū)的復(fù)雜網(wǎng)絡(luò)的7個(gè)社區(qū)內(nèi)部尋找3節(jié)點(diǎn)的13種子圖。尤其是度數(shù)較大的地區(qū)的子圖,是比較受關(guān)注的。在這13種子圖中,以圖4和圖13分布較多。以圖4為例說(shuō)明。找出了與表1相對(duì)應(yīng)的子圖分布。
圖4 社區(qū)3和社區(qū)4的子圖M4的分布Fig.4 The distribution of sub-graphs M4 of community 3 and 4
圖5 社區(qū)5、6、7的子圖M4的分布Fig.5 The distribution of sub-graphs M4 of community 5,6 and 7
選取了全國(guó)五大地區(qū)的68個(gè)城市,用相關(guān)性大小構(gòu)建了空氣污染的復(fù)雜網(wǎng)絡(luò),并研究了對(duì)應(yīng)網(wǎng)絡(luò)的異質(zhì)性質(zhì)。首先分析了節(jié)點(diǎn)度的大小,找出了13個(gè)度較大的地區(qū),分別是北京、蘇州、廊坊、長(zhǎng)沙、天水、天津、唐山、張家口、石家莊、張家界、中山、西寧、蘭州。這些是屬于空氣污染相對(duì)嚴(yán)重的區(qū)域。
然后對(duì)建立的網(wǎng)絡(luò)進(jìn)行了社區(qū)劃分,當(dāng)n=7時(shí),Q值最大。將這68個(gè)地區(qū)劃分為7個(gè)社區(qū)。這7個(gè)社區(qū)內(nèi)的區(qū)域并不完全是按照華東、華北等區(qū)域進(jìn)行劃分的。比如社區(qū)1為華中地區(qū),社區(qū)3全為華西地區(qū),社區(qū)5全為華東地區(qū)。有些社區(qū)是幾個(gè)地區(qū)的,如社區(qū)2為華北、華中地區(qū),社區(qū)4為華東、華中、華南和華西地區(qū),社區(qū)6為華東、華南和華西地區(qū),社區(qū)7為華東、華北和華西地區(qū)。
最后使用文獻(xiàn)的模體分類(lèi)方法對(duì)不同社區(qū)進(jìn)行了分析。發(fā)現(xiàn)其中M4和M13較為普遍。以M4子模體為例,對(duì)其中度較大的地區(qū)即社區(qū)3~7進(jìn)行了尋求。在分析過(guò)程中,發(fā)現(xiàn)這些污染較為嚴(yán)重的地區(qū)的子模體也出現(xiàn)了群聚現(xiàn)象。
表3所示為模體的群聚現(xiàn)象,其中黑體部分是連接較多的區(qū)域,說(shuō)明這些城市的空氣污染是有聯(lián)系的??諝馕廴局笖?shù)的變化按群聚現(xiàn)象進(jìn)行變化。在治理空氣污染的時(shí)候,應(yīng)該考慮一下這種群聚現(xiàn)象??梢苑乐怪卫砹艘粋€(gè)地區(qū),空氣污染又從相關(guān)別的地區(qū)轉(zhuǎn)來(lái),空氣污染治理效果不明顯的現(xiàn)象出現(xiàn)。比如北京空氣污染的控制和治理的過(guò)程中,如果能把這些群聚地區(qū)一起進(jìn)行治理,那么治理的效果應(yīng)該比單獨(dú)治理北京的效果更好。如果要把空氣污染一起治理好,需要大家共同的努力。
表3子模體M4在各社區(qū)的群聚現(xiàn)象
Tab.3Theclusteringphenomenonofsub-graphsM4indifferentcommunities
社區(qū)地區(qū)3西寧(55)、吐魯番(59)、蘭州(60)、天水(61)、拉薩(62)4黃山(3)、南昌(19)、長(zhǎng)沙(39)、張家界(40)、武漢(42)、荊州(43)、桂林(50)、成都(63)、重慶(65)5上海(1)、蚌埠(4)、南通(5)、南京(6)、蘇州(7)、揚(yáng)州(8)、寧波(10)、嘉興(12)6兩個(gè)群聚:福州(13)、廈門(mén)(14)、泉州(15)、麗江(68);中山(48)、深圳(49)、北海(51)、南寧(52)、???53)、三亞(54)7三個(gè)群聚:北京(21)、天津(22)、唐山(28)、秦皇島(32)、廊坊(36);衡水(25)、邢臺(tái)(26)、邯鄲(27)、石家莊(35);北京(21)、錫林郭勒(23)、滄州(29)、張家口(30)、承德(31)、包頭(33)、呼和浩特(34);
本文使用復(fù)雜網(wǎng)絡(luò)的方法對(duì)68個(gè)不同地區(qū)進(jìn)行了分析,得到了空氣污染城市之間關(guān)系的相關(guān)性網(wǎng)絡(luò)。分析了對(duì)應(yīng)網(wǎng)絡(luò)的性質(zhì),包括節(jié)點(diǎn)度、社區(qū)結(jié)構(gòu)、模體。在現(xiàn)實(shí)生活中,空氣污染現(xiàn)象并不是一個(gè)城市單獨(dú)出現(xiàn)的現(xiàn)象,而是大部分地區(qū)一起出現(xiàn)的現(xiàn)象,同時(shí)由于空氣的流動(dòng)性,對(duì)于分析空氣污染問(wèn)題具有一定的復(fù)雜性。通過(guò)對(duì)網(wǎng)絡(luò)的分析,發(fā)現(xiàn)了城市的群聚現(xiàn)象,得出空氣污染的治理需要把相關(guān)城市一起治理,才能更快的達(dá)到立竿見(jiàn)影的效果。