陳 璐,朱大明
(昆明理工大學(xué)國土資源工程學(xué)院,云南昆明 650093)
鼠疫是一種人畜共患的傳染性疾病,其病原體為鼠疫桿菌(Yersiniapestis),主要宿主為嚙齒類動物,傳播媒介為跳蚤[1-3]。作為長期穩(wěn)定存在的自然疫源性疾病,實踐證明,鼠疫只能控制,無法根除。在自然疫源地內(nèi),宿主種群密度一旦恢復(fù),在特定環(huán)境下鼠疫可能繼續(xù)流行,甚至蔓延到人群中。近年來,世界人口飛速增長、城市面積加速擴張,使得人類對鼠疫自然疫源地的侵?jǐn)_和破壞不斷加劇,人類與鼠疫動物宿主的接觸愈發(fā)頻繁。作為威脅世界人類生命健康的第四大傳染性疾病,鼠疫已成為威脅人類生命健康的巨大隱患。
目前人們對鼠疫時空傳播規(guī)律仍缺乏充分認(rèn)識,為更好地控制與預(yù)防鼠疫的流行,空間流行病學(xué)通過融合時空統(tǒng)計分析方法、傳統(tǒng)統(tǒng)計回歸模型、傳染病動力學(xué)模型、生態(tài)位模型等,在鼠疫傳播機制探索、危險因素識別、疫情發(fā)生與流行預(yù)測、時空風(fēng)險制圖等研究中的應(yīng)用越來越廣泛,有效促進(jìn)了鼠疫防控與監(jiān)測預(yù)警工作的開展。
作為一種大規(guī)模傳染病,世界歷史上曾發(fā)生過三次鼠疫大流行,均給人類與動物群體帶來巨大災(zāi)難,甚至改變了人類的社會結(jié)構(gòu)[4-5]。20 世紀(jì)50 年代,鼠疫在我國得到了有效控制,90 年代人間鼠疫在世界范圍內(nèi)盛行,流行范圍超過25 個國家,疫源地遍布亞、非、美58 個國家和地區(qū)[6],我國的人間鼠疫病例也顯著上升。2017 年以來,非洲的馬達(dá)加斯加,中亞的印度、緬甸、哈薩克斯坦,北亞的蒙古,我國的云南、四川和內(nèi)蒙古都曾出現(xiàn)散發(fā)的人間鼠疫病例,但未造成大規(guī)模的鼠疫流行,此后全球鼠疫進(jìn)入新的靜息期[7-8]。10 月26 日,中國云南勐海縣發(fā)現(xiàn)兩例腺鼠疫病例,昭示著國內(nèi)鼠疫有復(fù)蘇跡象。
鼠疫是我國嚴(yán)重危險人類健康安全與社會發(fā)展的甲類烈性傳染病之一[9],我國鼠疫防控以監(jiān)測為主。自20 世紀(jì)80 年代起,通過建立全國范圍的縣級疫情監(jiān)控網(wǎng)和系統(tǒng)對全國疫點進(jìn)行定期監(jiān)測,主要工作包括:記錄當(dāng)?shù)厝碎g疫情和動物疫情發(fā)病情況的人間鼠疫疫情監(jiān)測;采集當(dāng)?shù)貒X動物和跳蚤標(biāo)本進(jìn)行血清分型、細(xì)菌和生物分型及毒力基因檢測的動物間疫情監(jiān)測[10-12]。
空間流行病學(xué)(Spatial Epidemiolopy)是健康地理學(xué)的一個分支,其研究對象為環(huán)境地理和人類疾病,內(nèi)容涵蓋人類疾病的時空分布和影響因素,涉及的數(shù)據(jù)包含時間、空間和屬性等多維信息??臻g流行病學(xué)融合了信息技術(shù)、計算機技術(shù)、3S 技術(shù)等,同時隨著信息理論與景觀生態(tài)學(xué)理論等基礎(chǔ)理論的不斷發(fā)展,為未來的流行病研究打下了良好基礎(chǔ)。鼠疫流行具有區(qū)域性、季節(jié)性和周期波動性等特征,為空間流行病學(xué)在鼠疫防治中的應(yīng)用提供了前提條件[3],其中對于大區(qū)域尺度的研究以遙感影像數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù)支撐。GIS 技術(shù)的引入則通過地圖直觀展示疾病的空間分布情況,實時、動態(tài)地顯示疾病的時空變化特征;對疾病分布進(jìn)行可視化展示,結(jié)合回歸統(tǒng)計和空間分析技術(shù)研究疾病病因及各種影響因素,分析疾病的空間聚集性,探索流行病生態(tài)系統(tǒng)的分布格局及演化過程[13-14]。
空間流行病學(xué)在鼠疫防控預(yù)警中的應(yīng)用主要包括以下3 方面內(nèi)容:①基于計算機仿真技術(shù)與回歸統(tǒng)計方法的鼠疫傳播機制探索;②基于時序分析與GIS 空間分析方法的潛在危險因素識別及疫情預(yù)測;③基于遙感信息處理與貝葉斯統(tǒng)計的鼠疫風(fēng)險探測及預(yù)測。
傳染病動力學(xué)模型是一種根據(jù)種群增長特性和傳染病在種群內(nèi)的傳播機制與疾病風(fēng)險因素而建立,以反映傳染病傳播動力學(xué)特征的數(shù)學(xué)模型。該模型主要基于計算機仿真技術(shù)和模型預(yù)測方法,定量模擬與分析傳染病的傳播途徑、流行動態(tài)及重要風(fēng)險因素。
鼠疫傳染病動力學(xué)模型的構(gòu)建最早可追溯到Kermack等[15-16]對1665-1666 年倫敦黑死病流行規(guī)律研究中的SIR(Susceptible-Infected-Recovered)模型和SIS(Susceptible-Infected-Susceptible)模型,同時提出的決定傳染病流行是否發(fā)生的“閾值理論”奠定了后續(xù)傳染病傳播動力學(xué)研究的理論基礎(chǔ)。此后,Samia 等[17]構(gòu)建了巴基斯坦地區(qū)完整的跳蚤—野生動物—人類—鼠疫動力學(xué)模型,該模型包含了嚙齒動物增長率模型、跳蚤負(fù)擔(dān)模型、季節(jié)性野生動物疫源地模型和人間鼠疫模型;Dean 等[18]建立了人類傳染性—媒介寄生蚤的SIR 模型,將該模型與肺鼠疫和鼠蚤傳播模型進(jìn)行比較分析,并利用貝葉斯估計方法對第二次鼠疫大流行期間動物鼠疫每次暴發(fā)過程中的重要參數(shù)——基本繁殖數(shù)進(jìn)行了預(yù)估;White 等[19]為研究第一次鼠疫大流行期間肺鼠疫的傳播機制,通過專家經(jīng)驗假設(shè)初始化條件和估計參數(shù),構(gòu)建了肺鼠疫SIR 與SEIR 模型、腺鼠疫SIR 與SEIR 模型、腺鼠疫/肺鼠疫SEIR 模型等7 個模型;Sichone等[20]使用系統(tǒng)動力學(xué)建模軟件Vensim 對2015 年Nyimba 鼠疫發(fā)病模式進(jìn)行仿真建模,利用SEI 模型估計易感人群中單個感染個體在感染期間的平均繼發(fā)感染數(shù)等。
目前基于鼠疫傳染病動力模型的應(yīng)用研究主要集中于國外,眾多學(xué)者通過構(gòu)建預(yù)測模型實現(xiàn)對鼠疫傳播機制的深入挖掘,明確鼠疫歷史流行事件的傳播途徑。模型模擬精度越高,納入模型中的因素則越多,對鼠疫傳播規(guī)律的認(rèn)識程度將極大地影響閾值參數(shù)設(shè)置與因素選取的客觀性和準(zhǔn)確性。采用仿真軟件對鼠疫歷史傳播過程進(jìn)行模擬與模型驗證需要時空數(shù)據(jù)庫的支持,其中涉及計算機圖形處理、數(shù)據(jù)庫、模型仿真等相關(guān)技術(shù)。目前國內(nèi)對鼠疫傳播動力學(xué)機制的探索尚處于空白階段,因此還需作進(jìn)一步研究。
鼠疫作為一種自然疫源性疾病,其潛伏、發(fā)生、傳播及流行均與本地自然疫源地的生態(tài)環(huán)境緊密相連[21]。因此,可通過融合區(qū)域的多源遙感數(shù)據(jù)和地理信息數(shù)據(jù),采用統(tǒng)計回歸和空間分析方法探索分析氣候、環(huán)境、生物等因素與鼠疫之間的相關(guān)關(guān)系,以此預(yù)測某地是否存在鼠疫風(fēng)險及其風(fēng)險指數(shù)。
回歸分析可根據(jù)疾病數(shù)據(jù)的分布規(guī)律,建立疾病數(shù)據(jù)與環(huán)境因子的統(tǒng)計回歸數(shù)學(xué)表達(dá)式,進(jìn)行潛在因素的識別與疾病發(fā)生數(shù)預(yù)測。時間序列分析根據(jù)歷史發(fā)生疾病的時間序列數(shù)據(jù),采用曲線擬合和參數(shù)估計建立數(shù)學(xué)模型,以反映疾病在時間上的傳播規(guī)律。結(jié)合時間序列分析與回歸分析方法,可根據(jù)預(yù)測對象與影響因素之間的相關(guān)性預(yù)測未來鼠疫發(fā)生情況。已有鼠疫預(yù)測研究中較為經(jīng)典的方法有:多元logistic 回歸模型、結(jié)構(gòu)方程模型、零膨脹的廣義相加模型等。在鼠疫疫情預(yù)測及因子分析應(yīng)用方面,可分為以下兩部分:
(1)人間疫情預(yù)測。Sun 等[22]采用零膨脹廣義相加模型研究第三次鼠疫大流行期間全國物種豐富度與每年鼠疫發(fā)生病例數(shù)之間的關(guān)系。首先將整個中國區(qū)域劃分為一度的公里格網(wǎng),并統(tǒng)計格網(wǎng)內(nèi)每年平均人間病例數(shù)和物種豐富度以及環(huán)境變量屬性均值。由于格網(wǎng)內(nèi)人間鼠疫病例數(shù)存在大量零值,分別選擇零膨脹二項分布和零膨脹泊松分布統(tǒng)計模型,研究顯示嚙齒類動物物種多樣性與人間鼠疫病例數(shù)和流行強度均呈正相關(guān)關(guān)系。同時,以歷史氣象數(shù)據(jù)為數(shù)據(jù)源的小波分析作為一種時間序列分析方法,近年來也常被用于探索歷史氣候條件對鼠疫發(fā)生的影響。如Tennant 等[23]采用小波分析確定了在第三次鼠疫大流行期間英屬印度人間鼠疫的傳播是由濕度變化引起的,且疫情發(fā)生前一個月的大氣濕度與當(dāng)前月份鼠疫的發(fā)生呈正相關(guān)關(guān)系。
(2)動物間疫情預(yù)測。錢全[24]應(yīng)用logistic 回歸和靜息二元時間序列分析方法建立鄂托克前旗長爪沙鼠鼠疫預(yù)測模型,研究顯示當(dāng)年秋季平均氣溫與鼠疫流行之間具有較強的相關(guān)性,降水對長爪沙鼠鼠疫流行的影響具有2~3年的年際滯后效應(yīng)。此外,基于系統(tǒng)發(fā)生學(xué)與層次分析理論的結(jié)構(gòu)方程模型的引入,也為區(qū)域疫源地內(nèi)鼠疫的環(huán)境因子探索提供了內(nèi)在動力。如Xu 等[25]利用結(jié)構(gòu)方程模型識別氣候與內(nèi)蒙古沙鼠鼠疫及達(dá)里爾松鼠鼠疫的相關(guān)性,采用自下而上和自上而下的傳播路徑,研究溫度、降水、植被覆蓋度對嚙齒動物—媒介—鼠疫的系統(tǒng)性影響,明確了降水和溫度對當(dāng)?shù)貎煞N宿主動物間疫情的發(fā)生均有積極影響,而植被覆蓋度對當(dāng)?shù)貏游镩g鼠疫發(fā)生的影響存在明顯的種群差異。
綜上所述,在統(tǒng)計回歸中,以鼠疫病例數(shù)為因變量的回歸建模需要考慮鼠疫數(shù)據(jù)的統(tǒng)計學(xué)特征,再選擇合適的數(shù)學(xué)模型。傳統(tǒng)回歸模型往往忽視了微生態(tài)環(huán)境以及時空相關(guān)性和交互性的影響,導(dǎo)致預(yù)測結(jié)果不太符合實際情況,后續(xù)研究需要結(jié)合空間分析方法,加入時間和空間變量。時空地理加權(quán)回歸和時空插值等時空統(tǒng)計分析方法的引入,能更好地解決鼠疫數(shù)據(jù)的時空自相關(guān)問題。同時,建模中考慮到空間分異的影響,對具有分層異質(zhì)性的環(huán)境變量采用如地理探測器Q 統(tǒng)計方法進(jìn)行時空分層,再建立多水平時空模型進(jìn)行因子識別與疫情預(yù)測。
空間流行病學(xué)研究內(nèi)容包括疾病風(fēng)險探測、危險因素識別和聚集性分析。其中,用于鼠疫疫情風(fēng)險探測的空間流行病學(xué)方法包括時空聚集性分析以及生態(tài)位模型與貝葉斯時空模型。
3.3.1 時空聚集性分析
基于時空分析與風(fēng)險制圖技術(shù)的時空聚集性分析是目前空間流行病學(xué)中最常用的時空統(tǒng)計方法之一,旨在識別疾病在時間、空間或時空上分布的聚集趨勢和傾向,幫助找出疾病發(fā)病風(fēng)險較高的地段和時間段,主要識別的疾病有:腎綜合征出血熱[26]、H7N9 禽流感[27]、新冠肺炎[28]等傳染病和慢性疾病。在疾病探測中,該方法主要應(yīng)用于3個方面:時間聚集性探測、空間聚集性探測和時空聚集性探測。
(1)時間聚集性探測。只考慮疾病在時間上的聚集效應(yīng),常用方法有圓形分布法、集中度法與時間序列分析方法。其中,時間序列分析可通過已有的疾病發(fā)病時間規(guī)律預(yù)測未來發(fā)病情況。自回歸滑動平均模型(ARIMA)是一種常用的時間序列方法,該方法采用差分階數(shù)(Gap),通過繪制時間序列的自相關(guān)函數(shù)圖和偏自相關(guān)函數(shù)圖并與標(biāo)準(zhǔn)圖進(jìn)行對比,從而識別疾病的時間滯后效應(yīng)。如Ben-Ari 等[29]采用一種基于時間相似度原理對疫情發(fā)生點進(jìn)行時間序列分組的聚類方法,將中國鼠疫疫源地分為4 個部分和南北兩大類。
(2)空間聚集性探測??煞譃槿挚臻g聚集性和局部空間聚集性探測,前者探測區(qū)域整體聚集程度,后者用于定位聚集區(qū)。其中,空間自相關(guān)法主要根據(jù)空間位置的遠(yuǎn)近度量空間現(xiàn)象或事物的相似及相關(guān)程度。空間聚集性探測主要用于自然鼠疫疫源地劃分和病灶識別。如李海蓉等[30]通過空間聚類分析,按照形成環(huán)境將我國的鼠疫疫源地劃分為3 類;Galanaud 等[31]基于空間自相關(guān)方法和歷史流行病信息,繪制了15 世紀(jì)初期3 種流行病中的鼠疫死亡分布圖。
(3)時空聚集性探測。主要目的在于獲取疾病的高發(fā)期和聚集位置,如Sun 等[32]采用基于機器學(xué)習(xí)的時空聚類方法重構(gòu)了1772-1964 年間中國區(qū)域鼠疫流行的傳播路線,并將中國分為2 個核心區(qū)和13 個聚類,這些研究可為未來鼠疫及其他傳染病防控與決策提供參考。
綜上所述,疾病時空聚集性分析為近年來較為熱門的一個研究方向,可用于探索鼠疫發(fā)生的時空分布模式,包括熱點探測和流行高發(fā)時區(qū)識別。目前在鼠疫風(fēng)險探測研究中,可采用自相關(guān)分析、核密度估計、時空掃描統(tǒng)計等空間分析方法聯(lián)合進(jìn)行分析,利用GIS 技術(shù)和計算機技術(shù)通過可視化地圖進(jìn)行時空展現(xiàn),將進(jìn)一步推動鼠疫時空分布模式信息的表達(dá)與傳播。
3.3.2 生態(tài)位模型
生態(tài)位模型(Ecological Niche Models,ENM)是一種用于預(yù)測生態(tài)風(fēng)險和物種地理分布的模型,已在如腎綜合征出血熱[33]、血吸蟲[34]等傳染病傳播研究中得到了廣泛應(yīng)用。其中,最大熵模型(Maxent)和規(guī)則集遺傳算法(GARP)模型在鼠疫研究中應(yīng)用最為廣泛[35]。Maxent 模型輸入分布數(shù)據(jù)為存在點數(shù)據(jù),基于機器學(xué)習(xí)算法選擇分布點環(huán)境信息熵最小的最優(yōu)擬合模型進(jìn)行物種潛在分布預(yù)測。GARP 模型在Maxent 模型數(shù)據(jù)基礎(chǔ)上還需要增加不存在點,采用預(yù)設(shè)預(yù)測規(guī)則的遺傳算法從所有樣本點提取的環(huán)境特征中選擇具有最優(yōu)規(guī)則集合的組合模型,總結(jié)物種分布生態(tài)需求,以預(yù)測物種潛在分布。
Maxent 模型和GARP 模型在鼠疫監(jiān)測預(yù)警中的主要應(yīng)用包括以下兩方面:
(1)疫源地內(nèi)鼠疫潛在風(fēng)險預(yù)測。Walsh 等[36]利用Maxent 模型預(yù)測2000-2015 年美國西部鼠疫風(fēng)險及重要共生宿主的潛在空間分布時發(fā)現(xiàn),對宿主分布有較大影響的因素為海拔、最干季降水量和最濕季降水量及土地覆蓋率。為提高中國長爪沙鼠疫源地動物間疫情潛在分布的預(yù)測精度,閆東等[37]采用Maxent 和GARP 兩個生態(tài)位模型,模型中只考慮氣候因素對鼠疫的影響,通過比較分析,顯示Maxent 模型預(yù)測精度更高。
(2)宿主和媒介生物物種的適生區(qū)預(yù)測及疫源地識別。如Ben-Ari 等[29]為了確定中國鼠疫可能存在的新自然疫源地,同時采用GARP 和Maxent 兩個生態(tài)位模型進(jìn)行鼠疫適生區(qū)識別,發(fā)現(xiàn)了至少4 個獨立疫源地;閆東等[38]采用Logistic 回歸篩選禿病蚤蒙冀亞種的氣候環(huán)境因素,利用GARP 模型預(yù)測禿病蚤蒙冀亞種的適宜分布區(qū)。
綜上所述,Maxent 模型和GARP 模型對于小樣本鼠疫分布預(yù)測具有極大優(yōu)勢,可適用于大范圍的鼠疫疫源地和宿主/媒介分布預(yù)測,但針對小范圍區(qū)域的預(yù)測精度較低。多源遙感數(shù)據(jù)是生態(tài)位模型主要的數(shù)據(jù)源,未來將融合遙感信息技術(shù)、數(shù)據(jù)庫技術(shù)、計算機圖像處理技術(shù)和GIS 空間分析技術(shù)等,建立歷史鼠疫監(jiān)測數(shù)據(jù)庫及精度更高的多源遙感數(shù)據(jù)庫,采用廣義相加模型(Genneral Additive Model,GAM)、廣義線性模型(Genneral Linear Model,GLM)等基于回歸統(tǒng)計的生態(tài)位模型實現(xiàn)疫情風(fēng)險和物種分布定量預(yù)測。
3.3.3 貝葉斯時空模型
貝葉斯時空模型是一種基于貝葉斯統(tǒng)計的時空回歸模型,可分析疾病的空間效應(yīng)、時間效應(yīng)與時空交互效應(yīng)及其環(huán)境風(fēng)險因素,幫助人們了解疾病的地理分布,并預(yù)測發(fā)病趨勢。目前主流的貝葉斯時空模型有3 種:BYM(Besag,York and Mollie Mode)模型、層次貝葉斯時空模型和FBM(Familiar Bayesian Spatio-temporal Model)模型。BYM 模型可有效解決時空交互和過度離散化等問題;層次貝葉斯時空模型將分級結(jié)構(gòu)納入BYM 模型中,對于多水平結(jié)構(gòu)數(shù)據(jù)具有良好的穩(wěn)定性,但只適用于空間多尺度分析[39];FBM 模型充分考慮了疾病周期性變化和傳播的空間異質(zhì)性,進(jìn)行分區(qū)時間趨勢估計,使得模型更加精準(zhǔn),因此在未來的空間流行病研究中有著廣闊的應(yīng)用前景[40]。
貝葉斯時空模型對于較小區(qū)域范圍的疾病空間分析有著較大優(yōu)勢。近年來,隨著計算機技術(shù)的發(fā)展以及馬爾科夫鏈蒙特卡羅方法(MCMC)的引入,貝葉斯時空方法主要應(yīng)用于癌癥[41]、布魯氏疾?。?2]、手足口?。?3]、瘧疾[44]等空間流行病研究中。張俊輝等[42]在研究北方六省布魯氏菌病的時空分布特征時,從縣區(qū)和地市兩個尺度構(gòu)建層次貝葉斯時空模型,發(fā)現(xiàn)分層多尺度聯(lián)合模型可單獨分析地區(qū)傳染病和慢性疾病,為同類研究提供了一種新的方法作為參考;Sn?ll 等[45]基于宿主—寄生蟲系統(tǒng)的聯(lián)合空間動力學(xué)原理,提出一種適用于黑尾土撥鼠的區(qū)域長期鼠疫動態(tài)和種群動態(tài)研究的分層貝葉斯模型。但目前國內(nèi)仍缺少基于貝葉斯時空模型的鼠疫疫情相關(guān)研究。
綜上所述,鼠疫作為傳染性疾病,其傳播流行在空間和時間單元上具有尺度依賴性。采用分層貝葉斯時空模型可實現(xiàn)多尺度空間的鼠疫疫情探索,研究不同區(qū)域鼠疫相對風(fēng)險的時間變化規(guī)律,同時結(jié)合不同歷史時期的環(huán)境因子數(shù)據(jù)實現(xiàn)對危險因素的識別。貝葉斯統(tǒng)計在我國鼠疫研究中尚處于空白,因此在未來的空間流行學(xué)研究中,采用貝葉斯時空模型對鼠疫流行規(guī)律的時空信息進(jìn)行挖掘具有較高的應(yīng)用價值。
目前,國內(nèi)外學(xué)者針對鼠疫疫情預(yù)測、危險因素識別和風(fēng)險評估等方面已開展了大量工作,但深度仍遠(yuǎn)遠(yuǎn)不夠。我國空間流行病學(xué)在鼠疫監(jiān)測中的應(yīng)用多集中于疾病風(fēng)險制圖領(lǐng)域,在鼠疫時空傳播方面的研究尚處于初級階段。分層貝葉斯時空模型、結(jié)合時序分析的傳染病動力學(xué)模型和時空聚集性分析方法等在鼠疫時空分析中的應(yīng)用將是未來鼠疫預(yù)測預(yù)警研究的主要方向。在應(yīng)用研究方面,至今仍缺乏對中國區(qū)域歷史鼠疫大流行事件的傳染性動力學(xué)探究,主要原因在于我國鼠疫宿主媒介種類多,傳播機理十分復(fù)雜,先驗參數(shù)難以確定。貝葉斯估計方法等方法的應(yīng)用將對動力學(xué)參數(shù)估計具有一定啟發(fā)作用。未來可通過結(jié)合多源遙感數(shù)據(jù)和空間流行病學(xué)方法研究鼠疫的環(huán)境風(fēng)險因素,建立時空傳播與分析模型,將能更深入地探索鼠疫的時空傳播規(guī)律和發(fā)病機理,對鼠疫自然疫源地內(nèi)的鼠疫疫情防控與決策具有重要意義。