曹然
5月11日,在俄羅斯克拉斯諾戈?duì)査箍说囊惶幷褂[中心,用于應(yīng)對(duì)新冠疫情的臨時(shí)醫(yī)院正在施工中。圖/衛(wèi)星社
在有關(guān)新冠病毒的科學(xué)、政策和公眾討論中,流行病學(xué)模型是穿梭其中的幽靈。政府依據(jù)模型制定防疫政策,預(yù)判疫情走向;學(xué)者們通過(guò)模型分析病毒的傳播能力,評(píng)估防疫體系的得失;社會(huì)輿論常被模型指向的龐大感染和死亡數(shù)據(jù)震驚,又在不同模型得出的不同結(jié)論前不知所措。
2020年4月,聯(lián)合國(guó)非洲經(jīng)濟(jì)委員會(huì)在報(bào)告中援引英國(guó)帝國(guó)理工學(xué)院的模型稱,非洲最多可能有300萬(wàn)人死于新冠病毒,一百多位非洲知識(shí)分子隨后聯(lián)署呼吁更有效的防疫政策。
事實(shí)上,英國(guó)帝國(guó)理工模型預(yù)設(shè)的是非洲沒有采取有效社交隔離等防疫措施情況下的疫情走勢(shì),其估算的死亡數(shù)據(jù)最高值是300萬(wàn),最低值則是30萬(wàn)。但在數(shù)據(jù)發(fā)布時(shí),非洲已有二十多個(gè)國(guó)家實(shí)施了全國(guó)性的封鎖隔離措施。
“采取了積極的防疫措施后,結(jié)果其實(shí)會(huì)很不一樣?!蹦戏墙鹕酱髮W(xué)醫(yī)學(xué)院公衛(wèi)專家莎拉·尼沃德對(duì)《中國(guó)新聞周刊》表示。倫敦衛(wèi)生和熱帶病醫(yī)學(xué)院當(dāng)月中旬發(fā)布的另一個(gè)模型指出,非洲國(guó)家的積極防疫措施最多可以將死亡率降低75%。
對(duì)于流行病學(xué)、生物統(tǒng)計(jì)等領(lǐng)域的專業(yè)人士而言,模型數(shù)據(jù)背后的研究目的、建模方式、參數(shù)設(shè)定及完整結(jié)論要比看上去讓人震驚的單個(gè)數(shù)字更值得關(guān)注。但政府和公眾對(duì)于這些模型的數(shù)據(jù)卻時(shí)而過(guò)度輕信,時(shí)而又棄之如敝履。
一直追蹤非洲防疫的尼沃德說(shuō),現(xiàn)在她已經(jīng)不再關(guān)注任何模型數(shù)據(jù)了。哈佛大學(xué)流行病學(xué)助理教授約納塔·格拉德則對(duì)《中國(guó)新聞周刊》強(qiáng)調(diào):“我們要一直記住一點(diǎn),模型從來(lái)不是像天氣預(yù)報(bào)那樣用來(lái)準(zhǔn)確預(yù)測(cè)疫情的,它的價(jià)值在于提供決策參考?!?h3>哪種模型更有效?
新冠疫情在武漢蔓延之初,那不勒斯腓特烈二世大學(xué)數(shù)學(xué)教授西亞圖斯等一批歐洲學(xué)者就開始通過(guò)流行病學(xué)模型著手研究這個(gè)全新的傳染病,并在SCI期刊發(fā)表了多篇同行評(píng)議論文。對(duì)他們來(lái)說(shuō),這只是日常的科研工作,就像之前建立關(guān)于埃博拉疫情和MERS疫情的流行病學(xué)模型一樣。
得益于流行病學(xué)模型最近一百余年的發(fā)展,在新冠病毒剛出現(xiàn)且人們對(duì)其生物學(xué)特征一無(wú)所知時(shí),相關(guān)的流行病學(xué)模型就可以建立了。這是因?yàn)榱餍胁〉淖匀皇访艽a已經(jīng)被破解,即健康的人(易感人群)感染病毒,出現(xiàn)臨床癥狀,最終康復(fù)或死亡的過(guò)程。
健康、感染、康復(fù)人群的此消彼長(zhǎng),決定著病毒周期性的流行和消退?;谶@一規(guī)律,“在疫情發(fā)生之初建立的模型,雖然在數(shù)據(jù)預(yù)測(cè)上難以準(zhǔn)確,但卻能提供可靠的趨勢(shì)性分析?!蔽鱽唸D斯對(duì)《中國(guó)新聞周刊》說(shuō)。
西亞圖斯采用的是最經(jīng)典的SIR系列模型。這種模型將人群分為易感人群S、感染者I和康復(fù)者R,將對(duì)病毒傳播能力和防疫政策的假設(shè)體現(xiàn)于人群從一個(gè)組別向另一個(gè)組別轉(zhuǎn)移的數(shù)學(xué)規(guī)則中,從而計(jì)算病毒的感染率和峰值區(qū)間。目前,在與美國(guó)疾病控制與預(yù)防中心(CDC)合作監(jiān)測(cè)新冠疫情的12個(gè)模型中,5個(gè)都采用了SIR系列模型。
“SIR系列模型比較簡(jiǎn)單,被證明能夠在短期內(nèi)充分模擬病毒在一般人群中的流行動(dòng)態(tài)?!蔽鱽唸D斯介紹,相比于其他類型的模型,這類模型最大的優(yōu)勢(shì)是基本變量只有三到四個(gè),“需要校準(zhǔn)的參數(shù)數(shù)量最少,這一點(diǎn),在數(shù)據(jù)不多的疫情第一階段非常重要?!?/p>
西亞圖斯提到的其他模型主要是統(tǒng)計(jì)學(xué)模型。其中,曾被白宮援引的西雅圖華盛頓大學(xué)衛(wèi)生計(jì)量和評(píng)估研究所(IHME)的模型最為有名,也最受爭(zhēng)議。該團(tuán)隊(duì)研究了新冠病毒在世界各地暴發(fā)的數(shù)據(jù),以世界各地的既有數(shù)據(jù)和美國(guó)人口、疾病傳播及防疫政策的假設(shè)為基礎(chǔ),推斷美國(guó)及各州疫情可能的曲線。
IHME認(rèn)為,這樣的統(tǒng)計(jì)學(xué)模型更為準(zhǔn)確,因?yàn)樗爸饕蕾囉谡鎸?shí)世界的數(shù)據(jù),而不是關(guān)于疾病如何傳播的假設(shè)”。SIR模型的使用者確實(shí)因?qū)π鹿诓《咎匦缘募僭O(shè)而做出過(guò)誤判。被英國(guó)政府援引“60%的人可能感染”的帝國(guó)理工學(xué)院模型,就將新冠病毒放進(jìn)了一個(gè)為流感設(shè)計(jì)的SIR模型中。
美國(guó)疫情在4月進(jìn)入暴發(fā)期后,IHME對(duì)各州峰值和病床壓力的預(yù)估也多次出現(xiàn)失誤。IHME團(tuán)隊(duì)承認(rèn)難以預(yù)估“模型的不確定性”,且這種不確定性時(shí)而是高估,時(shí)而是低估。
一些專家指出,這與統(tǒng)計(jì)學(xué)模型對(duì)“真實(shí)數(shù)據(jù)”的依賴有關(guān)。疫情暴發(fā)之初,各大模型的數(shù)據(jù)主要來(lái)自中國(guó),但當(dāng)時(shí)中國(guó)的數(shù)據(jù)并未統(tǒng)計(jì)無(wú)癥狀感染者,因此關(guān)于確診病例數(shù)和其他數(shù)據(jù)的比例不一定能反映病毒的真實(shí)傳播能力。
“新冠病毒流行初期,感染、死亡等數(shù)據(jù)常常受到檢測(cè)不足、檢測(cè)不一致、報(bào)告延誤、記錄不全等因素的限制。”倫敦衛(wèi)生和熱帶病醫(yī)學(xué)院醫(yī)療數(shù)據(jù)專家尼古拉斯·朱厄爾在一篇分析新冠模型得失的論文指出。相比于有自己的邏輯、基礎(chǔ)變量較少的流行病學(xué)模型,統(tǒng)計(jì)學(xué)模型受前期數(shù)據(jù)不足的影響更為嚴(yán)重。
2020年5月4日,在進(jìn)行了大規(guī)模修正后,IHME模型重新上線。新模型采用了混合模式,結(jié)合了統(tǒng)計(jì)建模方法和疾病傳播方法,利用兩類模型的優(yōu)勢(shì),將疾病傳播模型的結(jié)果與統(tǒng)計(jì)模型的結(jié)果進(jìn)行對(duì)照。
在IHME調(diào)整其統(tǒng)計(jì)學(xué)模型的同時(shí),SIR模型的建模者之間也出現(xiàn)了爭(zhēng)論。因?yàn)樽罨A(chǔ)的SIR模型僅設(shè)有易感人群、感染者和康復(fù)者三個(gè)基本變量,難以反映新冠病毒潛伏期的傳播,也拙于應(yīng)付學(xué)者對(duì)病死率的關(guān)切,有學(xué)者提出加入處于潛伏期的暴露者E,采用SEIR模型。西亞圖斯等學(xué)者則將病亡者D作為基本變量,發(fā)展出SIRD模型。對(duì)此,朱厄爾評(píng)論稱,增加一些從流行病學(xué)角度觀察到的、反映傳染病傳播特點(diǎn)的基本變量,有助于更好地分析新冠疫情。
不過(guò),《自然》雜志子刊《自然醫(yī)學(xué)》4月22日刊登的意大利特倫托大學(xué)教授朱利亞·喬亞努團(tuán)隊(duì)的論文,卻將SIR模型的復(fù)雜化推向了高峰。該論文基于新冠病毒前期研究的成果,將代表病毒傳播不同階段的八種人群全部列為基本變量,建立SIDARTHE模型。這八個(gè)基本變量分別是易感人群(S)、無(wú)癥狀感染者(I)、無(wú)癥狀確診者(D)、有癥狀感染者(A)、有癥狀確診者(R)、重癥者(T)和已治愈者(H)和病亡者(E)。
“SIDARTHE模型確實(shí)比其他模型更復(fù)雜、更全面,因?yàn)樗哪繕?biāo)不僅僅是預(yù)測(cè)疫情走向?!眴虂喤瑢?duì)《中國(guó)新聞周刊》解釋稱,這一模型的主要目的是為決策者提供一個(gè)有用的工具,有助于比較不同的防疫措施及它們的組合使用對(duì)疫情走向的不同影響。
但在很多學(xué)者看來(lái),這卻不是一個(gè)好的模型。西亞圖斯對(duì)《中國(guó)新聞周刊》表示,過(guò)于復(fù)雜的模型會(huì)遭遇“維度詛咒”,即難以在一個(gè)模型中校準(zhǔn)太多的參數(shù)。朱厄爾也指出,如果復(fù)雜的模型在運(yùn)算中遺漏關(guān)鍵數(shù)據(jù),那么它們可能比簡(jiǎn)單的模型更不可靠,“微小的錯(cuò)誤將導(dǎo)致更大的災(zāi)難”。
朱厄爾還指出,“復(fù)雜的模型也會(huì)讓人產(chǎn)生錯(cuò)覺,更難發(fā)現(xiàn)關(guān)鍵的疏漏?!?/p>
面對(duì)質(zhì)疑,喬亞努對(duì)《中國(guó)新聞周刊》承認(rèn),過(guò)多的基本參數(shù)確實(shí)使得校準(zhǔn)模型更具挑戰(zhàn)性。但他認(rèn)為,“一旦數(shù)據(jù)合適,復(fù)雜的模型可以提供更準(zhǔn)確的趨勢(shì)預(yù)測(cè)?!?/p>
在約翰·霍普金斯大學(xué)的流行病學(xué)家里弗斯看來(lái),圍繞流行病學(xué)模型的建模方式的爭(zhēng)議,很大程度上緣于人們?cè)谝咔楸┌l(fā)之初并不知道怎樣的流行病學(xué)或統(tǒng)計(jì)學(xué)模型可能是更有效的,也不知道應(yīng)當(dāng)如何改進(jìn)SIR這樣的經(jīng)典模型。
2020年4月,牛津大學(xué)教授古塔普?qǐng)F(tuán)隊(duì)用血清調(diào)查數(shù)據(jù)推翻了自己此前的模型結(jié)論。
3月24日,該團(tuán)隊(duì)曾以假設(shè)新冠病毒感染者中只有0.1%到1%的人需要入院治療為前提,運(yùn)用SIR模型分析英國(guó)和意大利兩國(guó)的重癥和死亡病例數(shù)。當(dāng)時(shí)的模型還預(yù)測(cè)稱,截至3月19日,英國(guó)可能有36%到68%的民眾感染新冠病毒,而意大利到3月6日可能有60%到80%的民眾感染。一個(gè)月后的血清調(diào)查結(jié)果則顯示,英國(guó)和意大利的新冠病毒整體感染比例或都低于10%。
莎拉·尼沃德對(duì)《中國(guó)新聞周刊》說(shuō),古塔普?qǐng)F(tuán)隊(duì)出現(xiàn)的問(wèn)題具有一定的典型性。“在急于發(fā)表預(yù)測(cè)結(jié)果的背景下,許多模型對(duì)關(guān)鍵數(shù)據(jù)的假設(shè)都缺乏嚴(yán)謹(jǐn)性。”和古塔普?qǐng)F(tuán)隊(duì)發(fā)布的論文一樣,研究者們很少說(shuō)明采取這些假設(shè)的原因。
模型本質(zhì)上是一組數(shù)學(xué)公式,任何一個(gè)關(guān)鍵項(xiàng)的輸入值稍有變化,就會(huì)得出非常不同的結(jié)果。而有關(guān)新冠病毒的模型,最初幾乎所有數(shù)值都是不確定的。從病毒本身的生物學(xué)特征,到免疫等人類生物學(xué)特征,再到人群接觸等社會(huì)運(yùn)作方式,以及醫(yī)療體系的承載能力等,都存在很多變量。
“對(duì)病毒大流行的研究,其實(shí)是人類曾經(jīng)嘗試研究的一些最復(fù)雜和最混亂的東西的混合,從人類行為學(xué),到病毒學(xué),再到免疫學(xué)?!崩锔ニ褂纱烁锌溃A(yù)測(cè)新冠疫情是一個(gè)巨大的挑戰(zhàn),即使是最聰明的頭腦也不知道這一切將如何結(jié)束。
以帝國(guó)理工學(xué)院模型對(duì)英國(guó)疫情的估算為例,如果模型中的基本傳染數(shù)值(R0)為2,社會(huì)疏離措施設(shè)置為最強(qiáng),則疫情僅造成數(shù)千人死亡;假設(shè)R0值為2.6且沒有社會(huì)疏離措施,則疫情能造成55萬(wàn)人死亡。這兩個(gè)結(jié)果相差懸殊,后者是前者的百倍還多。
倫敦衛(wèi)生和熱帶病醫(yī)學(xué)院的朱厄爾將這種對(duì)重要參數(shù)的推測(cè)稱為“關(guān)鍵假設(shè)”。病死率和感染率是兩項(xiàng)最困難的“關(guān)鍵假設(shè)”,前者缺乏真實(shí)數(shù)據(jù)的支撐,后者則需面對(duì)捉摸不定的人類行為。
日內(nèi)瓦大學(xué)全球公衛(wèi)研究所所長(zhǎng)安托萬(wàn)·弗拉奧曾對(duì)《中國(guó)新聞周刊》預(yù)測(cè)過(guò)非洲新冠疫情的一個(gè)特征:非洲的人口結(jié)構(gòu)相對(duì)年輕,但并不是說(shuō)中青年人就不會(huì)成為新冠重癥患者。考慮到非洲重癥救治的醫(yī)療條件比較薄弱,理論上非洲中青年人新冠病死率會(huì)遠(yuǎn)高于歐美。
比病死率更難以捉摸的變量是R0值。R0值是指在沒有外力介入且所有人都沒有免疫力的情況下,一個(gè)感染者將病毒傳染給其他人的平均數(shù)。R0值越低,意味著病毒傳播能力越弱。R0值會(huì)隨疫情的周期性變化而改變,研究者則需要通過(guò)計(jì)算接觸率、傳播率、接觸量、傳播時(shí)間等因素,確定新冠病毒的R0值。
平均接觸率是指每個(gè)感染者在一段時(shí)間內(nèi)平均與多少人接觸,而這取決于他們的生活環(huán)境與社交習(xí)慣;每次接觸的傳播率則被專家看作是“在不均衡的變化中”。但新冠病毒并不以“每人幾例”的方式有序傳播,超級(jí)傳播者的出現(xiàn)足以打亂模型的預(yù)測(cè),比如發(fā)生在意大利倫巴第大區(qū)醫(yī)院、韓國(guó)“新天地教會(huì)”教堂、美國(guó)馬薩諸塞州生物學(xué)會(huì)議上的聚集性傳播事件。
4月7日,在南非開普敦,工作人員對(duì)當(dāng)?shù)鼐用耖_展排查工作。圖/路透
像帝國(guó)理工和古塔普?qǐng)F(tuán)隊(duì)這樣的模型,都預(yù)設(shè)病毒以固定的速率在整個(gè)樣本人群中均質(zhì)地傳播,不同癥狀的感染者的傳播能力沒有差異,不同群體被感染的幾率也沒有差異。
此外,當(dāng)一些學(xué)者試圖計(jì)算每次接觸的傳播量和傳播的持續(xù)時(shí)間時(shí),他們還需要病毒生物學(xué)和免疫學(xué)領(lǐng)域研究的支撐。而病毒在傳播者身上存活的時(shí)間、在潛伏期內(nèi)產(chǎn)生傳染性的時(shí)間,很長(zhǎng)一段時(shí)間內(nèi)都眾說(shuō)紛紜。
在估算模型參數(shù)時(shí),最難預(yù)測(cè)的還是人類行為。北卡羅來(lái)納大學(xué)副教授圖費(fèi)克奇指出,一些模型未必是高估了感染比例,而是模型的結(jié)論嚇住了社會(huì)公眾,并引發(fā)了嚴(yán)厲的封鎖隔離措施,直接阻斷了病毒傳播的可能。
對(duì)于專業(yè)人士,模型并不是他們判斷疫情的唯一標(biāo)準(zhǔn)。但對(duì)于政府而言,模型是疫情之初極少數(shù)有科學(xué)依據(jù)的政策參考之一。對(duì)公眾來(lái)說(shuō),模型則更是最好的警示。
喬亞努對(duì)《中國(guó)新聞周刊》表示,所有模型都需要基于本地?cái)?shù)據(jù)進(jìn)行適當(dāng)校準(zhǔn),與傳染率和測(cè)試率相關(guān)的一些關(guān)鍵參數(shù)甚至要在適當(dāng)?shù)臅r(shí)間“瞬間改變”,以反映防疫政策的變化。
如今,美國(guó)北卡羅來(lái)納、伊利諾伊、加利福尼亞等州已經(jīng)開始使用多個(gè)不同的模型作為決策依據(jù),且在防疫政策變動(dòng)后會(huì)確定新的參考模型。一些專家則呼吁建立“新一代模型”,不再只是對(duì)疫情做長(zhǎng)期的、概要性的預(yù)測(cè),而是可以為地方政府的具體防疫措施提供更細(xì)致的參考。
美國(guó)哥倫比亞大學(xué)推出了一個(gè)帶有直觀的交互式地圖的模型,專門預(yù)測(cè)在不同的社會(huì)隔離政策下,美國(guó)哪些縣的醫(yī)療體系在何時(shí)會(huì)不堪重負(fù)。不過(guò),該項(xiàng)目也飽受數(shù)據(jù)缺乏、很多變量難以假設(shè)的困擾。
針對(duì)亞非拉地區(qū)的模型,能獲得的數(shù)據(jù)比歐美國(guó)家要少得多。尼沃德對(duì)《中國(guó)新聞周刊》指出,為保證有關(guān)非洲的模型結(jié)論有效,目前至少需要四個(gè)方面的真實(shí)材料:年齡分布和健康狀況的人口學(xué)統(tǒng)計(jì)資料,國(guó)家的檢測(cè)追蹤能力,醫(yī)療衛(wèi)生資源的基本數(shù)據(jù),以及政府采取的社會(huì)干預(yù)政策。