麻策
南方周末發(fā)表的《買票都實(shí)名制了,為何還借媒體找密切接觸者》引起了我極大的好奇和困惑。文章報(bào)道稱:截至1月28日晚,全國(guó)至少有117趟火車、35架航班和3條地鐵線路正在(通過(guò)網(wǎng)絡(luò)等媒體)緊急尋找確診患者的同行乘客,這是“因?yàn)閷?shí)名制找人要太多的手續(xù)”。為此,2020年1月27日,幾位程序員還迅速研發(fā)了“2019-nCoV新型肺炎確診患者相同行程查詢工具”。
但是,這種原始的網(wǎng)絡(luò)找人方式顯然仍易產(chǎn)生漏網(wǎng)之魚,因?yàn)橐咔榉浅V畷r(shí)網(wǎng)絡(luò)信息(包括謠言)太多,即使有人看到了也可能基于各種原因而不上報(bào)。我自己也沒(méi)有想到,浙江的杭州和溫州會(huì)分別由于湖北人員空降和湖北返工密集原因,突然間成為新的重點(diǎn)防疫區(qū)所在。
圖1 丁香醫(yī)生全國(guó)疫情新增趨勢(shì)圖(截至2020.02.01)。來(lái)源:衛(wèi)建委 不含港澳臺(tái)
我的好奇和困惑在于,全球以及中國(guó)抗擊傳染病應(yīng)該是一項(xiàng)比較成熟的安排,難道全球視野下,沒(méi)有更具優(yōu)勢(shì)的方式進(jìn)行密切接觸者的識(shí)別和追蹤么?特別是在中國(guó)春運(yùn)人群大遷徙的背景下,有沒(méi)有方式對(duì)傳染病遷徙路徑進(jìn)行實(shí)時(shí)分析并作出疫區(qū)預(yù)判呢?
本文也僅能對(duì)本文所描述的大數(shù)據(jù)技術(shù)方法進(jìn)行說(shuō)明,興許還存在更優(yōu)的大數(shù)據(jù)解決方案,不贅言。
“有效隔離”是傳染流行病學(xué)防治的第一良藥,世界衛(wèi)生組織在《關(guān)于2019新型冠狀病毒疫情的突發(fā)事件委員會(huì)第二次會(huì)議的聲明》中認(rèn)為:“只要各國(guó)采取強(qiáng)有力的措施,及早發(fā)現(xiàn)、隔離和治療病例,追蹤接觸者,并提倡針對(duì)風(fēng)險(xiǎn)程度采取相應(yīng)的減少社交接觸的措施,仍然有可能阻斷病毒傳播?!?/p>
而“有效隔離”的重中之重是“有效識(shí)別”,包括對(duì)(1)確診病例個(gè)體的有效識(shí)別;(2)對(duì)密切接觸者的有效識(shí)別;(3)對(duì)密切接觸者遷徒路徑的有效識(shí)別。做到了有效的識(shí)別,才能進(jìn)行有效隔離,并有效的調(diào)配社會(huì)資源,精準(zhǔn)預(yù)測(cè)疫情蔓延所在。
在這次中國(guó)新型冠狀病毒疫情中,對(duì)來(lái)自重點(diǎn)防疫區(qū)(例如湖北)以及爆發(fā)防疫區(qū)(例如浙江溫州)的人員,目前各省市已經(jīng)將來(lái)自該地區(qū)的人員視為“密切接觸者”予以重點(diǎn)關(guān)注,浙江杭州因?yàn)楹钡貐^(qū)航空接收,浙江溫州因?yàn)楹狈禍厝藛T潮出現(xiàn)等原因,疫情嚴(yán)峻形式徒然上升,各地出現(xiàn)了直接勸返,以及對(duì)這些遷徙流入的密切接觸者進(jìn)行強(qiáng)制隔離觀察的現(xiàn)象。
不過(guò),目前的“有效識(shí)別”,似乎仍然停留在直接觀察和較為簡(jiǎn)單初級(jí)階段的識(shí)別,例如,對(duì)可見(jiàn)的“鄂”字車輛進(jìn)行嚴(yán)防死守、對(duì)身份證顯示為湖北籍的重點(diǎn)盤查,對(duì)飛自湖北境內(nèi)的航班進(jìn)行醫(yī)學(xué)隔離,以及要求所有被盤查的人員主動(dòng)申報(bào)是否來(lái)自湖北,同乘交通工具人員的主動(dòng)上報(bào)等等。
但這一招對(duì)于那些短暫停留或路過(guò)重點(diǎn)防疫區(qū)以及爆發(fā)防疫區(qū)的人員,對(duì)提前離開(kāi)該類防疫區(qū),以及對(duì)這些人員沿途以及目的地所在人群的遷徙影響,甚至在特定行政區(qū)存在刻意隱瞞疫情等等例外情況下,似乎就不那么有效識(shí)別了。隨著疫情的變化,密切接觸者的范圍也會(huì)發(fā)生比較大的變化。
潮落礁起,平常被吹乎神技的大數(shù)據(jù)技術(shù),在這場(chǎng)防疫之戰(zhàn)中似乎并沒(méi)有任何驚艷于公眾的華彩亮相。國(guó)外倒是有媒體報(bào)道某人工智能公司早在2019年的12月底,就首次利用了新聞報(bào)道以及旅行者數(shù)據(jù)確定了下一步可能會(huì)出現(xiàn)新型冠狀病毒的地區(qū)。不過(guò),我們目前主要依賴于群防群控、地毯式布控,堅(jiān)信自上而下網(wǎng)格管理的“人定勝天”之道,目前來(lái)看,這些傳統(tǒng)防治方法確實(shí)比所謂的大數(shù)據(jù)技術(shù)來(lái)得更靠譜。那么,大數(shù)據(jù)技術(shù)是不是真的無(wú)用武之地呢?
至少?gòu)娜蛄餍胁》揽厥飞蟻?lái)看,有一種大數(shù)據(jù)技術(shù)的應(yīng)用和作用已經(jīng)被發(fā)現(xiàn)并成熟運(yùn)用,那就是移動(dòng)電話網(wǎng)絡(luò)大數(shù)據(jù)。
移動(dòng)電話網(wǎng)絡(luò)是重疊的無(wú)線電覆蓋區(qū)域的蜂窩,由無(wú)數(shù)的手機(jī)基站塔產(chǎn)生,覆蓋范圍從幾百米到幾公里不等。人們?cè)诖螂娫捄褪褂镁W(wǎng)絡(luò)時(shí),通過(guò)這些基站的蜂窩網(wǎng)絡(luò)將人們的電話連接到其他電話用戶或互聯(lián)網(wǎng)。我們以前的漫游收費(fèi),以及現(xiàn)在當(dāng)坐著動(dòng)車高鐵穿梭于不同省市時(shí)收到的“歡迎到此一游”的識(shí)別你所在之處的短信廣告,就是基于這個(gè)原理而實(shí)現(xiàn)。
早在2009年,德國(guó)報(bào)紙《時(shí)代周刊》(Die Zeit)就進(jìn)行了一項(xiàng)詳細(xì)的試驗(yàn),經(jīng)同意,他們使用德國(guó)某政府官員在六個(gè)月內(nèi)的移動(dòng)電話呼叫詳細(xì)記錄(CDR)數(shù)據(jù),詳細(xì)分析并成功繪制出了該官員六個(gè)月內(nèi)的全部行蹤軌跡,包括每天停留的地點(diǎn)、夜晚休息的地點(diǎn)以及和他人的通信(電話和短信)日志。
通過(guò)CDR大數(shù)據(jù)分析,可以有效分析疫區(qū)人群或密切接觸者的遷徙路徑,并據(jù)此估計(jì)每個(gè)地區(qū)傳染病的嚴(yán)重程度,推斷當(dāng)?shù)鼐用袷艿礁腥镜娘L(fēng)險(xiǎn),當(dāng)?shù)匦姓C(jī)關(guān)可以據(jù)此發(fā)布不同等級(jí)的風(fēng)險(xiǎn)預(yù)警。
事實(shí)上,這種移動(dòng)電話網(wǎng)絡(luò)CDR“大數(shù)據(jù)技術(shù)”早已被應(yīng)用于除了傳染病防疫之外的很多人道主義救助之中。例如在土耳其難民融合項(xiàng)目中,350余萬(wàn)遷徙于土耳其的難民中,90%以上早已生活在聯(lián)合國(guó)難民署經(jīng)營(yíng)的難民營(yíng)之外,CDR“大數(shù)據(jù)技術(shù)”被聯(lián)合國(guó)用于難民融合本地化的評(píng)估工作。
埃博拉病毒(Ebola) 肆虐表。來(lái)源:美國(guó)疾病控制與預(yù)防中心及世界衛(wèi)生組織
CDR“大數(shù)據(jù)技術(shù)”還用于分析地區(qū)貧困指數(shù),并據(jù)此作為精準(zhǔn)扶貧的佐證數(shù)據(jù)。例如,紐約大學(xué)布法羅分校的Neeti Pokhriyal使用來(lái)自900萬(wàn)個(gè)CDR數(shù)據(jù)在塞內(nèi)加爾創(chuàng)建了“貧困圖”。在該圖中,鏈接的粗細(xì)表示區(qū)域之間交換的呼叫和文本的數(shù)量。圓圈的大小指示總的傳入和傳出呼叫和文本。
海地地震中的CDR技術(shù)運(yùn)用至今仍令人耳目一新。2010年1月,在造成22.25萬(wàn)人死亡、19.6萬(wàn)人受傷的海地大地震中,CDR“大數(shù)據(jù)技術(shù)”被首次應(yīng)用于人道主義行動(dòng)中,用于實(shí)時(shí)監(jiān)控震后人群分布情況,以便于社會(huì)物資的分配。
圖2 全國(guó)新型冠狀病毒感染每日確診數(shù)據(jù)。來(lái)源:衛(wèi)建委 不含港澳臺(tái)
地震在當(dāng)?shù)貢r(shí)間16:50分左右開(kāi)始,地震造成的恐慌驅(qū)使人們大量地離開(kāi)海地首都太子港,而大量救援物資到達(dá)太子港后卻不知向何處進(jìn)行調(diào)度分配。當(dāng)時(shí)的Flowminder研究團(tuán)隊(duì)聯(lián)系了海地兩家電信運(yùn)營(yíng)商,但只有其中一家,即Digicel同意將其CDR數(shù)據(jù)共享進(jìn)行研究,F(xiàn)lowminder研究團(tuán)隊(duì)對(duì)1.92億個(gè)注冊(cè)呼叫中的190萬(wàn)張SIM卡進(jìn)行了數(shù)據(jù)清理和過(guò)濾,并從中近乎實(shí)時(shí)地分析出人員遷移的總體規(guī)模和運(yùn)動(dòng)趨勢(shì)。
針對(duì)飽受瘧疾困擾的肯尼亞,CDR技術(shù)用于人口流動(dòng)的量化。在《手機(jī)和瘧疾:模擬人類和寄生蟲的旅行》研究報(bào)告中,研究人員認(rèn)為:“在許多瘧疾流行國(guó)家,手機(jī)幾乎普及了,這為以前所未有的動(dòng)態(tài)規(guī)模檢查國(guó)家人口流動(dòng)提供了一種新方法。移動(dòng)電話已在全球范圍內(nèi)迅速采用,它提供了一種獨(dú)特的方式來(lái)隨時(shí)間推移,跟蹤數(shù)百萬(wàn)個(gè)體并了解瘧疾流行人群的動(dòng)態(tài)。使用移動(dòng)電話作為人類傳感器來(lái)測(cè)量人類活動(dòng)模式是一個(gè)迅速發(fā)展的領(lǐng)域。從移徙工人、季節(jié)性放牧者,從農(nóng)村到城市的移民以及難民,在從瘧疾到霍亂和艾滋病毒等傳染病的傳播中都發(fā)揮著重要作用?!?/p>
2009年,墨西哥豬流感(H1N1)疫情暴發(fā),政府于2009年4月實(shí)施的控制H1N1流感爆發(fā)的措施,包括在4月16日發(fā)布第一批H1N1流感病例醫(yī)療警報(bào),在4月27日至4月30日關(guān)閉學(xué)校;并從5月1日至5月5日暫停所有非必要活動(dòng)。CDR技術(shù)及數(shù)據(jù)被用于分析人員的動(dòng)向,以便政府作出實(shí)時(shí)的應(yīng)對(duì),CDR技術(shù)證明了政府的這些措施成功地減少了被病毒感染的人數(shù),并將大流行高峰推遲了兩天。
2014年,埃博拉病毒(Ebola)肆虐西非,據(jù)世界衛(wèi)生組織發(fā)表數(shù)據(jù)顯示,埃博拉出血熱疫情肆虐的利比里亞、塞拉利昂和幾內(nèi)亞等西非三國(guó)的感染病例(包括疑似病例)已達(dá)19031人,其中死亡人數(shù)達(dá)到11325人(美國(guó)CDC數(shù)據(jù)),這是被世界衛(wèi)生組織視為近代最為緊急的國(guó)際公共衛(wèi)生事件。此后,埃博拉病毒又分別于2017-2019年連年曝發(fā),致死率達(dá)到50-90%,可謂人類共敵。
2014年,埃博拉病毒在幾內(nèi)亞、塞拉利昂和利比里亞以及向尼日利亞、塞內(nèi)加爾的迅速傳播,可能源發(fā)于幾內(nèi)亞一個(gè)小村莊的一個(gè)18個(gè)月大的男孩被蝙蝠感染,另外更是由于當(dāng)?shù)貐^(qū)域恐慌性遷徙所致。
從CDR大數(shù)據(jù)技術(shù)應(yīng)用的實(shí)踐來(lái)看,最大的法律障礙在于個(gè)人隱私權(quán)益的保護(hù)和商業(yè)數(shù)據(jù)的共享問(wèn)題。上述各個(gè)典型案例中,各大數(shù)據(jù)分析機(jī)構(gòu)也不時(shí)被各電信運(yùn)營(yíng)商排斥和不理睬,無(wú)法拿到CDR數(shù)據(jù)并進(jìn)行分析。
在中國(guó),個(gè)人信息收集使用的的條款,目前還沒(méi)有得到有效的實(shí)踐。個(gè)人建議,在這次全國(guó)疫情契機(jī)下,官方機(jī)構(gòu)可以嘗試激活“與公共安全、公共衛(wèi)生、重大公共利益直接相關(guān)的”個(gè)人信息,并在保障網(wǎng)絡(luò)數(shù)據(jù)安全的情況下提供研究使用。
實(shí)際上,部分電信運(yùn)營(yíng)商確實(shí)開(kāi)始研究和開(kāi)發(fā)了大數(shù)據(jù)產(chǎn)品。例如聯(lián)通大數(shù)據(jù)公司開(kāi)發(fā)的人口大數(shù)據(jù)產(chǎn)品,表示可以“結(jié)合運(yùn)營(yíng)商的人員屬性、位置、愛(ài)好等數(shù)據(jù),與政府?dāng)?shù)據(jù)關(guān)聯(lián)融合,提高數(shù)據(jù)的實(shí)時(shí)性、準(zhǔn)確性,分析工作人口、過(guò)路人口、實(shí)有人口、人口遷徙、人口熱力等情況,及時(shí)了解轄區(qū)各類人員的變化”。疫情發(fā)生后,工信部還向各大運(yùn)營(yíng)商等調(diào)度部署了疫情防控大數(shù)據(jù)支撐服務(wù),要求“運(yùn)用大數(shù)據(jù)分析,支撐服務(wù)疫情態(tài)勢(shì)研判、疫情防控部署以及對(duì)流動(dòng)人員的疫情監(jiān)測(cè)、精準(zhǔn)施策,迫在眉睫”。
不過(guò),這些電信運(yùn)營(yíng)商在中國(guó)非典以來(lái),有沒(méi)有認(rèn)識(shí)到CDR數(shù)據(jù)的重要戰(zhàn)略意義,以及目前有沒(méi)有針對(duì)傳染病這類重大公共衛(wèi)生事件進(jìn)行CDR的研究,不得而知。至少?gòu)哪壳皝?lái)看,這些寶藏型數(shù)據(jù)可能仍然沒(méi)有被充分利用,也可能會(huì)錯(cuò)過(guò)這次全國(guó)疫情“賜予”他們的良機(jī)。
因此,呼吁行政主管部門能夠把這些數(shù)據(jù)匿名化后,作為政府?dāng)?shù)據(jù)資源開(kāi)放給更多的研究機(jī)構(gòu)進(jìn)行研究,用社會(huì)的力量,別讓疫情的結(jié)局只留下災(zāi)難和遺憾。
因?yàn)楦嗟目赡埽谶@場(chǎng)新型冠狀病毒防疫戰(zhàn)爭(zhēng)中,中國(guó)興許會(huì)對(duì)全球傳染病防治作出標(biāo)桿性的歷史貢獻(xiàn),中國(guó)大數(shù)據(jù)產(chǎn)業(yè)和技術(shù)也可能會(huì)給全人類創(chuàng)造新的價(jià)值圖景。
這樣的歷史機(jī)遇,請(qǐng)別讓它溜走!