韓 輝,伍 波,侯 穎,宋悅謙
(中國海關科學技術研究中心,北京 100026)
21 世紀以來,大數(shù)據(jù)相關技術、產(chǎn)品、應用和標準不斷發(fā)展,以數(shù)據(jù)驅動、智慧決策、智能作業(yè)為特征的智慧創(chuàng)新模式已經(jīng)廣泛滲透并深刻影響著社會發(fā)展的各個領域[1-2]。大數(shù)據(jù)技術的發(fā)展與應用有助于推動經(jīng)濟發(fā)展、提升政府治理能力、保障和改善民生,因此受到各國政府高度重視并上升到國家發(fā)展戰(zhàn)略[3]。海關是依法履行進出境生物安全監(jiān)管的行政執(zhí)法機關,是國門生物安全風險防控的第一道屏障。在全球生物安全形勢日趨嚴峻的大背景下,海關全面加強對大數(shù)據(jù)技術的研究與實踐應用,構建基于大數(shù)據(jù)技術的國門生物安全風險監(jiān)測預警網(wǎng)絡,有助于快速感知和識別重大新發(fā)突發(fā)傳染病疫情、動植物疫病和外來物種入侵等風險,做到早發(fā)現(xiàn)、早預警、早處置,既是維護國門生物安全的重要舉措,也是推進智慧海關建設的必由路徑。
隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和信息化等技術的高速發(fā)展,生物安全相關數(shù)據(jù)量呈暴發(fā)式增長,包括疫情疫病發(fā)病和死亡數(shù)據(jù)、人員貿(mào)易往來數(shù)據(jù)和醫(yī)療衛(wèi)生數(shù)據(jù)等結構化數(shù)據(jù),也包括外來入侵生物特征圖片、視頻、音頻和地理位置信息等非結構化數(shù)據(jù)。生物安全大數(shù)據(jù)潛藏的價值巨大,在海量的數(shù)據(jù)中挖掘對相關性分析、趨勢預測分析等有重要價值的數(shù)據(jù)并結合機器學習和人工智能等方法進行深度分析,可以挖掘背后的規(guī)律,為相關部門科學決策提供參考。實踐證明,大數(shù)據(jù)在國門生物安全風險防控和治理工作中有廣闊的應用前景。
在公共衛(wèi)生領域,傳染病癥候群和病原學監(jiān)測數(shù)據(jù)、互聯(lián)網(wǎng)輿情數(shù)據(jù)、病媒生物和宿主動物數(shù)據(jù)以及人口流動數(shù)據(jù)等多來源渠道數(shù)據(jù)已被廣泛應用于傳染病監(jiān)測預警工作,有助于新發(fā)突發(fā)傳染病的快速識別,提高監(jiān)測預警的敏感性和及時性[4]。在我國新型冠狀病毒感染疫情防控中,人口流動、病原學監(jiān)測和互聯(lián)網(wǎng)搜索引擎等多源異構大數(shù)據(jù)的應用,為傳染源和傳播鏈追溯、疫情動態(tài)追蹤和研判預警、醫(yī)療衛(wèi)生資源調(diào)配等方面提供了強有力的支撐,為統(tǒng)籌疫情防控和經(jīng)濟社會穩(wěn)定發(fā)展發(fā)揮了關鍵作用[5]。傳染病跨境傳播是全球各國面臨的重要公共衛(wèi)生問題。有研究人員利用大數(shù)據(jù)對傳染病跨境傳播的風險進行了預測。Rockl?v 等[6]利用往來有基孔肯雅熱疫情流行地區(qū)的國際航班客運量、本地傳播媒介白紋伊蚊監(jiān)測數(shù)據(jù)和Twitter 用戶數(shù)據(jù)等評估了疫情輸入風險和輸入后引起本土傳播的風險,為傳染病輸入防控提供了依據(jù)。
隨著國際貿(mào)易往來的不斷發(fā)展,外來生物入侵問題愈加突出。外來物種的跨境傳播、擴散,不僅會導致生態(tài)環(huán)境破壞,同時也會造成巨大的經(jīng)濟損失。隨著外來入侵物種相關數(shù)據(jù)的大量積累,大數(shù)據(jù)技術也被逐步應用于外來入侵生物防控和治理工作中。研究人員利用有害生物的地理分布信息、形態(tài)特征信息、DNA 條形碼以及氣候地理信息等數(shù)據(jù),結合生態(tài)位模型、GIS 空間分析技術和聚類分析方法等模型與算法對外來入侵生物在本國的擴散風險、適生區(qū)和適生程度、入侵后定殖的可能性以及潛在的經(jīng)濟損失進行了預測,為外來有害生物入侵的早期預警和快速反應提供了技術支撐[7]。
多年以來,海關已積累了一定的檢驗檢疫、監(jiān)管和統(tǒng)計等各類業(yè)務數(shù)據(jù),以及與其他部委、國外官方組織機構交換和采購的數(shù)據(jù),形成了大數(shù)據(jù)基礎資源池,加強了數(shù)據(jù)挖掘和分析,初步讓大數(shù)據(jù)應用融入國門生物安全風險防控工作中,但仍存在諸多問題和局限性,主要表現(xiàn)在以下三方面。
國門生物安全風險監(jiān)測預警工作需要多系統(tǒng)、多部門共同參與,包括民航、旅游、公安和工信等部門。各部門均有比較完善的業(yè)務系統(tǒng),相關數(shù)據(jù)資源均可作為生物安全風險監(jiān)測預警的重要數(shù)據(jù)源。然而,海關在進行生物安全風險預警時主要依賴于海關業(yè)務數(shù)據(jù),例如在衛(wèi)生檢疫領域,主要依賴于世界衛(wèi)生組織等權威機構通報的傳染病疫情監(jiān)測數(shù)據(jù)和口岸傳染病輸入病例檢疫發(fā)現(xiàn)數(shù)據(jù)。海關與各部門之間缺乏長效的信息共享機制,面臨“數(shù)據(jù)壁壘”的挑戰(zhàn),關聯(lián)數(shù)據(jù)擴展、數(shù)據(jù)互聯(lián)互通和整合分析尚無法實現(xiàn)。為提高生物安全風險預警的及時性、敏感性和特異性,還需要綜合分析疫情疫病流行國家和地區(qū)媒介生物、環(huán)境、人口免疫水平、人口流動和國際貿(mào)易等數(shù)據(jù),而在海關實際工作中相關數(shù)據(jù)涉及較少,極大地限制了國門生物安全風險監(jiān)測預警能力。
生物安全風險預警技術將直接影響到預警結果的及時性和準確性。大數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)繁雜的特點。在利用大數(shù)據(jù)開展分析時,要求能夠有對數(shù)據(jù)進行深度挖掘、分析預測的技術,以及對需求進行梳理并建立模型解決問題的能力,從而為海關提供有效的決策參考。近年來迅猛發(fā)展的人工智能方法,如機器學習、云計算和數(shù)據(jù)挖掘等新型智慧技術已逐漸成熟,可對海量的數(shù)據(jù)實現(xiàn)實時動態(tài)、高速便捷和人工智能化的處理分析,在國門生物安全風險預警方面有巨大的應用價值。然而,海關在生物安全風險預警工作中使用的技術仍較為落后,主要通過建立風險評估預警數(shù)學模型判定風險級別,或者依靠專家的經(jīng)驗判斷,機器學習、人工智能和云計算等新技術的應用較少,導致已有數(shù)據(jù)資源的使用效率不高,有效信息的挖掘能力不足。
生物安全風險監(jiān)測預警工作具有極強的專業(yè)性和技術性,高水平、專業(yè)化、復合型人才隊伍是全面加強海關大數(shù)據(jù)研究與應用的根本保障。目前,海關專業(yè)人才的質(zhì)和量均明顯不足,從事人工智能、機器學習和云計算等與大數(shù)據(jù)緊密相關領域的人才存在缺口,精通海關業(yè)務與大數(shù)據(jù)技術的復合型人才更是十分匱乏,嚴重制約了大數(shù)據(jù)的應用,無法滿足新形勢下國門生物安全風險防控工作的需求。構建海關大數(shù)據(jù)應用支撐體系,不僅需要人才和技術作為支撐,還需要法律法規(guī)和規(guī)章制度作為保障。目前,海關在生物安全大數(shù)據(jù)資源采集、質(zhì)量控制、安全存儲和開放共享等方面的政策法規(guī)尚不健全,與其他政府部門之間數(shù)據(jù)流通和共享的機制壁壘尚未打通。因此,亟需構建和完善海關數(shù)據(jù)基礎制度,促進數(shù)據(jù)合規(guī)、高效的流通與使用。
當前,生物安全相關數(shù)據(jù)資源日益豐富,并且數(shù)據(jù)采集、挖掘和分析等技術也在不斷發(fā)展。然而,海關大數(shù)據(jù)的應用仍處于起步階段,為彌補當前海關在大數(shù)據(jù)資源收集、挖掘和應用等方面存在的不足,滿足國門生物安全風險早期預警和快速處置的需求,保障人民群眾健康和經(jīng)濟穩(wěn)定發(fā)展,需加強以下幾方面工作。
大數(shù)據(jù)的利用必須打破部門、領域和地域等的壁壘,克服“信息孤島”現(xiàn)象,實現(xiàn)不同來源數(shù)據(jù)真正意義上的交換和共享。海關需拓寬數(shù)據(jù)的來源渠道,通過加強與民航局、移民局、文旅局、外交部、工信部、公安部等部委以及國際組織機構的合作,利用區(qū)塊鏈[8]、智能合約[9]、聯(lián)邦學習[10]等技術,在保障數(shù)據(jù)安全和隱私的前提下,推動建立高效運行的數(shù)據(jù)共享機制和數(shù)據(jù)交換平臺,促進數(shù)據(jù)流轉,打通不同部門和系統(tǒng)之間的壁壘。通過高效整合多種傳統(tǒng)數(shù)據(jù)和新型數(shù)據(jù)資源,實現(xiàn)對國門生物安全風險的多維度預警。
實現(xiàn)國門生物安全風險智慧化預警的關鍵環(huán)節(jié)是高效的預警模型和算法。高效的模型和算法可使得生物安全相關數(shù)據(jù)的處理、分析、預警等環(huán)節(jié)更加自動化和智能化。海關在國門生物安全風險預測預警工作中可結合時間模型、空間模型和時空模型等模型,充分融入機器學習和深度學習等人工智能算法技術,充分提取多源數(shù)據(jù)中的有效信息,改善數(shù)據(jù)低效、碎片化應用的局面,彌補傳統(tǒng)監(jiān)測數(shù)據(jù)中的觀測偏差和漏報,避免傳統(tǒng)模型參數(shù)不準確等問題,提升預警的準確性,實現(xiàn)預警智慧化。
海關需進一步強化在國門生物安全風險防控中廣泛應用大數(shù)據(jù)技術的思維,以數(shù)據(jù)分析結果作為決策支撐。要加大對大數(shù)據(jù)方面人才培養(yǎng)、經(jīng)費投入和推廣應用等的支持與保障,分級分類建立一支涵蓋大數(shù)據(jù)處理和分析、生物安全風險應急處置、實驗室檢測和流行病學調(diào)查等專業(yè)人員的隊伍,充分發(fā)揮專業(yè)特色和優(yōu)勢。尤其需加大對應用型、復合型、創(chuàng)新型人才的培養(yǎng)力度。同時,需盡快完善海關大數(shù)據(jù)應用相關規(guī)章制度,破除數(shù)據(jù)共享和應用等各個層面的體制機制障礙,將大數(shù)據(jù)應用納入法治軌道,夯實大數(shù)據(jù)應用基礎。