□ 王 婧 彭 斌 重慶醫(yī)科大學公共衛(wèi)生與管理學院 江 生 重慶市食品藥品檢驗所
姚曉倩 董姣姣 重慶醫(yī)科大學公共衛(wèi)生與管理學院
在21世紀全球信息化大背景下,中國乃至全世界的食品安全面臨多層面的影響,機遇與挑戰(zhàn)并存。一方面,人民從對食品“量”的被動需求轉化為對食品“質”的主動要求;另一方面,近幾年來居民生活水平不斷提高,但食品安全事件卻頻頻發(fā)生,成為社會焦點,并且上升為全球性危機。三鹿奶粉事件、假雞蛋事件、染色饅頭事件等等食品安全重大問題不剩枚舉,還有國際上流傳廣泛的食源性疾病危機,都說明食品在生產、儲存、運輸及銷售等環(huán)節(jié)中存在不少漏洞,應把食品安全問題作為當前研究的重點。
面對如此嚴峻的食品安全形勢,建立的法律法規(guī)很難達到理想中的效果,人民對政府及有關部門的懷疑態(tài)度愈發(fā)嚴重,所以政府應從事件發(fā)生后的緊急處理階段調整到在事件發(fā)生前的預防控制上來,主動出擊。
在全球大數據與信息化的背景下,監(jiān)測與收集食品安全數據越來越容易,實時的食品監(jiān)測數據數量多,具有多源性、異構性等特征,探索更多適合于數據性質的預警方法與體系尤為重要。風險預警在各個行業(yè)與領域都有廣泛應用,在實踐過程中得到了多次的發(fā)展和完善。對于預警方法和模型,需要結合不同數據的特點不斷創(chuàng)新、打開不同的視角,作為重要支持技術以實現食品安全。
在食品安全范疇中預警指對食品質量安全風險的預防預測,通過對食品檢測數據的風險分析評估,預測食品安全風險的趨勢變化[1]。食品安全預警是食品監(jiān)管的重要部分,正確運用其方法可以提高食品安全水平,降低食品安全危害事件的發(fā)生概率。
食品安全預警體系綜合了監(jiān)測與收集數據、處理與分析數據以及發(fā)出警告3方面的內容,并在逐步的使用中不斷更新,以達到最優(yōu)狀態(tài)。下面簡單介紹幾個各國各地區(qū)的食品安全風險預警模型。
歐盟有食品與飼料快速預警系統(rapid alert system for food and feed,RASFF),主要用于歐盟各成員國之間的風險信息交流,若存在風險則及時發(fā)布通告并采取相應措施;美國有食源性疾病主動監(jiān)測網絡(food born disease active surveillance network, Food Net),簡稱食品網(Food Net),通過此系統可以確定食源性疾病的危害程度,并將疾病與特定食物相聯系;中國有國家食品安全風險評估中心( China National Center for Food Safety Risk Assessment,CFSA),保障居民的食品安全以及公眾健康。
對于食品安全預警模型,已經有了許多成熟的研究。國內學者探索了許多種方法,運用支持向量機對畜產品[2]等建立了安全預警模型;基于BP神經網絡開發(fā)了食品安全評估系統[3];運用關聯規(guī)則對肉類食品冷鏈物流質量[4]等建立了安全預警模型;基于貝葉斯網絡構建了網絡訂餐食品安全預警系統[5]。
國外學者也做出了許多研究。Allain V等提出了應用于家禽屠宰場肉類檢驗的預警系統,評估了13個不同食品安全事件出現之前的早期信號,提出新興風險識別支持系統(ERIS)的設計,以支持風險管理者識別新出現的風險[6];Xi W等基于粗糙集理論和層次分析法,建立了農產品“2-3結構”模式的質量和風險評價模塊化系統[7];Wang Xueli等建立了貝葉斯分層模型,使用食源性疾病的訪問患者的數量預測患者的每日真實數量[8];Barons M J等設計了一種動態(tài)貝葉斯網絡方法,為食品安全提供決策支持,與糖業(yè)的潛在不穩(wěn)定性相關聯[9]。
層次分析法(Analytic Hierarchy Process,AHP)是20世紀70年代初,美國運籌學家薩蒂提出的一種定量與定性相結合的決策分析方法。它將一個復雜的多目標問題,分解成目標層、準則層和方案層,構建層次結構模型,抓住問題的本質,提供合乎要求的決策方案。圖1為其示意圖。
層次分析法的主要步驟為構建層次結構模型,構造判斷矩陣,層次單排序及其一致性檢驗,層次總排序及其一致性檢驗。首先通過深入了解和分析問題,確定系統的總目標,然后將總目標分解成若干因素,一層一層組成一個層級體系,形成嵌套模式。
圖1 層次分析法示意圖
支持向量機(Support Vector Machine,SVM)是1995年Corinna Cortes和Vapnik等人最先提出的,它的優(yōu)勢是小樣本、非線性及高維模式的識別。它根據有限的樣本進行訓練,其樣本稱為支持向量,尋找一個最優(yōu)的超平面,使兩個樣本之間的分類間隔最大化,用這個超平面可以成功區(qū)分不同的類別。圖2是典型的支持向量機分類示意圖。
圖2 支持向量機分類示意圖
可以明顯看出圖中有兩個不同的類別,在二維空間中,最優(yōu)超平面即是一條直線A,直線A離兩個類別的距離都是最大的。其數學形式如式(1)。
其中,g(x)為分類函數,b為分類閾值,ω為權重向量,x為樣本特征向量??梢钥闯?,g(x)不唯一,所以最優(yōu)g(x)可通過幾何指標求得。
若為線性不可分,則在方程中添加一個正則化參數,即懲罰系數;若為非線性,則通過核函數映射將低維空間的樣本向量轉換為高維空間的樣本向量,然后再進行分析[10]。
BP神經網絡于1986年由Rumelhart和McClelland等科學家首先提出,又稱為誤差反向傳播神經網絡(back-error propagation neutral network,BPNN),是一種應用廣泛的人工神經網絡(artificial neutral network,ANN)[11]。它采用逆向誤差算法來訓練多層次網絡,其網絡信息向前傳播,而誤差是逆向傳播,不斷調整權重和閾值,從而得到一個誤差平方和最小的網絡。
典型結構包括輸入層、隱藏層和輸出層,隱藏層可以包含多個層次,結構示意圖如圖3所示。
圖3 BP神經網絡示意圖
其中一個神經元的輸出如式(2)所示。
式(2)中:xi代表神經元的第i個輸入,ωi為xi的權重,取值有正、負兩種,分別反映了xi是興奮的或是抑制的,T為興奮閾值,n為輸入個數,y為輸出,當輸入之和大于T,則y為1,小于T,則y為0。
貝葉斯網絡在1985年首次提出[12],把有向無環(huán)圖和概率結合起來,利用先驗概率計算條件概率,利用概率知識進行分類,表達復雜的因果關系。貝葉斯網絡一般分為兩種類型,一種是靜態(tài)網絡,一種是動態(tài)網絡,在靜態(tài)網絡中加入時序因素后就形成了動態(tài)網絡,提高了預測精度。
貝葉斯定理公式見式(3)。
式(3)中:Pr(A)為A的邊緣概率,不論B是否發(fā)生,Pr(A)都不會改變,即Pr(A)是先于B發(fā)生的,所以又稱為先驗概率;而Pr(A|B)則是事件A的條件概率,即在先發(fā)生了B事件的條件下再發(fā)生A事件的概率,所以也稱后驗概率。
一般來說,貝葉斯網絡可以表示為B=(Bs,Bp)。Bs=(X,E)是一個有向無環(huán)圖,X是隨機變量的集合,E代表有依賴關系的有向邊的集合。BP是條件概率分布的總和。式(4)的假設決定了網絡的結構。
式(4)中:πxi是父節(jié)點集合,xi的條件概率分布為P(Xi|πi)。
圖4是貝葉斯網絡結構示意圖,網絡中的每個節(jié)點就是一個變量,變量間的線段表示因果關系,利用前一個節(jié)點的概率計算下一個節(jié)點的概率,最后對得到結果的概率進行分類。
圖4 貝葉斯網絡示意圖
決策樹是用于分類的機器學習樹形結構。通過已知概率,計算不同方案的期望,選擇期望最大的方案,從而達到分類的目的,是運用概率的圖解法。因為訓練過程中的決策分析圖很像一棵樹,所以稱為決策樹[13]。在決策樹中,每一個節(jié)點代表一個事件,即上一個屬性的不同取值,進而在葉節(jié)點形成了每一種可能的類別,從根節(jié)點到不同的葉節(jié)點的路徑為生成的規(guī)則集合,可運用此規(guī)則預測新樣本的類別。
關聯規(guī)則于1993年提出[14],其目的是要找到既滿足最小支持度又滿足最小置信度的強關聯規(guī)則,從數據中發(fā)現潛在的相關規(guī)則與信息。Apriori算法是應用最廣泛的算法之一,之后又很多學者在其基礎上進行改進,彌補了經典Apriori算法的不足。
Apriori算法的思路為首先掃描數據庫,找到所有的1-頻繁項集,之后經過處理、修剪找到所有的2-頻繁項集,以此類推,找到所需的k-頻繁項集,最后由頻繁項集生成符合條件的強關聯規(guī)則。
2018年12月,研究團隊對于食品安全監(jiān)督管理、風險預警方面存在的問題,與重慶市食品藥品監(jiān)督管理局的工作人員進行訪談與調研,結合對文獻的研究,總結了現階段食品安全預警方面存在的問題與困難。
如自動售貨機、保健食品、農村一條龍家宴等屬于監(jiān)管盲區(qū),法律法規(guī)沒有清楚界定其屬于哪個監(jiān)管部門,并且類型雜、多,無法精準監(jiān)管,導致無法獲取相關食品安全數據,不可能達到預警狀態(tài)。
第二是在各部門聯合執(zhí)法的情況下,還是存在很多監(jiān)管漏洞,管理投入成本高,耗費人力物力,與之對應的可用于安全預警的人力物力就要相應減少,側面反映出機構改革還不到位。
很多繁復的工作需要人工進行,加大了政府工作人員無謂的工作量,不能有效的把時間和精力運用到食品安全預警最需要的地方。
目前用于食品安全預警的機器學習技術眾多,應用也十分廣泛,但真正做到事前“預警”的很少。究其原因是各個平臺、政府部分之間的數據不共通,很多數據是職能部門內部保密的,這對于全鏈條的食品安全風險預警是一大障礙。
在WEB2.0時代背景下,獲得海量數據越來越容易,如何挖掘出數據中的有用信息才是重中之重。對于食品安全的預警模型研究,已經進入一個新的篇章,從單純的算法研究轉變?yōu)榻Y合政府各部門的日常監(jiān)管需求,以需求為導向進行應用研究,從而進一步走向食品安全社會共治的道路。將協同治理與新技術相結合,使得食品安全預警不僅為現在服務,還為將來服務。將預警研究延伸到市場、農業(yè)、生態(tài)環(huán)境、食源性疾病、社會與氣候等方面中去,做到全鏈條的社會共治食品安全預警。