王建新,李騰旭,李中天,王曄茹
(1 北京林業(yè)大學信息學院 北京 100083 2 國家林草局智能信息處理中心 北京 100083 3 國家食品安全風險評估中心 北京 100022)
諸多發(fā)達國家已經(jīng)把食品安全問題提升到國家安全的戰(zhàn)略高度[1]。我國也十分重視食品安全問題,已把食品安全上升至與國防安全同等重要的重大民生工程之一[2]。而食品安全評價是實現(xiàn)食品安全管理的前提和首要條件,它對食品的安全性給出判斷性描述,最終是一個分類和等級評價的問題,這是目前研究的熱點和難點。由于食品安全風險評價是其它食品安全管理活動的前提和基礎,能為食品安全管理部門提供決策輔助[1],也能為社會大眾提供食品安全的知情權,因此是食品安全管理的關鍵環(huán)節(jié)。公平公正、科學合理的評價體系使得后續(xù)的風險管理、預警和響應機制有章可循、有據(jù)可依。
食品安全風險評價體系的主要議題有4 個,這都是當前研究的熱點。第一是建立指標體系,即評價體系中應該包含什么指標,它們的組織結(jié)構是什么。第二是權重設置,即設置各個指標在評價體系中的數(shù)量化的重要程度。第三是指標值到分值的映射關系。由于一般的評價結(jié)果最終是分值或等級這樣的數(shù)量值,因此,需要把指標中類別化的或數(shù)量化的取值映射為分值或等級值。第四是分項分值到總項分值之間的匯總合成關系。由于指標體系中總項會由若干個分項構成,而每個分項又可能會有若干個更細的分項構成,因此需要建立分項分值到總項之間的匯總合成映射關系。有時這種合成匯總關系比較簡單,包括簡單的加權相加、求均值等,有時按照實際需要會非常復雜。
要進行食品安全評價,首先需要建立合理的指標體系。指標體系分為單層指標體系和多層指標體系。在單層指標體系中,決定食品安全風險綜合程度或指數(shù)的是若干個變量,這些變量之間的關系是平行的,它們或者是等權重的,或者是非等權重的,所有變量的分值最終決定綜合的食品安全風險程度。為建立乳制品安全風險評估指數(shù),有研究[3]選取了14 個指標,用3 種綜合評價法施加于這14 個指標,結(jié)果具有高度一致性,驗證了指標選取的合理性。呂學東等[4]構建了出口食品生產(chǎn)企業(yè)“三同”成熟度評價體系,也是典型的單層評價指標體系,文中通過百分制給每個指標賦予了一個權重,通過加權得分評價一個企業(yè)的“三同”成熟度。
然而,在食品安全評價中,單層評價指標體系相對較少,這是因為食品安全評價是一個復雜的系統(tǒng)工程,因此多層指標體系在文獻中更為常見,也更為頻繁地在實踐中使用,常見的層次分析法(AHP 法)也是典型的多層結(jié)構。AHP 法是由美國匹茲堡大學的運籌學教授薩蒂提出的一種定性與定量結(jié)合的多層權重分析方法,該方法把一個復雜問題先看作一個整體,然后逐層分解,一個高層的目標可以分解為若干個低一層級的目標[5]。
建立指標體系之后,需要為各個指標設置權重,方能通過指標變量的值計算風險得分。設置指標權重通常分為主觀設定和客觀計算兩種方式,有時也會把二者結(jié)合起來操作。有研究[4]由專家直接給出各個指標的權重值。然而,AHP 法中的權重一般由若干個專家分別給出,收集專家給出的權重分值后,需要進行一致性驗證[5]。如果驗證通過,就說明專家們對權重的分配達成基本一致的意見,權重保留;否則,需要專家重新對權重進行分配。除了采用層次分析法[5-6]外,多個應用中用層次分析法建立指標體系和設置權重,包括對農(nóng)副產(chǎn)品供應商的評價體系研究[7],對基于供應鏈的區(qū)域性食品安全狀況的評價[8],對食品生產(chǎn)企業(yè)質(zhì)量安全的評價體系研究[9],以及對我國食品企業(yè)信用評價體系的建設[10]等。AHP 法中的權重設置是典型的主客觀相結(jié)合的方法。熵權法通過指標數(shù)據(jù)確定指標的權重[11-13],是純粹客觀的權重設置法,然而,前提條件是各個待評價的對象在每個指標變量上的取值已經(jīng)全部獲取,因此該方法的適應性較弱,對一些指標值超出已知數(shù)據(jù)范圍的新對象無法評價。主成分分析方法也是一種客觀設置權重的方法,其利用歷史數(shù)據(jù),通過各指標的線性貢獻判定指標權重。例如,研究[3]利用主成分分析方法實現(xiàn)了乳制品安全風險評估指數(shù)中的權重設置。
在建立指標體系、設置各指標權重后,需要建立指標值到分值的映射關系,映射關系建立的方法有很多種,如等級離散劃分法[2],把評價結(jié)果值區(qū)間[1,5]劃分為5 個安全等級,包括“很差”“很好”等,例如后者的評價值區(qū)間可以是(4.2,5]等。而為了度量哪些變量會影響消費者舉報網(wǎng)絡外賣餐飲店的食品安全違法違規(guī)行為,王浩等[14]自定義了若干個原因變量,這些變量大部分都是5 等級取值的。更多使用的是指標值到得分值之間的線性映射,如采用線性映射[15]計算低碳生產(chǎn)、經(jīng)濟增收、安全供給等方面的綠色發(fā)展指數(shù),最后綜合計算總體的綠色發(fā)展指數(shù)。
食品安全風險評價體系中另外一個重要的議題就是建立分指標項(分項)分值到總指標項(總項)之間的匯總合成映射關系。不管是單層指標體系[3],還是多層指標體系[4-10],總項分值是n 個分項分值的線性加權和,如公式(1)所示。
式中,T——總項分值;vi——各分項分值;αi——各分項權重,i=1,2,…,n,且要滿足αi=1。
除了線性映射外,分項到總項分值的映射方式可以有多種,可以更復雜,而不僅僅限于公式(1)這種映射方式。更一般的形式如公式(2)所示。
式中,f——任意的線性或非線性映射。
雖然線性映射方式在分項到總項的映射中比較常用,但是它存在一個重要缺陷。在食品安全風險評價中,如果某個分指標的分值較高,即風險較高,則會認為總指標中存在這樣一個“短板”:即使其它分指標的數(shù)量很多,風險都比較小,也不能把總指標判定為低風險。也就是說,在風險評估和評價中,分值較高的分項的影響較大,分指標的分值不適合按照權重線性相加。
食品安全風險的大小,以及它對監(jiān)管部門和輿情的影響,并不簡單是各個因素嚴重程度的加權和,而是更偏重于突出事件、出現(xiàn)嚴重問題的因素或分指標。實現(xiàn)這一映射關系的傳統(tǒng)做法是使用模糊隸屬度函數(shù)(簡稱為模糊函數(shù))。例如,公式(3)是一個簡單的模糊函數(shù),也稱為最大模糊算子:
根據(jù)公式(3),總指標分值(代表總體風險)是分指標分值的最大值。也就是說,總指標風險值由分指標風險值中最大的那個決定。這個映射關系比較符合人們對風險的認知:系統(tǒng)風險由系統(tǒng)中的短板決定。有研究應用模糊綜合[16]的方式對高校食堂的食品衛(wèi)生做了評價和分析,易于發(fā)現(xiàn)食堂食品衛(wèi)生的短板問題,以便督促改進,有研究應用更一般的三角模糊法[12]評價冷鏈貨架周期,然而,通過施加三角模糊的運算法則,最終的映射結(jié)果仍呈現(xiàn)為非此即彼的形式。還有研究[11]首先用熵權法確定分指標的風險分值,然后也通過模糊綜合的方式獲得總指標的風險分值。
另一方面,與風險評估評價相反,若要對安全性進行評價,計算安全指數(shù)等,則分指標的安全值中最小的那個對總指標具有決定作用,這也是一個模糊函數(shù),稱為最小模糊算子:
公式(4)的意義是:總指標的安全性由最不安全的分指標決定。
然而,上述模糊評價的方式存在另一個重要的缺陷,即總指標的分值必須是某一個分指標的分值,非此即彼,具有排他性,并不滿足實踐應用中的需求,也就是嚴格單調(diào)性范式要求。所謂嚴格單調(diào)性范式要求是:對于兩個評價對象,若除第k個分指標外,其它分指標的值都相同,則兩個對象的總指標值相對于第k 個分指標的值要滿足嚴格單調(diào)性。嚴格單調(diào)性包括嚴格單調(diào)增和嚴格單調(diào)減。這里以嚴格單調(diào)增為例,形式化地描述嚴格單調(diào)性范式要求。
假設兩個待評價對象O'和O″在n-1 個分指標上的分值都相同,而在第k 個分指標上的分值不同,也就是二者的分指標值分別是:S1,S2,…Sk-1,Sk',Sk+1…Sn和S1,S2,…Sk-1,Sk″,Sk+1…Sn,且假設Sk'>Sk″,那么嚴格單調(diào)增范式要求需要兩個總指標的分值滿足Tk'>Tk″,然而,最大模糊算子和最小模糊算子顯然都不滿足嚴格單調(diào)范式要求,會出現(xiàn)Tk'=Tk″的情況。例如,假設兩個待評價對象O'和O″只有兩個分指標,它們的分值向量分別是(0.3,0.8)和(0.4,0.8)。根據(jù)最大模糊算子,這兩個待評價對象的總指標分值都是0.8,顯然不滿足嚴格單調(diào)性范式要求。事實上,就風險而言,O″比O'風險更高,二者風險值不應該相等。同理,對最小模糊算子也存在大量不滿足嚴格單調(diào)性范式的例子。
模糊評價方式雖然突出了重點分指標對總指標分值的決定作用,但是完全忽略了其它分指標對總指標分值的影響,在邏輯上并不合理,在實踐應用中是有缺陷的。
為了融合和兼顧重點分指標對總指標的決定性影響和嚴格單調(diào)性范式兩個要求,需要新的映射方式,為此,作者提出廣義向量模長的映射方法,并從數(shù)學證明和實踐應用兩個角度說明其優(yōu)勢。
有研究[12]采用歐式距離比較兩個商品的貨架期差異,并取得良好的效果。兩個商品的歐式距離由分項計算,如公式(5)所示:
借鑒這個距離定義,可以建立基于歐式模長的分指標值到總指標值的映射方式,即通過計算分指標值構成的向量與0 向量的距離獲取總指標的分值,如公式(6)所示:
顯然,歐式向量模長的映射方式是符合嚴格單調(diào)范式的(證明略)。另外,該評價方式也滿足重點分指標對總指標的決定性影響的要求。例如,假設食品安全風險由4 個因素構成,其分值分別是v1,v2,v3,v4,各因素的權重均為0.25,對于某食品,前3 個分指標的分值都是0.1,第4 個分指標的值是0.9,則按照線性加權和映射方式,綜合風險的分值是0.25×0.1+0.25×0.1+0.25×0.1+0.25×0.9=0.3。用歐式向量模長的方式可以做如下計算:
歐式向量模長的映射方式也有其不足之處。從公式(7)的例子可以看出,突出的分值對總指標的影響程度是固定不變的,因此,歐式模長不具有普適性,不能隨需要而調(diào)整,究其關鍵原因是由于該評價方式?jīng)]有可調(diào)整的超參數(shù)。另外,公式(7)所示歐式模長評價方式?jīng)]有考慮各個分指標的權重,需要在歐式模長的基礎上提出更普適的映射方式。
定義從分指標值到總指標值的廣義向量模長映射方式如公式(8)所示:
式中,β——超參數(shù),取值范圍可以從負無窮(包括)到正無窮(包括);αi——各個分指標的權重,i=1,2,…,n,且要滿足廣義向量模長的廣義性體現(xiàn)在兩個方面:第一,該模型具有超參數(shù)β,有更廣泛的適應性;第二,與歐式模長映射方式不同,它兼顧了各個分項的權重值。
首先,證明如下有關漸近性的命題:
命題1.當超參數(shù)β 趨于正無窮時,廣義向量模長映射退化為最大模糊算子映射。
證明:為了證明過程的簡潔,先假設共有2 個分指標(有更多分指標時,證明過程類似),也就是n=2,兩個分指標的值分別是v1和v2,且v1>v2。
從上面的證明結(jié)果可以看出,經(jīng)過廣義向量模長映射,總指標值就是分指標的最大值。這種映射實際上就是最大模糊算子映射。
命題2.當超參數(shù)β 趨于正0 時,廣義向量模長評價方式退化為幾何加權平均。
根據(jù)洛必達法則,上式分子分母同時求導:
因此,
公式(9)其實是幾何平均的一般形式。特殊地,當α1=α2=0.5 時,
上式恰好是各個分指標值傳統(tǒng)意義上的幾何平均。下面通過一個例子比較算術平均映射和幾何平均映射。仍然假設有2 個分指標,每個分指標所占權重都是0.5,兩個分指標的值分別是0.3 和0.9,那么它們的算術平均值是0.6,然而,幾何平均值是0.5196,二者雖接近,但又有不同,幾何平均映射的結(jié)果更接近于分指標中較小的值。
命題3.當超參數(shù)β 趨于負無窮時,廣義向量模長評價方式退化為最小模糊算子。
于是有,
因此,
所得結(jié)果即為分指標中的最小值。這說明,當超參β 趨于負無窮時,廣義向量模長映射即最小模糊算子映射。
公式(8)表示廣義向量模長映射方法,其超參β 在正無窮、0、負無窮處均沒有定義,除此之外,在實數(shù)軸上的任何其它地方都有定義,可計算。為此,前文通過求極限的方式,重新在這3 處給出了公式(8)的擴展定義,使得公式(8)的超參β 在包括正、負無窮的整個實數(shù)軸上都有了定義。進一步地,通過前文的證明,可以得出:廣義向量模長映射方法能夠涵蓋前述的幾乎所有的映射方法,包括最大模糊算子法、最小模糊算子法、歐式模長法、算術平均法、幾何平均法,也包括這些方法之間的過渡狀態(tài)方法。廣義向量模長映射法隨著超參β 的變化,與其它映射方法的關系如圖1所示。
圖1 廣義向量模長映射法與其他映射方法的關系Fig.1 The relationship between generalized vector modulus length mapping method and other methods
首先,超參β 的值越大,映射結(jié)果就越接近于分指標項中的最大值。極端情況,當β 為正無窮時,映射結(jié)果即分指標項的最大值。相反地,超參β 的值越小,映射結(jié)果就越接近于分指標項中的最小值。極端情況,當β 為負無窮時,映射結(jié)果即分指標項的最小值。特殊地,當β 的值為0,1,2時,廣義向量模長映射法分別退化為幾何平均映射法、算術平均映射法和歐式模長映射法。
除了超參β 在正負無窮的極端情況,廣義向量模長映射方法均滿足嚴格單調(diào)范式。
除了上述特殊情況,超參β 在過渡狀態(tài)情況下的映射方法更有意義。當β 位于區(qū)間(1,+∞)中時,映射結(jié)果會更偏向于較大的分項值,并且隨著β 的增加,這種偏向的程度更深。當考慮風險指數(shù)等綜合指標時,可以讓超參β 選擇這個區(qū)間的值。相反地,若考慮安全指數(shù)等指標,則可讓超參取值在區(qū)間(-∞,0)中。超參β 在這個區(qū)間中時,映射獲得的總指標的值更傾向于各個分指標的最小值,并且隨著β 的減小,這種傾向性就更明顯。當超參β 在區(qū)間[0,1]中時,既可以映射風險指數(shù),也可以映射安全指數(shù),然而,由于不能很好地體現(xiàn)關鍵子指標對總指標的決定作用,因此建議盡量不采用。不過,當要把分指標信息盡量完整地反映到總指標中,而又不考慮分指標值的大小對映射方式的影響時,可以考慮用這個區(qū)間中的超參值。與眾多文獻中的映射方式類似,可以讓超參β 取值為1,這時廣義向量模長映射法就退化為線性加權平均法。
由于廣義向量模長映射法完全由超參數(shù)β 決定,因此,用Gβ表示一個特定的映射方法。例如,G10表示超參為10 的廣義向量模長映射法,G∞就是最大模糊算子映射法。
根據(jù)廣義向量模長的公式(8),表1列出部分超參數(shù)對總指標分值的影響程度。這里仍然假設只有兩個分指標,其權重α1=α2=0.5,且分項值v1=0.9,v2=0.2。根據(jù)廣義向量模長的公式(8),以及它在一些特殊點上的擴展定義,得到對應關系,見表1。
從表1可以看出,隨著超參數(shù)β 從正無窮變化到負無窮,總指標項的值從分指標的最大值逐漸變化為分指標的最小值。在實際應用中,可以參考表1中的數(shù)據(jù),按照實際需求,選取合適的映射關系,即選取重要值的分指標對總指標的合適的影響程度。也可以根據(jù)實際需求,選取表中兩個相鄰超參之間的某個中間值。
表1 廣義向量模長方法中超參數(shù)對總指標分值的影響關系Table 1 Impact of the hyper-parameter to total metric score in the method of generalized vector modulus length
為了評估蘭州市柑橘類水果的農(nóng)藥殘留風險,文獻[17]建立了指標體系,其中包括甲拌磷等6 個分指標。本文把廣義向量模長映射法應用于這個評價案例,驗證該方法的有效性。比較結(jié)果如表2所示。
表2 廣義向量模長映射法與其它方法的應用比較Table 2 Application comparison between the method of generalized vector modulus length and other methods
觀察表2中線性加權映射法(G1),它的最終結(jié)果與分指標最大風險值0.8 相差甚遠,因此不能反映具有重要值的分指標對總指標的決定作用。相反地,最大模糊映射法(G∞)和廣義向量模長法(G10)的結(jié)果都是或比較接近分指標的最大值,符合實際情況,更有應用價值。
然而,最小模糊映射法(G-∞)在所有情境中的結(jié)果都是0,因此在考慮風險指數(shù)而不是安全指數(shù)時,不具有應用價值。相反地,在考慮安全指數(shù)計算時,該方法會更為實用。
情景1 和情景2 的6 個分指標風險值除了“苯醚甲環(huán)唑”外,全部相同,廣義向量模長映射法(G10)捕捉到這個差異,總指標的風險值也有所不同,且滿足嚴格單調(diào)性范式。然而,最大模糊映射法(G∞)不具備捕捉這個差異的能力,其最終的風險值均為0.8,與分指標的最大值完全相同。
兩個分指標“敵敵畏”和“苯醚甲環(huán)唑”的權重不同,在情景2 和情景3 中交換了風險值,這在線性加權映射法(G1)中得以體現(xiàn),從情景2 的0.32變化為情景3 的0.23,在廣義向量模長映射法(G10)也得以體現(xiàn),從情景2 的0.70947 變化為0.63661,而最大模糊映射法(G∞)不具備捕捉這個變化的能力,它對權重的變化并不敏感。
綜上分析,廣義向量模長映射法從各個角度看,具有比較大的綜合優(yōu)勢。
食品安全風險評價體系的科學合理性和公平公正性對食品安全管理具有重要作用,是其不可或缺的組成部分。好的評價體系能夠使食品安全監(jiān)督檢查有據(jù)可依,可以更好地區(qū)分食品企業(yè)和食品產(chǎn)品,結(jié)合監(jiān)督抽檢和檢驗檢查等起到引導和督促的作用。評價體系建設的第4 個議題(由分到總的映射)中,存在不能體現(xiàn)重要分指標值對總指標值的決定作用、不滿足嚴格單調(diào)性范式等問題。本文提出的廣義向量模長映射法不但能夠很好地體現(xiàn)重要分指標值對總指標值的決定作用,而且能夠滿足嚴格單調(diào)性范式。更重要的是,通過嚴格的數(shù)學推導,證明廣義向量模長映射法是傳統(tǒng)映射方法的統(tǒng)一形式,可通過超參的選取,確定適合應用場景的廣義向量模長映射實例。通過實際的應用場景,驗證了這些結(jié)論。
在多層的指標體系中,存在多次的從分指標值到總指標值的映射過程,需要有多個超參β。一般來說,同一個指標體系下的超參不要求統(tǒng)一,應根據(jù)實際需求,決定不同映射關系中的不同超參的值。
雖然提出廣義向量模長的分指標值到總指標值的映射方法,但是指標體系建設中仍然存在諸多問題和難點,后續(xù)將把映射方法與另外3 個議題結(jié)合,形成有機統(tǒng)一的指標體系方法論和建設指南。