• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      單類分類方法結合光譜分析在食品真實性鑒別中的應用

      2022-11-07 08:37:42唐逸蕓呂慧英唐忠海郭時印
      光譜學與光譜分析 2022年11期
      關鍵詞:光譜分類樣本

      唐逸蕓,劉 芮,王 潞,呂慧英,唐忠海*,肖 航,郭時印,范 偉*

      1. 湖南農(nóng)業(yè)大學食品科學技術學院,湖南 長沙 410128 2. 云南省煙草公司保山市公司,云南 保山 678000 3. Department of Food Science, University of Massachusetts, Amherst, MA 01003, USA 4. 湖南省菜籽油營養(yǎng)健康與深度開發(fā)工程技術研究中心,湖南 長沙 410128

      引 言

      自2008年出現(xiàn)三聚氰胺重大食品安全事故以來,人們對食品真實性問題高度關注, 食品欺詐是一種以經(jīng)濟利益為驅(qū)動的故意行為,包括“故意替換、 添加、 篡改或虛報食品成分或食品包裝或進行虛假宣傳,或關于產(chǎn)品的虛假以及誤導性聲明”[1]。其中摻假作為欺詐的一種類型,因摻假物的種類性質(zhì)不同往往會引發(fā)食品安全問題,面對全球食品摻假的頻繁發(fā)生,促使各國政府更加重視食品真?zhèn)舞b別,在我國,《食品安全法》中對食品生產(chǎn)過程中的食品摻雜摻假、 標簽虛假和針對監(jiān)管的各類信息欺詐的違法行為有詳細規(guī)定[2]。為了保障食品安全和消費者權益,發(fā)展有效的檢測方法至關重要。

      常用的色譜和質(zhì)譜等基于化學成分分析的檢測方法一般包括復雜的前處理,還存在著檢測周期長、 需消耗有毒有害化學試劑、 檢測成本高、 需破壞樣本等缺點。隨著近代儀器分析的飛速發(fā)展,無損快速檢測成為食品認證的重要研究方向[3]。光譜技術,如常用的近紅外、 中紅外以及拉曼等振動光譜技術,有彌補傳統(tǒng)檢測技術的缺陷的可能性,它們憑借著需要較少的制備樣品時間,以及快速和、 非破壞性和綠色環(huán)保等特點,近年來,多被使用為檢測樣本中摻雜物的替代分析方法[4]。

      光譜技術存在特異性低的缺點,如果摻入物的成分幾乎接近于原物,兩者的光譜差異在肉眼下看起來很難區(qū)分,需要借助數(shù)學建模將這些信息放大從而找到兩者之間的區(qū)別,這種復雜的統(tǒng)計學方法是根據(jù)樣品的相似性將光譜信息(即每個波長的強度)轉(zhuǎn)換成新的變量或類別響應。在過去十年中,已有許多統(tǒng)計學方法與分析測量相結合,被開發(fā)應用于質(zhì)量評估、 產(chǎn)品可追溯性,地理來源的定義和檢測食品真?zhèn)蝃5]。如主成分分析(PCA)、 聚類分析(HCA)等廣泛使用的非監(jiān)督方法是簡單有效的分類方法,在沒有任何數(shù)據(jù)先驗的情況下通過降低數(shù)據(jù)維數(shù)來識別樣本之間的異同[6]。另一方面,線性判別分析(LDA)、 偏最小二乘判別分析(PLS-DA)和簇類獨立軟模式(SIMCA)等監(jiān)督方法是基于來自特定樣本的先驗信息生成分類模型,分類用途更廣。支持向量機(SVM)、 人工神經(jīng)網(wǎng)絡(ANN)、 隨機森林(RF)等機器學習通過學習如何組合輸入信息對從未知數(shù)據(jù)做出有用的預測。

      Oliveri等[7]得出結論,在正確定義所有的類別,且包含的樣本代表每個類的前提下,傳統(tǒng)的分類方法使用所有類的貢獻,在兩個或更多個類之間尋找定界符以區(qū)分純樣本和摻有多種已知物的摻假樣本。Rodionova等[8]在一篇關于應用于食品認證的化學計量學方法的詳細綜述中表示,像判別分析這種分類方法常在代謝組學,基因組學和其他組學中應用,至于認證問題,單類分類方法顯示更可靠的結果。

      1 單類分類方法

      1996年,Moya等[9]在研究工作中首創(chuàng)了單類分類這一術語(one-class classification,OCC),2001年,Tax[10]進一步闡述和總結了此方法,表明單類分類方法已經(jīng)成為模式識別的一個重要分支。不同的研究人員根據(jù)應用場景的不同來表示類似的概念,如奇異值檢測、 新奇檢測或概念學習等。近年來,單類分類法受到越來越多的關注[11],其最終結果是回答決策問題中新樣本是否屬于目標類。關于其分類,根據(jù)原理大致可分為四類: 第一類是密度估計法,第二類基于神經(jīng)網(wǎng)絡的方法,第三類是基于聚類的方法,第四類是基于支持域的方法[12]。

      為了進一步闡述單類分類方法在摻假鑒別中的作用,圖1模擬了同一情景下不同分類方法的比較情況:

      (1) 紫色的圓點表示有一定數(shù)量基礎的真實樣本T。

      (2) 藍色,綠色,黃色,紅色的圓點分別代表不同較少數(shù)量的摻假類別(A,B,C,D),分別將其加入到真實樣本T中。

      (3) 用多類分類方法分類建模后得到不同模型TA,TB,TC,而未知樣本類別D未能識別出來。

      (4) 用單類分類方法分類建模后得到兩大類模型,真實類別T,其余為摻假類別ABCD。

      圖1 不同分類方法的示意圖Fig.1 Schematic diagram of different classification methods

      采用多類分類方法進行分類時,在含有已知摻假樣本的情況下需要建立不同的模型分別將它們識別出來,但如果摻入未知樣本,由于事先并未對其進行過訓練,使用該方法效果不佳。相比之下,單類分類方法通常是檢測多重摻假的更好選擇,因為它只需要用真實的樣本來建立分類模型,該模型可以識別任何不同于此的樣本為摻假樣本,不僅是圖中所示的這幾種,之后摻入的任何不同于真實樣本(E,F(xiàn),G,…)的都會歸類為摻假樣本,大大減少了分類工作。

      結合高斯函數(shù)原理,采用matlab分別模擬了三組數(shù)量為1000的光譜數(shù)據(jù),一組為含三個峰的真實樣品(圖2),對于摻假組,為了更好地比較兩種方法的分類結果,采用了兩種摻假形式,一種是模擬了摻入有三種不同種類的物質(zhì)(圖3),而另一種模擬了摻入一類樣品(圖4),取不同數(shù)量的真假數(shù)據(jù)(5/50/500/1 000),模擬在樣品平衡以及差異值很大的情況下,用PLS-DA法和OCPLS法分別代表多類分類方法和單類分類方法來驗證分類效果,結果見表1和表2,其中敏感性表示模型正確分類目標樣本的能力,特異性表示模型正確分類非目標樣本的能力。

      如表1和表2所示,無論在同類還是不同類的情況下,當真實樣本數(shù)量極少時,單類分類方法無法識別大量的摻假樣本,而多類分類方法效果很好,這也表明單類分類方法要求一定的真實樣本數(shù)據(jù),而隨著真實樣本的不斷增多,單類分類方法的結果出現(xiàn)逆轉(zhuǎn),即使在摻假樣本極少的情況下,依然有100%的分類結果,證明了這種方法在處理極端值問題的優(yōu)越性。對比表1和表2,在同等數(shù)據(jù)數(shù)量的情況下,摻入有不同種類的樣本時,PLS-DA方法的分類結果低于摻入同類樣本的結果,而OCPLS不受摻入物類別影響。

      圖2 真實樣本模擬數(shù)據(jù)圖Fig.2 Simulated data graph ofactual sample

      圖3 摻假樣本(三種)模擬數(shù)據(jù)圖Fig.3 Simulated data graph of adulteratedsamples (three classes)

      圖4 摻假樣本(一種)模擬數(shù)據(jù)圖Fig.4 Simulated data graph of adulteratedsamples (one class)

      表1 模擬不同種類摻假物的分類結果Table 1 Classification results of simulatedadulterants of different classes

      表2 模擬一類摻假物的分類結果Table 2 Classification results of simulatedadulterants of one class

      歸納多類分類方法的不足:首先,它依賴于定義明確的類別來訓練模型,并且決策邊界是根據(jù)來自每個類的示例樣本決定的,還需要有關摻假物的信息[7],分類結果旨在將未知數(shù)據(jù)對象分類為幾個預定義類別之一(在最簡單的二進制分類情況下為兩個)。然而當未知數(shù)據(jù)對象不屬于這些類別時,就會出現(xiàn)問題,而現(xiàn)實生活中的摻假物通常是未知的,當處理未知來源的食品完整性問題時,這種監(jiān)督方法往往會失敗。在樣本數(shù)量相對平衡的理想情況下,分類面位于分類樣本之間,能夠較好地區(qū)分開來,但在樣本數(shù)量差異較大的不平衡情況下,如果摻假樣本太少,傳統(tǒng)分類方法的分類面會明顯向少的樣本側(cè)偏移,導致分類精度較低,而在現(xiàn)實生活中常出現(xiàn)這種情況,比如機械故障檢測,網(wǎng)絡入侵檢測醫(yī)學診斷問題中,采集的樣本大部分都是正常樣本,很少出現(xiàn)異常數(shù)據(jù)。還有一種可能是異常樣本量太大,比如在人臉檢測,目標檢索和字符檢測過程中,雖然異常樣本容易獲得,但是異常樣本的類型太多,幾乎不可能全部獲得。因此,當樣本數(shù)量不平衡問題嚴重時,傳統(tǒng)分類方法不能獲得很高的分類精度。

      單類分類方法已被應用于醫(yī)學問題[13],人臉圖像識別[14],故障檢測[15],遙感分類[16]等,如下述幾種單類方法。

      1.1 數(shù)據(jù)驅(qū)動的簇類獨立軟模式(data-driven-soft independent modelling of class analogy,DD-SIMCA)

      SIMCA(簇類獨立軟模式)是一種基于主成分分析(PCA)的建模技術,采用PCA模型參數(shù)和F檢驗構造計算T2ucl和Q統(tǒng)計量作為樣本分類的新屬性, 并計算待測樣本到各類主成分空間的歐式距離作為判別類別的依據(jù), 是一種常用的分類方法[17]。

      DD-SIMCA是對原SIMCA關于構建接受邊界方式的修改,作為PCA和SIMCA的結合,用于開發(fā)一個決策規(guī)則(閾值),從所有其他樣本中劃分出目標類。該方法還提供了一個理論上的可能性計算模型的特點,如I型錯誤α和Ⅱ型錯誤β[18]。訓練數(shù)據(jù)收集在(IXJ)矩陣X中,I是樣本的數(shù)量,J是變量的數(shù)量。計算一般分為兩步,首先,DD-SIMCA將PCA應用于X矩陣。主成分(PCs)的個數(shù)A決定了模型的復雜度,該參數(shù)從根本上影響了分類的質(zhì)量。A值越大,X的大部分變化被PCA分解解釋。同時,在主成分分析中包含多余的成分可能導致模型不僅考慮了主要的類特征,而且還考慮了不相關的噪聲。因此,在選擇模型復雜度時,往往采用簡約原則。第二步,DD-SIMCA從訓練集中計算每個對象的兩個距離,即正交(歐氏)距離(OD)和分數(shù)(馬氏)距離(SD)。SD表示樣本在分數(shù)空間中的位置,OD表示樣本到分數(shù)空間的距離。DD-SIMCA發(fā)現(xiàn)了表征這些距離分布的參數(shù)的數(shù)據(jù)驅(qū)動估計,因此可以為給定的值開發(fā)一個接受區(qū)域/決策規(guī)則[19]。此外,當可選類可用時,DD-SIMCA提供了計算Ⅱ型β誤差并構建相應的擴展接受區(qū)域的可能性,保證了從備選類中接受樣本的風險不大于β[18]。分類結果用“靈敏性”(sensitivity)和“特異性”(specificity)來描述,或者用傳統(tǒng)的統(tǒng)計術語,如Ⅰ型誤差α和Ⅱ型誤差β。敏感性表示目標類中正確識別的樣本的份額。特異性是可選類對象的一部分,它被正確地標識為該類的數(shù)量。根據(jù)統(tǒng)計學術語,敏感性可定義為100(1-α)%,特異性為100(1-β)%[20]。

      1.2 單類偏最小二乘法(one-class partial least squares,OCPLS)

      雖然各種算法已經(jīng)發(fā)展起來,但最常用的仍然是偏最小二乘法(PLS),它被公認為化學計量學的基石,其理論和性質(zhì)得到了廣泛的研究[21]。

      OCPLS是一種基于PLS的特殊分類算法,被認為是SIMCA的替代方法。它是一種在化學計量學中日益受到關注的單類方法,作為一種非線性和魯棒性算法,它可以減少非線性和異常值污染數(shù)據(jù)集的影響,在建立OCPLS模型時,可以得到兩種自然距離度量。一個是基于由主要的OCPLS成分從一個樣本到類的中心跨越的分數(shù)距離(SD);另一個是響應變量為1的絕對中心殘差(ACR)??梢杂嬎愠鰳颖镜腍otelling’s T2統(tǒng)計量,并通過計算F分布可以得到SD的置信上限(UCL),再計算模型殘差。樣本的殘差可以被假定為一個正態(tài)分布,有一個估計均值和一個估計標準差。樣本的殘差可以集中為零均值。因此,可以得到類內(nèi)樣本的ACR的UCL。ACR值實際上是OCPLS回歸系數(shù)向量上投影的度量,而OCPLS模型的一個組成部分可以看作是一個樣本在訓練集的平均光譜上的投影。一般來說,類內(nèi)樣本的投影到平均頻譜上有相當長的長度和分布緊密,這意味著OCPLS組件考慮了兩者解釋方差和預測的緊致性。對于一個樣本,過大的SD或ACR值表明它明顯偏離類的大部分。根據(jù)ACR和SD的值,一個未知的測試樣本可以分配給一個四組: 正常樣本(低SD和低ACR值),壞杠桿樣本(高SD和高ACR值),良好的杠桿樣本(高SD和低ACR值)和響應異常值(低SD和高ACR值),正常樣本被視為真實樣本,而其他三種被認為是摻假的或者偽造的樣本[22]。

      1.3 單類支持向量機(one-class support vector machine,OCSVM)

      SVM(支持向量機)的目標是通過最大化分離超平面和數(shù)據(jù)之間的距離或余量,找到一個泛化誤差最小的最優(yōu)超平面[23]。

      單類支持向量機(OCSVM)是原始SVM算法的變體[24]。在高維空間中給定一組訓練數(shù)據(jù),OCSVM就是在一個變換的空間中尋找超平面,該空間將大部分數(shù)據(jù)集中的區(qū)域與其他地方分開[25]。對超平面參數(shù)進行估計,使其與訓練數(shù)據(jù)相關的余量最大化。因此,它是尋找訓練點與原點最大間隔或確定包含同一類訓練數(shù)據(jù)的最小超球體的最有效方法之一。數(shù)據(jù)分類包括檢查測試樣本是否屬于超球體。OCSVM的運行時性能取決于支持向量機的數(shù)量(SVs),這可能比訓練樣本的數(shù)量少得多。在摻假檢測的背景下,從真實樣品中識別所有可能的摻假樣品是至關重要的。實際上,OCSVM計算出容納大多數(shù)訓練點的“邊界”,如果測試樣品落在此界限內(nèi),則歸類為真實樣本;否則,它被視為摻假樣本。

      OCSVM算法是一種用途廣泛的分類器,能夠應用于負類樣本難以收集的領域中[26],已用于許多不同的領域,例如工程[27]、 地質(zhì)[28],提供了有意義的結果。盡管OCSVM在解決復雜問題方面表現(xiàn)出色,但在化學中并未得到充分利用[29],只有少數(shù)研究將該算法應用于分析目的,比如使用氣相色譜法結合OCSVM檢測芝麻油中的摻假[30],還有應用 OCSVM 作為異常值檢測器來追蹤茶葉的地理來源[31]。目前結合OCSVM和光譜學用于食品認證的化學研究還少被涉及,這也是未來趨勢。

      1.4 單類隨機森林(one-class random forests,OCRF)

      隨機森林(RF)作為通用的集成技術之一,使用隨機化產(chǎn)生不同的基于個體樹的分類器池[32]。隨機森林算法使用了兩個強大的隨機化過程: 打包(bagging)和隨機特征選擇(random feature selection, RFS)。第一個原則,bagging是在訓練集的引導副本上訓練每個單獨的樹,通常用于在各個分類器之間創(chuàng)建預期的多樣性,并且對于不穩(wěn)定的分類器特別有效,例如基于樹的分類器,其中訓練集的小變化導致預測的大變化。第二個原則,RFS是一個隨機原則,專門用于樹歸納算法。當生長成樹時,包括在樹的每個節(jié)點隨機選擇特征子集,從中選擇分裂測試。RFS有助于降維,并已被證明比單獨bagging顯著提高隨機森林精度。

      而單類隨機森林(OCRF),是在隨機森林算法的基礎上增加了原始異常值生成過程,該過程利用隨機森林算法提供的集成學習機制來減少要生成的人工異常值的數(shù)量以及生成這些異常值的特征空間的大小[33]。OCRF方法具有以下優(yōu)點: (1)組合弱分類器和不穩(wěn)定分類器的不同集合,明確提高了單個分類器的泛化性能,(2)依據(jù)訓練樣本和特征對訓練數(shù)據(jù)集進行子采樣,以便通過控制它們的位置和數(shù)量有效地生成輸出。

      2 單類分類方法在食品摻假中的應用

      2.1 食用油

      作為人體必需的三大營養(yǎng)素來源之一的食用油,其摻假是消費者和油脂加工業(yè)的首要擔憂,摻假主要有兩種類型,一種是冷榨油和精煉油的混合,一種是用便宜的食物機制代替昂貴的食物機制。

      Rodriguez等[34]用傅里葉變換紅外光譜結合OCPLS和SIMCA檢測以1%,2%,5%和10%四種不同的比例摻入到芝麻油中四種可能的摻雜物的存在。結果表明,在預測誤差1%~5%內(nèi),用這種方法檢測摻假的奇亞籽油和芝麻油是成功的,且OCPLS比SIMCA的鑒別性能稍高一點,也體現(xiàn)了單類分類方法的優(yōu)越性。Hu等[35]基于OCPLS近紅外光譜和熒光光譜數(shù)據(jù)融合,采用快速分析證實了中國油茶中摻入廉價植物油的可行性。結果表明,魯棒的OCPLS可以檢測摻有2%及以上的包括菜籽油、 葵花籽油、 玉米油和花生油的廉價油。Neves等[36]評估了傅里葉變換衰減全反射紅外光譜法結合DD-SIMCA檢測初榨椰子油的摻假性能,通過測定純油樣品和摻有油菜籽油、 玉米油、 向日葵油和大豆油樣品的紅外光譜,用單類分類模型來判定初榨椰子油的真實性和摻假性,最后以88%~100%的靈敏度和96%~100%的特異性識別摻假油。

      然而,單類分類模型也會出現(xiàn)分類效果弱于多分類情況,例如Gagneten等[37]于檢測菜籽油中的摻假物比較SIMCA,PLS-DA, DD-SIMCA 和OCPLS四種方法,結果表明用SIMCA,PLS-DA的準確率略高于DD-SIMCA 和OCPLS。分析認為某些波長不包含必要的信息,可能會干擾模型的建立步驟,而如果通過適當選擇輸入變量,選擇與目標樣品特性高度相關的波長范圍,分類結果可能會得到改善。Yuan等[38]采用近紅外光譜和OCPLS法對亞麻籽油進行多重摻假的有針對性的檢測,并且設計了一種變量選擇方法,以顯著減少變量數(shù)量,提高摻雜物檢測的準確性。

      2.2 乳制品

      為了達到質(zhì)量要求標準,乳制品的摻假主要是通過添加化合物完成,一般有為了減少微生物的數(shù)量而添加過氧化氫、 甲醛或次氯酸鈉等被歸類為防腐劑的物質(zhì),以及添加氯化鈉、 淀粉或蔗糖等被歸類為增稠劑的物質(zhì)。

      Gondim等[39]提出了一種采用中紅外光譜技術和單分類方法對牛奶中摻假成分進行序列檢測的方法。模型采用低目標摻假水平,包括甲醛、 過氧化氫、 碳酸氫鹽、 碳酸酯以及蔗糖等,因減少了所需要時間及成本和錯誤的樣本數(shù)量,這種方法被認為是一種有效的篩選方法。Muller-Maatsch等[40]將紫外可見熒光和近紅外光譜技術與單類分類方法相結合,以區(qū)分真正的脫脂奶粉和摻假奶粉,最后有86%的摻假樣品被正確地歸類為“不合格”。

      2.3 飲品

      飲料的摻假主要有兩種類型,一種是使用較便宜的水果來代替單一果漿中的主要成分,還有一種是對飲料進行有關成分,真實性或地理起源的錯誤標簽標識。

      Xu等[41]采用傅里葉變換近紅外光譜對正宗板藍根茶的成分和類別模型進行了表征,并對可能的外源性摻假物進行了檢測。采用標準正態(tài)變換(SNV)得到最精確的OCPLS模型。結果表明,SNV-OCPLS可以檢測到板藍根中摻假量在5% (W/W)以上的蘋果干皮,為板藍根茶的快速質(zhì)量控制提供了一種有用的替代工具。Xu等[42]采用熒光法和化學計量學方法研究了獼猴桃汁中多種廉價物質(zhì)同時檢測的可行性,最后得到了靈敏度為0.929的OCPLS模型。該方法可以檢測出2%以上的糖漿和人造果粉摻假,為非靶向分析摻假獼猴桃汁提供了一種快速和高靈敏的方法。Miaw等[43]采用低場核磁共振光譜評價了蘋果汁、 腰果汁和混合果汁對葡萄蜜酒的摻假。采用OCPLS,DD-SIMCA和PLS-DA等分類方法進行比較。結果表明,所有單類分類方法均具有良好的性能,分辨率高于93%,而多類方法分類結果不太滿意,這也凸顯了單類分類的優(yōu)勢。

      2.4 保健品

      藥用保健食品由于經(jīng)濟效益的原因,經(jīng)常被添加一些外觀相似的廉價材料,如粉末或提取物制造假冒偽劣的藥材制劑。

      Li等[44]采用近紅外光譜和OCPLS建立了來自不同產(chǎn)地的代表性中草藥天麻樣品的類模型,對芋頭淀粉、 甘薯淀粉、 馬鈴薯淀粉和黃精粉4種常見外源性摻假物進行了非靶向檢測。結果表明,經(jīng)過二階導數(shù)處理后的光譜OCPLS模型可以檢測出1.0%及以上的4種摻假物,靈敏度為0.910 7。Rodionova等[45]以牛至藥材摻假為例,采用判別分析和單類分類法分析了非目標分析在食品欺詐檢測中的應用所涉及的化學計量學問題。結果表明,判別方法只是部分適用于解決認證問題,DD-SIMCA是用于非目標分析的功能強大的分類器。在中國,可食燕窩作為一種珍貴的功能性產(chǎn)品,需要建立一種可靠的方法來快速鑒定。Guo等[46]采用傅里葉變換紅外光譜結合PCA,LDA,SVM和OCPLS等化學計量學方法,驗證了該系統(tǒng)識別的可行性。結果表明,OCPLS模型的預測靈敏度為0.937,特異度為0.886,對商業(yè)可食燕窩樣品的檢測有了進一步的推進。

      2.5 香辛料

      香料用來給食物調(diào)味和改善菜肴的味道,色澤是香料的主要品質(zhì)屬性之一。常見的香料摻假是添加非法染料,人為地提高和保持香料的天然色澤,或掩蓋與低價值產(chǎn)品原料的混合。此外,香料的價格通常是由它們的重量或體積決定的,而另一種常見的香料摻假是添加便宜的膨化劑。

      Horn等[47]采用傅里葉變換中紅外光譜和DD-SIMCA,基于不同預處理方法比較,建立了一種辣椒粉摻假的非靶向檢測方法,測試含1% (W/W)蘇丹Ⅰ、 1% (W/W)蘇丹Ⅳ、 3% (W/W)鉻酸鉛、 3% (W/W)氧化鉛、 5% (W/W)二氧化硅,10%的聚氯乙烯,10%的阿拉伯膠的摻假物。隨后他們[48]又將核磁共振波譜與單類分類法相結合用于辣椒粉摻假的非靶向檢測,建立的單類分類模型靈敏度為92%,適合摻假篩查和與異常值診斷相結合。

      2.6 谷物

      谷物的品質(zhì)由摻入便宜的粉末及添加劑來改變蛋白質(zhì)含量、 淀粉含量或硬度。

      Cardoso等[49]用拉曼光譜結合OCSVM和SIMCA對木薯淀粉樣品進行改性,將摻假物如小麥粉、 碳酸氫鈉等以0.5%~50%的范圍摻入木薯淀粉中。對這兩種化學計量模型進行統(tǒng)計比較,發(fā)現(xiàn)OCSVM優(yōu)于SIMCA,OCSVM檢測摻假率超過2%的可能性,而SIMCA檢測摻假率只有5%。Faqeerzada等[50]用高光譜短波紅外圖像結合DD-SIMCA對摻入不同比例花生粉的杏仁粉進行了研究,建立了PLSR模型來預測杏仁粉中摻假比例。DD-SIMCA的分類結果對不同的摻假樣本驗證集具有100%的敏感性和89%~100%的特異性。PLSR分析結果表明,每一種摻雜的杏仁粉具有較高的判定系數(shù)和較低的誤差值。Rodionova等[51]通過對大豆粕進行近紅外光譜測量和DD-SIMCA進行數(shù)據(jù)處理,鑒別出三聚氰胺、 氰尿酸和混合摻假物,證明了此方法的可靠性。

      表3整理了上述單分類方法結合光譜分析在食品摻假檢測方面應用的相關文獻。

      表3 單類分類方法結合光譜分析在食品摻假檢測方面的應用Table 3 Application of one-class classification combined with spectral analysis in food adulteration detection

      3 結 論

      光譜檢測技術是現(xiàn)階段比較常用的檢測技術,將其應用于食品質(zhì)量安全檢測中,不僅可以保證飲食安全,還能促進光譜技術的發(fā)展。隨著多元統(tǒng)計學的不斷發(fā)展,分類方法在食品質(zhì)量安全檢測方面有了更深更廣的發(fā)展空間。多類分類方法的分析過程需要復雜的統(tǒng)計方法,精準的建模和完善的算法,而單類分類方法只需要對目標類進行分類,確定好邊界后,其余可能不同的樣本都將與其分開,大大減少了分類的工作量。在現(xiàn)實生活中,可以先用此方法篩選出摻假的樣品,再對摻假樣品進行定量調(diào)查。

      在過去的幾年里,新的單類分類算法出現(xiàn)了,并在一些應用領域得到了開發(fā)。盡管單類分類領域正在變得成熟,但仍有幾個基本問題有待研究,首先注意的是單類分類的任務是在正常類周圍定義一個分類邊界,這樣它可以從正常類中接受盡可能多的對象,同時最大限度地減少接受異常對象的機會。由于只能確定邊界的一邊,因此很難根據(jù)一個類別來確定邊界在數(shù)據(jù)周圍的每個方向上的緊密程度,也更難確定應該使用哪些屬性來尋求正常和異常對象的最佳分離。特別是,當數(shù)據(jù)的邊界長且不凸時,所需的訓練對象的數(shù)量可能會非常高。所以,相對于傳統(tǒng)的多類分類算法,單類分類算法將需要更多的訓練數(shù)據(jù)。其次,分類器集成方法需要進一步探索,基于隨機子空間新技術值得關注,隨機預言集成在多類分類問題上表現(xiàn)得更好,OCRF是新出現(xiàn)的這一方面的方法,當然,還可以進行新的集成方法研究。而且在OCSVM中使用的內(nèi)核多數(shù)是線性,多項式以及高斯的,研究人員可以專注于有效調(diào)整和優(yōu)化核函數(shù)研究一些更具創(chuàng)新性的核形式。開發(fā)用于流式數(shù)據(jù)分析和在線分類的單類分類方法也是值得期待的??傊瑳]有一篇文獻指出單類分類方法要優(yōu)于多類分類方法,選擇最佳的分析和統(tǒng)計方法并不是一件容易的事情,這將取決于具體的食物真實性問題,因為所有的方法都有優(yōu)點和缺點。目前要做的,是需要不斷完善各類單類算法,并與多類分類方法相結合比較,得到對于不同類型樣品最適合的算法,取得最優(yōu)結果,進一步監(jiān)測食品的質(zhì)量安全。

      猜你喜歡
      光譜分類樣本
      基于三維Saab變換的高光譜圖像壓縮方法
      分類算一算
      用樣本估計總體復習點撥
      分類討論求坐標
      推動醫(yī)改的“直銷樣本”
      數(shù)據(jù)分析中的分類討論
      教你一招:數(shù)的分類
      隨機微分方程的樣本Lyapunov二次型估計
      村企共贏的樣本
      星載近紅外高光譜CO2遙感進展
      中國光學(2015年5期)2015-12-09 09:00:28
      象州县| 图们市| 凤山县| 德化县| 六盘水市| 安义县| 钟祥市| 兴业县| 绵竹市| 唐海县| 娱乐| 子长县| 图木舒克市| 股票| 定西市| 尉犁县| 吴忠市| 安阳县| 杭锦后旗| 河源市| 乐业县| 阳西县| 保山市| 比如县| 明光市| 临汾市| 蒲城县| 华蓥市| 平武县| 上蔡县| 葫芦岛市| 两当县| 博兴县| 五寨县| 水富县| 柘荣县| 甘谷县| 汤阴县| 三亚市| 隆尧县| 华容县|