• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于機(jī)器學(xué)習(xí)算法構(gòu)建醬鹵肉貨架期預(yù)測(cè)模型

      2024-05-16 03:34:04張慧娟黃千里徐寶才
      食品研究與開發(fā) 2024年9期
      關(guān)鍵詞:鹽水鴨醬牛肉保鮮劑

      張慧娟,黃千里,徐寶才

      (合肥工業(yè)大學(xué)食品與生物工程學(xué)院,安徽合肥 230009)

      貨架期建模是食品預(yù)測(cè)微生物學(xué)的一個(gè)新興領(lǐng)域。一般的貨架期模型通過詳細(xì)了解特定產(chǎn)品的腐敗動(dòng)力學(xué),根據(jù)供應(yīng)鏈中的環(huán)境條件數(shù)據(jù)實(shí)時(shí)預(yù)測(cè)產(chǎn)品狀態(tài)。然而,肉制品貨架期模型的建立以試驗(yàn)數(shù)據(jù)為主,只針對(duì)單一因素變化預(yù)測(cè),無法判斷多種因素變化對(duì)貨架期的影響?,F(xiàn)有的研究中,已有將機(jī)器學(xué)習(xí)算法或統(tǒng)計(jì)學(xué)習(xí)方法用于建立食品貨架期模型,例如薛建新等[1]以軟化為分類指標(biāo),分別采用非線性的最小支持二乘向量機(jī)(least square support vector machine,LSSVM)模型和線性的偏最小二乘回歸三層貝葉斯概率(probabilistic latent semantic-latent dirichlet allocation,PLS-LDA)模型建立不同貨架期沙果的分類模型;趙策等[2]以電子鼻設(shè)備對(duì)梨核進(jìn)行采樣,結(jié)合機(jī)器學(xué)習(xí)算法對(duì)3 個(gè)等級(jí)黑核梨進(jìn)行分類,為皇冠梨進(jìn)行品質(zhì)檢測(cè)。以上研究均需要通過開展wet-lab 試驗(yàn)獲得原始數(shù)據(jù)。

      肉制品科學(xué)發(fā)展過程中積累了大量研究數(shù)據(jù),利用數(shù)據(jù)挖掘技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行分析和挖掘,進(jìn)一步發(fā)現(xiàn)變化規(guī)律和趨勢(shì),有助于制定更科學(xué)、精準(zhǔn)的保鮮策略。文本挖掘是從文本數(shù)據(jù)中獲取有價(jià)值信息和知識(shí),并通過計(jì)算機(jī)發(fā)現(xiàn)以前未知的新信息的方法,包括信息檢索、信息提取和數(shù)據(jù)挖掘等過程[3]。Thavorn 等[4]在Web of Science 數(shù)據(jù)庫中通過對(duì)生鮮農(nóng)產(chǎn)品保質(zhì)期延長(zhǎng)技術(shù)進(jìn)行科學(xué)計(jì)量和文本挖掘,以解決水果保藏問題。Luong 等[5]采用關(guān)鍵詞搜索、專家咨詢和文本挖掘相結(jié)合的方法研究肉制品的腐敗發(fā)生時(shí)間與儲(chǔ)藏條件、微生物因素、肉品類型等各個(gè)影響因素間的關(guān)系。

      本文將機(jī)器學(xué)習(xí)算法和文本挖掘技術(shù)融入醬鹵肉制品貨架期預(yù)測(cè)研究中,基于原始數(shù)據(jù)收集,通過機(jī)器學(xué)習(xí)算法,以貨架期為目標(biāo)變量,通過多種特征(包括包裝方式、儲(chǔ)藏溫度、保鮮劑種類和二次殺菌方式)來構(gòu)建預(yù)測(cè)醬鹵肉制品的貨架期模型。首先通過比較各種編碼方法,并選擇效果較優(yōu)的方法作為非數(shù)量特征的編碼方式。繼而比較多種分類算法,選擇性能最優(yōu)的模型,并分析最優(yōu)模型在不同貨架期分類中的表現(xiàn)。最后,對(duì)最優(yōu)模型在實(shí)際產(chǎn)品(醬牛肉和鹽水鴨)中的性能進(jìn)行測(cè)試,分析應(yīng)用潛能,以期為食品生產(chǎn)、加工和銷售等領(lǐng)域提供有價(jià)值的指導(dǎo)。

      1 材料與方法

      1.1 原料、試劑與設(shè)備

      牛腱肉、整鴨白條、鹵料、蔥、姜、八角、茴香:市售;生抽、老抽:佛山市海天調(diào)味食品股份有限公司。

      乳酸鏈球菌素(Nisin)、聚賴氨酸(均為分析純):浙江新銀象生物工程有限公司;殼聚糖(分析純):阿拉丁生化科技股份有限公司;平板計(jì)數(shù)瓊脂(plate count agar,PCA)培養(yǎng)基:廣東環(huán)凱微生物科技有限公司。

      潔凈工作臺(tái)(AlphaClean 1300):力康精密科技(上海)有限公司;微生物培養(yǎng)箱(DR-H20):廣東德瑞檢測(cè)設(shè)備有限公司。

      1.2 數(shù)據(jù)來源

      醬鹵肉制品的文獻(xiàn)數(shù)據(jù)均來自于Web of Science核心數(shù)據(jù)庫和中國(guó)知網(wǎng)(China National Knowledge Internet,CNKI)。因醬鹵肉制品種類較多,單一檢索無法得到完全結(jié)果,建立復(fù)合檢索式:“stewed beef” OR “braised beef” OR “spiced beef” OR “sauce beef” OR “stewed chicken” OR “boiled chicken” OR “roast chicken” OR “braised chicken” OR “spiced chicken” OR “smoked chicken” OR “salted chicken” OR “stewed duck” OR “boiled duck” OR “roast duck” OR “braised duck” OR “spiced duck” OR “brine duck” OR “salted duck” OR “hemp duck” OR “stewed pork” OR “boiled pork” OR “braised pork” OR “spiced pork” OR “stewed meat” OR “boiled meat” OR “braised meat” OR “Yao meat”;時(shí)間跨度為2000 年至2022 年,文獻(xiàn)類型選擇“article”,一共檢索到6 384 篇文獻(xiàn)。在CNKI 數(shù)據(jù)庫中主題檢索:“醬鹵肉” OR “鹵牛肉” OR “醬牛肉” OR “燒雞” OR “鹽水鴨” OR “扒雞” OR “肉凍” OR “肴肉”,一共有328 個(gè)結(jié)果。繼而基于以下標(biāo)準(zhǔn)對(duì)所獲文獻(xiàn)進(jìn)一步篩選:1)研究對(duì)象為醬鹵肉;2)明確醬鹵肉制品儲(chǔ)藏條件;3)研究包括儲(chǔ)藏期間細(xì)菌總數(shù)的測(cè)定;4)僅保留研究性論文。經(jīng)整理,最終獲得119 篇與醬鹵肉制品貨架期研究相關(guān)的文獻(xiàn),共收集樣本量271 例。肉制品微生物的生長(zhǎng)和繁殖受多種因素的影響,包括貯藏溫度、包裝方式、保鮮劑種類和二次殺菌方式等,具體詳見表1。

      表1 原始數(shù)據(jù)集中不同影響因素組成Table 1 Different influencing factors composition in original dataset

      1.3 數(shù)據(jù)整理

      為便于運(yùn)用機(jī)器學(xué)習(xí)構(gòu)建醬鹵肉制品貨架期預(yù)測(cè)模型,需要對(duì)樣本數(shù)據(jù)進(jìn)行整理。首先,將貨架期(微生物總數(shù)達(dá)到105CFU/g 的時(shí)間)設(shè)為目標(biāo)變量,并將其分為8 個(gè)等級(jí),其中貨架期在1~5 d 內(nèi)為Ⅰ級(jí),6~10 d 內(nèi)為Ⅱ級(jí),11~15 d 內(nèi)為Ⅲ級(jí),16~20 d 內(nèi)為Ⅳ級(jí),21~25 d 內(nèi)為Ⅴ級(jí),26~30 d 內(nèi)為Ⅵ級(jí),31~60 d 內(nèi)為Ⅶ級(jí),>60 d 為Ⅷ級(jí)。其次,考慮的影響因素為包裝方式、儲(chǔ)藏溫度、保鮮劑種類和二次殺菌方式,將這4 個(gè)因素設(shè)為特征變量。

      由于很多機(jī)器學(xué)習(xí)算法要求輸入數(shù)據(jù)是數(shù)值型,因此需要將非數(shù)值型變量轉(zhuǎn)換為數(shù)值型變量[6]。分別采用5 種不同的編碼方式對(duì)特征變量賦值,包括JamesStein、BaseNEncoder、TargetEncoder、OrdinalEncoder、PolynomialEncoder。(https://www.kaggle.com/code/arashnic/an-overview-of-categorical-encoding-methods)。

      1.4 模型構(gòu)建

      為構(gòu)建醬鹵肉制品貨架期預(yù)測(cè)模型,選用5 種機(jī)器學(xué)習(xí)算法,包括隨機(jī)森林算法(RandomForest)[7]、邏輯回歸(LogisticRegression)[8]、K 最近鄰算法(K-nearest neighbors,KNN)[9]、多層感知機(jī)分類器(multilayer perceptron classifier,MLPClassifier)[10]和XGBoost[11]。開發(fā)語言為Python 3.7.16,利用scikit-learn 庫的train_test_split 函數(shù),將數(shù)據(jù)集按照70%用于訓(xùn)練和30%用于測(cè)試的比例進(jìn)行隨機(jī)劃分。為優(yōu)化模型參數(shù),采用網(wǎng)格搜索法(GridSearchCV)來在所有候選參數(shù)組合中選擇最佳參數(shù)[12]。此外,使用5-折交叉驗(yàn)證法(Cross-Validation)來驗(yàn)證模型準(zhǔn)確度,這種方法將整個(gè)數(shù)據(jù)集分成5 份,每次選擇其中1 份作為測(cè)試集,剩余4 份作為訓(xùn)練集;通過計(jì)算模型在測(cè)試集上的得分,并記錄每次迭代的分?jǐn)?shù),最后對(duì)這些分?jǐn)?shù)求平均值。比較不同模型的平均交叉驗(yàn)證得分,可以判斷哪種模型在預(yù)測(cè)醬鹵肉制品貨架期方面表現(xiàn)最佳[13]。

      1.5 模型評(píng)價(jià)

      為評(píng)估、比較不同模型的綜合能力和性能,更好地為醬鹵肉制品行業(yè)提供有效的貨架期預(yù)測(cè)模型,選取準(zhǔn)確度(Accuracy)、精確度(Precision)、召回率(Recall)和F1-score 為評(píng)價(jià)指標(biāo)。此外,使用受試者工作特征曲線(receiver operating characteristic curve,ROC)來分析模型的預(yù)測(cè)效能,以及曲線下面積(area under curve,AUC)來判定預(yù)測(cè)能力的大小,AUC 值越大,表明模型的預(yù)測(cè)能力越強(qiáng)[14]。相關(guān)性能指標(biāo)的定義和計(jì)算方法如下:

      1)準(zhǔn)確度(Accuracy):分類正確的樣本占總樣本個(gè)數(shù)的比例。

      2)精確度(Precision,查準(zhǔn)率):分類正確的正樣本個(gè)數(shù)占分類器判定為正樣本的樣本個(gè)數(shù)的比例。

      3)召回率(Recall,查全率):分類正確的正樣本個(gè)數(shù)占總的正樣本個(gè)數(shù)的比例。

      4)F1-score:精確度和召回率的調(diào)和平均值,兼顧了分類模型的準(zhǔn)確率和召回率。

      1.6 模型驗(yàn)證

      為驗(yàn)證模型在預(yù)測(cè)不同類型醬鹵肉制品貨架期方面的準(zhǔn)確性和穩(wěn)定性,選擇兩種廣泛消費(fèi)的醬鹵肉制品(醬牛肉和鹽水鴨)為對(duì)象,選取4 個(gè)影響因素(包裝方式、儲(chǔ)藏溫度、保鮮劑種類和二次殺菌方式)的不同水平,制作醬牛肉和鹽水鴨。通過對(duì)這些不同處理?xiàng)l件下制作的實(shí)際樣品的貨架期進(jìn)行測(cè)試,能夠更好地了解模型在實(shí)際應(yīng)用中的優(yōu)缺點(diǎn),從而為未來研究和模型改進(jìn)提供方向。

      1.6.1 醬牛肉制作

      將5 kg 牛腱肉放入清水中浸泡3 h,每隔1 h 換一次水,去除血水和雜質(zhì)。然后,把牛腱肉切成合適大小的塊狀,用適量生抽、老抽進(jìn)行腌制,放入冰箱隔夜取出。腌制后的牛肉焯水,撇去浮沫。制備鹵料,把鹵料放入水中加熱,水溫升至65~70 ℃放入焯水后的牛肉,小火煮制時(shí)間為3~4 h。煮制完成后取出牛肉并于室溫下冷卻。將醬牛肉樣品分別浸泡在Nisin、ε-聚賴氨酸、殼聚糖溶液中20 min,撈出后瀝干,立即進(jìn)行真空包裝和托盤包裝,分別在4 ℃和25 ℃下儲(chǔ)藏。

      1.6.2 鹽水鴨制作

      選擇市售的鴨肉,把八角、茴香炒制過的鹽涂擦在鴨體內(nèi)腔和體表,堆碼腌制。然后,將干腌后的鴨肉放入制備好的鹵水中進(jìn)行濕腌。將濕腌后的鴨胚放入4 ℃冷庫里滴掛12 h 后再進(jìn)行煮制。煮制過程中加蔥、姜、八角,待水煮沸后,將鴨放入鍋中,加熱升溫至85 ℃時(shí)小火悶煮60 min,即可起鍋[15]。將鹽水鴨樣品分別浸泡在Nisin、ε-聚賴氨酸、殼聚糖溶液中20 min,撈出后瀝干,立即進(jìn)行真空包裝和托盤包裝,分別在4 ℃和25 ℃下儲(chǔ)藏。

      1.6.3 微生物數(shù)量測(cè)定

      根據(jù)GB/T 4789.2—2022《食品安全國(guó)家標(biāo)準(zhǔn)食品微生物學(xué)檢驗(yàn)菌落總數(shù)測(cè)定》方法測(cè)定保鮮劑處理后的醬鹵肉和鹽水鴨的菌落總數(shù)。

      2 結(jié)果與分析

      2.1 醬鹵肉制品的貨架期分布

      不同儲(chǔ)藏條件下,醬鹵肉制品的貨架期,即細(xì)菌總數(shù)達(dá)到105CFU/g 時(shí)間差異較大。所收集的數(shù)據(jù)顯示,醬鹵肉制品最長(zhǎng)的儲(chǔ)存時(shí)間為270 d,而常溫條件下,大多數(shù)醬鹵肉制品在第1 天細(xì)菌總數(shù)就超過了規(guī)定值。根據(jù)前期收集的醬鹵肉制品貨架期數(shù)據(jù),對(duì)其進(jìn)行分析,結(jié)果如圖1 所示。

      圖1 醬鹵肉制品的貨架期分布圖Fig.1 Shelf-life distribution chart of marinated meat products

      由圖1 可知,醬鹵肉制品的貨架期主要集中在Ⅰ級(jí)至Ⅵ級(jí)。其中,Ⅱ級(jí)(6~10 d)的貨架期占比最高,共有75 個(gè)樣品。這表明大部分醬鹵肉制品的貨架期在10 d以內(nèi),這可能與醬鹵肉制品的保鮮方式和食品安全要求有關(guān)[16]。此外,從Ⅰ級(jí)到Ⅲ級(jí)的貨架期分布來看,隨著貨架期的延長(zhǎng),樣品數(shù)量逐漸減少。這可能表明,為了滿足市場(chǎng)需求和保證食品安全,生產(chǎn)商和經(jīng)銷商傾向于選擇較短的貨架期。然而,也有一定數(shù)量的樣品具有較長(zhǎng)的貨架期(Ⅶ級(jí)和Ⅷ級(jí))。這些較長(zhǎng)貨架期的產(chǎn)品可能采用了更為先進(jìn)的保鮮技術(shù)或特殊的加工工藝,以確保產(chǎn)品在長(zhǎng)時(shí)間內(nèi)保持良好品質(zhì)[17]。這部分產(chǎn)品可能適用于遠(yuǎn)程運(yùn)輸或長(zhǎng)期儲(chǔ)存的場(chǎng)景,以滿足不同市場(chǎng)的需求??梢?,大部分醬鹵肉制品的貨架期較短,且隨著貨架期的延長(zhǎng),樣品數(shù)量逐漸減少。這一現(xiàn)象可能與保鮮技術(shù)、市場(chǎng)需求和食品安全等多種因素有關(guān)。因此,在構(gòu)建貨架期預(yù)測(cè)模型中,將考慮4 個(gè)主要影響因素,包括包裝方式、儲(chǔ)藏溫度、保鮮劑種類和二次殺菌方式。

      2.2 模型構(gòu)建

      2.2.1 不同特征編碼方法的效果比較

      由于影響貨架期的4 個(gè)主要影響因素為分類特征,因此在建模之前需要對(duì)它們進(jìn)行特征編碼,將分類特征轉(zhuǎn)換為數(shù)值特征,以便于模型的訓(xùn)練和預(yù)測(cè)[18]。為了找到適合本研究的特征編碼方法,對(duì)5 種編碼方法進(jìn)行比較,包括JamesStein、BaseNEncoder、TargetEncoder、OrdinalEncoder、PolynomialEncoder。這些編碼方法各自具有不同的特點(diǎn)和優(yōu)勢(shì),可以滿足不同的建模需求和數(shù)據(jù)特征[19]。不同特征編碼方式對(duì)模型訓(xùn)練和預(yù)測(cè)的準(zhǔn)確率影響見圖2。

      圖2 不同編碼方法的效果比較Fig.2 Comparison of the effects of different encoding methods

      從圖2 可以看出,JamesStein 編碼在多數(shù)機(jī)器學(xué)習(xí)方法中表現(xiàn)較好,特別是在隨機(jī)森林算法(Random-Forest)和KNN 中,準(zhǔn)確率分別為0.91 和1.00(最高準(zhǔn)確率)。TargetEncoder 編碼在MLPClassifier 和LogisticRegression 中表現(xiàn)較好,準(zhǔn)確率分別為0.93 和0.75。OrdinalEncoder 和PolynomialEncoder 編碼在某些機(jī)器學(xué)習(xí)方法中表現(xiàn)較好,但在其他方法中準(zhǔn)確率較低。BaseNEncoder 編碼在大多數(shù)情況下表現(xiàn)一般,但在隨機(jī)森林方法中的準(zhǔn)確率為0.77,相對(duì)較高??梢?,不同編碼方法的表現(xiàn)有明顯差異,選擇合適的特征編碼對(duì)于提高預(yù)測(cè)準(zhǔn)確性至關(guān)重要。由于JamesStein 編碼在大多數(shù)情況下具有較高的準(zhǔn)確率,在后續(xù)的機(jī)器學(xué)習(xí)過程中使用JamesStein 編碼作為特征編碼方法。

      2.2.2 不同預(yù)測(cè)模型的性能比較

      為比較不同機(jī)器學(xué)習(xí)算法在目標(biāo)數(shù)據(jù)集上的表現(xiàn),分析RandomForest、KNN、邏輯回歸(LogisticRegression)、多層感知機(jī)分類器(MLPClassifier)、XGboost在數(shù)據(jù)集上的預(yù)測(cè)性能,結(jié)果如圖3 所示。

      圖3 不同預(yù)測(cè)模型的性能(準(zhǔn)確度、精確度、AUC 值和F1-score)比較Fig.3 Comparison of performance(accuracy,precision,AUC and F1-score)of different prediction models

      由圖3 可知,隨機(jī)森林在準(zhǔn)確度(Accuracy)、精確度(Precision)、AUC 和F1-score 指標(biāo)上的表現(xiàn)均優(yōu)于其他方法,分別為0.95、0.97、0.99 和0.91,顯示出較好的預(yù)測(cè)性能。邏輯回歸和多層感知機(jī)分類器次之。K最近鄰算法的F1-score(0.71)相對(duì)較低。XGBoost 在本試驗(yàn)中表現(xiàn)較差,準(zhǔn)確度、精確度、AUC 和F1-score均較低,其精確率僅為0.23。

      首先,RandomForest 表現(xiàn)出最佳的預(yù)測(cè)性能,這可能歸因于它的集成學(xué)習(xí)策略,通過組合多個(gè)決策樹來降低過擬合風(fēng)險(xiǎn)和提高預(yù)測(cè)準(zhǔn)確性[20]。LogisticRegression 和多層感知機(jī)分類器(MLPClassifier)具有相似的較高準(zhǔn)確度,表明它們?cè)陬A(yù)測(cè)貨架期方面具有一定潛力。然而,邏輯回歸通常對(duì)線性可分問題有較好的處理能力,而貨架期預(yù)測(cè)可能涉及非線性關(guān)系。相較而言,多層感知機(jī)分類器(基于神經(jīng)網(wǎng)絡(luò)的方法)可能更適合捕捉數(shù)據(jù)中的復(fù)雜模式[21]。KNN 在AUC 值上表現(xiàn)較好,但在準(zhǔn)確度和F1-score 上相對(duì)較低。這可能與該方法對(duì)異常值和噪聲敏感有關(guān)[22]。KNN 的實(shí)際應(yīng)用中,可能需要進(jìn)一步優(yōu)化K 值和距離度量方式以提高預(yù)測(cè)性能。XGBoost 在本試驗(yàn)中表現(xiàn)較差,未來可以嘗試使用網(wǎng)格搜索或貝葉斯優(yōu)化等技術(shù)對(duì)模型參數(shù)進(jìn)行調(diào)優(yōu)[23]??傊?,不同機(jī)器學(xué)習(xí)算法在預(yù)測(cè)醬鹵肉制品貨架期方面有其獨(dú)特的優(yōu)勢(shì)和局限性。綜合試驗(yàn)結(jié)果,由于隨機(jī)森林算法(RandomForest;主要參數(shù):n_estimators=500,min_sam-ples_leaf=1,random_state=200)在準(zhǔn)確度、精確度、AUC 和F1-score 方面均表現(xiàn)出較好的性能,選其進(jìn)行醬鹵肉制品貨架期的預(yù)測(cè)和后續(xù)的驗(yàn)證試驗(yàn)。

      2.2.3 較優(yōu)模型的性能分析

      為進(jìn)一步分析所構(gòu)建的隨機(jī)森林模型在不同貨架期分類上的表現(xiàn),基于不同類的預(yù)測(cè)結(jié)果構(gòu)建混淆矩陣,如圖4 所示。

      圖4 隨機(jī)森林模型在貨架期預(yù)測(cè)中各等級(jí)的表現(xiàn)(混淆矩陣圖)Fig.4 Performance analysis of random forest model on shelf-life prediction across different levels:A confusion matrix visualization

      從圖4 對(duì)角線元素可以看出,模型在Ⅰ、Ⅱ、Ⅲ、Ⅳ和Ⅷ類別上的預(yù)測(cè)準(zhǔn)確性較高,這表明模型對(duì)這些貨架期分類的預(yù)測(cè)能力較強(qiáng)。然而,在Ⅴ、Ⅵ和Ⅶ類別上表現(xiàn)次之。觀察混淆矩陣的非對(duì)角線元素可見,在Ⅴ和Ⅵ類別上存在一定程度的預(yù)測(cè)誤差。例如,Ⅴ類別中有2 個(gè)樣本被錯(cuò)誤地預(yù)測(cè)為Ⅵ類別,Ⅵ類別中有1 個(gè)樣本被錯(cuò)誤地預(yù)測(cè)為Ⅴ類別??赡芤?yàn)檫@些類別的樣本數(shù)量較少,模型在學(xué)習(xí)過程中未能充分捕捉到這些類別的特征[24];也可能是由于這兩類貨架期數(shù)據(jù)之間存在一定的相似性,導(dǎo)致模型在區(qū)分這些類別時(shí)出現(xiàn)困難。此外,醬鹵肉制品的貨架期也受到制作過程和制作環(huán)境的影響。例如,低溫真空包裝的醬鹵肉制品的貨架期主要集中在16~20 d,而低溫普通包裝的鹵牛肉貨架期在20 d 左右[25]。然而,針對(duì)燒雞的儲(chǔ)藏試驗(yàn)表明,真空包裝低溫儲(chǔ)藏后僅1 d 細(xì)菌總數(shù)就超過了臨界值[26]。隨機(jī)森林模型在不同貨架期分類上的預(yù)測(cè)性能存在差異,這可能與研究中提到的貨架期與制作過程和制作環(huán)境之間的關(guān)系有關(guān)?;谶@些可能的原因,未來可以嘗試相應(yīng)策略,如采用過采樣或欠采樣方法來平衡各個(gè)等級(jí)的樣本數(shù)量,從而提高模型在這些等級(jí)上的預(yù)測(cè)性能[27];將與制作過程和制作環(huán)境相關(guān)的特征納入模型;進(jìn)一步挖掘各個(gè)等級(jí)之間的差異,以便更好地理解模型在預(yù)測(cè)貨架期時(shí)可能遇到的挑戰(zhàn)。隨機(jī)森林模型在貨架期預(yù)測(cè)中的ROC 分析見圖5。

      圖5 隨機(jī)森林模型在貨架期預(yù)測(cè)中各等級(jí)的ROC 分析Fig.5 ROC for random forest model in shelf-life prediction across different levels

      從圖5 可以看出,隨機(jī)森林模型在8 個(gè)貨架期分類中的整體表現(xiàn)非常優(yōu)秀。其中,除了Ⅳ和Ⅴ類別的AUC 值分別為0.99 和0.98 之外,其他類別的AUC 值均達(dá)到了1.00。AUC 值較高意味著模型具有較好的分類性能和預(yù)測(cè)能力[28]。結(jié)合前面的混淆矩陣結(jié)果,可以看出隨機(jī)森林模型在大部分貨架期分類上的預(yù)測(cè)準(zhǔn)確性較高。然而,結(jié)合混淆矩陣結(jié)果,在Ⅳ和Ⅴ類別上,模型的預(yù)測(cè)性能略有下降??紤]到這兩個(gè)類別的貨架期為21~30 d(21~25 d 范圍內(nèi)為Ⅴ級(jí),26~30 d范圍內(nèi)為Ⅵ級(jí)),這兩個(gè)類別之間的特征分布可能存在一定的重疊,導(dǎo)致模型難以區(qū)分這兩個(gè)類別[29]??梢?,結(jié)合ROC 曲線的AUC 值和混淆矩陣結(jié)果,對(duì)于現(xiàn)有數(shù)據(jù)集,隨機(jī)森林模型在不同貨架期分類上的表現(xiàn)尚佳。

      2.3 模型驗(yàn)證

      為測(cè)試所構(gòu)建的隨機(jī)森林模型在實(shí)際產(chǎn)品的貨架期預(yù)測(cè)中的表現(xiàn),選擇兩種廣泛消費(fèi)的醬鹵肉制品(醬牛肉和鹽水鴨)為對(duì)象,選取4 個(gè)影響因素(包裝方式、儲(chǔ)藏方式、保鮮劑和二次殺菌)的不同水平,制作醬牛肉和鹽水鴨。對(duì)這些不同處理?xiàng)l件下制作的實(shí)際樣品的貨架期進(jìn)行測(cè)定,并與預(yù)測(cè)值進(jìn)行比較,結(jié)果見圖6。

      圖6 醬牛肉實(shí)際貨架期與隨機(jī)森林模型貨架期預(yù)測(cè)對(duì)比Fig.6 Comparison for the actual shelf-life of marinated beef and the shelf-life prediction of random forest model

      如圖6 所示,在醬牛肉中的測(cè)試結(jié)果顯示,在儲(chǔ)藏溫度為0~4 ℃的條件下,醬牛肉在普通包裝和真空包裝下的預(yù)測(cè)貨架期與實(shí)際貨架期一致,符合預(yù)測(cè)范圍。然而,當(dāng)使用殼聚糖作為保鮮劑時(shí),貨架期的實(shí)際值與預(yù)測(cè)值存在一定差異。這可能與殼聚糖作為一種天然的抗菌劑,在加工過程中對(duì)貨架期的影響更為顯著,導(dǎo)致模型的預(yù)測(cè)效果相對(duì)較差。在25~30 ℃的儲(chǔ)藏條件下,模型對(duì)貨架期的預(yù)測(cè)表現(xiàn)較為準(zhǔn)確,實(shí)際貨架期與預(yù)測(cè)值基本相符。這說明,隨機(jī)森林模型在預(yù)測(cè)室溫條件下醬鹵肉制品的貨架期方面具有較高的準(zhǔn)確性。

      對(duì)鹽水鴨樣品進(jìn)行的貨架期測(cè)試結(jié)果見圖7。

      圖7 鹽水鴨實(shí)際貨架期與隨機(jī)森林模型貨架期預(yù)測(cè)對(duì)比Fig.7 Comparison for the actual shelf-life of salted duck and the shelf-life prediction of random forest model

      由圖7 可知,除兩例外,隨機(jī)森林模型在其他情況下都能夠準(zhǔn)確預(yù)測(cè)。在低溫儲(chǔ)藏條件下,保鮮劑的使用以及包裝方式都對(duì)貨架期產(chǎn)生了明顯影響,延長(zhǎng)了鹽水鴨的保質(zhì)期,這與文獻(xiàn)[30]中的研究結(jié)果相符。普通包裝下,加入保鮮劑可以顯著延長(zhǎng)鹽水鴨的貨架期,而真空包裝進(jìn)一步提高了貨架期。在室溫條件下,不論包裝方式和保鮮劑的使用,鹽水鴨的貨架期均顯著縮短,這表明環(huán)境溫度對(duì)貨架期具有重要影響。

      3 結(jié)論

      在本研究基于原始數(shù)據(jù)收集,通過機(jī)器學(xué)習(xí)方法,構(gòu)建了一個(gè)預(yù)測(cè)醬鹵肉制品的貨架期模型。此模型以貨架期為目標(biāo)變量,基于多種特征(包括包裝方式、儲(chǔ)藏溫度、保鮮劑種類和二次殺菌方式等)來預(yù)測(cè)醬鹵肉制品的貨架期。通過比較多種編碼方法,選用"James-Stein"編碼作為特征數(shù)據(jù)的編碼方式,以便更好地應(yīng)對(duì)分類變量的多樣性。在比較了多種分類算法的表現(xiàn)后,本研究選定了隨機(jī)森林作為最優(yōu)模型。進(jìn)一步法分析了隨機(jī)森林模型在8 個(gè)貨架期分類中的表現(xiàn),證實(shí)了模型的優(yōu)越性能,表明模型在預(yù)測(cè)醬鹵肉制品貨架期方面具有較高的可靠性。為驗(yàn)證模型在實(shí)際產(chǎn)品中的表現(xiàn),本研究選取了兩種廣泛消費(fèi)的醬鹵肉制品(醬牛肉和鹽水鴨)作為試驗(yàn)對(duì)象,通過對(duì)不同處理?xiàng)l件下制作的實(shí)際樣品的貨架期進(jìn)行測(cè)定,并與預(yù)測(cè)值進(jìn)行比較,發(fā)現(xiàn)隨機(jī)森林模型在預(yù)測(cè)醬牛肉和鹽水鴨的貨架期方面具有較高的準(zhǔn)確性。

      猜你喜歡
      鹽水鴨醬牛肉保鮮劑
      低鈉醬牛肉煮制液中替代鹽配方優(yōu)化
      Celebrating Chinese New Year in Nanjing
      鹽水鴨里的南京味道
      金橋(2022年9期)2022-09-20 05:51:32
      基于模糊數(shù)學(xué)的醬牛肉感官綜合評(píng)判研究
      有趣,才是婚姻的保鮮劑
      海峽姐妹(2019年2期)2019-03-23 02:55:34
      別把蛤蟆油當(dāng)青春保鮮劑
      低溫微波處理對(duì)醬牛肉保質(zhì)期的影響
      食品界(2016年10期)2016-09-10 07:22:44
      山雞椒精油微膠囊大米保鮮劑的研制
      鮮切花化學(xué)保鮮劑的研究進(jìn)展
      江蘇:為鹽水鴨制定安全標(biāo)準(zhǔn)百克鹽含量不超過4.5克
      广元市| 上饶市| 泸州市| 商丘市| 仙桃市| 满城县| 专栏| 阜宁县| 尤溪县| 铜鼓县| 沂水县| 晴隆县| 搜索| 柳林县| 兰考县| 舟曲县| 纳雍县| 喀喇沁旗| 博爱县| 砚山县| 达尔| 濉溪县| 曲周县| 松江区| 东乌珠穆沁旗| 阳春市| 鹤山市| 双桥区| 喜德县| 衢州市| 建湖县| 枣强县| 天门市| 柯坪县| 新化县| 乡宁县| 韶山市| 松江区| 辛集市| 溧水县| 静海县|