• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      食品安全風(fēng)險預(yù)警領(lǐng)域大數(shù)據(jù)挖掘的應(yīng)用

      2021-11-21 19:20:51陳愷周小蕙王明慧
      電子技術(shù)與軟件工程 2021年18期
      關(guān)鍵詞:決策樹貝葉斯數(shù)據(jù)挖掘

      陳愷 周小蕙 王明慧

      (1.貴州省分析測試研究院 貴州省貴陽市 550000 2.貴州貴科大數(shù)據(jù)有限責(zé)任公司 貴州省貴陽市 550000)

      在當(dāng)前形勢下,我國社會主義市場經(jīng)濟(jì)獲得了全面提高和發(fā)展,互聯(lián)網(wǎng)的應(yīng)用也更加普遍,并在人們的日常工作和生活中,發(fā)揮著重要作用。計算機(jī)和互聯(lián)網(wǎng)在不同領(lǐng)域的使用,有助于為其儲存大量的有用數(shù)據(jù),為了將這些數(shù)據(jù)的使用價值充分發(fā)揮出來,需不斷整合和處理各個行業(yè)的數(shù)據(jù),然后將其運用于各個行業(yè)中,促進(jìn)其進(jìn)一步發(fā)展,在這種形勢下,大數(shù)據(jù)被提出。近年來,食品安全問題頻發(fā),極大的損害了消費者的權(quán)益,也對民生安全造成了嚴(yán)重威脅,因此,當(dāng)前社會逐漸意識到食品安全風(fēng)險預(yù)警的重要性。借助大數(shù)據(jù)技術(shù),建立健全的食品安全風(fēng)險預(yù)警機(jī)制,也成為一項迫在眉睫的重任,本文對此作一探討和研究,內(nèi)容如下。

      1 大數(shù)據(jù)概述

      大數(shù)據(jù)的概念較為抽象,結(jié)合字面含義進(jìn)行分析,表示數(shù)據(jù)更具多元化、規(guī)模更具龐大化。當(dāng)前,大數(shù)據(jù)的定義尚未統(tǒng)一。就當(dāng)前的百科來講,其認(rèn)為大數(shù)據(jù)作為一種重要的信息資產(chǎn),具有較高的增長率、多樣化的類型及海量的容量,而為了進(jìn)一步提升其洞察力、決策力及優(yōu)化流程的能力,還需創(chuàng)新處理模式。簡單來講,即通過采取相關(guān)的措施,來達(dá)到較高的洞察力、決策能力以及對工作流程優(yōu)化的相關(guān)數(shù)據(jù),其共包含5 方面特征,即大量性、真實性、多樣性、高速性及低價值密度。最初,大數(shù)據(jù)經(jīng)常在開源項目Nutch 中被使用,其大數(shù)據(jù)具有相對簡單的定義,即為了進(jìn)一步更新網(wǎng)絡(luò)的搜索功能,而發(fā)揮分析和批量處理作用的龐大數(shù)據(jù)。截止到當(dāng)前,大數(shù)據(jù)的應(yīng)用愈加廣泛,且在多個行業(yè)領(lǐng)域中都發(fā)揮出了重要作用,市場競爭也逐漸演變?yōu)樾畔?shù)據(jù)之間的競爭。經(jīng)過不斷的創(chuàng)新和發(fā)展,大數(shù)據(jù)更加完善,且作為一種重要資產(chǎn),隱藏著較大的潛在價值和深遠(yuǎn)意義。

      科學(xué)技術(shù)的不斷進(jìn)步和發(fā)展,促使計算機(jī)硬件設(shè)備也更加完善,能夠儲存大量的數(shù)據(jù)信息,并形成數(shù)據(jù)庫,當(dāng)前需加強對這些數(shù)據(jù)的研究和運用,充分發(fā)揮其價值和作用。在此形勢下,大數(shù)據(jù)挖掘技術(shù)應(yīng)運而生,可靈活發(fā)揮沉積數(shù)據(jù)的價值,使其作為一種有效的知識資源。大數(shù)據(jù)挖掘技術(shù)表示在計算機(jī)技術(shù)的作用下,將數(shù)據(jù)庫中的一些潛在信息和價值挖掘出來,并對其發(fā)展趨勢進(jìn)行分析和預(yù)測。

      2 常用的幾種大數(shù)據(jù)挖掘技術(shù)及其在食品安全行業(yè)的具體應(yīng)用

      伴隨當(dāng)今計算機(jī)硬件領(lǐng)域的持續(xù)、穩(wěn)定化發(fā)展,許多功能強大且實用性突出的數(shù)據(jù)收集設(shè)備、儲存介質(zhì)等,在多個領(lǐng)域中得到不錯應(yīng)用,強力推動了數(shù)據(jù)庫領(lǐng)域的發(fā)展與繁榮,致使大量數(shù)據(jù)、信息在數(shù)據(jù)庫當(dāng)中得以儲存。需要指出的是,在大數(shù)據(jù)庫當(dāng)中,許多數(shù)據(jù)由于未能充分利用,因而最終轉(zhuǎn)變成了“數(shù)據(jù)墳?zāi)埂?,在此狀況下,怎樣讓此些數(shù)據(jù)重新“蘇醒”,把數(shù)據(jù)墳?zāi)瓜蚰切└邇r值屬性的知識“金塊”進(jìn)行轉(zhuǎn)變,人們需要采取各種可行措施,有效解決此類問題,而大數(shù)據(jù)挖掘技術(shù)的出現(xiàn),便能夠較好的將數(shù)據(jù)與知識間的鴻溝給消除掉,乃是把數(shù)據(jù)相知識進(jìn)行轉(zhuǎn)變的重要手段。需指出的是,大數(shù)據(jù)挖掘?qū)嶋H就是把那些處于隱藏狀態(tài)的信息,從數(shù)據(jù)庫當(dāng)中進(jìn)行提取,然后借助開發(fā)計算機(jī)程序,從數(shù)據(jù)庫當(dāng)中進(jìn)行自動、有目的性挖掘,以此找出或明確規(guī)律的一種手段。需強調(diào)的是,若能夠在海量的數(shù)據(jù)挖掘當(dāng)中,找出明顯的模式,那么此些模式便能夠被總結(jié)、理解與設(shè)計,并且還能夠用于預(yù)測未來大規(guī)模的數(shù)據(jù)。大數(shù)據(jù)挖掘方式以常規(guī)數(shù)據(jù)挖掘為基礎(chǔ),而對于數(shù)據(jù)挖掘技術(shù)而言,則由多學(xué)科、多領(lǐng)域先進(jìn)技術(shù)集成而得到,較常用的有高性能計算、模式識別、統(tǒng)計學(xué)等。而比較常用的機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘技術(shù)有人工神經(jīng)網(wǎng)絡(luò)、決策樹等。

      2.1 貝葉斯網(wǎng)絡(luò)

      貝葉斯網(wǎng)絡(luò)最早是在1988年被提出的,其表示模式象征著一種不確定性,其本質(zhì)代表著一種因果關(guān)系,且是賦值的,具體表現(xiàn)為有向無環(huán)圖(DGA),全稱為directed acyclic graph。一個變量對應(yīng)一個網(wǎng)絡(luò)中的結(jié)點,表示一個事件。在貝葉斯網(wǎng)絡(luò)中,各個變量之間弧的變化規(guī)則,可將一些不確定的內(nèi)在概率較好的表達(dá)出來,從而更好的闡述導(dǎo)致事件發(fā)生的因果因素。貝葉斯網(wǎng)絡(luò)可將數(shù)據(jù)域中不同數(shù)據(jù)的概率情況及關(guān)聯(lián),更好的展現(xiàn)出來,從而更加充分的揭示其中的概率情況。貝葉斯網(wǎng)絡(luò)模型簡潔易懂,通過分析行為、結(jié)果,并對其因果關(guān)系進(jìn)行探討,以此來預(yù)測和分析其中的可能性結(jié)果。貝葉斯網(wǎng)絡(luò)的使用,可對有缺陷的數(shù)據(jù)進(jìn)行完善,并在其它技術(shù)的協(xié)助下,進(jìn)一步分析因果情況。此外,貝葉斯網(wǎng)絡(luò)還可有效連接先驗知識和數(shù)據(jù),并防治其擬合過度。

      在食品行業(yè)中,貝葉斯網(wǎng)絡(luò)大都被運用在食品產(chǎn)品的設(shè)計過程中。例如,在創(chuàng)建與食品相關(guān)的貝葉斯網(wǎng)絡(luò)模型時,若了解人們對甜食的偏愛,則在樣本中列舉食品時,除了需要列舉甜食外,還需舉例受歡迎的食品,而使用貝葉斯網(wǎng)絡(luò)推斷其受歡迎情況時,則需考慮到食品顏色的影響作用。傳統(tǒng)的專家推薦系統(tǒng)是出于規(guī)則考慮而制定的,劃分方式按模塊劃分,其中不包含與數(shù)據(jù)源或其他規(guī)則相關(guān)的內(nèi)容,則無法對相似問題進(jìn)行處理,可借助貝葉斯網(wǎng)絡(luò)中的條件概率。此外,在風(fēng)險評價概率統(tǒng)計模型方面,貝葉斯網(wǎng)絡(luò)也更具代表性,可用于預(yù)估食品供應(yīng)鏈的風(fēng)險概率。在評價事件的風(fēng)險概率時,可通過對食品供應(yīng)鏈中的一些風(fēng)險因素進(jìn)行分析,如資金流、信息流或物流信息等,并據(jù)此創(chuàng)建貝葉斯網(wǎng)絡(luò)模型。初始事件不同時,食品供應(yīng)鏈的回應(yīng)也有所不同,從而導(dǎo)致不同的發(fā)展過程和結(jié)果。為了得出食品的風(fēng)險值,可通過分析貝葉斯網(wǎng)絡(luò)不同節(jié)點的條件概率情況,來將聯(lián)合概率計算出來。

      2.2 決策樹

      決策樹作為一種常見的歸納推理算法,常被應(yīng)用于機(jī)器研究和學(xué)習(xí)過程中,采用的方式為逐漸朝離散值函數(shù)進(jìn)行逼近,首先將較小的“樹”選擇出來,決策樹采用學(xué)習(xí)中提到的某種函數(shù)表示。決策樹可充分結(jié)合噪聲的數(shù)據(jù)特點和規(guī)律,從而總結(jié)出相應(yīng)的表達(dá)式。且在決策樹的根節(jié)點和葉子節(jié)點上,都分別排列著一個相應(yīng)的實例。決策樹經(jīng)判定后,對各個實例進(jìn)行分類,并將分類特點借助葉子節(jié)點來表示。在分類實例時,首先需劃分決策樹的根節(jié)點,然后將與實例相應(yīng)的屬性值選擇出來,并結(jié)合其對應(yīng)的樹枝繼續(xù)。更換決策樹實例,并對以上步驟進(jìn)行根循環(huán),從而得到分類后的實例情況。結(jié)合根部至葉子節(jié)點的順序,來得到不同規(guī)則的集合,從而對樣本數(shù)據(jù)規(guī)則進(jìn)行概括和歸納,并對每個樣本的屬性進(jìn)行了解,此外,還可對新樣本的屬性進(jìn)行預(yù)測。

      決策樹分析法在解決決策問題時,主要遵循的邏輯思維方式為樹狀法,決策方法主要依據(jù)對風(fēng)險的分析展開。具體應(yīng)用到食品行業(yè)時,決策樹可用于評估農(nóng)產(chǎn)品食品的安全情況,針對一些數(shù)據(jù),會對農(nóng)產(chǎn)品質(zhì)量安全造成影響,采用降維方法預(yù)處理該數(shù)據(jù),并總結(jié)出對質(zhì)量安全影響較大的特征值,在組合優(yōu)化決策樹的前提下,建立判定農(nóng)產(chǎn)品質(zhì)量安全的模型,決策樹的屬性可選擇影響農(nóng)產(chǎn)品質(zhì)量的因素,如土壤PH、地下水重金屬含量及種植規(guī)模情況等。劃分?jǐn)?shù)據(jù)樣本為兩類,即訓(xùn)練集和測試集,經(jīng)訓(xùn)練后,得到集合后的規(guī)則。在決策樹模型中輸入測試過程中的各個數(shù)據(jù)樣本,并將其準(zhǔn)確率計算出來,判斷農(nóng)產(chǎn)品質(zhì)量安全風(fēng)險能否使用決策樹進(jìn)行評估和判定。此外,在某個具體的檢測指標(biāo)中,也可使用決策樹,如對油炸性方便面的質(zhì)量進(jìn)行評定等。

      2.3 人工神經(jīng)網(wǎng)絡(luò)

      人工神經(jīng)網(wǎng)絡(luò)的出處為生物學(xué),該數(shù)據(jù)挖掘方式具有相對較高的學(xué)習(xí)精度,具體建模方式來源于生物學(xué)中相互連接神經(jīng)元之間的網(wǎng)絡(luò)組成情況。神經(jīng)網(wǎng)絡(luò)可對數(shù)據(jù)中存在的錯誤進(jìn)行不斷學(xué)習(xí)和優(yōu)化,并通過不斷提升精準(zhǔn)度,來加強對數(shù)據(jù)的了解,從而將其中隱藏的規(guī)律總結(jié)出來,因此,截止到現(xiàn)在,人工神經(jīng)網(wǎng)絡(luò)在多個領(lǐng)域中都發(fā)揮出了重要作用。目前,預(yù)計有10 多種人工神經(jīng)網(wǎng)絡(luò)模型被創(chuàng)建出來,其中最為常見的一種為反向傳播(BP)神經(jīng)網(wǎng)絡(luò),在不同的層級中都分布有神經(jīng)元,且每個層級中至少含有一個神經(jīng)元,有的還具有多個神經(jīng)元。每個神經(jīng)元中分布著數(shù)量一定的輸入值和輸出值,其中輸入值也可與上一層神經(jīng)元的輸出相對應(yīng),而輸出值也可作為輸入值,傳輸?shù)较乱粚由窠?jīng)元。每個層級的神經(jīng)元,都會交互相鄰層級的各個神經(jīng)元,并通過不同的操作,對所提供的的數(shù)據(jù)集進(jìn)行深入學(xué)習(xí),如正向傳播、調(diào)整權(quán)值和反向傳播等,從而實現(xiàn)對模型進(jìn)行優(yōu)化的目的。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力具有非常強的健壯性,該方式可更好的實現(xiàn)向量值、實數(shù)值及離散值的逼近。

      BP 神經(jīng)網(wǎng)絡(luò)對非線性函數(shù)具有高度的映射功能,其在信息的儲存方面具有相對較廣的分布,且可以更好的并行處理大規(guī)模的數(shù)據(jù),具有較好的抗干擾能力和適應(yīng)能力,而以上優(yōu)勢在很大程度上提升了其學(xué)習(xí)能力。針對不確定問題的處理,BP 神經(jīng)網(wǎng)絡(luò)作為一種人工智能處理方式,具有相對較高的解決能力,在結(jié)合主成分分析的基礎(chǔ)上,該方法還可用于研究鑒別近紅外光譜蘋果品種的方式,具體使用時,首先結(jié)合主成分分析方式,對蘋果聚類并將其近紅外指紋圖譜得出,從而獲得對蘋果品種具有敏感反應(yīng)的波段,采用特征波段圖譜將其輸入到神經(jīng)網(wǎng)絡(luò)中,輸出品種,創(chuàng)建相應(yīng)的模型,并經(jīng)大量訓(xùn)練后,進(jìn)一步預(yù)測未知樣品情況。采用以上方式進(jìn)行判定時,可極大的提升對品種識別的準(zhǔn)確概率。此外,BP 神經(jīng)網(wǎng)絡(luò)還經(jīng)常被用于以下數(shù)據(jù)分析和挖掘中,如預(yù)測分析大米直鏈淀粉含量情況、預(yù)測冬小麥的耗水特性等。因此,其在食品安全當(dāng)中,有著良好的應(yīng)用效能與價值。

      BP 神經(jīng)網(wǎng)絡(luò)具有訓(xùn)練速度快、準(zhǔn)確率高及健壯性強等優(yōu)點,因而與其它數(shù)據(jù)挖掘方式相比較,要更具優(yōu)勢;另外,BP 神經(jīng)網(wǎng)絡(luò)的靈活性較強,新的訓(xùn)練數(shù)據(jù)集能夠比較方便的用于模型訓(xùn)練中,因而有助于模型準(zhǔn)確性的提升,適用于食品安全風(fēng)險預(yù)警領(lǐng)域。

      3 結(jié)語

      綜上,食品安全問題作為一項關(guān)乎民生的大事,與人們的身體健康和生命安全密切相關(guān)。由于食品的種類和加工工序相對繁多和復(fù)雜,在展開數(shù)據(jù)挖掘和分析研究的過程中,需加強對多種食品的探討。大數(shù)據(jù)時代的到來,為食品行業(yè)的健康有序發(fā)展提供了有利條件,將大數(shù)據(jù)應(yīng)用在食品安全風(fēng)險預(yù)警中,可有效緩解和改善食品安全問題,從而充分確保人們的生命安全。本文主要結(jié)合三種常用的大數(shù)據(jù)挖掘技術(shù)進(jìn)行了探討,以期能夠更好的促進(jìn)食品安全問題的研究工作。

      猜你喜歡
      決策樹貝葉斯數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      貝葉斯公式及其應(yīng)用
      基于決策樹的出租車乘客出行目的識別
      基于貝葉斯估計的軌道占用識別方法
      一種基于貝葉斯壓縮感知的說話人識別方法
      電子器件(2015年5期)2015-12-29 08:43:15
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      始兴县| 大洼县| 定边县| 宾川县| 肥城市| 抚宁县| 安龙县| 青川县| 广元市| 博乐市| 德江县| 淮南市| 克东县| 大港区| 洪湖市| 石泉县| 平度市| 德江县| 建昌县| 九台市| 桂林市| 什邡市| 甘谷县| 松桃| 任丘市| 阆中市| 吴桥县| 隆化县| 荔波县| 灵山县| 革吉县| 类乌齐县| 驻马店市| 耿马| 靖宇县| 特克斯县| 梁平县| 保德县| 焦作市| 巴楚县| 田阳县|