方永美+熊俊濤+楊振剛+廖鑒康
摘要:蔬菜是人們?nèi)粘I畹谋仨毱?,也是容易出現(xiàn)質(zhì)量安全問題的產(chǎn)品。影響蔬菜質(zhì)量安全的一個(gè)重要因素就是農(nóng)藥殘留問題。以蔬菜農(nóng)藥殘留檢測(cè)數(shù)據(jù)為對(duì)象,利用貝葉斯網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)挖掘,得到不同品種蔬菜的農(nóng)藥殘留含量分布,以及同一品種在不同時(shí)間的分布趨勢(shì),經(jīng)過可信度分析,該結(jié)論可信。該結(jié)果可為蔬菜的生產(chǎn)者、消費(fèi)者以及監(jiān)管人員提供一定的決策依據(jù)。
關(guān)鍵詞:數(shù)據(jù)挖掘;貝葉斯網(wǎng)絡(luò);農(nóng)藥殘留;質(zhì)量
中圖分類號(hào):TS201.6;R857.3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2016)23-6253-05
DOI:10.14088/j.cnki.issn0439-8114.2016.23.063
Abstract: Vegetable is one of the necessities of peoples daily life. It is also prone to occurring quality and safety issues. It is pesticide residue that was one of the important factors which effects on the vegetable quality and safety. Bayesian network of data mining technology is applied to mining the limited assay information of vegetable. It got to pesticide residues distribution for varieties of vegetables, and the same vegetable distribution trends in different months. The results are credible and can offer some decision for producers, consumers and supervisors of vegetable quality and safety.
Key words: data mining;bayesian network;pesticide residue;quality
隨著社會(huì)的發(fā)展和生活水平的提高,人們對(duì)蔬菜產(chǎn)品安全的關(guān)注與日俱增,影響蔬菜質(zhì)量安全的一個(gè)重要因素就是農(nóng)藥殘留問題。以蔬菜農(nóng)藥殘留監(jiān)測(cè)為基礎(chǔ)的蔬菜安全風(fēng)險(xiǎn)分析作為現(xiàn)代蔬菜安全管理工作的發(fā)展方向,正逐步成為各國(guó)遵循的準(zhǔn)則和行為規(guī)范[1]。Li等[2]研究認(rèn)為,中國(guó)食品安全保障體系的標(biāo)準(zhǔn)陳舊且執(zhí)行不嚴(yán)謹(jǐn)。Rudder[3]通過對(duì)蔬菜的銷售渠道進(jìn)行研究發(fā)現(xiàn),農(nóng)民把蔬菜賣給生產(chǎn)廠商來降低安全責(zé)任。
周潔紅等[4]以經(jīng)濟(jì)學(xué)為理論基礎(chǔ),提出了以批發(fā)市場(chǎng)為核心實(shí)施蔬菜質(zhì)量安全可追溯體系是現(xiàn)階段建設(shè)蔬菜質(zhì)量安全管理的最有效方法。劉中華[5]認(rèn)為供貨商對(duì)蔬菜質(zhì)量管理意識(shí)的缺乏以及對(duì)供貨商的約束力不足導(dǎo)致出現(xiàn)差異。樊紅平等[6]用系統(tǒng)理論分析了農(nóng)產(chǎn)品檢驗(yàn)檢測(cè)體系構(gòu)成及其功能。樊孝鳳[7]從信息不對(duì)稱理論的角度,著重解釋了中國(guó)蔬菜農(nóng)殘普遍超標(biāo)的現(xiàn)象。許宇飛[8]認(rèn)為,對(duì)食品安全狀態(tài)評(píng)價(jià)應(yīng)根據(jù)各污染物的限量標(biāo)準(zhǔn)進(jìn)行逐級(jí)評(píng)價(jià);秦燕等[9]提出運(yùn)用控制圖方法來監(jiān)測(cè)食品安全質(zhì)量是否處于控制狀態(tài)。王志剛[10]利用Probit模型對(duì)影響消費(fèi)者農(nóng)產(chǎn)品質(zhì)量安全的認(rèn)知和購買行為的主要影響因素進(jìn)行了解析。
大部分研究采用傳統(tǒng)方法,難以滿足對(duì)蔬菜農(nóng)藥殘留檢測(cè)數(shù)據(jù)的深度分析需求。國(guó)內(nèi)開展對(duì)DMKD(數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn))的研究稍晚,沒有形成整體力量[11]。有關(guān)蔬菜質(zhì)量安全方面應(yīng)用數(shù)據(jù)挖掘技術(shù)的研究鮮見報(bào)道[12]。陳晨等[13]采用貝葉斯分類算法,以玉米生長(zhǎng)環(huán)境和質(zhì)量數(shù)據(jù)庫為對(duì)象,對(duì)新生長(zhǎng)環(huán)境下玉米的生長(zhǎng)質(zhì)量進(jìn)行挖掘。劉春玲等[14]認(rèn)為,在農(nóng)業(yè)領(lǐng)域積累的大量農(nóng)業(yè)數(shù)據(jù)信息中運(yùn)用數(shù)據(jù)挖掘是極具應(yīng)用前景的方案。本研究以山東省煙臺(tái)市的蔬菜檢測(cè)數(shù)據(jù)為對(duì)象,運(yùn)用貝葉斯網(wǎng)絡(luò)方法進(jìn)行數(shù)據(jù)挖掘,得出蔬菜質(zhì)量安全的規(guī)律以及趨勢(shì),以期為蔬菜農(nóng)藥殘留檢測(cè)數(shù)據(jù)分析提供參考。
1 數(shù)據(jù)獲取
數(shù)據(jù)均來自煙臺(tái)蔬菜質(zhì)量安全信息網(wǎng),數(shù)據(jù)的時(shí)間覆蓋范圍是從自2006年7月到2013年2月(除2009年9、10月外),共78期抽檢信息。記錄項(xiàng)目包括檢測(cè)時(shí)間、檢測(cè)地點(diǎn)、品種、平均酶抑制率和平均合格率。
平均酶抑制率是決定了蔬菜農(nóng)藥殘留的量化標(biāo)準(zhǔn),根據(jù)國(guó)家頒布的農(nóng)藥殘留檢測(cè)條例,如果檢測(cè)得出酶抑制率超過50%則認(rèn)定為農(nóng)藥殘留超標(biāo),評(píng)定結(jié)果為不合格。使用Weka3.6[15]作為數(shù)據(jù)挖掘工具,在對(duì)數(shù)據(jù)進(jìn)行挖掘前,要對(duì)收集的數(shù)據(jù)進(jìn)行集中、整合、清理。
對(duì)收集的每月原始數(shù)據(jù)進(jìn)行集中、整合。把整合后的數(shù)據(jù)轉(zhuǎn)換成XLS文件,并由XLS文件轉(zhuǎn)換成Weka能識(shí)別的CSV文件;通過Weka的Explorer運(yùn)行CSV文件,并將其另存為ARFF文件。圖1是Explorer運(yùn)行CSV文件后成功讀取數(shù)據(jù)的結(jié)果。從圖1中可以看到,該文件中數(shù)據(jù)數(shù)量為3 768。
2 數(shù)據(jù)處理
2.1 屬性選擇
通過分析原始實(shí)例得到5個(gè)屬性值。
1)地點(diǎn)屬性:文化路市場(chǎng)、三環(huán)市場(chǎng)、大世界市場(chǎng)、紅利市場(chǎng)、前進(jìn)路市場(chǎng)、新橋市場(chǎng)、煙大市場(chǎng)、祥和市場(chǎng)、宏達(dá)市場(chǎng)、其他地點(diǎn),共10個(gè)可取值,是名詞性屬性,沒有殘缺值。
2)品種屬性:韭菜、黃瓜、生菜、油菜、茼蒿、芹菜、蕓菜、菠菜、其他蔬菜,共9個(gè)可選值,是名詞性屬性,沒有殘缺值。
3)時(shí)間屬性:2006年7月~2013年2月(除2009年9、10月外),以月為單位,共78個(gè)可選值,沒有殘缺值。
4)平均酶抑制率和平均合格率屬性都是數(shù)值性屬性,區(qū)間在[0,100],單位是百分比。
5)平均酶抑制率是根據(jù)抽檢單位抽檢統(tǒng)計(jì)而來的直接數(shù)據(jù)。平均合格率只是平均酶抑制率的另一個(gè)反映,因此,平均合格率是冗余屬性,在處理過程中不考慮,通過Weka中的Remove按鈕刪除。處理后,得到4個(gè)屬性,分別為品種、地點(diǎn)、時(shí)間和平均酶抑制率。
2.2 數(shù)據(jù)清理
經(jīng)過檢查,實(shí)例集中一共有109個(gè)殘缺值,約占2.9%,且其屬性均為平均酶抑制率。黃瓜和蕓豆中的平均酶抑制率的殘缺值最多,并且多集中在煙大市場(chǎng)、文化路市場(chǎng);其原因是這兩個(gè)品種的供應(yīng)量很少,導(dǎo)致抽檢量也少。平均酶抑制率作為類屬性,其值的缺失使得該實(shí)例失去了參考意義。因此,刪除這兩個(gè)市場(chǎng)的黃瓜和蕓豆實(shí)例,實(shí)例數(shù)量分布如表1所示。
對(duì)于連續(xù)抽檢實(shí)例集,還需考察各個(gè)屬性的實(shí)例數(shù)量比例情況。表1中所示的品種為菠菜、地點(diǎn)為宏達(dá)市場(chǎng)的實(shí)例數(shù)較少,分別只有23個(gè)和8個(gè)。這2種實(shí)例會(huì)給挖掘算法帶來較大的誤差率。通過查初始數(shù)據(jù)得知,菠菜的抽檢只在2006年7月到2006年10月進(jìn)行,而宏達(dá)市場(chǎng)的抽檢則只在2007年8月進(jìn)行。在一共78個(gè)抽檢月里,這些實(shí)例屬于少數(shù),從實(shí)例的健壯性考慮,刪除地點(diǎn)是宏達(dá)市場(chǎng)和品種是菠菜的實(shí)例。
2.3 屬性離散
在進(jìn)行相關(guān)數(shù)據(jù)挖掘前,對(duì)平均酶抑制率進(jìn)行離散化。由于平均酶抑制率為50%是一個(gè)閾值,因此只需進(jìn)行等區(qū)間劃分,使用過濾器Discretize功能實(shí)現(xiàn),結(jié)果如表2所示。區(qū)間內(nèi)數(shù)值的單位是百分比。平均酶抑制率越小,代表其農(nóng)藥殘留成分越低。由于平均酶抑制率大于或等于50%的蔬菜不能食用,對(duì)區(qū)間進(jìn)行修正。首先,將50以上的三個(gè)區(qū)間合并成一個(gè)區(qū)間;其次,要把“-∞”替換成最小值“0”,把“∞”替換成最大值“100”。得到一個(gè)四區(qū)間的分布。為方便起見,把區(qū)間[0,16.666 667)、[16.666 667,
33.333 333)、[33.333 333,50)、[50,100]分別稱為A類、B類、C類、D類。A類代表農(nóng)藥殘留水平是最低,其次是B類,兩者都是可以放心食用的類別。C類是一個(gè)警戒的農(nóng)藥殘留水平;對(duì)于D類,平均酶抑制率超過50%,不能食用。
2.4 數(shù)據(jù)轉(zhuǎn)換
通過數(shù)據(jù)轉(zhuǎn)換,得到2個(gè)一樣的實(shí)例集:數(shù)值型版本實(shí)例集和名詞型版本實(shí)例集。除了表現(xiàn)形式,其他方面完全一樣。名詞型版本中,包括品種、地點(diǎn)、年份、月份、平均酶抑制率5個(gè)屬性;數(shù)值型版本中,共有40個(gè)屬性,其中品種有9個(gè)、地點(diǎn)有10個(gè)、年份有8個(gè)、月份有12個(gè)以及平均酶抑制率。得到這2個(gè)實(shí)例集后,將這些實(shí)例的順序隨機(jī)打亂,將排序的影響降到最小。用Randomize過濾器進(jìn)行順序隨機(jī)化。
3 蔬菜質(zhì)量安全趨勢(shì)的數(shù)據(jù)挖掘
3.1 運(yùn)行貝葉斯網(wǎng)絡(luò)
貝葉斯網(wǎng)絡(luò)是一種基于統(tǒng)計(jì)理論,具有較強(qiáng)理論根基,采用圖解方式表達(dá)概率分布的方法。貝葉斯網(wǎng)絡(luò)畫出的圖形就像是節(jié)點(diǎn)網(wǎng)絡(luò)圖,每個(gè)節(jié)點(diǎn)代表一個(gè)屬性,節(jié)點(diǎn)間用有方向的連線連接著,卻不能形成環(huán),是一個(gè)有向無環(huán)圖[15]。
在Weka當(dāng)中,選取貝葉斯網(wǎng)絡(luò)分類器(Bayes Net),將初始累計(jì)值alpha設(shè)置為0.5以避免零頻率;選擇K2算法并將最大父輩節(jié)點(diǎn)數(shù)量設(shè)為1;在useADTree中選擇true,以減少搜索算法重復(fù)搜索這個(gè)實(shí)例集的次數(shù)。點(diǎn)擊OK按鈕,算法開始工作。選擇visualize graph,查看到網(wǎng)絡(luò)結(jié)構(gòu),如圖2所示。
分別運(yùn)行圖2中的平均酶抑制率節(jié)點(diǎn)、月份節(jié)點(diǎn)、地點(diǎn)節(jié)點(diǎn)、品種節(jié)點(diǎn)、年份節(jié)點(diǎn),將會(huì)出現(xiàn)各屬性的概率密度。點(diǎn)擊平均酶抑制率節(jié)點(diǎn),出現(xiàn)總體實(shí)例集在各個(gè)區(qū)間的分布概率,其在A類(0,16.666 667)的概率是0.268,B類[16.666 667, 33.333 333)的概率是0.586,C類[33.333 333,50)的概率是0.144,D類[50,100]的概率是0.002。實(shí)例大部分處于A、B類,說明蔬菜農(nóng)藥殘留程度總體上不高。
3.2 可信度分析
點(diǎn)擊Summary,得到貝葉斯網(wǎng)絡(luò)的基礎(chǔ)評(píng)估信息,其相關(guān)系數(shù)達(dá)到84.2%,Kappa統(tǒng)計(jì)量是70.1%。從正確的肯定率來看,貝葉斯網(wǎng)絡(luò)對(duì)A類的正確肯定率為69.3%,其對(duì)A類的錯(cuò)誤肯定率只有4.9%。對(duì)B類、C類的正確肯定率則較高,分別達(dá)到92.6%和78.6%。ROC Area方面,在A類、B類、C類均達(dá)到了91%以上,取得比較好的效果。
3.3 蔬菜質(zhì)量安全分析
3.3.1 單個(gè)屬性分析 運(yùn)行圖2中的月份節(jié)點(diǎn),得到關(guān)于平均酶抑制率在不同月的概率密度,結(jié)果如圖3所示。從圖3分析得到,7、8月的總體平均酶抑制率最高,以其為中軸,其他月的情況逐漸好轉(zhuǎn)。7、8月C類的概率較高;5、6月D類的概率較高。總體來講,從5月到9月,屬于C、D類的概率較大,說明蔬菜的農(nóng)藥殘留水平超標(biāo)的風(fēng)險(xiǎn)增加。這是因?yàn)檫@個(gè)時(shí)間段氣溫轉(zhuǎn)高、濕度適宜,是害蟲的發(fā)育階段,危害最為嚴(yán)重,相應(yīng)地,菜農(nóng)對(duì)蔬菜的用藥量也大幅度提高。處于一年中的年首和年尾的蔬菜農(nóng)藥殘留較低。
運(yùn)行圖2中的地點(diǎn)節(jié)點(diǎn),得到關(guān)于平均酶抑制率在不同地點(diǎn)的概率密度,結(jié)果如圖4所示。從圖4可以看出,對(duì)于地點(diǎn)而言,祥和市場(chǎng)蔬菜的總體平均酶抑制率偏低。祥和市場(chǎng)中,A類的概率密度遠(yuǎn)遠(yuǎn)高于其他市場(chǎng),其次是煙大市場(chǎng)、新橋市場(chǎng)、大世界市場(chǎng)。高危的是紅利市場(chǎng)、文化路市場(chǎng),在這些地點(diǎn)平均酶抑制率偏高的概率密度較大。尤其是紅利市場(chǎng),C類的實(shí)例占到了一半以上。D類的5個(gè)實(shí)例中有2個(gè)就屬于紅利市場(chǎng),2個(gè)是文化路市場(chǎng),1個(gè)是新橋市場(chǎng)。
運(yùn)行圖2中的品種節(jié)點(diǎn),得到關(guān)于平均酶抑制率在不同蔬菜品種間的概率密度,結(jié)果如圖5所示。從圖5可以看出,平均酶抑制率較低的分別是蕓豆、生菜、茼蒿以及其他蔬菜;平均酶抑制率較高的分別是韭菜、油菜、黃瓜、芹菜。韭菜屬于C類的概率密度超過其他品種。
對(duì)于葉菜類蔬菜,如油菜,容易生蟲子,對(duì)這類蟲害的處理方法一般是葉面噴灑農(nóng)藥;因此,葉菜類一般比根莖類蔬菜的農(nóng)藥殘留多。黃瓜作為瓜果類蔬菜的一種,比較特殊,由于生長(zhǎng)的環(huán)境濕度較大,容易生病,對(duì)其用藥量一般較大。一般認(rèn)為,像韭菜這類辛辣類蔬菜或者鱗莖類蔬菜具有較好的抗蟲害能力;實(shí)際上,韭菜的農(nóng)藥殘留問題一般比較嚴(yán)重。因?yàn)榫虏藭?huì)受到韭蛆的危害,為了消滅地下的蟲害,不得不使用更多劑量的農(nóng)藥;一些菜農(nóng)甚至采用大面積、大劑量地使用有毒的有機(jī)磷農(nóng)藥灌地,從而導(dǎo)致農(nóng)藥殘留的情況比較嚴(yán)重。
3.3.2 綜合分析 對(duì)品種屬性與地點(diǎn)屬性的關(guān)系,以及品種屬性與月份屬性的關(guān)系進(jìn)行分析。設(shè)總體實(shí)例關(guān)于平均酶抑制率的概率為Pr(總體)(表3),不同蔬菜品種在不同地點(diǎn)的概率為Pr(地點(diǎn)/品種),關(guān)于品種的概率為Pr(品種),按照條件概率計(jì)算并作歸一化處理,分別得到每個(gè)市場(chǎng)的各個(gè)蔬菜品種的概率。以紅利市場(chǎng)為例,分析結(jié)果如表3所示。
在紅利市場(chǎng)上,韭菜、黃瓜在C類(排名分別為1、2)和D類(排名分別為2、1)排名靠前,而在A類(排名分別為8、7)、B類(排名分別為7、7)的排名靠后,說明這些品種的蔬菜農(nóng)藥殘留水平較高,而生菜、蕓豆、茼蒿等則相反。
韭菜所含的農(nóng)藥殘留總體水平較高,但并不是所有市場(chǎng)上的韭菜的農(nóng)藥殘留都高。點(diǎn)擊地點(diǎn)、品種屬性,從其運(yùn)行結(jié)果中摘錄得到韭菜所含農(nóng)藥殘留水平在不同市場(chǎng)的分布,如圖6所示。從圖6可以看出,韭菜實(shí)例在祥和市場(chǎng)上屬于A類的比例最多,其次是煙大市場(chǎng)。而紅利市場(chǎng)最差,其主要屬于C類和D類。這表明,即使是同一品種的蔬菜,其在不同市場(chǎng)的平均酶抑制率水平也不相同。
另外,總體較安全的蔬菜,并不是在任何時(shí)期都很安全。相同品種的蔬菜,在不同月農(nóng)藥殘留水平也不一樣。設(shè)Pr(總體)、Pr(月份︳品種)和Pr(品種),進(jìn)行條件概率運(yùn)算,然后做歸一化處理。以黃瓜為例,其趨勢(shì)如圖7所示。從圖7中可知,黃瓜的平均酶抑制率在A類的概率從一月開始逐漸下降,一直到8月達(dá)到最低,之后呈升高趨勢(shì);B類和C類隨著時(shí)間的變化呈上升趨勢(shì)。說明,黃瓜的安全性越來越低,其原因是夏季蔬菜上市的季節(jié),同時(shí)也是蟲害多發(fā)季節(jié),菜農(nóng)使用農(nóng)藥增多。
4 小結(jié)
通過貝葉斯網(wǎng)絡(luò)的數(shù)據(jù)挖掘工具的分析,得出如下結(jié)論:①在品種分類問題上一些蔬菜如生菜、蕓豆等的酶抑制率水平相對(duì)較低,而韭菜等則處于一個(gè)非常警戒的水平;②在以地點(diǎn)作為分類,祥和市場(chǎng)、煙大市場(chǎng)等市場(chǎng)的平均酶抑制率水平比較低,而其他地點(diǎn)、文化路市場(chǎng)、紅利市場(chǎng)等其平均酶抑制率水平則相對(duì)較高;③在時(shí)間方面,平均酶抑制率呈現(xiàn)出較大的季節(jié)性規(guī)律,每年的5月平均酶抑制率開始升高,直到9月開始回落;④在品種與地點(diǎn)之間的聯(lián)系上,通過分析韭菜在其他地點(diǎn)的平均酶抑制率分布區(qū)間的概率密度發(fā)現(xiàn),即使韭菜總體被認(rèn)為農(nóng)藥殘留水平較高的蔬菜,在祥和市場(chǎng)還是值得信賴;⑤在品種和時(shí)間之間的聯(lián)系,通過對(duì)蔬菜在各月的平均酶抑制率水平變化情況進(jìn)行分析,探討其季節(jié)規(guī)律,以黃瓜為例,分析其在受到季節(jié)因素影響的大??;⑥在品種和地點(diǎn)、時(shí)間的聯(lián)系,以韭菜為例,結(jié)合了地點(diǎn)和時(shí)間,分析了對(duì)韭菜最佳的選取方案。
參考文獻(xiàn):
[1] 李泰然.中國(guó)食源性疾病現(xiàn)狀及管理建議[J].中華流行病學(xué)雜志,2003,24(8):651-653.
[2] LI B,MA C L,GONG S L,et al. Food safety assurance systems in China[J].Food Control,2007(18):480-484.
[3] RUDDER A.Food safety and the risk assessment of ethnic minority food retail businesses[J].Food Control,2006(17):189-196.
[4] 周潔紅,張仕都.蔬菜質(zhì)量安全可追溯體系建設(shè):基于供貨商和相關(guān)管理部門的二維視角[J].農(nóng)業(yè)經(jīng)濟(jì)問題,2011(1):32-39.
[5] 劉中華.蔬菜質(zhì)量安全可追溯體系建設(shè)研究[D].青島:中國(guó)海洋大學(xué),2012.
[6] 樊紅平,王 敏,王 芳,等.中美農(nóng)產(chǎn)品質(zhì)量安全檢驗(yàn)檢測(cè)體系比較研究[J].家畜生態(tài)報(bào),2008,29(6):1-5,12.
[7] 樊孝鳳.我國(guó)生鮮蔬菜質(zhì)量安全治理的逆向選擇研究[D].武漢:華中農(nóng)業(yè)大學(xué),2007.
[8] 許宇飛.沈陽市主要農(nóng)產(chǎn)品污染調(diào)查及防治途徑的研究[J].農(nóng)業(yè)環(huán)境保護(hù),1996,15(1):32-35.
[9] 秦 燕,李 輝,李 聰.控制圖分析在食品安全預(yù)警中的應(yīng)用[J].中國(guó)公共衛(wèi)生,2004,20(9):1089-1090.
[10] 王志剛.食品安全的認(rèn)知和消費(fèi)決定:關(guān)于天津市個(gè)體消費(fèi)者的實(shí)證分析[J].中國(guó)農(nóng)村經(jīng)濟(jì),2003(4):41-48.
[11] 陳卓民.數(shù)據(jù)挖掘技術(shù)在國(guó)內(nèi)外的研究和發(fā)展現(xiàn)狀[J].青年文學(xué)家,2009(16):122-123.
[12] 邢平平,施鵬飛,熊范綸.數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)數(shù)據(jù)中的有效應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2001,37(2):4-6.
[13] 陳 晨,董 倩,吳玉潔.基于貝葉斯分類的農(nóng)作物產(chǎn)品質(zhì)量挖掘研究[J].安徽農(nóng)業(yè)科學(xué),2011,39(12):7448-7449.
[14] 劉春玲,崔凌云,賈冬青,等.數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用[J].農(nóng)機(jī)化研究,2010(7):201-204.
[15] WITTEN I H,F(xiàn)RANK E.數(shù)據(jù)挖掘?qū)嵱脵C(jī)器學(xué)習(xí)技術(shù)[M].北京:機(jī)械工業(yè)出版社,2012.