吳 寧 柏春霞 祝毅博
摘要:針對(duì)樸素貝葉斯分類方法中屬性值條件獨(dú)立假設(shè)不適應(yīng)實(shí)際情況的問題,提出了關(guān)聯(lián)規(guī)則森林表示法及應(yīng)用關(guān)聯(lián)規(guī)則森林的改進(jìn)貝葉斯分類算法(ABC算法)。ABC算法利用關(guān)聯(lián)規(guī)則挖掘得到滿足條件的關(guān)聯(lián)規(guī)則,并由此來構(gòu)造關(guān)聯(lián)規(guī)則森林,而規(guī)則森林中所有根節(jié)點(diǎn)的概率與所有適用的規(guī)則置信度連乘,就得到所有屬性值的聯(lián)合概率。應(yīng)用UDI數(shù)據(jù)集對(duì)分類器進(jìn)行了測(cè)試,分類結(jié)果表明,ABC算法的分類準(zhǔn)確率明顯高于樸素貝葉斯分類算法,平均提高5%,特別是對(duì)屬性間有著較強(qiáng)依賴關(guān)系的數(shù)據(jù)集,其分類準(zhǔn)確率提高了37%。
關(guān)鍵詞:樸素貝葉斯分類;關(guān)聯(lián)規(guī)則;聯(lián)合概率
中圖分類號(hào):TP311.13文獻(xiàn)標(biāo)志碼:A文章編號(hào):0253—987X(2009)02—0048—05
西安交通大學(xué)學(xué)報(bào)2009年2期