陳生海++羅水瓊
摘 要:本文通過給出例證指出歷史文獻中關于決策規(guī)則的性質(zhì)的不完備之處。并且給出使這些性質(zhì)成立的充分必要條件,這能更好的運用粗糙集理論的方法選擇準確的決策規(guī)則,從而提高決策的高效性。
關鍵詞:粗糙集,決策表,決策規(guī)則
0 引言
為了從海量數(shù)據(jù)中提取未知的、隱藏的有用的知識,近幾年來,已經(jīng)提出了許多基于歸納學習的理論方法,其中1982年Pawlak教授提出來的粗糙集理論[1],在這方面起著重要的作用。它已被成功應用于模式識別、機器學習和知識獲取等領域[2][3]。
命題1:設決策規(guī)則r:C→xD,則如下的性質(zhì)成立。
說明:性質(zhì)(5)和(6)是通過性質(zhì)(1),(2),(3),(4)推理得來的。
我們通過一個例證對命題1進行驗證,指出其不完備之處。同時,給出使命題1中性質(zhì)成立的充分和必要條件,這些結果將有助于分析人員通過粗糙集理論的方法選擇正確的決策規(guī)則,提高決策的有效性。
1 決策規(guī)則
1.1 規(guī)則定義
粗糙集理論為決策表表示的樣本數(shù)據(jù)提供了產(chǎn)生規(guī)則的方法,決策表中每一行表示一個對象,列為描述對象的屬性,那么決策規(guī)則可以定義為:
定義1.1 給定決策表S=(U,C,D),其中U為非空的有限論域,C和D分別為條件屬性和決策屬性集合,。對于,有一個序列C(c1(x),…, cn(x)),D(d1(x),…,dn(x)),其中{c1(x),…,cn(x)}為條件屬性集,{d1(x),…, dn(x)}為決策屬性集,則一條決策規(guī)則可以表示為c1(x),…, cn(x) →d1(x),…, dn(x)或簡寫為當且僅當C(x)∩D(x)≠?。
1.2 規(guī)則度量
用粗糙集理論進行分類規(guī)則挖掘時,往往產(chǎn)生大量的分類規(guī)則,其中包含了由于噪聲的影響而產(chǎn)生的規(guī)則。
給定決策表S=(U,C,D),C(x)和D(x)分別為根據(jù)條件屬性和決策屬性對論域的劃分;
為條件類粒度和決策類粒度,其中|U|表示集合U的基數(shù)。
定義1.2
稱為決策表S中規(guī)則 的支持度,規(guī)則支持度表示了滿足此規(guī)則的對象占全部樣本的百分比,亦可理解為規(guī)則 的強度。
2 性質(zhì)成立的充要條件
根據(jù)上述實例的分析可知,規(guī)則的性質(zhì)只針對部分對象是成立的。在本章中我們將從規(guī)則度量的指標層面給出一些使命題1中性質(zhì)(1)-(6)成立的充分必要條件。
我們根據(jù)粗糙集理論中等價類的概念,可得如下的引理。
引理1:對于任意對象x, y∈U,可以得出:
(1) C(x)=C(y) iff y∈C(x)
(2) D(x)=D(y) iff y∈D(x)。
首先,我們來討論命題1中的性質(zhì)(1)和(2)。
定理1:對于給定對象x∈U,決策規(guī)則C→xD,那么以下表達式是等價的。