約簡(jiǎn)
- 基于最小約簡(jiǎn)的粗糙集數(shù)據(jù)挖掘算法研究*
,需要尋求有效的約簡(jiǎn)算法以擴(kuò)展經(jīng)典粗糙集理論。本文提出一種基于最小約簡(jiǎn)的粗糙集數(shù)據(jù)挖掘算法,優(yōu)化改進(jìn)傳統(tǒng)粗糙集在數(shù)據(jù)挖掘領(lǐng)域應(yīng)用的不足。2 算法原理約簡(jiǎn)算法在數(shù)據(jù)挖掘領(lǐng)域,用于在原始數(shù)據(jù)集中發(fā)現(xiàn)最小子集,并將數(shù)據(jù)進(jìn)行分類。相關(guān)學(xué)者通過(guò)分析數(shù)據(jù)的內(nèi)在關(guān)聯(lián)提出了幾種主流約簡(jiǎn)算法。Connolly等[7]提出利用屬性值獲取最小約簡(jiǎn)的方法,但計(jì)算準(zhǔn)確度較差;Y.He 等[8]利用深度層次聚類算法計(jì)算最小約簡(jiǎn),計(jì)算的準(zhǔn)確度有所提高,但耗時(shí)較大;B. Xu 等[9]提
計(jì)算機(jī)與數(shù)字工程 2023年1期2023-05-12
- 知識(shí)庫(kù)的相對(duì)約簡(jiǎn)與拓?fù)?span id="j5i0abt0b" class="hl">約簡(jiǎn)
糙集理論中,知識(shí)約簡(jiǎn)是重要的課題,也是獲取知識(shí)的重要步驟.論域U上的知識(shí)指U上的某個(gè)等價(jià)關(guān)系,知識(shí)庫(kù)指的是U上的一族等價(jià)關(guān)系,文獻(xiàn)[2]論述了知識(shí)庫(kù)的多種約簡(jiǎn)理論.趙靜,徐羅山在文獻(xiàn)[3]中研究了知識(shí)庫(kù)的知識(shí)約簡(jiǎn)和知識(shí)表達(dá)系統(tǒng)的屬性約簡(jiǎn)的轉(zhuǎn)化和聯(lián)系.王長(zhǎng)忠等在文獻(xiàn)[4]中把知識(shí)庫(kù)推廣為關(guān)系信息系統(tǒng),它實(shí)際為U上的一族二元關(guān)系.文獻(xiàn)[5]則把U上的任一子集族稱為一個(gè)抽象知識(shí)庫(kù).本文強(qiáng)調(diào)與抽象知識(shí)庫(kù)的區(qū)別,把關(guān)系信息系統(tǒng)仍稱為知識(shí)庫(kù).李旭等在文[6]中定義了相
- 基于貼進(jìn)度的模糊決策表屬性約簡(jiǎn)啟發(fā)式算法
,此過(guò)程稱為屬性約簡(jiǎn)〔6〕。目前幾乎所有的關(guān)于基于模糊粗糙集的屬性約簡(jiǎn)的研究都是從文獻(xiàn)〔7〕開(kāi)始的,但是由于這種方法完全是從形式上把經(jīng)典粗糙集中相應(yīng)的方法甚至符號(hào)照搬過(guò)來(lái),對(duì)基于模糊粗糙集的屬性約簡(jiǎn)的本質(zhì)沒(méi)有清楚的認(rèn)識(shí),因而導(dǎo)致設(shè)計(jì)的屬性約簡(jiǎn)算法不收斂。對(duì)此,Cheng 等〔8〕通過(guò)模糊粗糙集的粒結(jié)構(gòu)引入辨識(shí)矩陣的方法來(lái)計(jì)算屬性約簡(jiǎn),但是通過(guò)實(shí)例發(fā)現(xiàn),某些情況下求出核屬性后條件屬性卻無(wú)法進(jìn)行有效約簡(jiǎn)。本文提出一種新的約簡(jiǎn)算法,首先利用貼進(jìn)度生成可辨識(shí)矩陣,
大理大學(xué)學(xué)報(bào) 2022年6期2022-07-07
- 基于分離優(yōu)勢(shì)覆蓋集的Pythagorean模糊決策信息系統(tǒng)的屬性約簡(jiǎn)
了應(yīng)用空間.屬性約簡(jiǎn)是指從原始的屬性集中去除冗余的屬性且保持核心屬性不變,這在信息處理方面有著重要的作用.去除冗余數(shù)據(jù),不僅減少干擾決策的影響因素,還能充分利用運(yùn)行空間,避免不必要的浪費(fèi).由此可見(jiàn),屬性約簡(jiǎn)是數(shù)據(jù)分析的重要組成部分.對(duì)于基于正域的屬性約簡(jiǎn),鄧大勇等[8]提出了可變正域的約簡(jiǎn),即允許正域在一定范圍內(nèi)發(fā)生變化,因此提高了泛化能力; 對(duì)于基于商集的屬性約簡(jiǎn),Thuy等[9]提出了分離商集及D-分離商集,并將其用于決策信息系統(tǒng)的屬性約簡(jiǎn)中,提高了處
- 基于確定性因子的啟發(fā)式屬性值約簡(jiǎn)模型
4-5]。屬性值約簡(jiǎn)是粗糙集理論研究和應(yīng)用的核心課題之一,也是構(gòu)建規(guī)則提取算法[6-13]和歸納規(guī)則分類器[14-15]的重要技術(shù)基礎(chǔ)。屬性值約簡(jiǎn)是指在不影響決策系統(tǒng)知識(shí)表達(dá)能力的前提下,去除其中冗余屬性值的過(guò)程[16],它不但能夠從原始數(shù)據(jù)庫(kù)中直接提取出可讀性高、便于應(yīng)用的簡(jiǎn)約規(guī)則,而且還能在不降低專家系統(tǒng)可分辨性的基礎(chǔ)上提高其清晰度,并從中揭示出以往未知、有潛在價(jià)值的信息,從而實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)[10,16]。目前,針對(duì)構(gòu)建屬性值約簡(jiǎn)模型這一問(wèn)題,學(xué)術(shù)界已經(jīng)
計(jì)算機(jī)應(yīng)用 2022年2期2022-03-01
- 多源數(shù)據(jù)矩陣增量約簡(jiǎn)算法
計(jì)算動(dòng)態(tài)多源數(shù)據(jù)約簡(jiǎn)的問(wèn)題,因?yàn)椴荒苡行Ю迷械挠?jì)算結(jié)果,導(dǎo)致求解動(dòng)態(tài)分布數(shù)據(jù)約簡(jiǎn)就會(huì)花費(fèi)很多時(shí)間,使得計(jì)算效率很低。為了克服上述靜態(tài)算法的缺陷,一些研究者把增量學(xué)習(xí)技術(shù)應(yīng)用到粒計(jì)算和粗糙集理論中。增量學(xué)習(xí)技術(shù)可以充分利用原有的計(jì)算結(jié)果,避免重復(fù)計(jì)算,提高計(jì)算效率。目前很多學(xué)者把增量技術(shù)應(yīng)用到求解信息系統(tǒng)約簡(jiǎn)的問(wèn)題中。這些增量方法主要用來(lái)去計(jì)算信息系統(tǒng)對(duì)象、屬性和屬性值發(fā)生變化后的約簡(jiǎn)問(wèn)題。首先,一些學(xué)者針對(duì)對(duì)象添加到信息系統(tǒng)后如何迅速計(jì)算其約簡(jiǎn)問(wèn)題,提
計(jì)算機(jī)工程與應(yīng)用 2022年3期2022-02-24
- 基于粗糙集不確定度的特定類屬性約簡(jiǎn)
糙集理論中,屬性約簡(jiǎn)是核心內(nèi)容與研究熱點(diǎn),其主要在保持相同分類能力的前提下進(jìn)行冗余屬性刪除,從而達(dá)到數(shù)據(jù)表的優(yōu)化處理.決策表具有3層粒度結(jié)構(gòu)[2],在約簡(jiǎn)方面涉及到系統(tǒng)決策分類與局部決策類2種主體.傳統(tǒng)的屬性約簡(jiǎn)是決策分類約簡(jiǎn),主要考慮所有決策類的整體優(yōu)化.針對(duì)實(shí)際中存在的局部?jī)?yōu)化需求,特定類約簡(jiǎn)應(yīng)運(yùn)而生,并改進(jìn)了決策分類約簡(jiǎn)的盲點(diǎn).文獻(xiàn)[3]基于正域首先建立特定類約簡(jiǎn),文獻(xiàn)[4-5]分別從信息度量與三支決策角度推進(jìn)特定類約簡(jiǎn),文獻(xiàn)[6-8]分別從鄰域粗糙
- 一種局部視角的類別近似質(zhì)量屬性約簡(jiǎn)加速方法
)0 引 言屬性約簡(jiǎn),作為粗糙集理論研究的核心問(wèn)題,不僅能有效降低數(shù)據(jù)的維度,且所得約簡(jiǎn)結(jié)果具有明確的語(yǔ)義解釋,因而受到廣泛的關(guān)注[1-7]。所謂屬性約簡(jiǎn),是指利用在某種度量標(biāo)準(zhǔn)上構(gòu)造的約束條件,刪除數(shù)據(jù)中冗余的屬性,以提升后續(xù)學(xué)習(xí)算法的性能[8-9]。在粗糙集理論中,近似質(zhì)量[10]作為一種常用的度量標(biāo)準(zhǔn),可以用于刻畫(huà)樣本空間的不確定性。具體而言,近似質(zhì)量用下近似集合中的樣本占所有樣本比例的大小來(lái)表征不確定性的程度。近似質(zhì)量的變化可以表現(xiàn)為下近似集合中樣
計(jì)算機(jī)應(yīng)用與軟件 2021年11期2021-11-15
- 基于區(qū)間值信息系統(tǒng)的信息熵增量式屬性約簡(jiǎn)算法
38000)屬性約簡(jiǎn)是粗糙集理論和粒計(jì)算理論的重要研究問(wèn)題[1-2],其目的是為了消除數(shù)據(jù)集內(nèi)部的冗余屬性,提高數(shù)據(jù)集的知識(shí)發(fā)現(xiàn)性能。然而實(shí)際應(yīng)用中的數(shù)據(jù)集總是處于不斷動(dòng)態(tài)更新之中,針對(duì)這類數(shù)據(jù)環(huán)境,一種被稱為增量式屬性約簡(jiǎn)的方法被提出[3-5],從而提高了動(dòng)態(tài)數(shù)據(jù)的屬性約簡(jiǎn)性能。針對(duì)增量式屬性約簡(jiǎn),學(xué)者在各種類型的信息系統(tǒng)進(jìn)行了相關(guān)的研究。Shu等[6]在傳統(tǒng)的完備型信息系統(tǒng)中提出了對(duì)象增加時(shí)的增量式屬性約簡(jiǎn)算法;在不完備信息系統(tǒng)方面,丁棉衛(wèi)等[7]利于
綏化學(xué)院學(xué)報(bào) 2021年9期2021-09-01
- 面向連續(xù)參數(shù)的多粒度屬性約簡(jiǎn)方法研究
論與方法中,屬性約簡(jiǎn)問(wèn)題[5-10]一直是眾多學(xué)者關(guān)注的焦點(diǎn)。作為一種特征選擇機(jī)制,約簡(jiǎn)的目的是獲得滿足給定約束條件的最小屬性子集,進(jìn)而達(dá)到降低不確定性、提升學(xué)習(xí)器泛化性能等目的。在數(shù)據(jù)分析中,屬性約簡(jiǎn)中的約束條件往往可以通過(guò)一些度量準(zhǔn)則進(jìn)行構(gòu)造,如近似質(zhì)量、條件熵等[6,8]。經(jīng)典粗糙集方法僅能處理符號(hào)型數(shù)據(jù),但在解決實(shí)際應(yīng)用問(wèn)題時(shí),連續(xù)型數(shù)據(jù)是廣泛存在的。因此已有諸多學(xué)者構(gòu)建了很多拓展的粗糙集模型以用于分析及處理連續(xù)型數(shù)據(jù):如基于高斯核函數(shù)的模糊粗糙集
計(jì)算機(jī)與生活 2021年8期2021-08-07
- 基于可辨識(shí)矩陣的屬性約簡(jiǎn)算法及應(yīng)用
[3-4].屬性約簡(jiǎn)[5-7]是粗糙集理論研究的主要內(nèi)容之一,由于在原始數(shù)據(jù)集中,往往存在大量冗余和不確定性的信息,嚴(yán)重影響到后續(xù)數(shù)據(jù)挖掘和處理的效率.因此,通過(guò)刪除冗余屬性,能獲得數(shù)據(jù)集合的本質(zhì)信息和保持原始數(shù)據(jù)分類信息的完整性,從而提高數(shù)據(jù)的分類質(zhì)量.目前粗糙集屬性約簡(jiǎn)方法的研究已經(jīng)取得了很多成果,各種高效的啟發(fā)式約簡(jiǎn)算法相繼被提出,這些啟發(fā)式約簡(jiǎn)算法主要目的是尋找一個(gè)約簡(jiǎn)或近似約簡(jiǎn).譬如,鮑迪等針對(duì)區(qū)間值決策表中對(duì)象集動(dòng)態(tài)增加的情況,提出了區(qū)間值決策
大學(xué)數(shù)學(xué) 2021年3期2021-07-09
- 基于差別矩陣的區(qū)間值決策系統(tǒng)β分布約簡(jiǎn)
于許多領(lǐng)域。屬性約簡(jiǎn)[1-7]是粗糙集理論的核心研究?jī)?nèi)容之一。當(dāng)前,消除不必要的屬性、縮小數(shù)據(jù)規(guī)模從而加速數(shù)據(jù)的處理顯得尤為重要,而屬性約簡(jiǎn)的目的就是盡可能消除數(shù)據(jù)中不必要的屬性,得到?jīng)Q策系統(tǒng)中某種分類特征不變的最小屬性子集。通過(guò)屬性約簡(jiǎn)既可以縮小數(shù)據(jù)規(guī)模又不會(huì)破壞知識(shí)的原始信息,恰好滿足了當(dāng)前的需求。目前已經(jīng)有許多學(xué)者對(duì)知識(shí)約簡(jiǎn)做了大量工作。1992年,Skowron 等[8]提出了一種基于差別矩陣的正域約簡(jiǎn)方法,隨后國(guó)內(nèi)外許多學(xué)者對(duì)此做了大量的擴(kuò)展工作
計(jì)算機(jī)應(yīng)用 2021年4期2021-04-20
- 快速求解粒球粗糙集約簡(jiǎn)的屬性劃分方法
域粗糙集進(jìn)行屬性約簡(jiǎn)[4-6]這一問(wèn)題的研究時(shí),往往需要通過(guò)大量的嘗試或采用一定的參數(shù)搜索策略來(lái)設(shè)置鄰域半徑的大小[7-9],這勢(shì)必會(huì)帶來(lái)極大的時(shí)間消耗。為了克服鄰域粗糙集中半徑選取這一困難,已有相關(guān)學(xué)者借助自適應(yīng)的理念,提出了一些能夠自主確定半徑大小的策略。例如,Zhou等[10]面向在線特征選擇問(wèn)題,提出了Gap鄰域的概念,其使用樣本間距離的差值確定鄰域的大小,從而生成較為緊湊的Gap鄰域粒結(jié)構(gòu);Xia等[11]為提升大規(guī)模數(shù)據(jù)中分類任務(wù)的效率,提出了
南京理工大學(xué)學(xué)報(bào) 2021年4期2021-04-09
- 基于0-1規(guī)劃的最小屬性約簡(jiǎn)算法
前提下,通過(guò)知識(shí)約簡(jiǎn),導(dǎo)出問(wèn)題的決策或分類規(guī)則[1]. 屬性約簡(jiǎn)是粗糙集理論中的核心內(nèi)容之一.數(shù)據(jù)庫(kù)中的屬性并不是同等重要的, 甚至其中某些知識(shí)是冗余的,通過(guò)屬性約簡(jiǎn), 可以去除數(shù)據(jù)庫(kù)中的冗余、無(wú)用的成分, 揭示數(shù)據(jù)中隱含的規(guī)律.從粗糙集理論的角度來(lái)理解, 在一個(gè)信息系統(tǒng)中, 有些屬性對(duì)于分類來(lái)說(shuō)是多余的, 去掉這些屬性后,信息系統(tǒng)的分類能力不會(huì)改變, 所以屬性約簡(jiǎn)后仍然反映了一個(gè)信息系統(tǒng)的本質(zhì)信息[2-6].一般來(lái)講,一個(gè)信息系統(tǒng)的屬性約簡(jiǎn)不是唯一的,通
洛陽(yáng)師范學(xué)院學(xué)報(bào) 2021年2期2021-03-31
- 偽標(biāo)簽鄰域粗糙集下的屬性約簡(jiǎn)加速策略
鄰域粗糙集。屬性約簡(jiǎn)[14-17]作為粗糙集理論中備受關(guān)注的問(wèn)題之一,已經(jīng)得到眾多學(xué)者的重視。目前,有關(guān)約簡(jiǎn)求解的方法主要有:窮舉法[18,19]和基于適應(yīng)度函數(shù)的啟發(fā)式方法[14]。盡管窮舉法可用于求解所有的約簡(jiǎn),但過(guò)于復(fù)雜和耗時(shí)。這也是基于適應(yīng)度函數(shù)的啟發(fā)式方法受到廣泛關(guān)注的原因?;趥螛?biāo)簽鄰域粗糙集的屬性約簡(jiǎn)問(wèn)題,可以使用啟發(fā)式方法來(lái)進(jìn)行求解。但值得注意的是,在不同的半徑下進(jìn)行屬性約簡(jiǎn)時(shí),往往會(huì)得到不同的約簡(jiǎn)結(jié)果,而對(duì)于不同約簡(jiǎn)結(jié)果,其意義或泛化性能
計(jì)算機(jī)工程與設(shè)計(jì) 2020年11期2020-11-17
- 基于矩陣方法的區(qū)分度增量式屬性約簡(jiǎn)算法
的重要分支,屬性約簡(jiǎn)[2]是粗糙集理論的重點(diǎn)研究?jī)?nèi)容。屬性約簡(jiǎn)的目的是為了將原始信息系統(tǒng)的冗余屬性進(jìn)行甄別和刪除,從而提高數(shù)據(jù)集的知識(shí)發(fā)現(xiàn)性能。然而隨著信息技術(shù)的發(fā)展以及數(shù)據(jù)采集技術(shù)的提高,實(shí)際應(yīng)用環(huán)境下的數(shù)據(jù)總是時(shí)刻處于動(dòng)態(tài)更新之中,傳統(tǒng)的各種屬性約簡(jiǎn)算法是針對(duì)靜態(tài)的數(shù)據(jù)設(shè)計(jì)的,而對(duì)于動(dòng)態(tài)的數(shù)據(jù)集,這些算法的處理效率較為低下,不能很好地適應(yīng)實(shí)際的工程需求[3-4]。為了改善動(dòng)態(tài)數(shù)據(jù)下的屬性約簡(jiǎn)性能,學(xué)者們提出了一種改進(jìn)的屬性約簡(jiǎn)方法——增量式屬性約簡(jiǎn)[5
計(jì)算機(jī)應(yīng)用與軟件 2020年9期2020-09-09
- 二進(jìn)制辨識(shí)矩陣的屬性約簡(jiǎn)及不必要屬性的求解
的研究.其中屬性約簡(jiǎn)是粗糙集理論研究的主要內(nèi)容.在對(duì)約簡(jiǎn)的研究中,利用二進(jìn)制求約簡(jiǎn)是一個(gè)重要分支.二進(jìn)制辨識(shí)矩陣是對(duì)skowron辨識(shí)矩陣[1]的改進(jìn),采用二進(jìn)制表示形式,使計(jì)算更加簡(jiǎn)單直觀.因此,采用二進(jìn)制辨識(shí)矩陣進(jìn)行屬性約簡(jiǎn)具有一定的意義.Hu等人在1995年提出了基于skowron矩陣的核屬性求解算法[2].Felix等人[3]在1999年提出了只由0和1構(gòu)成的二進(jìn)制可辨識(shí)矩陣.文獻(xiàn)[4]利用Felix提出的二進(jìn)制可辨識(shí)矩陣計(jì)算核屬性并得出相應(yīng)的屬性
- 帶權(quán)決策表的屬性約簡(jiǎn)
了成功應(yīng)用。屬性約簡(jiǎn)是粗糙集研究的重要內(nèi)容之一,其主要思想就是根據(jù)特定規(guī)則要求,刪除冗余屬性,得到知識(shí)分類最小屬性子集。目前,屬性約簡(jiǎn)已取得了大量的理論研究成果。將決策表和不同應(yīng)用背景相結(jié)合,研究人員提出了正域約簡(jiǎn)[2-3]、變精度約簡(jiǎn)[4-5]、分配約簡(jiǎn)[2,6]、覆蓋約簡(jiǎn)[7-8]、分布約簡(jiǎn)[9]、局部約簡(jiǎn)[10-12]等多種類型的約簡(jiǎn)。已有的研究已通過(guò)容差關(guān)系[13]、量化容差關(guān)系[14]、限制容差關(guān)系[15]等拓展了正域約簡(jiǎn)的應(yīng)用范圍。Liu[16
計(jì)算機(jī)工程與應(yīng)用 2020年12期2020-06-18
- 信息系統(tǒng)的最大可能約簡(jiǎn)算法
前提下,通過(guò)知識(shí)約簡(jiǎn),導(dǎo)出問(wèn)題的決策或分類規(guī)則.經(jīng)過(guò)多年的發(fā)展,該理論已被成功地用于機(jī)器學(xué)習(xí)、決策分析、過(guò)程控制、模式識(shí)別和數(shù)據(jù)挖掘等領(lǐng)域[1].屬性約簡(jiǎn)是粗糙集理論中的核心研究?jī)?nèi)容之一[2-3].數(shù)據(jù)庫(kù)中的屬性并不是同等重要的, 甚至其中某些知識(shí)是冗余的,通過(guò)屬性約簡(jiǎn), 可以去除數(shù)據(jù)庫(kù)中的冗余、無(wú)用的成分, 從而揭示數(shù)據(jù)中隱含的規(guī)律.從粗糙集理論的角度看, 在一個(gè)信息系統(tǒng)中, 有些屬性對(duì)于分類來(lái)說(shuō)是多余的, 去掉這些屬性后,信息系統(tǒng)的分類能力不會(huì)改變,
洛陽(yáng)師范學(xué)院學(xué)報(bào) 2020年2期2020-03-23
- 帶權(quán)決策表的變精度約簡(jiǎn)算法
的應(yīng)用領(lǐng)域.屬性約簡(jiǎn)是粗糙集理論研究的重要內(nèi)容,其主要思想就是根據(jù)特定規(guī)則要求,刪除冗余和不相關(guān)屬性,構(gòu)成知識(shí)分類最小屬性集.許多學(xué)者對(duì)正區(qū)域約簡(jiǎn)、變精度粗糙集模型進(jìn)行了深入研究,在經(jīng)典粗糙集模型約簡(jiǎn)中,二元關(guān)系是等價(jià)關(guān)系,為了更好處理信息丟失的決策表,已有研究通過(guò)容差關(guān)系[3]、相似關(guān)系[4]、量化容差關(guān)系[5]、限制容差關(guān)系[6]拓展了粗糙集約簡(jiǎn)研究.目前,Liu[7]在一致決策表和不一致決策表上提出了一般關(guān)系,從而推廣了決策表中的二元關(guān)系,并研究了關(guān)
小型微型計(jì)算機(jī)系統(tǒng) 2019年10期2019-11-11
- 基于知識(shí)?;男畔⑾到y(tǒng)增量式屬性約簡(jiǎn)
35000)屬性約簡(jiǎn)是粗糙集理論[1]在機(jī)器學(xué)習(xí)和知識(shí)發(fā)現(xiàn)等領(lǐng)域中一種常用的數(shù)據(jù)處理工具,它通過(guò)對(duì)數(shù)據(jù)中冗余屬性進(jìn)行刪除從而達(dá)到更好的分類性能。在現(xiàn)實(shí)的數(shù)據(jù)中,數(shù)據(jù)快速更新,每時(shí)每刻都有新的數(shù)加入,而傳統(tǒng)的非增量式屬性約簡(jiǎn)在求動(dòng)態(tài)數(shù)據(jù)的約簡(jiǎn)集時(shí)需要進(jìn)行大量的重復(fù)計(jì)算,這樣消耗了大量的時(shí)間和空間,不能很好地滿足實(shí)際的需求[2,3]。增量式屬性約簡(jiǎn)[2,3]相對(duì)于傳統(tǒng)的屬性約簡(jiǎn),是一種專門(mén)針對(duì)動(dòng)態(tài)數(shù)據(jù)集的約簡(jiǎn)方法,它能夠在原先約簡(jiǎn)集的基礎(chǔ)上進(jìn)一步導(dǎo)出更新后數(shù)據(jù)
測(cè)控技術(shù) 2019年8期2019-09-10
- 面向特定類的三支概率屬性約簡(jiǎn)算法
高維數(shù)據(jù)進(jìn)行屬性約簡(jiǎn)可以提高分類算法的效率和分類性能,且能降低分類過(guò)程中的測(cè)試代價(jià)和誤分類代價(jià),因此,屬性約簡(jiǎn)在近些年得到了廣泛關(guān)注和研究.然而,在經(jīng)典粗糙集模型的屬性約簡(jiǎn)中,不確定性度量呈現(xiàn)的單調(diào)性在三支決策的屬性約簡(jiǎn)中不再成立,于是研究學(xué)者們相繼提出三支屬性約簡(jiǎn),這些三支約簡(jiǎn)方法主要分為三支宏觀屬性約簡(jiǎn)和三支微觀屬性約簡(jiǎn).三支宏觀屬性約簡(jiǎn)適用于決策類是相互關(guān)聯(lián)的決策系統(tǒng),即獲取所有決策類下的三支屬性約簡(jiǎn).例如,Chen等人為鄰域系統(tǒng)構(gòu)建基于條件熵的三支
小型微型計(jì)算機(jī)系統(tǒng) 2019年9期2019-09-09
- 面向局部多約束的屬性約簡(jiǎn)方法研究*
的構(gòu)建以外,屬性約簡(jiǎn)[2-5]是粗糙集理論中公認(rèn)的一個(gè)核心研究問(wèn)題。所謂屬性約簡(jiǎn),一般來(lái)說(shuō)可以理解為從所有屬性中找出一些滿足給定約束條件的屬性子集。這些約束條件大多是建立在由粗糙集模型與方法所得到的一些度量(如近似質(zhì)量[6]、條件熵[7]、決策錯(cuò)誤率[8]等)基礎(chǔ)上的,具體的約束可以是找到一些屬性子集能夠保持這些度量或在給定的閾值范圍內(nèi)達(dá)到預(yù)期的度量標(biāo)準(zhǔn)。例如,將近似質(zhì)量作為約簡(jiǎn)約束條件中的度量,利用啟發(fā)式算法可以求得一個(gè)使得近似質(zhì)量滿足給定約束的最小屬性
計(jì)算機(jī)與生活 2019年5期2019-07-18
- 直覺(jué)模糊序決策系統(tǒng)的部分一致約簡(jiǎn)*
序信息系統(tǒng)的屬性約簡(jiǎn),其中包括一致直覺(jué)模糊序決策系統(tǒng)的相對(duì)約簡(jiǎn)。針對(duì)不一致直覺(jué)模糊序決策系統(tǒng),國(guó)內(nèi)學(xué)者提出了分布約簡(jiǎn)和最大分布約簡(jiǎn),并證明了二者的等價(jià)性[12-13]。另外,與基于等價(jià)關(guān)系的不一致系統(tǒng)類似[14-15],序決策系統(tǒng)還存在分配約簡(jiǎn)[16]、部分一致約簡(jiǎn)[17]以及其他形式的約簡(jiǎn)[18-20]。徐偉華等將分配約簡(jiǎn)引入到直覺(jué)模糊序決策系統(tǒng)[21],并將部分一致約簡(jiǎn)推廣到區(qū)間值模糊序決策系統(tǒng)的情形[22],但對(duì)直覺(jué)模糊序決策系統(tǒng)目前尚未展開(kāi)相關(guān)的討
計(jì)算機(jī)與生活 2019年3期2019-04-18
- 幾類拓展粗糙集模型屬性約簡(jiǎn)研究綜述
廣泛應(yīng)用,其屬性約簡(jiǎn)算法作為數(shù)據(jù)預(yù)處理的有效方法也受到國(guó)內(nèi)外學(xué)術(shù)界的廣泛關(guān)注.屬性約簡(jiǎn)也稱特征選擇,指的是從原始屬性集合中選出具有代表性的屬性子集,是粗糙集理論研究的重點(diǎn)內(nèi)容之一.特征選擇可以在不影響最終決策質(zhì)量的前提下,有效去除數(shù)據(jù)的噪聲和冗余特征,提高學(xué)習(xí)效率[26]. 目前,各國(guó)學(xué)者經(jīng)過(guò)不斷努力,基于概念格、決策樹(shù)、隨機(jī)森林、支持向量機(jī)、粗糙集等理論設(shè)計(jì)出各類特征選擇算法. 其中,基于粗糙集理論的特征選擇算法不僅可以求解最優(yōu)或次優(yōu)約簡(jiǎn)結(jié)果,而且能夠在
宜賓學(xué)院學(xué)報(bào) 2019年12期2019-03-05
- 鄰域粗糙集約簡(jiǎn)算法在圖像特征選擇中的應(yīng)用
的數(shù)值型數(shù)據(jù)屬性約簡(jiǎn)算法,但該算法為靜態(tài)約簡(jiǎn)算法?,F(xiàn)在已經(jīng)有學(xué)者在其基礎(chǔ)上提出動(dòng)態(tài)約簡(jiǎn)算法,這些算法都從代數(shù)觀分析其動(dòng)態(tài)更新過(guò)程。而通過(guò)文獻(xiàn)[4]可知信息觀在不一致決策方面要優(yōu)于代數(shù)觀。因此,從信息觀研究基于鄰域粗糙集的動(dòng)態(tài)約簡(jiǎn)算法具有重要的理論意義。行人檢測(cè)在計(jì)算機(jī)視覺(jué)等領(lǐng)域有著重要的應(yīng)用[4-6]。目前基于計(jì)算機(jī)視覺(jué)的行人檢測(cè)大多是基于特征提取和機(jī)器學(xué)習(xí)的方法[7-9]。運(yùn)用特征描述行人與背景的區(qū)別。經(jīng)過(guò)這些年的科學(xué)發(fā)展,學(xué)者已經(jīng)提出很多有效的行人檢測(cè)
現(xiàn)代電子技術(shù) 2018年21期2018-11-13
- 模糊決策表中基于OWA算子的三支屬性約簡(jiǎn)
前提下,通過(guò)知識(shí)約簡(jiǎn)導(dǎo)出問(wèn)題的決策規(guī)則。這種模型在完備的信息系統(tǒng)中得到了成功運(yùn)用[1,2]。在模糊決策表中,數(shù)據(jù)往往被認(rèn)為是一個(gè)模糊概念,于是研究者們對(duì)經(jīng)典的粗糙集理論進(jìn)行擴(kuò)充[3,4]。許多學(xué)者在構(gòu)造各種不同區(qū)分關(guān)系的基礎(chǔ)上,討論各種屬性約簡(jiǎn)的理論和方法,并進(jìn)行了相關(guān)應(yīng)用研究[5,6]。管濤[7]等基于模糊集合的貼近度,構(gòu)造模糊相似關(guān)系,取其截集后得到不可區(qū)分關(guān)系,利用水平集粗糙成員函數(shù)給出分布約簡(jiǎn)與分配約簡(jiǎn);Jensen和Shen提出以依賴度函數(shù)作為啟
數(shù)據(jù)采集與處理 2018年4期2018-09-10
- 不協(xié)調(diào)區(qū)間值決策系統(tǒng)的最大分布約簡(jiǎn)
64005)屬性約簡(jiǎn)[1-7]是粗糙集理論[1-3]的核心研究?jī)?nèi)容之一,在數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、決策分析、智能信息處理等領(lǐng)域取得了諸多研究成果。屬性約簡(jiǎn)的目的是刪除冗余屬性,只保留使決策表某種分類特征不變的最小屬性子集。差別矩陣方法是一種用于求取所有屬性約簡(jiǎn)的有效方法,該方法由Skowron[8]于1982年提出,并將差別矩陣應(yīng)用于正域約簡(jiǎn)中。諸多學(xué)者在此基礎(chǔ)上做了大量的研究工作。Kryszkie-wicz[9]于1999年在不完備信息系統(tǒng)下引入廣義決策保持
智能系統(tǒng)學(xué)報(bào) 2018年3期2018-07-20
- 矩陣增量屬性約簡(jiǎn)算法
化后決策信息系統(tǒng)約簡(jiǎn)問(wèn)題,是信息科學(xué)領(lǐng)域研究的一個(gè)普遍關(guān)注熱點(diǎn).如果使用非增量屬性約簡(jiǎn)方法[1-3]來(lái)處理動(dòng)態(tài)數(shù)據(jù)屬性約簡(jiǎn)問(wèn)題時(shí),需要重新計(jì)算變化后決策信息系統(tǒng)的屬性約簡(jiǎn),不能充分利用先前知識(shí)粒度和約簡(jiǎn),導(dǎo)致運(yùn)行速度較慢.為了有效解決非增量約簡(jiǎn)算法在處理動(dòng)態(tài)數(shù)據(jù)時(shí)存在的缺陷,許多研究者提出了增量屬性約簡(jiǎn)方法.針對(duì)決策信息系統(tǒng)對(duì)象變化增量屬性約簡(jiǎn)問(wèn)題,楊明針對(duì)決策信息系統(tǒng)對(duì)象集動(dòng)態(tài)更新問(wèn)題,對(duì)差別矩陣進(jìn)行改進(jìn),分析了改進(jìn)差別矩陣的增量更新機(jī)制,設(shè)計(jì)了增量屬性
小型微型計(jì)算機(jī)系統(tǒng) 2018年6期2018-07-04
- 置信優(yōu)勢(shì)關(guān)系粗糙集的屬性約簡(jiǎn)方法
IODS).屬性約簡(jiǎn)是粗糙集理論及其擴(kuò)展模型研究的核心問(wèn)題之一[5,6].在完備有序信息系統(tǒng)中,多種約簡(jiǎn)方法被提出.其中,Dembczyński[1]等給出了基于分類精度的約簡(jiǎn)概念,卻沒(méi)有提出相應(yīng)的約簡(jiǎn)方法.徐偉華等提出了多種基于DRSA的約簡(jiǎn)方法,包括分布約簡(jiǎn)和最大分布約簡(jiǎn)[7],可能分布約簡(jiǎn)(分配約簡(jiǎn))及相容分布約簡(jiǎn)[8].Inuiguchi等提出了基于決策屬性聯(lián)合類的上、下近似、邊界域不變的約簡(jiǎn)方法[9],Kusunoki進(jìn)一步給出決策屬性基于類的上
小型微型計(jì)算機(jī)系統(tǒng) 2018年2期2018-03-27
- 廣義分布保持屬性約簡(jiǎn)研究
廣義分布保持屬性約簡(jiǎn)研究高學(xué)義1,2,張楠1,2,童向榮1,2,姜麗麗1,2(1. 煙臺(tái)大學(xué) 數(shù)據(jù)科學(xué)與智能技術(shù)山東省高校重點(diǎn)實(shí)驗(yàn)室,山東 煙臺(tái) 264005; 2. 煙臺(tái)大學(xué) 計(jì)算機(jī)與控制工程學(xué)院,山東 煙臺(tái) 264005)屬性約簡(jiǎn)是粗糙集理論的重要研究?jī)?nèi)容之一。分布約簡(jiǎn)保證約簡(jiǎn)前后每個(gè)對(duì)象的概率分布保持不變,即保證每條規(guī)則的置信度在約簡(jiǎn)前后不發(fā)生改變。實(shí)際應(yīng)用中,人們往往更加關(guān)注可信度較高或較低的規(guī)則。因此,在本文中引入了廣義分布保持屬性約簡(jiǎn),該屬性約
智能系統(tǒng)學(xué)報(bào) 2017年3期2017-08-01
- 基于MapReduce的高效粗糙集屬性約簡(jiǎn)算法
的高效粗糙集屬性約簡(jiǎn)算法呂 潔1劉利民1胡皎月1許志偉1,21(內(nèi)蒙古工業(yè)大學(xué)信息工程學(xué)院 內(nèi)蒙古 呼和浩特 010080)2(中國(guó)科學(xué)院計(jì)算技術(shù)研究所 北京 100086)針對(duì)粗糙集理論中傳統(tǒng)的基于正域的屬性約簡(jiǎn)算法和基于信息熵的屬性約簡(jiǎn)算法無(wú)法得到最小約簡(jiǎn)集的問(wèn)題,給出基于信息熵改進(jìn)的屬性約簡(jiǎn)算法,即先使用條件熵識(shí)別出重要度值最大的屬性,使用正域進(jìn)行約簡(jiǎn)判斷。在此基礎(chǔ)上,設(shè)計(jì)了高效的基于MapReduce的信息熵改進(jìn)屬性約簡(jiǎn)算法。以真實(shí)海量氣象數(shù)據(jù)為基
計(jì)算機(jī)應(yīng)用與軟件 2017年4期2017-04-24
- 基于決策表的保邊界域不變及保負(fù)域不變約簡(jiǎn)
不變及保負(fù)域不變約簡(jiǎn)趙思雨,魏玲*(西北大學(xué)數(shù)學(xué)學(xué)院,陜西省西安市郵編:710127)屬性約簡(jiǎn)是粗糙集理論的重要研究方向之一。本文針對(duì)決策表, 從三支決策的角度提出了保持負(fù)域不變的約簡(jiǎn)及保持邊界域不變的約簡(jiǎn), 并研究保持負(fù)域不變的約簡(jiǎn)、保持邊界域不變的約簡(jiǎn)與基于粗糙集理論代數(shù)角度的約簡(jiǎn)之間的關(guān)系。決策表;屬性約簡(jiǎn);邊界域;負(fù)域引言粗糙集理論作為一種數(shù)據(jù)分析處理理論,由波蘭科學(xué)家Pawlak于1982年提出,在數(shù)據(jù)的決策與分析、模式識(shí)別、機(jī)器學(xué)習(xí)與知識(shí)發(fā)現(xiàn)等
數(shù)碼設(shè)計(jì) 2016年1期2016-10-13
- 基于信息量的動(dòng)態(tài)屬性約簡(jiǎn)算法仿真實(shí)現(xiàn)
信息量的動(dòng)態(tài)屬性約簡(jiǎn)算法仿真實(shí)現(xiàn)陳麗芳*,王云華北理工大學(xué)理學(xué)院,河北省唐山市郵編:063009基于信息量的動(dòng)態(tài)約簡(jiǎn)算法充分利用了原信息系統(tǒng)的約簡(jiǎn)結(jié)果,從約簡(jiǎn)效率上,比靜態(tài)算法有很大的提高。但在實(shí)際應(yīng)用中,該算法的計(jì)算工作量令許多非數(shù)學(xué)專業(yè)的科技人員感到力不從心。鑒于這種情況,本文針對(duì)基于信息量的動(dòng)態(tài)屬性約簡(jiǎn)算法,編程仿真了整個(gè)計(jì)算過(guò)程。對(duì)該算法進(jìn)行設(shè)計(jì)并用C語(yǔ)言編寫(xiě)了源代碼,使計(jì)算過(guò)程簡(jiǎn)單化,輸入待解決問(wèn)題的數(shù)據(jù)和新增動(dòng)態(tài)數(shù)據(jù)即可計(jì)算得出相應(yīng)的約簡(jiǎn)結(jié)果。
數(shù)碼設(shè)計(jì) 2016年1期2016-10-13
- 基于粗糙集的可變正區(qū)域約簡(jiǎn)
糙集的可變正區(qū)域約簡(jiǎn)鄧大勇1,2,李亞楠1,薛歡歡1(1.浙江師范大學(xué) 數(shù)理與信息工程學(xué)院,浙江 金華321004;2.浙江師范大學(xué) 行知學(xué)院,浙江 金華321004)屬性約簡(jiǎn)是粗糙集理論的研究重點(diǎn)之一.現(xiàn)有的各種粗糙集約簡(jiǎn)幾乎都是保持某種約簡(jiǎn)準(zhǔn)則不變,用這種方法處理一些存在異常點(diǎn)的數(shù)據(jù)時(shí),在泛化能力方面存在一定的問(wèn)題.針對(duì)此類問(wèn)題,提出了一種可變正區(qū)域的約簡(jiǎn)方法,該方法在進(jìn)行屬性約簡(jiǎn)時(shí)允許正區(qū)域存在一定程度的變化.理論分析和示例表明了該方法的有效性.粗糙
- 面向成組對(duì)象集的增量式屬性約簡(jiǎn)算法
象集的增量式屬性約簡(jiǎn)算法錢(qián)進(jìn)1,2,朱亞炎1(1.江蘇理工學(xué)院 計(jì)算機(jī)工程學(xué)院,江蘇 常州 213015; 2. 南京信息工程大學(xué) 江蘇省大數(shù)據(jù)分析技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210044)現(xiàn)實(shí)世界中數(shù)據(jù)集都是動(dòng)態(tài)變化的,非增量式屬性約簡(jiǎn)方法從頭重新計(jì)算原始數(shù)據(jù)集,而且未考慮先前約簡(jiǎn)結(jié)果中的信息,將耗費(fèi)大量的時(shí)間和空間。為此,討論了動(dòng)態(tài)數(shù)據(jù)環(huán)境下約簡(jiǎn)的不變性,提出了一種面向成組對(duì)象集的增量式屬性約簡(jiǎn)算法,利用先前約簡(jiǎn)中信息來(lái)快速獲取強(qiáng)傳承性的約簡(jiǎn),從而提高
智能系統(tǒng)學(xué)報(bào) 2016年4期2016-09-27
- 一種最小測(cè)試代價(jià)約簡(jiǎn)的改進(jìn)算法
一種最小測(cè)試代價(jià)約簡(jiǎn)的改進(jìn)算法何華平, 陳光建(四川理工學(xué)院 計(jì)算機(jī)學(xué)院 四川 自貢 643000)傳統(tǒng)屬性約簡(jiǎn)的目標(biāo)是在決策表中的所有條件屬性中,選擇一組分類代價(jià)最小的約簡(jiǎn),算法構(gòu)建了測(cè)試代價(jià)最小的約簡(jiǎn).以往的測(cè)試代價(jià)約簡(jiǎn)算法查找成功率不夠理想,性能不穩(wěn)定,提出了一種改進(jìn)的測(cè)試代價(jià)約簡(jiǎn)算法.通過(guò)運(yùn)行2個(gè)UCI數(shù)據(jù)集實(shí)驗(yàn),證明算法是有效的,并為提高測(cè)試代價(jià)約簡(jiǎn)算法性能提供了新途徑.代價(jià)敏感學(xué)習(xí); 屬性約簡(jiǎn); 最小測(cè)試代價(jià)0 引言在數(shù)據(jù)挖掘中,要?jiǎng)h除冗余數(shù)據(jù)
鄭州大學(xué)學(xué)報(bào)(理學(xué)版) 2015年1期2015-02-11
- 一種改進(jìn)的啟發(fā)式最優(yōu)相對(duì)屬性約簡(jiǎn)算法
發(fā)式最優(yōu)相對(duì)屬性約簡(jiǎn)算法陶加云1,李英順2,趙玉鑫2(1.沈陽(yáng)工業(yè)大學(xué)信息科學(xué)與工程學(xué)院,遼寧沈陽(yáng)110870;2.沈陽(yáng)工業(yè)大學(xué)化工過(guò)程自動(dòng)化學(xué)院,遼寧遼陽(yáng)111003)針對(duì)在傳統(tǒng)的粗糙集理論相對(duì)屬性約簡(jiǎn)算法中因需計(jì)算可區(qū)別矩陣和正區(qū)域而導(dǎo)致的約簡(jiǎn)效率低下這一問(wèn)題,提出一種改進(jìn)的啟發(fā)式最優(yōu)相對(duì)屬性約簡(jiǎn)算法加以解決.通過(guò)引入屬性集的相對(duì)分類能力的定義給出相對(duì)屬性約簡(jiǎn)的判定條件,在此基礎(chǔ)上導(dǎo)出的改進(jìn)相對(duì)屬性約簡(jiǎn)算法既能保證約簡(jiǎn)過(guò)后的條件屬性是最優(yōu)的,又能提高約
宜賓學(xué)院學(xué)報(bào) 2015年12期2015-01-18
- 粗糙集屬性約簡(jiǎn)方法研究
成功[2]。屬性約簡(jiǎn)是粗糙集理論的核心內(nèi)容之一。目前已經(jīng)出現(xiàn)了很多屬性約簡(jiǎn)的方法,例如基于正區(qū)域的屬性約簡(jiǎn)[3]、基于差別矩陣的屬性約簡(jiǎn)[4]、基于信息熵的屬性約簡(jiǎn)[5]、基于分布的屬性約簡(jiǎn)及基于近似的屬性約簡(jiǎn)[6]、基于云模型的約簡(jiǎn)方法[7]、基于相對(duì)粒度的約簡(jiǎn)算法發(fā)[8]等。本文通過(guò)將決策信息系統(tǒng)樹(shù)形化,并定義了在此樹(shù)形結(jié)構(gòu)上的屬性約簡(jiǎn),發(fā)現(xiàn)屬性可約簡(jiǎn)并不需要再次求得下上近似集,可直接由等價(jià)類所包含的決策屬性來(lái)決定,由此可增加屬性約簡(jiǎn)的效率。進(jìn)而給出了
電子設(shè)計(jì)工程 2015年12期2015-01-04
- 概念格約簡(jiǎn)與覆蓋約簡(jiǎn)之間的關(guān)系
4900)概念格約簡(jiǎn)與覆蓋約簡(jiǎn)之間的關(guān)系李立峰1, 俞 偉2(1.西安郵電大學(xué) 理學(xué)院, 陜西 西安 710121;2.中國(guó)人民解放軍69213部隊(duì), 新疆 喀什 844900)以一類與覆蓋粗糙集相對(duì)應(yīng)的形式背景為工具,對(duì)概念格屬性約簡(jiǎn)和覆蓋粗糙集約簡(jiǎn)進(jìn)行研究,結(jié)果表明覆蓋粗糙集與形式背景之間存在一一對(duì)應(yīng)關(guān)系,并且證明了覆蓋粗糙集的交約簡(jiǎn)可化為概念格的屬性約簡(jiǎn)。概念格; 屬性約簡(jiǎn); 覆蓋0 引 言概念格是根據(jù)對(duì)象與屬性之間的二元關(guān)系建立的一種層次結(jié)構(gòu)[1]
- 電控發(fā)動(dòng)機(jī)故障診斷屬性約簡(jiǎn)算法應(yīng)用研究
動(dòng)機(jī)故障診斷屬性約簡(jiǎn)算法應(yīng)用研究謝春麗,張東興,米志飛(東北林業(yè)大學(xué) 交通學(xué)院,黑龍江 哈爾濱 150040)利用粗糙集理論中的區(qū)分矩陣屬性約簡(jiǎn)算法對(duì)電控發(fā)動(dòng)機(jī)的幾種典型故障參數(shù)進(jìn)行屬性約簡(jiǎn),為驗(yàn)證約簡(jiǎn)結(jié)果是否有利于下一步的故障診斷,采用較成熟的BP神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行診斷驗(yàn)證,將約簡(jiǎn)結(jié)果作為網(wǎng)絡(luò)的輸入,待診斷故障作為網(wǎng)絡(luò)的輸出。通過(guò)學(xué)習(xí)訓(xùn)練結(jié)果表明:利用區(qū)分矩陣方法所獲得的核約簡(jiǎn)不能作為故障診斷的特征參量,其導(dǎo)致網(wǎng)絡(luò)不收斂,而其它3組約簡(jiǎn)可以用于區(qū)分現(xiàn)有故障
湖北汽車工業(yè)學(xué)院學(xué)報(bào) 2014年1期2014-07-12
- 變精度覆蓋決策信息系統(tǒng)的約簡(jiǎn)
蓋決策信息系統(tǒng)的約簡(jiǎn)許晴媛1,李進(jìn)金2,張燕蘭11.閩南師范大學(xué)計(jì)算機(jī)科學(xué)與工程系,福建漳州 3630002.閩南師范大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,福建漳州 363000把變精度方法引入到覆蓋決策信息系統(tǒng)中,給出變精度覆蓋下近似與變精度覆蓋上近似的定義。進(jìn)而討論了變精度覆蓋下近似與變精度覆蓋上近似的若干性質(zhì)及約簡(jiǎn)。分析了它們與覆蓋分布約簡(jiǎn)、最大覆蓋分布約簡(jiǎn)、覆蓋下近似約簡(jiǎn)、覆蓋上近似約簡(jiǎn)之間的關(guān)系。并給出實(shí)例進(jìn)行說(shuō)明。變精度;覆蓋;決策信息系統(tǒng);約簡(jiǎn)1 引言由P
計(jì)算機(jī)工程與應(yīng)用 2014年6期2014-07-07
- 綜合屬性選擇和刪除的屬性約簡(jiǎn)方法
50001)屬性約簡(jiǎn)利用粗糙集[1-2]等理論,旨在保持信息系統(tǒng)決策能力不變的條件下,去除冗余屬性,從而減少數(shù)據(jù)的冗余度,是機(jī)器學(xué)習(xí)和人工智能最重要的研究方向之一.屬性約簡(jiǎn)方法有很多,譬如基于依賴度的屬性約簡(jiǎn)方法[3]、基于互信息的屬性約簡(jiǎn)方法[4-5]、基于模糊粗糙集的屬性約簡(jiǎn)方法[6-8]等.Skowron于1992年提出了辨識(shí)矩陣和辨識(shí)函數(shù)的概念[9],利用辨識(shí)矩陣和辨識(shí)函數(shù)實(shí)現(xiàn)了屬性約簡(jiǎn),并得到了廣泛的研究[10].然而,基于辨識(shí)矩陣的屬性約簡(jiǎn)方法
智能系統(tǒng)學(xué)報(bào) 2013年2期2013-09-24
- 基于變精度粗糙集的不完備決策表屬性約簡(jiǎn)
不完備決策表屬性約簡(jiǎn)林春杰1,張瑞玲1,韓曉琴21.洛陽(yáng)師范學(xué)院 信息技術(shù)學(xué)院,河南 洛陽(yáng) 471022 2.洛陽(yáng)師范學(xué)院 教育科學(xué)學(xué)院,河南 洛陽(yáng) 4710221 引言粗糙集理論[1]是一種無(wú)需先驗(yàn)知識(shí),能夠處理不精確、不確定、不完備數(shù)據(jù)的數(shù)學(xué)工具,是經(jīng)典集合論的重要發(fā)展,在知識(shí)定義、知識(shí)約簡(jiǎn)、規(guī)則發(fā)現(xiàn)等方面[2-5],為知識(shí)獲取提供了一種嶄新的工具。然而經(jīng)典粗糙集模型對(duì)噪聲敏感,其對(duì)數(shù)據(jù)的過(guò)擬合而降低了對(duì)對(duì)象的預(yù)測(cè)能力。為了克服這些局限性,Ziarko
計(jì)算機(jī)工程與應(yīng)用 2013年13期2013-07-20
- 基于互信息的并行約簡(jiǎn)*
中求得一個(gè)穩(wěn)定的約簡(jiǎn)結(jié)果,Bazan[1-2]提出了動(dòng)態(tài)約簡(jiǎn)的概念.該理論的主體思想是先把要處理的決策表劃分成若干個(gè)具有強(qiáng)烈概率因素的子表,然后求出全部子表的所有約簡(jiǎn)并取其交集.通常認(rèn)為利用這種方式求得的約簡(jiǎn)結(jié)果較為穩(wěn)定.然而,動(dòng)態(tài)約簡(jiǎn)有2個(gè)缺點(diǎn):一是必須求出全部子決策表的所有約簡(jiǎn),時(shí)間復(fù)雜度很高;二是動(dòng)態(tài)約簡(jiǎn)得到的結(jié)果有可能為空,理論本身不完備.鄧大勇在文獻(xiàn)[3-6]中借鑒動(dòng)態(tài)約簡(jiǎn)的分表思想提出了并行約簡(jiǎn)理論.并行約簡(jiǎn)和動(dòng)態(tài)約簡(jiǎn)類似,都是將一個(gè)決策表拓展
- 一種改進(jìn)的最小屬性約簡(jiǎn)算法*
發(fā)現(xiàn)等領(lǐng)域.屬性約簡(jiǎn)是粗糙集理論中的一個(gè)核心內(nèi)容,目前有很多研究都是針對(duì)屬性約簡(jiǎn)方面的.求解屬性約簡(jiǎn)的算法可以劃分為如下幾類:(1)基于正區(qū)域的求解算法,有時(shí)在求解的過(guò)程中會(huì)結(jié)合屬性的重要性、互信息等;(2)基于差別矩陣的求解算法;(3)基于智能計(jì)算的求解方法,如基于遺傳算法和神經(jīng)網(wǎng)絡(luò).隨著問(wèn)題規(guī)模的增大,基于差別矩陣求解算法的缺陷會(huì)愈加凸顯.有時(shí)在利用正區(qū)域或差別矩陣求解時(shí),常結(jié)合屬性的重要性[1]、互信息[2]、屬性出現(xiàn)的頻率[3]等,使得算法更加高效
- 基于D-S證據(jù)理論直接求代數(shù)約簡(jiǎn)和代數(shù)核*
究熱點(diǎn)之一。屬性約簡(jiǎn)是Rough 集理論的核心問(wèn)題之一,也是知識(shí)獲取的關(guān)鍵步驟之一,因此屬性約簡(jiǎn)研究深受各研究者的關(guān)注。目前已有多種屬性約簡(jiǎn)方法被提出,歸納起來(lái)主要有Pawlak原始定義的屬性約簡(jiǎn),稱之為代數(shù)約簡(jiǎn); 基于條件信息熵的屬性約簡(jiǎn)(稱之為信息熵約簡(jiǎn))[2-3];基于包含度理論的分布約簡(jiǎn)、最大分布約簡(jiǎn)、分配約簡(jiǎn)及近似約簡(jiǎn)等[4];基于D-S證據(jù)理論的屬性約簡(jiǎn)方法等[5-7]。其中信息熵約簡(jiǎn)與分布約簡(jiǎn)是完全等價(jià)的[8],分配約簡(jiǎn)與近似約簡(jiǎn)也完全等價(jià)。
- 真度約簡(jiǎn)與計(jì)量邏輯學(xué)推理模式的關(guān)系
理和命題集的近似約簡(jiǎn).本文的目的就是探討命題集F(S)上的近似推理框架與命題集近似約簡(jiǎn)之間的關(guān)系.本文中,首先給出了n值 Lukasiewicz 命題集的真度約簡(jiǎn)及α-真度約簡(jiǎn)的概念,將命題集的精確約簡(jiǎn)轉(zhuǎn)化為近似約簡(jiǎn),然后指出了這種近似約簡(jiǎn)與計(jì)量邏輯學(xué)中近似推理模式的內(nèi)在聯(lián)系,為在F(S)上展開(kāi)近似推理提供了新的途徑.1 n值Lukasiewicz 命題系統(tǒng)中的真度約簡(jiǎn)定義1s={p1,p2,…}是一個(gè)可數(shù)集,F(S)是由S生成的(,∨,→)型自由代數(shù),是
陜西科技大學(xué)學(xué)報(bào) 2011年5期2011-02-20
- 真度約簡(jiǎn)與計(jì)量邏輯學(xué)推理模式的關(guān)系
理和命題集的近似約簡(jiǎn).本文的目的就是探討命題集F(S)上的近似推理框架與命題集近似約簡(jiǎn)之間的關(guān)系.本文中,首先給出了n值 Lukasiewicz 命題集的真度約簡(jiǎn)及α-真度約簡(jiǎn)的概念,將命題集的精確約簡(jiǎn)轉(zhuǎn)化為近似約簡(jiǎn),然后指出了這種近似約簡(jiǎn)與計(jì)量邏輯學(xué)中近似推理模式的內(nèi)在聯(lián)系,為在F(S)上展開(kāi)近似推理提供了新的途徑.1 n值Lukasiewicz 命題系統(tǒng)中的真度約簡(jiǎn)定義1s={p1,p2,…}是一個(gè)可數(shù)集,F(S)是由S生成的(,∨,→)型自由代數(shù),是
陜西科技大學(xué)學(xué)報(bào) 2011年5期2011-02-20