• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于粗糙集與關(guān)聯(lián)規(guī)則的道路運(yùn)輸管理信息數(shù)據(jù)挖掘方法*

      2014-03-15 08:44:00鄭曉峰王曙
      關(guān)鍵詞:決策表約簡(jiǎn)粗糙集

      鄭曉峰 王曙

      (華南理工大學(xué)土木與交通學(xué)院,廣東廣州510640)

      我國(guó)的道路交通運(yùn)輸發(fā)達(dá),占綜合運(yùn)輸?shù)?5%以上.針對(duì)道路交通運(yùn)輸管理復(fù)雜的特點(diǎn),近年來(lái)各省級(jí)道路運(yùn)輸管理機(jī)構(gòu)積極開(kāi)發(fā)和實(shí)施道路運(yùn)輸管理信息系統(tǒng),用科技的手段去規(guī)范管理、提供便民服務(wù).道路運(yùn)輸企業(yè)的質(zhì)量信譽(yù)考核和道路運(yùn)輸車輛準(zhǔn)入核查作為道路運(yùn)輸管理的兩項(xiàng)主要措施,所遇到的數(shù)據(jù)挖掘問(wèn)題在整個(gè)道路運(yùn)輸管理信息數(shù)據(jù)挖掘研究中具有普適性與代表性.數(shù)據(jù)挖掘[1]過(guò)程又稱知識(shí)發(fā)現(xiàn)過(guò)程,1989年在國(guó)際會(huì)議IJCAI(International Joint Conference on Artificial Intelligence)上被首次提出,經(jīng)過(guò)20多年的發(fā)展,目前已成為數(shù)據(jù)庫(kù)領(lǐng)域的熱門(mén)學(xué)科,其理論研究和實(shí)際應(yīng)用均取得了豐碩的成果,在交通運(yùn)輸領(lǐng)域的數(shù)據(jù)挖掘研究成果主要有:運(yùn)用聚類分析方法研究車輛衛(wèi)星定位數(shù)據(jù)挖掘[2-3],運(yùn)用關(guān)聯(lián)規(guī)則方法分析交通事故原因[4-5],運(yùn)用時(shí)空數(shù)據(jù)挖掘、關(guān)聯(lián)規(guī)則等方法研究交通規(guī)劃[6-7],綜合運(yùn)用分類、聚類和關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘方法研究交通流控制[8-9].但截至目前,關(guān)于海量道路運(yùn)輸管理信息數(shù)據(jù)挖掘方法的研究鮮見(jiàn)報(bào)道.

      數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中一類可被發(fā)現(xiàn)的重要知識(shí),若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián).道路運(yùn)輸管理所需的決策分析信息大部分涉及關(guān)聯(lián)問(wèn)題.關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘自Agrawal等[10]提出后已被廣泛研究,其傳統(tǒng)算法Apriori也在原有基礎(chǔ)上不斷得到優(yōu)化[11],但是目前仍然存在許多用算法不能解決的問(wèn)題,例如因數(shù)據(jù)庫(kù)的決策目標(biāo)和關(guān)聯(lián)屬性未規(guī)劃清楚而造成的龐大的關(guān)聯(lián)規(guī)則挖掘的運(yùn)算量,由于支持度和置信度等參數(shù)設(shè)置不適當(dāng)而產(chǎn)生的大量無(wú)用規(guī)則等.因此,準(zhǔn)確地規(guī)劃挖掘目標(biāo),做好數(shù)據(jù)的約簡(jiǎn)等預(yù)處理和合適地配置參數(shù)對(duì)關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘來(lái)說(shuō)意義重大.近年來(lái),關(guān)聯(lián)規(guī)則方法在交通運(yùn)輸領(lǐng)域的最新應(yīng)用研究成果集中在對(duì)時(shí)空數(shù)據(jù)的挖掘上[[4-7,12].這些成果所應(yīng)用到的數(shù)據(jù)本身具備明顯的時(shí)間序列性質(zhì),而道路運(yùn)輸管理信息多是無(wú)序的非結(jié)構(gòu)化數(shù)據(jù),挖掘其規(guī)律性規(guī)則難度更大,挖掘過(guò)程中會(huì)遇到更多的上述問(wèn)題,因此探索關(guān)聯(lián)規(guī)則在道路運(yùn)輸管理數(shù)據(jù)上的新的應(yīng)用思路和方法具有重要的現(xiàn)實(shí)意義.

      粗糙集理論是Pawlak[13]于1982年提出的一種數(shù)據(jù)挖掘工具.它的基本思想是通過(guò)關(guān)系數(shù)據(jù)庫(kù)分類歸納形成概念和規(guī)則,通過(guò)等價(jià)關(guān)系的分類以及分類對(duì)于目標(biāo)的近似來(lái)發(fā)現(xiàn)知識(shí).粗糙集能夠支持知識(shí)獲取的多個(gè)步驟(如數(shù)據(jù)預(yù)處理、數(shù)據(jù)約簡(jiǎn)、規(guī)則生成和依賴關(guān)系獲取等),而無(wú)需提供所需處理的數(shù)據(jù)集合之外的任何先驗(yàn)信息,所以對(duì)問(wèn)題不確定性的描述或處理可以說(shuō)是比較客觀的[14].道路運(yùn)輸管理信息多為不一致、不精確和不完整的數(shù)據(jù),而且其數(shù)據(jù)挖掘的目的多為決策分析類型,因此粗糙集分析方法適用于此類信息的數(shù)據(jù)挖掘.粗糙集理論發(fā)展30多年來(lái),在理論研究和應(yīng)用研究方面均取得了大量代表性成果[14-15],但有關(guān)粗糙集方法應(yīng)用于道路運(yùn)輸管理信息數(shù)據(jù)挖掘的研究在國(guó)內(nèi)外卻鮮見(jiàn)報(bào)道.

      針對(duì)道路運(yùn)輸管理信息數(shù)據(jù)的特點(diǎn),文中利用粗糙集屬性約簡(jiǎn)方法,研究關(guān)聯(lián)規(guī)則傳統(tǒng)理論與粗糙集理論的結(jié)合問(wèn)題,提出粗糙集分析與經(jīng)典關(guān)聯(lián)規(guī)則相結(jié)合的數(shù)據(jù)挖掘方法,利用粗糙集方法分析規(guī)則條數(shù)與支持度、置信度之間的關(guān)系,并針對(duì)質(zhì)量信譽(yù)考核問(wèn)題驗(yàn)證了粗糙集分析和關(guān)聯(lián)規(guī)則的綜合方法,研究了屬性約簡(jiǎn)方法在道路運(yùn)輸車輛準(zhǔn)入核查中的應(yīng)用.

      1 相關(guān)理論知識(shí)

      1.1 關(guān)聯(lián)規(guī)則

      設(shè)I={I1,I2,…,Im}是文字屬性,稱為項(xiàng).給定一個(gè)事務(wù)數(shù)據(jù)庫(kù)D,D={t1,t2,…,tn}.其中每個(gè)事務(wù)ti(i=1,2,…,n)都對(duì)應(yīng)I的一個(gè)子集,滿足tn?I.每一個(gè)事務(wù)都有一個(gè)標(biāo)識(shí)符TID.如果項(xiàng)集α?I、β?I,并且α∩β=?,則形如式(1)的蘊(yùn)涵式稱為關(guān)聯(lián)規(guī)則:

      如果D中有s的事務(wù)包含α∪β(其中s=D中包含α∪β的事務(wù)個(gè)數(shù)/D中所有事務(wù)個(gè)數(shù) × 100%),那么規(guī)則α?β的支持度為s,其計(jì)算表達(dá)式為

      如果包含α的事務(wù)有c也包含β(其中c=既包含α又包含β的事務(wù)個(gè)數(shù)/包含α的事務(wù)個(gè)數(shù)× 100%),那么規(guī)則α?β的置信度為c,其計(jì)算表達(dá)式為

      設(shè)定最小支持度θ和最小置信度ω,如果s≥θ且c≥ω,則α?β為強(qiáng)關(guān)聯(lián)規(guī)則.

      1.2 粗糙集

      1.2.1 信息系統(tǒng)的抽象

      粗糙集理論把客觀世界抽象為一個(gè)信息系統(tǒng)[13].一個(gè)信息系統(tǒng)S是一個(gè)四元組,記為

      其中:U是對(duì)象(或事例)的有限集合,也稱為論域,U={u1,u2,…,um};A是對(duì)象屬性的有限集合,記為A={a1,a2,…,am};V是屬性的值域集,記為V=∪Vi,Vi是A中元素ai的值域;f是信息函數(shù),記為f:U×A V,f(ui,ai)∈Vi,他為每一個(gè)對(duì)象的每一個(gè)屬性賦予一個(gè)值.

      1.2.2 不可分辨關(guān)系

      設(shè)G={g1,g2,…,gn}?A,可以定義G上的一個(gè)不可分辨關(guān)系:

      1.2.3 等價(jià)類和劃分

      對(duì)于ui∈U,可用集合[ui]g來(lái)表示包含元素ui的等價(jià)類,.所有得到的等價(jià)類的并集構(gòu)成了論域U的劃分,記為U/ind(G),也稱為U的基本知識(shí)或概念.

      1.2.4 約簡(jiǎn)

      如果屬性集合G?A滿足ind(G)=ind(A),且對(duì)于任意gk∈G均滿足式(5):

      則G是A的一個(gè)約簡(jiǎn),記為G=RED(A).A的所有約簡(jiǎn)的交集構(gòu)成A的屬性約簡(jiǎn)的核,記為CORE(A)=∩RED(A).

      2 基于粗糙集理論的關(guān)聯(lián)規(guī)則挖掘

      2.1 基本思想

      傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘有4個(gè)重要的步驟[16]:

      步驟1數(shù)據(jù)預(yù)處理;

      步驟2 根據(jù)最小支持度找出數(shù)據(jù)集中的所有頻繁項(xiàng)集;

      步驟3 根據(jù)頻繁項(xiàng)集和最小置信度產(chǎn)生關(guān)聯(lián)規(guī)則;

      步驟4 評(píng)估規(guī)則.

      傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘的研究重點(diǎn)在產(chǎn)生關(guān)聯(lián)規(guī)則的算法求解和改善上.但事實(shí)上,關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù)預(yù)處理是非常關(guān)鍵的,粗糙集理論在描述數(shù)據(jù)系統(tǒng)和簡(jiǎn)化待挖掘數(shù)據(jù)系統(tǒng)關(guān)聯(lián)項(xiàng)問(wèn)題方面有獨(dú)到的作用.此外,如果最小支持度和最小置信度兩個(gè)關(guān)鍵閾值設(shè)置不當(dāng),會(huì)產(chǎn)生大量的頻繁項(xiàng)集和大量的冗余規(guī)則,影響用戶的決策,這是規(guī)則評(píng)估的關(guān)鍵問(wèn)題.因此可嘗試運(yùn)用粗糙集理論和方法,對(duì)規(guī)則條數(shù)與最小支持度和最小置信度之間的關(guān)系問(wèn)題進(jìn)行求解.

      2.2 關(guān)聯(lián)規(guī)則和粗糙集融合解決方法

      2.2.1 歸納關(guān)聯(lián)規(guī)則

      按照粗糙集方法的信息系統(tǒng)抽象方法,大多數(shù)關(guān)聯(lián)規(guī)則挖掘問(wèn)題可歸納為求解實(shí)例中以決策目標(biāo)確定的關(guān)鍵數(shù)據(jù)項(xiàng)集和其余數(shù)據(jù)項(xiàng)集之間關(guān)聯(lián)規(guī)則的問(wèn)題.

      定義1 式(4)中的對(duì)象屬性A通??梢詣澐譃閮蓚€(gè)集合E和F,A=E∪F,E∩F=?.E稱為條件屬性集,F(xiàn)稱為決策屬性.將一個(gè)數(shù)據(jù)庫(kù)中待求解關(guān)聯(lián)規(guī)則的數(shù)據(jù)項(xiàng)集劃分為粗糙集表述的信息系統(tǒng)中A的條件屬性集和決策屬性,表達(dá)為求解S=〈U,A,V,f〉(A=E∪F,E∩F=?)中E?F的問(wèn)題.這里的U指關(guān)聯(lián)數(shù)據(jù)庫(kù)所有記錄的集合(即為式(4)中所稱的論或),這時(shí)的S也稱為決策表.

      通過(guò)定義1的歸納,待求解關(guān)聯(lián)規(guī)則的數(shù)據(jù)項(xiàng)集即可先根據(jù)粗糙集理論的約簡(jiǎn)方法做預(yù)處理以減少冗余數(shù)據(jù)項(xiàng).

      2.2.2 約簡(jiǎn)條件屬性集

      粗糙集理論的約簡(jiǎn)的典型算法是根據(jù)式(5)衍生得到的.文獻(xiàn)[17]介紹了通過(guò)構(gòu)造差別矩陣對(duì)條件屬性集E進(jìn)行約簡(jiǎn)的方法.該方法的差別矩陣M是一個(gè)的矩陣,其中的每一個(gè)元素mij? E,做進(jìn)一步整理得到式(6):

      M為主對(duì)角線為?的對(duì)稱矩陣,在實(shí)際應(yīng)用中只計(jì)算它的上三角陣.約簡(jiǎn)的計(jì)算過(guò)程是對(duì)mij中每個(gè)元素進(jìn)行“或”運(yùn)算,然后再對(duì)所有的mij進(jìn)行“與”運(yùn)算,最后的結(jié)果就是M約簡(jiǎn)的組合.

      2.2.3 粗糙集方法與Apriori算法的結(jié)合

      定義2 設(shè)集合L是條件屬性集E的子集,以L得到的等價(jià)類稱為特征集,記為[X],其中X是特征集[X]的描述.如果L有k個(gè)元素,那么稱[X]為k元特征集,記為[Xk].Xk稱為k元特征描述,用式(7)表述:

      定義3 令θ是關(guān)聯(lián)規(guī)則的最小支持度,如果規(guī)則Xk?F的支持度大于θ,那么稱由Xk確定的k元特征集為頻繁k-項(xiàng)集.令Tk表示頻繁k-項(xiàng)集的集合,Rk是k元特征集的集合,稱為k元候選集.則有Rk?Tk,主要方法總結(jié)為算法1,描述如下:

      待挖掘的數(shù)據(jù)庫(kù)用粗糙集方法處理后,歸納成決策表S,S=〈U,A,V,f〉(A=E∪F,E∩F=?).E1為條件屬性集E的約簡(jiǎn),F(xiàn)為決策屬性,設(shè)θ為最小支持度,ω為最小置信度.

      結(jié)合Apriori-new算法[18],得到E1?F的關(guān)聯(lián)規(guī)則,如圖1所示.

      圖1 粗糙集應(yīng)用于關(guān)聯(lián)規(guī)則挖掘的算法流程Fig.1 Algorithm process of association rule mining using rough set

      2.2.4 關(guān)聯(lián)規(guī)則條數(shù)與參數(shù)配置的關(guān)系

      上述方法中,最小支持度和最小置信度的設(shè)置對(duì)關(guān)聯(lián)規(guī)則的產(chǎn)生條數(shù)有重大的影響.通過(guò)設(shè)置一定范圍的最小支持度和最小置信度,得到一定范圍內(nèi)的規(guī)則條數(shù),它們之間的關(guān)系可能也存在一定的規(guī)律.文獻(xiàn)[19]用回歸分析的方法研究這一關(guān)系.但事實(shí)上這一個(gè)關(guān)系是不確定的,針對(duì)特定領(lǐng)域的應(yīng)用,可運(yùn)用粗糙集的方法來(lái)求解它們的關(guān)系.

      根據(jù)粗糙集理論,得到另一個(gè)決策表P,P=〈U2,A2,V2,f2〉(A2=E2∪F2,E2∩F2=?).U2是關(guān)聯(lián)規(guī)則運(yùn)算記錄集,θ2是最小支持度,ω2是最小置信度.設(shè)θ2∪ω2=E2,F(xiàn)2是規(guī)則條數(shù).通過(guò)上述方法可求解形如E2?F2的關(guān)聯(lián)規(guī)則.

      3 應(yīng)用研究

      3.1 道路運(yùn)輸企業(yè)質(zhì)量信息考核驗(yàn)證

      文中提出的粗糙集和關(guān)聯(lián)規(guī)則綜合應(yīng)用方法,已在廣東省道路運(yùn)政管理信息系統(tǒng)中的客運(yùn)企業(yè)質(zhì)量信譽(yù)考核數(shù)據(jù)庫(kù)得到驗(yàn)證.

      3.1.1 決策屬性與決策表

      客運(yùn)企業(yè)質(zhì)量信譽(yù)考核評(píng)分表中有4個(gè)要素:運(yùn)輸安全、經(jīng)營(yíng)行為、服務(wù)質(zhì)量和社會(huì)責(zé)任.每個(gè)要素對(duì)應(yīng)各自的得分檔次,道路運(yùn)輸管理部門(mén)組織專家對(duì)每個(gè)企業(yè)按照評(píng)分表就各要素進(jìn)行打分,然后綜合各要素得分情況,再結(jié)合專家意見(jiàn)得到最后的評(píng)定結(jié)論.可以看出,管理部門(mén)需要知道的是評(píng)定結(jié)論與哪些要素的取值結(jié)合較為緊密,哪些要素在實(shí)際操作中可以忽略.因此,可設(shè)評(píng)定結(jié)論為決策屬性,評(píng)定要素為條件屬性,評(píng)定記錄為論域.為了說(shuō)明問(wèn)題,選擇9條記錄建立如表1所示的決策表,其中{運(yùn)輸安全、經(jīng)營(yíng)行為、服務(wù)質(zhì)量,社會(huì)責(zé)任}為條件屬性集,評(píng)定結(jié)果為決策屬性.

      表1 道路運(yùn)輸企業(yè)質(zhì)量信譽(yù)考核決策表Table 1 Decision table of quality credit assessment for road transport ation enterprise

      3.1.2 數(shù)據(jù)預(yù)處理

      為了構(gòu)造差別矩陣來(lái)對(duì)決策表進(jìn)行約簡(jiǎn),使用字母a、b、c、d、e來(lái)代替各屬性,其中a、b、c、d代表?xiàng)l件屬性,e代表決策屬性;同時(shí)為簡(jiǎn)化文中的計(jì)算過(guò)程,各屬性值合并劃分為兩個(gè)檔次,好用“1”表示,中和差合并為一個(gè)檔次,用“0”表示,得到表2所示的概化表.

      表2 概化后的決策表Table 2 Generalized decision table

      3.1.3 條件屬性集的約簡(jiǎn)

      按照前文所提到的差別矩陣約簡(jiǎn)方法得到差別矩陣M:

      對(duì)矩陣中各元素進(jìn)行“或”運(yùn)算,然后進(jìn)行“與”運(yùn)算,最后得到a∧b∧c,則得到一個(gè)約簡(jiǎn){a,b,c},約簡(jiǎn)后的決策表如表3所示.

      表3 約簡(jiǎn)后的決策表Table 3 Reduced decision table

      3.1.4 關(guān)聯(lián)規(guī)則的獲取

      設(shè)最小支持度θ=30%,最小置信度ω=80%,利用算法1得到以下4條關(guān)聯(lián)規(guī)則.

      其現(xiàn)實(shí)意義是運(yùn)輸安全性好且經(jīng)營(yíng)行為好的則質(zhì)量信譽(yù)好,運(yùn)輸安全性好且服務(wù)質(zhì)量中等的則質(zhì)量信譽(yù)好,經(jīng)營(yíng)行為好且服務(wù)質(zhì)量好的則質(zhì)量信譽(yù)中等,經(jīng)營(yíng)行為差且服務(wù)質(zhì)量差的則質(zhì)量信譽(yù)差.

      3.1.5 規(guī)則條數(shù)與支持度、置信度的關(guān)系

      在上述計(jì)算過(guò)程中,采用多個(gè)最小支持度θ2和最小置信度ω的組合,得到規(guī)則條數(shù)F2的對(duì)應(yīng)值,組成決策表P.再用決策表P及算法1可得到最小支持度θ、最小置信度ω和規(guī)則條數(shù)F2的關(guān)系如下:

      即當(dāng)最小置信度ω在30%≤ω≤50%區(qū)間取值,且最小支持度θ在70%≤θ≤90%區(qū)間取值時(shí),可使規(guī)則條數(shù)穩(wěn)定在3到5條.

      3.2 道路運(yùn)輸車輛準(zhǔn)入驗(yàn)證

      3.2.1 燃料限值核查制度的主要問(wèn)題

      燃料限值核查制度是指各地交通主管部門(mén)根據(jù)國(guó)家頒布實(shí)施的達(dá)標(biāo)車型表去核查道路運(yùn)輸車輛是否達(dá)標(biāo).表里的核查項(xiàng)目是需要核查的達(dá)標(biāo)車型表中公布車型的具體參數(shù).對(duì)照檢查公布車型的具體參數(shù)與實(shí)際車輛的具體參數(shù)是核查工作的主要內(nèi)容,因此核查項(xiàng)目的多少直接決定了實(shí)施部門(mén)的工作量.研究究竟真正需要核查多少具體參數(shù),既能保證數(shù)據(jù)能夠判斷實(shí)際車輛是否滿足達(dá)標(biāo)車型的要求,又能最大限度地減少核查內(nèi)容、減少地方道路運(yùn)輸管理部門(mén)的工作量,是實(shí)施燃料限值核查工作遇到的主要問(wèn)題.實(shí)際工作中遇到的是如表4所示的數(shù)據(jù)表.

      表4 計(jì)算示例數(shù)據(jù)表Table 4 Data table of calculation example

      3.2.2 核查項(xiàng)目約簡(jiǎn)解決方法

      目前燃料限值制度的核查項(xiàng)目有12項(xiàng),設(shè)為核查項(xiàng)目的集合{車輛型號(hào),載客人數(shù)(含駕駛員),外形尺寸,整備質(zhì)量,總質(zhì)量,發(fā)動(dòng)機(jī)型號(hào),底盤(pán)型號(hào),驅(qū)動(dòng)型式,輪胎規(guī)格,貨箱欄板內(nèi)尺寸或容積,牽引座最大允許承載質(zhì)量,準(zhǔn)拖掛車總質(zhì)量},用字母代替表示為{C,H,J,K,L,N,O,P,Q,R,T,W},Y代表結(jié)論.

      廣東省自2010年3月1日全面實(shí)施燃料限值核查制度后,核查新增道路運(yùn)輸營(yíng)運(yùn)車輛共12814輛,其中核查結(jié)論為通過(guò)的有12649輛,不通過(guò)的有165輛.

      通過(guò)廣東省道路運(yùn)輸管理信息系統(tǒng)后臺(tái)數(shù)據(jù)庫(kù)取得已具有12814條記錄的數(shù)據(jù)表,以表4的定義生成決策表,如表5所示.

      表5 廣東省燃料限值工作決策表Table 5 Work decision table of fuel limits set by Guangdong Province

      利用上述方法來(lái)求條件屬性的約簡(jiǎn),利用C++語(yǔ)言編程并在Windows 7平臺(tái)進(jìn)行“與”和“或”運(yùn)算,最后得到該決策表的一個(gè)約簡(jiǎn){C,H,J,N,O,P,R,T},即車輛型號(hào)、載客人數(shù)、外形尺寸、發(fā)動(dòng)機(jī)型號(hào)、底盤(pán)型號(hào)、驅(qū)動(dòng)型式、貨箱欄板內(nèi)尺寸或容積、牽引座最大允許承載質(zhì)量為必須核查的項(xiàng)目,可將原12項(xiàng)的核查項(xiàng)目減少為8項(xiàng),即決策表的條件屬性減少33%,對(duì)應(yīng)的工作量也減少了33%,有重要的實(shí)際應(yīng)用價(jià)值.

      4 結(jié)語(yǔ)

      文中針對(duì)道路運(yùn)輸管理信息數(shù)據(jù)的特點(diǎn),將粗糙集理論方法運(yùn)用到經(jīng)典關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘中,提出了粗糙集分析與經(jīng)典關(guān)聯(lián)規(guī)則相結(jié)合的數(shù)據(jù)挖掘方法,利用粗糙集方法分析了規(guī)則條數(shù)與支持度、置信度之間的關(guān)系;通過(guò)道路運(yùn)輸管理的實(shí)際案例驗(yàn)證了該方法的科學(xué)有效性,證明該方法對(duì)于解決道路運(yùn)輸管理的實(shí)際問(wèn)題切實(shí)可行.但由于關(guān)聯(lián)規(guī)則帶有一定的主觀判斷,因此在挖掘目標(biāo)不明顯的數(shù)據(jù)挖掘應(yīng)用中有一定局限性.該方法較為適用于推測(cè)評(píng)定結(jié)果和評(píng)定指標(biāo)之間關(guān)系的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘.

      [1] 李思男,李寧,李戰(zhàn)懷.多標(biāo)簽數(shù)據(jù)挖掘技術(shù):研究綜述[J].計(jì)算機(jī)科學(xué),2013,40(4):14-15.Li Si-nan,Li Ning,Li Zhan-huai.Multi-label data mining:a survey[J].Compute Science,2013,40(4):14-15.

      [2] 唐亮.信息化條件下?tīng)I(yíng)運(yùn)車輛安全監(jiān)管關(guān)鍵技術(shù)研究[D].重慶:重慶大學(xué)自動(dòng)化學(xué)院,2012.

      [3] 劉衛(wèi)寧,曾嬋娟,孫棣華.基于DBSCAN算法的營(yíng)運(yùn)車輛超速點(diǎn)聚類分析[J].計(jì)算機(jī)工程,2009,35(5): 268-272.Liu Wei-ning,Zeng Chan-juan,Sun Di-hua.Clustering analysis of overspeed spots for commercial vehicles based on DBSCAN[J].Computer Engineering,2009,35(5): 268-272.

      [4] Xiao Juan,Ye Feng,Xie Yafen,et al.Association rule mining and application in intelligent transportation system[C]∥Proceedings of the 27th Chinese Control Conference.Kunming:Beihang University Press,2008.

      [5] Tian Rui,Zhao-sheng Yang,Zhang Mao-lei.Method of road traffic accidents causes analysis based on data mining[C]∥Proceedings of 2010 International Conference on Computational Intelligence and Software Engineering.Changchun:IEEE,2010.

      [6] Lee Wei-Hsun,Tsenga Shian-Shyong,Tsaia Sheng-Han.A knowledge based real-time travel time prediction system for urban network[J].Expert Systems with Appli-cations,2009,36(3):4239-4247.

      [7] Zhou Guo-qing,Wang Lin-bing,Wang Dong,et al.Integration of GIS and data mining technology to enhance the pavement management decision making[J].Journal of Transportation Engineering,2010,136(4):332-341.

      [8] 夏英,張俊,王國(guó)胤.時(shí)空關(guān)聯(lián)規(guī)則挖掘算法及其在ITS中的應(yīng)用[J].計(jì)算機(jī)科學(xué),2011 38(9):173-176.Xia Ying,Zhang Jun,Wang Guo-yin.Spatio-temporal association rule mining algorithm and its application in intelligent transportation system[J].Compute Science,2011,38(9):173-176.

      [9] Chen Shu-yan,Wang Wei,Zuylen van Henk.A comparison of outlier detection algorithms for ITS data[J].Expert Systems with Applications,2010,37(2):1169-1178.

      [10] Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in Large databases[C]∥Proceeding of the ACMSIGMOD International Conference on Management of Data(ACMSIGMOD'93).Washington:IEEE,1993.

      [11] 曾安平.多類關(guān)聯(lián)規(guī)則生成算法[J].計(jì)算機(jī)應(yīng)用,2012,32(8):2198-2201.Zeng An-ping,Muti-class association rule generation algorithm[J].Journal of computer applications,2012,32 (8):2198-2201.

      [12] 夏英.智能交通系統(tǒng)中的時(shí)空數(shù)據(jù)分析關(guān)鍵技術(shù)研究[D].成都:西南交通大學(xué)計(jì)算機(jī)與通信工程學(xué)院,2012

      [13] Pawlak Z.Rough sets[J].International Journal of Parallel Programming,1982,11(5):341-356.

      [14] 王國(guó)胤,姚一豫,于洪.粗糙集理論與用研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2009,32(7):1229-1246.Wang Guo-yin,Yao Yi-yu,Yu Hong.A survey on rough set theory and applications[J].Chinese Journal of Computers,2009,32(7):1229-1246.

      [15] 王學(xué)恩,韓崇昭,韓德強(qiáng),等.粗糙集研究綜述[J].控制工程,2013,20(1):1-8.Wang Xue-en,Han Chong-zhao,Han De-qiang,et al.A survey of rough sets theory[J].Control Engineering of China,2013,20(1):1-8.

      [16] Agrawal R,Srikant R.Fast algorithms for mining association rules[C]∥20th International Conference on Very Large Databases.San Francisco:IEEE,1994.

      [17] 唐建國(guó),譚明術(shù).粗糙集理論中的求核和約簡(jiǎn)控制與決策[J].控制與決策,2003,18(4):449-452.Tang Jian-guo,Tan Ming-shu.On finding core and reduction in rough set theory[J].Control and Decision,2003,18(4):449-452.

      [18] 程巖,黃梯云.信息系統(tǒng)中一種面向粗糙集的數(shù)據(jù)挖掘方法[J].情報(bào)學(xué)報(bào),2001,20(1):90-99.Cheng Yan,Huang Ti-yun.A method of rough-set oriented data mining in information system[J].Journal of The China Society For Scientific and Technical Information,2001,20(1):90-99.

      [19] 邸書(shū)靈,陳娜,馬新娜.回歸分析在關(guān)聯(lián)規(guī)則挖掘中的應(yīng)用研究[J].微計(jì)算機(jī)信息,2008,24(1/2/3): 171-172.Di Shu-ling,Chen Na,Ma Xin-na.Regression analysis and application in association rules mining[J].Microcomputer Information,2008,24(1/2/3):171-172.

      猜你喜歡
      決策表約簡(jiǎn)粗糙集
      基于決策表相容度和屬性重要度的連續(xù)屬性離散化算法*
      基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
      基于二進(jìn)制鏈表的粗糙集屬性約簡(jiǎn)
      實(shí)值多變量維數(shù)約簡(jiǎn):綜述
      基于模糊貼近度的屬性約簡(jiǎn)
      多粒化粗糙集性質(zhì)的幾個(gè)充分條件
      雙論域粗糙集在故障診斷中的應(yīng)用
      正反轉(zhuǎn)電機(jī)缺相保護(hù)功能的實(shí)現(xiàn)及決策表分析測(cè)試
      兩個(gè)域上的覆蓋變精度粗糙集模型
      一種改進(jìn)的分布約簡(jiǎn)與最大分布約簡(jiǎn)求法
      河南科技(2014年7期)2014-02-27 14:11:29
      泰兴市| 四子王旗| 酒泉市| 新闻| 湘潭市| 福建省| 新绛县| 临朐县| 喜德县| 崇阳县| 吴川市| 云霄县| 博客| 赫章县| 汕头市| 惠来县| 屯留县| 桦甸市| 登封市| 绿春县| 固始县| 桂平市| 高清| 亚东县| 钦州市| 绍兴市| 金阳县| 健康| 临朐县| 兰考县| 五原县| 唐河县| 隆安县| 兴义市| 台北市| 许昌市| 易门县| 华宁县| 中西区| 乐业县| 江安县|