• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      分布式數(shù)據(jù)挖掘綜述

      2014-10-20 06:40:48
      關(guān)鍵詞:數(shù)據(jù)源本體站點(diǎn)

      劉 濱

      (河北科技大學(xué)經(jīng)濟(jì)管理學(xué)院,河北石家莊 050018)

      隨著網(wǎng)絡(luò)(有線和無線)技術(shù)在計(jì)算、通信和安全等領(lǐng)域不斷產(chǎn)生重要突破,互聯(lián)網(wǎng)、移動(dòng)網(wǎng)、廣電網(wǎng)、物聯(lián)網(wǎng)、視聯(lián)網(wǎng)等現(xiàn)代網(wǎng)絡(luò)及衍生業(yè)務(wù)迅速擴(kuò)張,形成泛在于網(wǎng)絡(luò)空間的、包括各種數(shù)據(jù)和計(jì)算資源的分布式計(jì)算環(huán)境[1-2]。例如:互聯(lián)網(wǎng)的蓬勃發(fā)展,催生出豐富的網(wǎng)絡(luò)業(yè)務(wù)形態(tài),如電子商務(wù)、電子政務(wù)、網(wǎng)絡(luò)教育、網(wǎng)絡(luò)游戲等,為各類組織迅速集聚起海量數(shù)據(jù)。為了最大化這些數(shù)據(jù)的價(jià)值,將其應(yīng)用范圍從傳統(tǒng)的服務(wù)于業(yè)務(wù)處理、報(bào)表統(tǒng)計(jì)的事務(wù)服務(wù)層次擴(kuò)展至知識(shí)服務(wù)層次,需要利用數(shù)據(jù)挖掘(data mining,DM)技術(shù)發(fā)現(xiàn)其中隱藏的模式或規(guī)則,用以指導(dǎo)和輔助生產(chǎn)或運(yùn)營中的管理決策行為,以提高決策水平及決策收益。例如,在電子商務(wù)領(lǐng)域,研究基于關(guān)聯(lián)規(guī)則的購物籃分析方法[3],針對(duì)客戶動(dòng)態(tài)地調(diào)整站點(diǎn)結(jié)構(gòu)和網(wǎng)頁內(nèi)容,有助于實(shí)現(xiàn)商品的關(guān)聯(lián)銷售;研究購買行為相似的客戶分類方法[4],有助于提供個(gè)性化服務(wù)以提高客戶滿意度;研究瀏覽行為相似的客戶聚類方法[5],有助于把握各類客戶的消費(fèi)習(xí)慣和傾向,向其推薦特定商品和實(shí)現(xiàn)交叉銷售,既提高了營銷的目標(biāo)性和有效性,又降低了營銷成本。

      然而,這些互聯(lián)于網(wǎng)絡(luò)的數(shù)據(jù)源間普遍存在異構(gòu)性、私有性和平臺(tái)兼容性等限制,兼因行業(yè)競(jìng)爭(zhēng)和法律約束等因素(如個(gè)人或企業(yè)的數(shù)據(jù)隱私保護(hù)問題等)難于進(jìn)行集中式挖掘[6],而分布式數(shù)據(jù)挖掘(distributed data mining,DDM)技術(shù),通常被視為DM技術(shù)在分布式環(huán)境中的擴(kuò)展,已經(jīng)證明了其在應(yīng)對(duì)以上問題時(shí)的有效性,并且,即便在數(shù)據(jù)非物理分布的條件下,DDM技術(shù)也能提高挖掘的效率。GIANNELLA等對(duì)分布式挖掘與集中式挖掘進(jìn)行了比較,概括出了DDM的2點(diǎn)優(yōu)勢(shì)[7]:

      1)網(wǎng)絡(luò)通信開銷較少 在DDM過程中,在每個(gè)數(shù)據(jù)源處進(jìn)行局部挖掘后,將中間結(jié)果(局部模式)而非數(shù)據(jù)傳輸?shù)街醒胩幚韱卧员阏铣鋈帜J?。與集中式DM需要傳輸局部數(shù)據(jù)源處的大量數(shù)據(jù)相比,DDM中僅需傳輸局部模式,網(wǎng)絡(luò)通信帶來的時(shí)空開銷更少;

      2)安全性較好 對(duì)分布式環(huán)境下?lián)碛懈鱾€(gè)局部數(shù)據(jù)源的組織而言,DDM過程中只需共享(傳遞)挖掘出來的局部模式而非全部數(shù)據(jù),有助于更好地保護(hù)數(shù)據(jù)私有性。

      1 DDM相關(guān)概念

      1.1 定義與框架

      圖1 分布式數(shù)據(jù)挖掘框架Fig.1 Distributed data mining framework

      DDM在20世紀(jì)90年代后期逐漸被人們關(guān)注,通常被定義為分布式環(huán)境中的數(shù)據(jù)挖掘[8],或是利用分布式計(jì)算資源挖掘分布式數(shù)據(jù)資源,并對(duì)局部結(jié)果(模式)進(jìn)行整合以得到最終結(jié)果(全局模式)[9]。在圖1中給出的DDM 高層架構(gòu)中[10],顯然,最終結(jié)果的質(zhì)量與局部數(shù)據(jù)源的類型、可用性、局部結(jié)果的質(zhì)量及整合方法等密切相關(guān)。

      DDM的實(shí)施未必都以站點(diǎn)間純粹獨(dú)立挖掘的方式進(jìn)行,當(dāng)某個(gè)(些)站點(diǎn)具備較強(qiáng)的計(jì)算、存儲(chǔ)和通信能力時(shí),這個(gè)(些)站點(diǎn)可以匯聚其他站點(diǎn)的數(shù)據(jù),形成“全局分布、局部集中”挖掘方式;此外,DDM中的數(shù)據(jù)也未必都來自于分布式數(shù)據(jù)源,對(duì)于擁有海量集中數(shù)據(jù),同時(shí)擁有分布式站點(diǎn)(計(jì)算資源、存儲(chǔ)資源等)的組織來講,可以將數(shù)據(jù)分散到各站點(diǎn),充分利用站點(diǎn)資源,實(shí)施分布式挖掘,獲得優(yōu)于集中式挖掘的效率。

      1.2 適用場(chǎng)景

      DDM通常適用于具有如下特征的場(chǎng)景中[11]:

      1)系統(tǒng)包括多個(gè)具有獨(dú)立數(shù)據(jù)和計(jì)算資源的站點(diǎn),站點(diǎn)間僅通過消息傳遞進(jìn)行通信;

      2)站點(diǎn)之間的通信開銷昂貴(否則,可以進(jìn)行集中式DM了);

      3)站點(diǎn)具有資源限制(例如,資源的可用時(shí)間、范圍等);

      4)會(huì)考慮站點(diǎn)資源私有性保護(hù)(例如,數(shù)據(jù)資源的使用權(quán)限、可用范圍等)的問題。

      1.3 研究挑戰(zhàn)

      當(dāng)前,DDM研究與應(yīng)用領(lǐng)域的主要挑戰(zhàn)如下[12-13]。

      1)異構(gòu)與同構(gòu)挖掘 當(dāng)源數(shù)據(jù)主要來自少數(shù)幾處站點(diǎn),并且由相同的數(shù)據(jù)庫管理系統(tǒng)(data base management system,DBMS)和管理模式來維護(hù)時(shí),大部分?jǐn)?shù)據(jù)的結(jié)構(gòu)(屬性、格式、單位等)規(guī)范而統(tǒng)一,此時(shí),DM的主要開銷在于處理同構(gòu)式數(shù)據(jù);而當(dāng)源數(shù)據(jù)內(nèi)部存在大量異構(gòu)數(shù)據(jù)時(shí),則需要在挖掘前將各分布站點(diǎn)的數(shù)據(jù)轉(zhuǎn)變?yōu)槿忠恢碌慕Y(jié)構(gòu),否則,結(jié)構(gòu)上的沖突在所難免(例如:同類同質(zhì)數(shù)據(jù)卻分別歸于不同的屬性等)。

      2)動(dòng)態(tài)環(huán)境下的數(shù)據(jù)多變性 在傳統(tǒng)的挖掘過程中,數(shù)據(jù)通常被視為靜態(tài)的,挖掘工作在擁有足夠多數(shù)據(jù)的環(huán)境中進(jìn)行。而隨著一些新興業(yè)務(wù)的發(fā)展,例如電子商務(wù),與其相關(guān)的數(shù)據(jù)具有天然的時(shí)變性,即數(shù)據(jù)的產(chǎn)生、有效性等與時(shí)間值密切相關(guān),挖掘結(jié)果也具有時(shí)間敏感性。由此知,在分布式環(huán)境下,將各個(gè)站點(diǎn)處時(shí)間敏感的、具有動(dòng)態(tài)特征的局部挖掘結(jié)果正確傳送、聚集、整合具有一定的挑戰(zhàn)性。

      3)通信開銷 集中挖掘條件下,挖掘算法通常結(jié)合系統(tǒng)的I/O開銷和CPU時(shí)間開銷進(jìn)行設(shè)計(jì)。而在分布式數(shù)據(jù)環(huán)境中,站點(diǎn)間的通信開銷是影響挖掘效果的重要因素,和網(wǎng)絡(luò)帶寬、傳送的信息量等密切相關(guān)。

      4)知識(shí)整合[14-15]DDM的最終目標(biāo)是通過分析、整合局部模式來獲得最終的全局模式。就局部數(shù)據(jù)集的分析任務(wù)而言,可以采取現(xiàn)有的集中式挖掘的方法;而在整合局部結(jié)果方面,傳統(tǒng)的簡(jiǎn)單整合的方法或許不再有效。例如,對(duì)某個(gè)或某些局部站點(diǎn)的有趣模式,放在全局層面來看,或許將不再具有價(jià)值。所以,為了整合出全局模式,有必要先收集全部的局部有趣模式,站在全局層面考察局部模式的價(jià)值。

      5)語義異構(gòu) 分布式數(shù)據(jù)源間普遍存在語義異構(gòu),而現(xiàn)有DDM模型大多根據(jù)數(shù)據(jù)源間結(jié)構(gòu)上的同構(gòu)或異構(gòu),假設(shè)它們是一張?zhí)摂M表的水平或垂直分割結(jié)果[11],對(duì)數(shù)據(jù)源的挖掘?qū)嶋H是以語義分割的方式獨(dú)立進(jìn)行。當(dāng)數(shù)據(jù)源間的語義距離較大時(shí),將無法形成該虛擬表的構(gòu)建基礎(chǔ),由此推及,語義分割式的獨(dú)立挖掘?qū)p害結(jié)果質(zhì)量[16]。作為一種語義描述模型,本體有效而規(guī)范[17],在數(shù)據(jù)源本體構(gòu)建相關(guān)的本體學(xué)習(xí)領(lǐng)域[18-20]和計(jì)算本體間相似度的本體匹配領(lǐng)域[21-23]積累了很多方法,為有效度量數(shù)據(jù)源間的語義距離奠定了基礎(chǔ)。

      2 DDM系統(tǒng)及分類

      DDM是利用分布式計(jì)算資源挖掘分布式數(shù)據(jù)資源,通過整合局部結(jié)果以獲得全局知識(shí)的方法,主要瓶頸在于分布式數(shù)據(jù)環(huán)境下的挖掘限制和多算法協(xié)作問題,挖掘質(zhì)量主要取決于局部結(jié)果的質(zhì)量和整合方法的質(zhì)量。基于以上共識(shí),國內(nèi)外學(xué)者引入Agent和網(wǎng)格等突破挖掘限制、引入元學(xué)習(xí)優(yōu)化挖掘算法的選擇和組合、引入CDM(collective data mining)框架改善局部結(jié)果質(zhì)量,取得了許多有代表性的成果,下面根據(jù)各自的主要設(shè)計(jì)理念進(jìn)行歸類分析和綜述。

      2.1 基于Multi-Agent的DDM系統(tǒng)

      此類DDM系統(tǒng)的主要設(shè)計(jì)理念是利用Agent的自治性實(shí)現(xiàn)局部挖掘以保護(hù)數(shù)據(jù)私有性;利用Agent的主動(dòng)性減少用戶參與以提高挖掘自動(dòng)化水平;利用Agent的協(xié)作性實(shí)現(xiàn)多算法協(xié)同挖掘等[24]。

      GAYA等給出了一個(gè)利用分布式Agent整合局部挖掘結(jié)果(Theory)的DATS(decentralized agentbased model for theory synthesis)模型[25],該模型由采用進(jìn)化方法整合結(jié)果的 MASETS(multi-agent system for evolutionary theory synthesis)系統(tǒng)實(shí)現(xiàn)。其中,每個(gè)Agent的架構(gòu)如圖2所示,其中,每個(gè)Agent包括4個(gè)模塊:分類模塊(對(duì)于給定的實(shí)例e,將其歸類于c)、通信模塊(通過消息與其他Agent通信)、學(xué)習(xí)模塊(從本地?cái)?shù)據(jù)Di學(xué)習(xí)本地結(jié)果LT)、整合模塊(利用局部結(jié)果生成和修正全局結(jié)果GT)。

      楊博等研究了在分布式動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境中挖掘社區(qū)關(guān)系問題,引入自組織Agent網(wǎng)絡(luò),設(shè)計(jì)了面向自治計(jì)算的AOC(autonomy-oriented computing)方法進(jìn)行分布式和增量式的網(wǎng)絡(luò)社區(qū)關(guān)系挖掘[26],AOC方法利用被動(dòng)Agent在分布式動(dòng)態(tài)進(jìn)化網(wǎng)絡(luò)中協(xié)作式地偵測(cè)和更新社區(qū)結(jié)構(gòu)。如圖3所示,社區(qū)網(wǎng)絡(luò)分布于5個(gè)不同位置的Agent間,每個(gè)Agent對(duì)于全網(wǎng)都有自己的局部視圖(包括在其控制下的點(diǎn)和從這些點(diǎn)連出的線)。分布式網(wǎng)絡(luò)社區(qū)挖掘的任務(wù)可以被描述為這5個(gè)Agent利用各自的視圖相互協(xié)作找出網(wǎng)絡(luò)中的全部社區(qū)。

      以上2個(gè)研究側(cè)重于對(duì)Agent自治性和協(xié)作性的利用;MATEO等提出一個(gè)智能分布式架構(gòu)和基于Agent的DM模型來實(shí)現(xiàn)自適應(yīng)機(jī)制,以便實(shí)施DM算法和多Agent間的高效交互[27]。如圖4所示,DM模型基于Multi-Agent系統(tǒng)實(shí)現(xiàn),包括3項(xiàng)DM功能:聚類、分類和關(guān)聯(lián)規(guī)則挖掘,來實(shí)施知識(shí)發(fā)現(xiàn)和系統(tǒng)需求的采集。

      做法:1.準(zhǔn)備適量的燕麥片,然后用溫水浸泡三個(gè)小時(shí),加入少許蜂蜜,直至糊狀。2.將燕麥糊敷在手部,然后用保鮮膜包好整只手。等待8分鐘以后,取下保鮮膜,開始搓揉按摩手部。

      圖2 Agent結(jié)構(gòu)Fig.2 Agent′s architecture

      圖3 分布式網(wǎng)絡(luò)社區(qū)挖掘問題示意Fig.3 A schematic representation of the d-NCMP

      熊赟等設(shè)計(jì)的挖掘轉(zhuǎn)錄調(diào)節(jié)元素的TREMAgent(transcriptional regulatory element mining agent)系統(tǒng)[28],能對(duì)轉(zhuǎn)錄因子(transcription factor,TF)或轉(zhuǎn)錄因子結(jié)合位點(diǎn)(transcription factor binding site,TFBS)的預(yù)測(cè),提供多種類的檢索和鑒別服務(wù)并及時(shí)更新結(jié)果。如圖5所示,TREMAgent包括4類Agent:1)算法Agent,與其他Agent交互以處理各類任務(wù)(查詢、檢索、挖掘);2)數(shù)據(jù)庫Agent,與外部數(shù)據(jù)源交互,它們也管理數(shù)據(jù)庫的本地拷貝并轉(zhuǎn)換為其他Agent可以訪問的格式;3)接口Agent,為其他3類Agent提供間接通信服務(wù);4)協(xié)調(diào)Agent,在接口Agent和算法Agent間建立通信通道,派發(fā)任務(wù)給不同的Agent,協(xié)調(diào)處理和沖突。此外,協(xié)調(diào)Agent存儲(chǔ)每個(gè)Agent的信息,維護(hù)全系統(tǒng)的控制工作。

      圖4 面向基于Multi-Agent間通信和協(xié)作的智能分布式框架的DM模型Fig.4 Data mining model for the intelligent distributed framework based on the communication and coordination of Multi-Agent

      圖5 TREMAgent系統(tǒng)全景圖Fig.5 Overview of TREMAgent system

      綜上所述,此類基于Multi-Agent的DDM系統(tǒng)中,多Agent間的通信和協(xié)作是影響挖掘效率的重要因素,而現(xiàn)有研究多側(cè)重于協(xié)作機(jī)制的設(shè)計(jì),較少考慮Agent間的通信開銷。

      2.2 基于網(wǎng)格的DDM系統(tǒng)

      基于網(wǎng)格的DDM系統(tǒng)的主要設(shè)計(jì)理念是利用網(wǎng)格在資源共享、開放服務(wù)和協(xié)同工作等方面的優(yōu)勢(shì),提高挖掘的可靠性和協(xié)同性;在網(wǎng)格計(jì)算環(huán)境中進(jìn)行DM,也是通過共享局域和廣域網(wǎng)絡(luò)分享資源(計(jì)算和存儲(chǔ)等)的典型范例。由此可知,利用網(wǎng)格計(jì)算提高挖掘的性能、可擴(kuò)展性、可訪問性和資源利用率是這個(gè)方向的主要發(fā)展動(dòng)力。

      STANKOVSKI等提出的數(shù)據(jù)挖掘網(wǎng)格(data mining grid,DMG)[29],基于面向服務(wù)的體 系 結(jié) 構(gòu) (service-oriented architecture,SOA)[30-31]、標(biāo)準(zhǔn)化和開源原則設(shè)計(jì)。采用了開放式網(wǎng)格服務(wù)體系 (open grid services architecture,OGSA)[32-33]和 Web 服 務(wù) 資 源 框 架 (web services resource framework,WSRF)[34-35]以支持其進(jìn)化。圖6給出了DMG系統(tǒng)的4層體系架構(gòu),通常而言,高層次的組件會(huì)調(diào)用低層次的組件。最底層組件包括了軟件和硬件資源;Globus Toolkit 4層給出了一些系統(tǒng)的核心網(wǎng)格中間件組件;服務(wù)層給出了提供中樞DMG服務(wù)的組件;客戶組件層給出了DMG應(yīng)用客戶端的組件。

      為了應(yīng)對(duì)“信息與數(shù)據(jù)重疊”的挑戰(zhàn),楚一紅等提出了基于網(wǎng)格的子空間聚類算法(nonredundant subspace cluster mining,NORSC)[36],以便在保證必要數(shù)據(jù)覆蓋度的前提下高效發(fā)現(xiàn)間接的子空間距離。NORSC不僅能避免在給定數(shù)據(jù)大都?xì)w屬于高維聚類情況下產(chǎn)生冗余聚類,而且在處理數(shù)據(jù)覆蓋問題時(shí)只有有限的信息丟失。圖7給出了NORSC算法流程圖。

      圖6 DMG系統(tǒng)體系結(jié)構(gòu)Fig.6 DMG system architecture

      圖7 NORSC算法流程圖Fig.7 Flowchart of algorithm NORSC

      羅杰文等系統(tǒng)分析了Agent網(wǎng)格面對(duì)的主要問題,實(shí)現(xiàn)了一個(gè)基于Agent網(wǎng)格的智能平臺(tái)(agent grid intelligent platform,AGrIP)[37],AGrIP平臺(tái)為網(wǎng)格環(huán)境中基于Agent的DDM提供了底層構(gòu)造。同時(shí),從實(shí)現(xiàn)的觀點(diǎn)出發(fā),設(shè)計(jì)了一個(gè)面向AGrIP平臺(tái)的4層模型,如圖8所示。

      1)公共資源層(Common Resources) 包括分布在網(wǎng)格環(huán)境中的各類資源,例如,工作站、PC機(jī)、計(jì)算集群、存儲(chǔ)設(shè)備、數(shù)據(jù)庫、數(shù)據(jù)集等,可以運(yùn)行在Unix,Windows NT或其他操作系統(tǒng)平臺(tái)上。

      2)Agent環(huán)境層(Agent Environment) 這是網(wǎng)格計(jì)算的核心層,負(fù)責(zé)資源定位、分派、驗(yàn)證、統(tǒng)一信息訪問、通信、任務(wù)分配和Agent庫的管理等。

      3)開發(fā)工具包層(Developing Toolkits)開發(fā)環(huán)境,包括Agent的創(chuàng)建、信息檢索、DDM,以便讓用戶更有效地使用網(wǎng)格資源。

      4)應(yīng)用服務(wù)層(Application Service) 包括部分面向特定應(yīng)用的被組織起來的Agent,這些應(yīng)用包括:科研信息化(E-Science)、電子商務(wù)、決策支持和生物信息等。

      作為此類方法的基礎(chǔ),網(wǎng)格技術(shù)在資源管理和任務(wù)調(diào)度方面尚有很大的研究空間,而與之關(guān)聯(lián)的負(fù)載平衡問題則是提高挖掘效率的關(guān)鍵問題[38]。

      圖8 AGrIP的體系結(jié)構(gòu)Fig.8 Architecture of AGrIP

      2.3 基于元學(xué)習(xí)的DDM系統(tǒng)

      其主要設(shè)計(jì)理念是通過元學(xué)習(xí)優(yōu)化挖掘算法的選擇與組合,并對(duì)已獲知識(shí)進(jìn)行多次學(xué)習(xí)以提高結(jié)果質(zhì)量[39]。

      HMIDA等 提 出 了 Weka4GML 框 架[40],它的建立基于 Globus工具包——一種支持WSRF標(biāo)準(zhǔn),并被廣泛采用的網(wǎng)格中間件,服務(wù)于開發(fā)元學(xué)習(xí)方法以處理分布于數(shù)據(jù)網(wǎng)格間的數(shù)據(jù)集。Weka4GML擴(kuò)展了Weka工具包[41-42](一個(gè)串行DM算法集,面向知識(shí)發(fā)現(xiàn),包括標(biāo)準(zhǔn)的數(shù)據(jù)預(yù)處理、挖掘和可視化技術(shù))來支持?jǐn)?shù)據(jù)挖掘算法的分布式執(zhí)行。如圖9所示,Weka4GML包括4種類型的節(jié)點(diǎn):存儲(chǔ)節(jié)點(diǎn)、基分類節(jié)點(diǎn)、元分類節(jié)點(diǎn)和用戶節(jié)點(diǎn)。

      1)存儲(chǔ)節(jié)點(diǎn) 包括分布式數(shù)據(jù)集的一個(gè)或多個(gè)片段,并將所存數(shù)據(jù)及其屬性作為Web服務(wù)發(fā)布,同時(shí)通過FTP服務(wù)器與其他網(wǎng)格節(jié)點(diǎn)分享本地?cái)?shù)據(jù)。

      2)基分類節(jié)點(diǎn) 通過在本地?cái)?shù)據(jù)集上執(zhí)行基分類算法挖掘局部模式。這些模式被用于各類數(shù)據(jù)集以進(jìn)行預(yù)測(cè),并將預(yù)測(cè)結(jié)果發(fā)送給元分類節(jié)點(diǎn)。

      3)元分類節(jié)點(diǎn) 利用FTP服務(wù)器收集元數(shù)據(jù),并在其上執(zhí)行元級(jí)挖掘算法生成最終分類器。

      4)用戶節(jié)點(diǎn) 提供系統(tǒng)的圖形界面允許用戶選擇Weka支持的算法,來對(duì)存儲(chǔ)節(jié)點(diǎn)上的數(shù)據(jù)集進(jìn)行挖掘,執(zhí)行網(wǎng)格上的元學(xué)習(xí)過程。

      圖9 Weka4GML框架上執(zhí)行的元學(xué)習(xí)過程Fig.9 Meta-learning process on Weka4GML framework

      楊立等提出的SOA4KD(service oriented architecture for knowledge discovery)體系,結(jié)合元學(xué)習(xí)和語義網(wǎng)來選擇和執(zhí)行挖掘算法[43]。其結(jié)構(gòu)見圖10,其中數(shù)據(jù)服務(wù)層對(duì)應(yīng)于“知識(shí)發(fā)現(xiàn)過程”定義(見文獻(xiàn)[43])中的F,知識(shí)發(fā)現(xiàn)算法服務(wù)層對(duì)應(yīng)于“知識(shí)發(fā)現(xiàn)過程”定義中的L,KB0(knowledge base,背景知識(shí)庫)以領(lǐng)域本體的形式被放置于語義服務(wù)層中;此外,語義服務(wù)層中還包含了KDS(knowledge discovery service)質(zhì)量本體、擴(kuò)展的知識(shí)發(fā)現(xiàn)任務(wù)本體和回答本體。質(zhì)量本體是一個(gè)可擴(kuò)展的定義,它不僅包含“知識(shí)發(fā)現(xiàn)過程”定義中的確定程度C和感興趣程度I,還包含了KDS作為服務(wù)的一些通用測(cè)度和過程測(cè)度,這就保證了KDS質(zhì)量評(píng)價(jià)的通用性、完整性和可擴(kuò)展性,從而最大限度地滿足不同用戶多樣性的需求?;谧匀徽Z言擴(kuò)展的知識(shí)發(fā)現(xiàn)任務(wù)本體是一個(gè)將知識(shí)發(fā)現(xiàn)任務(wù)和自然語言問題元素連接起來的擴(kuò)展本體,結(jié)合領(lǐng)域本體,實(shí)現(xiàn)以自然語言方式獲取用戶需求,SOA4KD通過元學(xué)習(xí)器動(dòng)態(tài)挑選出滿足用戶需求的最合適的知識(shí)發(fā)現(xiàn)算法服務(wù)并觸發(fā)執(zhí)行,而回答本體的作用是將知識(shí)發(fā)現(xiàn)的結(jié)果轉(zhuǎn)化為自然語言,以方便用戶理解。

      此類方法的主要局限在于,并非所有挖掘算法都能直接實(shí)現(xiàn)元學(xué)習(xí)。

      2.4 基于CDM(collective data mining)框架的 DDM系統(tǒng)

      其主要設(shè)計(jì)理念是將待學(xué)習(xí)的函數(shù)表示為一組基函數(shù)的分布式存在,允許各數(shù)據(jù)源選擇不同的學(xué)習(xí)算法,并以全局結(jié)果正確為前提減少網(wǎng)絡(luò)通信量。

      KARGUPTA等提出了CDM框架,建立了基于異構(gòu)站點(diǎn)的集合式挖掘系統(tǒng)BODHI(besizing knowledge through distributed heterogeneous induction)[44],并將CDM 應(yīng)用于分布式聚集[45]和Bayes網(wǎng)絡(luò)[46]中,在解決無法正確生成構(gòu)造全局結(jié)果所需的局部結(jié)果方面效果明顯。CDM方法的主要步驟如下:

      1)在每個(gè)數(shù)據(jù)源站點(diǎn)生成正交基系數(shù);

      2)從每個(gè)站點(diǎn)選擇合適的數(shù)據(jù)樣本,傳送到一個(gè)專用站點(diǎn),生成與非線性交叉項(xiàng)對(duì)應(yīng)的標(biāo)準(zhǔn)正交基系數(shù);

      3)整合局部模型,將其變形為用戶描述出的正則表示中(符合用戶的輸出要求),輸出該最終模式;

      4)此類方法需要先根據(jù)整體數(shù)據(jù)集合生成正交數(shù)據(jù)模型,成本較高,卻直接關(guān)系到最終結(jié)果的質(zhì)量,而且其表述能力能否滿足需要也未能給出證明。

      圖10 SOA4KD體系結(jié)構(gòu)Fig.10 Architecture of SOA4KD

      圖11給出了BODHI系統(tǒng)的結(jié)構(gòu)圖,共包括4個(gè)基礎(chǔ)組件:1)獨(dú)立Agent,可以完成特定學(xué)習(xí)任務(wù)的自治實(shí)體;2)Agent站,負(fù)責(zé)提供Agent運(yùn)行時(shí)環(huán)境,以及Agent與其他系統(tǒng)內(nèi)站點(diǎn)間的通信;3)協(xié)調(diào)器,是Agent實(shí)例,負(fù)責(zé)各個(gè)Agent站間的協(xié)作通信;4)系統(tǒng)中傳遞的消息。

      圖11 BODHI系統(tǒng)的全景圖Fig.11 Overall systems diagram for the BODHI system

      3 當(dāng)前DDM研究存在的問題

      第2部分中介紹的4類主要DDM方法,大多根據(jù)數(shù)據(jù)源間的結(jié)構(gòu)關(guān)系(同構(gòu)或異構(gòu))設(shè)定數(shù)據(jù)背景,較少考慮數(shù)據(jù)源間的語義關(guān)系及其可能引發(fā)的問題,例如,概念間的內(nèi)在聯(lián)系因分布式環(huán)境而隱匿等,而這將導(dǎo)致局部結(jié)果的冗余性或無效性,或遺失潛在有用結(jié)果,進(jìn)而影響全局結(jié)果的質(zhì)量[16]。當(dāng)前,雖然有涉及此類問題的研究,例如,文獻(xiàn)[16]根據(jù)頻繁項(xiàng)集計(jì)算數(shù)據(jù)源相似度,據(jù)此分組數(shù)據(jù)源并獨(dú)立挖掘各組,提高了挖掘質(zhì)量。然而,頻繁項(xiàng)集的生成開銷正比于數(shù)據(jù)源規(guī)模,限制了該方法的可擴(kuò)展性;并且,準(zhǔn)確度量數(shù)據(jù)源間的語義關(guān)系,需要全面、深入地考察元素和結(jié)構(gòu)距離并進(jìn)行有效綜合。

      綜上可知,現(xiàn)有DDM研究存在的共性問題有:

      1)挖掘質(zhì)量問題 不考慮各個(gè)站點(diǎn)數(shù)據(jù)源間的內(nèi)在語義聯(lián)系,各站點(diǎn)獨(dú)立挖掘本地?cái)?shù)據(jù),與其他站點(diǎn)間無語義層面的數(shù)據(jù)交互和融合,形成純粹的“分割式”挖掘,最終導(dǎo)致全局結(jié)果質(zhì)量受損。為此需要研究如何度量站點(diǎn)數(shù)據(jù)源間的內(nèi)在語義距離,既從宏觀級(jí)(例如:數(shù)據(jù)文件級(jí)、數(shù)據(jù)庫級(jí)、數(shù)據(jù)表級(jí)等),也從微觀級(jí)(例如:元組級(jí)、屬性級(jí)、維度級(jí)等)度量這種語義距離,構(gòu)建數(shù)據(jù)源間語義距離的復(fù)合量化體系,并能根據(jù)數(shù)據(jù)源間的語義距離改變或改善挖掘方式,從而提高局部結(jié)果的挖掘和整合質(zhì)量,遞進(jìn)式解決全局結(jié)果的質(zhì)量問題;

      2)挖掘效率問題 DDM系統(tǒng)也是分布式計(jì)算系統(tǒng),同樣面對(duì)各個(gè)站點(diǎn)處的負(fù)載均衡、通信開銷縮減等問題,所以,DDM系統(tǒng)中的挖掘效率問題可以理解為如何調(diào)度資源以平衡挖掘負(fù)載、減少協(xié)作挖掘中的通信開銷問題。

      4 本體與DM

      作為語義網(wǎng)[47-48]的基礎(chǔ),本體能為對(duì)象語義距離度量提供有效支持。2000年時(shí),本體第1次被引入DM領(lǐng)域[49],主要被應(yīng)用于領(lǐng)域和背景知識(shí)本體、DM過程本體和元數(shù)據(jù)本體[50]:1)領(lǐng)域和背景知識(shí)本體組織領(lǐng)域知識(shí),在知識(shí)發(fā)現(xiàn)過程中的幾個(gè)階段具有重要作用;2)DM過程本體編輯挖掘過程描述,根據(jù)給定問題確定最適合的任務(wù)處理方法,例如,DM算法的確定和實(shí)施等;3)元數(shù)據(jù)本體則描述項(xiàng)目構(gòu)造過程。本體的作用主要有:1)澄清了領(lǐng)域知識(shí)的結(jié)構(gòu),從而為知識(shí)表示打好基礎(chǔ);2)為人和組織之間的通信提供共同的詞匯,使知識(shí)共享成為可能;3)在不同建模方法、范式、語言和軟件工具之間進(jìn)行翻譯和映射,以實(shí)現(xiàn)不同系統(tǒng)之間的互操作和集成[51-52]。

      在利用本體描述挖掘任務(wù)的領(lǐng)域背景方面,MARINICA等針對(duì)關(guān)聯(lián)規(guī)則挖掘中需要從海量規(guī)則中遴選有效規(guī)則的問題,提出了交互式的、用于刪減冗余規(guī)則的挖掘后處理方法ARIPSO(association rule inter-active post-processing using schemas and ontologies)[49],應(yīng)用本體表達(dá)用戶的背景知識(shí),在挖掘后處理時(shí)改善用戶知識(shí)的集成。圖12給出了ARIPSO的框架結(jié)構(gòu),包括2個(gè)部分:首先,利用知識(shí)庫規(guī)范化用戶知識(shí)和目標(biāo),通過領(lǐng)域知識(shí)展現(xiàn)用戶知識(shí)的概貌,通過用戶期望闡明用戶對(duì)被發(fā)現(xiàn)規(guī)則的先驗(yàn)知識(shí);其次,后處理任務(wù)包括迭代應(yīng)用一系列的篩選器(最小化提升約束篩選器、條目關(guān)聯(lián)篩選器和模式篩選/裁剪)對(duì)規(guī)則集進(jìn)行篩選,以提取出有價(jià)值的規(guī)則。

      在利用本體描述DM過程本身方面,?AKOVá等針對(duì)在給定知識(shí)發(fā)現(xiàn)過程的輸入和輸出類型前提下,知識(shí)發(fā)現(xiàn)工作流的自動(dòng)構(gòu)造問題,提出了解決方法[53]。該方法包括2個(gè)步驟:1)通過知識(shí)發(fā)現(xiàn)本體定義知識(shí)類型和DM算法的規(guī)范化概念;2)利用領(lǐng)域和任務(wù)本體實(shí)現(xiàn)工作流組成的規(guī)范化。該方法的核心是由知識(shí)發(fā)現(xiàn)本體所提供的知識(shí)發(fā)現(xiàn)領(lǐng)域中的規(guī)范化概念。如圖13所示,該本體定義了知識(shí)發(fā)現(xiàn)的場(chǎng)景、各種知識(shí)的表示和算法,其基本目標(biāo)是使得工作流計(jì)劃制定者能夠以之為根據(jù),對(duì)于具體的DM任務(wù)選擇出可以產(chǎn)生中間和最終結(jié)果的算法。

      圖12 ARIPSO系統(tǒng)框架Fig.12 ARIPSO Framework description

      圖13 知識(shí)本體的部分上層結(jié)構(gòu)(子類間的關(guān)系由箭頭指示)Fig.13 Part of the top level structure of the knowledge type part of the ontology with subclass relations shown through arrows

      5 結(jié) 語

      對(duì)DDM研究領(lǐng)域的研究現(xiàn)狀進(jìn)行綜述,介紹了基本概念,結(jié)合實(shí)例對(duì)主要系統(tǒng)進(jìn)行分類,歸納出主要問題與挑戰(zhàn)。通過本文的闡述可知,為了提升分布式挖掘過程中局部結(jié)果和最終結(jié)果的質(zhì)量,策略之一就是將DDM理論和本體理論作融合,以數(shù)據(jù)源間語義距離的度量為突破口,建立語義距離度量的復(fù)合量化體系,通過構(gòu)建和求解新型DDM模型來實(shí)現(xiàn)目標(biāo)。具體路線:首先,利用本體描述數(shù)據(jù)源的語義特征;進(jìn)而,基于本體匹配技術(shù)構(gòu)建數(shù)據(jù)源間語義距離的復(fù)合量化體系,根據(jù)度量結(jié)果分組數(shù)據(jù)源,并依次構(gòu)建層次化的挖掘模型、知識(shí)整合模型和負(fù)載平衡機(jī)制;最終,形成具有可操作性和可解釋性的DDM方法,并結(jié)合具體實(shí)例進(jìn)行實(shí)驗(yàn)驗(yàn)證和仿真分析。

      [1] DELAMARE S,F(xiàn)EDAK G,KONDO D,et al.SpeQuloS:A QoS service for BoT applications using best effort distributed computing infrastructures[A].Proceedings of the 21st International Symposium on High-Performance Parallel and Distributed Computing(HPDC’12)[C].New York:ACM,2012.173-186.

      [2] PETER B,LI Y,THAIN D.Weaver:Integrating distributed computing abstractions into scientific workflows using Python [A].Proceedings of the 19th ACM International Symposium on High Performance Distributed Computing(HPDC’10)[C].New York:ACM,2010.636-643.

      [3] CHEN Jinlin,XIAO Keli.BISC:A bitmap itemset support counting approach for efficient frequent itemset mining[J].Transactions on Knowledge Discovery from Data,2010,4(3):1-37.

      [4] GOES P,ILK N,YUE W T,et al.Live-chat agent assignments to heterogeneous e-customers under imperfect classification[J].Transactions on Management Information Systems,2011,2(4):1-15.

      [5] DEODHAR M,GHOSH J.SCOAL:A framework for simultaneous co-clustering and learning from complex data[J].Transactions on Knowledge Discovery from Data,2010,4(3):1-31.

      [6] LIU Bin,CAO Shugui,HE Wu.Distributed data mining for e-business[J].Information Technology and Management,2011,12(2):67-79.

      [7] GIANNELLA C,BHARGAVA R,KARGUPTA H.Multi-agent systems and distributed data mining[A].Cooperative Information AgentsⅧ:8th International Workshop(CIA’04)[C].Berlin:Springer,2004.1-15.

      [8] HAMMOUDA K M,KAMEL M S.Hierarchically distributed peer-to-peer document clustering and cluster summarization[J].IEEE Transactions on Knowledge and Data Engineering,2009,21(5):681-698.

      [9] LIU Kun,KARGUPTA H,RYAN J.Random projection-based multiplicative data perturbation for privacy preserving distributed data mining[J].IEEE Transactions on Knowledge and Data Engineering,2006,18(1):92-106.

      [10] PARK B H,KARGUPTA H.Distributed Data Mining:Algorithms,Systems,and Applications[M].Mahwah:Lawrence Erlbaum Associates,2002.

      [11] DA S J C,GIANNELLA C,BHARGAVA R,et al.Distributed data mining and agents[J].Engineering Applications of Artificial Intelligence,2005,18(7):791-807.

      [12] DAVIES W H E,EDWARDS P.Agent-based knowledge discovery[A].Working Notes of the AAAI Spring Symposium on Information Gathering from Heterogeneous,Distributed Environments[C].Stanford:Stanford University,1995.234-237.

      [13] 莊 艷,陳繼明,徐 丹,等.基于 Multi-agent系統(tǒng)的分布式數(shù)據(jù)挖掘[J].計(jì)算機(jī)科學(xué),2007,34(12):163-167.

      ZHUANG Yan,CHEN Jiming,XU Dan,et al.Distributed data Mining based on Multi-agent system[J].Computer Science,2007,34(12):163-167.

      [14] JASJIT S.Distributed R &D,cross-regional knowledge integration and quality of innovative output[J].Res Policy,2008,37(1):77-96.

      [15] SUMNER M.How alignment strategies influence ERP project success[J].Enterprise Information Systems,2009(4):425-448.

      [16] LI Tao,ZHU Shenghuo,OGIHARA M.A new distributed data mining model based on similarity[A].Proceedings of 2003ACM Symposium on Applied Computing[C].New York:ACM,2003.432-436.

      [17] WASSIM J,NAJLA S,F(xiàn)AIEZ G.Approach and tool to evolve ontology and maintain its coherence[J].International Journal of Metadata,Semantics and Ontologies,2010,5(sup2):151-166.

      [18] ZAVITSANOS E,PALIOURAS G,VOUROS G A.Gold standard evaluation of ontology learning methods through ontology transformation and alignment[J].IEEE Transactions on Knowledge and Data Engineering,2011,23(11):1635-1648.

      [19] WEICHSELBRAUN A,WOHLGENANNT G,SCHARL A.Refining non-taxonomic relation labels with external structured data to support ontology learning[J].Data and Knowledge Engineering,2010,69(8):763-778.

      [20] 劉凱鵬,方濱興.基于社會(huì)性標(biāo)注的本體學(xué)習(xí)方法[J].計(jì)算機(jī)學(xué)報(bào),2010,33(10):1823-1834.

      LIU Kaipeng, FANG Binxing.Ontology induction based on social annotations [J].Chinese Journal of Computers,2010,33(10):1823-1834.

      [21] NICOLA F,CLAUDIA D,F(xiàn)LORIANA E.Composite ontology matching with uncertain mappings recovery[J].ACM SIGAPP Applied Computing Review Archive,2011,11(2):17-29.

      [22] MASCARDI V,LOCORO A,ROSSO P.Automatic ontology matching via upper ontologies:A systematic evaluation[J].IEEE Transactions on Knowledge and Data Engineering,2010,22(5):609-623.

      [23] LI Juanzi,TANG Jie,LI Yi,et al.RiMOM:A dynamic multistrategy ontology alignment framework[J].IEEE Transaction on Knowledge and Data Engineering,2009,21(8):1 218-1 232.

      [24] SANTHANA C,KATIE A,F(xiàn)RANS C.Multi-agent based clustering:Towards generic multi-agent data mining[A].Proceedings of the 10th Industrial Conference on Advances in Data Mining:Applications and Theoretical Aspects(ICDM’10)[C].Berlin:Springer,2010.115-127.

      [25] GAYA M C,GIRáLDEZ J I.Merging local patterns using an evolutionary approach[J].Knowledge and Information Systems,2011,29(1):1-24.

      [26] YANG Bo,LIU Jiming,LIU Dayou.An autonomy-oriented computing approach to community mining in distributed and dynamic networks[J].Autonomous Agents and Multi-Agent Systems,2010,20(2):123-157.

      [27] MATEO R M A,LEE J W.Data mining model based on multi-agent for the intelligent distributed framework[J].International Journal of Intelligent Information and Database Systems,2010,4(4):322-336.

      [28] XIONG Yun,ZHENG Guangyong,YANG Qing,et al.A collaborative multiagent system for mining transcriptional regulatory elements[J].IEEE Intelligent Systems,2009,24(3):26-37.

      [29] STANKOVSKI V,SWAIN M,KRAVTSOV V,et al.Digging deep into the data mine with DataMiningGrid[J].IEEE Internet Computing,2008,12(6):69-76.

      [30] DAN A,JOHNSON R D,CARRATO T.SOA service reuse by design[A].Proceedings of the 2nd International Workshop on Systems Development in SOA Environments(SDSOA’08)[C].New York:ACM,2008.35-40.

      [31] JOSUTTIS N.SOA in Practice[M].California:O'Reilly Media,2007.

      [32] FOSTER I,KESSELMAN C,NICK J,et al.Grid services for distributed system integration[J].Computer,2002,35(6):37-46.

      [33] NATHALIE F,WILLIAM L,ANTHONY M,et al.ICENI:An open grid service architecture implemented with Jini[A].Proceedings of the 2002 ACM/IEEE Conference on Supercomputing(Supercomputing’02)[C].Los Alamitos:IEEE Computer Society Press,2002.1-10.

      [34] ZHANG Donglai,CODDINGTON P,WENDELBORN A.Web services workflow with result data forwarding as resources[J].Future Generation Computer Systems,2011,27(6):694-702.

      [35] MOLTóI,HERNáNDEZ V,ALONSO J M.Automatic replication of WSRF-based Grid services via operation providers[J].Future Generation Computer Systems,2009,25(8):876-883.

      [36] CHU Yihong,CHEN Yiju,YANG Denian,et al.Reducing redundancy in subspace clustering[J].IEEE Transactions on Knowledge and Data Engineering,2009,21(10):1432-1446.

      [37] LUO Jiewen,WANG Maoguang,HU Jun,et al.Distributed data mining on agent grid:Issues,platform and development toolkit[J].Future Generation Computer Systems,2007,23(1):61-68.

      [38] HERRERO P,BOSQUE J L,PéREZ M S.Covering the cooperative load balancing delivery in collaborative grid environments[J].Multiagent and Grid Systems,2009,5(3):267-286.

      [39] PRODROMIDIS A L,CHAN P K,STOLFO S J.Meta-learning in distributed data mining systems:Issues and approaches[A].Advances of Distributed Data Mining[C].California:MIT/AAAI Press,2000.81-114.

      [40] HMIDA M B H,SLIMANI Y.Meta-learning in grid-based data mining systems[J].International Journal of Communication Networks and Distributed Systems,2010,5(3):214-228.

      [41] BOUCKAERT R R,F(xiàn)RANK E,HALL M A,et al.WEKA-experiences with a java open-source project[J].The Journal of Machine Learning Research,2010,11:2533-2541.

      [42] LIEVENS S,BAETS B D.Supervised ranking in the weka environment[J].Information Sciences,2010,180(24):4763-4771.

      [43] 楊 立,左 春,王裕國.面向服務(wù)的知識(shí)發(fā)現(xiàn)體系結(jié)構(gòu)研究與實(shí)現(xiàn)[J].計(jì)算機(jī)學(xué)報(bào),2005,28(4):445-457.

      YANG Li,ZUO Chun,WANG Yuguo.Research and implementation of service oriented architecture for knowledge discovery[J].Chinese Journal of Computers,2005,28(4):445-457.

      [44] KARGUPTA H,PARK B,HERSHBERGER D,et al.Collective data mining:A new perspective toward distributed data mining[J].Advances in Distributed and Parallel Knowledge Discovery,1999,2:131-174.

      [45] KARGUPTA H,HUANG W,SIVAKUMAR K,et al.Distributed clustering using collective principal component analysis[J].Knowledge and Information Systems,2001,3(4):422-448.

      [46] CHEN R,SIVAKUMAR K,KARGUPTA H.Collective mining of bayesian networks from distributed heterogeneous data[J].Knowledge and Information Systems,2004,6(2):164-187.

      [47] TIM B L,HENDLER J,LASSILA O.The semantic web[J].Scientific American,2001,284(5):34-43.

      [48] SHADBOLT N,HALL W,TIM B L.The semantic web revisited[J].IEEE Intelligent Systems,2006,21(3):96-101.

      [49] MARINICA C,GUILLET F.Knowledge-based interactive post mining of association rules using ontologies[J].IEEE Transaction on Knowledge and Data Engineering,2010,22(6):784-797.

      [50] NIGRO H,CISARO S G,XODO D.Data Mining with Ontologies:Implementations,F(xiàn)indings and Frameworks[M].Hershey:Idea Group Inc,2007.

      [51] 王春紅,劉紫玉.基于本體和多代理的考試系統(tǒng)模型研究[J].河北工業(yè)科技,2010,27(3):174-176.

      WANG Chunhong,LIU Ziyu.Research in examination system model based on ontology and multi-agent[J].Hebei Journal of Industrial Science and Techology,2010,27(3):174-176.

      [52] 張 娟,高克峰,張 曦.從文本中學(xué)習(xí)本體的系統(tǒng)設(shè)計(jì)[J].河北工業(yè)科技,2011,28(3):160-163.

      ZHANG Juan,GAO Kefeng,ZHANG Xi.Design of system of learning ontology from texts[J].Hebei Journal of Industrial Science and Technology,2011,28(3):160-163.

      [53] ?AKOVá M,KR RˇEMEN P,?ELEZN YˇF,et al.Automating knowledge discovery workflow composition through ontology-based planning[J].IEEE Transactions on Automation Science and Engineering,2011,8(2):253-264.

      猜你喜歡
      數(shù)據(jù)源本體站點(diǎn)
      Abstracts and Key Words
      對(duì)姜夔自度曲音樂本體的現(xiàn)代解讀
      基于Web站點(diǎn)的SQL注入分析與防范
      電子制作(2019年14期)2019-08-20 05:43:42
      2017~2018年冬季西北地區(qū)某站點(diǎn)流感流行特征分析
      Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
      基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評(píng)價(jià)研究
      首屆歐洲自行車共享站點(diǎn)協(xié)商會(huì)召開
      中國自行車(2017年1期)2017-04-16 02:53:52
      怕被人認(rèn)出
      《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
      基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評(píng)價(jià)算法
      和林格尔县| 郴州市| 邛崃市| 安丘市| 海晏县| 太和县| 嘉黎县| 尼勒克县| 甘孜县| 河源市| 井研县| 鄂托克前旗| 彭阳县| 石城县| 焉耆| 汉川市| 余庆县| 辽中县| 花垣县| 东兴市| 淮南市| 双鸭山市| 永新县| 石楼县| 武夷山市| 建宁县| 黎川县| 天柱县| 龙陵县| 哈密市| 麻城市| 宝坻区| 谢通门县| 金塔县| 三原县| 九江市| 霍山县| 界首市| 兴义市| 成都市| 巍山|