祝旭
DOI:10.16660/j.cnki.1674-098X.2016.22.094
摘 要:在龐大數(shù)據(jù)信息充斥的網(wǎng)絡(luò)環(huán)境下,對數(shù)據(jù)處理分析及數(shù)據(jù)挖掘服務(wù)都提出了更高的標(biāo)準(zhǔn)及要求。傳統(tǒng)的數(shù)據(jù)挖掘服務(wù)模式已經(jīng)無法滿足當(dāng)前網(wǎng)絡(luò)發(fā)展需求,在此形勢下,云計算背景下的數(shù)據(jù)挖掘服務(wù)被提出。該服務(wù)旨在提升挖掘網(wǎng)絡(luò)數(shù)據(jù)的效率,并使其成為一項具有商業(yè)化性質(zhì)的應(yīng)用服務(wù)。該文針對云計算背景下數(shù)據(jù)挖掘服務(wù)的結(jié)構(gòu)類型、建模流程、服務(wù)體系以及服務(wù)流程,探討了云計算背景下完整的數(shù)據(jù)挖掘服務(wù)模式。
關(guān)鍵詞:云計算 數(shù)據(jù)挖掘 服務(wù)模式 結(jié)構(gòu) 服務(wù)體系
中圖分類號:TP274 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2016)08(a)-0094-02
目前,有關(guān)云計算的研究已經(jīng)成為了全球性的熱點研究項目,國內(nèi)外絕大部分的信息技術(shù)企業(yè)將云計算列為了未來企業(yè)發(fā)展和提升核心競爭力的關(guān)鍵性技術(shù)支持。云計算的實現(xiàn)是以虛擬化技術(shù)與高速寬帶技術(shù)為基礎(chǔ),以各類運(yùn)算法作為支撐,從而形成云計算環(huán)境?,F(xiàn)階段而言,云計算研究尚處于起步階段,在學(xué)術(shù)界對云計算沒有統(tǒng)一的定義,但根據(jù)研究成果,其特點可歸納為:具有計算和存儲大規(guī)模數(shù)據(jù)的能力、具備動態(tài)收縮性的結(jié)構(gòu)和資源、提供的服務(wù)根據(jù)具體資源需求而定。這些特點為云計算背景下的數(shù)據(jù)挖掘服務(wù)模式的商業(yè)化提供了更多的可能性。
1 云計算背景下數(shù)據(jù)挖掘的服務(wù)模式分析
1.1 服務(wù)結(jié)構(gòu)
數(shù)據(jù)挖掘中所包括的行為與功能的集合即為數(shù)據(jù)挖掘服務(wù),服務(wù)內(nèi)容涵蓋選擇數(shù)據(jù)、預(yù)處理數(shù)據(jù)、分析、集成、挖掘數(shù)據(jù)、顯示結(jié)果及評價等,再采用混合搭配的方式,使這些功能形成新的應(yīng)用服務(wù)。云計算背景下,計算機(jī)設(shè)備集成開發(fā)環(huán)境、存儲設(shè)備、應(yīng)用軟件、服務(wù)器集群等實現(xiàn)了網(wǎng)絡(luò)環(huán)境的共享。以此為基礎(chǔ),結(jié)合虛擬化技術(shù)與高速寬帶,封裝打包軟硬件,進(jìn)而形成用戶的服務(wù)請求。用戶的服務(wù)請求又被分為了三個不同層次:IssS(Infrastructure as a Service,基礎(chǔ)設(shè)施即服務(wù))、PaaS(Platform as a Service,平臺即服務(wù))和SssS(Software as a Service,軟件即服務(wù))。三個不同層次的用戶服務(wù)請求共同組成了完整的云計算背景下的數(shù)據(jù)挖掘服務(wù)模式。
在數(shù)據(jù)挖掘服務(wù)整體結(jié)構(gòu)下涵蓋多種服務(wù)類型,如數(shù)據(jù)資源、流程、基礎(chǔ)設(shè)施、測試、應(yīng)用、集成、平臺、安全等?;A(chǔ)設(shè)施服務(wù)以數(shù)據(jù)中心服務(wù)為基礎(chǔ),負(fù)責(zé)在數(shù)據(jù)挖掘中為客戶提供計算資源,并可對其進(jìn)行遠(yuǎn)程訪問。數(shù)據(jù)資源服務(wù)主要為目標(biāo)客戶提供快捷、方便的遠(yuǎn)程數(shù)據(jù)訪問及數(shù)據(jù)下載。流程服務(wù)負(fù)責(zé)業(yè)務(wù)流程的梳理,其運(yùn)行可多個操作系統(tǒng)下完成,并可對關(guān)鍵信息數(shù)據(jù)和模塊進(jìn)行綁定。應(yīng)用服務(wù)可將所有的應(yīng)用程序作為一個整體進(jìn)行打包,終端客戶可以直接通過網(wǎng)絡(luò)平臺獲取。測試服務(wù)是利用遠(yuǎn)程測試工具,測試平臺或是本地數(shù)據(jù)的挖掘狀態(tài),以此判斷應(yīng)用是否處于正常情況。平臺服務(wù)可為數(shù)據(jù)挖掘系統(tǒng)提供開發(fā)服務(wù),用戶利用平臺中的各項功能可自行創(chuàng)建企業(yè)級應(yīng)用。集成服務(wù)可實現(xiàn)異構(gòu)數(shù)據(jù)與異質(zhì)系統(tǒng)的集成,并可將其交予客戶。安全服務(wù)在現(xiàn)有的云計算技術(shù)下,還存在較大的缺陷,但可以優(yōu)化系統(tǒng)的身份管理、加密等安全服務(wù),能夠為系統(tǒng)提供一定程度上的安全防護(hù)。
1.2 建模流程
實現(xiàn)云計算背景下的數(shù)據(jù)挖掘服務(wù)的關(guān)鍵在于結(jié)合上文所述的服務(wù)結(jié)構(gòu),建立服務(wù)組件模型與每一個數(shù)據(jù)挖掘服務(wù)形成一一對應(yīng)的關(guān)系。通過數(shù)據(jù)之間的關(guān)聯(lián)性描述和識別服務(wù),可以構(gòu)建出一個完整的服務(wù)組件。其具體創(chuàng)建流程如下。
1.2.1 定義服務(wù)
通過對問題域中數(shù)據(jù)挖掘服務(wù)相關(guān)信息的收集,實現(xiàn)對該服務(wù)核心功能的定義以及服務(wù)及數(shù)據(jù)支撐所需的產(chǎn)出。通過定義服務(wù),獲取相關(guān)數(shù)據(jù)挖掘業(yè)務(wù)的服務(wù)描述,最終使候選服務(wù)在數(shù)據(jù)挖掘服務(wù)目錄下形成。
1.2.2 綁定服務(wù)和數(shù)據(jù)
數(shù)據(jù)和功能共同構(gòu)成了完整的數(shù)據(jù)挖掘服務(wù),結(jié)合服務(wù)的定義,建立關(guān)聯(lián)數(shù)據(jù)與候選服務(wù)之間的聯(lián)系。在此過程中,可提供服務(wù)行為所需信息,通過調(diào)用規(guī)定服務(wù)信息,獲取關(guān)聯(lián)信息服務(wù)。
1.2.3 構(gòu)建服務(wù)組件
將服務(wù)綁定的數(shù)據(jù)和服務(wù)描述中的方法進(jìn)行整合后,可以讓服務(wù)定義的功能實現(xiàn),并封裝打包服務(wù),使其成為獨(dú)立的組件。對調(diào)用服務(wù)的接口進(jìn)行統(tǒng)一定義,最后得到完整獨(dú)立的服務(wù)組件。
1.3 體系結(jié)構(gòu)
云計算背景下,數(shù)據(jù)挖掘服務(wù)結(jié)構(gòu)的實現(xiàn)還需要構(gòu)建體系結(jié)構(gòu),通常情況下體系結(jié)構(gòu)可被分為以下四個層次。
1.3.1 基礎(chǔ)設(shè)施層
基礎(chǔ)設(shè)施層為數(shù)據(jù)挖掘服務(wù)提供所需的儲存與計算資源。基礎(chǔ)設(shè)施層利用終端接口,將網(wǎng)絡(luò)與各種物理資源相連接,共享和互聯(lián)網(wǎng)絡(luò)資源的同時,提供接口給數(shù)據(jù)挖掘服務(wù)中虛擬化過程。
1.3.2 虛擬化層
虛擬化層將云計算背景下各種分布式資源通過虛擬化工具進(jìn)行匯聚,并將其封裝為透明統(tǒng)一、集中邏輯的服務(wù)資源、通過管理這些資源,實現(xiàn)資源在數(shù)據(jù)挖掘過程中調(diào)度與分配的合理性。封裝的資源,也可被用于平臺層的開發(fā)及應(yīng)用。
1.3.3 平臺層
作為云計算背景下數(shù)據(jù)挖掘服務(wù)的核心服務(wù)層,平臺層提供各種核心功能與服務(wù),實現(xiàn)數(shù)據(jù)挖掘服務(wù)的綜合管理與實施。其中主要包括服務(wù)目錄的管理及組合功能、實施服務(wù)的描述任務(wù)功能、管理數(shù)據(jù)功能、調(diào)度計算資源功能等。
1.3.4 應(yīng)用層
終端層和接口層共同組成了應(yīng)用層。應(yīng)用層的接口層為用戶提供認(rèn)證、管理、處理請求、表達(dá)請求與評價結(jié)果的管理服務(wù)。終端層根據(jù)訪問介質(zhì)的不同,提供相應(yīng)的訪問接入,通過計算機(jī)、用戶界面、專用終端、移動終端等,各種云計算背景下的數(shù)據(jù)挖掘服務(wù)均可被用戶使用與訪問。
1.4 服務(wù)過程
云計算背景下的數(shù)據(jù)挖掘服務(wù)從技術(shù)層面上看是一種軟件產(chǎn)品,從管理層面上看是服務(wù)的過程。根據(jù)軟件的生命周期理論,在開發(fā)云計算分布式技術(shù)過程中,需充分考慮其服務(wù)過程。云計算背景下的數(shù)據(jù)挖掘服務(wù)過程包含以下三個階段。
1.4.1 分析階段
在這一階段下,主要是根據(jù)結(jié)合需求對服務(wù)進(jìn)行識別和發(fā)現(xiàn),對相應(yīng)的服務(wù)描述進(jìn)行定義。該階段標(biāo)志著服務(wù)的開始。
1.4.2 設(shè)計階段
在這一階段,生成服務(wù)相關(guān)說明書,說明書的生成需根據(jù)對服務(wù)的描述及定義,同時對服務(wù)的契約和接口進(jìn)行設(shè)計,設(shè)計內(nèi)容包括服務(wù)的非功能性特性和語義,以及服務(wù)代理、提供商與消費(fèi)者三者之間的契約關(guān)系。
1.4.3 開發(fā)階段
在開發(fā)階段,需要將服務(wù)功能特性進(jìn)行具體實現(xiàn),并在服務(wù)的定義區(qū)間內(nèi),完成功能集合。集合需根據(jù)高內(nèi)聚、低耦合原則,進(jìn)而形成服務(wù)組件。服務(wù)組件必須具備獨(dú)立性,功能的調(diào)用與溝通可利用服務(wù)接口實現(xiàn)。
2 結(jié)語
現(xiàn)階段而言,由于云計算背景下數(shù)據(jù)挖掘服務(wù)模式相關(guān)研究起步時間晚、發(fā)展時間尚短,因而不可避免地存在著一些缺陷和問題。針對這些問題,通過優(yōu)化云計算背景下數(shù)據(jù)挖掘服務(wù)模式的服務(wù)結(jié)構(gòu)、建模流程、體系結(jié)構(gòu)以及服務(wù)過程,能夠進(jìn)一步實現(xiàn)云計算背景下數(shù)據(jù)挖掘服務(wù)。同時,云計算背景下的數(shù)據(jù)挖掘服務(wù)模式需要與時俱進(jìn),順應(yīng)社會經(jīng)濟(jì)和科技的發(fā)展,不斷改進(jìn)和創(chuàng)新。
參考文獻(xiàn)
[1] 曹小春,曾安,潘丹.云計算環(huán)境下面向領(lǐng)域的數(shù)據(jù)挖掘服務(wù)平臺研究[J].自動化儀表,2014(9):9-13.
[2] 吳麗娜.基于云計算環(huán)境下的數(shù)據(jù)挖掘服務(wù)模式[J].電子技術(shù)與軟件工程,2015(15):195.
[3] 潘鈞.云計算服務(wù)模式的數(shù)據(jù)挖掘應(yīng)用平臺的構(gòu)建對策[J].數(shù)字技術(shù)與應(yīng)用,2015(10):90.