賈麗飛
摘? 要:當(dāng)前環(huán)境下,電子商務(wù)迅速發(fā)展,這使得電子商務(wù)的信息結(jié)構(gòu)也越來越加的復(fù)雜多變。本研究將主要立足在云計算背景下電子商務(wù)推薦平臺構(gòu)建的相關(guān)內(nèi)容做出簡要的分析,希望所得結(jié)果能夠引起大家的關(guān)注和重視,也希望本研究能夠為相關(guān)領(lǐng)域提供可行的參考。
關(guān)鍵詞:云計算;電子商務(wù);推薦平臺
引言:在當(dāng)前環(huán)境下,電子商務(wù)迅速發(fā)展,因為信息結(jié)構(gòu)和信息量的日益龐大,很多用戶都會在海量的商品信息之中迷失,而在這種情況下,商家也不能夠在海量的用戶信息當(dāng)中和用戶建立起持續(xù)有效的客戶關(guān)系。本研究將從以云計算為基礎(chǔ)的平臺上來進(jìn)行該方面問題的探索,希望能夠以低成本的來實現(xiàn)高性能的計算,以便于更好地滿足我國電信行業(yè)動態(tài)擴展下的電子商務(wù)需求。
一、我國電信發(fā)展電子商務(wù)推薦所面臨的問題
(一)對高性能計算有更高的需求。我國的電信電子商務(wù)平臺涉及到的技術(shù)系統(tǒng)比較廣泛,主要包括有EDC系統(tǒng)、MSS系統(tǒng)、OSS系統(tǒng)、EDI系統(tǒng),而這些系統(tǒng)彼此之間都不能夠進(jìn)行有效聯(lián)系,它們都是相互獨立的系統(tǒng),因此沒法做到資源共享,所以資源的利用率比較低。在電子商務(wù)背景下,其商品信息和用戶信息都是海量存在的,而且相互之間也都分布在各自獨立的系統(tǒng)當(dāng)中,因此為了更好地協(xié)調(diào)各個系統(tǒng)之間各個商品數(shù)據(jù)和用戶的關(guān)系,就需要構(gòu)建起高性能分布式的數(shù)據(jù)挖掘平臺。
(二)對可伸縮性有更高的需求。一般來說,推薦系統(tǒng)所采用的分析人物具備兩種特性,一種是突發(fā)性,另一種是階段性[1]。如果時間窗口是特定的,那么就需要有很大數(shù)量的計算資源,最好能夠按需求對資源做出分配。關(guān)于電子商務(wù)來說,其可以用來應(yīng)用的場景是非常復(fù)雜的,所以應(yīng)該采用的系統(tǒng)需要根據(jù)業(yè)務(wù)形態(tài)的不同需求來進(jìn)行搭配,這樣就能夠搭配出不同的推薦類型。
(三)對混合型推薦有更高的需求。我國的電信商品資源在目前來說還沒有獲得足夠多的用戶評價,所以說,在現(xiàn)階段存在著數(shù)據(jù)悉數(shù)問題和冷開始問題[2]。基于此,在系統(tǒng)的選擇上不能夠單純地采用協(xié)同過濾的技術(shù),筆者建議在技術(shù)的采用上最好將內(nèi)容過濾技術(shù)納入其中。在對推薦模型進(jìn)行設(shè)置的時候應(yīng)該對用戶位置、訪問日志以及賬單等業(yè)務(wù)信息做出必要的處理,比如數(shù)據(jù)的挖掘等,這樣能夠更好地提高推薦的質(zhì)量。
(四)對復(fù)雜數(shù)據(jù)結(jié)構(gòu)分析的有更高的需求。在當(dāng)前的網(wǎng)絡(luò)環(huán)境下,商品的用戶數(shù)量和商品數(shù)量也在不斷地增長。很多數(shù)據(jù)結(jié)構(gòu)都變得越來越復(fù)雜,特別是號碼百事通和網(wǎng)上營業(yè)廳等的數(shù)據(jù)應(yīng)用越來越多,這是因為產(chǎn)品的更新和變化越來越快。基于這種情況,其產(chǎn)品和產(chǎn)品的更新?lián)Q代也越來越快,這就導(dǎo)致產(chǎn)品與產(chǎn)品之間的直接關(guān)注度也逐漸降低。所以,在這種情況下,我們在建造推薦模型的時候,最好要圍繞著用戶信息的構(gòu)建狀態(tài)擴展來進(jìn)行,最好在這個時候,對動態(tài)擴展為基準(zhǔn)的云計算平臺做出海量數(shù)據(jù)的挖掘。
二、云計算背景下電子商務(wù)推薦平臺的構(gòu)建研究
(一)分布式的文件系統(tǒng)層構(gòu)建。筆者認(rèn)為,為了更好地實現(xiàn)云計算背景下電子商務(wù)推薦平臺的構(gòu)建,可以采用Hadoop
HDFS的分布式數(shù)據(jù)文件的存貯功能,我們可以在多臺計算機集群上將海量的存儲數(shù)據(jù)進(jìn)行分部存貯,再把其文件進(jìn)行分塊存貯,這樣就能夠進(jìn)行分塊復(fù)制,可以有效地實現(xiàn)容錯處理[3]。HDFS通過一個管理節(jié)點和多個數(shù)據(jù)節(jié)點來組成的,其中其中心管理服務(wù)器是管理節(jié)點,主要任務(wù)是對文件系統(tǒng)的名字進(jìn)行管理,可以有效限制用戶空間和用戶客戶端的文件訪問權(quán)限。舉例子來說,可以對系統(tǒng)的關(guān)閉打開以及系統(tǒng)重命名文件以及名錄文件進(jìn)行元數(shù)據(jù)的收集和處理,在這個系統(tǒng)的集群當(dāng)中,每一個數(shù)據(jù)節(jié)點都對應(yīng)配備一個節(jié)點,這個節(jié)點的主要任務(wù)就是對本節(jié)點上的數(shù)據(jù)存儲進(jìn)行管理。除此之外,還可以對客戶的讀寫請求做出處理,以便于更好地創(chuàng)建數(shù)據(jù)模塊,對于一些內(nèi)容也可以做出刪除。從系統(tǒng)內(nèi)部做出分析,一個文件可以劃分成為多個數(shù)據(jù)塊,并將所有的數(shù)據(jù)塊都存儲在同一組數(shù)據(jù)節(jié)點上。
(二)構(gòu)建起分布式計算層。在這里可以采用MapReduce來當(dāng)作分布式系統(tǒng)模塊,可以在此模塊的基礎(chǔ)上運行計算模型。在具體運行過程中,需要將一個大型的任務(wù)進(jìn)行劃分,劃分為很多的細(xì)粒度的子任務(wù),而這些子任務(wù)的分布式是運行在多個節(jié)點上的,這樣更方便進(jìn)行計算和調(diào)度,以便于更好地在云平臺上獲得更多的更加海量的海量數(shù)據(jù)處理能力。在本系統(tǒng)運行當(dāng)中,MAP和REDUCE的操作被執(zhí)行為包裹任務(wù)。其主要的目的就是在每一個Hadoop集群節(jié)點上將任務(wù)執(zhí)行的軟件做出安排,而這個軟件我們將其稱之為TaskTracker,需要將這個軟件安置在每一個計算節(jié)點之上。而它的任務(wù)就是對該集群范圍之內(nèi)的調(diào)度作業(yè)和任務(wù)的執(zhí)行軟件進(jìn)行部署,我們將其稱之為
JobTrackre,但是之前我們必須在Hadoop當(dāng)中選擇出相對獨立的機器進(jìn)行部署。
結(jié)語:本研究當(dāng)中,筆者主要針對云計算背景下電子商務(wù)推薦平臺構(gòu)建方面的相關(guān)內(nèi)容做出簡要分闡述,文中筆者也簡單地談了自己的看法。筆者認(rèn)為要想更好地構(gòu)建起云計算背景下的電子商務(wù)推薦平臺,我們還需要對云計算的中間件進(jìn)行整合和處理,以此擴展其相關(guān)的功能,最終促進(jìn)我國電子商務(wù)事業(yè)的發(fā)展。
參考文獻(xiàn):
[1] 多雪松,張晶,高強.基于Hadoop的海量數(shù)據(jù)管理系統(tǒng)[J].微計算機信息.2010,15(13):658-659.
[2] 張敏,陳云海,林立宇.電信運營商云計算數(shù)據(jù)中心的構(gòu)建分析[J].電信技術(shù),2012,32(06):25-26.