丁祿祺
(青島藍(lán)灣信息科技有限公司,山東青島266111)
現(xiàn)階段,為了使云計(jì)算運(yùn)用得到更好的發(fā)展,計(jì)算機(jī)技術(shù)人員應(yīng)接受專業(yè)的培訓(xùn),保證培訓(xùn)效果達(dá)到國(guó)家計(jì)算機(jī)技術(shù)規(guī)定標(biāo)準(zhǔn)。與傳統(tǒng)的推薦算法對(duì)比,云計(jì)算能夠在大量數(shù)據(jù)運(yùn)算過(guò)程中,解決可實(shí)現(xiàn)擴(kuò)展和數(shù)據(jù)較少的問(wèn)題。因此,本文研究的課題,對(duì)云計(jì)算環(huán)境下資源優(yōu)化具有重要意義,對(duì)云計(jì)算中資源推薦技術(shù)具有現(xiàn)實(shí)性意義。
將云計(jì)算運(yùn)用在項(xiàng)目的過(guò)濾推薦算法過(guò)程中,對(duì)其傳統(tǒng)算法進(jìn)行優(yōu)化,其具體算法流程有以下幾點(diǎn):第一,擴(kuò)展向量。擴(kuò)展向量是根據(jù)云計(jì)算對(duì)項(xiàng)目的具體運(yùn)算形式進(jìn)行向量擴(kuò)展,項(xiàng)目的擴(kuò)展向量特征運(yùn)算程序如下:
式(1)中,eitemj代表的是第 j個(gè)項(xiàng)目擴(kuò)展向量,p(i,j)代表 i個(gè)客戶偏好項(xiàng)目j的數(shù)量值,aitem(j,q)表示項(xiàng)目j具有第q個(gè)屬性值。
第二,臨近搜索,臨近搜索代表著用戶尋找項(xiàng)目的目標(biāo)相近,可進(jìn)行相似度計(jì)算。相似度計(jì)算也運(yùn)用擴(kuò)展向量和相似程度進(jìn)行優(yōu)化,優(yōu)化結(jié)果的相似度量程序如下:
式(2)中與云計(jì)算谷本相似程度如下:
對(duì)于大量的數(shù)據(jù)推薦系統(tǒng),其系統(tǒng)相關(guān)體系是建設(shè)于物理群體以上,能夠根據(jù)相關(guān)的數(shù)據(jù)和推算技術(shù)進(jìn)行使用,有效地為用戶提供相關(guān)材料、節(jié)目推薦和平臺(tái)交流互動(dòng)等。其中的節(jié)目推薦是根據(jù)用戶對(duì)其進(jìn)行綜合評(píng)價(jià),用戶即可獲取熱播節(jié)目和新節(jié)目的節(jié)目榜單。其中云計(jì)算系統(tǒng)中,具有服務(wù)功能,形成的相關(guān)服務(wù)數(shù)據(jù)能夠儲(chǔ)存在系統(tǒng)內(nèi)部文件中,將其附屬在HDFS系統(tǒng)中,運(yùn)用CPU進(jìn)行框架計(jì)算和對(duì)框架進(jìn)行相關(guān)處理,云集三系統(tǒng)體系結(jié)構(gòu)分為物理資源管理層、物理資源處理層、和物理應(yīng)用層,使用戶能夠完成高質(zhì)量和高性能系統(tǒng)功能運(yùn)算。
對(duì)于大量數(shù)據(jù)的推薦系統(tǒng),在用戶使用較多的情況下,可對(duì)用戶按照城市區(qū)域進(jìn)行劃分,對(duì)數(shù)據(jù)進(jìn)行分區(qū)儲(chǔ)存,云計(jì)算系統(tǒng)應(yīng)用中所涉及的各個(gè)目標(biāo),使用戶最終將數(shù)據(jù)儲(chǔ)存對(duì)應(yīng)的地域數(shù)據(jù)檔案庫(kù)中[2]。雖然大部分用戶能夠?qū)?yīng)用程序地域進(jìn)行劃分,但訪問(wèn)應(yīng)用程序操作執(zhí)行力具有了局限性。通對(duì)對(duì)應(yīng)用程序進(jìn)行地域劃分,能夠有效降低數(shù)據(jù)傳送失誤,但網(wǎng)絡(luò)一旦出現(xiàn)故障時(shí),映客仍然可對(duì)其程序進(jìn)行操作。
云計(jì)算系統(tǒng)智能推薦模塊分為預(yù)處理模塊與算法運(yùn)行模塊,其中預(yù)處理模塊功能分為兩類:第一,能夠?qū)ο到y(tǒng)功能進(jìn)行數(shù)據(jù)優(yōu)化,整合相關(guān)數(shù)據(jù)并轉(zhuǎn)化,所形成的數(shù)據(jù)格式儲(chǔ)存在數(shù)據(jù)整成平臺(tái)中,第二種屬于推薦算法,將所需數(shù)據(jù)從應(yīng)用平臺(tái)中進(jìn)行獲取,進(jìn)行二次轉(zhuǎn)化,形成數(shù)據(jù)源,供算法運(yùn)行的過(guò)程計(jì)算使用。算法運(yùn)行模塊時(shí)能夠?qū)⑦\(yùn)行推薦算法中基于Hadoop系統(tǒng),將數(shù)據(jù)經(jīng)過(guò)預(yù)處理得到的數(shù)據(jù)源進(jìn)行相關(guān)輸入,并保存在數(shù)據(jù)庫(kù)中。例如,用戶在應(yīng)用平臺(tái)系統(tǒng)中的對(duì)該平臺(tái)進(jìn)行評(píng)價(jià)與評(píng)分?jǐn)?shù)據(jù),輸出系統(tǒng)中的各項(xiàng)功能數(shù)據(jù),對(duì)用戶目標(biāo)進(jìn)行具體的推薦。
使用MovieLens100K數(shù)據(jù)集,能夠運(yùn)行三種推薦計(jì)算方式,其中包含協(xié)同過(guò)濾、Slopeone、ALS三種推薦技術(shù)。得到進(jìn)行對(duì)比新模型前后之間的準(zhǔn)確率與召回率,如表1所示,新型應(yīng)用推薦技術(shù)的準(zhǔn)確得到了顯著提升,召回率隨之也提高相應(yīng)的程度[3]。因此,擴(kuò)展向量的推薦技術(shù)可解決不同程度上的精準(zhǔn)問(wèn)題,三種推薦算法也能夠適用于新型應(yīng)用的廣泛使用。
表1 100K數(shù)據(jù)集的三種推薦算法前后對(duì)比
在三種推算法中,對(duì)于系統(tǒng)中的冷啟動(dòng)進(jìn)行解決理論,可采取使用MovieLens100K數(shù)據(jù)集對(duì)解決冷啟動(dòng)進(jìn)行實(shí)驗(yàn)驗(yàn)證。如表2所示,從實(shí)驗(yàn)得出的數(shù)據(jù)可看出,新模型使用的三種推薦技術(shù)都可成功解決云計(jì)算中冷啟動(dòng)問(wèn)題,并且三種推薦技術(shù)中的協(xié)同過(guò)濾推薦計(jì)算方法對(duì)解決冷啟動(dòng)應(yīng)用最為突出。因此,三種推薦技術(shù)在云計(jì)算下可解決冷啟動(dòng)問(wèn)題。
表2 三種推薦技術(shù)對(duì)冷啟動(dòng)問(wèn)題解決數(shù)據(jù)準(zhǔn)確率精度對(duì)比
在云計(jì)算下,三種推薦技術(shù)的計(jì)算結(jié)果中,對(duì)其包含的評(píng)價(jià)、運(yùn)算復(fù)雜化度、運(yùn)行速度、冷啟動(dòng)解決情況進(jìn)行綜合總結(jié)評(píng)價(jià),如表3所示。從表3中可得出,依數(shù)字大小進(jìn)行相應(yīng)的評(píng)價(jià),協(xié)同過(guò)濾推薦技術(shù)算法推薦精確度較其他兩種推薦技術(shù)較低,但在商業(yè)應(yīng)用程序中更為流行使用。ALS-WR推薦技術(shù)算法精確度要高于其他兩種運(yùn)算方法,但對(duì)解決冷啟動(dòng)能力較低,影響程序的運(yùn)行效率,算法綜合性能低于其他兩種推薦技術(shù)算法。最后一種SlopeOne推薦技術(shù)算法的精確度、解決冷啟動(dòng)能力以及運(yùn)行速度均為平均水平,運(yùn)算原理較為簡(jiǎn)單。
表3 三種推薦技術(shù)算法分綜合評(píng)價(jià)結(jié)果
本文對(duì)擴(kuò)展向量的模型分析,基于云計(jì)算下大數(shù)據(jù)的推薦技術(shù):云計(jì)算系統(tǒng)體系結(jié)構(gòu)、設(shè)計(jì)云計(jì)算系統(tǒng)平臺(tái)、設(shè)計(jì)云計(jì)算系統(tǒng)智能推薦模塊,對(duì)云計(jì)算環(huán)境下推薦技術(shù)結(jié)果的評(píng)測(cè):云計(jì)算下推薦技術(shù)結(jié)果的比較、總結(jié)云計(jì)算下推薦技術(shù)運(yùn)算效果進(jìn)行了綜合論述與分析,望此次研究結(jié)果能夠得到運(yùn)用大量數(shù)據(jù)計(jì)算的相關(guān)工作人員的關(guān)注,在實(shí)際操作中能夠解決大量數(shù)據(jù)系統(tǒng)面臨的擴(kuò)展性和實(shí)時(shí)性問(wèn)題。