梁冰芳
摘要
在互聯(lián)網(wǎng)不斷發(fā)展與推動下,出現(xiàn)了一個新的概念名詞——云計算,在云計算的大環(huán)境下應用的數(shù)據(jù)數(shù)量不斷增長,幾乎已經(jīng)達到一個頂峰,所以此時就必須提出更具有創(chuàng)新性的東西,特別是極具個性化的內(nèi)容,但是受限于云計算龐大的數(shù)據(jù)計算量和它獨有的處理框架結(jié)構(gòu),不能將傳統(tǒng)的技術直接運用到云計算當中,必須進行一系列的改革與創(chuàng)新才能發(fā)揮云計算最好的效果。為了更好的解決上面的問題,在云計算的大環(huán)境下提出基于協(xié)同過濾的個性化推薦機制是十分必要的,這一機制首先會制定分散式評分管理策略,然后會使用候選鄰居的概念對結(jié)果影響比較大的項目進行分析與研究,并推出協(xié)同過濾的個性化推薦機制,幫助用戶更好地解決問題。
【關鍵詞】云計算環(huán)境 協(xié)同過濾 個性化推薦機制
聯(lián)網(wǎng)的快速發(fā)展與壯大為用戶的生活和工作提供了充足的快捷和便利,但是在帶來方便的同時也帶來了諸如信息超載的問題,信息的急速超載導致用戶的工作效率大大降低,很多工作不能及時完成,所以適時的推出基于協(xié)同過濾的個性化推薦機制是非常合理與科學的,它是一種重要的信息過濾方法,它主要通過對用戶的興趣愛好和歷史搜索行為等一系列的行為進行分析,然后根據(jù)用戶的需求推薦科學合理的項目,這可以在很大程度上解決目前信息超載的問題。而且協(xié)同過濾推薦是一項非常成功的個性化推薦機制,可以說是到目前最成功的一個個性化推薦機制之一吧。下面就詳細的對協(xié)同過濾個性化推薦機制進行詳細的分析和研究。
1 相關工作
其實除了本文要講到的協(xié)同過濾的個性化推薦機制,還有許多分布式推薦機制,它們大多數(shù)都遵循著一個基本思想,就是:首先它們互相之間在網(wǎng)絡上進行評分向量的運送,然后就是對每一個具體用戶進行分布式運算,最后代表鄰居關系的覆蓋網(wǎng)絡就可以在網(wǎng)絡上建設完成了。但是這些算法基本上都存在著這樣一個問題就是:這種算法一般都會產(chǎn)生巨大的費用,而且網(wǎng)絡數(shù)據(jù)的更新也比較緩慢和滯后,而且整個算法的完成需要花費大量的時間。為了解決上面所提到的問題,Miller、Kim、Ormadi、Berkvosky等人紛紛提出了自己的解決方案和措施,有的提出泛洪策略的推薦法,有的則提出了用面向鄰居運送評分向量的方式來代替前面所提到的泛洪策略的推薦法,甚至有的人設計出面向社交網(wǎng)絡的分布式推薦機制的想法。雖然他們提出的想法都在某些方面存在著優(yōu)勢和可取之處,但是它們的缺點也是比較明顯的,所以最終沒有得到長久的發(fā)展[2]。
2 云計算環(huán)境的協(xié)同過濾推薦機制
關于模型的描述,按照功能和具體結(jié)構(gòu),我們可以將云計算環(huán)境下的協(xié)同過濾推薦模型分為四個部分,分別是:基礎設施層、數(shù)據(jù)預處理層、推薦服務層、用戶接入層。首先基礎設施層數(shù)據(jù)核心,是由以SN架構(gòu)為基礎的數(shù)據(jù)中心構(gòu)成,負責計算本地的評分數(shù)據(jù);數(shù)據(jù)預處理層是負責管理數(shù)據(jù)的部門,主要對用戶的數(shù)據(jù)進行管理與收集,還附帶查詢功能;推薦服務層是負責接受用戶的數(shù)據(jù)的,然后對這些數(shù)據(jù)進行響應與分析;最后用戶接入層是提供推薦機制的泛在接入。
3 分布式評分管理
3.1 評分過濾
說到傳統(tǒng)的評分過濾,在此處我們主要講述一下傳統(tǒng)的推薦算法的使用,傳統(tǒng)的使用通常是對用戶使用協(xié)同過濾的推薦思想,然后對用戶的相似度進行計算,然后獲得用戶的k鄰值。最后通過對k鄰值的一系列計算與分析得出k近鄰加權產(chǎn)生的推薦結(jié)果。還有就是,當推薦算法在計算項目的相似度時,如果兩個不同的項目的存儲位置分別在不同的位置時,那么推薦算法就需要在數(shù)據(jù)傳輸過程中將一邊的數(shù)據(jù)傳輸?shù)搅硗庖贿?。而且單次推薦過程需要很多記錄,大約是n(n-1)m/2次。
3.2 兩階段評分索引
在進行評分索引時,由于項目的候選鄰居可能會存在以下情況即:候選鄰居的分布式可能會存儲在多個不同的位置,因此如何快速找到它們的存儲位置成為了十分重要的一點,也是在進行評分索引時必須要注意和重視的一點,如果不能足夠重視這一點的話就會對用戶造成很多的不便和問題,從而加劇信息超載的問題。
3.3 評分存儲
在進行評分存儲時,要注意具體的存儲規(guī)則,這樣有幫助用戶找到最適合他們的推薦機制,并最快速的找到它們的位置,這樣就可以節(jié)省大量的時間,這樣用戶就可以利用這些時間做一些對于他們而言更加有意義的事情。
3.4 評分查詢
評分查詢是用戶在進行數(shù)據(jù)索引步驟后十分重要的一步,可以很有效的找到k鄰值,然后找到自己的評分值。
3.5 參數(shù)分析
本節(jié)通過調(diào)節(jié)R八《的候選鄰居數(shù)量、興趣度模型更新間隔以及模型規(guī)模等參數(shù)優(yōu)化RAC的MAE和NIF。實驗中訓練集的項目數(shù)量分別設置為500,2500和5000,并從測試集中分別選擇500個用戶作為目標用戶,然后通過對這些目標用戶的分析得住一個合理科學的理論,并通過這一理論指導實踐,更好的解決信息超載的問題,幫助用戶更好地生活和工作。
4 基于候選鄰居的協(xié)同過濾推薦算法
在進行候選鄰居的協(xié)同過濾推薦算法時,一般的項目是具有相似性的,而且它們之間的相似性是一般不會發(fā)生變化的,本文就是對協(xié)同過濾算法進行研究與創(chuàng)新,推出一種全新的思想,構(gòu)建一個好的思路,然后通過這種思路來推出更加優(yōu)化的算法,幫助用戶有效解決信息超載這一問題,然后提出具體的個性化推薦方案,幫助櫻花解決這一問題。
5 結(jié)語
隨著云計算的不斷發(fā)展與創(chuàng)新,信息超載的情況越來越嚴重,已經(jīng)嚴重的影響到人們?nèi)粘5膶W習與工作,為了解決這一問題,必須提出更好地個性化推薦機制,這樣才能有效的提高人們的工作效率,減輕工作負擔,達到最好的效果。而本文就是對在云計算的大環(huán)境下基于協(xié)同過濾的個性化推薦機制進行研究與分析,來解決傳統(tǒng)的個性化推薦所不能解決的問題,在大幅度上解決當下信息超載的問題,幫助人們推薦最適合自己的應用,充分提高人們的工作效率,將人們從繁雜的工作中解放出來,促進人們的健康可持續(xù)發(fā)展。
參考文獻
[1]Tunkelang D.Recommendations as a con-versation with the user[C].Proc ofthe 5th ACM Conf on Recommender Sys-tems.New York:ACM.2016(09):11-12.
[2]Breese 7,Heckerman D,Kadie C.Bmpiri-cal analysis of predictive algorithmsfor collaborative filtering [C]//Procof the 14th Conf on Uncertainty inArtificial Intelligence.San Francis-cc:Morgan Kaufmann,2016(11):43-52.