張金澤 天津現(xiàn)代職業(yè)技術(shù)學(xué)院
面向移動(dòng)電商個(gè)性化推薦系統(tǒng)模型的研究
張金澤 天津現(xiàn)代職業(yè)技術(shù)學(xué)院
移動(dòng)電商已成為消費(fèi)形式主流,其個(gè)性化推薦系統(tǒng)的研究尤為重要,文章從建立模型的角度,分析輸入模塊、推薦處理模塊、輸出模塊三部分及系統(tǒng)過(guò)濾、內(nèi)容推薦的應(yīng)用。
移動(dòng)電商;個(gè)性化推薦;協(xié)同過(guò)濾;內(nèi)容推薦
基于移動(dòng)平臺(tái)的電商個(gè)性化推薦系統(tǒng)除了需要滿(mǎn)足傳統(tǒng)的軟件系統(tǒng)諸如系統(tǒng)性、實(shí)用性、安全性、易操作性和可擴(kuò)展性的性能要求之外,還要考慮移動(dòng)電商的特殊性帶來(lái)的影響。移動(dòng)電商對(duì)電商個(gè)性化推薦系統(tǒng)的要求如下:
1.1 用戶(hù)興趣偏好的實(shí)時(shí)性
用戶(hù)的興趣偏好是不斷變化的,體現(xiàn)在系統(tǒng)中就是用戶(hù)評(píng)分?jǐn)?shù)據(jù)隨著用戶(hù)的商品瀏覽、購(gòu)買(mǎi)及評(píng)分等操作而改變。移動(dòng)平臺(tái)賦予了電商的移動(dòng)性特點(diǎn),移動(dòng)中的用戶(hù)更容易受到不同情境的影響,興趣變化程度更為突出。這就要求系統(tǒng)能夠及時(shí)捕獲用戶(hù)興趣的變化,把握用戶(hù)的實(shí)時(shí)興趣偏好,做出準(zhǔn)確有效的推薦。
1.2 系統(tǒng)響應(yīng)的快速性
移動(dòng)電商面向的是使用移動(dòng)終端進(jìn)行網(wǎng)購(gòu)的用戶(hù),用戶(hù)在移動(dòng)終端上對(duì)系統(tǒng)延時(shí)等待的忍耐程度要遠(yuǎn)遠(yuǎn)低于傳統(tǒng)的端,這就要求系統(tǒng)擁有較高的運(yùn)算和傳輸效率,能夠快速響應(yīng)用戶(hù)的要求,在最短的時(shí)間內(nèi)為用戶(hù)提供準(zhǔn)確、可靠的推薦結(jié)果。
1.3 大數(shù)據(jù)處理的適應(yīng)性
移動(dòng)平臺(tái)的便攜性使得用戶(hù)可隨時(shí)隨地瀏覽商品信息。沒(méi)有時(shí)間和地點(diǎn)的限制,用戶(hù)的訪問(wèn)量和數(shù)據(jù)量將會(huì)大幅增加,這要求系統(tǒng)具備良好的大數(shù)據(jù)處理能力,在大數(shù)據(jù)、高并發(fā)情況下也能保證快速響應(yīng)和有效處理。
系統(tǒng)模型由三個(gè)部分組成:輸入模塊,推薦處理模塊以及輸出模塊構(gòu)成。
2.1 輸入模塊
輸入模塊一般是客戶(hù)端或者瀏覽器與用戶(hù)進(jìn)行交互,將用戶(hù)的交互信息收集并存儲(chǔ)起來(lái),或者直接交給推薦處理模塊進(jìn)行處理。不同類(lèi)型的電商推薦系統(tǒng),收集和處理的用戶(hù)信息各不相同,有的收集用戶(hù)的瀏覽頁(yè)面路徑,有的收集用戶(hù)的評(píng)價(jià),這都會(huì)導(dǎo)致推薦結(jié)果的不同。電商推薦系統(tǒng)輸入模塊可以使用如下的信息:顧客注冊(cè)信息、用戶(hù)主動(dòng)評(píng)分信息、用戶(hù)隱式瀏覽信息、用戶(hù)文本評(píng)價(jià)信息、關(guān)鍵字信息、用戶(hù)購(gòu)買(mǎi)信息。
2.2 推薦處理模塊
推薦處理模塊是電商推薦系統(tǒng)模型的主體,具有承前啟后作用,接收輸入模塊的數(shù)據(jù),將推薦結(jié)果交給輸出模塊。推薦處理模塊具體分成兩個(gè)部分:推薦建模和推薦引擎。推薦處理模塊可以使用不同的推薦算法,還可以使用結(jié)合的算法。
協(xié)同過(guò)濾系統(tǒng)是目前應(yīng)用最為廣泛的個(gè)性化推薦系統(tǒng),其中Grundy被認(rèn)為是第一個(gè)投入應(yīng)用的協(xié)同過(guò)濾系推薦工具。 Grundy系統(tǒng)可以建立用戶(hù)興趣模型,利用模型給每個(gè)用戶(hù)推薦相關(guān)的書(shū)籍。 Tapes2try郵件處理系統(tǒng)人工確定用戶(hù)之間的相似度, 隨著用戶(hù)數(shù)量的增加,其工作量將大大增加,而且準(zhǔn)確度也會(huì)大打折扣。 GroupLens建立用戶(hù)信息群,群內(nèi)的用戶(hù)可以發(fā)布自己的信息,依據(jù)社會(huì)信息過(guò)濾系統(tǒng)計(jì)算用戶(hù)之間的相似性,進(jìn)而向群內(nèi)的其他用戶(hù)進(jìn)行協(xié)同推薦。 Ringo利用相同的社會(huì)信息過(guò)濾方法向用戶(hù)進(jìn)行音樂(lè)推薦。其他利用協(xié)同過(guò)濾方法進(jìn)行推薦的系統(tǒng)還有Amazon1com的書(shū)籍推薦系統(tǒng),Jester的笑話推薦系統(tǒng),Phoaks的www信息推薦系統(tǒng)等。
內(nèi)容推薦許多改進(jìn)算法已經(jīng)被廣泛研究并且應(yīng)用到標(biāo)準(zhǔn)的相關(guān)性計(jì)算和夾角余弦公式中。例如缺席投票(defaultvoting),事例引申(caseamplification)和加權(quán)優(yōu)勢(shì)內(nèi)容推薦預(yù)測(cè)等。其中,缺席投票是基于記憶方法的一種擴(kuò)展。如果用戶(hù)明確評(píng)分的產(chǎn)品數(shù)目很少,上面提到的算法得到的用戶(hù)相似度都不準(zhǔn)確。原因在于這種相似性的計(jì)算是基于用戶(hù)x和y共同評(píng)過(guò)分的產(chǎn)品集合。實(shí)證數(shù)據(jù)表明,如果給一內(nèi)容推薦些沒(méi)有打分的產(chǎn)品賦予一些缺省的打分值,那么預(yù)測(cè)分?jǐn)?shù)的準(zhǔn)確性將大幅度提高。Sarwar等提出應(yīng)用相關(guān)性和夾角余弦方法計(jì)算產(chǎn)品之間的相似性。這個(gè)思想被Deshpande和Karypis推廣到基于產(chǎn)品相似性的top2N推薦算法中,即在進(jìn)行推薦的時(shí)候只考慮相似度最高的N個(gè)產(chǎn)品,并非所有的產(chǎn)品。實(shí)驗(yàn)證明這種方法不僅比傳統(tǒng)的基于用戶(hù)鄰居的推薦算法快1—2個(gè)數(shù)量級(jí)。
2.3 輸出模塊
輸出模塊就是把結(jié)果輸出給用戶(hù)。它也是與用戶(hù)的交互過(guò)程,對(duì)應(yīng)于輸入模塊。經(jīng)過(guò)推薦處理模塊的處理后,就需要用戶(hù)能夠看到推薦的結(jié)果電商推薦系統(tǒng)可以使用不同的方式呈現(xiàn)其推薦的結(jié)果,結(jié)果的類(lèi)型也不同,電商推薦系統(tǒng)的輸出結(jié)果可以分為幾種形式:
(1)相關(guān)產(chǎn)品的輸出:推薦的結(jié)果就是商品的集合。典型的列表如 Top-N推薦列表或銷(xiāo)售排行列表。
(2)等級(jí)評(píng)分的輸出:對(duì)應(yīng)于輸入數(shù)據(jù)的主動(dòng)評(píng)分信息,用戶(hù)對(duì)商品打分,系統(tǒng)記錄并統(tǒng)計(jì)這些信息,推薦處理模塊生成用戶(hù)對(duì)該產(chǎn)品的綜合評(píng)分,幫助用戶(hù)判斷該產(chǎn)品的質(zhì)量或者性能。
(3)電子郵件的輸出:其實(shí)和相關(guān)的產(chǎn)品輸出一樣,都是具體的商品集合。但是呈現(xiàn)方式不同。它不是直接呈現(xiàn),而是通過(guò)電子郵件發(fā)給用戶(hù)。這種輸出的方式是站點(diǎn)與用戶(hù)之間的交互,可以定期吸引客戶(hù)到站點(diǎn)訪問(wèn),提高用戶(hù)忠誠(chéng)度,減少用戶(hù)的丟失。
(4)文本評(píng)論的輸出:對(duì)應(yīng)于輸入模塊的文本評(píng)論信息。當(dāng)用戶(hù)瀏覽某個(gè)商品時(shí),可以給出這些評(píng)價(jià)信息。根據(jù)這些評(píng)價(jià)信息可以輔助用戶(hù)了解該產(chǎn)品的性能,決定是否購(gòu)買(mǎi)。
[1]鄧曉懿.移動(dòng)電商個(gè)性化服務(wù)推薦方法研究[D].大連理工大學(xué),2012.
[2]李鵬輝.基于移動(dòng)平臺(tái)的電商個(gè)性化推薦系統(tǒng)研究:(碩士論文).大連海事大學(xué),2014.
張金澤(1982),男,天津人,職務(wù):教師,研究方向:電商運(yùn)營(yíng)/信息技術(shù)。