蔣文娟 蘇佳 陸娜 李富蕓
摘要:個(gè)性化推薦系統(tǒng)可以幫助電子商務(wù)網(wǎng)站為用戶提供快速有效的商品搜索服務(wù),滿足用戶的需求,提高用戶的購物效率。服裝是電子商務(wù)平臺的重要類目,但是由于用戶對服裝的偏好因素多,且用戶對服裝商品同時(shí)有趨同性和求異性,對服裝個(gè)性化推薦的研究有很有必要。基于協(xié)同過濾算法,對用戶收藏夾的信息進(jìn)行了分析,計(jì)算出相似度最高的用戶,并將該用戶的收藏夾信息中目標(biāo)用戶還未關(guān)注到的信息推薦給目標(biāo)用戶,實(shí)現(xiàn)了一個(gè)簡單電子商務(wù)網(wǎng)站的個(gè)性化推薦系統(tǒng)。
關(guān)鍵詞:協(xié)同過濾;個(gè)性化推薦;推薦算法;相似度;電子商務(wù)
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)35-0194-03
1 概述
隨著互聯(lián)網(wǎng)的高速發(fā)展和物流產(chǎn)業(yè)的日益成熟,電子商務(wù)已經(jīng)成為互聯(lián)網(wǎng)的重要應(yīng)用之一,我國電子商務(wù)行業(yè)的市場規(guī)模也發(fā)生了翻天覆地的變化。電子商務(wù)對二十一世紀(jì)人類的生活起到的作用和帶來的改變是不可預(yù)估的,網(wǎng)絡(luò)已是人們重要的購物途徑。據(jù)國家統(tǒng)計(jì)局?jǐn)?shù)據(jù)顯示,2018年全國電子商務(wù)交易額達(dá)31.63萬億元,同比增長8.5%。其中,商品、服務(wù)類電子商務(wù)交易額30.61萬億元,增長14.5%。2018年全國網(wǎng)上零售額達(dá)9.01萬億元,如圖1所示,其中實(shí)物商品網(wǎng)上零售額為7.02萬億元。從品類來看,服裝鞋帽針紡織品、日用品、家用電器及音響器材占前三,分別占實(shí)物商品網(wǎng)絡(luò)零售額的25.2%、14.4%和10.6%。[1]
服裝作為日常消費(fèi)品,消費(fèi)者的需求比較大,消費(fèi)者頻次高,密度大。2018年“雙十一”全天成交額達(dá)到2315億元,其中服裝服飾占比達(dá)到了20.3%。隨著商品種類和數(shù)量的呈現(xiàn)指數(shù)級的增長,對于消費(fèi)者來說,從眾多商品中搜索到心儀的商品并非易事。服裝是一種個(gè)性化需求特點(diǎn)比較強(qiáng)的商品,普通的搜索引擎并不適用于消費(fèi)者快速有效地選擇到自己心儀的服裝,個(gè)性化推薦系統(tǒng)可以幫助解決以上的問題。
2 個(gè)性化推薦系統(tǒng)
個(gè)性化推薦系統(tǒng)是通過分析消費(fèi)者的歷史消費(fèi)數(shù)據(jù)以及商品信息,預(yù)測消費(fèi)者的喜好,然后在電子商務(wù)網(wǎng)站上為消費(fèi)者展示其可能感興趣的商品。個(gè)性化推薦系統(tǒng)可以幫助銷售服裝的商家及網(wǎng)站迅速而有效地為消費(fèi)者推薦感興趣的服裝,滿足消費(fèi)者的需求,提高消費(fèi)者的購物效率,提升消費(fèi)者的購物體驗(yàn)。個(gè)性化推薦系統(tǒng)在B2C(Business-to-Customer)電子商務(wù)領(lǐng)域的應(yīng)用,有著良好的發(fā)展與應(yīng)用前景。當(dāng)前,幾乎所有大型B2C電商系統(tǒng),如亞馬遜、京東、當(dāng)當(dāng)?shù)龋荚诓煌潭壬嫌型扑]系統(tǒng)的應(yīng)用。國內(nèi)的京東網(wǎng)站在瀏覽商品時(shí)會彈出“猜你喜歡”“為你推薦”等關(guān)鍵詞;當(dāng)當(dāng)網(wǎng)站上為用戶進(jìn)行私人定制的“專屬商城”,“當(dāng)當(dāng)為您推薦”等推薦功能;網(wǎng)易云的音樂個(gè)性化調(diào)頻推薦,微博、知乎和百度貼吧論壇的內(nèi)容推薦都是典型的個(gè)性化推薦技術(shù)的應(yīng)用。
服裝個(gè)性化推薦系統(tǒng)在原理上與其他商品的推薦系統(tǒng)類似,但因?yàn)榉b本身不易建立用戶模型,服裝推薦通同時(shí)具有趨同心理和求異心理等原因,服裝推薦系統(tǒng)本身有其特殊性。
2.1研究現(xiàn)狀
1987年Malonedeng等研究者最早提出了推薦系統(tǒng)(Recom-mender System)的概念,它是通過評分來進(jìn)行推薦的,且只在電子商務(wù)領(lǐng)域有運(yùn)用。直到20世紀(jì)90年代,Resnick和Varian等[2]研究者在推薦系統(tǒng)的基礎(chǔ)上提出個(gè)性化推薦系統(tǒng)的新概念。1998年亞馬遜(Amazon.com)上線了基于物品的協(xié)同過濾算法,將推薦系統(tǒng)推向服務(wù)千萬級用戶和處理百萬級商品的規(guī)模,并能產(chǎn)生質(zhì)量良好的推薦。2005年Adomavicius等人將推薦系統(tǒng)分為3個(gè)主要類別,并提出了未來可能的主要研究方向。2007年第一屆ACM推薦系統(tǒng)大會在美國舉行。2016年,YouTube發(fā)表論文[3],將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用推薦系統(tǒng)中,實(shí)現(xiàn)了從大規(guī)??蛇x的推薦內(nèi)容中找到最有可能的推薦結(jié)果。
與國外相比,國內(nèi)的個(gè)性化推薦技術(shù)和互聯(lián)網(wǎng)發(fā)展比較晚,但經(jīng)過學(xué)習(xí)國外的技術(shù)并結(jié)合自己的研發(fā)后,發(fā)展非常迅速,已經(jīng)取得了一定的成功。
2.2組成和分類
個(gè)性化推薦系統(tǒng)主要由三部分組成:一是收集數(shù)據(jù)并分析以獲取用戶偏好;二是選擇推薦算法;三是實(shí)現(xiàn)推薦。其中推薦算法是整個(gè)系統(tǒng)的關(guān)鍵。
目前,系統(tǒng)推薦算法主要分為三類[4]:
2.2.1協(xié)同過濾推薦
協(xié)同過濾算法是最早應(yīng)用到推薦系統(tǒng)中的,也是目前最常用的推薦算法之一。協(xié)同過濾推薦首先基于用戶一評分矩陣來分析目標(biāo)用戶的興趣愛好,然后檢索與目標(biāo)用戶有類似興趣愛好的用戶群體,根據(jù)類似用戶群體的商品評價(jià)信息,將評分高的商品推薦給目標(biāo)用戶。協(xié)同過濾推薦對多媒體內(nèi)容能夠達(dá)到較好的推薦效果,也可以發(fā)現(xiàn)用戶新的偏好信息;但是協(xié)同過濾推薦對于新的產(chǎn)品和多興趣用戶存在評價(jià)系數(shù)和冷啟動等問題。
2.2.2基于內(nèi)容的推薦
基于內(nèi)容的推薦是協(xié)同過濾推薦的延續(xù)與發(fā)展。該算法首先通過用戶的評價(jià)、分享、收藏夾等歷史行為信息來建立用戶偏好模型,還要通過分析和提取推薦商品中的內(nèi)容信息建立推薦商品模型;再計(jì)算推薦商品模型和用戶偏好模型的相似度,最后將相似度最大的商品推薦給用戶。基于內(nèi)容的推薦簡單且高效,可以很好地解決冷啟動問題;但是該算法只能推薦用戶已有興趣類似的商品,另外對于如音頻視頻等多媒體內(nèi)容的特征不好提取因此也難以達(dá)到滿意的推薦效果。
2.2.3混合推薦
每種算法都有其優(yōu)點(diǎn)和缺點(diǎn)?;旌贤扑]是綜合利用幾種推薦算法的優(yōu)點(diǎn),可以產(chǎn)生由于獨(dú)立推薦算法的推薦效果。采用最多的混合方法是基于內(nèi)容和協(xié)同過濾的推薦。
3 基于協(xié)同過濾的服裝個(gè)性化推薦
3.1協(xié)同過濾算法
協(xié)同過濾算法不需要預(yù)先獲得用戶或物品的特征數(shù)據(jù),僅依賴于用戶的歷史行為數(shù)據(jù)對用戶進(jìn)行建模,從而為用戶進(jìn)行推薦。協(xié)同過濾以健壯性與優(yōu)異的速度,在互聯(lián)網(wǎng)領(lǐng)域得到了廣泛應(yīng)用。協(xié)同過濾推薦算法正迅速成為信息過濾與信息系統(tǒng)中的流行技術(shù)。與傳統(tǒng)的推薦方法不同,協(xié)同過濾是用來分析用戶興趣的方法。通過綜合這些用戶對某一信息的評估,從而形成了一個(gè)系統(tǒng)來預(yù)測用戶對該信息的偏好程度。[5]
協(xié)同過濾算法分為以用戶為基礎(chǔ)(User-based)的協(xié)同過濾和以商品為基礎(chǔ)(Item-based)的協(xié)同過濾兩種算法[6],通過比較,本設(shè)計(jì)采用基于用戶的協(xié)同過濾。
3.2基于用戶的協(xié)同過濾算法
基于用戶協(xié)同過濾的推薦算法包括三個(gè)步驟,如圖2所示:
3.2.1收集數(shù)據(jù)
此數(shù)據(jù)指的是用戶的歷史行為數(shù)據(jù),如用戶的關(guān)注、購買歷史、收藏行為,或給某個(gè)商品的評分等,這些都可以作為數(shù)據(jù)供推薦算法使用。本文是將用戶的收藏行為作為數(shù)據(jù)來收集的。
3.2.2找到相似用戶
計(jì)算用戶間的相似度的方法有如下幾種:
本文用公式(2)余弦相似度來計(jì)算用戶間的相似度[7],其中N(u)為用戶u喜歡的物品集合,N(v)為用戶v喜歡的物品集合。可以根據(jù)用戶的收藏夾的內(nèi)容來獲得N(u)和N(v)。
3.2.3進(jìn)行推薦
本文使用用戶的收藏夾來計(jì)算用戶相似度。如下圖3所示,對于用戶A只能計(jì)算得到一個(gè)相似用戶C,然后將用戶C收藏的服裝D推薦給用戶A??捎脠D4說明基于用戶的協(xié)同過濾推薦原理。
圖5給出的是系統(tǒng)具體實(shí)現(xiàn)中對用戶vape1和其他用戶的相似度的計(jì)算結(jié)果。根據(jù)此結(jié)果,可看出用戶vape1和vape2、vape3的相似度較高,因此會給用戶vape1推薦用戶vape2和用戶vape3的收藏夾中的物品。
4 總結(jié)
本文通過運(yùn)用協(xié)同過濾算法對服裝個(gè)性化推薦系統(tǒng)進(jìn)行了研究,僅通過采集用戶的收藏夾內(nèi)容,根據(jù)收藏夾內(nèi)容進(jìn)行用戶相似度的比較,尋找相似用戶,為用戶在購買服裝前提供個(gè)性推薦,從而提高用戶網(wǎng)購服裝的效率以及更好的購物體驗(yàn)。本系統(tǒng)僅以收藏夾內(nèi)容作為基礎(chǔ)數(shù)據(jù),考慮并不全面,在后續(xù)的系統(tǒng)完善中,可以考慮將消費(fèi)者購物數(shù)據(jù)以及其他相關(guān)信息納入系統(tǒng)基礎(chǔ)數(shù)據(jù),從而使推薦更為精準(zhǔn)、有效。
參考文獻(xiàn):
[1]商務(wù)部電子商務(wù)和信息化司.中國電子商務(wù)報(bào)告2018[R].北京:中國商務(wù)出版社,2018.
[2]Resnick P,Iacovou N,Suchak M,et al.GroupLens: an open ar-chitecture for collaborativefiltering of netnews[C]. USA: Pro-ceedings of the 1994 ACM Conference on Computer Support-ed Cooperative Work,1994:175-186.
[3]Cremonesi P,Tripodi A,Turrin R.Cross-DomainRecommend-er Systems.[C] IEEE, International Conference on Data Mining-Workshops, 2012:496-503.
[4]劉建國,周濤,汪秉宏.個(gè)性化推薦系統(tǒng)的研究進(jìn)展[J].自然科學(xué)進(jìn)展,2009,19(1):1-15.
[5]鄧愛林,朱揚(yáng)勇,施伯樂.基于項(xiàng)目評分預(yù)測的協(xié)同過濾推薦算法[J].軟件學(xué)報(bào),2003(9):1621-1628.
[6]趙亮,胡乃靜,張守志.個(gè)性化推薦算法設(shè)計(jì)[J].計(jì)算機(jī)研究與發(fā)展,2002(8):986-991.
[7]單毓馥,李丙洋.電子商務(wù)推薦系統(tǒng)中服裝推薦問題研究[J].毛紡科技,2016,44(5):66-69.
[8]王寧,何震.改進(jìn)協(xié)同過濾算法在服裝個(gè)性化推薦的研究[J].湖南工程學(xué)院學(xué)報(bào),2019,29(1):34-36.
[9]胡覺亮,王正方.基于用戶偏好的個(gè)性化服裝推薦模式研究[J].浙江理工大學(xué)學(xué)報(bào),2018,40(2):136-143.
【通聯(lián)編輯:代影】
收稿日期:2019-11-12
基金項(xiàng)目:海南省自然科學(xué)基金項(xiàng)目(617119);國家自然科學(xué)基金項(xiàng)目(61562023);海南省自然科學(xué)基金(617124);海南省高等學(xué)??茖W(xué)研究項(xiàng)目(Hnky2017-17)
作者簡介:蔣文娟(1975-),女,甘肅人,副教授,碩士,主要研究方向?yàn)橛?jì)算機(jī)應(yīng)用、圖像處理;蘇佳,學(xué)士;陸娜,副教授,碩士;李富蕓,副教授,碩士。