• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于灰關(guān)聯(lián)分析和時(shí)空偏好特征的興趣點(diǎn)推薦算法

      2022-05-23 09:59:20陳江美張文德
      關(guān)鍵詞:密度估計(jì)關(guān)聯(lián)個(gè)性化

      陳江美, 張文德

      (1. 福州大學(xué)經(jīng)濟(jì)與管理學(xué)院, 福建 福州 350108; 2. 福州大學(xué)信息管理研究所, 福建 福州 350108)

      0 引 言

      隨著移動(dòng)社交網(wǎng)絡(luò)的普及與應(yīng)用,多樣化的位置簽到及共享功能不斷涌現(xiàn),獲取用戶的地理信息更為容易,助推了基于位置的社交網(wǎng)絡(luò)(location-based social network,LBSN)的興起。例如,目前較為流行的Gowalla、Yelp、Foursquare等移動(dòng)平臺(tái)不僅具備社交功能,還為用戶提供了諸多與位置有關(guān)的服務(wù)。LBSN中主要包含了用戶與位置屬性、社交關(guān)系及簽到時(shí)間等信息,用戶可通過(guò)“簽到”的方式分享其可能喜歡的地點(diǎn),從而衍生出多樣化的位置服務(wù)功能。其中,興趣點(diǎn)(point-of-interest,POI)推薦作為一項(xiàng)重要的服務(wù)內(nèi)容,近年來(lái)受到了學(xué)者的廣泛關(guān)注。POI是指用戶簽到的地點(diǎn),如景點(diǎn)、電影院等,興趣點(diǎn)推薦能夠有效緩解位置過(guò)載問(wèn)題,從而提升用戶在LBSN中的個(gè)性化體驗(yàn),并有助于商家挖掘潛在客戶,成為了當(dāng)前研究的熱點(diǎn)問(wèn)題。

      目前,國(guó)內(nèi)外學(xué)者對(duì) POI推薦工作已開(kāi)展大量的研究,并設(shè)計(jì)不同的推薦策略來(lái)改善推薦性能,但仍存在一些局限。首先,用戶的偏好存在漂移性,即用戶的興趣可能隨時(shí)間在動(dòng)態(tài)變化,雖然少數(shù)研究將時(shí)間納入POI推薦工作,但性能有待提高。LBSN中的用戶簽到矩陣十分稀疏,而當(dāng)前納入時(shí)間的研究主要是利用時(shí)間間隙來(lái)劃分矩陣,加劇了評(píng)分矩陣的數(shù)據(jù)稀疏性。因此,如何合理地挖掘用戶的時(shí)間偏好是重點(diǎn)。其次,用戶的移動(dòng)行為符合個(gè)性化特征,但多數(shù)的研究認(rèn)為用戶的地理行為偏向于統(tǒng)一的分布,未充分考慮用戶個(gè)性化特征,如何更好地實(shí)現(xiàn)地理行為的個(gè)性化值得研究。最后,LBSN存在海量的異構(gòu)數(shù)據(jù),這些異構(gòu)數(shù)據(jù)對(duì)推薦結(jié)果有著不同程度的影響,如何有效地融合多類型異構(gòu)數(shù)據(jù)增加了推薦的難度。

      在傳統(tǒng)POI推薦工作的基礎(chǔ)上,本文針對(duì)上述問(wèn)題,提出了一種基于灰關(guān)聯(lián)分析和時(shí)空偏好(grey relational analysis and temporal-spatial information, GRA-TS)的POI推薦算法。本文的貢獻(xiàn)主要有以下3點(diǎn):

      (1) 考慮用戶偏好動(dòng)態(tài)變化和數(shù)據(jù)稀疏性問(wèn)題,提出將時(shí)間融入矩陣分解算法中,以刻畫(huà)用戶對(duì)POI的時(shí)間偏好。同時(shí),將灰色系統(tǒng)理論沿用于此,利用灰關(guān)聯(lián)分析方法度量各時(shí)間段的相似度,從而減弱數(shù)據(jù)稀疏的影響,有效改善推薦性能。

      (2) 考慮用戶的簽到分布符合個(gè)性化特征,采用自適應(yīng)核密度估計(jì)方法來(lái)模擬用戶的空間偏好,從而捕捉用戶的空間偏好。

      (3) 綜合考慮用戶的時(shí)間偏好和空間偏好特征,通過(guò)模擬用戶的時(shí)空偏好行為,獲得用戶的綜合偏好分?jǐn)?shù)。同時(shí),將本文提出的算法進(jìn)行數(shù)據(jù)實(shí)驗(yàn),結(jié)果表明了該算法相較于其他基準(zhǔn)算法具有更優(yōu)的推薦性能。

      1 研究綜述

      基于位置的社交網(wǎng)絡(luò)中蘊(yùn)含著豐富的信息,目前POI推薦的相關(guān)研究主要通過(guò)融合上下文信息(如地理信息、時(shí)間信息),采用協(xié)同過(guò)濾算法、矩陣分解算法、深度學(xué)習(xí)、譜聚類等方法模擬用戶的決策行為。在已有的研究中,考慮用戶對(duì)地理距離較敏感的特性,Ye等人采用冪律分布建模用戶的地理行為偏好,將地理信息融入基于用戶的協(xié)同過(guò)濾算法中。但交互矩陣十分稀疏,協(xié)同過(guò)濾方法難以發(fā)揮作用。考慮矩陣分解算法能緩解稀疏問(wèn)題,文獻(xiàn)[6-7]將地理信息納入加權(quán)矩陣分解算法的框架中以挖掘用戶的偏好。Zhang等人則考慮用戶潛在的地理和社交信息,通過(guò)矩陣分解算法聯(lián)合求解用戶的綜合偏好。為了進(jìn)一步挖掘用戶的地理行為偏好,文獻(xiàn)[9-11]將地理因素結(jié)合多種情景信息來(lái)模擬用戶的簽到行為,進(jìn)而提高推薦質(zhì)量。

      近年來(lái),一些學(xué)者在試圖改善推薦性能時(shí),將用戶簽到的時(shí)間作為重要的情景信息融入推薦工作中。為了模擬用戶的時(shí)間偏好,學(xué)者們從多個(gè)角度進(jìn)行建模。Yin等人利用協(xié)同過(guò)濾技術(shù)為目標(biāo)用戶在給定時(shí)間推薦地點(diǎn)。但協(xié)同過(guò)濾技術(shù)易受稀疏影響,推薦效果不佳。Gao等人將時(shí)間所具有的非統(tǒng)一性和連續(xù)性嵌入矩陣分解算法中。但由于考慮要素單一,無(wú)法全面挖掘用戶的偏好。Rahmani等人考慮用戶的周期性行為,將時(shí)空信息納入矩陣分解框架中。文獻(xiàn)[15]融合空間、社交和時(shí)間信息的影響,探究各要素在POI推薦工作中的作用。上述算法雖考慮了時(shí)間影響,但主要利用時(shí)間劃分簽到矩陣,造成原本就稀疏的矩陣更加稀疏,導(dǎo)致動(dòng)態(tài)推薦效果不佳。

      綜上可知,目前大量的基于時(shí)空的研究成果仍存在局限性。傳統(tǒng)動(dòng)態(tài)推薦的工作鮮少考慮時(shí)間特征的影響,造成對(duì)用戶的時(shí)間偏好挖掘不充分,同時(shí)忽略了時(shí)間戳細(xì)化用戶簽到矩陣后帶來(lái)的稀疏性影響。另外,上述的工作主要將用戶的地理行為建模為統(tǒng)一的距離分布,忽略了用戶的個(gè)性化行為。為此,本文提出了一種新的基于時(shí)空偏好的POI算法,以提高用戶的動(dòng)態(tài)個(gè)性化推薦效果。

      2 灰關(guān)聯(lián)分析方法

      灰色系統(tǒng)理論是一種能處理貧信息問(wèn)題的方法。灰關(guān)聯(lián)分析是灰色系統(tǒng)理論中一種重要的研究方法,通過(guò)判斷序列曲線幾何形狀的相近程度以衡量序列間的相似性,對(duì)樣本數(shù)據(jù)量及數(shù)據(jù)的分布規(guī)律無(wú)特殊要求,可有效處理復(fù)雜貧信息系統(tǒng)的數(shù)據(jù)。因此,本文將灰關(guān)聯(lián)分析理論運(yùn)用到推薦系統(tǒng)領(lǐng)域中,用來(lái)度量數(shù)據(jù)稀疏條件下的相似度。

      2.1 灰關(guān)聯(lián)度

      灰關(guān)聯(lián)系數(shù):設(shè)={()|∈}為參考序列,={()|∈}為對(duì)應(yīng)的比較序列,={1,2,…,},={1, 2,…,},稱

      ((),())=

      (1)

      為參考序列和比較序列在處的灰關(guān)聯(lián)系數(shù)。其中,為分辨系數(shù),一般取05。

      灰關(guān)聯(lián)度:設(shè)存在((),())為非負(fù)數(shù),為度量參考序列和比較序列的相似度,稱

      (2)

      為第個(gè)比較序列的灰關(guān)聯(lián)度。

      2.2 灰關(guān)聯(lián)熵與熵關(guān)聯(lián)度

      灰關(guān)聯(lián)密度:由定義1可知,((),())為參考序列和比較序列在處的灰關(guān)聯(lián)系數(shù),稱

      (3)

      為第個(gè)比較序列在處的灰關(guān)聯(lián)密度。

      (4)

      為第個(gè)比較序列的灰關(guān)聯(lián)熵。

      熵關(guān)聯(lián)度:設(shè)表示第個(gè)比較序列的灰關(guān)聯(lián)系數(shù),稱

      (5)

      為第個(gè)比較序列的熵關(guān)聯(lián)度。其中,=ln,表示最大熵。

      2.3 均衡接近度

      傳統(tǒng)的灰關(guān)聯(lián)分析方法存在局部異常點(diǎn)的傾向及信息損失的局限,為了克服此缺陷,在灰關(guān)聯(lián)分析方法中引入灰關(guān)聯(lián)熵,利用均衡接近度作為衡量向量之間相似度的標(biāo)準(zhǔn)。

      均衡接近度:由灰關(guān)聯(lián)度和熵關(guān)聯(lián)度組合乘積,得

      (,)=(,)·()

      (6)

      式中:(,)表示參考序列和比較序列的均衡接近度。

      均衡接近度方法由傳統(tǒng)的灰關(guān)聯(lián)分析方法發(fā)展而來(lái),灰色系統(tǒng)理論中灰關(guān)聯(lián)度的概念可用于描述向量間的相似性。近年來(lái),相關(guān)學(xué)者將灰關(guān)聯(lián)分析方法拓展到推薦領(lǐng)域。文獻(xiàn)[25]指出傳統(tǒng)的相似性度量方法面臨數(shù)據(jù)稀疏性和相關(guān)性兩大挑戰(zhàn),結(jié)合灰關(guān)聯(lián)分析方法提出一種新的協(xié)同過(guò)濾預(yù)測(cè)模型。文獻(xiàn)[26-27]利用灰關(guān)聯(lián)分析挖掘數(shù)據(jù)的關(guān)聯(lián)性,進(jìn)而探索用戶間的關(guān)系。文獻(xiàn)[28]將灰色系統(tǒng)理論應(yīng)用到社交推薦中,通過(guò)優(yōu)化預(yù)測(cè)模型,以緩解數(shù)據(jù)稀疏性和差異性。本文沿用這一思路,將灰色系統(tǒng)理論引入POI推薦領(lǐng)域,并將均衡接近度的概念用到時(shí)間相似度之上,以改進(jìn)傳統(tǒng)的余弦相似度方法存在局部異常點(diǎn)的不足,進(jìn)而提高相似度計(jì)算的準(zhǔn)確性,改善數(shù)據(jù)稀疏問(wèn)題。

      3 GRA-TS推薦算法

      3.1 算法框架及思想

      本文從時(shí)間和空間的角度出發(fā),設(shè)計(jì)出統(tǒng)一的POI推薦算法框架,如圖1所示。本算法主要思想是將用戶簽到的時(shí)間特征細(xì)化,分解帶有時(shí)間戳的用戶評(píng)分矩陣,利用處理小樣本的灰關(guān)聯(lián)分析方法度量時(shí)間相似度,進(jìn)而降低稀疏性的影響。同時(shí),運(yùn)用自適應(yīng)核密度估計(jì)方法個(gè)性化地建模用戶的空間偏好。最終,提出了一種GRA-TS算法,在第32~第34節(jié)將給出詳細(xì)的模型描述。

      圖1 GRA-TS算法的框架結(jié)構(gòu)圖

      3.2 引入時(shí)間特征的矩陣分解算法

      與協(xié)同過(guò)濾算法建模時(shí)間偏好相比,矩陣分解算法具有更好的可擴(kuò)展性與緩解稀疏性的能力。鑒于用戶的簽到行為受時(shí)間影響,本節(jié)將時(shí)間的個(gè)性化和連續(xù)性特征融入矩陣分解算法框架中,結(jié)合灰關(guān)聯(lián)分析方法,以描述用戶對(duì)POI的時(shí)間偏好。

      321 時(shí)間個(gè)性化特征建模

      (7)

      (8)

      322 時(shí)間連續(xù)性特征建模

      (9)

      式中:(,-1)表示時(shí)間段和-1的相似度;()表示用戶在時(shí)間間隔內(nèi)的簽到偏好。為了簡(jiǎn)化損失函數(shù),當(dāng)=1時(shí),令=-1,則-1=,將其轉(zhuǎn)化為矩陣形式如下:

      (10)

      式中:表示個(gè)用戶間的對(duì)角時(shí)間系數(shù)矩陣,表達(dá)式如下:

      (11)

      323 灰關(guān)聯(lián)分析度量相似度

      灰關(guān)聯(lián)分析方法可用于衡量向量間的關(guān)聯(lián)程度,借助灰色理論中“接近度”的思想,利用均衡接近度方法計(jì)算用戶簽到POI各時(shí)間段間的相似度。因此,利用式(6)均衡接近度方法對(duì)式(9)中的時(shí)間相似度進(jìn)行求解如下:

      (,-1)=(,-1)

      (12)

      324 統(tǒng)一的時(shí)間偏好特征

      本節(jié)綜合考慮上述時(shí)間個(gè)性化和連續(xù)性特征,并建立統(tǒng)一的時(shí)間偏好函數(shù)。由于式(8)和式(10)中的同為用戶特征偏好矩陣,若單獨(dú)對(duì)兩個(gè)優(yōu)化函數(shù)求解很難滿足統(tǒng)一性要求。鑒于此,本節(jié)將兩個(gè)矩陣分解的優(yōu)化函數(shù)聯(lián)合求解如下:

      (13)

      式中:為調(diào)整時(shí)間正則化的參數(shù)。

      本文利用變更最小二乘法(alternative least square, ALS)對(duì)目標(biāo)函數(shù)進(jìn)行優(yōu)化,當(dāng)求解一個(gè)隱特征向量時(shí),固定其他變量。其中矩陣為待求解參數(shù),訓(xùn)練過(guò)程中其更新公式如下:

      (14)

      (15)

      通過(guò)優(yōu)化式(14)和式(15),可求解參數(shù)矩陣,并將其代入式(7)計(jì)算得到預(yù)測(cè)矩陣中的各元素值, 將其定義為用戶的時(shí)間偏好特征預(yù)測(cè)值。

      3.3 引入空間信息的個(gè)性化推薦算法

      用戶的空間偏好通常指用戶的決策受地理位置信息的影響程度,考慮地理位置對(duì)用戶的簽到行為具有重要作用,本文利用自適應(yīng)核密度估計(jì)方法來(lái)建模用戶的空間偏好,以實(shí)現(xiàn)個(gè)性化推薦。設(shè)={,,…,}表示用戶已簽到POI集合,其中,(,)表示POI的經(jīng)緯度坐標(biāo)。同時(shí),考慮用戶的空間偏好特征,利用核密度估計(jì)方法捕捉用戶的地理偏好,并將高斯分布作為核函數(shù),獲得用戶對(duì)未簽到POI的預(yù)測(cè)函數(shù)為

      (16)

      (17)

      (18)

      式中:表示用戶簽到POI的總次數(shù);表示用戶對(duì)POI的訪問(wèn)次數(shù);(-)表示包含兩個(gè)全局固定帶寬(,)的核函數(shù)。(,)的公式如下:

      (19)

      (20)

      為實(shí)現(xiàn)個(gè)性化推薦,本文并非直接利用式(16)的()值來(lái)描述用戶的空間偏好,而是用來(lái)決策每個(gè)被簽到POI的自適應(yīng)帶寬:

      =(())-

      (21)

      式中:表示敏感參數(shù),值越大意味著對(duì)()越敏感;表示幾何平均數(shù),的表達(dá)式如下:

      (22)

      最終,根據(jù)式(19)和式(20)的固定帶寬值(,)和式(21)的自適應(yīng)帶寬值,預(yù)測(cè)用戶在未簽到POI上的自適應(yīng)核估計(jì)的推薦概率分布如下:

      (23)

      (24)

      3.4 融合時(shí)空特征的算法優(yōu)化

      (25)

      因此,將式(25)與式(23)中度量用戶的空間偏好的算法相結(jié)合,建立最終的統(tǒng)一優(yōu)化算法GRA-TS,獲得用戶未簽到POI的最終預(yù)測(cè)偏好如下:

      (26)

      4 數(shù)據(jù)實(shí)驗(yàn)與分析

      4.1 數(shù)據(jù)集介紹

      本文實(shí)驗(yàn)的數(shù)據(jù)集來(lái)自Foursquare網(wǎng)站,該網(wǎng)站是一個(gè)基于用戶地理位置的社交網(wǎng)站,采用其發(fā)布的真實(shí)公開(kāi)的Foursquare數(shù)據(jù)集來(lái)評(píng)估所提算法的性能,其包含的具體內(nèi)容如表1所示。

      表1 數(shù)據(jù)集統(tǒng)計(jì)

      為了評(píng)估算法的精度,先進(jìn)行數(shù)據(jù)預(yù)處理,過(guò)濾掉一些發(fā)生次數(shù)較少的異常數(shù)據(jù),分別刪除訪問(wèn)頻率少于10個(gè)POI的用戶和被訪問(wèn)頻率少于10個(gè)用戶的POI。

      4.2 度量指標(biāo)

      為了驗(yàn)證本文算法的有效性,將實(shí)驗(yàn)中用戶簽到數(shù)據(jù)按8∶2的比例隨機(jī)分成訓(xùn)練集和測(cè)試集。根據(jù)top-的推薦排序,為每個(gè)用戶推薦得分最高的前個(gè)POI,并對(duì)生成的POI推薦列表進(jìn)行評(píng)估。本文主要是對(duì)算法的基本性能作對(duì)比,重點(diǎn)是找出通過(guò)訓(xùn)練算法生成的POI列表總數(shù)中有多少是目標(biāo)用戶在測(cè)試集中實(shí)際簽到的POI。準(zhǔn)確率precision@與召回率recall@是top-推薦中的兩個(gè)基本指標(biāo)。為此,在對(duì)比實(shí)驗(yàn)部分采用這兩個(gè)基本指標(biāo)進(jìn)行算法的評(píng)估,公式如下:

      (27)

      (28)

      式中:()表示訓(xùn)練集通過(guò)本文算法訓(xùn)練生成的POI推薦列表;()表示測(cè)試集中用戶對(duì)POI的簽到列表。

      4.3 實(shí)驗(yàn)對(duì)比與算法評(píng)估

      為了評(píng)估算法的性能,選取了5種基準(zhǔn)算法與本文提出的GRA-TS算法進(jìn)行比較。

      (1) LRT算法:基于時(shí)間效應(yīng)的POI推薦算法,考慮時(shí)間非統(tǒng)一性和連續(xù)性兩大特征,將其分別納入矩陣分解算法,綜合求解獲得用戶的最終偏好。

      (2) SCGT算法:融合社交、分類、地理與時(shí)間信息的POI推薦算法利用固定帶寬的核密度估計(jì)捕捉用戶的地理偏好,并結(jié)合社交信息提出統(tǒng)一的推薦模型。

      (3) iGSLR:融合地理與社交影響的位置推薦算法,采用固定帶寬的核密度估計(jì)方法模擬用戶的地理行為,利用協(xié)同過(guò)濾建模用戶的社會(huì)影響力,通過(guò)融合獲得最終的用戶偏好。

      (4) PRUG:基于用戶興趣和地理因素的POI推薦算法,利用自適應(yīng)核密度估計(jì)與樸素貝葉斯算法捕捉用戶的空間偏好,結(jié)合用戶的偏好生成統(tǒng)一的模型。

      (5) STACP:基于時(shí)空偏好的POI推薦算法,考慮用戶簽到行為的周期性,利用矩陣分解框架建模時(shí)空信息的影響,求解獲得用戶的潛在偏好。

      其中,LRT與STACP是兩種基于時(shí)間因素的算法,可有效地研究動(dòng)態(tài)推薦的效果。而SCGT、iGSLR、PRUG及STACP分別采用了不同的地理建模方式來(lái)挖掘用戶的偏好,有利于充分探究個(gè)性化推薦問(wèn)題。同時(shí),這些算法結(jié)合了一種或多種情景信息,有助于研究時(shí)空信息對(duì)推薦工作的影響,進(jìn)而驗(yàn)證本文算法的有效性。因此,將上述5種算法作為本文的對(duì)比方法。

      在實(shí)驗(yàn)的參數(shù)設(shè)置部分,依據(jù)文獻(xiàn)[13]中的最優(yōu)參數(shù)的選取,將本文算法中的正則化參數(shù)分別設(shè)置為2,2,1,經(jīng)過(guò)實(shí)驗(yàn)測(cè)試適用于本文的算法,并應(yīng)用于以下實(shí)驗(yàn)。對(duì)敏感參數(shù),通常將值取為0.5,經(jīng)驗(yàn)證此時(shí)用戶的地理偏好得分最佳。

      4.3.1 相似度優(yōu)化對(duì)推薦性能影響

      為了探究灰關(guān)聯(lián)分析方法度量時(shí)間相似度對(duì)推薦結(jié)果的影響,本節(jié)將基于GRA的時(shí)間影響模型(GRA-temporal, GRAT)算法與基準(zhǔn)算法LRT進(jìn)行對(duì)比。其中,GRAT是本文算法的一部分,主要利用矩陣分解算法描述時(shí)間的個(gè)性化和連續(xù)性特征,與LRT相比,GRAT算法采用均衡接近度方法刻畫(huà)時(shí)間段間的相關(guān)性,而非運(yùn)用傳統(tǒng)的余弦相似度度量方法。

      本實(shí)驗(yàn)選取為5、8、10、12、15和20,分別對(duì)比兩種算法在Foursquare數(shù)據(jù)集上的推薦精度和召回率的變化情況,并將實(shí)驗(yàn)中的參數(shù)設(shè)為最優(yōu)值。從圖2(a)和圖2(b)看出,GRA算法的推薦準(zhǔn)確率和召回率相較于LRT有顯著的提高,表明了均衡接近度方法在度量時(shí)間相似度方面較余弦相似度方法具有更突出的效果,說(shuō)明了本文相似度優(yōu)化的有效性?;谊P(guān)聯(lián)分析方法能改善推薦性能的原因歸結(jié)兩點(diǎn):① 傳統(tǒng)的相似度方法易遭受局部異常點(diǎn)影響,造成數(shù)據(jù)損失而影響推薦質(zhì)量,而均衡接近度方法可以減弱局部異常點(diǎn)的影響;② 均衡接近度方法能處理貧信息問(wèn)題,本算法利用時(shí)間劃分矩陣造成了嚴(yán)重的稀疏問(wèn)題,將灰關(guān)聯(lián)分析方法沿用于此,并采用矩陣分解算法能有效改善數(shù)據(jù)稀疏性。因此,實(shí)驗(yàn)結(jié)果表明了利用均衡接近度來(lái)計(jì)算相似度能改善推薦性能。

      圖2 相似度優(yōu)化前后的推薦準(zhǔn)確率和召回率

      4.3.2 地理因素影響

      為了研究基于冪律分布的地理因素在預(yù)測(cè)用戶偏好上的影響,同時(shí)探究采用自適應(yīng)核密度估計(jì)方法捕捉用戶地理偏好的有效性,將本文提出的GRA-TS算法與GRAT算法、基于灰關(guān)聯(lián)分析與冪律分布(grey relational analysis-power law distribution, GRAP)的算法進(jìn)行對(duì)比。其中,GRAT算法是本文算法的一部分,與GRA-TS算法相比,此算法未考慮地理因素的影響。GRAP則利用冪律分布來(lái)模擬地理行為影響。實(shí)驗(yàn)比較為5、8、10、12、15和20時(shí),3種算法在數(shù)據(jù)集上的準(zhǔn)確率和召回率變化情況,如圖3所示。

      圖3 融合不同地理信息的算法性能對(duì)比

      由圖3看出,未考慮地理因素的GRAT算法的推薦準(zhǔn)確率和召回率低于其他兩種算法,說(shuō)明地理信息在本文的推薦工作中具有重要意義,是影響推薦策略的主要因素之一。GRAP算法與本文所提的算法相比,顯然看出GRA-TS算法的推薦性能更優(yōu)。GRAP利用冪律分布捕捉用戶的地理偏好,性能優(yōu)于GRAT算法,但其將用戶的移動(dòng)行為視作統(tǒng)一的分布,忽視了用戶個(gè)性化行為的影響。GRA-TS算法利用自適應(yīng)核密度估計(jì)方法描述用戶個(gè)性化的簽到行為,表現(xiàn)出最好的推薦性能,說(shuō)明了本文對(duì)地理建模的合理性。

      4.3.3 算法的性能對(duì)比與分析

      在Foursquare數(shù)據(jù)集的基礎(chǔ)上,將本文算法的參數(shù)設(shè)定為=2、=2和=1時(shí)推薦性能最佳,并根據(jù)其他5種文獻(xiàn)設(shè)置的參數(shù)值,使各算法的推薦效果最優(yōu)。實(shí)驗(yàn)將6種算法進(jìn)行比較,對(duì)比結(jié)果如圖4所示,其描述了各算法在POI推薦列表長(zhǎng)度為5、8、10、12、15和20時(shí)的推薦性能。從圖4看出,本文提出的GRA-TS算法的性能最優(yōu)。同時(shí),值的增加有易于用戶挖掘更多的POI,因此各算法的推薦準(zhǔn)確率在逐漸降低與召回率在逐漸升高。由圖4(a)和圖4(b)可見(jiàn),GRA-TS算法的推薦準(zhǔn)確率和召回率在相同條件下均優(yōu)于其他5種算法,特別相較于LRT的性能有顯著提升??紤]LRT只納入時(shí)間信息,且算法遭受?chē)?yán)重的數(shù)據(jù)稀疏問(wèn)題,因此推薦的性能最低。SCGT與iGSLR采用固定帶寬的核密度估計(jì)函數(shù)建模地理影響,并融合社會(huì)影響力,初步考慮了不同用戶的地理行為偏好,但兩種算法易受到數(shù)據(jù)稀疏影響。STPACP將用戶的時(shí)空偏好嵌入矩陣分解框架,與SCGT與iGSLR相比,矩陣分解分解算法能緩解稀疏問(wèn)題,但未充分挖掘用戶簽到的時(shí)間特征,性能有待提高。PRUG融合了核密度估計(jì)和樸素貝葉斯算法描述用戶的地理偏好,結(jié)合了用戶偏好影響,性能優(yōu)于上述4種算法,但未考慮用戶的動(dòng)態(tài)偏好,結(jié)果次優(yōu)。與上述5種算法對(duì)比,本文提出的GRA-TS算法考慮了時(shí)間的個(gè)性化和連續(xù)性特征,進(jìn)而描述用戶的時(shí)間偏好,并運(yùn)用灰關(guān)聯(lián)分析度量時(shí)間相關(guān)性,緩解了數(shù)據(jù)稀疏的影響,提高了動(dòng)態(tài)推薦效果。同時(shí),利用自適應(yīng)核密度估計(jì)方法捕捉用戶的移動(dòng)行為偏好,有效地實(shí)現(xiàn)個(gè)性化推薦,增強(qiáng)了推薦的時(shí)空特征關(guān)聯(lián)。綜上,GRA-TS算法的推薦性能最佳,表現(xiàn)出最好的推薦性能。

      圖4 6種算法在Foursquare上的推薦性能

      5 結(jié) 論

      為了提高動(dòng)態(tài)推薦與個(gè)性化推薦的效果,本文提出了一種基于GRA-TS的POI推薦算法。該算法將用戶簽到的時(shí)間特征細(xì)化,把灰關(guān)聯(lián)分析與矩陣分解算法相結(jié)合,利用灰關(guān)聯(lián)分析計(jì)算時(shí)間相似度,減少了數(shù)據(jù)稀疏的影響,有效地提高了動(dòng)態(tài)推薦的效果,為應(yīng)對(duì)推薦系統(tǒng)的稀疏性問(wèn)題提供了新的方法。還采用了自適應(yīng)核密度估計(jì)建模用戶的地理行為,增強(qiáng)了個(gè)性化體驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文提出的算法在推薦準(zhǔn)確率和召回率方面均優(yōu)于其他基準(zhǔn)的推薦算法。在未來(lái)的工作中,將進(jìn)一步挖掘更多的情景信息來(lái)提高推薦性能。同時(shí),將異地問(wèn)題作為突破重點(diǎn),進(jìn)一步深入完善模型。

      猜你喜歡
      密度估計(jì)關(guān)聯(lián)個(gè)性化
      m-NOD樣本最近鄰密度估計(jì)的相合性
      面向魚(yú)眼圖像的人群密度估計(jì)
      基于MATLAB 的核密度估計(jì)研究
      科技視界(2021年4期)2021-04-13 06:03:56
      堅(jiān)持個(gè)性化的寫(xiě)作
      文苑(2020年4期)2020-05-30 12:35:12
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      新聞的個(gè)性化寫(xiě)作
      新聞傳播(2018年12期)2018-09-19 06:27:10
      奇趣搭配
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      上汽大通:C2B個(gè)性化定制未來(lái)
      滿足群眾的個(gè)性化需求
      潼关县| 德州市| 汾阳市| 明光市| 军事| 原阳县| 开化县| 喜德县| 高密市| 濮阳市| 永福县| 文化| 五台县| 全南县| 山东省| 龙里县| 成武县| 沂南县| 无极县| 聂荣县| 兴宁市| 西峡县| 正安县| 花莲县| 双辽市| 阳原县| 油尖旺区| 华池县| 清水河县| 莱州市| 棋牌| 宿州市| 柳州市| 洱源县| 明光市| 中超| 抚远县| 陆良县| 大港区| 盐山县| 奉新县|