• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      融合知識(shí)圖譜與用戶(hù)評(píng)論的商品推薦算法

      2020-08-19 07:27:36湯偉韜余敦輝魏世偉
      計(jì)算機(jī)工程 2020年8期
      關(guān)鍵詞:圖譜準(zhǔn)確率權(quán)重

      湯偉韜,余敦輝,2,魏世偉

      (1.湖北大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,武漢 430062; 2.湖北省教育信息化工程技術(shù)中心,武漢 430062)

      0 概述

      隨著互聯(lián)網(wǎng)的快速發(fā)展,電子商務(wù)系統(tǒng)得到了廣泛應(yīng)用,其中的商品信息不斷擴(kuò)增,隨之也帶來(lái)了信息過(guò)載的問(wèn)題。為解決該問(wèn)題,商品推薦[1-2]應(yīng)運(yùn)而生,其通過(guò)分析用戶(hù)過(guò)往的購(gòu)買(mǎi)記錄或商品的受歡迎程度等信息,推斷用戶(hù)的喜好并為用戶(hù)推薦他們感興趣的商品。

      知識(shí)圖譜[3]是一種基于圖的網(wǎng)絡(luò)數(shù)據(jù)結(jié)構(gòu),其由多個(gè)節(jié)點(diǎn)和邊構(gòu)成,其中,實(shí)體作為節(jié)點(diǎn),關(guān)系作為邊,以多個(gè)<頭實(shí)體,關(guān)系,尾實(shí)體>的三元組形式存儲(chǔ)在知識(shí)庫(kù)中。知識(shí)圖譜作為大數(shù)據(jù)時(shí)代的產(chǎn)物,是物品與物品之間關(guān)系的最有效的表現(xiàn)方式,并且其能夠融合多源異構(gòu)信息,因此,越來(lái)越多的學(xué)者將知識(shí)圖譜應(yīng)用于推薦算法中[4]。

      知識(shí)圖譜的圖結(jié)構(gòu)能夠體現(xiàn)用戶(hù)評(píng)論之間的商品網(wǎng)絡(luò)結(jié)構(gòu)信息,因此,本文提出一種融合知識(shí)圖譜與用戶(hù)評(píng)論的商品推薦算法。結(jié)合知識(shí)圖譜分析每個(gè)用戶(hù)評(píng)論,提取商品特征及其對(duì)應(yīng)的情感詞,根據(jù)情感詞計(jì)算商品特征得分。將知識(shí)圖譜融入到商品相似度矩陣的計(jì)算中,在隨機(jī)游走模型中輸入相似度矩陣以分配特征權(quán)重,在此基礎(chǔ)上,通過(guò)商品特征分?jǐn)?shù)和特征權(quán)重計(jì)算商品推薦價(jià)值,根據(jù)商品推薦價(jià)值進(jìn)行Top-k推薦。

      1 相關(guān)工作

      推薦算法主要分為協(xié)同過(guò)濾算法、基于內(nèi)容的推薦算法和混合推薦算法。

      1)協(xié)同過(guò)濾算法將某個(gè)用戶(hù)感興趣的物品推薦給和該用戶(hù)興趣相似的用戶(hù)。文獻(xiàn)[5]通過(guò)將信息熵和雙聚類(lèi)引入到協(xié)同工作中,提取局部密集評(píng)分模塊從而提高推薦效率。文獻(xiàn)[6]提出一種基于可信數(shù)據(jù)和用戶(hù)相似度融合的“斜率一”算法,但是該算法沒(méi)有考慮商品本身信息對(duì)結(jié)果的影響,受限于評(píng)分?jǐn)?shù)據(jù)稀疏和冷啟動(dòng)問(wèn)題。

      2)基于內(nèi)容的推薦算法為用戶(hù)推薦與他喜歡的物品相似的物品。文獻(xiàn)[7]將概率模型與經(jīng)典的基于內(nèi)容的過(guò)濾推薦算法相結(jié)合,文獻(xiàn)[8]提出一種基于內(nèi)容的加權(quán)粒度序列推薦算法,但是上述2種算法受物品內(nèi)容信息提取技術(shù)的制約,推薦效果一般。

      3)混合推薦算法將多個(gè)推薦算法進(jìn)行組合,以發(fā)揮各自?xún)?yōu)勢(shì)。文獻(xiàn)[9]在ConvMF中加入雙嵌入層,更加注意物品的側(cè)面信息,文獻(xiàn)[10]考慮用戶(hù)行為數(shù)據(jù)和社會(huì)關(guān)系的互補(bǔ)性,但是上述研究增加了復(fù)雜度,運(yùn)行時(shí)間成本較高。

      近年來(lái),基于用戶(hù)評(píng)論的推薦算法相繼被提出。文獻(xiàn)[11]進(jìn)行用戶(hù)評(píng)論主題挖掘,其引入情感因素,構(gòu)建主題情感混合模型,并結(jié)合用戶(hù)評(píng)分進(jìn)行推薦,據(jù)此提出一種基于用戶(hù)評(píng)論的個(gè)性化產(chǎn)品推薦算法。文獻(xiàn)[12]在情感分類(lèi)輔助任務(wù)中引入格外監(jiān)督信息,以降低推薦任務(wù)的學(xué)習(xí)難度,通過(guò)在2個(gè)任務(wù)間共享短語(yǔ)的表示,使推薦任務(wù)更好地理解情感短語(yǔ)的語(yǔ)義。文獻(xiàn)[13]提出一種正則約束方式,對(duì)評(píng)論文本信息與模型的融合方法進(jìn)行深入研究?;谟脩?hù)評(píng)論的推薦算法同時(shí)結(jié)合了用戶(hù)特性與商品特性,獲取的商品細(xì)粒度信息準(zhǔn)確度高,避免了用戶(hù)評(píng)分?jǐn)?shù)據(jù)稀疏性的問(wèn)題。但是,現(xiàn)有的多數(shù)研究重點(diǎn)關(guān)注對(duì)評(píng)論文本的自然語(yǔ)言處理,孤立地處理單個(gè)評(píng)論而忽略了評(píng)論之間的網(wǎng)絡(luò)結(jié)構(gòu)信息。

      綜上所述,協(xié)同過(guò)濾算法主要探究用戶(hù)之間以及商品之間的關(guān)系,但沒(méi)有深入研究用戶(hù)和商品本身所具有的許多信息。大部分基于用戶(hù)評(píng)論的推薦算法雖然將評(píng)論融入到用戶(hù)和商品的關(guān)系中,但其關(guān)注文本處理而忽視了評(píng)論與評(píng)論之間可能存在的網(wǎng)絡(luò)結(jié)構(gòu)。本文通過(guò)知識(shí)圖譜構(gòu)造評(píng)論之間的網(wǎng)絡(luò)結(jié)構(gòu),利用該網(wǎng)絡(luò)結(jié)構(gòu)挖掘用戶(hù)評(píng)論所富含的信息,從而進(jìn)行商品推薦。

      2 融合知識(shí)圖譜的商品特征提取

      在用戶(hù)對(duì)商品的評(píng)論中,需要提取用戶(hù)關(guān)注度高的商品特征及其對(duì)應(yīng)的情感詞。多數(shù)商品特征提取方法都是獨(dú)立地分析單個(gè)評(píng)論文本而忽略了評(píng)論之間的聯(lián)系。因此,本文將知識(shí)圖譜融入到商品特征提取算法中,將多個(gè)商品的多個(gè)評(píng)論聯(lián)系在一起進(jìn)行討論。

      本文將商品作為知識(shí)圖譜中的實(shí)體,商品的特征作為商品實(shí)體的屬性,情感詞作為屬性值,將該規(guī)則關(guān)聯(lián)到知識(shí)圖譜中并進(jìn)行研究。

      2.1 基于語(yǔ)義約束LDA的商品特征和情感詞提取

      從評(píng)論文本中有效地提取商品特征和情感詞并獲取特征級(jí)別的情感傾向,是商品評(píng)論細(xì)粒度情感分析的關(guān)鍵。文獻(xiàn)[14]根據(jù)中文商品評(píng)論文本的特點(diǎn),從句法分析、詞義理解和語(yǔ)境相關(guān)等多角度獲取詞語(yǔ)間的語(yǔ)義關(guān)系,然后將其作為約束知識(shí)并嵌入到主題模型中,提出一種語(yǔ)義關(guān)系約束的主題模型SRC-LDA,以實(shí)現(xiàn)語(yǔ)義指導(dǎo)下LDA的細(xì)粒度主題詞提取。本文將通過(guò)SRC-LDA對(duì)商品i的某條用戶(hù)評(píng)論所提取出的特征組成的集合,定義為評(píng)論中的商品特征集合CFi={cf1,cf2,…}。

      2.2 基于知識(shí)圖譜的商品特征融合

      通過(guò)SRC-LDA從用戶(hù)評(píng)論中提取商品特征,需要與商品知識(shí)圖譜中的商品特征進(jìn)行融合,并對(duì)商品知識(shí)圖譜進(jìn)行補(bǔ)全。某商品在知識(shí)圖譜中可能存在以下2種情況:

      1)知識(shí)圖譜中存在特定商品所對(duì)應(yīng)的實(shí)體

      在該情形下,將知識(shí)圖譜中商品實(shí)體i的屬性所組成的集合定義為知識(shí)圖譜中的商品特征集KFi={kf1,kf2,…},取評(píng)論特征集和知識(shí)圖譜特征集的交集作為暫時(shí)確定的最終商品特征集Fi={f1,f2,…},如下:

      Fi=CFi∩KFi

      (1)

      但是,僅取兩者的交集是不夠完整的,原因是知識(shí)圖譜中的商品特征不完整,可能存在評(píng)論中是特征的詞而知識(shí)圖譜中還未收納,因此,需要在該集合中找出確實(shí)是特征的詞并補(bǔ)全到知識(shí)圖譜中,定義待補(bǔ)全特征集為:

      RFi=CFi-KFi

      (2)

      在得到待補(bǔ)全特征集RFi后,需要將真正表示特征的詞從中提取出并加入到最終商品特征集Fi中。針對(duì)商品i的評(píng)論有若干條,每條評(píng)論可得到一個(gè)RFi,將所有評(píng)論的RFi組合在一起,合并相同的元素,同時(shí)記錄特征f、特征出現(xiàn)的次數(shù)fn以及包含該特征的評(píng)論數(shù)fc,得到詞倉(cāng)庫(kù)為:

      WWH={(f1,fn1,fc1),(f2,fn2,fc2),…}

      (3)

      參考TF-IDF[15]中依據(jù)詞頻來(lái)計(jì)算詞的重要程度的思想,本文構(gòu)建一種基于詞頻的模型WTF-IDF,并將其應(yīng)用于詞倉(cāng)庫(kù)集合中。設(shè)一共有n篇用戶(hù)評(píng)論,定義特征詞頻為:

      (4)

      逆向集合頻率為:

      (5)

      詞總權(quán)重為:

      WTF-IDF=WTF×WIDF

      (6)

      根據(jù)WTF-IDF的值進(jìn)行排序,取值最大的λ個(gè)詞作為補(bǔ)充詞形成補(bǔ)充詞集SFi={sf1,sf2,…},將該詞集補(bǔ)充到最終商品特征集中,即:

      Fi=(CFi∩KFi)∪SFi

      (7)

      2)知識(shí)圖譜中不存在該商品所對(duì)應(yīng)的實(shí)體

      在該情形下,KFi為空集,最終的商品特征集就為評(píng)論中的商品特征集:

      Fi=CFi

      (8)

      在得到最終商品特征集Fi后,需要對(duì)知識(shí)圖譜進(jìn)行實(shí)體和特征補(bǔ)全。若該商品原先不在知識(shí)圖譜中,將實(shí)體補(bǔ)全進(jìn)知識(shí)圖譜中,補(bǔ)全過(guò)程注意特征消歧[16]。然后將知識(shí)圖譜進(jìn)行特征集補(bǔ)全,即更新KFi=Fi。

      3 商品推薦價(jià)值計(jì)算

      將商品對(duì)用戶(hù)群體的利用價(jià)值定義為商品推薦價(jià)值。在得到用戶(hù)群體真正關(guān)心的商品特征集合后,分析商品特征的得分和權(quán)重,然后根據(jù)特征得分和權(quán)重計(jì)算商品推薦價(jià)值。

      3.1 基于情感詞的特征得分計(jì)算

      在通過(guò)SRC-LDA得到商品特征對(duì)應(yīng)的情感詞后,根據(jù)情感詞庫(kù)中情感詞對(duì)應(yīng)的正面情感、中性情感和負(fù)面情感3種情況設(shè)置不同的得分,如表1所示。

      表1 情感詞語(yǔ)得分情況Table 1 Scores of emotional words

      不同用戶(hù)對(duì)同一商品特征往往會(huì)表現(xiàn)出不同的情感,此外,用戶(hù)評(píng)論的時(shí)間也是一個(gè)重要的衡量因素,近期的評(píng)論應(yīng)當(dāng)更具價(jià)值。假設(shè)此刻的時(shí)間為nt,評(píng)論時(shí)間為ct,最大時(shí)間差Δt=nt-ctmin,β為時(shí)間差比,則定義時(shí)間參數(shù)為:

      (9)

      假設(shè)通過(guò)SRC-LDA求得某商品特征fi的情感詞集為Efi={e1,e2,…},加入情感詞得分s和時(shí)間T后,計(jì)算考慮時(shí)間的每個(gè)特征情感詞的得分為:

      es=s×T

      (10)

      情感詞集轉(zhuǎn)變?yōu)镋fi={(e1,es1),(e2,es2),…},則該特征的總得分v定義為所有情感詞得分es的n分位數(shù)。最后,商品特征集可更新表示為帶特征得分的商品特征集Fi={(f1,v1),(f2,v2),…}。

      3.2 KCRW特征權(quán)重分配

      對(duì)于特征集合中的不同特征,需要分析其重要程度,即為每個(gè)特征分配權(quán)重。復(fù)雜網(wǎng)絡(luò)中的隨機(jī)游走模型[17]在克服數(shù)據(jù)稀疏性問(wèn)題上能夠取得良好的效果,其可以看作一個(gè)描述隨機(jī)游走者訪問(wèn)頂點(diǎn)序列的馬爾可夫鏈。文獻(xiàn)[18]指出當(dāng)游走達(dá)到穩(wěn)態(tài)后,每一個(gè)節(jié)點(diǎn)被訪問(wèn)的概率可作為該節(jié)點(diǎn)的權(quán)重表示。但是,一般的隨機(jī)游走模型將每個(gè)轉(zhuǎn)移概率設(shè)置為定值,未考慮到不同商品具有不同相似度的特點(diǎn)。因此,本文將基于商品特征向量的商品相似度與基于知識(shí)圖譜的商品相似度的加權(quán)作為隨機(jī)游走中邊的權(quán)值,構(gòu)造轉(zhuǎn)移概率矩陣,通過(guò)隨機(jī)游走來(lái)傳遞商品間的影響關(guān)系,從而確定特征的權(quán)重。知識(shí)圖譜中的隨機(jī)游走策略如圖1所示,其中,實(shí)線為關(guān)系邊,虛線為游走路線。

      圖1 隨機(jī)游走策略示意圖Fig.1 Schematic diagram of random walk strategy

      3.2.1 融合知識(shí)圖譜的商品相似度計(jì)算

      融合知識(shí)圖譜的商品相似度計(jì)算分為2個(gè)部分:

      1)基于商品向量的商品相似度sim

      前文將每個(gè)商品以商品特征集Fi的形式來(lái)表示,Fi中僅包含該商品具有的特征元素,本節(jié)改進(jìn)商品的表示形式,定義商品i的向量表示為:

      Ii=(I1,I2,…)T

      (11)

      (12)

      將所有商品表示為式(11)的向量后,用Pearson相關(guān)系數(shù)計(jì)算商品相似度:

      (13)

      2)基于知識(shí)圖譜的商品相似度sim′

      知識(shí)圖譜中的商品實(shí)體之間的關(guān)系邊同樣可以表示商品的相似度。知識(shí)表示方法TransE[19]將知識(shí)圖譜嵌入到低維向量空間中以進(jìn)行計(jì)算,基于TransE的變種方法TransM[20]在嵌入的同時(shí)還可以表示出實(shí)體之間關(guān)系邊的權(quán)重大小,該參數(shù)在一定程度上反映了商品在知識(shí)圖譜網(wǎng)絡(luò)結(jié)構(gòu)中的相似關(guān)系。在知識(shí)圖譜中,對(duì)于三元組,r為頭商品實(shí)體x和尾商品實(shí)體y之間的關(guān)系,采用TransM將知識(shí)圖譜以維度k嵌入到向量空間中:

      (14)

      (15)

      其中,Δr表示含有關(guān)系r的所有三元組,hr表示關(guān)系為r的三元組的所有頭商品實(shí)體,tr表示關(guān)系為r的三元組的所有尾商品實(shí)體。基于TransM可得知識(shí)圖譜的關(guān)系邊權(quán)重,關(guān)系邊權(quán)重可表示商品相似度:

      (16)

      結(jié)合基于商品特征向量的商品相似度與基于知識(shí)圖譜的商品相似度,最終定義2個(gè)商品的加權(quán)相似度為:

      (17)

      Sim越大表示商品x與商品y越相似。

      3.2.2 基于隨機(jī)游走模型的特征權(quán)重分配

      通過(guò)Sim可得任意2個(gè)商品之間的相似度,構(gòu)建商品相似度矩陣如下:

      (18)

      (19)

      令最大值元素為max,最小值元素為min,將所有元素進(jìn)行0-1歸一化:

      (20)

      將得到的商品相似度矩陣S作為概率轉(zhuǎn)移矩陣并輸入到隨機(jī)游走模型中,第m次隨機(jī)游走時(shí)的商品游走概率向量為Pm=(P1,P2,…)T,Pi指第i個(gè)商品的游走概率,則對(duì)應(yīng)的隨機(jī)游走策略為:

      Pm=(1-θ)·P0+θ·S·Pm-1

      (21)

      其中,θ為阻尼因子,表示游走項(xiàng)到達(dá)某一商品節(jié)點(diǎn)后繼續(xù)向后游走的概率,1-θ即表示下一次游走后返回初始商品節(jié)點(diǎn)的概率,阻尼因子θ一般取0.85[21]。經(jīng)過(guò)多次的迭代隨機(jī)游走,每個(gè)商品的游走概率逐漸趨于穩(wěn)定,最終的商品游走概率向量為Pm。

      在實(shí)際中,游走的節(jié)點(diǎn)對(duì)象是商品,而希望得到的卻是特征向量f=(wf1,wf2,…)T,wfi指第i個(gè)特征的權(quán)重,因此,需要在商品和特征之間建立一層轉(zhuǎn)化關(guān)系。商品i的向量為Ii=(I1,I2,…)T,設(shè)一共有n件商品,則可得到總商品矩陣為:

      (22)

      商品游走概率向量的實(shí)質(zhì)就是商品的權(quán)重,而商品的權(quán)重又與特征的權(quán)重直接關(guān)聯(lián),因此,理論上商品游走概率向量也可以表示為特征權(quán)重的加權(quán),即商品i的游走概率Pi可以表示為:

      (23)

      特征權(quán)重向量可表示為:

      f=(I′)-1×Pm

      (24)

      最終的商品特征集可更新表示為帶得分和權(quán)重的集合Fi={(f1,wf1,v1),(f2,wf2,v2),…}。

      3.3 商品推薦價(jià)值計(jì)算算法

      對(duì)于商品i,求得該商品的特征權(quán)重和特征得分后,根據(jù)其特征集Fi可計(jì)算推薦價(jià)值為:

      (25)

      求得所有商品的推薦價(jià)值后,根據(jù)推薦價(jià)值從大到小進(jìn)行Top-k排序,分?jǐn)?shù)高的商品應(yīng)當(dāng)更受到用戶(hù)群體的喜愛(ài),因此,推薦序列中的前k個(gè)商品給用戶(hù)。

      商品推薦價(jià)值計(jì)算(KCRW)算法描述如下:

      算法1KCRW算法

      輸入商品i的特征集合Fi={(f1,v1),(f2,v2),…}

      輸出商品推薦價(jià)值序列

      1.for each 商品i:

      2.表示出商品向量Ii=(I1,I2,…)T

      3.for each 商品i:

      4.for each 除商品i以外的商品j:

      6.構(gòu)建相似度矩陣S

      7.計(jì)算商品游走概率向量Pm=(1-θ)·P0+θ·S·Pm-1

      9.計(jì)算特征權(quán)重向量f=(I′)-1×Pm

      10.for each 商品i:

      11.特征集合更新為Fi={(f1,wf1,v1),(f2,wf2,v2),…}

      13.return 商品推薦價(jià)值序列

      3.4 算法時(shí)間復(fù)雜度分析

      假設(shè)一共有n個(gè)商品,每個(gè)商品包含m個(gè)特征。KCRW算法步驟1~步驟2的時(shí)間復(fù)雜度為O(n),步驟3~步驟5的時(shí)間復(fù)雜度為O(m·n2),步驟6~步驟7的時(shí)間復(fù)雜度為O(n2),步驟10~步驟12的時(shí)間復(fù)雜度為O(n)。綜上,KCRW算法的時(shí)間復(fù)雜度為O(m·n2)。

      4 實(shí)驗(yàn)結(jié)果與分析

      4.1 實(shí)驗(yàn)設(shè)置

      本文實(shí)驗(yàn)數(shù)據(jù)集包含用戶(hù)評(píng)論和知識(shí)圖譜2個(gè)方面。在用戶(hù)評(píng)論方面,本文爬取的數(shù)據(jù)來(lái)自淘寶、天貓商城和京東商城這3個(gè)全球大型電商平臺(tái),其中涵蓋了5 000個(gè)商品總共100 000條用戶(hù)評(píng)論,每個(gè)商品平均約有20條用戶(hù)評(píng)論。在知識(shí)圖譜方面,本文選取1.4億中文通用知識(shí)圖譜思知(ownthink),數(shù)據(jù)以<實(shí)體、屬性、值>、<實(shí)體、關(guān)系、實(shí)體>混合的形式存儲(chǔ)在apache-jena-fuseki服務(wù)器中。

      4.2 評(píng)價(jià)指標(biāo)

      實(shí)驗(yàn)使用準(zhǔn)確率(Precision)、召回率(Recall)以及F值(F-Score)3個(gè)指標(biāo)[22]進(jìn)行評(píng)價(jià),各指標(biāo)的計(jì)算公式分別如下:

      (26)

      (27)

      (28)

      其中,TP指用戶(hù)喜歡且推薦了的樣本,FN指用戶(hù)不喜歡但推薦了的樣本,FP指用戶(hù)喜歡但沒(méi)被推薦的樣本。

      準(zhǔn)確率反映了推薦算法的推薦水平,表示將用戶(hù)喜歡的物品推薦給用戶(hù),而用戶(hù)不喜歡的物品則不推薦。召回率反映了推薦算法所推薦的物品占用戶(hù)真正喜歡的物品的比重。F值是準(zhǔn)確率和召回率的加權(quán)平均。將數(shù)據(jù)集以6∶4劃分為訓(xùn)練集和測(cè)試集進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)硬件環(huán)境:處理器型號(hào)為Intel?CoreTMi7-8550U CPU @ 1.80 GHz 1.99 GHz,內(nèi)存為16 GB;實(shí)驗(yàn)軟件環(huán)境:Python3.7.5,JDK-13.0.1,apache-jena-fuseki-3.13.1。實(shí)驗(yàn)參數(shù)設(shè)置如表2所示。

      表2 實(shí)驗(yàn)參數(shù)設(shè)置Table 2 Experimental parameters setting

      4.3 結(jié)果分析

      4.3.1 特征參數(shù)確定

      設(shè)定商品數(shù)量為5 000,評(píng)論數(shù)量為100 000,特征參數(shù)確定如下:

      1)補(bǔ)充量λ和時(shí)間差比β的聯(lián)合確定

      設(shè)置嵌入維度k為200,探究不同λ和β下的準(zhǔn)確率、召回率和F值,結(jié)果如圖2所示。

      圖2 不同λ和β值下的實(shí)驗(yàn)結(jié)果Fig.2 Experimental result under different λ and β values

      從圖2可以看出,隨著補(bǔ)充量λ的提高,準(zhǔn)確率、召回率和F值開(kāi)始逐漸遞增后來(lái)逐漸減小,當(dāng)λ=2時(shí)達(dá)到峰值。因此,將最佳的補(bǔ)充量λ設(shè)置為2。此外,當(dāng)時(shí)間差比β取1.5Δt時(shí),準(zhǔn)確率、召回率和F值相對(duì)較高,再增大β時(shí)準(zhǔn)確率明顯下降。

      2)嵌入維度k的確定

      已確定最佳補(bǔ)充量λ為2,最佳時(shí)間差比β為1.5Δt,探究不同k下的準(zhǔn)確率、召回率和F值,結(jié)果如圖3所示。

      圖3 不同k值下的實(shí)驗(yàn)結(jié)果Fig.3 Experimental result under different k values

      從圖3可以看出,隨著嵌入向量維度k的提高,準(zhǔn)確率、召回率和F值開(kāi)始逐漸遞增,在k=200時(shí)達(dá)到峰值,然后逐漸減小。因此,將最佳的嵌入向量維度k設(shè)置為200。

      4.3.2 算法有效性驗(yàn)證

      確定參數(shù)的最佳值后,補(bǔ)充量λ設(shè)為2,時(shí)間差比β設(shè)為1.5Δt,嵌入維度k設(shè)為200。將本文推薦算法與基于知識(shí)圖譜的推薦算法(KG)[23]、協(xié)同過(guò)濾算法(CF)[5]、基于內(nèi)容的推薦算法(CB)[7]和混合推薦算法(MX)[9]的推薦效果進(jìn)行比較,分別探究在商品數(shù)量和評(píng)論數(shù)量變化時(shí)準(zhǔn)確率、召回率和F值的變化情況,以驗(yàn)證本文推薦算法的有效性。

      1)探究評(píng)論數(shù)量對(duì)算法性能的影響(商品數(shù)量設(shè)定為5 000)。從圖4可以看出,隨著評(píng)論數(shù)量的增多,本文算法的準(zhǔn)確率、召回率和F值都在不斷上升,準(zhǔn)確率在評(píng)論數(shù)量大于40 000后明顯優(yōu)于其他3種算法,并且召回率和F值一直高于其他3種算法,本文算法相對(duì)其他算法的性能提升比率如表3所示。

      圖4 不同評(píng)論數(shù)量下的實(shí)驗(yàn)結(jié)果Fig.4 Experimental result under different number of comments

      表3 本文算法相對(duì)其他算法的性能提升比率1Table 3 The performance improvement ratio 1 of the proposed algorithm compared with other algorithms %

      2)探究商品數(shù)量對(duì)算法性能的影響(針對(duì)每個(gè)商品隨機(jī)取10條評(píng)論)。從圖5可以看出,隨著商品數(shù)量的增多,本文算法的召回率在不斷增大,F值趨于穩(wěn)定,算法的準(zhǔn)確率、召回率和F值一直高于其他3種算法,性能提升比率如表4所示。

      圖5 不同商品數(shù)量下的實(shí)驗(yàn)結(jié)果Fig.5 Experimental result under different number of commodity

      表4 本文算法相對(duì)其他算法的性能提升比率2Table 4 The performance improvement ratio 2 of the proposed algorithm compared with other algorithms %

      5 結(jié)束語(yǔ)

      本文提出一種融合知識(shí)圖譜與用戶(hù)評(píng)論的商品推薦算法,以商品特征作為研究對(duì)象使推薦更加準(zhǔn)確。利用知識(shí)圖譜的網(wǎng)絡(luò)結(jié)構(gòu)關(guān)聯(lián)所有評(píng)論文本以挖掘商品特征信息,從而更充分地利用商品內(nèi)部信息,然后進(jìn)行知識(shí)圖譜補(bǔ)全以避免數(shù)據(jù)稀疏問(wèn)題。在隨機(jī)游走模型中的相似度矩陣構(gòu)建中結(jié)合知識(shí)圖譜,使模型的準(zhǔn)確性進(jìn)一步提高。實(shí)驗(yàn)結(jié)果表明,本文商品推薦算法能夠取得較好的推薦效果。用戶(hù)評(píng)論和知識(shí)圖譜之間還有很多待挖掘的內(nèi)容,如評(píng)論中的隱語(yǔ)義部分含有大量的商品隱含特征,這些特征對(duì)于分析用戶(hù)偏好具有較大作用。下一步將通過(guò)知識(shí)圖譜來(lái)挖掘用戶(hù)評(píng)論中的隱含信息,以提高推薦系統(tǒng)的準(zhǔn)確性和有效性。

      猜你喜歡
      圖譜準(zhǔn)確率權(quán)重
      乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
      健康之家(2021年19期)2021-05-23 11:17:39
      不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
      2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
      繪一張成長(zhǎng)圖譜
      權(quán)重常思“浮名輕”
      高速公路車(chē)牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
      為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
      基于公約式權(quán)重的截短線性分組碼盲識(shí)別方法
      補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      主動(dòng)對(duì)接你思維的知識(shí)圖譜
      镇康县| 永清县| 房产| 海兴县| 和静县| 昌乐县| 阜平县| 开化县| 板桥市| 西城区| 开鲁县| 和林格尔县| 法库县| 盐津县| 陆川县| 绵阳市| 方正县| 无为县| 鸡东县| 清徐县| 朝阳区| 永宁县| 交口县| 永康市| 阳信县| 西安市| 祁阳县| 吴江市| 南和县| 台州市| 维西| 太仓市| 尖扎县| 长垣县| 华安县| 黄大仙区| 郯城县| 页游| 常熟市| 乌兰察布市| 厦门市|