• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      融合知識(shí)圖譜的RippleNet推薦模型優(yōu)化研究

      2021-09-07 10:42:44劉偉江郝一哲
      現(xiàn)代情報(bào) 2021年9期
      關(guān)鍵詞:圖譜實(shí)體語(yǔ)義

      劉偉江 郝一哲

      DOI:10.3969/j.issn.1008—0821.2021.09.007

      [中圖分類(lèi)號(hào)]TP391 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1008-0821(2021)09-0064-10

      隨著信息技術(shù)的發(fā)展,以數(shù)據(jù)分析為基礎(chǔ)的推薦系統(tǒng)應(yīng)用領(lǐng)域不斷拓展,如根據(jù)用戶信息的購(gòu)物推薦;針對(duì)交互歷史數(shù)據(jù)的音樂(lè)、電影推薦等。在現(xiàn)有推薦模型研究基礎(chǔ)上,針對(duì)以往推薦模型面臨的數(shù)據(jù)稀疏和冷啟動(dòng)、訓(xùn)練數(shù)據(jù)邏輯關(guān)聯(lián)不足、推薦結(jié)果可解釋性低等問(wèn)題,研究人員逐漸將知識(shí)圖譜技術(shù)引入推薦系統(tǒng)中。

      知識(shí)圖譜(Knowledge Graph,KG)概念最早由美國(guó)Google公司提出并逐漸發(fā)展為一種表達(dá)實(shí)體間語(yǔ)義關(guān)系的知識(shí)庫(kù)工具?,F(xiàn)階段,伴隨著互聯(lián)網(wǎng)技術(shù)的進(jìn)步,許多團(tuán)體已經(jīng)構(gòu)建了包含大量實(shí)體信息的知識(shí)圖譜,如DBpedia、CN-DBpedia、YAGO KG、Freebase KG、Microsoft Satori等通用知識(shí)圖譜。在推薦系統(tǒng)中引入知識(shí)圖譜可以豐富項(xiàng)目與項(xiàng)目、用戶與用戶以及項(xiàng)目與用戶的關(guān)聯(lián)信息,并可借助其語(yǔ)義推理功能提取原始輸入數(shù)據(jù)間的邏輯關(guān)系,以提高推薦系統(tǒng)的工作性能。此外,由于儲(chǔ)存在知識(shí)圖譜中的實(shí)體間語(yǔ)義關(guān)系種類(lèi)具有多樣性,推薦系統(tǒng)中某個(gè)用戶與實(shí)體間的交互數(shù)據(jù)往往可以在知識(shí)圖譜中從一個(gè)項(xiàng)目實(shí)體出發(fā),沿著不同的語(yǔ)義關(guān)系延伸到不同類(lèi)型的項(xiàng)目實(shí)體,從而擴(kuò)大用戶的潛在興趣種類(lèi)和范圍,提高推薦系統(tǒng)輸出結(jié)果的合理性;同時(shí),知識(shí)圖譜的語(yǔ)義關(guān)系與推薦系統(tǒng)的輸入數(shù)據(jù)相結(jié)合可提高推薦系統(tǒng)輸出結(jié)果的可解釋性,改善商家推薦服務(wù)的接受度與用戶滿意度。因此,許多學(xué)者將知識(shí)圖譜與推薦系統(tǒng)結(jié)合提高推薦性能:Yang D等利用Metapath2Vec模型,將知識(shí)圖譜中的實(shí)體節(jié)點(diǎn)作為模型輸入,提高推薦系統(tǒng)的精準(zhǔn)率:Zhang FZ等提出的CKE模型可對(duì)知識(shí)圖譜進(jìn)行特征學(xué)習(xí),并將學(xué)習(xí)結(jié)果結(jié)合協(xié)同過(guò)濾模型實(shí)現(xiàn)推薦。類(lèi)似結(jié)合知識(shí)圖譜的推薦模型只將知識(shí)圖譜特征化,但推薦結(jié)果的可解釋性和邏輯性仍有欠缺,因此Wang H等基于已構(gòu)建的知識(shí)圖譜提出了“偏好擴(kuò)散”的思想構(gòu)建“Rip-pleNet模型”,此模型利用知識(shí)推理功能判斷用戶潛在偏好向用戶推薦,即用戶對(duì)某項(xiàng)事物的偏好信息可以借助知識(shí)圖譜節(jié)點(diǎn)間語(yǔ)義關(guān)系在節(jié)點(diǎn)之間傳播,再通過(guò)實(shí)體節(jié)點(diǎn)和語(yǔ)義關(guān)系特征刻畫(huà)用戶偏好,此方法取得良好的效果并廣泛引用。

      本文以RippleNet模型為基礎(chǔ),考慮到模型根據(jù)隨機(jī)選取定量節(jié)點(diǎn)的機(jī)制更新用戶偏好數(shù)據(jù)集的過(guò)程會(huì)導(dǎo)致每次更新的元素節(jié)點(diǎn)與上層潛在偏好節(jié)點(diǎn)之間的語(yǔ)義邏輯性偏低,并且在隨機(jī)更新過(guò)程中會(huì)出現(xiàn)用戶偏好失真,這種失真會(huì)在偏好數(shù)據(jù)集中逐層放大,進(jìn)而影響用戶偏好的刻畫(huà)。此外,訓(xùn)練RippleNet模型的用戶評(píng)分?jǐn)?shù)據(jù)屬于一種隱式反饋數(shù)據(jù),此評(píng)分?jǐn)?shù)據(jù)通過(guò)閾值設(shè)定方式進(jìn)一步被轉(zhuǎn)換為顯式評(píng)分?jǐn)?shù)據(jù),在這一轉(zhuǎn)換過(guò)程中,數(shù)據(jù)噪聲的存在會(huì)影響最后的推薦質(zhì)量。Yera R等認(rèn)為未經(jīng)過(guò)噪聲處理的原始隱式交互數(shù)據(jù)會(huì)影響推薦結(jié)果的精準(zhǔn)率。趙明等和郭偉等為了降低訓(xùn)練數(shù)據(jù)對(duì)推薦模型性能的影響,將識(shí)別的噪聲刪除,卻提高了數(shù)據(jù)稀疏性?;诖?,本文從以下兩方面對(duì)RippleNet模型進(jìn)行優(yōu)化,以期提高推薦結(jié)果的精準(zhǔn)度。首先,統(tǒng)計(jì)已構(gòu)建知識(shí)圖譜中各類(lèi)語(yǔ)義關(guān)系詞頻,用戶偏好擴(kuò)散時(shí),其偏好數(shù)據(jù)集會(huì)優(yōu)先選擇與起始節(jié)點(diǎn)在知識(shí)圖譜中高語(yǔ)義詞頻語(yǔ)義關(guān)系連接的下層節(jié)點(diǎn)進(jìn)行更新,保證用戶偏好按照較強(qiáng)的語(yǔ)義邏輯進(jìn)行擴(kuò)散,從而改進(jìn)數(shù)據(jù)集更新過(guò)程節(jié)點(diǎn)選擇的隨機(jī)性;其次,本文分別設(shè)置一個(gè)低分閾值和高分閾值,將顯式評(píng)分?jǐn)?shù)據(jù)中用戶和項(xiàng)目劃分為高、中、低評(píng)分類(lèi),按照高評(píng)分用戶評(píng)價(jià)過(guò)的高評(píng)分項(xiàng)目會(huì)得到高評(píng)分的邏輯(中、低評(píng)分類(lèi)也具有類(lèi)似邏輯)對(duì)原始評(píng)分?jǐn)?shù)據(jù)集進(jìn)行噪聲的識(shí)別和修正工作。因此,本文擬利用偏好傳播規(guī)則限制用戶偏好數(shù)據(jù)集的隨機(jī)性的同時(shí),通過(guò)識(shí)別并修正噪聲提高訓(xùn)練數(shù)據(jù)質(zhì)量來(lái)提高模型的推薦性能。

      1相關(guān)工作概述

      1.1知識(shí)圖譜

      知識(shí)圖譜中的節(jié)點(diǎn)代表了一定范圍內(nèi)的實(shí)體,節(jié)點(diǎn)間的連線則表示一個(gè)實(shí)體和另一個(gè)實(shí)體的語(yǔ)義知識(shí)關(guān)系,實(shí)際上,可以將知識(shí)圖譜理解為一個(gè)由實(shí)體和實(shí)體間語(yǔ)義關(guān)系構(gòu)成的有向異構(gòu)網(wǎng)絡(luò)圖。首先,知識(shí)圖譜可以將現(xiàn)實(shí)中的事物實(shí)體以及事物間的關(guān)系抽象為節(jié)點(diǎn)與連線,從而構(gòu)成“圖譜”的表現(xiàn)形式,直觀表達(dá)抽象對(duì)象的關(guān)聯(lián)信息;其次,知識(shí)圖譜可以根據(jù)實(shí)體節(jié)點(diǎn)間相互聯(lián)系的語(yǔ)義關(guān)系對(duì)多個(gè)抽象對(duì)象進(jìn)行“知識(shí)”表達(dá)。

      1.2基于知識(shí)圖譜的RippleNet推薦模型

      RippleNet推薦模型是一種基于知識(shí)圖譜推薦的端到端模型框架,它以用戶一項(xiàng)目對(duì)作為輸入,輸出用戶交互(如點(diǎn)擊、瀏覽)物品的概率,該模型通過(guò)分析知識(shí)圖譜中節(jié)點(diǎn)和語(yǔ)義關(guān)系獲得節(jié)點(diǎn)間深層次的潛在關(guān)系,并結(jié)合物品推薦思想在知識(shí)圖譜中獲得用戶的潛在偏好信息。

      RippleNet模型的關(guān)鍵思想是用戶偏好擴(kuò)散:該模型將每個(gè)用戶歷史興趣或者已有交互歷史的實(shí)體作為知識(shí)圖譜中的一個(gè)種子集,用戶偏好從種子集出發(fā)并沿著知識(shí)圖譜的語(yǔ)義關(guān)系連接進(jìn)行迭代,擴(kuò)展用戶的興趣并發(fā)現(xiàn)用戶對(duì)某個(gè)候選節(jié)點(diǎn)的潛在興趣,通過(guò)用戶偏好在知識(shí)圖譜中的擴(kuò)散過(guò)程獲得用戶的偏好數(shù)據(jù)集。如圖1所示,某用戶看過(guò)由James Cameron執(zhí)導(dǎo)的電影《Titanic》,而該導(dǎo)演執(zhí)導(dǎo)過(guò)電影《Avatar》,另外《Titanic》中演員Leo-nardo DiCaprio也參演過(guò)《Inception》。根據(jù)“偏好擴(kuò)散”思想,該用戶就有可能因?yàn)槠醚輪TLeo-nardo DiCaprio而喜歡《Inception》,也可能因?yàn)閷?duì)導(dǎo)演James Cameron的偏好而喜歡《Avatar》。

      1)類(lèi)似于由多個(gè)雨滴產(chǎn)生的真實(shí)漣漪,用戶對(duì)實(shí)體的潛在興趣是由其歷史偏好逐層擴(kuò)散,并沿著知識(shí)圖譜中的語(yǔ)義關(guān)系由近及遠(yuǎn)傳播,通過(guò)圖2所示的同心圓對(duì)“漣漪”進(jìn)行可視化類(lèi)比。

      2)用戶在偏好集合中的潛在偏好強(qiáng)度隨著跳數(shù)k增加而減弱,這與真實(shí)紋波振幅逐漸衰減的情況相似。圖2中逐漸變淡的綠色顯示了中心和周?chē)鷮?shí)體間逐漸減少的相關(guān)性。

      2 RippleNet模型優(yōu)化

      RippleNet模型對(duì)每一位用戶的偏好刻畫(huà)都來(lái)源于用戶偏好數(shù)據(jù)中的信息,用戶偏好數(shù)據(jù)集的質(zhì)量會(huì)直接影響模型性能。RippleNet模型中隨機(jī)選取節(jié)點(diǎn)的方式會(huì)使用戶偏好數(shù)據(jù)集具有不確定性,從而導(dǎo)致用戶偏好的不穩(wěn)定,進(jìn)而直接影響推薦結(jié)果準(zhǔn)確性;另外,原模型未考慮評(píng)分?jǐn)?shù)據(jù)噪聲對(duì)推薦結(jié)果的影響,存在于評(píng)分?jǐn)?shù)據(jù)中的噪聲會(huì)降低數(shù)據(jù)質(zhì)量,從根本上影響模型對(duì)用戶偏好的刻畫(huà)。所以RippleNet模型優(yōu)化主要由偏好擴(kuò)散制定和評(píng)分?jǐn)?shù)據(jù)噪聲識(shí)別與修正兩部分組成。

      2.1偏好擴(kuò)散規(guī)則制定

      猜你喜歡
      圖譜實(shí)體語(yǔ)義
      繪一張成長(zhǎng)圖譜
      語(yǔ)言與語(yǔ)義
      前海自貿(mào)區(qū):金融服務(wù)實(shí)體
      實(shí)體的可感部分與實(shí)體——兼論亞里士多德分析實(shí)體的兩種模式
      補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      兩會(huì)進(jìn)行時(shí):緊扣實(shí)體經(jīng)濟(jì)“釘釘子”
      振興實(shí)體經(jīng)濟(jì)地方如何“釘釘子”
      主動(dòng)對(duì)接你思維的知識(shí)圖譜
      “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
      認(rèn)知范疇模糊與語(yǔ)義模糊
      宜都市| 大兴区| 依安县| 曲阜市| 邵阳市| 米脂县| 巴南区| 枞阳县| 封丘县| 南宁市| 北宁市| 马尔康县| 德清县| 富川| 九寨沟县| 囊谦县| 湟源县| 双鸭山市| 拉孜县| 社会| 清徐县| 东平县| 东阳市| 昔阳县| 石狮市| 呼和浩特市| 玉林市| 临江市| 贞丰县| 德阳市| 连云港市| 攀枝花市| 鞍山市| 金乡县| 平乐县| 新沂市| 商河县| 铅山县| 滨海县| 邯郸市| 临朐县|