• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于人性化用戶特征的在線酒店推薦技術研究

      2019-04-01 13:11:54王婧虹李銀勝
      計算機應用與軟件 2019年2期
      關鍵詞:人性化準確率協(xié)同

      王婧虹 李銀勝

      (復旦大學軟件學院 上海 201203)

      0 引 言

      我國的酒店市場空間巨大,尤其是隨著經(jīng)濟水平和生活質量的不斷提升,人們出行頻率大幅提高,對酒店服務的需求擴大,酒店種類變得豐富且數(shù)量激增。因此,為用戶提供精準有效的酒店推薦服務尤為重要。

      目前國內外均提出并實施了很多推薦系統(tǒng),以方便用戶挑選酒店。但已有的推薦系統(tǒng)大多存在數(shù)據(jù)稀疏、冷啟動以及對用戶行為缺乏理解的缺點,沒有挖掘用戶人性化數(shù)據(jù),確定其興趣所在,推薦其真正感興趣的酒店資源。以下結合用戶場景介紹目前酒店推薦存在的問題。

      總所周知,李彥宏、馬云、馬化騰分別為BAT創(chuàng)始人,均為中國著名男性企業(yè)家,如表1所示,因此對酒店的硬性需求基本一致。

      表1 共同特征

      若三位到達上海,需入住酒店時,按傳統(tǒng)推薦方法,均會推薦上海萬豪虹橋大酒店,因其離虹橋機場近、地理位置優(yōu)越、商務風格、環(huán)境安靜、設施齊全,較好滿足三位基本要求。酒店特征描述如表2所示。

      表2 酒店特征

      針對李彥宏,專注保守(性格),崇尚極簡主義(觀念),為其推薦經(jīng)典的商務酒店即可,上海萬豪虹橋大酒店乃不二之選;但針對馬云,不像其他二位本身家庭條件優(yōu)渥(環(huán)境)且擁有IT技術背景(知識),他創(chuàng)業(yè)歷程艱辛坎坷(經(jīng)歷),且相對年齡較大(生理),年輕時不懈拼搏如今事業(yè)有成的他相當注重養(yǎng)生,喜愛太極(觀念)。因此在滿足基本需求的前提下,結合人性化特征,給馬云推薦環(huán)境靜謐,擁有可散步健身的大塊草坪的上海西郊賓館更為合適,符合其養(yǎng)生之道;針對馬化騰,典型的廣東潮汕人(環(huán)境),鐘愛廣式美食(觀念),對于率性的他(性格),身處外地能很方便地品嘗到家鄉(xiāng)味道,定是人生幸事。因此在滿足基本需求的前提下,結合人性化特征,給馬化騰推薦周邊就有“潮汕食府”的上海虹橋新華聯(lián)索菲特大酒店更為合適,符合其飲食文化。上述三位人性化特征如表3所示。傳統(tǒng)推薦與人性化推薦結果對比情況如表4所示。

      表3 人性化特征

      續(xù)表3

      表4 推薦對比

      由此可見,客戶選擇酒店,其實是選擇一個短期的生活圈[10],僅僅滿足其對硬件設施的需求是遠遠不夠的[13],更需從多方面考慮其人性化特性,讓客戶體會到被推薦的酒店處處都在為其著想,賓至如歸[12]。

      因此,本文提出了一種基于人性化用戶特征的在線酒店推薦方法。剖析、獲取用戶人性化特征形成酒店用戶模型,結合特征匹配與協(xié)同過濾方法為用戶推薦其感興趣的酒店。并于課題項目“酒店管理營運博弈沙盤”進行實驗,得出準確率、召回率、運行效率等綜合表現(xiàn)最佳的推薦方式,且在一定程度上解決冷啟動和數(shù)據(jù)稀疏的問題。

      1 相關工作

      目前大部分酒店推薦系統(tǒng)基于用戶瀏覽和購買歷史進行興趣度分析,著力于采集電子商務網(wǎng)站中的大量注冊、交易、評價等用戶數(shù)據(jù),和Web服務器中的日志數(shù)據(jù)、用戶購物信息,但用戶的人性化特性鮮為關注。

      文獻[1]采集用戶已訪問的酒店資源集合以及在線提交的資源要求等信息。根據(jù)用戶于酒店網(wǎng)站上的在線行為,抽象出瀏覽用戶特征并構建信息庫,形成用戶模塊。分析用戶興趣特征和產(chǎn)品特征的相似性,利用聚類方法,挖掘出與用戶興趣相關的酒店產(chǎn)品。量化用戶興趣特征和產(chǎn)品特征,匹配算法簡單明了,但產(chǎn)品特征需一一列舉,且不易量化的特性均被忽略。文獻[2-3]采集用戶酒店評論信息,得到用戶偏好和酒店評價數(shù)據(jù)。根據(jù)用戶輸入對酒店的要求(如城市,出游類型等信息,及對房間、食物、位置、服務、設備等的偏好),來構建用戶模型。文獻[2]認為群體用戶的整體評價往往會忽略推薦用戶某方面的特定需求。因此先為評論提取偏好,根據(jù)有相同或相似偏好的用戶評價來形成推薦列表。協(xié)同過濾的思想,存在冷啟動、數(shù)據(jù)稀疏問題。文獻[3]提出線下評估方法,線下提取酒店用戶評論并進行處理得到項目特征矩陣,結合協(xié)同過濾,加快推薦速度,一定程度上優(yōu)化冷啟動問題但無法徹底解決,且需要不斷更新離線資源。文獻[4]采集用戶內部數(shù)據(jù)(如國籍、性別、年齡等)和外部數(shù)據(jù)(如設備、社交媒體、時間、環(huán)境等)。通過對用戶內外部信息數(shù)據(jù)進行語義特征提取等處理,并進行情感分析、行為分析、偏好分析,來構建用戶模型。文獻[5]采集用戶基本信息和網(wǎng)站操作信息數(shù)據(jù),根據(jù)用戶基本信息(性別、年齡、職業(yè)等)、用戶偏好信息及用戶操作行為(學習記錄、收藏夾等)來構建模型。文獻[6]采集用戶瀏覽網(wǎng)站時的眼動追蹤數(shù)據(jù)和鼠標追蹤數(shù)據(jù),來得到用戶偏好,再做基于內容的推薦。

      綜上,目前已有的推薦系統(tǒng)大多存在數(shù)據(jù)稀疏、冷啟動以及對用戶行為缺乏理解的問題。幾乎沒有挖掘用戶人性化數(shù)據(jù),確定其興趣所在,推薦其真正感興趣的酒店資源。因此,本文結合用戶人性化特征,更準確、高效地為用戶推薦酒店。

      2 預備知識

      2.1 用戶建模與推薦技術

      國內外相關研究機構與學者在用戶建模以及推薦技術領域取得了大量的研究成果:目前廣泛采用用戶行為分析觀察法來獲取用戶喜好信息,通過獲取到的用戶喜好信息建立用戶模型[8]。一般通過基于知識的推薦技術來直接啟發(fā)用戶主動提供偏好和需求,進而通過用戶偏好結構以及關聯(lián)規(guī)則和樣例以及評論屬性來建立用戶輪廓模型[9];基于內容的推薦技術主要從用戶表示喜愛或者正面反饋的內容來獲取用戶偏好,進而通過基于關鍵詞的向量空間模型、基于內容的標簽網(wǎng)絡以及潛在的主題模型等技術來構建用戶輪廓模型;基于協(xié)同過濾的推薦技術通過獲取到的用戶偏好模型,運用余弦相似度、皮爾遜相似度等方法找到其相似用戶[11],再為其推薦相似用戶喜愛的產(chǎn)品,以取得較高的推薦成效。然而這些方法所采取的用戶數(shù)據(jù)相對較為單一,往往只是用戶某個維度的體現(xiàn),從而導致在推薦上的人性化效果不足。

      2.2 人性化用戶模型

      人性化用戶模型由作者所在課題組李銀勝[22]、沈劍平[19]等人提出,亦稱數(shù)字靈魂模型Cyber-Anima。Cyber-Anima模型旨在反映個體的內生特征概念,這些內生特征會對個體行為產(chǎn)生重大影響。該模型對用戶人性化特征進行數(shù)字處理,為探索用戶欲望和推理用戶意圖提供了全新的視角。個體內生特征可從用戶輸入、互聯(lián)網(wǎng)資源、應用系統(tǒng)、便攜式設備等處獲取的信息進行關聯(lián)、相互轉換,不斷更新、完善。因此,Cyber-Anima對于身處網(wǎng)絡世界的個體來說是與生俱來的,在使用過程中無需再收集各種用戶相關數(shù)據(jù)。所以,若結合人性化用戶模型,可解決傳統(tǒng)協(xié)同過濾方法的冷啟動和數(shù)據(jù)稀疏問題[22]。

      表5 六大維度內容

      人性化模型采用基于本體的表示法,將六個維度中的屬性作為本體的概念對和關系,從而結構化、語義化地描述用戶[14]。在構建過程中,通過確定本體的頂層概念,即用戶模型的六個維度,然后按照六個維度的具體定義,將其子維度表示成相應的子概念。用戶模型維度可以表示為D∷=C×R,其中C表示概念集,R表示關系集。其中關系是概念之間的聯(lián)系,本文在構建人性化個體模型本體時主要運用的幾種關系類型[14]如表6所示。

      表6 概念間關系類型

      2.3 語義特征提取

      構建用戶模型時涉及到語義特征提取技術,用戶信息中往往包含大量文本信息。文本的特征項的選取即為從文本中抽取具有代表性的詞來表示文本信息的特征[19]。文本信息通常使用向量空間模型(VSM)來表示,每個文檔表示為一個特征向量V=(t1w1,t2w2,…,tnwn),其中ti為詞條項,wi為權值。

      如果某個詞或短語在一個文本中出現(xiàn)的頻率TF(term-frequency)高,在其他文本中出現(xiàn)的頻率低,則認為該詞或短語具有良好的區(qū)別能力[21]。IDF(Inverse Document Frequency)指逆向文件頻率,如果包含詞條t的文檔越少,IDF越大,則說明詞條t具有很好的類別區(qū)分能力。

      結合TF與IDF,TF-IDF計算方法如下所示:

      (1)

      式中:tfi為詞i在訓練集中的詞頻,N為訓練集文本數(shù),ni未出現(xiàn)詞i的文本數(shù)目。

      3 基于人性化用戶特征的酒店推薦

      3.1 整體架構

      本文依托于所在實驗室提出的私有云瀏覽器“彩云閣”,在這里每個個體都擁有自己的Cyber-Anima模型[22],本文將其應用到酒店推薦領域,提取出與酒店選擇相關的用戶特征,形成人性化酒店用戶模型。綜合用戶特征與酒店特征匹配結果和協(xié)同過濾方法所得結果,可得酒店推薦候選集。如圖1所示。

      圖1 整體架構

      3.2 酒店模型

      針對酒店可量化的參數(shù),如星級、房型、房價、設施、設備、服務等,進行歸一化處理,可得酒店特征參數(shù)表,如表7所示。

      表7 酒店特征參數(shù)

      酒店特征矩陣如下所示:

      H(f)=(H11,H12,…,H1j,H21,…,H2j,…,Hij)

      (2)

      式中:Hij表示第i家酒店的第j個特征。兩個酒店間相關性可通過余弦相似度得到,如下所示:

      (3)

      3.3 用戶模型

      與酒店特征一一對應,結合用戶基本信息、輸入信息及人性化信息可得用戶偏好矩陣U(f),如下所示:

      U(f)=(U1,U2,…,Uj)

      (4)

      式中:Uj表示用戶u對第j個 特征的偏好。

      為了更好地發(fā)掘用戶之間的潛在聯(lián)系,更進一步解決數(shù)據(jù)稀疏性問題,本文采用用戶-用戶矩陣對用戶進行建模,并通過余弦相似度計算它們之間的相似度,如下式所示:

      (5)

      緊接著,用戶u就可以通過n個相似的用戶(u1,u2,…,un)和他們間的相似度(sim_u1,sim_u2,…,sim_un)表示。

      3.4 推薦算法

      將會影響酒店選擇人性化特征引入到用戶建模過程中,得到人性化酒店用戶模型,再通過協(xié)同過濾的思想進行推薦。因此,稱其為基于人性化特征的協(xié)同過濾(Collaborative Filtering Based on Humanized Features),簡稱HF-CF。

      在為酒店和用戶分別建模后,可計算用戶u對酒店i的期望評分pr(u,i),如下式所示:

      pr(u,i)=r(v,j)×sim_u(u,v)×sim_h(i,j)

      (6)

      式中:r(v,j)表示用戶v對酒店j的評分,sim_u(u,v)為用戶u和用戶v之間的相似度,sim_h(i,j)為酒店i和酒店j之間的相似度。

      最后,根據(jù)期望評分可篩選出Top-N家酒店作為推薦候選集。

      4 實 驗

      4.1 評價指標

      本文采用針對推薦方法常用的準確率、召回率和F1-Score三個指標來分析推薦效果[20]。其中,準確率是指被推薦的列表中用戶真正感興趣的項目所占比例,反映了準確推薦的能力;召回率是指用戶感興趣的列表中被推薦項目的所占比例,反映了全面推薦的能力;F1-Score綜合準確率和召回率,反映推薦服務的綜合評價。推薦結果的列聯(lián)表如表8所示。

      表8 列聯(lián)表

      因此,評價指標準確率、召回率、F1-Score可通過以下公式計算:

      (7)

      (8)

      (9)

      以上三大指標的值范圍均0-1,值越大表示推薦效果越好。但準確率和召回率相互影響,一般來說,若要達到高準確率,必須舍棄一些召回率,反之亦然。因此,準確率和召回率需要平衡,即讓F1_Score值達到最佳。

      4.2 實驗平臺及數(shù)據(jù)

      本文以“酒店管理營運博弈沙盤”為實驗平臺,該沙盤是由所在實驗室研發(fā)并已被數(shù)十家酒店管理院校使用的電子學習軟件,旨在幫助學生更形象生動、直觀快速地了解并掌握酒店管理營運知識。根據(jù)用戶需求與偏好分配酒店是該軟件核心功能之一,因此,一個準確高效的建模和推薦方法非常重要。

      沙盤中酒店數(shù)據(jù)和用戶數(shù)據(jù),初期從各大酒店預訂網(wǎng)站歷史訂單、評價中抓取、處理、分析后所得。在投入使用后,不斷地產(chǎn)生新的訂單數(shù)據(jù),且各院校師生會注入當?shù)鼐频陻?shù)據(jù)與自身信息及偏好數(shù)據(jù)。整個數(shù)據(jù)庫可供所有用戶共享,真實性、有效性較高,并不斷更新、維護。

      本文獲取沙盤數(shù)據(jù)庫中1 382條用戶數(shù)據(jù)、967條酒店數(shù)據(jù)和15 377條訂單數(shù)據(jù)進行實驗。

      4.3 基線算法

      個性化推薦系統(tǒng)的推薦算法主要有基于內容的推薦、基于協(xié)同過濾的推薦、基于知識的推薦、基于效用的推薦和混合推薦等[18]。在酒店推薦領域,由于酒店各項指標十分明確,有不少直接使用特征參數(shù)匹配的方法。本文采用特征參數(shù)匹配方法與基于協(xié)同過濾的推薦方法作為基線算法。

      特征參數(shù)匹配方法FM(Features Matching):將服務項特征與用戶偏好進行一一匹配,往往可以達到較高的準確率。但前期服務項數(shù)據(jù)與用戶偏好信息的獲取相當復雜,且數(shù)據(jù)量達到一定范圍時,計算效率急劇下降,擴展性較差。

      基于協(xié)同過濾的推薦方法CF(Collaborative Filtering):主要是通過對未評分項進行評分預測來實現(xiàn),又可分為基于用戶的協(xié)同過濾與基于項目的協(xié)同過濾[15]。它只依賴用戶行為,不需要對內容進行深入了解,適用范圍廣,可以用來推薦復雜項目,能起到意想不到的推薦結果[16]。但前期需要大量的用戶行為數(shù)據(jù),即冷啟動問題[17];且用戶量與項目量常常較為龐大,兩者間存在用戶行為關系的較為有限,即數(shù)據(jù)稀疏問題。本文運用人性化用戶模型,可較好地解決這兩個問題。

      4.4 實驗結果與分析

      通過相關數(shù)據(jù)采集、處理,酒店建模,用戶建模,基于協(xié)同過濾計算,可得出推薦結果。其中,用戶模型中用n個相似用戶及相似度表示用戶u。當用戶模型參數(shù)n取不同值時,推薦效果如表9所示。

      表9 用戶模型參數(shù)n不同時推薦效果

      當n小于或等于6時,隨著數(shù)值增大,各項指標都逐漸升高;n大于6后,各項指標上升空間極為有限。結合推薦效率,取n為6時的推薦效果與基線算法對比。根據(jù)三大指標統(tǒng)計結果如表10所示。

      表10 實驗結果比較

      可以看出,本文提出的方法整體推薦效果良好,召回率和F1-Score值均比兩種基線算法的高。盡管準確率相比特征參數(shù)匹配方法較低一點,但可擴展性和推薦效率更為客觀。

      5 結 語

      本文分析了現(xiàn)有酒店推薦系統(tǒng)的現(xiàn)狀,其主要缺點在于只對用戶表象信息進行提取,缺乏全方面深入挖掘用戶的人性化特征,如知識、性格、觀念等。因此,本文提出一種基于人性化特征的酒店推薦方法,更加精準地分析用戶的真實意圖,提高個性化推薦的效果。以基于協(xié)同過濾的推薦算法作為基線算法,結合用戶人性化特征,計算出推薦結果,并通過實驗驗證了該方法的可行性和有效性。

      接下來仍有諸多工作需要繼續(xù),更多與酒店相關的業(yè)務知識和市場情況有待深入學習并分析,讓研究更符合現(xiàn)實;更多人性化特征需要不斷探索發(fā)掘,來完善人性化用戶模型,讓推理和推薦邏輯更嚴謹;此外,可引入更先進的推薦算法,提高準確率和推薦效率。

      猜你喜歡
      人性化準確率協(xié)同
      乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
      健康之家(2021年19期)2021-05-23 11:17:39
      不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
      2015—2017 年寧夏各天氣預報參考產(chǎn)品質量檢驗分析
      蜀道難:車與路的協(xié)同進化
      科學大眾(2020年23期)2021-01-18 03:09:08
      人性化
      幽默大師(2019年6期)2019-06-06 08:41:38
      “四化”協(xié)同才有出路
      汽車觀察(2019年2期)2019-03-15 06:00:50
      高速公路車牌識別標識站準確率驗證法
      加入人性化考量令體驗更佳 TDG Audio IWLCR-66 & IWS-210
      三醫(yī)聯(lián)動 協(xié)同創(chuàng)新
      “扶不扶”的人性化選擇
      公民與法治(2016年2期)2016-05-17 04:08:33
      六枝特区| 上杭县| 万宁市| 汝南县| 抚远县| 昌江| 通州区| 旅游| 栾城县| 长丰县| 玛纳斯县| 天峻县| 耒阳市| 肃南| 吐鲁番市| 文昌市| 忻城县| 河曲县| 安化县| 新沂市| 固镇县| 汉阴县| 岱山县| 黎平县| 锡林浩特市| 大宁县| 临夏县| 留坝县| 桑日县| 龙南县| 手机| 德江县| 阳春市| 双鸭山市| 永年县| 含山县| 灵武市| 慈利县| 磴口县| 边坝县| 那曲县|