• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于時間權重因子的隱私保護推薦算法

      2022-09-02 04:22:58王永王利冉珣肖玲
      湖南大學學報(自然科學版) 2022年8期
      關鍵詞:復雜度差分權重

      王永,王利,冉珣,肖玲

      (重慶郵電大學電子商務與現代物流重點實驗室,重慶 400065)

      隨著網絡中數據的爆炸式增長,用戶有效獲取有用信息的難度日益增加.推薦算法結合用戶的歷史數據準確挖掘用戶的真實意圖,提供精準的個性化推薦服務[1],能幫助用戶更快獲得有用的信息.然而,個性化推薦需要利用大量個人信息,存在隱私泄露風險[2-3].因此,設計考慮隱私保護的推薦算法是非常必要的.

      近年來,將差分隱私技術應用到推薦領域取得了良好的進展,其中一類典型的處理方式是將隱私保護技術與鄰居型協(xié)同過濾算法相結合.Zhu等人[4]運用指數機制對鄰居選擇過程進行擾動,減小攻擊者推測用戶和項目相似性的概率,防止攻擊者通過鄰居信息推測用戶評分數據.Yang 等[5]針對用戶上下文興趣建模時的隱私保護問題,在計算用戶平均分和相似度時進行差分隱私保護,并利用聚類算法解決數據稀疏問題.Mcsherry等人[6]將推薦算法分為學習階段和預測階段,在學習階段引入噪聲實現對項目相似度矩陣的保護.Yang 等人[7]根據用戶隱私需求特點,將用戶隱私需求分為3 種不同層次,在計算相似度時,對不同層次隱私需求的用戶采用不同強度的拉普拉斯噪聲進行擾動,實現個性化差分隱私保護.此類基于鄰居選擇的隱私保護推薦算法具有良好的可解釋性以及推薦性能.然而,該類算法存在高維數據稀疏性問題及可拓展性問題.在歷史數據較少時,推薦質量不高.

      基于矩陣因式分解的推薦算法是另一類主流推薦算法,具有準確度高、拓展性好、靈活度高等特點.通過將高維稀疏矩陣分解為兩個低維特征矩陣,能有效解決數據稀疏性問題,具有良好的應用前景.針對該類算法,Zhang 等人[8]根據用戶自身的特點,設計了一種特殊的評分數據采樣機制,實現個性化差分隱私保護.鮮征征等人[9]致力于將SVD++模型與差分隱私機制相結合,分別從梯度擾動、目標函數擾動、輸出結果擾動提出基于差分隱私機制和SVD++結合的模型.鄭劍等[10]提出一種融合標簽相似度的差分隱私矩陣分解推薦模型,可以同時保護標簽數據和用戶評分.為減少噪聲的引入,Zhang 等人[11]設計一種新的目標函數擾動方式,并通過聯(lián)合學習得到差分隱私分解矩陣.

      然而,現有的隱私保護推薦算法大多是基于靜態(tài)數據進行設計的.現實中,用戶興趣是一個動態(tài)變化的過程[12-13].用戶興趣變化導致評分數據的重要程度變化,進而使隱私需求相應發(fā)生變化.上述算法對推薦系統(tǒng)進行隱私保護時忽略隱私需求的變化,容易引入不必要的噪聲,降低數據效用,進而導致推薦質量降低.為解決上述問題,本文從用戶興趣漂移的行為數據出發(fā),將時間因素作為度量隱私保護程度的關鍵點,提出一種基于時間權重因子的隱私保護推薦算法.設計時間權重因子刻畫數據對用戶的重要性,對不同時間段的數據根據其重要性進行不同強度的隱私保護.所提出的算法旨在充分保障用戶隱私安全的條件下,有效提升數據的有效性,進而提升推薦質量.

      1 預備知識

      1.1 概率矩陣分解

      概率矩陣分解(Probability Matrix Factorization,PMF)算法作為推薦系統(tǒng)的主流算法之一,在稀疏度高的評分矩陣中表現出良好的推薦精確度[14].相關評分矩陣R的條件分布如下:

      式中:ui、vj分別為K維的用戶因子向量和項目因子向量;Iij為指示函數,當用戶i評論過項目j時,Iij=1,否則Iij=0;N(Ri,j|μ)是服從高斯分布的概率密度函數,其均值為μ,方差為

      當U、V均為μ=0的高斯球面先驗分布時,U、V的概率密度函數分布分別為:

      對式(2)的后驗分布取對數進行分析,計算公式如下:

      式中:C為常量值.求解以式(3)為目標函數的最大化問題,就能訓練出用戶因子矩陣U和項目因子矩陣V,然后根據U和V進行預測評分,并根據預測結果為用戶提供推薦服務.以上問題可以轉換為求解如下最小化問題:

      式中:λu>0,λv>0 為正則化參數;‖ · ‖2為歐幾里得范數;rij表示用戶i對項目j的評分;每個用戶因子向量ui∈U滿足

      1.2 差分隱私

      差分隱私是當前主流的隱私保護技術,本文所涉及的重要相關概念如下:

      定義1ε-差分隱私[15]:D和D′為相差一條記錄的鄰居數據集.給定隨機算法A,當A在數據集D和D′上的任意輸出結果O[O∈Range(A)]滿足式(5),則稱算法A滿足ε-差分隱私.

      式中:Pr [·]表示事件發(fā)生的概率;ε為隱私預算.

      定義2ρ-個性化差分隱私[16]:設隨機算法A:D→Range(A),并且用戶-項目評分的隱私預算矩陣ρ=[εij]N×M.如果算法滿足式(6),稱隨機算法A滿足ρ-個性化差分隱私.

      式中:εij表示rij的個性化隱私預算.

      2 應用場景

      本研究的應用場景為集中式推薦系統(tǒng),采用PMF 算法為推薦模型.系統(tǒng)被認為是可靠和可信賴的,這類系統(tǒng)通過收集并利用用戶評分數據進行模型訓練,為用戶提供個性化推薦服務.然而,用戶評分不僅直接反映其興趣偏好,還隱含用戶的性別、年齡、收入水平等信息,用戶的評分信息如果被他人獲取,則個人隱私泄露風險增加.因此,推薦系統(tǒng)應當著力于保障系統(tǒng)中用戶評分信息的安全.

      文獻[11]表明,一個具有隱私保護的推薦系統(tǒng)應該確保攻擊者不能學習用戶因子矩陣U和項目因子矩陣V,否則,系統(tǒng)任何評分數據都可以由兩個因子矩陣內積UT·V推導出來.為了抵御這種攻擊,推薦系統(tǒng)需要保密儲存U,只發(fā)布V.此外,發(fā)布V有助于解決項目評分數據不足問題.例如,不同的推薦系統(tǒng),擁有相似的項目集,但用戶群不同.通過與其他推薦系統(tǒng)共享V,推薦者可以使用本地用戶信息進一步訓練V.這樣,推薦系統(tǒng)就可以利用多個來自其他系統(tǒng)的數據進行模型訓練,有效實現信息共享,緩解信息不足的問題,改進推薦系統(tǒng)的性能.

      然而,項目因子矩陣V包含用戶信息,直接發(fā)布真實的V依然會帶來隱私問題.假設攻擊者擁有除用戶評分rab之外的其他所有用戶的評分數據和真實的V.攻擊者想要獲得rab.可以采用以下兩種典型的攻擊方式:

      1)相似性攻擊[4]:項目因子矩陣揭示了項目評分之間的相似性,可以幫助攻擊者預測用戶信息.攻擊者通過做一些關于未知評分rab的假設及觀察vb和vi,i∈{x|x∈I}之間相似性的變化,推斷出實際的rab.

      2)重構攻擊[17]:根據真實項目因子矩陣V,攻擊者只需要求解如下問題就能夠得到用戶a的信息ua:

      為了抵御這兩種攻擊方式,對推薦系統(tǒng)進行如下處理:首先,推薦系統(tǒng)訓練不加擾動的推薦模型,得到U并將其保密儲存.隨后,將用戶因子矩陣U作為常數,訓練滿足差分隱私的推薦模型得到并發(fā)布擾動后的項目因子矩陣擾動后的可以防止攻擊者通過獲取任意兩個項目因子之間的精確距離,能夠對相似性進行有效保護.也可以防止攻擊者獲得準確的項目因子矩陣以抵御重構攻擊.此外,其他推薦系統(tǒng)仍然可以利用訓練自己的模型,提高推薦質量.

      綜上所述,在本文方案中,為保護用戶的評分信息,用戶因子矩陣U和項目因子矩陣V均需要進行保護.其中,U通過在可信系統(tǒng)內部以保密儲存的方式進行保護,V通過引入差分隱私以添加噪聲的方式進行保護.

      3 基于時間權重因子的隱私保護推薦算法

      當前大多數隱私保護推薦算法對評分數據進行隱私保護時沒有考慮時間的影響,將所有時間段的評分數據視為同等重要程度.然而,時間因素對推薦系統(tǒng)有著重要的影響,且具有很好的研究價值.費洪曉等[18]運用時間窗口調整用戶興趣漂移帶來的影響;Pan等[19]提出時間距離越近的信息在推薦時更加受重視;Jiang 等[20]將時間權重信息應用到用戶評分數上,削弱用戶過去興趣,突出現在的興趣;蘭燕等[21]認為用戶具有興趣漂移的特性,即用戶興趣是變化的,且信息的影響力隨時間階段性衰減;Chen等[22]認為發(fā)生在不同時間的信息對表示用戶當前興趣的貢獻值是不一樣的,并引入4 種遺忘曲線以更好地把握用戶近期的興趣.上述研究表明,用戶興趣偏好會隨著時間變化,發(fā)生時間不同的評分數據對用戶重要程度存在差異,近期數據更能反映用戶當下的興趣偏好,更為重要.對所有時間段的數據采用相同程度的隱私保護,容易引入不必要的噪聲,降低推薦算法的性能.因此,有必要考慮時間的影響,對不同時間段的評分數據施加不同強度的隱私保護.從而達到在保障用戶隱私安全的前提下,不降低數據的有效性,提升推薦的準確度.

      為了論述方便,相關符號說明如表1所示.

      表1 符號說明Tab.1 Description of symbol

      本文設計了基于時間權重因子的隱私保護推薦方案,總體步驟如下:

      步驟1根據3.1 節(jié)的算法1 計算時間權重因子和評分的隱私預算;

      步驟2利用步驟1得到的隱私預算,根據3.2節(jié)的算法2對評分數據進行抽樣,得到抽樣數據集Ds;

      步驟3利用抽樣數據集Ds,根據3.3 節(jié)的算法3,生成具有差分隱私保護作用的PMF模型.

      本文方案對應的整體框架如圖1所示.

      圖1 方案框架Fig.1 The framework of the proposed scheme

      3.1 考慮時間權重因子的隱私預算

      時間對興趣點具有深遠和廣泛的影響.首先用戶興趣會因自身成長、階段性角色的轉變等而發(fā)生變化.其次,項目本身也具有時效性,如項目的流行性、生命周期等.興趣點的改變導致評分數據對推薦系統(tǒng)的重要程度存在差異.因此,引入時間權重因子用于調節(jié)信息價值在時間變化中的衰減情況.時間權重因子的設計主要考慮兩個因素:評分重要性的半衰期T0[23],即評分從發(fā)布到其重要性減半所需要的時間;評分重要性的保持期T1[21],即評分重要性基本維持不變的時長.根據以上兩個概念,構建時間權重因子F(tij)為:

      式中:tnow為計算推薦結果的時間;tij為評分rij發(fā)生的時間;floor()為階梯函數.權重因子F(tij)隨(tnow-tij)的增大而減小,表示評分發(fā)生的時間越長,用戶興趣越可能發(fā)生改變,重要程度越小.

      時間權重因子表示評分的重要程度.時間權重因子越大,評分重要程度越高,應采用較高的隱私保護強度.當時間權重因子低于所設置的閾值時,表明評分信息的重要程度下降,應降低其隱私保護強度以減少噪聲的引入.通過該方式對評分數據進行隱私保護更加符合實際情況,能夠有效提升推薦的準確性.針對每個評分,采用如下隱私預算分配公式:

      式中:ε為統(tǒng)一隱私預算;εij表示評分rij的隱私預算;AVG(F(t))表示時間權重因子閾值.限制隱私預算范圍為:

      隱私預算描述了隱私保護的強弱程度,隱私預算越小,相應的隱私保護強度越高.

      基于上述分析,設計考慮時間權重因子的隱私預算分配算法如算法1所示.

      3.2 評分數據抽樣

      數據中每個評分的隱私預算存在差異,為了根據評分的隱私預算進行不同強度的隱私保護,采用隨機抽樣算法對評分數據進行抽樣.隨機抽樣算法定義如下:

      給定數據集RN×M、算法1 的輸出ρ=[εij]N×M和.以式(10)所定義的概率π(rij,)對R中的評分數據進行隨機抽樣.

      其中rij∈R.未被抽中的評分,將其評分值設為0.

      結合隱私預算的隨機抽樣算法如算法2所示.

      在隨機抽樣算法中,評分數據被分為兩個兩部分:①算法未抽中的評分數據.當評分數據的隱私預算低于所設定閾值時,有一定概率不被抽中.未被抽中的數據被設置為0,直接不參與推薦流程,能夠最大限度保護這些數據.②算法抽中的評分數據Ds.被抽中的數據Ds將作為輸入項,用于3.3節(jié)的模型訓練中,實現具有隱私保護的個性化推薦.

      3.3 基于隱私保護的概率矩陣分解模型

      為了實現PMF 模型與隱私保護的結合,采用對目標函數添加擾動的方式.擾動后的目標函數如下:

      在模型訓練中,首先,用交替最小二乘法求解式(4)所示的不加擾動的PMF目標函數.

      1)固定U,對式(4)的vj求偏導?E(U,V)∕?vj=0,得到求解vj的公式:

      2)固定V,對式(4)的ui求偏導?E(U,V)∕?ui=0,得到求解ui的公式:

      迭代上述過程,直到收斂,得到用戶因子矩陣U.隨后,將U作為常數,代入式(11),求解擾動后的PMF 目標函數,即對式(11)的求偏導?E(U,V)∕=0,得到求解的公式:

      迭代上述過程至收斂,得到擾動后的項目因子矩陣.

      上述求解過程如算法3所示.

      為了防止攻擊者通過發(fā)布的信息來預測用戶偏好,將用戶因子矩陣U進行保密儲存,只發(fā)布擾動后的項目因子矩陣.推薦系統(tǒng)利用自身保密存儲的用戶因子矩陣U和發(fā)布的項目因子矩陣,可以預測用戶對項目的評分,并據此提供個性化推薦服務.

      4 算法分析

      4.1 安全性分析

      引理1[8]對概率矩陣分解模型的目標函數添加擾動的方式如下:

      引理2[8]令R表示評分數據集,ρ表示用戶隱私預算矩陣.抽樣算法RS(R,ρ,t)以式(13)所示的概率π(rij,t) 對原始數據集R進行隨機抽樣.將RS(R,ρ,t)抽樣后的數據作為輸入集,訓練任意滿足t-差分隱私的推薦模型,則所得的模型滿足ρ-個性化差分隱私.

      式中:t是一個可調整的值.

      定理1本文提出的基于時間權重因子的隱私保護推薦方案滿足ρ-個性化差分隱私.

      證明本文方案包括算法1、算法2、算法3,分別對這3種算法進行分析,證明本文方案的安全性.

      根據隨機抽樣算法式(10),對π(rpq,)分情況進行討論:

      證畢

      4.2 復雜度分析

      在本文算法中,算法1 是對原始評分矩陣進行遍歷,時間復雜度為O(NM).類似地,算法2 時間復雜度為O(NM).算法3 時間開銷與其梯度下降更新公式相關,其時間復雜度為O(ωN)或O(ωM).則本文算法的整體時間復雜度為O[N(M+ω)]或者O[M(N+ω)].同理,算法1 和算法2 的空間復雜度均為O(NM);算法3 的空間復雜度為O(NK)或者O(KM).由于K<<(M或N),故算法的整體空間復雜度近似于O(NM).綜上所述,本文算法的時間和空間復雜度均與數據數量呈正線性關系,應用于大規(guī)模數據運算時復雜度不會顯著增加.

      5 實驗結果及分析

      實驗采用推薦系統(tǒng)領域常用的Movielens-100k、Movielens-1M、Epinions、Movielens-10M、Amazon-Books 5 個數據集對算法性能進行分析.Movielens-10M、Amazon-Books 數據集用于測試算法在大規(guī)模數據集上的性能.數據集包含的統(tǒng)計信息如表2所示.

      表2 數據集的統(tǒng)計信息Tab.2 Statistics for the dataset

      實驗的訓練集與測試集比例為4∶1,評價指標為均方根誤差(RMSE).實驗中默認參數設置為:隱因子維度K=5,迭代次數ω=50,正則化參數λu=λv=1.為保證結果的有效性,對每個算法進行5 次實驗,取均值作為實驗結果.所有實驗均基于Python實現,使用PC 機執(zhí)行,操作系統(tǒng)為Windows 10 64b,CPU 是Intel?CoreTMi7-9700 CPU @ 3.00GHz,RMA是16-GB.

      實驗主要檢驗3 個問題:①時間權重因子對算法準確性的影響;②本文算法預測的準確性;③算法的效率.

      5.1 時間權重因子對算法準確性的影響

      信息重要性衰減曲線如圖2 所示.橫軸表示距離評分的時間,縱軸表示信息重要程度隨時間的衰減情況.

      圖2 信息重要性衰減曲線Fig.2 Information importance decay curve

      由式(8)可知,在時間權重因子曲線中,信息重要性的衰減程度與參數T0與T1相關.本文算法在進行隱私保護時結合了時間權重因子.為實現算法的最佳性能,需要首先確定最優(yōu)的時間權重因子參數.本節(jié)實驗T1分別取20、25、30.為方便對比,本節(jié)實驗只呈現算法中引入時間權重因子的結果.實驗統(tǒng)一隱私預算ε=0.1.實驗結果如圖3所示.

      圖3 時間參數的影響Fig.3 Influence of time parameters

      由圖3 可知,在Movielens、Epinions 與Amazon-Books數據集上,算法的準確性由于時間權重因子參數不同存在差異.在圖3(a)的Movielens-100K 數據集中,當T1=20 時,算法的RMSE 整體更低,預測準確性更高,且當T0為2 時預測精確度最好.此時,算法對T1的改變比較敏感,對T0的改變不敏感.圖3(b)中,RMSE的變化情況與圖3(a)類似,在0.913 62~0.913 82 內波動,在T1=20、T0=6 時推薦效果最優(yōu).由圖3(c)(d)可知,T1=20、T0=4 時算法性能最好.圖4(e)中,RMSE 在T1值不同時差異較大,但在T1值相同時波動較小,在T1=20、T0=2時取得最優(yōu)結果.上述結果差異主要是由于對于相同時間段發(fā)生的評分,其時間權重因子會隨著參數變化而變化,進而隱私保護強度水平不同,最終改變算法的預測準確性.

      5.2 算法性能對比

      為驗證模型的有效性,將本文算法與其他4 種基于矩陣分解的隱私保護算法進行比較.涉及的對比算法有:①基于隨機梯度擾亂的矩陣分解(Private Stochastic Gradient Perturbation,PSGD)算法[24].將差分隱私與矩陣因式分解推薦相結合的典型算法,采用隨機梯度下降法更新因子矩陣,在每次迭代過程中加入拉普拉斯噪聲.②基于一般差分隱私保護的概率矩陣分解(Differentially Private Probabilistic Matrix Factorization,DP-PMF)算法[8].未引入時間權重因子,通過目標擾動法對PMF 的目標函數進行擾動.③基于個性化差分隱私保護的概率矩陣分解(Personalized Differentially Private Probabilistic Matrix Factorization,PDP-PMF)算法[8].將用戶分為不同隱私關注人群并以此劃分隱私預算,根據評分項的隱私預算對原始數據進行隨機抽樣,并對抽樣后的數據采用一般的差分隱私保護方案.④基于交替最小二乘法輸出加擾的矩陣分解(Private Alternating Least Squares,PALS)算法[25].將差分隱私與矩陣因式分解相結合,采用交替最小二乘法更新因子矩陣,并對輸出進行擾動.為合理地進行比較,算法②和算法④均只對項目因子矩陣進行擾動.根據5.1節(jié)實驗結果確定T0和T1,在Movielens-100k、Movielends-1M、Movielens-10M、Epinions、Amazon-Books 數據集上,測試所有算法在不同隱私預算下的RMSE.結果如圖4所示.

      圖4 呈現了不同數據集上所有算法的性能表現.整體上看,隨著ε增加,除本文算法外的其他算法預測精確度提升.這體現出差分隱私的性質,隱私預算越大,數據可用性越強,精度越高.而本文算法對ε的變化并不敏感.本文算法具有這種特性,主要是由于本文算法根據式(9)分配隱私預算時結合了時間權重因子的影響,對單個評分項進行了個性化的隱私保護,ε的增加主要降低部分近期評分隱私保護強度,平均隱私預算變化較小,導致算法的整體性能波動較小.

      圖4 不同算法性能對比Fig.4 Performance for different algorithm

      在不同數據集中,本文算法性能表現均優(yōu)于其他算法.以圖4(b)為例,本文算法RMSE 在隱私預算ε=1 時比其他算法中性能最優(yōu)的算法(PSGD)低0.084.并且,本文算法對隱私不敏感的這種特性使得算法在高隱私保護水平下,準確性優(yōu)勢更加明顯.例如,在ε=0.1 時,本文算法的RMSE 比PSGD 算法低0.58.

      此外,本文算法在大規(guī)模、更稠密的數據集上有更好的效果.例如,在ε=0.1 時,本文算法的RMSE由Movielens-1M 算法的0.975 2 下降到Movielens-10M 算法的0.876 8.其他算法的準確性在相同條件下也有增長,比如PSGD 算法的RMSE 由Movielens-1M 數據集的1.490 下降到Movielens-10M 數據集的1.293.但是,由于其他算法忽略了時間因素的影響,容易引入過量的噪聲,在大規(guī)模數據集上,效果仍然不如本文算法.如在Amazon-Books 數據集上,當ε=0.1 時,本文算法的RMSE 比性能最好的算法(PALS)低0.138.如上所述,本文算法在Movielens-10M 以及Amazon-Books 數據集上的表現驗證了其應用于大規(guī)模數據集上的潛力.

      5.3 效率對比

      為了分析本文算法的效率,對本文算法與PALS、PSGD、DP-PMF、PDP-PMF 算法進行分析,從理論和實驗兩個方面分析時間和計算開銷.

      理論上.由4.2 節(jié)可知,本文算法的時間復雜度為O[N(M+ω)]或者O[M(N+ω)],算法的時間復雜度與用戶和項目數量乘積NM成正比.PSGD、PALS 與DP-PMF 算法按照統(tǒng)一的隱私預算添加噪聲,無須在原算法增加額外步驟,故兩個算法時間復雜度均為O(NM).PDP-PMF 算法在DP-PMF 的基礎上增加了用戶隱私預算分配和評分采樣兩個步驟,增加的計算復雜度為NM,故算法的時間復雜度仍為O(NM).理論分析表明,盡管本文算法增加了時間復雜度O(Nω)或者O(Mω),但與其他算法仍然在同一數量范圍O(kNM)內,k為常數.

      從訓練時間和預測時間進行實驗分析.訓練時間指算法模型訓練完成耗費的時間,可以在用戶使用系統(tǒng)前完成;預測時間指系統(tǒng)推薦預測某個用戶評分耗費的時間,也是用戶等待的時間.實驗開銷對比如表3 所示.隨著數據規(guī)模的增加,所有算法耗費的時間均增多.整體上看,本文算法的時間比PALS和PSGD 要少,主要是因為PALS 和PSGD 算法均對數據進行了預處理,計算了每個用戶和項目的均值.在大規(guī)模數據集上,這種預處理會隨著用戶和項目數量增大耗費更多時間.此外,PALS比PSGD耗費時間多是由于PALS采用交替最小二乘法進行優(yōu)化,增加了對矩陣的求逆步驟.PDP-PMF 和DP-PMF 不需要對數據進行預處理,兩個算法的時間整體上均少于PALS 和PSGD 算法.此外,由于PDP-PMF 算法增加了兩個步驟,耗費時間比DP-PMF 多.而本文算法由于增加了時間權重因子計算步驟和隱私預算分配,本文算法的時間整體上多于PDP-PMF 和DPPMF.

      表3 實驗開銷對比Tab.3 Comparison of experimental costs

      在相同數據集上,與其他算法相比,盡管本文算法增加了計算時間,但整體計算開銷差距并不大.例如,在Movielens-10M 數據集上,本文算法預測時間比DP-PMF 算法多19.92 ms;訓練時間為8 100.90 s,比PSGD的2 200.80 s增加約3.6倍.說明盡管本文算法比其他算法耗費的時間更多,但仍然處于同樣的數量級別.在Movielens-100K 數據集上,本文算法的訓練時間為10.86 s,預測時間為3.96 ms.而在Amazon-Books 數據集上的訓練時間為36 395.39 s,預測時間為202.67 ms.說明算法數據的增加更多的是增加模型訓練的時間,而對用戶偏好的預測時間影響不大.

      6 結論

      本文算法的核心思想是從用戶興趣漂移角度出發(fā),解決現有隱私保護推薦算法忽略時間的影響導致推薦質量下降的問題.通過構建時間權重因子來衡量信息的重要性,并根據重要性對不同時間段的評分數據采用不同強度隱私保護.對推薦系統(tǒng)進行隱私保護時,這種方式能夠減少不必要噪聲的引入.此外,分別從理論和實踐上證明算法可行性.首先從理論角度證明本文算法的安全性,隨后,通過實驗表明,本文算法即使在較強的隱私預算下也能保證良好的預測精度,并且其推薦結果的準確度也比經典的差分隱私推薦算法更高,具有良好的應用前景.

      猜你喜歡
      復雜度差分權重
      數列與差分
      權重常思“浮名輕”
      當代陜西(2020年17期)2020-10-28 08:18:18
      一種低復雜度的慣性/GNSS矢量深組合方法
      為黨督政勤履職 代民行權重擔當
      人大建設(2018年5期)2018-08-16 07:09:00
      基于公約式權重的截短線性分組碼盲識別方法
      電信科學(2017年6期)2017-07-01 15:44:57
      求圖上廣探樹的時間復雜度
      某雷達導51 頭中心控制軟件圈復雜度分析與改進
      出口技術復雜度研究回顧與評述
      基于差分隱私的大數據隱私保護
      相對差分單項測距△DOR
      太空探索(2014年1期)2014-07-10 13:41:50
      武城县| 昌乐县| 奉节县| 民县| 浮梁县| 丹棱县| 盐津县| 米脂县| 灌南县| 额尔古纳市| 巴林右旗| 洞头县| 土默特左旗| 稷山县| 从江县| 夏津县| 策勒县| 凉城县| 南阳市| 祁阳县| 昭平县| 襄垣县| 梁河县| 霍邱县| 育儿| 鹰潭市| 启东市| 墨脱县| 岳普湖县| 东乌珠穆沁旗| 前郭尔| 辽宁省| 龙海市| 从化市| 扎赉特旗| 哈密市| 淮阳县| 内江市| 南雄市| 五河县| 合作市|