• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      面向個性化產(chǎn)品服務方案的推薦方法與應用

      2018-09-08 08:14:44耿秀麗
      中國機械工程 2018年16期
      關(guān)鍵詞:云滴預測方案

      楊 珍 耿秀麗

      上海理工大學管理學院,上海,200093

      0 引言

      目前,企業(yè)市場競爭愈發(fā)激烈,制造型企業(yè)面臨資源利用率、產(chǎn)品同質(zhì)化等挑戰(zhàn),開始注重產(chǎn)品的后市場需求,通過與產(chǎn)品服務結(jié)合來觸發(fā)更多的用戶需求。制造和服務的結(jié)合改變了傳統(tǒng)的企業(yè)運營模式,使得服務不再以產(chǎn)品的附加要素存在,產(chǎn)品服務系統(tǒng)(product service system,PSS)應運而生。PSS系統(tǒng)主要為企業(yè)提供一種“產(chǎn)品+服務”的整體解決方案。方案規(guī)劃作為PSS系統(tǒng)中的重要環(huán)節(jié),與方案設計及選擇都有密切聯(lián)系,因此,在提供服務方案前,需要確定用戶需求,定制出個性化的產(chǎn)品服務方案,并成功地將優(yōu)選的個性化服務方案推薦給合適的用戶,從而提高企業(yè)的核心競爭力。如何高效地給用戶推薦滿意的產(chǎn)品服務方案,與推薦算法性能優(yōu)化息息相關(guān)。

      個性化推薦算法是方案推薦過程中必不可少的技術(shù),主要分為基于協(xié)同過濾、基于內(nèi)容、基于知識、基于關(guān)聯(lián)規(guī)則的算法。其中,最為成功的算法為協(xié)同過濾(collaborative filtering,CF)算法,通過計算用戶行為或偏好的相似性,找到目標用戶的最近鄰及其對應項目進行推薦,但是傳統(tǒng)CF算法對不完整數(shù)據(jù)以及對零歷史記錄的用戶難以給出準確推薦。面對此挑戰(zhàn),人們提出新型CF算法,即隱語義模型(latent factorm odel,LFM)。通過隱類關(guān)聯(lián)用戶和項目,采用矩陣分解技術(shù)建立用戶-隱類、隱類-項目間的關(guān)系矩陣,利用矩陣乘積獲取用戶喜愛的項目并進行推薦。傳統(tǒng)LFM研究側(cè)重于減少數(shù)據(jù)稀疏和解決冷啟動問題,如文獻[1]針對LFM數(shù)據(jù)稀疏的問題,提出基于學習自動機的矩陣優(yōu)化算法代替奇異值矩陣分解方法;文獻[2]為減少數(shù)據(jù)稀疏性,采用基于隱類的似然估計法來優(yōu)化LFM,在用戶不了解相關(guān)知識的前提下,根據(jù)用戶個性化需求定量化預測;文獻[3]針對LFM的冷啟動和稀疏性問題,提出融入用戶屬性的推薦算法,通過分類模型得到其他用戶屬性重要度,結(jié)合用戶評分計算屬性相似度并推薦;文獻[4]針對冷啟動問題,將歷史瀏覽記錄轉(zhuǎn)化為用戶評分,融入基于LFM的相似評分并推薦。上述文獻主要通過改進LFM來解決稀疏性和冷啟動問題,以提高產(chǎn)品服務方案推薦的準確率。實際上,推薦技術(shù)不僅重視結(jié)果的精確性,也注重推薦過程的效率性,而文獻[5?6]就是為提高推薦效率,引入服務方案因子約束的LFM模型,采用一階線性方法擬合服務方案推薦結(jié)果;文獻[7]在此基礎上,采用Hessian工具中的二階求解器獲取產(chǎn)品的高斯逼近矩陣,既提高了推薦精度,又提高了推薦效率;文獻[8]利用主題將潛在因子應用于查找項目關(guān)聯(lián)的文本數(shù)據(jù),建立潛在因素模型,提高用戶查找項目的效率。

      本文基于文獻[4]的推薦方法,引入偏置量,形成加權(quán)LFM。偏置量是由用戶等主觀因素引起的用戶-隱類間的興趣偏差值、隱類-產(chǎn)品服務方案間的評分偏差值。熱門產(chǎn)品服務方案推薦過程往往忽略用戶主觀評分的偏差量,導致推薦結(jié)果未必符合最近鄰目標用戶真正的需求。本文的加權(quán)LFM算法基于矩陣分解技術(shù),根據(jù)用戶興趣特征找出新用戶的最近鄰,無需新用戶對產(chǎn)品服務方案的評分,就可以推薦最近鄰的相應產(chǎn)品服務方案,從而解決用戶冷啟動問題??紤]新用戶和最近鄰用戶興趣特征的差異,求出興趣特征的相似度,作為整個最近鄰用戶興趣值的權(quán)重;通過矩陣P和Q的積,得到用戶偏好服務方案并推薦,改變了以往逐漸查找最近鄰產(chǎn)品服務方案的方式,從而提高推薦效率。但是采用LFM算法推薦前,數(shù)據(jù)稀疏可能會影響推薦結(jié)果。當用戶興趣特征較多時,采用余弦相似度計算出的用戶相似度就會偏高,難以體現(xiàn)用戶間的差異。而云模型可以反映用戶概念的模糊性、不確定性和隨機性,較為完整地刻畫用戶特征。利用生成的用戶云,通過計算云滴距離測度可以間接計算用戶的相似性,從而彌補余弦相似度精度的不足。但是云滴數(shù)據(jù)的生成過程也具有偶然性,單獨應用云距離測度時準確性也受到約束。因此,本文提出采用正向云發(fā)生器求解出云滴,并將云滴距離和用戶-特征間的余弦相似度的加權(quán)綜合值作為新相似度,根據(jù)最近鄰用戶預測評分并填充空缺值,形成完整的數(shù)據(jù)集,從而提高數(shù)據(jù)的推薦精度。實際上,云相似度在個性化推薦技術(shù)中也有廣泛的應用,如文獻[9?11]基于云模型計算用戶偏好的相似性并匹配目標用戶進行推薦;文獻[12]采用基于云的特征相似度計算方法,壓縮數(shù)據(jù),降低維度,節(jié)約存儲空間;文獻[13]采用云相似度的計算方法,結(jié)合反向傳播網(wǎng)絡進行預測。此外,云相似度也會在數(shù)據(jù)聚集過程得到具體應用,如文獻[14]采用基于云相似度和云的距離模型,處理并聚類語言變量,求解出群體偏好值,給出合適決策。因此,本文采用結(jié)合正向云的加權(quán)LFM推薦算法,既能減少數(shù)據(jù)稀疏,又能通過用戶興趣特征相似度解決冷啟動問題,并且能夠通過LFM的矩陣分解技術(shù),獲取合適的推薦產(chǎn)品服務方案,提高推薦效率。

      由于傳統(tǒng)LFM的研究未考慮數(shù)據(jù)庫在動態(tài)更新的過程中,推薦內(nèi)容可能會隨之改變的情況,因此,本文提出采用動態(tài)增量更新機制,在不影響先前數(shù)據(jù)處理工作的前提下,采用差值平均法對預測公式更新產(chǎn)品服務方案推薦結(jié)果,降低時間復雜度。本文針對傳統(tǒng)LFM算法數(shù)據(jù)稀疏、冷啟動、未考慮實時更新等問題,采用云相似度預測填充空缺數(shù)據(jù),彌補稀疏性;采用基于用戶興趣特征的相似度尋找最近鄰用戶,并獲取最近鄰用戶興趣相似度作為用戶興趣特征的權(quán)重,結(jié)合用戶評分差異偏置量,約束主觀評分差異性;通過LFM方法獲取用戶產(chǎn)品服務方案評分并進行推薦;采用差值平均法更新推薦結(jié)果,解決因數(shù)據(jù)庫動態(tài)更新導致推薦結(jié)果變化的問題,力求達到產(chǎn)品服務方案實時推薦的效果。

      1 研究框架

      為提高個性化產(chǎn)品服務方案的推薦效率,針對推薦技術(shù)中的稀疏性、冷啟動以及未考慮實時更新等問題,本文考慮用戶、方案與隱類間的關(guān)系,提出了加權(quán)LFM。首先,基于用戶ui(i=1,2,…,s),方案aj(j=1,2,…,t)及隱類ck(k=1,2,…,n)的數(shù)據(jù)信息,采用正向云發(fā)生器,輸入用戶與隱類、方案與隱類的定性信息,輸出用戶-隱類的興趣度矩陣P、方案-隱類的比重矩陣Q。將用戶-方案評分劃分成P和Q兩朵云,采用云滴距離和余弦相似度的加權(quán)結(jié)果進行預測評分,填充矩陣P和Q的空缺數(shù)據(jù)。然后,考慮評分的偏置量,通過融入偏置量的加權(quán)LFM模型建立用戶-服務方案間的關(guān)系,輸入P、Q矩陣,輸出新用戶對產(chǎn)品服務方案的預測評分并排名,選擇前N項方案予以推薦。其中,新用戶對服務方案的預測評分主要通過如下方式獲得:基于新用戶興趣特征的相似度找出最近鄰用戶,將該相似度作為每個最近鄰的評分權(quán)重,采用加權(quán)LFM方法獲取新用戶對方案的評分。為了深入了解用戶需求,本文在LFM中添加一個成分:方案特征fg(g=1,2,…,e),并與方案構(gòu)成產(chǎn)品服務方案-特征評分矩陣O,可以具體到某一服務方案特征的推薦優(yōu)先性,精準地了解用戶需求。最后,提出差值更新法對新用戶評分數(shù)據(jù)進行實時更新,從而更新產(chǎn)品服務方案推薦。本文框架思路見圖1。

      圖1 本文的框架Fig.1 Fram e d iagram of this paper

      2 基于云模型的數(shù)據(jù)處理

      2.1 云模型相關(guān)概念

      云模型是張光衛(wèi)等[15]提出的處理定性描述和定量概念間不確定性的轉(zhuǎn)換模型,通過結(jié)合自然語言中的模糊隨機性,實現(xiàn)定性語言與定量數(shù)值間的轉(zhuǎn)換,為研究數(shù)據(jù)挖掘的不確定信息處理提供了新方法。為解決個性化推薦的稀疏性問題,本文考慮到產(chǎn)品服務方案評分信息的主觀性和模糊性,提出采用云模型實現(xiàn)定性定量數(shù)據(jù)的轉(zhuǎn)換,通過加權(quán)相似度對稀疏數(shù)據(jù)預測填充。云模型相關(guān)概念定義如下。

      定義1[1]云和云滴 設U是一個用數(shù)值表示的定量論域,C是U上的定性概念。若定量值x∈U是定性概念C上的一次隨機實現(xiàn),x對C的確定度μ(x)∈[0,1]是有穩(wěn)定傾向的隨機數(shù):μ:U →[0,1],?x∈U:x→ μ(x),則x在論域U上的分布稱為云(cloud),記為云C(x);每個x稱為一個云滴(drop)。

      定義2 正向云是將獨立參數(shù)表示為云的數(shù)字特征,描述事務的不確定性。采用參數(shù)期望Ex、熵 En、超熵 He三個特征描述云,即 C(Ex,En,He),當隨機變量x滿足x~N(Ex,E2n)時,其中,En~N(En,H2e),則對定性概念C的確定度滿足μ(x)=

      論域上若干個云滴組成云,云滴對隸屬度函數(shù)的映射是一對多轉(zhuǎn)換的關(guān)系,不同于模糊聚類一對一的轉(zhuǎn)換,云定性概念的整體特征由云滴表現(xiàn)出來。由參數(shù)(Ex,En,He)表示云的數(shù)字特征模型,稱為云模型。云模型的核心處理過程主要分兩種:正向云發(fā)生器和逆向云發(fā)生器,正向云發(fā)生器主要將定性描述的整體向量C(Ex,En,He)轉(zhuǎn)換為描述個體定量數(shù)值的云滴,逆向云算法主要將定量數(shù)據(jù)轉(zhuǎn)換為云滴(x,μ(x))。針對項目評分稀疏性,以及用戶評分主觀性問題,提出采用正向云算法,將定性評分轉(zhuǎn)換為云滴,并利用云滴距離以及特征向量的加權(quán)相似度來預測未知評分,提高推薦精度。以云(0.5,0.05,0.01)的3個特征值及N=1 000為輸入值,通過正向云發(fā)生器輸出云圖,見圖2。

      圖2 正向發(fā)生器輸出的云圖Fig.2 C loud drop model

      其中,期望Ex表示云滴在論域空間分布的期望值,即最能代表定性概念的點;熵En表示定性概念的不確定量,反映云的離散程度;超熵He是熵的不確定概念,可以描述云的厚度。

      2.2 基于改進的正向云模型對稀疏數(shù)據(jù)填充

      本文利用云模型的隨機模糊性,將用戶對產(chǎn)品服務方案主觀評分轉(zhuǎn)化為云滴,利用云滴距離和余弦相似的綜合相似度對用戶興趣度矩陣P、方案評分矩陣Q預測填補空缺數(shù)據(jù)。假設云向量C(Ex,En,He)表現(xiàn)為用戶特征興趣值,即 Ex是用戶對隱類的評分均值,En、He對應評分值的熵、超熵。通過引入云的綜合相似度預測評分,填充用戶評分或隱類中方案比重的缺失數(shù)據(jù)。用戶選擇方案時,會選擇高熱搜度、推薦次數(shù)多的方案而忘記本身個性偏好,導致所獲取的方案并沒有實際用處。很多推薦算法對此引入罰函數(shù)來減弱外界影響因素,本文考慮用戶興趣多樣性的影響,基于隨機性的云滴距離來減輕用戶偏好的影響,采用正向云發(fā)生器將云的特征值((Ex,En,He)轉(zhuǎn)換為離散的云滴Drop(xc,μ(xc)),具體特征指標的計算方式如下:

      式(1)~式(3)將定性描述轉(zhuǎn)換為云的特征指標,本文采用正向云算法將特征指標轉(zhuǎn)換為云滴,輸入為表示定性概念的三個特征值(Ex,En,He),輸出為云滴Drop(x1,μ(x1)),Drop(x2,μ(x2)),…,Drop(xN,μ(xN)),xc為處理后的評分值。具體過程如下:①生成以En為期望值、He為方差的一個正向隨機數(shù)E′n=N(En,He);②生成以Ex為期望值、E′n為方差的一個正向隨機數(shù)x=N(Ex,E′n);③計算μ(xc)=將帶有確定度μ(xc)的xc稱為數(shù)域中的一個云滴;重復步驟①~③,直到產(chǎn)生要求的N個云滴(xc,μ(xc)),c=1,2,…,N。

      其中,N(Ex,)為生成以Ex為期望值、為方差的正向隨機數(shù)函數(shù)。給定云的3個數(shù)字特征值(Ex,En,He)。上述算法可以生成任意云滴組成的正向云,比如用戶u和用戶v的特征向量Cu=(Exs,Ens,Hes),Cv=(Ext,Ent,Het)。用戶間的相似度可以用余弦相似度、皮爾森相似度、云距離測度等求解,考慮到余弦相似度局限于向量個體間的關(guān)系,忽略個體差異值的影響。皮爾森相似度實際上是數(shù)據(jù)中心化的余弦相似度,并不能針對離散的、差異大的數(shù)據(jù)點求解合適的相似度。云距離測度可以求解離散數(shù)據(jù)的相似度,但是忽略了核心用戶的相似特征關(guān)系。因此,本文針對用戶興趣差異性問題,結(jié)合基于實際用戶特征數(shù)據(jù)的余弦相似度和基于生成用戶云滴數(shù)據(jù)的云滴距離測度,來計算最終的用戶相似度,具體計算方式如下:

      其中,simc(u,v)是用戶u和v評分向量的余弦相似度,simd(u,v)是用戶u和v評分映射的云滴距離測度,sim(u,v)是由設定的權(quán)值α對simc(u,v)和simd(u,v)的加權(quán)綜合相似度。ru,c為用戶u對c的評分,rv,c為用戶v對c的評分,-ru是用戶u對所有共同評分產(chǎn)品服務方案的評分均值,-rv是用戶v對所有共同評分隱類的評分均值,Spred表示預測評分。本文通過正向云發(fā)生器獲取云滴距離并與云的特征余弦相似度加權(quán)求和,來預測填充稀缺數(shù)據(jù),提高個性化推薦的準確率。同理,產(chǎn)品服務方案對特征因子f的評估值為rac,其計算方式類似于用戶-隱類評分過程。例如,兩朵云的特征向量 Cu=(0.5,0.05,0.01),Cv=(0.6,0.055,0.033),利用正向云發(fā)生器擬合出兩者的云圖,見圖3。

      圖3 云模型Fig.3 Cloud m odel

      由圖3可知,兩朵云間距雖小,但Cu跨度小,離散程度低;而Cv跨度大,離散程度高。針對云滴距離的不確定性,本文采用云滴距離測度來預測并填充缺失數(shù)據(jù)有失準確度。引入特征向量間相似度以增加約束量并與距離相似度加權(quán)集合,以增加預測的準確度。如果某個用戶數(shù)據(jù)有所缺失,可以利用該用戶其他完整數(shù)據(jù)找出高相似性最近鄰,進行預測填充,得到完整的用戶數(shù)據(jù)。

      3 基于改進LFM的個性化實時推薦

      基于云模型處理后的用戶數(shù)據(jù),本文采用加權(quán)偏置量的加權(quán)LFM進行預測,即通過新用戶的興趣值來預測產(chǎn)品服務方案評分,并采用加權(quán)法優(yōu)化預測評分結(jié)果。與其他推薦模型進行比較,以證明本文算法推薦方案的精度。

      3.1 基于偏置量的LFM處理數(shù)據(jù)過程

      LFM是奇異值分解矩陣的改進算法,算法基于用戶項目間的隱含特征建立矩陣R。矩陣R的元素ruj表示用戶u對產(chǎn)品服務方案j的興趣度,本文通過計算并排序興趣度,給予產(chǎn)品服務方案推薦。LFM算法從數(shù)據(jù)集中提取出若干個主題,用于連接用戶和方案,R表示成矩陣P與矩陣Q的乘積。P是用戶-類矩陣,其元素pu,c表示用戶u對類c的興趣度;Q是方案-類矩陣,其元素qa,c表示方案a在類c中的權(quán)重,比重越高,越可能作為該類的代表。因此,需獲取P和Q中的元素值,即可得到u對產(chǎn)品服務方案a的預測評分,采用Top?N排序并推薦。pu是由pu,c組成的用戶-類向量集,即;qa是由qa,c組成的產(chǎn)品服務方案-類向量集,即預測評分=pu·。

      LFM是基于改進奇異值矩陣分解模型提出的,由于奇異值分解模型在處理稀疏數(shù)據(jù)時,子模型分解過程會增加運算成本,且不準確填充可能會導致數(shù)據(jù)推薦結(jié)果有誤差,故人們考慮采用基于梯度下降的LFM,構(gòu)建誤差最小化的損失函數(shù)來彌補數(shù)據(jù)稀疏缺陷。事實上,實際應用過程中,產(chǎn)品或服務方案的評價意見并非是單一選項值,用戶興趣及選擇也會有所偏差。例如,品牌類型以及熱度等都會使用戶打出差異明顯的分值。就不同用戶而言,同類型產(chǎn)品評分差距明顯也會導致預測值偏差過大,如熱度高、影響力大的產(chǎn)品容易受到用戶青睞。因此,引入用戶評分偏差量bu及項目打分偏差量ba來改善差異性[7],即

      其中,μ是數(shù)據(jù)庫中所有記錄評分的平均值;N表示所有用戶對項目的評分集數(shù)量[16];bu為用戶評分偏差,即用戶評分過程中和物品無關(guān)的因素。ba是指方案特征差異值,即產(chǎn)品服務方案評分值與用戶特征無關(guān)的因素;bua為考慮偏置量bu、ba后的評分結(jié)果;R(a)是產(chǎn)品服務方案評分總數(shù);R(u)是用戶評分總數(shù);rca為方案a在類中權(quán)重比值;ruc為用戶u對類c的評分值。

      考慮用戶-項目間的偏差值,將μ、bu、ba融入預測分值r^ua中,即

      如果用戶有更精細的產(chǎn)品服務方案需求,就會精確到產(chǎn)品服務方案特征的分析和推薦。本文引入產(chǎn)品服務方案a與特征f組成的類O,Of為方案特征向量集,為最終的方案推薦對應的特征值,預測函數(shù)預測產(chǎn)品服務方案特征評分

      3.2 基于改進LFM的實時推薦及更新過程

      考慮到用戶和產(chǎn)品服務方案相關(guān)數(shù)據(jù)隨時間不斷更新,且新用戶沒有產(chǎn)生相關(guān)歷史行為記錄,難以推薦其所需產(chǎn)品服務方案,若要對新用戶實時推薦產(chǎn)品服務方案,需要基于之前數(shù)據(jù)集進行動態(tài)更新。為提高推薦效率,且考慮到新用戶的冷啟動問題,基于用戶特征相似度推薦產(chǎn)品服務方案來解決該問題??紤]用戶特征多元性,引入用戶對類的興趣相似度wuc:

      其中,puc、pvc分別為用戶u、v對類c的興趣度評分;u分別為用戶u、v對類的評分均值。

      將用戶特征相似度wuc作為預測評分的權(quán)重,再次預測方案評分,通過差值平均法更新預測計算公式,從而降低時間復雜度。預測公式由式(10)變?yōu)?/p>

      當數(shù)據(jù)集更新時,即數(shù)據(jù)庫增加新用戶行為記錄,此時如果對新評分數(shù)據(jù)能夠增量更新,則在不影響前期數(shù)據(jù)工作下,基于Slope算法提出差值增量更新法,在預測評分中引入差值平均值,將新評分值平均到所有預測分值中,計算方式為其中是新用戶對產(chǎn)品服務方案的評分是已有用戶的平均評分,N(u)是新用戶前的用戶總數(shù),wuc是更新數(shù)據(jù)前的用戶特征相似度。對評分差值的權(quán)重進行約束。

      為突出本文算法的優(yōu)勢,通過對比不同算法的推薦效果,采用協(xié)同過濾算法常用的度量指標即平均絕對誤差(mean absolute error,MAE)來度量策略預測的精度。將其用于比較本文推薦算法、基于云模型的推薦算法以及基于梯度的LFM推薦精確度,MAE值越小,表明預測結(jié)果計算誤差越小,推薦精度越高。M AE值計算公式為

      其中,N為評分總數(shù),rua為實際評分,r^ua為預測評分。本文選取誤差最小的預測評分,將用戶pu及對應產(chǎn)品服務方案qi予以推薦。

      4 案例分析

      4.1 個性化產(chǎn)品服務方案推薦過程

      某企業(yè)針對機床再制造的銷售問題,即如何提高產(chǎn)品服務方案的銷售效率,提出采用個性化服務方案給予推薦。通過整理以往顧客購買產(chǎn)品記錄,本文選取10種具有代表性的產(chǎn)品服務方案a1,a2,…,a10,對其進行評估。方案評估指標分為主傳動變速系統(tǒng)(c1),刀架更換系統(tǒng)(c2),安全防護裝置(c3),進給系統(tǒng)(c4),廢舊機床利用率(c5),機床防護系統(tǒng)(c6),節(jié)能環(huán)保方案(c7)。通過問卷調(diào)查,選取其中10位用戶的評分數(shù)據(jù)作為本文的實驗數(shù)據(jù),雖然有隨機性,但是將其作為本文的例證,具有普適性。將新用戶對評估指標的打分高低表示為用戶對機床的興趣程度,用1~6來表示興趣度的程度,即非常不滿意、不滿意、一般、好、滿意、非常滿意,本文的興趣值見表1。

      表1 用戶興趣度Tab.1 User in terest

      若要將產(chǎn)品服務方案推薦給適合的用戶,就需建立用戶與方案間的聯(lián)系,而已有產(chǎn)品服務方案推薦,一般采用基于產(chǎn)品服務方案特征或者用戶特征的推薦算法予以推薦。本文采用LFM,將產(chǎn)品指標作為隱類,建立用戶與服務方案間的關(guān)系,即建立用戶-類表和類-方案比重表。由于用戶對方案的偏好不同,表現(xiàn)為對方案指標的喜愛程度,所以根據(jù)方案推薦的歷史數(shù)據(jù),得出10種方案指標評估比重矩陣,見表2。

      表2 機床產(chǎn)品服務方案比重Tab.2 Program p roportion ofm achine p roduct service

      為了更精準地給用戶推薦方案,如具體到方案某一性能特征,可以參照表3和表4。機床服務方案特征包括:床身(f1),主軸箱(f2),自動回轉(zhuǎn)刀

      表3 產(chǎn)品服務方案特征Tab.3 Program features of p roduct service

      架(f3),壓力控制閥(f4),環(huán)保節(jié)能(f5),進給傳動(f6),安全性能(f7),動力元件(f8)。根據(jù)專家的語義評估,將各個產(chǎn)品服務方案屬性值定量化轉(zhuǎn)換,分別用1~4表示特征較差、中、較好、好四個等級,具體指標以及等級見表3,每個方案對應方案特征指標值見表4。

      表4 產(chǎn)品服務方案特征數(shù)據(jù)Tab.4 Product service solution feature data values

      隨著用戶購買量的增加,評分數(shù)據(jù)量也在增加,此時就會面臨有些用戶不愿對已購買產(chǎn)品打分等情況,產(chǎn)生稀疏數(shù)據(jù)。面對此挑戰(zhàn),已有學者通過梯度算法改進LFM,使得預測評分偏差最低??紤]梯度算法未填充數(shù)據(jù),因此直接通過近似下降法搜索相似最近鄰進行預測填充來避開稀疏數(shù)據(jù)的影響,仍會有誤差存在。本文提出采用云相似度預測空缺數(shù)據(jù)的評分以彌補數(shù)據(jù)稀疏性,形成完整數(shù)據(jù)。如以表2填充數(shù)據(jù)為例,找出某類稀疏數(shù)據(jù)的最近鄰,采用加權(quán)云相似度進行預測。本文先計算方案-興趣特征類的評分的相似度,通過刪掉缺失數(shù)據(jù)對應類的同樣數(shù)據(jù),再計算相似度,如類c1和類c2間的相似性是在去除產(chǎn)品服務方案a3的基礎上根據(jù)式(6)求解,再通過式(7)求解預測分值,以此類推,根據(jù)式(4)求解余弦相似度,具體見表5、表6。由上述求解的余弦相似度可知,云相似度都很高,難以選取最優(yōu)值,故本文采取云滴間距離進行約束,以c1、c4、c7的云圖為例,見圖4、圖5。

      表5 方案-興趣特征向量Tab.5 Schem e-in terest featu re vector

      表6 興趣特征類的余弦相似度Tab.6 Cosine sim ilarity of interest feature class

      圖4 c1和c7的云圖關(guān)系Fig.4 C loud relations of c1 and c7

      圖5 c4和c7的云圖關(guān)系Fig.5 Cloud relations of c4 and c7

      由圖4和圖5可知,即使c1、c4、c7間余弦相似度很高,但在云圖中明顯看出,c1和c7的距離分散太多,云厚度小,離散性高,而c4云圖緊密性好,這也驗證了余弦相似性的不精確性,因此,引入式(5)計算云滴間距離相似度,結(jié)果見表7,并與表6余弦相似度加權(quán)求和,找出最優(yōu)解。

      將表6和表7中對應相似度加權(quán)求和,設置不同的α值,記錄下α分別為0.3、0.5、0.7時根據(jù)式(6)求解加權(quán)相似度的結(jié)果。由圖4和圖5可知,相對于余弦高相似度,云滴數(shù)據(jù)的生成過程也具有偶然性,單獨應用云距離測度準確性也受到約束,但當用戶興趣特征較多時,計算出的余弦相似度就會偏高,難以體現(xiàn)用戶間的差異。因此,本文結(jié)合基于實際用戶特征數(shù)據(jù)的余弦相似度和基于生成用戶云滴數(shù)據(jù)的云滴距離測度,來計算最終的用戶相似度。本方法避免了單一采用余弦相似或云距離測度的缺陷。所以本文根據(jù)α值的變化趨勢,選取α=0.3時的加權(quán)相似值,并選取高相似的特征類最近鄰,采用式(6)計算方式給予預測填充數(shù)據(jù)。表2彌補后的數(shù)據(jù)見表8,其中,加粗的數(shù)字是預測填充后得到的數(shù)據(jù)。同理,其他稀疏矩陣的稀疏數(shù)據(jù)的彌補過程亦如此。

      考慮數(shù)據(jù)評分因人而異,尤其對于機床的資深研究者,會對機床性能的評分比較苛刻,導致評分數(shù)據(jù)發(fā)生偏差,引入基于偏差量的LFM預測評分,具體計算公式為r^ua=pu·qTa。將表1中用戶對類ck的評分作為p,表8中填充后的機床方案比重值作為q,得出乘積即用戶對方案的評分。以表1中的u1對c1的評分向量p1=(2,4,1,2,5,6,3)與c1對a的比值向量q1=(0.835,0.452,0.513,0.391,0.412,0.093,0.121)T為例,將 p1和 q1相乘得到用戶對方案a1的評分為7.753,依此類推,Rua=puc·qca,其中,puc為表1形成的用戶-類矩陣,qca為表8形成的類-方案矩陣,Rua為用戶-方案矩陣。計算結(jié)果見表9。

      表8 機床產(chǎn)品服務方案填充后的完整值Tab.8 Com p lete value ofm achine tool product service p rogram after filling

      表9 用戶對產(chǎn)品服務方案的評分Tab.9 User ratings of product service solutions

      由表9可知,以用戶u1為例,方案評分由高到低為 a9、a10、a8、a7、a6、a2、a5、a4、a3、a1,方案 a9是用戶u1的最佳首選服務方案,對照表3、表4,可以得出方案9的機床具有以下特征:水平床身,直流數(shù)字化的主軸箱,回轉(zhuǎn)刀架,減壓閥,切削回收盤,閉環(huán),敞開式,齒輪泵。

      當該企業(yè)出現(xiàn)購買機床的新用戶時,由于用戶對機床性能認知不夠,但根據(jù)問卷調(diào)查得到其對機床性能ck興趣度,預測其最近鄰以及相應的推薦產(chǎn)品服務方案,新用戶vx(x=1,2,3)的興趣度分值見表10,根據(jù)余弦相似度求出用戶相似最近鄰見表11。

      表10 新用戶興趣度值Tab.10 Interest value of new user

      表11 新用戶與舊用戶興趣相似度Tab.11 Sim ilar interestsbetween new usersand old users

      由表 11 可知,新用戶 v1和 u1,v2和 u5,v3和 u10有高相似的興趣度,對于完全未了解或零購買記錄的用戶,采用基于用戶特征改進的推薦算法,如式(12)的計算方式,得到興趣度權(quán)重見表12。

      由表10和表1可得出用戶偏置量bv1=-0.428 56,bv2=0.428 586,bv3=-0.142 84,根據(jù)式(10)和式(13)計算找出最近鄰用戶并推薦高相似的產(chǎn)品服務方案,結(jié)果見表13。

      表12 高相似用戶的興趣度權(quán)重Tab.12 Interestweight of high sim ilar user

      表13 新用戶產(chǎn)品服務方案預測結(jié)果Tab.13 Forecast results of new user p roduct in service solu tions

      由表13可以看出,對于新用戶v1,機床方案優(yōu)先級由高到低依次為 a7、a8、a5、a6、a9、a10、a2、a1、a4、a3,所以給其推薦方案首選是 a7、a8,新用戶 v2推薦 a7、a8等產(chǎn)品服務方案,新用戶 v3推薦 a4、a7。如果具體到產(chǎn)品服務方案特征推薦,可采用式(11),得出高評分性能特征給予推薦,以用戶v1對應方案a7,v2對應方案a8以及v3對應方案a4的特征為例,具體見表14。由表14可知,對于方案a4,推薦交流無極變速的主軸箱,開環(huán)的進給傳動系統(tǒng),帶刀庫式的刀架的機床;對于方案a7,選擇帶有交流無級變速的主軸箱,溢流控制閥,齒輪泵的機床;對于產(chǎn)品服務方案a8,選擇開環(huán)的傳動,敞開式性能,環(huán)保性能高,交流無級變速的機床。

      表14 產(chǎn)品服務方案特征推薦表Tab.14 Product service p rogram featu rerecomm endation form

      4.2 產(chǎn)品服務方案推薦實時更新以及算法對比分析

      在產(chǎn)品服務方案推薦過程中,新用戶數(shù)據(jù)的產(chǎn)生使得數(shù)據(jù)庫不定期更新,但為了實時推薦用戶感興趣的服務方案且不影響前期計算過程,首先計算該用戶特征評分與推薦最近鄰用戶的相似度,如果相似度達到閾值0.85以上,采用式(14)對最后方案預測分值進行更新,雖然會略失準確度,但降低了時間復雜度,提高了方案推薦實時性。針對表13的用戶v1方案推薦,采用新用戶b的評分rba,更新產(chǎn)品服務方案推薦結(jié)果,見表15。

      表15 實時更新的產(chǎn)品服務方案推薦結(jié)果Tab.15 Recomm endation results of real-tim e update of p roduct service solu tion

      由表15可知,方案的優(yōu)先級由高到低依次為a7、a8、a5、a6、a9、a10、a1、a2、a4、a3,與更新前的總體推薦方案次序變化不大,只是產(chǎn)品服務方案a1和a2的優(yōu)先性調(diào)換了,說明更新數(shù)據(jù)少對結(jié)果影響力較小。

      為了驗證本文算法的合理性,考慮預測數(shù)據(jù)的推薦精度,以數(shù)據(jù)庫中50~400個等量樣本數(shù)據(jù)作為訓練集進行試驗。由于數(shù)據(jù)量過小,得到的速度差異不明顯,故本文未考慮算法執(zhí)行速度的比較,僅考慮了推薦精度的比較。通過式(15),對本文推薦算法、文獻[16]中的基于云模型的協(xié)同過濾算法、文獻[2]中的基于梯度算法的LFM三者推薦結(jié)果與實際結(jié)果的誤差值進行對比,具體見圖6。

      圖6 三種算法推薦得平均絕對誤差Fig.6 M ean average error of three recomm endation algorithm

      由圖6可知,當訓練集較少時,三種算法推薦精度誤差不大,都在0.08左右;隨著訓練集樣本數(shù)增加,誤差較小,但是本文算法誤差減小速度最快,說明對于數(shù)據(jù)量大的數(shù)據(jù)庫,本文推薦算法更加有效。另外,也能看出基于云模型的CF算法比LFM的推薦準確率高,并且當訓練集數(shù)量為350時,基于云模型的CF算法與本文算法的誤差很接近。

      5 結(jié)論

      本文針對評分數(shù)據(jù)具有主觀性、隨機模糊性等問題,且余弦相似度難以區(qū)別用戶對方案的偏好度,提出采用云滴距離測度和余弦相似度的綜合相似度來預測填充空缺數(shù)據(jù),彌補數(shù)據(jù)稀疏性??紤]到冷啟動問題,即對零記錄用戶推薦合適的方案,本文基于問卷調(diào)查得到用戶特征值并求相似度找出最近鄰用戶,并采用融入偏置量的加權(quán)LFM,提高推薦方案的效率??紤]到數(shù)據(jù)庫是動態(tài)更新的,采用基于差值評分預測方法更新預測結(jié)果。最后在不同訓練集下,擬合實際和預測平均誤差值的變化趨勢并分析結(jié)果,實驗結(jié)果證明了本文算法的優(yōu)先性。

      本文將推薦算法與個性化產(chǎn)品服務方案相結(jié)合,雖然在方案推薦過程和結(jié)果的精度有所提高,但是在前期填充數(shù)據(jù)過程中會耗費很多時間。考慮在下一步研究中優(yōu)化空缺數(shù)據(jù)的填充過程。

      猜你喜歡
      云滴預測方案
      無可預測
      黃河之聲(2022年10期)2022-09-27 13:59:46
      爛臉了急救方案
      好日子(2022年3期)2022-06-01 06:22:30
      選修2-2期中考試預測卷(A卷)
      選修2-2期中考試預測卷(B卷)
      福建九仙山一次佛光的云滴粒子尺度分析*
      海峽科學(2021年12期)2021-02-23 09:43:28
      你不知道的雷雨知識
      定邊:一份群眾滿意的“脫貧答卷” 一種提供借鑒的“扶貧方案”
      陜西畫報(2018年6期)2018-02-25 01:37:20
      不必預測未來,只需把握現(xiàn)在
      云微物理特性及云滴有效半徑參數(shù)化:一次降水層狀云的飛機觀測資料結(jié)果
      云滴譜離散度對氣溶膠間接效應影響的研究進展
      塘沽区| 焦作市| 石城县| 盐山县| 弋阳县| 古浪县| 镇巴县| 木兰县| 蓬溪县| 饶阳县| 当阳市| 平罗县| 平乡县| 南召县| 大厂| 佛教| 高清| 铁岭市| 昆山市| 德兴市| 始兴县| 阿合奇县| 左云县| 元阳县| 福清市| 南靖县| 宝应县| 通辽市| 通榆县| 浦东新区| 长治县| 马边| 太仓市| 惠东县| 怀安县| 合作市| 开封县| 宁远县| 富顺县| 酉阳| 东明县|