• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于行為曲線的用戶協(xié)同過(guò)濾控制推薦

      2023-01-15 11:25:54樊其鋒黑繼偉呂闖龐敏尚喆夏云龍邢志鋼
      家電科技 2022年6期
      關(guān)鍵詞:類(lèi)別準(zhǔn)確率聚類(lèi)

      樊其鋒 黑繼偉 呂闖 龐敏 尚喆 夏云龍 邢志鋼

      廣東美的制冷設(shè)備有限公司 廣東佛山 528000

      0 引言

      近幾年,隨著物聯(lián)網(wǎng)[1]和智能化的發(fā)展,各家電廠商逐步從傳統(tǒng)的制造技術(shù)向基于物聯(lián)網(wǎng)的智能家居[2]轉(zhuǎn)型。行業(yè)競(jìng)爭(zhēng)日益明顯,為了提升競(jìng)爭(zhēng)力,需要不斷探索新的領(lǐng)域。基于用戶行為進(jìn)行算法建模,為用戶提供精確的空調(diào)控制推薦服務(wù)至關(guān)重要。但是,用戶行為習(xí)慣方面具有一定的差異性,例如:冷熱喜好、節(jié)能需求、睡眠場(chǎng)景等,也會(huì)很大程度上影響推薦的準(zhǔn)確性。本文研究基于行為曲線的用戶協(xié)同過(guò)濾推薦算法,該算法可以充分反映人群在不同場(chǎng)景和習(xí)慣上的差異性,推薦的操作更加準(zhǔn)確和舒適,提升用戶體驗(yàn)和黏性,促進(jìn)空調(diào)行業(yè)的智能化發(fā)展。

      1 相關(guān)工作

      空調(diào)行為推薦具有非常重要的意義:對(duì)用戶而言,可以讓空調(diào)使用更加便捷;對(duì)空調(diào)廠商而言,可以增強(qiáng)用戶黏性,提升用戶使用體驗(yàn),最終提升銷(xiāo)量。目前,主要分為用戶研究和智能推薦。用戶研究以問(wèn)卷法、入戶訪談等方法為主。近幾年,互聯(lián)網(wǎng)行業(yè)得到飛速發(fā)展,大數(shù)據(jù)和人工智能更是炙手可熱[3],推薦方法不僅僅局限于傳統(tǒng)的統(tǒng)計(jì),而是升級(jí)到了基于算法與大數(shù)據(jù)的智能推薦。智能推薦主要包括基于分類(lèi)回歸、協(xié)同過(guò)濾等[9]。

      基于分類(lèi)回歸的推薦算法包括貝葉斯、KNN等算法[4]。貝葉斯分類(lèi)是通過(guò)給出的待分類(lèi)項(xiàng),求解在此項(xiàng)出現(xiàn)的條件下各類(lèi)別出現(xiàn)的概率,概率最大的分類(lèi)項(xiàng),則被認(rèn)為此項(xiàng)所屬的類(lèi)別;K近鄰是通過(guò)找出訓(xùn)練集中與該實(shí)例相似度最大的K個(gè)實(shí)例,并根據(jù)這K個(gè)實(shí)例的類(lèi)別確定該實(shí)例的類(lèi)別。

      協(xié)同過(guò)濾(CF)算法,分為User-based和Item-based兩類(lèi)[7]。Userbased協(xié)同過(guò)濾算法[6]是找出一個(gè)用戶的相似偏好集合,根據(jù)相似用戶的偏好預(yù)測(cè)該用戶的行為;Item-based協(xié)同過(guò)濾算法[5]則通過(guò)計(jì)算用戶對(duì)不同內(nèi)容的偏好程度,從而預(yù)測(cè)用戶的行為。

      此外,智能推薦還可提供個(gè)性化的推薦服務(wù)[8]。其中,基于用戶行為的自學(xué)習(xí)推薦[10,11,15],也具有較好的運(yùn)用。

      本文采用了基于行為曲線的用戶協(xié)同過(guò)濾控制推薦算法:UBCbased CF,根據(jù)用戶行為曲線相似度,找到相似行為用戶,從而根據(jù)相似用戶的空調(diào)操作進(jìn)行推薦。該算法反映了人群在不同場(chǎng)景和習(xí)慣上的差異性,推薦的操作更加準(zhǔn)確和舒適。

      2 UBC-based CF推薦控制

      本章詳細(xì)介紹空調(diào)行為推薦的流程。總體架構(gòu)如圖1所示。首先,提取用戶的歷史操作行為曲線,以表示該用戶;然后,通過(guò)計(jì)算行為曲線的相似度,來(lái)評(píng)估每個(gè)用戶與該用戶的相似度;接著,查找距離該用戶最近的K個(gè)鄰居,通過(guò)協(xié)同過(guò)濾算法獲取推薦值,實(shí)現(xiàn)空調(diào)的智能化控制。

      圖1 協(xié)同過(guò)濾推薦流程圖

      接下來(lái),將分別從用戶表示、計(jì)算行為曲線相似度、計(jì)算用戶行為相似度、協(xié)同過(guò)濾推薦這幾個(gè)部分進(jìn)行闡述。

      2.1 用戶表示

      從物聯(lián)網(wǎng)空調(diào)上收集用戶操作行為數(shù)據(jù),主要包括操作時(shí)間(開(kāi)關(guān)機(jī)、調(diào)節(jié)溫度、調(diào)節(jié)風(fēng)速等發(fā)生的時(shí)間)、開(kāi)關(guān)機(jī)、設(shè)置模式、設(shè)置溫度等數(shù)據(jù)。本文以操作行為來(lái)表示用戶。

      經(jīng)過(guò)歷史行為統(tǒng)計(jì)發(fā)現(xiàn):用戶對(duì)空調(diào)的操作60%會(huì)出現(xiàn)在開(kāi)機(jī)10分鐘內(nèi),80%出現(xiàn)在30分鐘內(nèi),90%出現(xiàn)在2小時(shí)內(nèi)。因此,用戶操作的時(shí)間序列對(duì)行為分析具有很大的影響。

      本文通過(guò)提取空調(diào)運(yùn)行過(guò)程中的時(shí)間階段特征,以時(shí)間為X值,用戶設(shè)置溫度、風(fēng)速、開(kāi)關(guān)機(jī)等分別為Y值,建立行為曲線。下面以設(shè)置溫度為例對(duì)用戶行為曲線(設(shè)置溫度)的生成過(guò)程進(jìn)行詳細(xì)闡述。

      (1)生成行為曲線:以時(shí)間序列為X軸,以設(shè)置溫度為Y軸,建立二維空間坐標(biāo)系。

      (2)行為曲線歸一化:由于受到氣候環(huán)境的影響,用戶的使用時(shí)長(zhǎng)不同;而且,較短的使用記錄,并不能反映空調(diào)從開(kāi)機(jī)到達(dá)溫再到穩(wěn)定的過(guò)程。因此,首先把使用時(shí)長(zhǎng)小于2小時(shí)的行為作為“噪聲”剔除,然后以用戶使用時(shí)間100%對(duì)用戶行為曲線進(jìn)行拉升或壓縮,使得其在相同的時(shí)間范圍內(nèi),以完成歸一化。如圖2所示。

      圖2 用戶行為曲線

      因此,用戶可表示為L(zhǎng)={L1,L2,L3,……,Ln},包含了用戶的設(shè)置溫度、風(fēng)速、開(kāi)關(guān)機(jī)等空調(diào)操作行為信息。其中L1可表示設(shè)置溫度行為曲線,L2可表示設(shè)置風(fēng)速行為曲線,L3可表示開(kāi)關(guān)機(jī)行為曲線……

      2.2 計(jì)算行為曲線相似度

      行為曲線相似度能夠表示兩個(gè)用戶空調(diào)某個(gè)操作使用行為的一致性,對(duì)于尋找高度相似的鄰居,提升算法推薦準(zhǔn)確率至關(guān)重要。

      本節(jié)主要介紹行為曲線相似度的計(jì)算方法。首先,通過(guò)積分公式計(jì)算兩條曲線面積的交集和并集;然后,以此計(jì)算曲線面積的Jaccard系數(shù)作為這兩條行為曲線的相似度。其中相同的用戶每次使用均為一條獨(dú)立的行為曲線。

      假設(shè)有2個(gè)用戶行為a和b,設(shè)置溫度曲線分別為L(zhǎng)a和Lb,如圖3所示。

      圖3 行為曲線相似度

      把曲線的時(shí)間軸劃分成正無(wú)窮個(gè)時(shí)間間隔;

      對(duì)于任何一個(gè)間隔i,行為a和b的設(shè)置溫度分別為T(mén)i,a和Ti,b,計(jì)算該間隔的最大設(shè)置溫度Ti,max和最小設(shè)置溫度Ti,min:

      根據(jù)積分和Jaccard公式,計(jì)算行為曲線的相似度sim_ba,b,具體公式如下:

      其中,Sa和Sb分別表示曲線La和Lb與X軸的面積,sim_ba,b為行為曲線a和b的相似度。

      2.3 計(jì)算用戶行為相似度

      用戶行為相似度能夠反映兩個(gè)用戶空調(diào)使用行為的一致性。本文通過(guò)行為曲線相似度來(lái)計(jì)算用戶之間的相似度。首先,針對(duì)特定用戶u,對(duì)該用戶的空調(diào)使用歷史行為曲線L={L1,L2,L3,……,Ln}進(jìn)行層次聚類(lèi),整合為M個(gè)類(lèi)別;然后,針對(duì)其他用戶k,計(jì)算該用戶每條歷史行為曲線距離用戶u最近的行為曲線Li(∈L),并以此劃分為L(zhǎng)i所在的類(lèi)別m(∈M);接著,計(jì)算用戶k與u在每個(gè)類(lèi)別的相似度,并以所有類(lèi)別的平均相似度,作為用戶k與u的空調(diào)使用行為相似度。

      具體算法如下:

      接下來(lái),本節(jié)將從用戶行為曲線聚類(lèi)、曲線類(lèi)別相似度計(jì)算、用戶行為相似度計(jì)算這幾個(gè)部分進(jìn)行詳細(xì)闡述。

      (1)用戶行為曲線聚類(lèi):針對(duì)特定用戶u,根據(jù)相似度閾值S,對(duì)該用戶的所有歷史行為曲線進(jìn)行層次聚類(lèi)。

      層次聚類(lèi)是一種基于相似度的聚類(lèi)方法,分為自下而上和自上而下兩種方法,圖4為層次聚類(lèi)的合并方法。

      圖4 層次聚類(lèi)的合并方法[14]

      下面介紹一個(gè)案例:假設(shè)用戶u有3條行為曲線,相似度閾值S為0.9,則最終合并為2個(gè)類(lèi)別,如圖5所示。

      圖5 用戶行為曲線聚類(lèi)

      閾值S的選取,對(duì)行為曲線聚類(lèi)具有明顯的影響,對(duì)推薦效果也具有較大的影響。S設(shè)置越小,區(qū)分度越小,曲線越容易聚成同一個(gè)類(lèi)別,選取的鄰居行為相似性越弱;S設(shè)置越大,區(qū)分度越大,曲線越不容易聚成同一個(gè)類(lèi)別,選取的鄰居行為容易過(guò)擬合,推薦效果反而變差。在第3章實(shí)驗(yàn)部分,將對(duì)該部分進(jìn)行參數(shù)優(yōu)化。

      (2)曲線類(lèi)別相似度計(jì)算:針對(duì)用戶k,計(jì)算該用戶每條歷史行為曲線距離用戶u最近的行為曲線Li(∈L),并以此劃分為L(zhǎng)i所在的類(lèi)別m(∈M);然后計(jì)算每個(gè)類(lèi)別的平均相似度。計(jì)算公式如下:

      其中,n表示用戶k劃分為類(lèi)別c的行為曲線數(shù)量,ui表示類(lèi)別c中第i條用戶u所屬行為曲線;ki表示類(lèi)別c中第i條用戶k所屬的行為曲線;sim_bui,ki表示類(lèi)別c中第i條用戶行為曲線相似度,sim_cc即為類(lèi)別c的行為相似度。案例如圖6所示。

      圖6 行為類(lèi)別相似度計(jì)算

      類(lèi)別1的平均相似度:

      類(lèi)別2的平均相似度:

      用戶行為相似度計(jì)算[12]:計(jì)算M個(gè)類(lèi)別的平均相似度,作為用戶u和k的相似度。計(jì)算公式如下:

      其中,n表示類(lèi)別的數(shù)量,sim_cc表示第c個(gè)類(lèi)別的行為相似度,sim_uu,k即為用戶u和k的平均行為相似度。如圖6所示案例:

      通過(guò)該方法,計(jì)算出每?jī)蓚€(gè)用戶之間的空調(diào)使用行為相似度。

      2.4 協(xié)同過(guò)濾推薦

      本文的推薦包含了群體默認(rèn)推薦值和協(xié)同過(guò)濾推薦。針對(duì)無(wú)歷史使用行為的新用戶,采用群體推薦默認(rèn)值,當(dāng)用戶使用了一段時(shí)間(7天)后,則采用協(xié)調(diào)過(guò)濾推薦。

      本節(jié)主要介紹協(xié)同過(guò)濾推薦算法[13]。首先,針對(duì)特定用戶,獲取該用戶與其他用戶的相似度;然后,查找距離該用戶最近的K個(gè)近鄰;最后,根據(jù)K個(gè)鄰居的當(dāng)前空調(diào)控制參數(shù)(包括不限于設(shè)置溫度,當(dāng)前控制參數(shù)無(wú)需區(qū)分智能推薦或用戶自主調(diào)控),生成推薦值,作為最終的控制參數(shù)。

      (1)獲取與其他用戶的相似度;

      (2)查詢?cè)撚脩舻腒近鄰;

      (3)推薦控制參數(shù)。

      獲取K個(gè)鄰居的當(dāng)前設(shè)置參數(shù),計(jì)算平均值,作為最終的推薦參數(shù)。

      其中,u表示該用戶,k表示K個(gè)鄰居中的第k個(gè)用戶,Tk表示用戶k的當(dāng)前設(shè)置溫度,sim_uu,k表示用戶u和k的用戶行為相似度。CFR(u)即為最終的推薦參數(shù)。

      每間隔時(shí)間T,通過(guò)本文的算法,可以實(shí)時(shí)獲取該用戶的推薦參數(shù)值,從而實(shí)現(xiàn)智能化控制。

      3 實(shí)驗(yàn)與分析

      本節(jié)首先介紹實(shí)驗(yàn)的數(shù)據(jù)集以及評(píng)估指標(biāo);然后,介紹調(diào)參和抽樣,最后對(duì)比多種推薦方法的效果,從而得出實(shí)驗(yàn)結(jié)論。

      3.1 數(shù)據(jù)集與評(píng)估方法

      本文所用數(shù)據(jù)為:用戶信息、用戶使用行為。抽取了2019年的部分?jǐn)?shù)據(jù),作為訓(xùn)練集和測(cè)試集,具體如表1所示。

      表1 數(shù)據(jù)集

      本文主要包括設(shè)置溫度和風(fēng)速的實(shí)時(shí)推薦(以溫度為例)。

      當(dāng)用戶實(shí)際設(shè)置溫度與算法推薦溫度高度一致的時(shí)候,則代表用戶滿意算法推薦的溫度值,即算法推薦溫度可以為用戶帶來(lái)較強(qiáng)的熱舒適性體驗(yàn),因此本文采用如下的準(zhǔn)確率公式來(lái)對(duì)推薦效果進(jìn)行判定。

      實(shí)驗(yàn)中,通過(guò)對(duì)比算法推薦溫度與用戶設(shè)置溫度,計(jì)算準(zhǔn)確率P,以此評(píng)估該算法的效果。準(zhǔn)確率計(jì)算公式如下:其中,TCu表示推薦溫度,Ts表示用戶設(shè)置溫度;14為[17,30]溫度范圍區(qū)間,以1℃為間隔,共14個(gè)值。

      3.2 結(jié)果與分析

      (1)參數(shù)調(diào)優(yōu)

      本算法中,閾值S(用戶行為相似度)的選取,對(duì)行為曲線聚類(lèi)具有明顯的影響,對(duì)推薦效果也具有較大的影響,因此,本文針對(duì)S取值進(jìn)行調(diào)優(yōu),選取不同的S值進(jìn)行聚類(lèi),然后進(jìn)行參數(shù)推薦,最后采用3.1節(jié)的公式進(jìn)行準(zhǔn)確率計(jì)算,得出不同閾值S下的準(zhǔn)確率如圖7所示。

      圖7 相似度閾值 參數(shù)調(diào)優(yōu)

      從圖7中可以看出,當(dāng)S≤0.85時(shí),準(zhǔn)確率較低且隨著S值變化不明顯,S=0.95時(shí)準(zhǔn)確率最高,當(dāng)S=1時(shí),平均準(zhǔn)確率又明顯下降。因此,本算法中S值參數(shù)選取為0.95。

      (2)各城市/季節(jié)效果對(duì)比

      為驗(yàn)證本算法在各個(gè)城市及季節(jié)的有效性,本項(xiàng)目在全國(guó)典型城市進(jìn)行抽樣,選取了北京、重慶、武漢等城市用戶的制冷和制熱模式的使用數(shù)據(jù),進(jìn)行參數(shù)推薦,最后采用3.1節(jié)的公式進(jìn)行準(zhǔn)確率計(jì)算,對(duì)推薦算法的效果進(jìn)行實(shí)驗(yàn)論證,具體的準(zhǔn)確率如表2所示。

      表2 不同城市/季節(jié)效果對(duì)比

      從表2中可以看出,在夏季制冷模式下,本項(xiàng)目算法推薦均有較好的效果,都在91%以上,其中北京、深圳最好,達(dá)到94.6%以上。冬季制熱模式下,由于用戶制熱差異較大,推薦效果差于夏季,且北方城市效果好于南方城市。

      (3)各算法效果對(duì)比

      為驗(yàn)證本算法整理準(zhǔn)確率,本項(xiàng)目對(duì)比了各算法的實(shí)際效果:用本實(shí)驗(yàn)對(duì)測(cè)試集,分別運(yùn)行KNN算法、基于用戶的協(xié)同過(guò)濾CF算法、UBC-based CF算法,計(jì)算準(zhǔn)確率對(duì)推薦結(jié)果進(jìn)行評(píng)估。如圖8所示。

      圖8 多算法推薦準(zhǔn)確率效果對(duì)比

      可以看出,本項(xiàng)目UBC-based CF算法的準(zhǔn)確率為91.43%,KNN算法的準(zhǔn)確率為86.26%,基于用戶的協(xié)同過(guò)濾user-based CF算法準(zhǔn)確率為87.19%,本項(xiàng)目算法準(zhǔn)確率提升了5%,取得了較好的效果。

      4 應(yīng)用效果

      本文研究的算法準(zhǔn)確率高達(dá)91.43%。在用戶空調(diào)使用過(guò)程中:100次推薦值,約有91次推薦值可滿足用戶需求,用戶無(wú)需進(jìn)行調(diào)節(jié)。而針對(duì)推薦值不滿足用戶需求的部分,若用戶產(chǎn)生調(diào)節(jié)行為,算法將會(huì)重新學(xué)習(xí)調(diào)整,越用越智能。

      本文研究的算法能夠最大限度地貼合用戶的實(shí)際使用需求,用戶無(wú)需動(dòng)手。不僅能夠給用戶帶來(lái)空調(diào)智能化的便捷,同時(shí)也能夠更好地給用戶提供舒適性體驗(yàn)。

      5 總結(jié)與展望

      本文研究基于行為曲線的用戶協(xié)同過(guò)濾控制推薦,提出了UBCbased CF算法:使用更細(xì)粒度的行為曲線來(lái)表示用戶,通過(guò)行為曲線相似度來(lái)計(jì)算用戶之前的行為相似度,從而基于用戶的協(xié)同過(guò)濾算法能夠獲得精準(zhǔn)度更高的空調(diào)控制推薦服務(wù)。該算法解決了人群在不同場(chǎng)景和習(xí)慣上的差異性問(wèn)題,推薦的操作更加準(zhǔn)確和舒適。本文通過(guò)實(shí)驗(yàn)分析,對(duì)模型參數(shù)進(jìn)行調(diào)優(yōu),并驗(yàn)證了在不同城市/季節(jié)下的推薦效果;另外,通過(guò)對(duì)比分析發(fā)現(xiàn),本算法的準(zhǔn)確率比其他算法高出4%以上,具有很好的推薦效果。

      接下來(lái),我們將進(jìn)一步研究濕度、潔凈度、新鮮度等其他指標(biāo)的推薦模型,以實(shí)現(xiàn)多維空氣的智能化控制。

      猜你喜歡
      類(lèi)別準(zhǔn)確率聚類(lèi)
      乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
      健康之家(2021年19期)2021-05-23 11:17:39
      不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
      2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
      高速公路車(chē)牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
      基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
      服務(wù)類(lèi)別
      基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
      一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
      論類(lèi)別股東會(huì)
      商事法論集(2014年1期)2014-06-27 01:20:42
      中醫(yī)類(lèi)別全科醫(yī)師培養(yǎng)模式的探討
      奉化市| 当雄县| 惠安县| 彭阳县| 丽水市| 大石桥市| 沧州市| 阿城市| 新宁县| 化德县| 德昌县| 萨嘎县| 东海县| 溧阳市| 宝清县| 乌拉特前旗| 隆尧县| 普格县| 贵溪市| 长子县| 儋州市| 保定市| 合山市| 来宾市| 宁陕县| 凤山县| 龙陵县| 淮南市| 湄潭县| 自贡市| 来宾市| 申扎县| 武山县| 壤塘县| 垦利县| 乃东县| 万安县| 泗水县| 平果县| 宁远县| 珲春市|