• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于數(shù)據(jù)挖掘下的自動化推薦系統(tǒng)

      2020-07-23 06:28:29陳利軍
      現(xiàn)代電子技術(shù) 2020年5期
      關(guān)鍵詞:攔截器數(shù)據(jù)挖掘關(guān)聯(lián)

      陳利軍

      摘? 要: 針對傳統(tǒng)的推薦系統(tǒng)中獲取關(guān)鍵詞傾向性單一的問題,設(shè)計(jì)數(shù)據(jù)挖掘下的自動化推薦系統(tǒng)。系統(tǒng)在原有的硬件結(jié)構(gòu)基礎(chǔ)上,在接口模塊中設(shè)置頁面跳轉(zhuǎn)攔截器和會話控制攔截器,將其與中心處理模塊相連,在中心處理模塊中使用nRF905無線芯片,形成新的系統(tǒng)硬件構(gòu)造。數(shù)據(jù)挖掘下,依據(jù)用戶信息挖掘關(guān)聯(lián)規(guī)則,確定相似量度,搜索出近鄰信息,獲得最終推薦內(nèi)容。利用軟件程序代碼實(shí)現(xiàn)自動化推薦,至此自動化推薦系統(tǒng)設(shè)計(jì)完成。測試結(jié)果表明,在使用相同的用戶信息情況下,與傳統(tǒng)的推薦系統(tǒng)相比,數(shù)據(jù)挖掘下的自動化推薦系統(tǒng)獲得的推薦詞匯多了3~5種,關(guān)鍵詞的傾向性更廣泛,適合應(yīng)用在實(shí)際項(xiàng)目中。

      關(guān)鍵詞: 推薦系統(tǒng); 攔截器設(shè)置; 數(shù)據(jù)挖掘; 關(guān)聯(lián)規(guī)則; 近鄰信息搜索; 推薦內(nèi)容獲得

      中圖分類號: TN911?34; TP311? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼: A? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)05?0113?03

      Automatic recommender system based on data mining

      CHEN Lijun1, 2

      (1. Information Engineering University, Zhengzhou 450000, China;

      2. School of Computer Engineering, Henan Institute of Economics and Trade, Zhengzhou 450018, China)

      Abstract: In view of the single tendency to obtain keywords in traditional recommender systems, an automatic recommender system based on data mining is designed. On the basis of the original hardware structure, the page skip interceptor and session control interceptor are set in the interface module, which are connected with the central processing module. The nRF905 wireless chip is used in the central processing module to form a new system hardware structure. On the basis of user information mining association rules for data mining technology, the similar measures are determined and the neighborhood information is searched out to get the final recommended content. Then, the software program code is used to realize automatic recommendation. So far, the design of automatic recommender system is completed. The test results show that, in comparison with the traditional recommender system, the automatic recommender system based on data mining obtains extra 3~5 kinds of recommended words under the condition of using the same user information, which has more broader keyword tendency, and is suitable for the application in actual projects.

      Keywords: recommender system; interceptor setting?up; data mining; association rule; neighborhood information search; recommended content acquisition

      0? 引? 言

      隨著現(xiàn)代網(wǎng)絡(luò)技術(shù)的發(fā)展,使用互聯(lián)網(wǎng)的用戶越來越多,網(wǎng)絡(luò)上充斥著越來越多分散的信息,當(dāng)這些信息同時(shí)呈現(xiàn)在互聯(lián)網(wǎng)用戶前時(shí),若不考慮用戶的需求,就導(dǎo)致大量重復(fù)無用的信息和服務(wù)出現(xiàn)在用戶面前,用戶不能在第一時(shí)間發(fā)現(xiàn)自己真正感興趣的內(nèi)容[1]。這種情況下,使用自動化推薦系統(tǒng),以用戶的興趣和偏好特征為依據(jù),向用戶提供滿足他們需求的內(nèi)容和服務(wù),使用戶擁有良好的體驗(yàn),感受到服務(wù)的人性化。傳統(tǒng)的推薦系統(tǒng)中,通常使用的是協(xié)同過濾推薦或混合推薦,協(xié)同過濾方法能夠過濾掉沒有價(jià)值的信息,留下用戶感興趣的信息;混合推薦是混合多種推薦算法,能夠克服推薦系統(tǒng)的冷啟動問題。但是使用這兩種算法的推薦系統(tǒng)存在一個(gè)通病,就是獲取關(guān)鍵詞傾向性比較單一,造成向用戶推薦的內(nèi)容和服務(wù)過于單一,不能滿足現(xiàn)今人們的生活節(jié)奏[2]。

      針對上述情況,本文設(shè)計(jì)數(shù)據(jù)挖掘下的自動化推薦系統(tǒng)。數(shù)據(jù)挖掘能夠?qū)崿F(xiàn)從大量數(shù)據(jù)集中識別出有效、具有潛在價(jià)值的數(shù)據(jù),多角度歸納出用戶所需的潛在數(shù)據(jù)。數(shù)據(jù)挖掘下,利用關(guān)聯(lián)法則算法和程序代碼實(shí)現(xiàn)自動化推薦,完成自動化推薦系統(tǒng)設(shè)計(jì)。

      1? 自動化推薦系統(tǒng)硬件設(shè)計(jì)

      1.1? 系統(tǒng)硬件結(jié)構(gòu)設(shè)計(jì)

      數(shù)據(jù)挖掘下的自動化推薦系統(tǒng)的目的是針對用戶提供的信息和網(wǎng)絡(luò)行為,幫助用戶解決需求問題,這需要大量的數(shù)據(jù)做基礎(chǔ)[3]。主要通過硬件結(jié)構(gòu)獲取用戶與項(xiàng)目之間的相關(guān)信息,反饋推薦結(jié)果,通過應(yīng)用模塊推薦給用戶,用戶可通過瀏覽器觀察推薦結(jié)果,也可通過移動終端查看結(jié)果[4]。其系統(tǒng)硬件結(jié)構(gòu)設(shè)計(jì)如圖1所示。

      利用信息收集模塊獲得用戶信息后,將其保存在存儲模塊內(nèi)。利用接口模塊將信息傳遞給中心處理模塊,之后將推薦結(jié)果傳遞到應(yīng)用模塊中,同時(shí)反饋給信息收集模塊保存推薦結(jié)果[5]。為了更好地實(shí)現(xiàn)自動化推薦,在接口模塊設(shè)置兩種攔截器:一種是會話控制攔截器;另一種是頁面跳轉(zhuǎn)攔截器。會話控制攔截器的目的是判斷在存儲模塊中是否存在該用戶信息,若沒有,創(chuàng)建會話控制信息寫入到文本文件中,并將用戶所有行為信息保存在存儲模塊中。設(shè)置頁面跳轉(zhuǎn)攔截器的目的是,用戶在進(jìn)行一定操作時(shí),存在一定的時(shí)間差,將用戶的動態(tài)請求信息完整的記錄下來,完成頁面跳轉(zhuǎn)攔截,及時(shí)獲取用戶行為信息[6]。其中,在接口模塊完成攔截任務(wù)后,將信息傳遞給中心處理模塊,在數(shù)據(jù)挖掘下,利用關(guān)聯(lián)法則離線處理獲得的用戶相關(guān)信息,將結(jié)果傳遞給應(yīng)用模塊,顯示在用戶界面。

      1.2? 中心處理模塊設(shè)計(jì)

      在該模塊中使用nRF905無線射頻芯片,該芯片擁有高效率傳輸數(shù)據(jù)的能力,不需要昂貴的高速M(fèi)CU來處理數(shù)據(jù)。同時(shí),芯片內(nèi)部512個(gè)通信頻道滿足多點(diǎn)通信、跳幀等需求,其頻道切換的時(shí)間[≤]6 μs,在422.4~4 473.5 MHz工作頻段內(nèi),工作電壓的范圍在1.9~3.6 V,接收時(shí)工作電流為12.5 μA,存在多種低功率工作模式,并且能夠同時(shí)接收到兩個(gè)不同頻道的數(shù)據(jù)[7]。中心處理模塊的外圍接口電路如圖2所示。

      2? 自動化推薦系統(tǒng)軟件設(shè)計(jì)

      2.1? 挖掘關(guān)聯(lián)規(guī)則

      關(guān)聯(lián)規(guī)則可表示為,當(dāng)用戶購買一種產(chǎn)品的同時(shí)購買另一種產(chǎn)品,這種情況就說明兩種產(chǎn)品之間存在關(guān)聯(lián)規(guī)則。如果數(shù)據(jù)集合[Q]在數(shù)據(jù)集合[W]中出現(xiàn)的次數(shù)比較多,就可以說明存在關(guān)聯(lián)規(guī)則[W?Q],[W]表示規(guī)則頭,[Q]表示規(guī)則體[8]。

      假設(shè)[E=e1,e2,…,en]表示所有信息塊集合,定義數(shù)據(jù)集[R]是數(shù)據(jù)庫事務(wù)的集合,其中,任意事務(wù)[am]是單一信息塊的集合,[?m,am?E]。假設(shè)[W]表示某個(gè)信息塊集合,事務(wù)[am]包含[W],當(dāng)且僅當(dāng)[W?am],其蘊(yùn)含形式就是關(guān)聯(lián)規(guī)則[W?Q],其中,[W,Q?I],并且[W?Q=?]。

      關(guān)聯(lián)規(guī)則[W?Q]在數(shù)據(jù)集[R]中具有支持度,定義數(shù)據(jù)集[R]中事務(wù)包含[W?Q]的比例:

      [supW?Q=PW?Q=countW?QR] (1)

      式中:[sup]表示數(shù)據(jù)的支持度;[count]表示統(tǒng)計(jì)集合;[P]表示概率;[W]和[Q]表示存在關(guān)聯(lián)規(guī)則的兩種數(shù)據(jù)集[9]。定義關(guān)聯(lián)規(guī)則[W?Q]在數(shù)據(jù)集[R]中的置信度,[R]中包含[A]的事務(wù),同時(shí)也包含[B]的事務(wù)的比例為:

      [conW?Q=PQW=supW?QsupW] (2)

      其中:

      [supW?QsupW=countW?QcountW] (3)

      式中[con]表示置信度。當(dāng)不同的數(shù)據(jù)集符合上述事務(wù)比例要求,說明其滿足了最小支持度[min_sup]。以此為前提,從支持度最小的數(shù)據(jù)集中開始搜索規(guī)則體,也就是待推薦的對象,確定產(chǎn)生的推薦。

      2.2? 搜索推薦內(nèi)容

      自動化推薦系統(tǒng)以關(guān)聯(lián)算法為基礎(chǔ),挖掘不同信息塊之間存在的相關(guān)性和隱式因果性,從而通過關(guān)聯(lián)規(guī)則的支持度和置信度作為相似量度,搜索出近鄰信息,形成最終推薦信息集[10]。

      假設(shè)存在[i]個(gè)信息塊和[j]個(gè)事務(wù),設(shè)置信息塊按照支持度從大到小排列為[s1,s2,…,si],[s]表示信息塊中的數(shù)據(jù)源[11]。使用FP?Growth算法中的模式樹,將空值插入模式樹樹根,按照一定的順序提取事務(wù)記錄,將其插入模式樹中,將新插入的界限的支持度計(jì)數(shù)賦值為1,若插入事務(wù)[j1]時(shí)產(chǎn)生了新的路徑,在之后的插入操作中,當(dāng)經(jīng)過某個(gè)節(jié)點(diǎn)時(shí),將其支持度計(jì)數(shù)加1,如事務(wù)[j2]插入模式樹中,產(chǎn)生了新的路徑,一直執(zhí)行到所有事務(wù)插入到模式樹中,最后產(chǎn)生的模式樹如圖3所示。

      獲得模式樹后,從最小支持度的信息塊中開始搜索,也就是從模式樹最深的葉子節(jié)點(diǎn)向上搜索[12]。觀察圖3,[s3]可以生成的信息塊集及其支持度計(jì)數(shù)為[s2,s1,s3:1]和[s2,s1,s4,s3:1],從中去掉[s3],進(jìn)一步提取出[s2,s1:1],稱為[s3]的條件模式基,若最小支持度計(jì)數(shù)閾值是2,則可以得到以[s3]結(jié)尾的信息塊集,也就是推薦集[13]。獲得推薦集后,利用程序代碼實(shí)現(xiàn)自動化推薦。

      2.3? 自動化推薦的實(shí)現(xiàn)

      利用程序代碼實(shí)現(xiàn)自動化推薦,設(shè)置userdir為所需推薦的用戶,將用戶行為信息保存在list filelist 中,推薦集保存在Map中,通過DateProcess.predict將推薦集推薦給userdir[14?15]。在數(shù)據(jù)挖掘下,依據(jù)用戶行為信息挖掘關(guān)聯(lián)規(guī)則,搜索因果關(guān)系最強(qiáng)的近鄰信息,形成推薦集,利用程序代碼實(shí)現(xiàn)自動化推薦。至此數(shù)據(jù)挖掘下自動化推薦系統(tǒng)設(shè)計(jì)完成。

      3? 自動化推薦系統(tǒng)性能測試

      3.1? 搭建自動化系統(tǒng)測試環(huán)境

      為了更好地測試系統(tǒng)的性能,搭建一個(gè)小型的局域網(wǎng)范圍的計(jì)算機(jī)集群,使用6臺計(jì)算機(jī),其中,1臺計(jì)算機(jī)作為服務(wù)器,另外5臺作為客戶端,通過瀏覽器完成對服務(wù)器的訪問。測試環(huán)境如圖4所示。

      圖4中,服務(wù)器和客戶端都運(yùn)行在Windows 10操作系統(tǒng)上,其相關(guān)配置為內(nèi)存4 GB以上,硬盤300 GB以上,用Java語言開發(fā)和實(shí)現(xiàn)。

      3.2? 系統(tǒng)測試過程

      通過計(jì)算機(jī)軟件模擬用戶行為信息數(shù)據(jù),利用數(shù)據(jù)挖掘下的自動化推薦系統(tǒng)處理用戶相關(guān)數(shù)據(jù),獲得向用戶推薦的關(guān)鍵詞信息。同時(shí),采用傳統(tǒng)的協(xié)同過濾推薦系統(tǒng)以及混合推薦系統(tǒng)設(shè)計(jì)對比實(shí)驗(yàn),測試在同時(shí)獲得相同的用戶行為信息時(shí),不同的推薦系統(tǒng)獲得的用戶推薦關(guān)鍵詞信息是否一致,獲得結(jié)果后具體分析。

      3.3? 測試結(jié)果與分析

      系統(tǒng)測試中獲取的用戶數(shù)據(jù)關(guān)鍵詞為快餐食品,不同的推薦系統(tǒng)測試的結(jié)果如圖5所示。

      觀察圖5中三種不同的測試結(jié)果,結(jié)果1使用的是傳統(tǒng)基于協(xié)同過濾的推薦系統(tǒng),根據(jù)關(guān)鍵詞快餐食品,獲得的相關(guān)推薦詞匯只有三種,這三種都是與關(guān)鍵詞具有關(guān)系的詞匯,傾向性較單一;結(jié)果2為傳統(tǒng)基于混合推薦系統(tǒng)測試結(jié)果,與結(jié)果1相比,與關(guān)鍵詞相關(guān)的詞匯多了兩種,這兩種詞匯與關(guān)鍵詞沒有直接聯(lián)系,是關(guān)聯(lián)出的詞匯,但是也同屬于快速食用的范圍內(nèi)。結(jié)果3使用的是數(shù)據(jù)挖掘下的自動化推薦系統(tǒng),與前兩種結(jié)果相比,推薦詞多出了3~5種,除了快速食用類別外,還有料理包和便當(dāng)盒等輔助性詞匯,其關(guān)鍵詞的傾向性比較廣泛,提高了用戶感興趣的可能性。

      4? 結(jié)? 語

      現(xiàn)如今人們長期處于快節(jié)奏的生活中,用戶使用多種多樣的搜索方式,尋找自身感興趣的內(nèi)容和服務(wù),但是很多用戶不能使用準(zhǔn)確的關(guān)鍵詞搜索自己所需的內(nèi)容,甚至有的用戶對自己的需求也不明確。使用推薦系統(tǒng)就可以主動地向用戶推薦可能感興趣的商品。數(shù)據(jù)挖掘下的自動化推薦系統(tǒng)解決了傳統(tǒng)推薦系統(tǒng)的問題,通過關(guān)聯(lián)規(guī)則搜索推薦內(nèi)容,多角度、多方面地向用戶推薦有可能需要的內(nèi)容,提高用戶搜索效率。同時(shí),通過測試證明該系統(tǒng)具有良好的推薦效果,具有良好的發(fā)展空間。

      參考文獻(xiàn)

      [1] 張婷婷.基于大數(shù)據(jù)的Web個(gè)性化推薦系統(tǒng)設(shè)計(jì)[J].現(xiàn)代電子技術(shù),2018,41(16):155?158.

      [2] 謝康.基于讀者個(gè)性化特征數(shù)據(jù)挖掘的圖書館書目推薦[J].現(xiàn)代電子技術(shù),2018,41(6):34?36.

      [3] 梁建勝,黃隆勝,徐淑瓊.基于視頻內(nèi)容檢測的協(xié)同過濾視頻推薦系統(tǒng)[J].控制工程,2018,25(2):305?312.

      [4] 何明,劉毅,常盟盟,等.基于上下文項(xiàng)目評分分裂的協(xié)同過濾推薦[J].計(jì)算機(jī)科學(xué),2017,44(3):247?253.

      [5] 張戈一,胡博然,常力恒,等.基于大數(shù)據(jù)分析挖掘的地質(zhì)文獻(xiàn)推薦方法研究[J].中國礦業(yè),2017,26(9):92?97.

      [6] 黃立威,江碧濤,呂守業(yè),等.基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2018,41(7):191?219.

      [7] 張時(shí)俊,王永恒.基于矩陣分解的個(gè)性化推薦系統(tǒng)研究[J].中文信息學(xué)報(bào),2017,31(3):134?139.

      [8] 何明,劉偉世,張江.支持推薦非空率的關(guān)聯(lián)規(guī)則推薦算法[J].通信學(xué)報(bào),2017,38(10):18?25.

      [9] 許曉飛,常健,楊重柱,等.基于用戶臉部信息的推薦系統(tǒng)設(shè)計(jì)[J].高技術(shù)通訊,2018,28(11):92?99.

      [10] 李瑞遠(yuǎn),洪亮,曾承.多層聚簇中基于協(xié)同過濾的跨類推薦算法[J].小型微型計(jì)算機(jī)系統(tǒng),2017,38(4):657?663.

      [11] 何明,常盟盟,吳小飛.一種基于差分隱私保護(hù)的協(xié)同過濾推薦方法[J].計(jì)算機(jī)研究與發(fā)展,2017,54(7):1439?1451.

      [12] 何明,孫望,肖潤,等.一種融合聚類與用戶興趣偏好的協(xié)同過濾推薦算法[J].計(jì)算機(jī)科學(xué),2017,44(z2):391?396.

      [13] 盛偉,王保云,何苗,等.基于評分相似性的群稀疏矩陣分解推薦算法[J].計(jì)算機(jī)應(yīng)用,2017,37(5):1397?1401.

      [14] 孔欣欣,蘇本昌,王宏志,等.基于標(biāo)簽權(quán)重評分的推薦模型及算法研究[J].計(jì)算機(jī)學(xué)報(bào),2017,40(6):1440?1452.

      [15] 沈晶磊,虞慧群,范貴生,等.基于隨機(jī)森林算法的推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)科學(xué),2017,44(11):164?167.

      猜你喜歡
      攔截器數(shù)據(jù)挖掘關(guān)聯(lián)
      多動能攔截器協(xié)同制導(dǎo)規(guī)律的研究及仿真
      英國MARSS公司推出新型反無人機(jī)攔截器
      無人機(jī)(2022年2期)2022-05-20 06:43:32
      以色列“天鎖”公司展出新式反無人機(jī)攔截器
      輕兵器(2022年5期)2022-05-19 00:56:24
      “苦”的關(guān)聯(lián)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      奇趣搭配
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      浑源县| 德兴市| 河东区| 定远县| 新绛县| 景德镇市| 广南县| 霸州市| 朝阳市| 西乌珠穆沁旗| 修文县| 饶河县| 鞍山市| 涞源县| 游戏| 宜君县| 女性| 习水县| 裕民县| 阿克陶县| 呼伦贝尔市| 辉南县| 土默特右旗| 昔阳县| 仁怀市| 寿阳县| 南乐县| 都兰县| 合作市| 玛多县| 札达县| 郁南县| 抚顺县| 沛县| 日喀则市| 屯昌县| 房山区| 栖霞市| 玛曲县| 拉孜县| 济南市|