• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)字科技館展品個(gè)性化推薦系統(tǒng)設(shè)計(jì)

      2023-04-11 19:10:14趙智姚爽韓丹
      互聯(lián)網(wǎng)周刊 2023年7期

      趙智 姚爽 韓丹

      摘要:隨著科技館行業(yè)的蓬勃發(fā)展,在互聯(lián)網(wǎng)技術(shù)的推動(dòng)下,數(shù)字科技館應(yīng)運(yùn)而生。但國內(nèi)外科技館的種類、數(shù)量眾多,展品數(shù)量更是不計(jì)其數(shù),因此用戶很難從大量的展品信息中快速搜索到自己需要的信息。本文分析了原有的協(xié)同過濾(CF)算法,指出了兩種CF算法存在的不足之處,在此基礎(chǔ)上進(jìn)行了修正,提出了一種改進(jìn)的基于相關(guān)相似性的CF算法,并設(shè)計(jì)了一套具有推薦功能的數(shù)字科技館展品個(gè)性化推薦系統(tǒng)。

      關(guān)鍵詞:數(shù)字科技館;協(xié)同過濾技術(shù);MAE;個(gè)性化推薦系統(tǒng)

      引言

      2021年12月,中國科學(xué)技術(shù)協(xié)會(huì)印發(fā)《現(xiàn)代科技館體系發(fā)展“十四五”規(guī)劃(2021—2025年)》,其中對(duì)全國科技館智慧化建設(shè)以及利用信息化手段促進(jìn)科技館體系協(xié)同聯(lián)動(dòng)發(fā)展做出了明確說明[1]。因此,為全面提高公眾科學(xué)素質(zhì),滿足新時(shí)代公眾對(duì)科普服務(wù)的新需求,我國科技館行業(yè)實(shí)現(xiàn)了線上線下相結(jié)合,線上虛擬科技館、網(wǎng)上虛擬瀏覽,網(wǎng)上互動(dòng)展品展示等基于互聯(lián)網(wǎng)的新型數(shù)字科技館。然而各類科技館眾多,館內(nèi)展品的種類和數(shù)量也是不計(jì)其數(shù),面對(duì)海量展品數(shù)據(jù)人們很難快速搜索到自己需要的信息。針對(duì)這一難題,開發(fā)一款個(gè)性化推薦系統(tǒng)為用戶推薦其感興趣的展品信息勢(shì)在必行[2]。

      個(gè)性化推薦可以實(shí)現(xiàn)根據(jù)不同用戶的需求量身定制個(gè)性化的服務(wù)??v觀已有的個(gè)性化推薦系統(tǒng),主要存在以下問題:

      (1)缺乏有效數(shù)據(jù)

      在收集用戶有效信息時(shí),大多數(shù)推薦系統(tǒng)都是要求用戶在瀏覽網(wǎng)頁時(shí)通過調(diào)查問卷的形式對(duì)所關(guān)注的商品進(jìn)行評(píng)價(jià),這很容易引起用戶的反感,因此無法保證數(shù)據(jù)的真實(shí)性、準(zhǔn)確性,導(dǎo)致新用戶的推薦信息匱乏,降低了系統(tǒng)的推薦精度。

      (2)計(jì)算效率問題

      針對(duì)一個(gè)用戶,以往的推薦系統(tǒng)可以實(shí)現(xiàn)實(shí)時(shí)查找其上萬個(gè)鄰居,但實(shí)際應(yīng)用時(shí)同時(shí)瀏覽網(wǎng)頁的用戶不計(jì)其數(shù),算法的計(jì)算復(fù)雜度高,推薦系統(tǒng)的實(shí)時(shí)推薦效率低。

      1. 數(shù)字科技館展品推薦系統(tǒng)的關(guān)鍵技術(shù)

      1.1 核心工作原理

      本文所設(shè)計(jì)的科技館展品推薦系統(tǒng),算法的計(jì)算過程如下:

      將輸入數(shù)據(jù)表述為一個(gè)i*j的用戶-展品評(píng)價(jià)矩陣R,矩陣元素ri,j表示第i個(gè)用戶對(duì)第j個(gè)展品的評(píng)分值。

      第一步:輸入為評(píng)價(jià)矩陣R,即用戶-展品評(píng)價(jià)矩陣,表述為i*j。i是原用戶數(shù),j是用戶瀏覽的展品數(shù)。矩陣元素ri,j表示第i個(gè)用戶對(duì)第j個(gè)展品的評(píng)分值。

      用戶已評(píng)分的展品信息數(shù)目用|Ii|表示,即用戶i評(píng)分向量的長度。

      通過上式計(jì)算出原用戶對(duì)其所有瀏覽過的展品信息的平均打分。

      第二步:預(yù)測新用戶對(duì)其未瀏覽展品的預(yù)測值。這一步關(guān)鍵是計(jì)算與新用戶興趣度相似的N個(gè)原用戶,即最近鄰用戶。根據(jù)其最近鄰用戶對(duì)展品信息的評(píng)價(jià)預(yù)測新用戶對(duì)相同展品的評(píng)價(jià)值paj。在該算法中,只有與用戶相似的N個(gè)鄰居參與計(jì)算。因此算法的核心是計(jì)算用戶a與用戶i的興趣相似度sim(a,b)。

      1.2 原有相似性算法分析

      余弦相似性度量方法:

      在余弦相似性度量方法中,將新用戶沒有評(píng)分的項(xiàng)目的評(píng)分均假設(shè)為0,這樣可以有效提高計(jì)算性能。但在展品信息量巨大,而用戶評(píng)價(jià)信息極少的情況下,這種假設(shè)的可信度不高。因?yàn)閷?shí)際應(yīng)用中龐大的用戶喜好千差萬別,不可能全部一樣。這樣的假設(shè)會(huì)導(dǎo)致推薦質(zhì)量下降。

      相關(guān)相似性的度量方法:

      在相關(guān)相似性的度量方法中,所選用的數(shù)據(jù)是兩用戶共同評(píng)分的項(xiàng)目,保證了參與計(jì)算的數(shù)據(jù)都是真實(shí)數(shù)據(jù)。但實(shí)際情況是,在大多數(shù)情況下兩用戶共同評(píng)價(jià)的展品少之又少,并且很難找到。因此,僅憑兩用戶對(duì)幾項(xiàng)展品有相同的興趣就判斷兩用戶為相似用戶,將原有用戶的所有瀏覽展項(xiàng)都推送給新用戶,這種推薦質(zhì)量是極低的。

      綜上,在相似度的計(jì)算中,首先,要保證參與計(jì)算的評(píng)分?jǐn)?shù)據(jù)都是真實(shí)數(shù)據(jù),不能一概假設(shè)為0,從而滿足推薦精度;其次,在數(shù)據(jù)選擇上要選取共同評(píng)分?jǐn)?shù)量較多的兩用戶才能成為最近鄰居,同時(shí)對(duì)項(xiàng)目評(píng)分較少的用戶不能考慮;最后,實(shí)現(xiàn)實(shí)時(shí)推送就要降低算法的計(jì)算復(fù)雜度從而提高算法的計(jì)算效率。

      1.3 基于相關(guān)相似性的CF算法改進(jìn)

      基于以上分析的三點(diǎn),我們對(duì)原有基于相關(guān)相似性的計(jì)算方法做了兩點(diǎn)改進(jìn),設(shè)計(jì)了一種新的度量方法:

      第一,將用戶a和用戶b共同評(píng)分的項(xiàng)目數(shù)量與用戶a選擇的項(xiàng)目總數(shù)的比值作為調(diào)節(jié)系數(shù),即S=∩(a,b)/∪(a)(比值公式:將用戶a和用戶b共同評(píng)分的項(xiàng)目數(shù)量與用戶a選擇的項(xiàng)目總數(shù)的比值作為調(diào)節(jié)系數(shù))。從該式中可以看出,當(dāng)原用戶與新用戶共同評(píng)分的展品數(shù)目較多時(shí),S值偏大;反之則較小。由此可以控制共同評(píng)分?jǐn)?shù)量較多的兩用戶才能成為最近鄰居,從而提高推薦精度。

      第二,在實(shí)驗(yàn)中發(fā)現(xiàn),最終結(jié)果會(huì)受raj和ra及rbj和rb差值符號(hào)的影響。若raj 和 rbj一個(gè)大于其均值,另一個(gè)小于均值,那么其乘積結(jié)果為負(fù)數(shù),導(dǎo)致計(jì)算后得出的相似度值為負(fù)數(shù),造成新用戶對(duì)其未評(píng)分的展品信息的推薦分?jǐn)?shù)明顯偏小,最終影響推薦結(jié)果。因此,為了保證相似度結(jié)果為正數(shù),我們將raj和ra及rbj和rb差值的乘積加絕對(duì)值。糾正因計(jì)算結(jié)果負(fù)數(shù)帶來的誤差。

      上式為最終改進(jìn)的相似度計(jì)算方法。從式中可以看出,此計(jì)算結(jié)果可以保證大量參與評(píng)分,且評(píng)分項(xiàng)目種類大致相同的用戶才能成為最近鄰。

      2. 實(shí)驗(yàn)結(jié)果及分析

      實(shí)驗(yàn)選用MovieLens數(shù)據(jù)集。我們抽取了943位用戶對(duì)1682部電影的評(píng)價(jià)數(shù)據(jù)共10萬個(gè)。評(píng)價(jià)數(shù)據(jù)為1到5,5分為評(píng)價(jià)數(shù)據(jù)最高值,其余依次降低。

      本文選用統(tǒng)計(jì)精度度量方法。MAE值越小,預(yù)測的準(zhǔn)確度越高。

      {p1,p2, …, pN}表示預(yù)測的用戶評(píng)分集合, {q1,q2, …,qN}為對(duì)應(yīng)的實(shí)際用戶評(píng)分集合,則平均絕對(duì)偏差MAE 表示為:

      我們分別計(jì)算了原有的兩種相似性MAE值和在相關(guān)相似性基礎(chǔ)上進(jìn)行改進(jìn)的MAE值。

      鄰居集中鄰居個(gè)數(shù)逐步增加,從而查看最近鄰居集數(shù)量對(duì)預(yù)測效果的影響,實(shí)驗(yàn)結(jié)果如表1所示。

      實(shí)驗(yàn)表明:本文提出的改進(jìn)算法鄰居集從5到40個(gè)絕對(duì)偏差由0.87到0.64逐漸降低,同原有基于余弦相似性和基于相關(guān)相似性算法相比,MAE值明顯變小,取得較好效果,如圖1所示。

      3. 科技館展品推薦系統(tǒng)工作流程設(shè)計(jì)

      3.1 構(gòu)造用戶興趣集

      科技館展品推薦系統(tǒng)中自動(dòng)分析數(shù)據(jù)庫中存入的用戶個(gè)人信息。用戶信息可以通過以下三種方式獲?。?/p>

      (1)邀請(qǐng)用戶注冊(cè)。在注冊(cè)過程中,直接收集用戶的喜好,這種方式收集到的興趣信息直接且準(zhǔn)確。

      (2)隱式搜索用戶信息。對(duì)于沒有注冊(cè)的用戶,則采用跟蹤用戶瀏覽展品信息的行為進(jìn)行興趣的收集,如瀏覽展品的頻次、下載展品的類型、檢索、收藏等信息。這種方法收集到的信息會(huì)存在“雜音”,需要在后臺(tái)進(jìn)行修正和篩選,從而不斷完善用戶的興趣信息。

      3.2 構(gòu)造展品資源集

      收集各科技館的展品信息,將展品數(shù)字化,構(gòu)建展品信息庫。

      3.3 構(gòu)造用戶——展品評(píng)價(jià)矩陣

      根據(jù)收集的用戶興趣集合展品信息集建立用戶——展品評(píng)價(jià)矩陣。

      3.4 計(jì)算用戶之間的相似度,找出最近鄰居

      根據(jù)用戶之間的共同喜好,計(jì)算最近鄰的相似度。算法采用改進(jìn)的基于相關(guān)相似性的相似性度量方法。

      3.5 計(jì)算推薦集,產(chǎn)生推薦

      根據(jù)計(jì)算出來的用戶相似度計(jì)算推薦結(jié)果,預(yù)測新用戶對(duì)其未瀏覽展品的預(yù)測值,產(chǎn)生新用戶推薦。

      結(jié)語

      實(shí)體科技館在其數(shù)字化演進(jìn)的過程中,逐步由“解釋它們是誰”變成“與它們的公眾之間建立對(duì)話關(guān)系”,科技館再也不僅僅是展品的“儲(chǔ)藏室”,而是與用戶進(jìn)行社交互動(dòng)的平臺(tái)[3]。利用人工智能,通過數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)展品信息的個(gè)性化推薦勢(shì)在必行。

      本文主要針對(duì)個(gè)性化推薦系統(tǒng)中協(xié)同過濾算法進(jìn)行了分析和研究。在分析過程中,發(fā)現(xiàn)了原有相似性度量方法中存在的問題,并對(duì)其進(jìn)行了兩點(diǎn)改進(jìn):引入調(diào)節(jié)系數(shù) S=∩(a,b)/∪(a),保證共同評(píng)分較多的兩用戶成為最近鄰居;糾正了相關(guān)相似性取值正負(fù)的問題。實(shí)驗(yàn)證明,該算法同傳統(tǒng)CF算法相比能顯著提高推薦精度。最后基于改進(jìn)的算法,設(shè)計(jì)了數(shù)字科技館展品個(gè)性化推薦系統(tǒng)的工作流程。在展品推薦系統(tǒng)的工作流程中,展品資源的完善是我們需要努力解決的問題。將展品轉(zhuǎn)化為可以利用的數(shù)字資源,集合整理國內(nèi)外數(shù)字展品信息構(gòu)造展品資源集是我們今后努力的方向。

      參考文獻(xiàn):

      [1]任賀春,趙錚.智慧服務(wù)智慧管理智慧共享——數(shù)字科技館轉(zhuǎn)型升級(jí)促進(jìn)科技館體系智慧化發(fā)展[J].自然科學(xué)博物館研究,2022,7(1):58-63,113.

      [2]馬宇罡,莫小丹,苑楠,等.中國特色現(xiàn)代科技館體系建設(shè):歷史、現(xiàn)狀、未來[J].科技導(dǎo)報(bào)2021,39(10):34-47.

      [3]何如珍.干部在線學(xué)習(xí)資源個(gè)性化推薦系統(tǒng)研究[J].電子技術(shù)與軟件工程,2022,(13):259-262.

      作者簡介:趙智,碩士研究生,高級(jí)工程師,研究方向:人工智能與數(shù)據(jù)挖掘。

      高阳县| 永昌县| 镇康县| 嘉禾县| 长沙县| 乃东县| 仙桃市| 曲水县| 德清县| 布尔津县| 阳高县| 新宁县| 六盘水市| 和硕县| 镶黄旗| 门头沟区| 历史| 谢通门县| 乃东县| 临沂市| 沛县| 宣武区| 边坝县| 安图县| 北川| 舞钢市| 凤台县| 廊坊市| 临西县| 自治县| 湖北省| 阿拉善左旗| 天台县| 民勤县| 垫江县| 山丹县| 云和县| 开封市| 西安市| 化州市| 旬阳县|