• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于用戶畫像的講座信息精準(zhǔn)推送服務(wù)研究*

      2021-12-10 07:43:14楊傳斌樓應(yīng)凡
      數(shù)字圖書館論壇 2021年10期
      關(guān)鍵詞:畫像日志講座

      楊傳斌 樓應(yīng)凡

      (1. 浙江師范大學(xué)信息化辦公室,金華 321004;2. 浙江師范大學(xué)教師教育學(xué)院,金華 321004)

      用戶畫像是指獲取用戶的專業(yè)背景、文化程度、興趣愛好等與用戶需求趨向相關(guān)的信息,以此為基礎(chǔ)進(jìn)行模型化表示,為用戶制定特定標(biāo)簽[1]。圖情領(lǐng)域已有不少學(xué)者開展了將用戶畫像應(yīng)用于圖書館精準(zhǔn)服務(wù)方面的研究:如劉海鷗等[2]通過融合用戶基本信息、內(nèi)容偏好、互動(dòng)、會(huì)話、情境標(biāo)簽的用戶畫像,同時(shí)引入情景化推薦方法實(shí)現(xiàn)圖書館大數(shù)據(jù)知識(shí)個(gè)性化服務(wù)模式;楊傳斌等[3]基于協(xié)同過濾推薦算法分析借書記錄生成動(dòng)態(tài)畫像并考慮畫像權(quán)重問題,再根據(jù)用戶畫像匹配新書屬性來實(shí)現(xiàn)圖書館的新書推薦功能;吳智勤等[4]收集用戶屬性、行為數(shù)據(jù)、社交網(wǎng)絡(luò)大數(shù)據(jù)和互聯(lián)網(wǎng)知識(shí)庫并通過對(duì)社交網(wǎng)絡(luò)分析來構(gòu)建用戶畫像,以此實(shí)現(xiàn)圖書館的個(gè)性化推薦服務(wù)、用戶行為分析和知識(shí)問答功能。

      學(xué)術(shù)講座作為高校知識(shí)交流的平臺(tái),可以增加大學(xué)生與優(yōu)秀學(xué)者面對(duì)面交流的機(jī)會(huì),使得高校的學(xué)術(shù)氛圍濃郁[5]。高校圖書館通常將講座推薦服務(wù)納入業(yè)務(wù)范圍,向在校師生推送講座信息。傳統(tǒng)講座推薦主要通過宣傳海報(bào)的方式,但海報(bào)信息傳播范圍有限。隨著互聯(lián)網(wǎng)的高速發(fā)展,通過QQ、微信或釘釘?shù)溶浖喊l(fā)消息,或通過微信公眾號(hào)進(jìn)行推送是目前高校圖書館推送講座信息的主要方式。它們能很好地將講座信息及時(shí)送達(dá)到學(xué)生,但這種無差別推送也會(huì)使學(xué)生淹沒在海量信息中,以致錯(cuò)過感興趣的講座。如果充分利用用戶畫像技術(shù)來分析學(xué)生偏好、發(fā)現(xiàn)學(xué)生潛在需求,再精準(zhǔn)匹配相對(duì)應(yīng)的講座資源,就能為學(xué)生個(gè)性化推薦講座信息,甚至可以根據(jù)學(xué)生標(biāo)簽信息,有針對(duì)性地開展講座活動(dòng)。除此之外,用戶畫像還會(huì)根據(jù)數(shù)據(jù)的動(dòng)態(tài)更新而不斷更新,緊跟學(xué)生的興趣變化趨勢(shì)。筆者通過數(shù)字化校園平臺(tái)收集學(xué)生數(shù)據(jù),構(gòu)建用戶畫像,最后通過用戶畫像與講座信息的匹配實(shí)現(xiàn)講座信息的精準(zhǔn)推送。

      1 用戶畫像構(gòu)建

      用戶畫像的構(gòu)建主要包括數(shù)據(jù)資源層、數(shù)據(jù)處理層和用戶畫像層。在數(shù)據(jù)資源層利用高校各個(gè)系統(tǒng)和平臺(tái)收集數(shù)據(jù),在數(shù)據(jù)處理層對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,并從基本信息、興趣愛好、學(xué)術(shù)偏向三個(gè)維度構(gòu)建標(biāo)簽體系,在用戶畫像層生成畫像并實(shí)現(xiàn)畫像更新。

      1.1 數(shù)據(jù)資源層

      學(xué)生數(shù)據(jù)來自學(xué)校數(shù)據(jù)中心及各個(gè)有關(guān)應(yīng)用系統(tǒng)(如科研系統(tǒng)、教務(wù)系統(tǒng)、圖書館移動(dòng)服務(wù)平臺(tái)、校園網(wǎng)管理平臺(tái)等),如表1所示,數(shù)據(jù)類型主要分為兩類:一是靜態(tài)數(shù)據(jù),即變化較慢相對(duì)穩(wěn)定的數(shù)據(jù);二是動(dòng)態(tài)數(shù)據(jù),即實(shí)時(shí)變化更新的信息數(shù)據(jù)。其中靜態(tài)數(shù)據(jù)包括學(xué)生的一些基本信息,動(dòng)態(tài)數(shù)據(jù)主要包括學(xué)習(xí)活動(dòng)數(shù)據(jù)、圖書館數(shù)據(jù)、網(wǎng)絡(luò)行為數(shù)據(jù)和學(xué)習(xí)行為數(shù)據(jù),畫像更新的操作也主要是針對(duì)這一類數(shù)據(jù)。

      表1 學(xué)生數(shù)據(jù)類型及來源

      1.2 數(shù)據(jù)處理層

      學(xué)生數(shù)據(jù)主要有結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化3種類型。結(jié)構(gòu)化數(shù)據(jù)相對(duì)較容易收集,如學(xué)生基本信息、學(xué)習(xí)活動(dòng)數(shù)據(jù),這類數(shù)據(jù)只需要進(jìn)行簡(jiǎn)單的清洗和挖掘就可以形成標(biāo)簽;但半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)相對(duì)來說需要更多時(shí)間進(jìn)行前期的預(yù)處理,如網(wǎng)絡(luò)行為數(shù)據(jù)和數(shù)字資源訪問數(shù)據(jù),其原始數(shù)據(jù)大部分存在缺項(xiàng)少值、數(shù)據(jù)異常、冗余、噪聲等問題,為了避免這些問題對(duì)用戶畫像帶來混淆,所以要對(duì)數(shù)據(jù)進(jìn)行提取、清洗、標(biāo)準(zhǔn)化3種方式操作進(jìn)行預(yù)處理來保證數(shù)據(jù)的準(zhǔn)確度和有效性。

      1.2.1 網(wǎng)絡(luò)行為數(shù)據(jù)處理

      由于師生在校園內(nèi)上網(wǎng)需要經(jīng)過學(xué)校統(tǒng)一身份認(rèn)證系統(tǒng)認(rèn)證,這會(huì)在防火墻上留下網(wǎng)絡(luò)訪問日志,每一條日志內(nèi)容包括訪問時(shí)間、IP地址、上網(wǎng)賬戶信息、訪問頁面URL、訪問數(shù)據(jù)庫等內(nèi)容。對(duì)網(wǎng)絡(luò)訪問日志的全面分析能獲得學(xué)生的所有網(wǎng)絡(luò)訪問行為,但日志量非常龐大,自編程難以建立全面的日志分析系統(tǒng),因此有必要借助日志管理分析工具軟件(如日志易)來實(shí)現(xiàn)日志的采集、存儲(chǔ)、處理和分析,其中提供搜索和統(tǒng)計(jì)功能可以單項(xiàng)進(jìn)行測(cè)算,提供的程序接口可以進(jìn)行大量數(shù)據(jù)的處理。目前筆者所在單位的日志系統(tǒng)存儲(chǔ)了約3年的網(wǎng)絡(luò)行為日志,每天的日志數(shù)量在5 000萬條以上,可以有效地開展基于日志的網(wǎng)絡(luò)行為畫像研究。

      為了實(shí)現(xiàn)講座的精準(zhǔn)推薦服務(wù),根據(jù)學(xué)生的網(wǎng)絡(luò)訪問行為總結(jié)其興趣愛好構(gòu)建用戶畫像是必要的。首先,需要對(duì)收集到的日志進(jìn)行網(wǎng)站名歸類,采用機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練,根據(jù)分類好的訓(xùn)練集得到類效果最優(yōu)的映射規(guī)則,建立網(wǎng)頁分類器;然后,采用N-Gram方法來實(shí)現(xiàn)URL特征提取,N-Gram的基本思想是先將文本以N字節(jié)進(jìn)行劃分和滑動(dòng)窗口操作,形成序列,計(jì)算所有字段出現(xiàn)頻率;最后,按照閾值進(jìn)行過濾。把經(jīng)過處理的網(wǎng)絡(luò)日志數(shù)據(jù)作為網(wǎng)站名分類的數(shù)據(jù)集,參考Alexa網(wǎng)站上對(duì)網(wǎng)站名的分類,采用面分類法對(duì)網(wǎng)站進(jìn)行分類,每一分類下根據(jù)排名選取10~30個(gè)網(wǎng)站為子分類,最后將URL網(wǎng)站映射到對(duì)應(yīng)的類別中(見表2)。經(jīng)過試算,按此分類,能將約87%的網(wǎng)絡(luò)行為劃到十大類別內(nèi),隨著挖掘?qū)W生瀏覽網(wǎng)站數(shù)量的增多,分類中的內(nèi)容會(huì)越來越完善[6]。

      表2 URL數(shù)據(jù)源網(wǎng)站名分類

      把每位學(xué)生的網(wǎng)絡(luò)行為中最多的4~6個(gè)類別作為其興趣愛好標(biāo)簽,若需要更加細(xì)化其興趣愛好則需要單獨(dú)列出某子類別作為標(biāo)簽,將其訪問的次數(shù)作為權(quán)重,生成的標(biāo)簽是科普類講座、非學(xué)科性講座推薦的重要依據(jù)。

      1.2.2 圖書館借閱數(shù)據(jù)的提取

      通過圖書管理系統(tǒng)提取學(xué)生借閱書籍的中圖分類號(hào),再根據(jù)中圖分類號(hào)所代表的圖書類別標(biāo)記該學(xué)生的興趣愛好,學(xué)生所借圖書的數(shù)量和借期長(zhǎng)短可用來計(jì)算對(duì)應(yīng)的權(quán)重。為了驗(yàn)證該方法的可行性,通過圖書管理系統(tǒng)采集某高校圖書館8個(gè)月內(nèi)11 862名學(xué)生的110 104條借書數(shù)據(jù),其中包含9 896種中圖分類號(hào),說明根據(jù)中圖分類號(hào)來描述學(xué)生的興趣愛好是相當(dāng)細(xì)分的。若可選取中圖分類號(hào)的前面部分,只選首字母則只有22個(gè)大類,如A為馬列、B為哲學(xué)宗教、T為工業(yè)技術(shù)等,但用它去匹配講座明顯范圍太廣,為此將借書的中圖分類號(hào)分為三個(gè)層次:第一為大類即為首字母,共22個(gè)標(biāo)簽;第二為中類即為首3個(gè)字母的,共約500個(gè)標(biāo)簽,如TP3為計(jì)算機(jī)技術(shù);第三為細(xì)類,即完整的分類號(hào),如TP311.5為軟件工程,全部的標(biāo)簽約有10 000個(gè)。通過這樣的層次劃分,學(xué)生借一本圖書就形成3個(gè)標(biāo)簽,分別從三個(gè)層次去匹配講座,兼顧了匹配成功率和精準(zhǔn)度。

      1.2.3 數(shù)字資源訪問行為的提取

      圖書館數(shù)字資源訪問行為分析是了解學(xué)生學(xué)習(xí)和研究興趣的重要來源,數(shù)字資源分為本地資源和外網(wǎng)資源兩類,本地資源一般通過校園網(wǎng)直接訪問,外網(wǎng)資源通過校園網(wǎng)出口IP地址驗(yàn)證訪問,若在校園網(wǎng)外則通過VPN/WEBVPN訪問,要取得其訪問行為需要分析防火墻日志,且比前述的網(wǎng)絡(luò)行為分類統(tǒng)計(jì)復(fù)雜許多。目前大多數(shù)高校圖書館都部署了統(tǒng)一檢索系統(tǒng),而統(tǒng)一檢索系統(tǒng)可實(shí)現(xiàn)基于中外文資源元數(shù)據(jù)及多種文獻(xiàn)類型的一站式檢索并能直接定位到來源數(shù)據(jù)庫獲取全文;部分高校還部署了電子資源訪問控制系統(tǒng),通過身份認(rèn)證進(jìn)行訪問控制,具備資源使用統(tǒng)計(jì)、讀者行為分析等功能。為了掌握學(xué)生的學(xué)習(xí)研究興趣點(diǎn),通過這兩個(gè)系統(tǒng)的日志能直接獲得所有學(xué)生的檢索詞及其頻度,計(jì)算后可作為標(biāo)簽的名稱和權(quán)重,簡(jiǎn)化了學(xué)生研究興趣的獲取。

      1.3 用戶畫像層

      1.3.1 用戶畫像維度體系

      根據(jù)數(shù)字化校園平臺(tái)收集到數(shù)據(jù)的分析以及用戶畫像的需求,設(shè)定用戶畫像維度體系,由基本信息、興趣愛好和學(xué)術(shù)偏向三個(gè)維度組成?;拘畔⒕S度包括姓名、性別、學(xué)號(hào)、民族、籍貫、學(xué)位學(xué)歷、在籍情況和年級(jí);興趣愛好維度包括參加社團(tuán)情況、參加學(xué)術(shù)報(bào)告情況、已參加講座情況、參加學(xué)校學(xué)院活動(dòng)情況、圖書館借閱情況、數(shù)字圖書館訪問情況、網(wǎng)絡(luò)課程選取情況、經(jīng)常訪問網(wǎng)站信息、愛好特長(zhǎng)和擔(dān)任職務(wù);學(xué)術(shù)偏向維度包括研究方向、所屬學(xué)院、所屬專業(yè)、學(xué)習(xí)經(jīng)歷、必修課程情況、選修課程情況、承擔(dān)課題情況。

      1.3.2 標(biāo)簽生成

      用戶標(biāo)簽分靜態(tài)標(biāo)簽和動(dòng)態(tài)標(biāo)簽兩類,靜態(tài)標(biāo)簽是最基礎(chǔ)的標(biāo)簽,由靜態(tài)數(shù)據(jù)(如姓名、性別、民族、籍貫、學(xué)位學(xué)歷、在籍情況、所屬學(xué)院、所屬專業(yè)等)形成。將這類靜態(tài)標(biāo)簽直接寫入用戶畫像,這類標(biāo)簽就是用戶畫像的基礎(chǔ)標(biāo)簽。對(duì)于學(xué)生的靜態(tài)數(shù)據(jù)采用本體的建模方式,構(gòu)建定性用戶畫像,畫像產(chǎn)出形式為關(guān)鍵詞法。動(dòng)態(tài)標(biāo)簽是根據(jù)動(dòng)態(tài)數(shù)據(jù)形成,動(dòng)態(tài)標(biāo)簽根據(jù)形成方式不同,分為統(tǒng)計(jì)類動(dòng)態(tài)標(biāo)簽和挖掘類動(dòng)態(tài)標(biāo)簽。對(duì)于統(tǒng)計(jì)類動(dòng)態(tài)數(shù)據(jù),根據(jù)建模方式的不同,分為基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì)和網(wǎng)絡(luò)日志數(shù)據(jù)統(tǒng)計(jì)。對(duì)于基礎(chǔ)數(shù)據(jù)的統(tǒng)計(jì),這類數(shù)據(jù)主要包括網(wǎng)絡(luò)課程數(shù)據(jù)等。采用融合用戶興趣的建模方法,采用向量空間模型來進(jìn)行表示,即ID{(α1,β1),(α2,β2),…(αn,βn)}。其中,αn表示特征項(xiàng),βn表示αn在整個(gè)模型中的權(quán)重,即用戶對(duì)αn的喜愛程度,當(dāng)βn越大,說明用戶對(duì)這個(gè)事情越感興趣,確定當(dāng)數(shù)值超過閾值N,則將它加入畫像中。對(duì)于網(wǎng)絡(luò)日志分類統(tǒng)計(jì)是在基礎(chǔ)數(shù)據(jù)統(tǒng)計(jì)之上引入占比的概念,根據(jù)網(wǎng)絡(luò)日志數(shù)據(jù)的分析,每一個(gè)學(xué)生都會(huì)生成十大類網(wǎng)站訪問數(shù)據(jù)量,可以將數(shù)據(jù)表示為:Student{(t1,p1,n1),(t2,p2,n2),…,(tm,pm,nm)}(m<11),其中,tm表示第m個(gè)網(wǎng)站主題,pm表示學(xué)生對(duì)第m個(gè)網(wǎng)站主題瀏覽量占總網(wǎng)站的比例,nm表示學(xué)生訪問第m個(gè)網(wǎng)站主題的次數(shù),之后可以將占比排名前N'(閾值N'')的類別標(biāo)簽加入畫像。對(duì)于挖掘類動(dòng)態(tài)數(shù)據(jù),第一部分是基礎(chǔ)數(shù)據(jù)挖掘,這類數(shù)據(jù)主要包括學(xué)生參與的各類活動(dòng)以及參加過的講座信息。對(duì)于這一類數(shù)據(jù)一般采用TF-IDF方法即詞頻-逆向文件頻率計(jì)算方法,將所得的動(dòng)態(tài)標(biāo)簽標(biāo)記到用戶畫像中。

      1.3.3 用戶畫像的生成

      在對(duì)數(shù)據(jù)進(jìn)行清洗、集成、分析的基礎(chǔ)之上生成標(biāo)簽,將標(biāo)簽打在目標(biāo)學(xué)生的畫像模型上,通常用一組標(biāo)簽來描述一個(gè)學(xué)生,這些標(biāo)簽從多個(gè)維度不同層面描述學(xué)生整體特征。最終生成多層次畫像標(biāo)簽,主要包含3個(gè)方面內(nèi)容,即基本信息、興趣愛好和學(xué)術(shù)偏向。形成用戶畫像之后,可以據(jù)此實(shí)現(xiàn)對(duì)學(xué)生的需求進(jìn)行預(yù)測(cè),通過相似度計(jì)算來實(shí)現(xiàn)講座信息的精準(zhǔn)推薦服務(wù)。例如,某同學(xué)的用戶畫像如下。

      {基本信息:女,202020200871,漢,浙江紹興,研究生,在籍,研二;

      興趣愛好:攝影協(xié)會(huì),“基于核心素養(yǎng)的小學(xué)數(shù)學(xué)解題思想觀”,“新自由主義情境下教師專業(yè)理論的跨國研究”,“語文作業(yè)與簡(jiǎn)單課堂”,古典舞,閱讀,(科技類,31.4%,2 135),(音樂類,20.5%,1 243),(G434,計(jì)算機(jī)化教學(xué)),(TP391.1,文字信息處理);

      學(xué)術(shù)偏向:教師教育學(xué)院,教育技術(shù)學(xué),電子化學(xué)習(xí)資源與環(huán)境研究,教學(xué)設(shè)計(jì),教育理論,教育改革研究,智慧教育}

      1.3.4 用戶畫像的興趣衰減和權(quán)重

      隨著時(shí)間的推移,學(xué)生的興趣也會(huì)不斷變化,為了更好地根據(jù)當(dāng)前學(xué)生的狀態(tài)來推薦講座,所以需要考慮學(xué)生最近新增加的行為或者愛好。對(duì)于靜態(tài)數(shù)據(jù)權(quán)重保持不變,動(dòng)態(tài)數(shù)據(jù)將充分利用窗口滑動(dòng)機(jī)制,定時(shí)更新標(biāo)簽權(quán)重。每個(gè)用戶畫像動(dòng)態(tài)數(shù)據(jù)標(biāo)簽都有相應(yīng)的權(quán)重W,畫像更新的間隔時(shí)間定為T,計(jì)算學(xué)生的動(dòng)態(tài)標(biāo)簽權(quán)重變化,根據(jù)變化情況進(jìn)行增刪,并將更新后的標(biāo)簽數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫中。

      記學(xué)生前一次的標(biāo)簽權(quán)重為Wlast,每間隔時(shí)間T后,學(xué)生原有的興趣程度會(huì)隨著時(shí)間推移發(fā)生相應(yīng)的減弱,加入時(shí)間衰減因子α,新增加的標(biāo)簽權(quán)重記為Wnew,充分考慮學(xué)生的興趣隨著時(shí)間發(fā)生變化的用戶畫像標(biāo)簽,更新后的標(biāo)簽權(quán)重為Wupdate,計(jì)算過程為:Wupdate=Wlast×α+Wnew。關(guān)于時(shí)間衰減的函數(shù),根據(jù)發(fā)生時(shí)間的先后為用戶行為數(shù)據(jù)分配權(quán)重。時(shí)間衰減是指用戶的行為會(huì)隨著時(shí)間減弱,歷史行為和當(dāng)前的相關(guān)性不斷減弱,在建立與時(shí)間衰減相關(guān)的函數(shù)時(shí),套用牛頓冷卻定律數(shù)學(xué)模型。其描述的場(chǎng)景是一個(gè)溫度高的物體在溫度低的環(huán)境下,物體的溫度要降低,周圍環(huán)境溫度要上升,最后二者的溫度一致,在這個(gè)平衡的過程中,物體的溫度F(t)是隨著時(shí)間t的增長(zhǎng)而呈現(xiàn)指數(shù)型衰減,其溫度衰減公式為:F(t)=初始溫度×exp(-冷卻系數(shù)α×間隔的時(shí)間),其中α為衰減常數(shù),通過回歸可計(jì)算得出。例如:指定45分鐘后物體溫度為初始溫度的0.5,即0.5=1×exp(-α×45),求得α=0.015 4。應(yīng)用到我們的興趣愛好,假設(shè)1個(gè)月后的興趣愛好下降到原來的90%,即0.9,按照牛頓冷卻定律0.9=1×exp(-α×1)求得冷卻系數(shù)α=0.105 0,也可根據(jù)不同興趣愛好特征設(shè)置不同的衰減常數(shù)α。具體實(shí)踐中T可選1個(gè)月,即每個(gè)月初計(jì)算一次學(xué)生的興趣愛好。

      2 講座信息的精準(zhǔn)推送服務(wù)

      2.1 講座特征提取

      講座推薦是用戶興趣需求和講座匹配的過程,因此需要把講座的屬性特征做向量處理,以方便計(jì)算,處理方式與畫像的生成方式類似。講座的特征提取包括講座名稱、類別、主講人基本信息、主講人所屬學(xué)校、主講人專業(yè)方向、承辦學(xué)院、主題詞(3~10個(gè)),其中主題詞生成的時(shí)候要考慮與構(gòu)建的用戶畫像匹配,如根據(jù)講座內(nèi)容設(shè)置主題詞為“科技類”、“音樂類”(與網(wǎng)絡(luò)行為匹配)、“軟件工程”(與借書記錄TP311.5匹配)等。

      2.2 推薦算法

      利用大數(shù)據(jù)平臺(tái)構(gòu)建用戶畫像以及提取講座的特征,再通過相關(guān)推薦算法找到講座的目標(biāo)群體,在學(xué)生群體里查找該類群體,將講座信息內(nèi)容發(fā)送給相關(guān)學(xué)生。比較現(xiàn)有的推薦算法的優(yōu)缺點(diǎn)之后,筆者采用的是基于內(nèi)容的推薦算法和基于物品的協(xié)同過濾算法[7]。

      2.2.1 基于內(nèi)容的推薦算法

      基于內(nèi)容的推薦算法可以根據(jù)學(xué)生各種信息數(shù)據(jù)組成的畫像來找到用戶喜歡的講座類型,通過對(duì)講座的相關(guān)信息統(tǒng)一成一套標(biāo)準(zhǔn)化的描述統(tǒng)計(jì)方式,然后計(jì)算得到該講座是否是某學(xué)生感興趣的類型,如果是就推送給學(xué)生。實(shí)現(xiàn)過程采用基于知網(wǎng)(HowNet)的語義相似度[8]。

      將用戶畫像中的關(guān)鍵詞和即將舉辦的講座關(guān)鍵詞,根據(jù)知網(wǎng)相似度進(jìn)行對(duì)比,若有關(guān)鍵詞相同則直接推送;若沒有相同關(guān)鍵詞,但有多個(gè)關(guān)鍵詞語義相似度達(dá)到或超過閾值,也將講座信息推送給學(xué)生;若達(dá)不到閾值,則不推送講座信息。

      2.2.2 基于物品的協(xié)同過濾算法

      基于物品的協(xié)同過濾算法就是收集用戶之前的一些喜愛物品數(shù)據(jù),在此基礎(chǔ)上為用戶推薦類似的物品。本文選用Jaccard相似度來實(shí)現(xiàn)。當(dāng)Jaccard(X,Y)數(shù)值越大,說明講座之間越相似[9],當(dāng)新舊講座之間的相似度達(dá)到閾值,則將新講座信息推送給參與過舊講座的學(xué)生。

      2.3 推薦結(jié)果的生成和發(fā)送

      許多高校在建設(shè)智慧校園過程中都建立了基于統(tǒng)一身份認(rèn)證的消息中心,根據(jù)用戶畫像與講座資源匹配的情況定時(shí)定向地將消息發(fā)送給學(xué)生,實(shí)現(xiàn)消息發(fā)送的自動(dòng)化,減輕管理人員的負(fù)擔(dān)。在消息通知中心可以選擇郵件、短信、釘釘、微信和智能渠道的方式向?qū)W生推送合適的講座信息。

      在推送講座信息下方有感興趣/不感興趣選項(xiàng),及時(shí)了解學(xué)生對(duì)推送內(nèi)容是否感興趣;在推送中及時(shí)提醒學(xué)生去講座報(bào)名系統(tǒng)報(bào)名。在實(shí)踐過程中,可能會(huì)存在相似度閾值偏高或者學(xué)生時(shí)間沖突,導(dǎo)致在講座報(bào)名系統(tǒng)中報(bào)名人數(shù)明顯偏少,因此可以相應(yīng)降低相似度閾值,再次向沒有收到推送但在相似度范圍內(nèi)的學(xué)生發(fā)送講座信息,及時(shí)增加報(bào)名人數(shù),確保有基本的參加人數(shù)。

      3 結(jié)語

      高校講座資源豐富,但如何在眾多講座資源中滿足學(xué)生的個(gè)性化資源需求是當(dāng)前講座管理需要面對(duì)的重要挑戰(zhàn)。隨著大數(shù)據(jù)技術(shù)、用戶畫像技術(shù)等不斷發(fā)展,為學(xué)生提供個(gè)性化服務(wù)也有了更大的發(fā)展空間。通過學(xué)生基本信息、興趣愛好、學(xué)術(shù)偏向三個(gè)維度構(gòu)建學(xué)生的多維畫像模型,結(jié)合用戶畫像與講座屬性的匹配及推薦算法實(shí)現(xiàn)個(gè)性化推薦,講座舉辦方只需提供講座信息,其余都可以通過系統(tǒng)自動(dòng)完成推薦,隨著應(yīng)用數(shù)據(jù)的不斷深入完善和算法的不斷優(yōu)化,講座信息的服務(wù)也將越來越精準(zhǔn)。除給學(xué)生提供精準(zhǔn)服務(wù)外,還可以通過分析用戶畫像中興趣愛好維度和學(xué)術(shù)偏向維度中的標(biāo)簽變化來了解學(xué)生需求,對(duì)講座開設(shè)的內(nèi)容提出建議,有針對(duì)性地邀請(qǐng)有關(guān)專家開展講座,提高講座的質(zhì)量和聽眾滿意度。

      猜你喜歡
      畫像日志講座
      威猛的畫像
      一名老黨員的工作日志
      “00后”畫像
      畫像
      扶貧日志
      心聲歌刊(2020年4期)2020-09-07 06:37:14
      游學(xué)日志
      他只做有“思享”的講座,讓小小微信裝下一個(gè)“萬人體育場(chǎng)”
      山東青年(2016年3期)2016-02-28 14:25:46
      書法史講座(十二)
      書法史講座(五)
      潛行與畫像
      青浦区| 美姑县| 铅山县| 宁强县| 赣榆县| 漳浦县| 红原县| 名山县| 广安市| 镇原县| 五原县| 西丰县| 侯马市| 汶上县| 灌阳县| 文成县| 津南区| 天津市| 七台河市| 邹城市| 白玉县| 杂多县| 江阴市| 凤翔县| 阿拉善盟| 广平县| 瓮安县| 抚远县| 鄂伦春自治旗| 崇礼县| 金川县| 云安县| 皋兰县| 炎陵县| 石棉县| 满城县| 当雄县| 盐边县| 米易县| 融水| 浑源县|