• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于知識圖譜的大數(shù)據(jù)學習推薦方法的研究應(yīng)用

      2024-10-31 00:00:00魏源鋒
      互聯(lián)網(wǎng)周刊 2024年20期

      摘要:隨著以知識圖譜為核心的新一代人工智能技術(shù)日趨成熟,基于大數(shù)據(jù)的在線教育推薦方法成為重要研究課題。推薦系統(tǒng)利用知識圖譜表示項目之間的潛在關(guān)系,將學習資源及其屬性映射至知識圖譜中,挖掘其內(nèi)在的關(guān)聯(lián)性,使推薦結(jié)果更具有解釋性?;诖?,要充分利用知識圖譜構(gòu)建學習過程交互的教育體系,融合多種課程資源,加強學習者由感知智能向認知智能的變遷,加強基于知識圖譜的異質(zhì)化信息協(xié)同,提高學習者個性化推薦的性能。

      關(guān)鍵詞:知識圖譜;大數(shù)據(jù);學習推薦方法

      引言

      推薦系統(tǒng)是根據(jù)用戶的興趣和偏好,向其提供個性化推薦的技術(shù)和方法。隨著強化學習、對比學習、注意力機制、知識圖譜等先進人工智能技術(shù)的推廣,推薦系統(tǒng)獲得了新的發(fā)展機遇,有效緩解了傳統(tǒng)推薦系統(tǒng)所面臨的數(shù)據(jù)稀疏等問題。基于此,本文重點關(guān)注和探討基于知識圖譜的大數(shù)據(jù)學習推薦方法的應(yīng)用,將知識圖譜作為學習輔助和支持,添加到學習者個性化學習資源推薦算法體系,引導學習者進行知識梳理和呈現(xiàn),快速尋找適宜的學習資源和方法,提高學習推薦方法的應(yīng)用效果。

      1. 概述

      知識圖譜的實現(xiàn)前提是基于廣覆蓋、深層次的語義網(wǎng)絡(luò),進行各實體間不同語義關(guān)系的表達,廣泛應(yīng)用于文本理解、推薦系統(tǒng)、自然語言問答等方面,通過知識抽取、知識融合、知識推理等融合技術(shù)獲取可讀知識。

      基于知識圖譜的推薦系統(tǒng)是運用知識圖譜中的實體、屬性、關(guān)系等信息,向用戶推薦其可能感興趣的學習或服務(wù)。其構(gòu)成主要包括:(1)知識圖譜的構(gòu)建。以實體、屬性、關(guān)系等要素作為載體,表示某領(lǐng)域知識的結(jié)構(gòu)、組織方式。(2)用戶建模。基于用戶的興趣、偏好和學習需求,通過建模獲悉用戶的歷史行為數(shù)據(jù)和個人信息,對其進行必要反饋。(3)知識推理。利用知識圖譜的知識和關(guān)系進行推理、分析,把握實體的內(nèi)在關(guān)聯(lián)和規(guī)律性,向其進行準確化、個性化的推薦。(4)推薦生成。根據(jù)用戶建模和知識推理,獲取實體的屬性或關(guān)系,自動生成相似性、關(guān)聯(lián)性、個性化內(nèi)容。(5)推薦評估和反饋。系統(tǒng)評估推薦結(jié)果的質(zhì)量,根據(jù)用戶反饋進行及時調(diào)整和優(yōu)化[1]。

      2. 基于知識圖譜的學習者個性化學習資源推薦應(yīng)用

      引入更加先進合理的個性化推薦方法,利用大數(shù)據(jù)、互聯(lián)網(wǎng)等信息化技術(shù)挖掘?qū)W習者的行為數(shù)據(jù),為學習者提供個性化、定制化的決策支持和學習服務(wù)。

      2.1 基于嵌入的學習方法

      采用圖嵌入的方法對實體關(guān)系進行表征,實施基于嵌入式技術(shù)的協(xié)同學習、多任務(wù)學習,引導學習者的主動式學習和深度學習。搭建多任務(wù)學習框架,涵蓋圖嵌入和推薦模塊,對各個模塊進行學習訓練和過程監(jiān)督,落實具體學習任務(wù)[2]。

      2.2 基于路徑的學習方法

      利用圖譜中實體間的關(guān)系進行學習推薦,通過知識圖譜與學習者、學習資源的深度耦合,搭建基于知識圖譜的學習資源圖庫,捕獲實體之間的連接關(guān)系,對于具有相似性的實體推薦學習資源,針對不同路徑的實體進行計算和分析,獲悉其具體結(jié)構(gòu)特征及內(nèi)在關(guān)聯(lián)性。還可以引入MCRec、PKGE等算法,挖掘?qū)W習者的主觀學習需求、學習路徑、學習特征,探尋學習者、學習資源,表征學習實體之間的對接通道,在學習推薦架構(gòu)中進行建模,學習不同學習者與學習資源的映射關(guān)聯(lián)邏輯。

      2.3 基于知識圖譜的LPRM推薦方法

      采用由底而上、自頂而下的不同策略,搭建課程知識圖譜,實現(xiàn)學習者的學習課程的鏈接,極大地提高了學習課程推薦的精準度[3]。課程知識圖譜的構(gòu)建過程如圖1所示。

      知識圖譜三元組的實體構(gòu)造極其復雜,其間的各個節(jié)點形成交互式的整體,而各實體之間的關(guān)系則演化為該網(wǎng)絡(luò)中的邊線,可以運用度中心性、H指數(shù)中心性、DH指數(shù)中心性來計算各個節(jié)點的影響力,提高計算結(jié)果的合理有效性。

      基于知識圖譜的學習者個性化學習資源推薦模型(簡稱LPRM模型)是知識圖譜的一種量化方法,通過在線課程平臺識別并獲取課程數(shù)據(jù),包括各種結(jié)構(gòu)化或非結(jié)構(gòu)化的課程數(shù)據(jù),經(jīng)過抽取、篩選的方式獲得結(jié)構(gòu)化數(shù)據(jù),利用更加精準的方法進行物品之間的相似度計算。在LPRM模型中,根據(jù)知識圖譜迭代擴展學習者的學習欲望,擴散學習資源,累積疊加生成學習者的偏好分布、潛在興趣、學習特征等,生成學習者相對應(yīng)的偏好集合。

      3. 基于知識圖譜的大數(shù)據(jù)學習推薦方法應(yīng)用

      3.1 基于知識圖譜鄰接實體分組聚合的學習推薦方法

      知識圖譜是一種結(jié)構(gòu)化的知識表示形式,以圖的形式描述、表達、存儲知識,用于圖結(jié)構(gòu)數(shù)據(jù)的查詢和推理驗證。知識圖譜的核心思想是將知識組織成圖結(jié)構(gòu)形式,將不同領(lǐng)域的知識整合于同一架構(gòu),形成完整、全面的異構(gòu)知識網(wǎng)絡(luò)。

      (1)嵌入模型的構(gòu)建?;谥R圖譜鄰接實體分組聚合的學習推薦方法是一種創(chuàng)新方法,通過將用戶-交互項目及其鄰接實體進行分組,聚類生成三元組集合。在這種基于圖注意力網(wǎng)絡(luò)的實體關(guān)系嵌入模型中,查詢輸入候選項目,連接知識圖譜,生成用戶-項目-實體異構(gòu)知識圖譜,在系統(tǒng)嵌入層形成用戶偏好捕獲模型,捕獲系統(tǒng)用戶的細粒度偏好[4]。

      (2)實體聚合和關(guān)系嵌入。利用高維離散數(shù)據(jù)向低維連接向量空間映射的技術(shù),將離散數(shù)據(jù)轉(zhuǎn)化為連續(xù)的向量表示,使離散的符號化詞語表征為低維向量,捕獲數(shù)據(jù)之間的語義與關(guān)聯(lián)關(guān)系,為下游數(shù)據(jù)分析和推理提供支持。

      關(guān)系嵌入是以提高用戶偏好向量的魯棒性和表達能力為目的,通過拼接三元組數(shù)據(jù)獲得向量表示,利用向量線性變換進行向量降維,提高模型的泛化能力和訓練效率。在模型之中,通過參數(shù)共享減少模型的復雜度,降低模型的復雜性和擬合風險,提高模型的訓練效率和表達能力[5]。

      (3)模型訓練分析。查詢嵌入表可獲取給定候選項目,計算出用戶偏好表示向量和項目表示向量,其本質(zhì)是一種二分類問題。通??梢圆捎靡韵聨追N損失函數(shù)進行表達。例如,二分類交叉熵損失是一種適用于二分類任務(wù)的損失函數(shù),用于衡量模型輸出的概率分布與真實標簽的差異,幫助學習者進行模型分類和輸出;Hinge損失用于衡量模型輸出分數(shù)與真實標簽的差異,支持向量機和最大間隔分類器等線性分類模型,提供數(shù)據(jù)擬合訓練,避免過擬合的現(xiàn)象[6]。

      3.2 基于知識圖譜三元組多層次聚類的學習推薦方法應(yīng)用

      基于知識圖譜三元組多層次聚類的推薦方法則是多層次、三元組知識層次的表征建模,屬于對項目屬性及其鄰接實體的多級分組聚類。通過知識圖譜感知學習推薦系統(tǒng)中的用戶偏好,構(gòu)建實體集合層注意力機制和項目集合層注意力機制,生成三元組多級聚類層次注意力模型。

      (1)知識圖譜嵌入模塊。通過學習實體、關(guān)系的嵌入式表達,將復雜關(guān)系和語義信息轉(zhuǎn)化為計算機可識別、可處理的形式,實現(xiàn)實體關(guān)系向低維向量空間的映射。由于傳統(tǒng)基于規(guī)則或基于統(tǒng)計的方法存在滯后性,對于復雜的語義關(guān)系和推理任務(wù)缺乏可學習性,因而可以通過向量之間的計算進行推理,捕獲實體之間的語義關(guān)系,提高知識表示和推理的準確性,實現(xiàn)對不同源知識的統(tǒng)一表示和處理。

      (2)實體集合注意力層。根據(jù)實體在該層次中的關(guān)系類別屬性,捕獲用戶的愛好特征。在實體集合抽取完成后,利用圖注意力網(wǎng)絡(luò)構(gòu)建實體注意力層,聚合生成實體集合的表示向量。通過關(guān)系嵌入的方式,增強每個實體集合的異構(gòu)性,實現(xiàn)實體集合的聚合[7]。

      (3)項目集合注意力層。根據(jù)用戶交互項目的類別屬性,將交互項目聚類到不同的項目集合,利用推薦系統(tǒng)挖掘不同項目集合在類別屬性方面的異質(zhì)性信息,增強用戶偏好的針對性和有效性。項目集合的聚合要考慮用戶的偏好,針對性地聚合用戶所有項目集合。

      (4)模型訓練。給定用戶和候選項目,將其輸入知識圖譜嵌入層,獲取候選項目表示向量。在知識圖譜嵌入式學習任務(wù)中,可以通過比較實體和關(guān)系之間的嵌入向量,運用知識圖譜嵌入任務(wù)損失函數(shù)和推薦任務(wù)損失函數(shù),表達實體關(guān)系的嵌入過程。

      4. 基于知識圖譜關(guān)系感知注意力卷積的學習推薦方法應(yīng)用

      4.1 預備性知識

      圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)是用于處理圖數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型,其核心在于聚合各鄰接節(jié)點的特征,通過矩陣運算進行信息交互和更新,并通過應(yīng)用激活函數(shù)和神經(jīng)網(wǎng)絡(luò)層進行多次迭代,在學習和推理的過程中獲得深層次的節(jié)點表示向量,較好地適用于基于圖數(shù)據(jù)的節(jié)點分類、連接預測、推薦系統(tǒng)。

      在系統(tǒng)的門控循環(huán)單元中,通過引入門控機制處理序列數(shù)據(jù),以更為簡潔的結(jié)構(gòu)和更少的參數(shù),由更新門和重置門兩個門控單元實施控制,捕獲序列數(shù)據(jù)中的長期依賴關(guān)系,為自然語言處理、語音識別、機器翻譯提供支持[8]。

      4.2 關(guān)系感知注意力圖卷積神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建

      由于知識圖譜具有不完整性,現(xiàn)有基于GCN的聚合方法缺乏顯式的實體關(guān)系,可以借助關(guān)系感知注意力權(quán)值替換鄰接矩陣中的二進制值,實現(xiàn)差異化的信息傳播與節(jié)點聚合[9]。

      在該模型的用戶偏好捕獲模塊中,可以設(shè)計契合用戶偏好和項目吸引力捕獲的模型,搭建一個包含用戶潛在感興趣實體的知識圖譜,通過查找用戶-項目交互矩陣,抽取用戶的交互項目序列,以此作為種子實體并進行隨機采樣,生成相應(yīng)的興趣知識圖譜。在該知識圖譜中,聚合興趣知識圖譜中的不同關(guān)系實體,篩選生成用戶細粒度興趣偏好,計算基于關(guān)系感知的用戶興趣偏好向量。同時,還可以采用最大池化操作函數(shù)進行特征提取和處理,通過注意力機制自適應(yīng)學習下的興趣偏好,體現(xiàn)出特定用戶興趣偏好的貢獻程度。

      在項目吸引力捕獲模塊之中,構(gòu)建用于描述項目特性的知識圖譜,在特質(zhì)知識圖譜的鄰接實體中呈現(xiàn)項目輔助性信息,將關(guān)系感知注意力圖卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于特質(zhì)知識圖譜,捕獲所感知的項目特質(zhì)信息。項目吸引力是指依賴于特質(zhì)信息的項目受歡迎程度,根據(jù)用戶與候選項目的交互情況,提取特定用戶的時間序列,獲取序列在某一位置的隱藏狀態(tài)。

      在門控過濾機制模塊中,考慮到可能存在的潛在噪聲信息,可在知識圖譜的構(gòu)建過程中引入不相關(guān)實體,構(gòu)建一種門控過濾機制,濾除可能存在的噪聲信息,保留用戶偏好和項目吸引力信息。

      5. 融合多種課程資源的學習路徑推薦方法應(yīng)用

      隨著以知識圖譜為核心的新一代人工智能技術(shù)逐漸成熟,要以課程推薦、相似知識點推薦、知識點檢索、可視化應(yīng)用等技術(shù)為依托,快速定位和掃描知識盲點或易于混淆的知識點,幫助學生進行個性化學習。

      5.1 課程教學資源數(shù)據(jù)的獲取

      多模態(tài)教學數(shù)據(jù)包含各種非結(jié)構(gòu)化或結(jié)構(gòu)化的數(shù)據(jù),可以作為知識圖譜的一種補充。在教育學習實踐過程中,教師可以利用文字、微課視頻/音頻、圖片、教案、PPT等方法,利用網(wǎng)絡(luò)爬蟲技術(shù)和人工渠道獲取學習信息,為后續(xù)算法的應(yīng)用及可視化分析提供數(shù)據(jù)支撐。

      5.2 數(shù)據(jù)預處理與存儲

      由于課程資源較為豐富,表現(xiàn)出多樣化的形態(tài),可以利用多任務(wù)的通用信息抽取技術(shù)UIE,對各課程的知識點數(shù)據(jù)進行實體抽取和預處理。具體操作中可以引入少量樣本數(shù)據(jù)進行標注訓練,通過Prompt方式進行建模和微調(diào),通過數(shù)據(jù)標注平臺、圖形化的標注界面進行一站式導入、導出。以知識融合技術(shù)作為平臺支持,對數(shù)據(jù)預處理過程存在的冗余加以剔除,避免形成數(shù)據(jù)歧義,保證數(shù)據(jù)集的標準化和有效性[10]。

      5.3 課程專業(yè)知識圖譜的構(gòu)建

      運用關(guān)聯(lián)規(guī)則挖掘方法進行課程關(guān)聯(lián)挖掘,在實體識別、關(guān)系提取等技術(shù)的支持下,抽取文本數(shù)據(jù)元素,獲取知識點之間的相似、先修、并行、后繼等關(guān)系?;谶@一前提,構(gòu)建大數(shù)據(jù)相關(guān)課程專業(yè)知識圖譜,嵌套進入Flask框架并進行展示。

      結(jié)語

      個性化學習資源推薦技術(shù)與學習者的學習需求相適應(yīng),由于傳統(tǒng)推薦方法存在局限性,可以引入基于知識圖譜的大數(shù)據(jù)學習推薦方法,運用相關(guān)技術(shù)挖掘?qū)W習者和學習資源中的高階語義關(guān)系,利用課程知識圖譜作為學習資源推薦的輔助信息,為需求者提供多樣化、個性化的學習推薦。

      參考文獻:

      [1]覃湘荔.基于知識圖譜的教育信息資源個性化推薦方法[J].無線互聯(lián)科技,2024,21(8):80-82.

      [2]馮勇,孫宇,徐紅艷,等.基于知識圖譜的短視頻實時推薦方法研究[J].遼寧大學學報(自然科學版),2023,50(4):302-311.

      [3]葛湘巍,劉洋.基于知識圖譜的多源無標簽數(shù)據(jù)推薦算法[J/OL].計算機仿真,1-6[2024-09-18].http://kns.cnki.net/kcms/detail/11.3724.TP.20240506.1330.004.html.

      [4]陳海英,吳芳.基于數(shù)據(jù)挖掘算法的高職數(shù)學線上學習資源推薦方法[J].信息與電腦(理論版),2023,35(13):108-110.

      [5]孫雪蓮.基于知識圖譜的公共文化資源個性化推薦方法的研究與實現(xiàn)[D].南京:東南大學,2023.

      [6]李程,丁鐘.基于數(shù)據(jù)驅(qū)動和知識圖譜的電影分類推薦方法[J].云南師范大學學報(自然科學版),2023,43(5):41-44.

      [7]李月,李琳,陳麗,等.基于圖神經(jīng)網(wǎng)絡(luò)的學習推薦算法研究[J].現(xiàn)代計算機,2023,29(16):27-32.

      [8]湯志康,武毓琦,李春英,等.基于知識圖譜卷積網(wǎng)絡(luò)的學習資源推薦[J/OL].計算機工程,2024,50(9):153-160.

      [9]周北京,王海榮,王怡夢,等.知識圖譜的雙注意力機制推薦方法[J].中國科技論文,2024,19(2):178-185,223.

      [10]周北京,王海榮,王怡夢,等.圖譜嵌入傳播的推薦方法[J/OL].計算機應(yīng)用,1-10[2024-09-18].http://kns.cnki.net/kcms/detail/51.1307.TP.20240103.0847.002.html.

      作者簡介:魏源鋒,本科,工程師,762403893@qq.com,研究方向:大數(shù)據(jù)。

      曲松县| 云南省| 山东| 房产| 宽城| 商水县| 丹凤县| 时尚| 林周县| 萍乡市| 柘荣县| 黎平县| 临朐县| 泸定县| 铁力市| 马山县| 昌江| 普定县| 大洼县| 莲花县| 焉耆| 黑水县| 海口市| 博客| 安庆市| 龙州县| 慈溪市| 盐亭县| 富川| 安远县| 台山市| 且末县| 芜湖县| 鄂尔多斯市| 阿尔山市| 南涧| 浦江县| 营山县| 德昌县| 延吉市| 五寨县|