劉莉
摘要:本文提出了一種基于并行化感知觸發(fā)因子的本體特征向量模型,研究重點(diǎn)在于書(shū)籍對(duì)用戶偏好模型表征用戶興趣的準(zhǔn)確度和對(duì)潛在興趣的挖掘度,直接決定了資源推薦的準(zhǔn)度和廣度等問(wèn)題上,通過(guò)將本體感知因子形成的特征向量形成數(shù)據(jù)集,從而實(shí)現(xiàn)了并行算法結(jié)構(gòu)處理過(guò)程。通過(guò)設(shè)置本體感知因子的特征向量以確定容量及結(jié)構(gòu)范圍,形成的初始化特征因子會(huì)被定義在局部結(jié)構(gòu)內(nèi)進(jìn)行分析和學(xué)習(xí)能力
關(guān)鍵詞:本體;觸發(fā)感知因子;特征向量模型
1 引言
隨著信息化時(shí)代的來(lái)臨,信息數(shù)據(jù)量正成幾何形式的增長(zhǎng),對(duì)于信息數(shù)據(jù)的處理工作成為當(dāng)前科學(xué)研究前沿問(wèn)題。以圖書(shū)館為例,在以往的圖書(shū)館信息管理中,僅存在于書(shū)籍目錄及簡(jiǎn)單的數(shù)據(jù)庫(kù)儲(chǔ)存和搜索形式中。在發(fā)達(dá)國(guó)家,各級(jí)圖書(shū)館不僅實(shí)現(xiàn)了網(wǎng)絡(luò)化的統(tǒng)一管理模式,還將書(shū)籍信息進(jìn)行了數(shù)字化處理,更能實(shí)現(xiàn)書(shū)籍信息內(nèi)容的檢索和編譯。不僅如此,針對(duì)用戶的偏好,還可以更有針對(duì)性地向用戶推薦內(nèi)容。就圖書(shū)館書(shū)籍服務(wù)內(nèi)容來(lái)說(shuō),書(shū)籍推薦工作已經(jīng)成為最重要的工作內(nèi)容,還代表了圖書(shū)館科技建設(shè)水平的質(zhì)量。
2 基于本體理論的書(shū)籍
在圖書(shū)館的書(shū)籍因其具有較強(qiáng)的知識(shí)方向性和更深的理論及應(yīng)用價(jià)值受到更多地關(guān)注,但是在圖書(shū)館的書(shū)籍因知識(shí)面窄和熟知性低的問(wèn)題往往不被廣大讀者所知,而對(duì)于有針對(duì)性需求的讀者又往往無(wú)法獲得有效推薦,所以在書(shū)籍的推廣上應(yīng)作為圖書(shū)館書(shū)籍推薦研究工作的難點(diǎn)突破口之一進(jìn)行解決。本文也正是基于以上問(wèn)題,自足于書(shū)籍的推薦工作上,基于書(shū)籍的本體感知觸發(fā)技術(shù)應(yīng)用與協(xié)同過(guò)濾方法的研究,總體上根據(jù)建立書(shū)籍本體構(gòu)架,在模型中引發(fā)觸發(fā)機(jī)制進(jìn)行信息搜集、處理和過(guò)濾,并據(jù)此向用戶推薦書(shū)籍。本文研究重點(diǎn)在于用戶偏好模型表征用戶興趣的準(zhǔn)確度和對(duì)潛在興趣的挖掘度直接決定了資源推薦的準(zhǔn)度和廣度等問(wèn)題上。
對(duì)于書(shū)籍的本體模型的建立,首先根據(jù)書(shū)籍的各類書(shū)籍信息進(jìn)行整理,然后帶入到圖書(shū)館藏書(shū)籍目錄中,形成信息化的數(shù)據(jù)資料,衍生的信息會(huì)被不斷的分化,逐步形成了本體的組件。對(duì)于書(shū)籍本體模型的描述中,以書(shū)籍知識(shí)領(lǐng)域、書(shū)籍信息、出版社信息等內(nèi)容是作為本體固定信息存在的,這類信息內(nèi)容自始至終不會(huì)更改,作為本體的基礎(chǔ)信息,對(duì)于書(shū)籍推薦效果也不會(huì)產(chǎn)生較大的影響。但更多地本體模型描述是依據(jù)不同環(huán)境的變化而改變的,例如:書(shū)籍借閱效果是隨著書(shū)籍借閱次數(shù)及書(shū)籍評(píng)價(jià)等內(nèi)容影響的,而熱度也會(huì)受到專業(yè)學(xué)科動(dòng)態(tài)信息等影響。
所以研究如何利用技術(shù)手段來(lái)實(shí)現(xiàn)書(shū)籍的推薦工作就要考慮到本體技術(shù)中對(duì)于動(dòng)態(tài)信息的感知能力及辨別效果。
3 書(shū)籍推薦模型的建立
3.1 書(shū)籍推薦模型
書(shū)籍推薦模型的建立是依據(jù)與書(shū)籍相關(guān)知識(shí)內(nèi)容的關(guān)聯(lián)產(chǎn)生的,這里的書(shū)籍信息和用戶信息被分別列為本體的感知因子,針對(duì)各類信息內(nèi)容又會(huì)呈現(xiàn)出更多地感知因子,因此基于本體的感知因子因?yàn)榫垲愡^(guò)程相互獨(dú)立且每次迭代相同任務(wù),所以會(huì)形成龐大的粒子團(tuán),而隨著任務(wù)粒度增加,計(jì)算時(shí)間也相對(duì)越長(zhǎng)。由于感知因子的數(shù)據(jù)對(duì)象彼此獨(dú)立,計(jì)算每個(gè)數(shù)據(jù)對(duì)象所屬的聚類,隨著聚類迭代次數(shù)增加,需要不斷更新聚類中心。針對(duì)以上情況,本文提出基于協(xié)同過(guò)濾算法,就是有效地支持迭代運(yùn)算,提高算法效率。
3.2 書(shū)籍推薦流程
第一階段,針對(duì)協(xié)同過(guò)濾算法進(jìn)行并行化設(shè)計(jì)與實(shí)現(xiàn)。本文通過(guò)將本體感知因子形成的特征向量形成數(shù)據(jù)集,從而實(shí)現(xiàn)了并行算法結(jié)構(gòu)處理過(guò)程,對(duì)于以后的的解析過(guò)程也起到了結(jié)構(gòu)性優(yōu)化的特征。通過(guò)設(shè)置本體感知因子的特征向量以確定容量及結(jié)構(gòu)范圍,形成的初始化特征因子會(huì)被定義在局部結(jié)構(gòu)內(nèi)進(jìn)行分析和學(xué)習(xí)能力,這樣就會(huì)不斷產(chǎn)生大量的數(shù)據(jù)信息,最終形成了初代特征向量因子團(tuán)。
第二階段,在第一階段得到初代特征向量因子團(tuán)的基礎(chǔ)上,帶入到初始化的聚類中心進(jìn)行數(shù)據(jù)分析。首先,將各數(shù)據(jù)樣本分布至集群中的 n 個(gè)計(jì)算節(jié)點(diǎn),并且將聚類中心借助函數(shù)使其在各個(gè)計(jì)算節(jié)點(diǎn)間實(shí)現(xiàn)共享。與此同時(shí),針對(duì)每個(gè)數(shù)據(jù)分片,計(jì)算其與最近聚類中心的軌跡距離,并根據(jù)每個(gè)聚類中心計(jì)算屬于該聚類的數(shù)據(jù)之和,對(duì)每個(gè)節(jié)點(diǎn)的累加數(shù)據(jù)和進(jìn)行合并求和,判斷sum和是否小于閾值,通過(guò)函數(shù)計(jì)算來(lái)完成更新聚類中心的操作,直到算法收斂或完成迭代從而輸出聚類中心和聚類結(jié)果。
第三階段,書(shū)籍推薦。首先對(duì)目標(biāo)用戶進(jìn)行判斷,如果是新用戶,則會(huì)根據(jù)系統(tǒng)熱度排行將流行度最高的N個(gè)書(shū)籍資源向新讀者進(jìn)行推薦;如果是老用戶,則會(huì)根據(jù)聚類中心計(jì)算用戶所屬聚類,使用函數(shù)獲取目標(biāo)用戶評(píng)分的項(xiàng)目信息,同時(shí)執(zhí)行持久化操作,計(jì)算聚類內(nèi)用戶之間的相似度,從而通過(guò)函數(shù)過(guò)濾與目標(biāo)用戶相似度最高的用戶信息,獲取目標(biāo)用戶鄰域的用戶評(píng)價(jià)過(guò)的項(xiàng)目信息和目標(biāo)用戶未評(píng)價(jià)過(guò)的項(xiàng)目信息,計(jì)算目標(biāo)用戶對(duì)項(xiàng)目信息的預(yù)測(cè)評(píng)分,將評(píng)分最高的N個(gè)項(xiàng)目推薦給目標(biāo)用戶。無(wú)論是新用戶還是老用戶在系統(tǒng)使用過(guò)程中的信息識(shí)別都會(huì)被累計(jì)到個(gè)人用戶信息庫(kù)中,形成了用戶信息特征庫(kù),為日后的書(shū)籍推薦工作提供信息。
通過(guò)對(duì)于書(shū)籍推薦模型的建立,可以實(shí)現(xiàn)基于本體技術(shù)的特征化向量機(jī)的系統(tǒng)推薦功能,具備了智能化書(shū)籍推薦的能力,對(duì)于圖書(shū)館的推薦服務(wù)可以做到以用戶為單位的針對(duì)性推薦效果,可以讓每位用戶享受到細(xì)致化的服務(wù)感受。而且,隨著系統(tǒng)的信息量不斷增加,感知內(nèi)容會(huì)不斷提高服務(wù)質(zhì)量,讓圖書(shū)館與用戶雙雙受益。
4 總結(jié)
本文在基于本體感知技術(shù)的基礎(chǔ)上,提出了融合用戶興趣分布變化和特征差異的協(xié)同過(guò)濾推薦算法。通過(guò)設(shè)置本體感知因子的特征向量以確定容量及結(jié)構(gòu)范圍,形成的初始化特征因子會(huì)被定義在局部結(jié)構(gòu)內(nèi)進(jìn)行分析和學(xué)習(xí)能力,帶來(lái)了獲取信息的便利性,還能起到對(duì)其他推薦平臺(tái)的推廣作用。
參考文獻(xiàn):
[1]Item-based top- N recommendation algorithms[J]. Mukund Deshpande,George Karypis. ?ACM Transactions on Information Systems (TOIS) . 2004 (1)
[2]Factorization meets the neighborhood:a multifaceted collaborative filtering model. Yehuda Koren. ACM SIGKDD International Conference on Know ledge Discovery and Data M ining . 2008
[3]基于用戶的協(xié)同過(guò)濾算法的改進(jìn)研究[J]. 蘇林宇,陳學(xué)斌. ?軟件. 2017(04)
[4]一種基于自適應(yīng)近鄰選擇的協(xié)同過(guò)濾推薦算法[J]. 彭玉,程小平. ?電腦知識(shí)與技術(shù). 2016(16)
[5]基于項(xiàng)目評(píng)分預(yù)測(cè)的混合式協(xié)同過(guò)濾推薦[J]. 盈艷,曹妍,牟向偉. ?現(xiàn)代圖書(shū)情報(bào)技術(shù). 2015(06)
[6]一種基于向量空間模型的模糊本體映射方法[J]. 張凌宇,陳淑鑫,張光妲,呂洪柱. ?計(jì)算機(jī)應(yīng)用研究. 2014(05)
[7]基于本體理論的智能電網(wǎng)廣義數(shù)據(jù)管理模型[J]. 黃彥浩,周孝信. ?電力系統(tǒng)自動(dòng)化. 2014(09)
[8]基于精確匹配的概念映射關(guān)系規(guī)則研究[J]. 鄧盼盼,常春. ?圖書(shū)情報(bào)工作. 2013(16)
[9]一種高效的多策略本體映射方法[J]. 姚曉明,王鋒,林蘭芬,朱曉偉,謝非. ?中國(guó)科技論文. 2013(07)
[10]圖解析方式的復(fù)合本體映射策略研究[J]. 凌仕勇,龔錦紅. ?華東交通大學(xué)學(xué)報(bào). 2013(03)
[11]A content-collaborative recommender that exploits WordNet-based user profiles for neighborhood formation[J] . Marco Degemmis,Pasquale Lops,Giovanni Semeraro. ?User Modeling and User-Adapted Interaction . 2007 (3)
[12]Afelder and silverman learning styles model based personalization approach to recommend learning objects. BIROL CILOGLUGIL,MUSTAFA MURAT INCEOGLU. Computational Science and Its Applications-ICCSA . 2016.