曲朝陽,徐鵬飛,婁建樓,顏 佳,曲 楠
(1.東北電力大學信息工程學院,吉林 吉林 132012;2.國家電網吉林省電力有限公司信息通信公司,吉林 長春 130062;3.江蘇省電力公司檢修分公司,江蘇 南京 210000)
基于協(xié)同過濾的電力信息運維知識個性化推薦模型
曲朝陽1,徐鵬飛1,婁建樓1,顏 佳2,曲 楠3
(1.東北電力大學信息工程學院,吉林 吉林 132012;2.國家電網吉林省電力有限公司信息通信公司,吉林 長春 130062;3.江蘇省電力公司檢修分公司,江蘇 南京 210000)
提出了基于協(xié)同過濾的電力信息運維知識個性化推薦模型.首先給出了電力信息運維知識個性化推薦模型的建立流程;其次引入隱式評分機制,將運維人員的學習行為轉換為對電力信息運維知識的隱式評分;再次對傳統(tǒng)協(xié)同過濾算法的不足進行改進;最后基于改進協(xié)同過濾算法構建個性化推薦模型,對電力信息運維知識進行推薦.實驗結果表明,該個性化推薦模型能夠有效提高推薦效果,具有實際意義.
協(xié)同過濾;電力信息運維知識;個性化推薦;隱式評分
隨著電網企業(yè)信息化建設的不斷發(fā)展,電力信息運維知識嚴重“過載”,運維人員很難在大量的電力信息運維知識中找到自己真正需要的知識.推薦系統(tǒng)是解決電力信息運維知識“過載”問題的主要工具,它能夠根據運維人員的習慣偏好向運維人員推薦可能感興趣的電力信息運維知識.協(xié)同過濾作為目前推薦系統(tǒng)中應用最成功的推薦技術,它是通過尋找與目標用戶習慣偏好相似的鄰居用戶,把鄰居用戶感興趣的知識推薦給目標用戶.[1-2]
電力信息運維知識個性化推薦是提高運維人員電力信息運維知識水平的有效途徑,但目前對電力信息運維知識個性化推薦的研究仍然沒有突破性進展,依舊面臨缺乏有效的推薦技術、推薦質量,難以滿足運維人員的需求等問題.針對以上問題,本文結合運維人員的學習行為,首先引入隱式評分機制,將運維人員的學習行為轉換為對電力信息運維知識的隱式評分,然后對傳統(tǒng)協(xié)同過濾算法的不足進行改進,最后構建基于改進協(xié)同過濾算法的個性化推薦模型,并將其應用于電力信息運維知識推薦.
圖1 電力信息運維知識個性化推薦模型建立的流程
真實可靠的評分數(shù)據是進行電力信息運維知識個性化推薦的前提,評分數(shù)據應該盡可能地反映運維人員對電力信息運維知識的感興趣程度,因此引入隱式評分機制,將運維人員在線學習過程中的學習行為轉換為對電力信息運維知識的隱式評分.傳統(tǒng)協(xié)同過濾算法在用戶相似性計算過程中沒有考慮項目之間的相似性以及在未評分值預測過程中沒有體現(xiàn)用戶興趣的動態(tài)變化,嚴重影響推薦質量.因此改進傳統(tǒng)協(xié)同過濾算法的不足,并基于改進協(xié)同過濾算法構建個性化推薦模型對電力信息運維知識進行推薦.運維人員可以根據推薦結果發(fā)現(xiàn)自己感興趣的知識,進而增強電力信息運維知識水平.電力信息運維知識個性化推薦模型的建立流程如圖1所示.
2.1 隱式評分機制
由于運維人員在線學習過程中會對電力信息運維知識產生一定的學習行為,比如對電力信息運維知識的下載、收藏、分享、學習時長等,因此引入隱式評分機制,通過跟蹤記錄運維人員的學習行為,將這些學習行為轉換為對電力信息運維知識的隱式評分.隱式評分能夠較好地解決運維人員對電力信息運維知識“學而不評”的現(xiàn)象,并且能夠客觀地反映運維人員對電力信息運維知識的感興趣程度,具有比預測更高的可靠性.[3]
隱式評分是通過計算運維人員的單一學習行為或組合學習行為的分值而得到的,本文用D(下載),C(收藏),S(分享)和T(學習時長)來表示運維人員的學習行為,電力信息運維知識的評分采用5分制.運維人員學習行為對應的電力信息運維知識評分值如表1所示.
表1 學習行為對應的評分值
2.2 協(xié)同過濾算法
2.2.1 傳統(tǒng)協(xié)同過濾算法
協(xié)同過濾可分為兩類,分別是基于存儲的協(xié)同過濾和基于模型的協(xié)同過濾[4-5].前者利用評分數(shù)據計算用戶或項目相似性得到鄰居集合或項目集合,根據鄰居集合中用戶對項目的評分進行預測;后者對已有數(shù)據運用概率統(tǒng)計和機器學習得到一個模型,根據模型進行預測.
基于存儲的協(xié)同過濾算法通過分析用戶的歷史評分數(shù)據,尋找和目標用戶習慣偏好相似的鄰居用戶,把鄰居用戶感興趣的項目作為結果推薦給目標用戶.它的實現(xiàn)過程分為獲取用戶評分數(shù)據、尋找最近鄰居、產生推薦列表3個步驟.[6]
(1) 獲取用戶評分數(shù)據
用戶評分一般情況下表示成一個m×n用戶-項目評分矩陣R=(rij),其中m表示用戶數(shù)量,n表示項目數(shù)量,rij表示用戶評分值,一般rij∈[0,5]且rij是整數(shù),評分值越高則表示用戶對該項目的感興趣程度越大.
(2) 尋找最近鄰居
用戶相似性計算的目的是尋找和目標用戶習慣偏好相似的最近鄰居集合,也就是說,對目標用戶u尋找一個按照用戶相似性從大到小排列的集合Nu={u1,u2,…,un},u?Nu.本文采用Pearson相關系數(shù)來計算用戶相似性sim(u,v),公式為
(1)
(3) 產生推薦列表
根據最近鄰居集合預測目標用戶u對未評分項目iT的評分值Pu,iT,選擇評分最高的前N個項目作為結果推薦給目標用戶.公式為
(2)
2.2.2 改進協(xié)同過濾算法
傳統(tǒng)協(xié)同過濾算法在用戶相似性計算過程中沒有考慮項目之間的相似性以及在未評分值預測過程中沒有體現(xiàn)用戶興趣的動態(tài)變化,嚴重影響推薦質量[7].本文對傳統(tǒng)協(xié)同過濾算法的不足進行以下改進.
(1) 用戶相似性計算
傳統(tǒng)協(xié)同過濾算法在用戶相似性計算過程中只考慮用戶共同評分過的項目,但忽略了項目之間的相似性,那么用戶共同評分過的項目中或許存在和被預測項目不相關卻被考慮在內,使得找到的鄰居用戶不準確.為了減小不相關項目對用戶相似性計算的干擾,將項目相似性sim(i,j)引入到用戶相似性計算中.該計算有多種不同的方法,如余弦相似性、Pearson相關系數(shù)、條件概率等[8].本文運用條件概率計算項目i和項目j之間的相似性
(3)
其中freq(i),freq(j),freq(ij)分別表示對項目i和項目j進行評分的用戶人數(shù)以及同時對項目i和項目j進行評分的用戶人數(shù),α∈[0,1]表示縮放比例因子.
引入項目相似性后用戶相似性計算公式為
(4)
其中:iT表示待預測項目,sim′(u,v)表示用戶u和用戶v基于iT的相似性.
(2) 未評分值預測
傳統(tǒng)協(xié)同過濾算法在未評分值預測過程中將用戶不同時間對項目的評分看做是相同的,忽略了用戶是在不同時間對項目進行評分不同這一事實.由于用戶興趣隨著時間流逝而改變,但在較短時間段內用戶興趣改變較小,因此一個用戶最可能會對其越晚評價的項目越產生興趣.心理學家艾賓浩斯對遺忘現(xiàn)象的研究結果表明:人類的遺忘過程是逐步的、非線性的[9].借鑒人類的遺忘規(guī)律,將時間函數(shù)f(t)引入到未評分值預測中,體現(xiàn)用戶不同時間內評價的項目對預測未評分值的影響,即用戶越晚評價的項目對預測未評分值的影響越大,那么f(t)應該是一個單調遞增函數(shù),函數(shù)值在(0,1)范圍內.本文使用指數(shù)函數(shù)作為時間函數(shù),公式為
(5)
其中:t表示用戶u評價項目iT的時間,e表示自然底數(shù).
引入時間函數(shù)后未評分值預測的公式為
(6)
2.3 基于協(xié)同過濾的個性化推薦模型
圖2 基于協(xié)同過濾的個性化推薦模型
以對隱式評分機制與協(xié)同過濾算法的研究為基礎,構建一個基于協(xié)同過濾的個性化推薦模型,并將其應用于某省電力有限公司試運行的電力信息運維知識培訓平臺中,該推薦模型如圖2所示.
推薦引擎是該模型的重要組成部分,它是實現(xiàn)電力信息運維知識個性化推薦的中樞.推薦引擎的基本思想是將運維人員信息、電力信息運維知識、隱式評分信息通過輸入接口傳送到推薦引擎,引擎中的推薦模塊利用本文改進的協(xié)同過濾算法對電力信息運維知識進行推薦,并將推薦結果通過輸出接口呈現(xiàn)給運維人員.
個性化推薦模型中推薦引擎的算法流程:
(1) 獲取用戶評分數(shù)據:查詢數(shù)據庫,得到用戶-項目評分矩陣.
(2) 尋找最近鄰居:根據公式(4)計算目標用戶u和其他用戶之間的相似性,即sim′(u,v),把用戶按照相似性由大到小排序,選擇前n個作為目標用戶u的鄰居用戶.
實驗數(shù)據使用某省電力有限公司試運行的電力信息運維知識培訓平臺中100個運維人員對1 200個電力信息運維知識的15 000條評分數(shù)據,并且每位運維人員至少對120個電力信息運維知識進行了1到5之間的評分,評分數(shù)值越高,表示運維人員對該電力信息運維知識的感興趣程度越大.
度量標準使用統(tǒng)計精度度量方法中的平均絕對偏差MAE,它是通過計算預測的用戶評分與實際的用戶評分之間的偏差度量,可以得到預測的準確性,MAE越小推薦效果越好.[10]設預測的用戶評分集合為{r1,r2,…,rn},設實際的用戶評分集合為{s1,s2,…,sn},則平均絕對偏差MAE定義為
(7)
最近鄰居集合的大小影響MAE,因此,在同一個數(shù)據集上選擇大小不同的最近鄰居集合,比較本文改進協(xié)同過濾算法和傳統(tǒng)協(xié)同過濾算法的推薦效果,實驗中將最近鄰居集合大小從10增加到45.
圖3 本文改進算法與傳統(tǒng)算法的MAE比較
本文提出的改進協(xié)同過濾算法與傳統(tǒng)協(xié)同過濾算法的MAE比較如圖3所示.
從圖3中可以看出,改進協(xié)同過濾算法的推薦效果比傳統(tǒng)協(xié)同過濾算法好.原因是改進協(xié)同過濾算法在計算用戶相似性時引入了項目相關性,使得找到的鄰居用戶更準確,在預測未評分值時引入了時間函數(shù),體現(xiàn)了用戶興趣的動態(tài)變化,從而提高了推薦效果.
為了從海量電力信息運維知識中向運維人員推薦出可能感興趣的知識,本文提出了基于協(xié)同過濾的電力信息運維知識個性化推薦模型.針對傳統(tǒng)協(xié)同過濾算法的不足,在用戶相似性計算時引入項目相似性以減小不相關項目的干擾,并在預測未評分值時引入時間函數(shù)以體現(xiàn)用戶興趣的動態(tài)變化,改進協(xié)同過濾算法構建電力信息運維知識個性化推薦模型,解決了電力信息運維知識“過載”問題.最后通過實驗證明了該個性化推薦模型能夠有效提高推薦效果,具有實際意義.
[1] 冷亞軍,陸青,梁昌勇.協(xié)同過濾推薦技術綜述[J].模式識別與人工智能,2014,27(8):720-734.
[2] 趙琴琴,魯凱,王斌.SPCF:一種基于內存的傳播式協(xié)同過濾推薦算法[J].計算機學報,2013,36(3):671-676.
[3] 孫歆,王永固,邱飛岳.基于協(xié)同過濾技術的在線學習資源個性化推薦系統(tǒng)研究[J].中國遠程教育,2012(8):78-82.
[4] 孫光福,吳樂,劉淇,等.基于時序行為的協(xié)同過濾推薦算法[J].軟件學報,2013,24(11):2721-2733.
[5] 榮輝桂,火生旭,胡春華,等.基于用戶相似度的協(xié)同過濾推薦算法[J].通信學報,2014,35(2):16-24.
[6] 胡勛,孟祥武,張玉潔,等.一種融合項目特征和移動用戶信任關系的推薦算法[J].軟件學報,2014,25(8):1817-1830.
[7] 邢春曉,高鳳榮,戰(zhàn)思南,等.適應用戶興趣變化的協(xié)同過濾推薦算法[J].計算機研究與發(fā)展,2007,44(2):296-301.
[8] 劉東輝,彭德巍,張暉.一種基于時間加權和用戶特征的協(xié)同過濾算法[J].武漢理工大學學報,2012,34(5):144-148.
[9] 于洪,李轉運.基于遺忘曲線的協(xié)同過濾推薦算法[J].南京大學學報(自然科學版),2010,46(5):520-527.
[10] 陳志敏,姜藝.綜合項目評分和屬性的個性化推薦算法[J].微電子學與計算機,2011,28(9):186-189.
(責任編輯:石紹慶)
Personalized recommendation model of power information operation and maintenance knowledge based on collaborative filtering
QU Zhao-yang1,XU Peng-fei1,LOU Jian-lou1,YAN Jia2,QU Nan3
(1.School of Information Engineering,Northeast Dianli University,Jilin 132012,China;2.Information and Communications Company State Grid Jilin Electric Power,Changchun 130062,China;3.Maintenance Branch of Jiangsu Electric Power Company,Nanjing 210000,China)
Personalized recommendation model of power information operation and maintenance knowledge based on collaborative filtering was proposed.First,the establishment process of personalized recommendation model of power information operation and maintenance knowledge is built.Second,implicit rate mechanism is introduced,which can transform learning behavior of the operation and maintenance personnel into implicit rate of power information operation and maintenance knowledge.Third,improve the shortcomings of traditional collaborative filtering algorithm.Finally,personalized recommendation model which is used to recommend the power information operation and maintenance knowledge was built based on improved collaborative filtering algorithm.The experimental result shows that the personalized recommendation model can effectively improve the recommendation effect,with a practical significance.
collaborative filtering;power information operation and maintenance knowledge;personalized recommendation;implicit rate
(責任編輯:石紹慶)
1000-1832(2017)02-0084-05
10.16163/j.cnki.22-1123/n.2017.02.016
2016-03-06
國家自然科學基金資助項目(51277023);吉林省科技計劃重點轉化項目(20140307008GX).
曲朝陽(1964—),男,博士,教授,主要從事智能信息處理、網絡技術、虛擬現(xiàn)實研究;通信作者:徐鵬飛(1991—),男,碩士研究生,主要從事智能信息處理研究.
TP 311 [學科代碼] 520·40
A