基于情感緊密度的社交網(wǎng)絡(luò)推薦算法

2016-09-26 09:31:29張能福

商洛學(xué)院學(xué)報 2016年2期

彭　歡　張能福

(作者單位：五邑大學(xué)經(jīng)濟(jì)管理學(xué)院)

彭歡張能福

當(dāng)前的社交網(wǎng)絡(luò)推薦算法主要是基于內(nèi)容相似度或者好友相似度進(jìn)行推薦，忽略了社交網(wǎng)絡(luò)中情感值計算；而基于NAS算法的緊密度計算屬性邊權(quán)值靈活度不高，因而緊密度計算不夠準(zhǔn)確，不能產(chǎn)生較為理想的推薦效果。針對上述兩個問題，提出了基于情感緊密度的社交網(wǎng)絡(luò)推薦算法，以達(dá)到社交網(wǎng)絡(luò)推薦準(zhǔn)確率的提高。實驗證明，該方法在提高短號集團(tuán)網(wǎng)絡(luò)的推薦準(zhǔn)確率方面較為理想。

緊密度；推薦準(zhǔn)確率；情感值計算；NAS算法

一、引言

短號集團(tuán)社交網(wǎng)絡(luò)上的推薦問題，不同于傳統(tǒng)的推薦系統(tǒng)，傳統(tǒng)社交網(wǎng)絡(luò)推薦系統(tǒng)主要基于以下幾類來進(jìn)行推薦：第一、基于用戶節(jié)點愛好之間的相似度來進(jìn)行推薦；第二、基于共同好友之間的相似度來進(jìn)行推薦；第三、基于以上兩類之間的相似度來進(jìn)行推薦。然而，對于用戶節(jié)點之間的通話除了固有的工作需求，還存在生活好友之間的聯(lián)系需求，以上推薦系統(tǒng)對于情感緊密度的計算都鮮有涉及，因此也難以提供較為理想的推薦效果[4][5][6]。

集團(tuán)社交網(wǎng)絡(luò)中的推薦系統(tǒng)所服務(wù)對象是單個自然人用戶節(jié)點，其推薦的內(nèi)容主要為向用戶推薦最為有利的短號集團(tuán)網(wǎng)絡(luò)。對于單向交流的推薦，通過計算用戶節(jié)點與集團(tuán)網(wǎng)絡(luò)內(nèi)的部分用戶節(jié)點間的交流頻率、情感強(qiáng)度，進(jìn)而得出用戶與集團(tuán)之間的緊密度，根據(jù)緊密度最高值進(jìn)行推薦的方法通常能達(dá)到很理想的推薦效果。

針對以上問題，本文主要解決的是用戶節(jié)點與集團(tuán)社交網(wǎng)絡(luò)通話記錄的情感緊密度計算，具體分為兩大類：工作關(guān)系需求分析對于推薦集團(tuán)社交網(wǎng)絡(luò)的影響，通過緊密度分析計算用戶節(jié)點間的緊密度權(quán)值；生活關(guān)系對于推薦集團(tuán)網(wǎng)絡(luò)的影響，通過緊密度分析計算用戶節(jié)點間的緊密度權(quán)值。通過以上分析計算，再進(jìn)行歸類，統(tǒng)計用戶節(jié)點與各個集團(tuán)社交網(wǎng)絡(luò)的權(quán)值大小，利用改進(jìn)的NAS算法計算自然人與集團(tuán)之間的緊密度，根據(jù)緊密度向自然人推薦集團(tuán)社交網(wǎng)絡(luò)，進(jìn)而提高推薦的準(zhǔn)確度[1]。

二、改進(jìn)的NAS算法

基于節(jié)點屬性相似性的NAS算法計算方法是：對任意兩節(jié)點計算屬性相似度，每增加一個共同屬性，其邊權(quán)值就加1，由此來判斷兩節(jié)點之間的緊密度。然而自然人與集團(tuán)社交網(wǎng)絡(luò)各用戶之間的緊密程度各有不同，邊權(quán)值大小不一[2]。改進(jìn)的NAS算法基于邊權(quán)值不同的思想，對原有的算法進(jìn)行改進(jìn)，計算方法如下：

假定兩節(jié)點i和j共有N個聯(lián)系人，對于第k條通話ak(1kN)，先計算節(jié)點聯(lián)系人k的情感緊密值xk，每增加一個聯(lián)系人，其邊權(quán)值就加xk，即：

ifi.ak=j.ak，Wnas(i,j)=Wnas(i,j)+xk

公式表示為：

Wnas(i,j)+=(xk-|i.ak-j.ak|)

由上式計算方法可知，自然人與集團(tuán)社交網(wǎng)絡(luò)之間的值越高，就越緊密，反之，則緊密度越低。選取緊密度最高的集團(tuán)社交網(wǎng)絡(luò)給予推薦能達(dá)到較為理想的效果。

三、情感緊密值分析

下面結(jié)合默認(rèn)日常工作時間，給出影響情感傾向性的兩種時間段的情感緊密值計算規(guī)則。

對于一個自然人，有工作時段情感系數(shù)、生活時間情感系數(shù)、通話頻率和情感值4個概念，分別記為Work(value)、Life(value)、Frequency(value)和Socre。影響用戶之間通話情感值的關(guān)系分為兩種，分別為：工作關(guān)系和生活關(guān)系。工作關(guān)系本身的情感強(qiáng)度低于生活關(guān)系的情感強(qiáng)度，情感程度直接影響情感系數(shù)的取值。工作時段情感系數(shù)表示處于工作時間段通話所包含的情感值，設(shè)為0.5；生活時間情感系數(shù)表示處于生活時間段通話所包含的情感值，設(shè)為1；通話頻率表示工作時間段和生活時間段分別所含的次數(shù)。自然人與集團(tuán)內(nèi)客戶通話情感程度計算規(guī)則如式(1)所示：

Socre=Work(value)Frequency(value)+Life(value)Frequency(value)(1)

說明：當(dāng)自然人與集團(tuán)內(nèi)某些客戶僅存在工作關(guān)系時，生活時間情感系數(shù)與通話頻率的組合情感值默認(rèn)為0，同理當(dāng)自然人與集團(tuán)內(nèi)某些客戶僅存在生活關(guān)系時，工作時間情感系數(shù)與通話頻率的組合情感值默認(rèn)為0。

四、基于情感緊密度的用戶圖

首先建立邊無權(quán)值的初步用戶圖(如圖1樣式)。用戶圖表示為G=。其中，V表示用戶節(jié)點；E表示用戶節(jié)點間的聯(lián)系。如果自然人與甲存在聯(lián)系，且甲屬于某個集團(tuán)網(wǎng)絡(luò)，那么此集團(tuán)網(wǎng)絡(luò)節(jié)點V則包含了甲，會有一條邊到達(dá)此集團(tuán)網(wǎng)絡(luò)節(jié)點，若自然人與此集團(tuán)用戶乙同樣存在聯(lián)系，也會只有一條邊連接到此集團(tuán)網(wǎng)絡(luò)節(jié)點[7]。如果甲不屬于某個集團(tuán)網(wǎng)絡(luò)，則會有一條邊直接連接到甲。

圖1　初步用戶圖

通過以上步驟得到一個無權(quán)的初步用戶圖，下面將為其加上基于用戶情感緊密度的邊權(quán)值。具體步驟為：由情感緊密值分析計算源節(jié)點與各聯(lián)系人之間的情感緊密值，將屬于同一集團(tuán)網(wǎng)絡(luò)的情感值進(jìn)行加成，再由改進(jìn)的NAS算法遍歷圖中的每一個節(jié)點，逐一計算該自然人節(jié)點集團(tuán)網(wǎng)絡(luò)之間的情感緊密度，并將其作為邊權(quán)值保存于圖中。從而創(chuàng)建帶邊權(quán)值的完整用戶圖。

算法 Improved NAS

InputG為無權(quán)值的初步用戶圖，A[H][N]為節(jié)點屬性矩陣，X[N]為各條通話所得情感值，H為集團(tuán)網(wǎng)絡(luò)節(jié)點總數(shù)，N為通話總數(shù)。

Output G’為擁有自然人情感緊密度的用戶圖

1：for each attribute akin all attributes do

2：Wnas(i,j)=Wnas(i,j)+(X[N]-|A[i][N]-A[j][N]|)

3：end for

五、實驗分析

實驗數(shù)據(jù)采用江門移動2014年11月至12月的集團(tuán)通訊錄中的加密數(shù)據(jù)，對其進(jìn)行歸納整理，隨機(jī)選取其中183個集團(tuán)網(wǎng)絡(luò)用戶，從中剔除異地記錄數(shù)據(jù)4522條，得出13587條有效數(shù)據(jù)。將屬于同一集團(tuán)的數(shù)據(jù)打包，通過情感緊密度分析規(guī)則計算其中每條數(shù)據(jù)情感值，分別采用NAS算法和改進(jìn)的NAS算法進(jìn)行緊密度的計算賦予邊權(quán)值，從中挑選邊權(quán)值最大的集團(tuán)社交網(wǎng)絡(luò)進(jìn)行推薦，對比該用戶所在真實集團(tuán)網(wǎng)絡(luò)驗證正確率。將兩種方法的實驗結(jié)果進(jìn)行對比，如表1所示：

表1　兩種計算方法的實驗結(jié)果對比

從表1中可得出如下結(jié)論：

基于情感緊密度的計算方法的整體準(zhǔn)確率為92.35%，相對于基于NAS算法的計算方法的整體準(zhǔn)確率為83.06%，提高了9.29個百分點。進(jìn)而基于情感緊密度的集團(tuán)社交網(wǎng)絡(luò)推薦效果更加理想。

六、結(jié)論

本文通過對自然人通話信息數(shù)據(jù)進(jìn)行預(yù)處理的基礎(chǔ)上，分別利用NAS算法和基于情感緊密度的改進(jìn)NAS算法對自然人與集團(tuán)網(wǎng)絡(luò)之間的緊密度進(jìn)行計算。得出如下結(jié)論：NAS算法僅僅利用兩節(jié)點間共有屬性進(jìn)行緊密度計算，忽略了自然人基于情感層面的計算，產(chǎn)生的推薦結(jié)果準(zhǔn)確率不高。

針對這種情況，本文提出的基于情感緊密度的社交網(wǎng)絡(luò)推薦方法是基于情感緊密值分析和基于改進(jìn)NAS算法緊密度計算，對屬性的邊權(quán)值進(jìn)行有效的計算。實驗結(jié)果表明：本文所提出的基于情感緊密度的社交網(wǎng)絡(luò)推薦方法準(zhǔn)確度更高，更加符合現(xiàn)實。

(作者單位：五邑大學(xué)經(jīng)濟(jì)管理學(xué)院)

[1]Liu H，Salerno J J，Young M J.Social Computing，Behavioral Modeling，and Predicition[M].Karsten Steinhaeuser，USA:Springer，2008:168-175.

[2]陳克寒，韓盼盼，吳健.基于用戶聚類的異構(gòu)社交網(wǎng)絡(luò)推薦算法[J].計算機(jī)學(xué)報,2013,(2):349-359

[3]熊正理，姜文君，王國軍.基于用戶緊密度的在線社會網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)算法[J].計算機(jī)工程,2013,(8):50-54

[4]羅森林，潘麗敏.情感計算理論與技術(shù)[J].系統(tǒng)工程與電子技術(shù),2003,(7):905-909

[5]Yasuda Y.，Kawarnoto S.，Ebata A.，Okitsu J.，2003.Concept and evaluation of X-NAS:a highly scalable NAS system.Mass Storage Systems and Technologies，2003，(6):219 - 227.

[6]萬常選，江騰蛟，鐘敏娟，邊海榮.基于詞性標(biāo)注和依存句法的Web金融信息情感計算[J].計算機(jī)研究與發(fā)展,2013,50(12):2554-2569

[7]Chen J，Geuer W，Dugan C，Muller M，Guy I．Make new friends，but keep the old：Recommending people on social networking sites//Proceedings of the 27th International Conference on Human Factors in Computing Systems ．New York，NY，USA，2009：201-210

基于情感緊密度的社交網(wǎng)絡(luò)推薦算法

一、引言

二、改進(jìn)的NAS算法

三、情感緊密值分析

四、基于情感緊密度的用戶圖

五、實驗分析

六、結(jié)論

一、引言

二、改進(jìn)的NAS算法

三、情感緊密值分析

四、基于情感緊密度的用戶圖

五、實驗分析