張春麗 張濤
摘要:隨著各種互聯(lián)網(wǎng)金融理財(cái)產(chǎn)品的普及,用戶往往難以獲取可信任的投資產(chǎn)品,為解決這一問題,設(shè)計(jì)一種基于社交網(wǎng)絡(luò)定向推送理財(cái)產(chǎn)品的方法,利用用戶直接社會關(guān)系和間接社會關(guān)系來推送理財(cái)產(chǎn)品。當(dāng)用戶之間關(guān)系不明確時(shí),通過分析用戶所使用的移動設(shè)備或位置感知服務(wù)產(chǎn)生的時(shí)空數(shù)據(jù)集,基于EBM 模型來挖掘潛在的用戶社會關(guān)系,即間接社會關(guān)系?;谟脩舻闹苯由鐣P(guān)系和間接社會關(guān)系發(fā)現(xiàn)用戶可信任的其他用戶,然后利用傳統(tǒng)的基于用戶的協(xié)同過濾算法做出理財(cái)產(chǎn)品推送。算法分析與仿真實(shí)驗(yàn)結(jié)果表明該推送方法是可行和有效的。
關(guān)鍵詞:金融理財(cái)產(chǎn)品;社會關(guān)系;時(shí)空數(shù)據(jù);EBM模型;協(xié)同過濾
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)30-0277-04
The Study of Financial Products Push Based on Social Relations
ZHANG Chun-li, ZHANG Tao
(Network Security Technology Research and Development Center, Third Research Institute of the Ministry of Public Security, Shanghai 200120, China)
Abstract: With the popularity of various internet financial products, the user is often difficult to obtain trusted investment products. In order to solve this problem, a method based on social network to recommend financial products is designed, which makes use of the user direct and indirect social relations to push financial products. When the relationship between the users is not clear, by analyzing spatiotemporal data sets generated by the mobile device or location based service used by users, the EBM model is applied to tap the potential social relations between users, namely indirect social relations. After that trusted users of the target user can be found based on the direct and indirect social relations. Finally, traditional user-based collaborative filtering algorithm is used to recommend financial products. Algorithm analysis and simulation results show that the push method is feasible and effective.
Key words: financial products; social relations; spatiotemporal data; EBM model; collaborative filtering
1 引言
隨著互聯(lián)網(wǎng)的快速發(fā)展和智能手機(jī)的迅速普及,我國互聯(lián)網(wǎng)金融市場作為一個(gè)潛力巨大的新興市場應(yīng)運(yùn)而生。互聯(lián)網(wǎng)金融快速的發(fā)展為互聯(lián)網(wǎng)金融理財(cái)產(chǎn)品[1]的生長提供豐富的土壤。2013年,阿里巴巴集團(tuán)推出一款名為“余額寶”的金融理財(cái)產(chǎn)品,成為第一個(gè)真正意義上的互聯(lián)網(wǎng)金融理財(cái)產(chǎn)品。與傳統(tǒng)銀行理財(cái)產(chǎn)品相比,低門檻、高收益、操作簡單方便是它留給投資者的最深刻的印象。這些優(yōu)點(diǎn)讓互聯(lián)網(wǎng)理財(cái)產(chǎn)品很快成為投資者的新型理財(cái)方式。在余額寶的帶領(lǐng)下越來越多的互聯(lián)網(wǎng)金融理財(cái)產(chǎn)品如雨后春筍般成長起來。伴隨著這些投資產(chǎn)品的產(chǎn)生,消費(fèi)者信任這一問題日漸突出,如何選擇低風(fēng)險(xiǎn)高回報(bào)的理財(cái)產(chǎn)品越來越難。在此背景下,本文提出了一種基于社交網(wǎng)絡(luò)定向推送理財(cái)產(chǎn)品的方法。利用用戶直接社會關(guān)系和間接社會關(guān)系來推送理財(cái)產(chǎn)品。當(dāng)用戶之間關(guān)系不明確時(shí),通過分析用戶所使用的移動設(shè)備或位置感知服務(wù)產(chǎn)生的時(shí)空數(shù)據(jù)集,基于EBM 模型來挖掘潛在的用戶社會關(guān)系,即間接社會關(guān)系。
眾所周知,微博、微信、位置感知服務(wù)LBS的普及,產(chǎn)生了大量有關(guān)用戶位置信息的數(shù)據(jù)集。我們可以隱式的獲取這些用戶位置信息,例如當(dāng)用戶在移動設(shè)備上進(jìn)行了信用卡交易活動,我們通過手機(jī)信號發(fā)射塔、GPS、WiFi熱點(diǎn)等可以推測出他目前所在的位置以及交易的時(shí)間等。同時(shí),用戶位置信息也可以顯示獲取,例如當(dāng)一個(gè)人發(fā)布了一篇帶有地理標(biāo)簽的微博,或者在微信上傳了一張圖片。這些位置數(shù)據(jù)集,即時(shí)空數(shù)據(jù)集,保真度高,是研究用戶的社會行為,用戶間社會關(guān)系的豐富信息資源。同時(shí)社會研究表明,頻繁在同一時(shí)間出現(xiàn)在同一地點(diǎn)的兩個(gè)人,最有可能有一定的社會關(guān)系,比如說朋友關(guān)系、夫妻關(guān)系等。
本文通過獲取用戶的時(shí)空數(shù)據(jù)集,發(fā)現(xiàn)用戶的間接社會關(guān)系,并基于用戶的直接社會關(guān)系和間接社會關(guān)系幫助用戶發(fā)現(xiàn)可信任的其他用戶,然后利用傳統(tǒng)的基于用戶的協(xié)同過濾算法做出理財(cái)產(chǎn)品推送。
2 相關(guān)工作
2.1 協(xié)同過濾推薦
協(xié)同過濾的概念最早于1992年由Goldberg等人提出,用于解決電子郵件數(shù)量過載問題。直到今天,協(xié)同過濾算法依然是互聯(lián)網(wǎng)中應(yīng)用最廣泛、最成功的推薦算法。目前主要有基于用戶(User-based)[2] 的協(xié)同過濾和基于商品(Item-based)[3]的協(xié)同過濾算法。
基于用戶的協(xié)同過濾算法依據(jù)“相似用戶具有相似興趣”的假設(shè),為目標(biāo)用戶選擇相似用戶集,利用這些相似用戶的已有評分對目標(biāo)用戶沒有進(jìn)行過評分的產(chǎn)品進(jìn)行評分預(yù)測,具體步驟如下:
假設(shè)用戶u和用戶v購買理財(cái)產(chǎn)品集合分別為[Iu]、Iv,共同購買的理財(cái)產(chǎn)品集合為Iuv,[Ru,i]表示用戶u對理財(cái)產(chǎn)品i 的購買情況,[Rv,i]表示用戶v對理財(cái)產(chǎn)品i 的購買情況,0代表沒有購買過,1代表購買過,[Ru]和[Rv]分別表示用戶u和v對理財(cái)產(chǎn)品的平均購買情況。
(1) 計(jì)算用戶相似性
基于兩個(gè)用戶共同購買的理財(cái)產(chǎn)品計(jì)算相似性,為目標(biāo)用戶選擇興趣相似度最高的N個(gè)最近鄰,最常用的測量用戶相似度的方法是皮爾遜相關(guān)系數(shù)相似度和余弦相似度。用戶u和用戶v之間的相似性通過Pearson相關(guān)系數(shù)度量[4]:
[simu,v=i∈IuvRu,i-RuRv,i-Rvi∈IuvRu,i-Ru2i∈IuvRv,i-Rv2] (1)
(2) 得到目標(biāo)用戶的推薦列表。
根據(jù)N個(gè)近鄰用戶對理財(cái)產(chǎn)品的購買行為,計(jì)算目標(biāo)用戶對目標(biāo)產(chǎn)品的預(yù)測評分。最終將預(yù)測評分最高的若干理財(cái)產(chǎn)品推薦給目標(biāo)用戶。常用計(jì)算方法是平均加權(quán)策略,如下:
目標(biāo)用戶u 對理財(cái)產(chǎn)品i 的預(yù)測評分為[4]:
[Pu,i=Ru+simu,v×Rv,i- Rvsimu,v] (2)
基于商品的協(xié)同過濾算法原理和基于用戶的算法基本上是相同的,但是基于商品的協(xié)同過濾算法在計(jì)算相似性的時(shí)候是針對商品的,該種算法適用于用戶數(shù)量的增長速度大大超過商品數(shù)量的增長速度的系統(tǒng)中。通過為目標(biāo)用戶的未購買過的理財(cái)產(chǎn)品選擇相似產(chǎn)品集并對其進(jìn)行評分預(yù)測,算法選出最終評分最高的N個(gè)理財(cái)產(chǎn)品推薦給用戶。
本文中我們使用基于用戶的協(xié)同過濾算法,以用戶社會關(guān)系強(qiáng)度[6,7]衡量用戶相似度,使用平均加權(quán)策略預(yù)測未知評分。
2.2 用戶社會關(guān)系強(qiáng)度
Granovetter在他的標(biāo)志性論文《The Strength of Weak Ties》[5]提出了關(guān)系強(qiáng)度的概念。關(guān)系強(qiáng)度從量化角度考察社會網(wǎng)絡(luò)用戶間的連接緊密程度。社會關(guān)系強(qiáng)度越高,表示用戶間的關(guān)系越緊密。因此度量和分析用戶社會網(wǎng)絡(luò)關(guān)系強(qiáng)度具有重要的理論和實(shí)用價(jià)值。針對當(dāng)前在線社交網(wǎng)絡(luò)中用戶關(guān)系強(qiáng)度度量問題,陳亮[6]等認(rèn)為在線社會網(wǎng)絡(luò)中用戶的交互頻率從某種程度上反映了社交網(wǎng)絡(luò)中用戶之間的關(guān)系強(qiáng)度,并以微博用戶為例給出了關(guān)系強(qiáng)度的定量化描述。具體步驟如下:
(1) 形式化定義微博用戶交互行為
微博應(yīng)用存在多種用戶交互行為,如消息提醒、私信、轉(zhuǎn)發(fā)、收藏、評論、關(guān)注、點(diǎn)贊等,分為四種不同的屬性:直接、間接、公開、私有。
這些用戶交互行為可以形式化定義如下:
[WBu1,…,un:P] (3)
其中,WB表示微博應(yīng)用情景,而P可表示多種用戶交互行為,[ u1,…,un]可代表該交互行為涉及到的不同用戶。
由此可知,不同用戶的不同交互行為可表示為[Piv1,…,vn],[Pjv1,…,vm]等形式。例如,用戶[u1]與用戶[v1]在某篇微博中存在不同的用戶交互行為[P1]與[P2],為計(jì)算用戶[u1]與用[v1]之間關(guān)系強(qiáng)度,可將兩者合并為同一描述形式:[WBu1,v1:P1u1?P2v1]。其中[P1]與[P2]是不同的用戶交互行為,如[P1u1]代表用戶[u1]轉(zhuǎn)發(fā)了當(dāng)前的微博,[P2v1]代表用戶[v1]評論了該微博。
(2) 計(jì)算關(guān)系強(qiáng)度值
關(guān)系強(qiáng)度值計(jì)算形式化表示如下:
[suv=k=1Nkαk*f(|Su|k(v) |)] (4)
在上式中, Suv表示用戶u與用戶v之間的關(guān)系強(qiáng)度值,其取值范圍為(0,1),[k=1Nkαk=1]代表用戶情境空間分類及每種情境的權(quán)重,不失一般性,這里取四種關(guān)系屬性權(quán)重為[αk] = 0.25。Nk代表了屬性分類,在這里代表直接屬性、間接屬性、公開屬性和私有屬性。[Su|k(v)]表示屬于第k類屬性的交互行為的集合。f是用戶交互行為正規(guī)化函數(shù),形式化表示為:
[fx=ln(xmaxx2x)ln(xmax2x2)] (5)
其中,[x][x]表示自變量的平均值,在微博應(yīng)用情景中表示用戶交互行為集合的平均值,[xmax]表示自變量的最大值,這里表示某類屬性交互行為的最大值。從上式中可以看出如果[x>x],f(x)的值接近1,反之[fx]值接近0。
關(guān)系強(qiáng)度值接近0表明兩者之間為弱關(guān)系,接近1表明兩者之間為強(qiáng)關(guān)系。在線社交網(wǎng)絡(luò)中用戶交互行為形成的關(guān)系強(qiáng)度反映了用戶對的興趣相似性和同質(zhì)性,但并不能反映用戶對的現(xiàn)實(shí)社會關(guān)系。用戶在購買理財(cái)產(chǎn)品時(shí)更多地會考慮到它帶來的風(fēng)險(xiǎn)性,所以人們更愿意相信來自信任度高的朋友的推薦。所以在社交網(wǎng)絡(luò)中向用戶推送理財(cái)產(chǎn)品不僅要考慮用戶的興趣相似性,還要考慮用戶的真實(shí)社會關(guān)系,真實(shí)關(guān)系越親密,推送成功率越高。所以本文工作主要在于挖掘社交網(wǎng)絡(luò)中用戶的真實(shí)社會關(guān)系,并綜合用戶的興趣相似性,來推送理財(cái)產(chǎn)品。
3 基于社交網(wǎng)絡(luò)的理財(cái)產(chǎn)品推送方法
3.1 建立原始數(shù)據(jù)模型
本文使用從新浪微博中采集的6萬余名用戶信息(用戶個(gè)人賬號信息、用戶關(guān)系信息、用戶交互行為信息與用戶位置信息等),并獲取到這些用戶在2016年3月到2016年6月共三個(gè)月的理財(cái)產(chǎn)品購買記錄,建立原始數(shù)據(jù)模型如下:
(1) 用戶集合,即所有采集的新浪微博用戶集合,用U表示。
(2) 理財(cái)產(chǎn)品集合,即所有可選擇的理財(cái)產(chǎn)品集合,用I表示。
(3) 用戶交互行為集合,用[WBu1,…,un:P]表示。
(4) 用戶時(shí)空數(shù)據(jù)集[7],即從社交網(wǎng)絡(luò)中收集到的有關(guān)用戶位置信息的數(shù)據(jù)集,每條時(shí)空數(shù)據(jù)包括用戶ID、用戶訪問地點(diǎn)的經(jīng)緯度值、地點(diǎn)ID,用L表示。
(5) 用戶社會關(guān)系矩陣,即集合U 中的用戶間的社會關(guān)系,用 F表示用戶關(guān)系矩陣,存儲用戶之間的社會關(guān)系強(qiáng)度。
(6) 用戶產(chǎn)品評分矩陣,即集合U 中用戶對集合I中理財(cái)產(chǎn)品的評分矩陣,使用R 表示。
3.2 用戶社會關(guān)系
(1) 直接社會關(guān)系
社交網(wǎng)絡(luò)中用戶間的直接社會關(guān)系[ sdij],表示有在線交互記錄的用戶i和用戶j的用戶相似性以及歷史交互行為情況的屬性向量,如公式4所示。
(2) 間接社會關(guān)系
社交網(wǎng)絡(luò)中用戶間的間接社會關(guān)系[ sidij],是指通過從社交網(wǎng)絡(luò)中收集用戶i和用戶j的時(shí)間位置信息挖掘用戶i和用戶j潛在的社會關(guān)系,如公式6、7、8所示。
本文中我們基于用戶位置信息計(jì)算用戶間的間接社會關(guān)系強(qiáng)度。EBM模型是一種時(shí)空數(shù)據(jù)集上計(jì)算社會關(guān)系強(qiáng)度的基于熵的模型,是用戶多樣性[7]和加權(quán)頻率[7]的有效結(jié)合。多樣性量化度量兩個(gè)用戶的所有共同出現(xiàn)中有效位置的數(shù)量,給出了實(shí)際位置的平均豐度比例。并通過引入了一個(gè)可調(diào)節(jié)的參數(shù)q靈活控制頻繁發(fā)生的巧合事件對社會關(guān)系強(qiáng)度的影響力。加權(quán)頻率提高了兩個(gè)用戶在不擁擠地點(diǎn)的共同出現(xiàn)對社會關(guān)系強(qiáng)度的重要性。
假設(shè)用戶社會關(guān)系強(qiáng)度為[ sij],用戶多樣性為[Dij],用戶加權(quán)頻率為[Fij],社會關(guān)系強(qiáng)度計(jì)算公式如下:
[ sij=αDij+βFij+γ ] (6)
[Dij=l,cij,l≠0cij,lfijq11-q] (7)
[Fij=lcij,l×exp u,Pu,l≠0Pu,llogPu,l ] (8)
其中α 、β 、γ 是優(yōu)化參數(shù),q是多樣性階數(shù),α 、β的經(jīng)驗(yàn)值[7]為(0.483,0.520),q的經(jīng)驗(yàn)值為0.1。[ cij,l]是用戶i和j在地點(diǎn)l的共同出現(xiàn)次數(shù),[fij=lcij,l]是用戶i和j在所有地點(diǎn)共同出現(xiàn)的總數(shù)。[Pu,l]是用戶u在地點(diǎn)l出現(xiàn)的概率。
基于用戶位置信息形成的社會關(guān)系強(qiáng)度,因?yàn)榭紤]了用戶的實(shí)時(shí)和歷史位置信息,更能反映用戶對在現(xiàn)實(shí)中的社會關(guān)系。
(3) 綜合社會關(guān)系
在線社交網(wǎng)絡(luò)中用戶交互行為形成的關(guān)系強(qiáng)度反映了用戶對的興趣相似性和同質(zhì)性,并不能反映用戶對的現(xiàn)實(shí)社會關(guān)系。同時(shí)基于用戶位置信息形成的社會關(guān)系強(qiáng)度,因?yàn)榭紤]了用戶的實(shí)時(shí)和歷史位置信息,更能反映用戶對在現(xiàn)實(shí)中的社會關(guān)系。綜合考慮兩種社會關(guān)系強(qiáng)度,最終形成了既能反映用戶興趣相似性又能反映用戶真實(shí)信任關(guān)系的社會關(guān)系強(qiáng)度。給出了計(jì)算方法如下:
[ sij=γ sdij+(1-γ) sidij] (9)
其中[γ∈[0,1]],當(dāng)[γ=0]時(shí),用戶社會關(guān)系即用戶的間接社會關(guān)系,當(dāng)[γ=1]時(shí),用戶社會關(guān)系即用戶的直接社會關(guān)系,通過調(diào)節(jié)[γ]可以控制兩種社會關(guān)系的權(quán)重比例。
基于理財(cái)產(chǎn)品市場現(xiàn)狀,多數(shù)用戶更愿意相信來自朋友而非理財(cái)平臺的推薦信息,且交往密切的用戶信任度越高。用戶社會關(guān)系強(qiáng)度越高,他們交往越密切,那么他們的信任值越高。所以用戶社會關(guān)系強(qiáng)度在某種程度上表示用戶之間信任度。
3.3 基于用戶社會關(guān)系的理財(cái)產(chǎn)品推薦方法
推薦方法的基本思想是:用戶交互行為信息上計(jì)算用戶對的直接社會關(guān)系,形成直接社*會關(guān)系矩陣;時(shí)空數(shù)據(jù)集上計(jì)算用戶對的間接社會關(guān)系,形成間接社會關(guān)系矩陣;線性組合直接社會關(guān)系矩陣和間接社會關(guān)系矩陣,得到既能反映用戶對興趣相似性也能反映用戶現(xiàn)實(shí)社會關(guān)系的綜合社會關(guān)系,并根據(jù)關(guān)系緊密程度找到可信任用戶集;基于可信任用戶的理財(cái)產(chǎn)品評分信息,利用傳統(tǒng)的基于用戶的協(xié)同過濾算法做出理財(cái)產(chǎn)品推薦。
算法:基于用戶社會關(guān)系推送理財(cái)產(chǎn)品
輸入:用戶交互行為集[WBu1,…,un:P],用戶時(shí)空數(shù)據(jù)集L,用戶產(chǎn)品評分矩陣R,目標(biāo)用戶[u]
輸出:向目標(biāo)用戶[u]推送的理財(cái)產(chǎn)品集
第一步:用戶交互行為集合[WBu1,…,un:P]上根據(jù)公式3、4計(jì)算用戶對的直接社會關(guān)系強(qiáng)度[ tij],得到直接社會關(guān)系矩陣T;
第二步:時(shí)空數(shù)據(jù)集L上根據(jù)公式5、6、7計(jì)算用戶對的間接社會關(guān)系強(qiáng)度[ sij],得到間接社會關(guān)系矩陣S;
第三步:T和S線性組合得到用戶對社會關(guān)系矩陣F。
第四步:基于用戶社會關(guān)系矩陣F,利用TOP-N方法或閾值法,得到目標(biāo)用戶的K個(gè)最近鄰。
第五步:平均加權(quán)策略進(jìn)行評分預(yù)測,得到推送產(chǎn)品列表。
4 實(shí)驗(yàn)
本文提出一種基于社交網(wǎng)絡(luò)推送理財(cái)產(chǎn)品的方法。根據(jù)用戶的在線交互行為和時(shí)空數(shù)據(jù)集,深入挖掘潛在的用戶社會關(guān)系,然后將其應(yīng)用于協(xié)同過濾算法,幫助用戶發(fā)現(xiàn)其可信任的近鄰用戶,并進(jìn)行用戶偏好理財(cái)產(chǎn)品預(yù)測。
4.1 實(shí)驗(yàn)環(huán)境
實(shí)驗(yàn)運(yùn)行的硬件環(huán)境為Intel(R) Core? i7-4790 CPU @3.60GHz,內(nèi)存8GB,操作系統(tǒng)為Windows7。開發(fā)環(huán)境為Eclipse。
4.2 評價(jià)方法
(1)準(zhǔn)確率
準(zhǔn)確率表示推薦給用戶的列表中他喜歡的理財(cái)產(chǎn)品的概率,定義為推薦列表中用戶喜歡的理財(cái)產(chǎn)品個(gè)數(shù)與推薦列表長度的比值,對于用戶u,推薦準(zhǔn)確率的計(jì)算方式如下:
[P=NtpL]
其中[Ntp]表示推薦列表中的理財(cái)產(chǎn)品與測試集中該用戶所選過的理財(cái)產(chǎn)品重合的個(gè)數(shù),L表示系統(tǒng)為用戶推薦的理財(cái)產(chǎn)品個(gè)數(shù)(即推薦列表長度)。
P的值越高,,說明算法的推薦效果越好,而系統(tǒng)平均的推薦準(zhǔn)確 率,既是測試集中所有用戶準(zhǔn)確率的平均值。
(2)召回率
我們將推薦列表中用戶喜歡的理財(cái)產(chǎn)品個(gè)數(shù)與系統(tǒng)中用戶喜歡的所有理財(cái)產(chǎn)品個(gè)數(shù)的比率定義為召回率,用于表示一個(gè)用戶喜歡的理財(cái)產(chǎn)品被推薦的概率。對于用戶u,推薦召回率定義如下:
[R=NtpIu]
其中,[Ntp]表示推薦列表中的理財(cái)產(chǎn)品與測試集中用戶u選過的理財(cái)產(chǎn)品重合的個(gè)數(shù),[Iu]表示測試集中用戶u選過的所有理財(cái)產(chǎn)品的個(gè)數(shù)。
R的值越高,說明算法的推薦效果越好,而系統(tǒng)平均的推薦召回率,既是測試集中所有用戶召回率的平均值。
4.3 結(jié)果比較
為了驗(yàn)證用戶間的社會關(guān)系強(qiáng)度對推薦結(jié)果的影響,在實(shí)驗(yàn)中我們比較了基于用戶的協(xié)同過濾算法(user-based CF)、基于產(chǎn)品的協(xié)同過濾算法(item-based CF)和本文提出的基于用戶社會關(guān)系的推薦算法(hybrid)的推薦效果。
對于上述三種算法,我們?nèi)⊥扑]列表長度(即系統(tǒng)推薦給目標(biāo)用戶的理財(cái)產(chǎn)品個(gè)數(shù)為1-6,并計(jì)算算法在準(zhǔn)確率、召回率兩個(gè)指標(biāo)上的表現(xiàn)。
從圖1和2中可以看出,在準(zhǔn)確率和召回率兩個(gè)指標(biāo)上,均是基于用戶社會關(guān)系的推薦算法的效果最佳,其次是基于產(chǎn)品的協(xié)同過濾算法(item-based CF),再次是基于用戶的協(xié)同過濾算法(user-based CF),三種推薦算法的準(zhǔn)確率和召回率的差異不太大。
從圖3和圖4中的結(jié)果可以看出,本文提出的基于用戶社會關(guān)系的推薦算法,當(dāng)[γ=0.3]時(shí)推薦效果最佳,表示更能體現(xiàn)用戶真實(shí)社會關(guān)系的間接社會關(guān)系對理財(cái)產(chǎn)品推薦效果的影響較大。
5 結(jié)論
本文結(jié)合用戶社會關(guān)系研究方法提出一種基于用戶社會關(guān)系強(qiáng)度進(jìn)行理財(cái)產(chǎn)品推薦的方法。該方法在推薦過程中考慮了用戶的在線交互行為信息、用戶的位置信息、用戶間的社會關(guān)系強(qiáng)度以及評分矩陣信息,并根據(jù)用戶關(guān)系緊密程度找到可信用戶;利用可信用戶計(jì)算目標(biāo)用戶對理財(cái)產(chǎn)品的偏好。從實(shí)驗(yàn)結(jié)果可以看出基于用戶社會關(guān)系推送理財(cái)產(chǎn)品有比較好的推送效果。另外,本文中的社會關(guān)系計(jì)算方法只考慮了用戶訪問某一地點(diǎn)的時(shí)間以及地點(diǎn)的擁擠程度,而忽略了用戶在某一地點(diǎn)的停留時(shí)間,這對用戶間的社會關(guān)系也是至關(guān)重要的。在未來的工作中,我們打算研究如何將用戶停留時(shí)間加入到社
會關(guān)系計(jì)算方法中,以便進(jìn)一步改善推薦的效果。
參考文獻(xiàn):
[1] 徐弦,程姣姣,符之瑜,等.不同年齡階層群體對互聯(lián)網(wǎng)理財(cái)產(chǎn)品的信任度研究[J].經(jīng)貿(mào)實(shí)踐,2015(16).
[2] Breese J S, Heckerman D, Kadie C. Empirical Analysis of Predictive Algorithm for Collaborative Filtering[J]. 2015.
[3] GONG Songjie, YE Hongwei. Joining user clustering and item based collaborative filtering in personalized recommendation services[C]//Industrial and Information Systems, 2009. IIS'09. International Conference on. IEEE, 2009: 149-151.
[4] 馬宏偉,張光衛(wèi),李鵬.協(xié)同過濾推薦算法綜述[J].小型微型計(jì)算機(jī)系統(tǒng), 2009 ,30 (7): 1282-1288.
[5] Granovetter M. The strength of weak ties[J]. American journal of sociology, 1973: 1360-1380
[6] 陳亮,朱培棟,陳侃.基于在線交互行為的社會關(guān)系強(qiáng)度計(jì)算方法[EB/OL].北京:中國科技論文在線 [2016-06-12].http://www.paper.edu.cn/releasepaper/content/201606-577.
[7] Pham H, Shahabi C,Liu Y, Ebm- an entropy-based model to infer social strength from spatiotemporal data, Proceedings of the 2013 international conference on Management of data. ACM, 2013: 265-276.
[8] 張佩云, 黃波, 謝榮見,等. 一種基于社會網(wǎng)絡(luò)信任關(guān)系的服務(wù)推薦方法[J].小型微型計(jì)算機(jī)系統(tǒng), 2014, 35(2):222-227.
[9] 王玉祥, 喬秀全, 李曉峰,等. 上下文感知的移動社交網(wǎng)絡(luò)服務(wù)選擇機(jī)制研究[J].計(jì)算機(jī)學(xué)報(bào),2010, 33(11):2126-2135.