周瓊,曲曉威,陳曦,孫雨,姚福賓,翟睿峰
(1.長(zhǎng)春理工大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,長(zhǎng)春 130022;2.長(zhǎng)春市萬(wàn)易科技有限公司,長(zhǎng)春 130000)
一種基于用戶投資偏好與產(chǎn)品特征的P2P網(wǎng)貸個(gè)性化推薦算法
周瓊1,曲曉威2,陳曦1,孫雨1,姚福賓1,翟睿峰1
(1.長(zhǎng)春理工大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,長(zhǎng)春 130022;2.長(zhǎng)春市萬(wàn)易科技有限公司,長(zhǎng)春 130000)
互聯(lián)網(wǎng)金融的蓬勃發(fā)展,在將普惠金融的實(shí)惠帶給投資者的同時(shí),也因理財(cái)產(chǎn)品的多樣化,給投資者帶來(lái)了挑選適合自己的網(wǎng)貸產(chǎn)品的困擾。鑒于此,系統(tǒng)結(jié)合P2P網(wǎng)貸平臺(tái)投資者的個(gè)人投資偏好和平臺(tái)產(chǎn)品的特征,設(shè)計(jì)了一種基于用戶賬戶持續(xù)時(shí)間、活躍度及投資偏好的P2P網(wǎng)貸個(gè)性化推薦算法,以節(jié)約投資者決策時(shí)間,加快平臺(tái)資金籌集進(jìn)度。
用戶投資偏好;產(chǎn)品特征;P2P網(wǎng)貸;個(gè)性化推薦
互聯(lián)網(wǎng)技術(shù)的日益成熟,帶來(lái)了其應(yīng)用領(lǐng)域的不斷拓展,傳統(tǒng)金融也搭互聯(lián)網(wǎng)的快車產(chǎn)生了P2P網(wǎng)貸、第三方支付、眾籌等網(wǎng)絡(luò)金融模式,其中P2P貸在規(guī)模和交易量上都占據(jù)了突出優(yōu)勢(shì)。在P2P網(wǎng)貸快速發(fā)展的同時(shí),互聯(lián)網(wǎng)本身的信息過(guò)載問(wèn)題也日益凸顯。同時(shí),由于P2P網(wǎng)貸平臺(tái)與傳統(tǒng)電子商務(wù)的消費(fèi)特性不同,用戶在選擇產(chǎn)品時(shí)需要綜合考慮投資收益率、風(fēng)險(xiǎn)等多方面因素,如何根據(jù)用戶的投資偏好與產(chǎn)品特征,為其提供高質(zhì)量的、個(gè)性化的推薦產(chǎn)品是P2P網(wǎng)貸平臺(tái)需要解決的問(wèn)題。
典型的推薦系統(tǒng)基于用戶集合、商品集合以及用戶對(duì)所購(gòu)商品評(píng)價(jià)集合進(jìn)行構(gòu)建,推薦的目標(biāo)是根據(jù)歷史數(shù)據(jù)對(duì)未來(lái)的選擇進(jìn)行預(yù)測(cè),輔助用戶在盡可能少的時(shí)間內(nèi)做出決策選擇。在實(shí)際應(yīng)用中,常將評(píng)價(jià)值按從高到底進(jìn)行排序,把評(píng)價(jià)值高的k個(gè)商品推薦給用戶。
本文結(jié)合對(duì)產(chǎn)品特征、用戶基本特征與用戶投資偏好進(jìn)行分類,根據(jù)用戶賬戶持續(xù)時(shí)間與活躍度,研究按照用戶分類與投資偏好的P2P網(wǎng)貸個(gè)性化推薦算法。
推薦算法是通過(guò)歷史行為,推測(cè)出未來(lái)可能的選擇傾向的一種方法。目前有基于內(nèi)容、關(guān)聯(lián)規(guī)則、效用、協(xié)同過(guò)濾、知識(shí)、組合等多種互聯(lián)網(wǎng)主流推薦算法,這些算法都是借助大數(shù)據(jù)相關(guān)技術(shù)對(duì)用戶和項(xiàng)目/產(chǎn)品相關(guān)數(shù)據(jù)進(jìn)行深入分析,挖掘用戶行為模式和喜好,進(jìn)而預(yù)測(cè)其未來(lái)的可能選擇,為其提供個(gè)性化的推薦。個(gè)性化推薦算法通常包括學(xué)習(xí)和使用兩個(gè)階段,在學(xué)習(xí)過(guò)程中對(duì)原始數(shù)據(jù)進(jìn)行挖掘分析并建立相應(yīng)算法推薦模型,該模型可用于使用階段行為預(yù)測(cè),為用戶提供個(gè)性化推薦。
選取產(chǎn)品的"類型"、"年華收益率"、"期限"、"起投金額"等結(jié)構(gòu)化信息進(jìn)行特征提取,采用K均值聚類(K-Means Clustering)方法來(lái)對(duì)產(chǎn)品進(jìn)行分類。
K均值聚類算法分類過(guò)程如下:
(1)從產(chǎn)品數(shù)據(jù)樣本集中選取K(K=8,參照目前人工分類結(jié)果設(shè)定)個(gè)數(shù)據(jù)對(duì)象,并將這K個(gè)對(duì)象初始化為簇中心;
(2)計(jì)算剩下的樣本到K個(gè)簇中心的歐式距離(見(jiàn)公式1),將樣本劃分到距離最小的簇;
(3)在聚類結(jié)果基礎(chǔ)上,重新計(jì)算每個(gè)簇的中心;
(4)將中心以外的元素重新聚類;
(5)重復(fù)執(zhí)行2-4,直至聚類穩(wěn)定。
將用戶特征分為兩類:個(gè)人基本信息和用戶投資偏好。本算法選取的基本信息包括身份特征、工作特征、風(fēng)險(xiǎn)承受能力、平臺(tái)登陸情況等注冊(cè)時(shí)填報(bào)的信息和實(shí)時(shí)獲取的動(dòng)態(tài)信息,投資偏好信息包括投資產(chǎn)品特性、投資周期、參與活動(dòng)情況等歷史交易信息。個(gè)人基本信息用于對(duì)用戶進(jìn)行分類,投資偏好信息用于為老用戶和活躍度較高的用戶生產(chǎn)產(chǎn)品排序進(jìn)行推薦。
用戶模型也稱為用戶畫(huà)像,用戶投資興趣模型是在用戶特征數(shù)據(jù)基礎(chǔ)上進(jìn)行構(gòu)建的。
分析用戶的投資偏好主要通過(guò)動(dòng)態(tài)更新用戶的投資日志記錄獲取,用戶興趣模型創(chuàng)建受限于日志收集時(shí)間與投資交易次數(shù),越是交易次數(shù)多的活躍用戶,推薦成功率越高;對(duì)于新用戶或者投資次數(shù)較少的用戶,按用戶分類進(jìn)行產(chǎn)品推薦。
分析用戶投資日志記錄,按N類產(chǎn)品投資次數(shù)大小進(jìn)行排序,得到用戶投資興趣模型。
新產(chǎn)品上線,該類產(chǎn)品在用戶投資興趣模型中排序在前3,則將該產(chǎn)品推薦給用戶;如產(chǎn)品投資所剩時(shí)間小于24小時(shí),則向用戶投資興趣模型中排序在前5的用戶進(jìn)行推薦。
本文從吉林省某互聯(lián)網(wǎng)金融平臺(tái)2016年5-10月半年的數(shù)據(jù)中隨機(jī)抽取了1300個(gè)產(chǎn)品與5000個(gè)用戶的數(shù)據(jù)進(jìn)行了算法推薦效果驗(yàn)證測(cè)試,產(chǎn)品采用K均值聚類方法進(jìn)行分類,經(jīng)過(guò)6次迭代得到了穩(wěn)定的分類結(jié)果,迭代過(guò)程與結(jié)果如圖1所示。
圖1 產(chǎn)品聚類分類過(guò)程與結(jié)果
推薦產(chǎn)品與客服中心的人工推薦產(chǎn)品用戶最終投資情況進(jìn)行了對(duì)比分析,如表1所示。
從表1可以看出,網(wǎng)絡(luò)推薦范圍比線下推薦范圍大,推薦成功率低,目前數(shù)值達(dá)70%以上即可滿足算法要求,這一數(shù)值可以根據(jù)平臺(tái)的要求通過(guò)調(diào)整對(duì)應(yīng)參數(shù)閾值得到提高。
本文提出了一種基于用戶投資偏好與項(xiàng)目特征的互聯(lián)網(wǎng)金融推薦算法。首先采用K均值聚類算法對(duì)產(chǎn)品進(jìn)行分類,然后根據(jù)用戶的投資偏好,對(duì)其投資產(chǎn)品類型進(jìn)行排序,按照特定規(guī)則為其推薦對(duì)應(yīng)產(chǎn)品。該算法推薦結(jié)果與平臺(tái)線下推薦結(jié)果進(jìn)行了成功率對(duì)比,自動(dòng)推薦成功率略低于線下推薦成功率,在下一步研究中,將分析線下成功率高的因素,整理后結(jié)合到網(wǎng)絡(luò)自動(dòng)推薦算法中,增加算法的適用性。
表1 個(gè)性化推薦算法與人工推薦算法成功率對(duì)比
[1]趙凌云.面向服務(wù)的消費(fèi)者行為分析及推薦模型研究[D].濟(jì)南:山東師范大學(xué),2014.
[2]刑春曉,高鳳榮,戰(zhàn)思南,等.適應(yīng)用戶興趣變化的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)研究與發(fā)展,2007,44(2):296-301.
[3]張雨,張霞,叢楓,等.基于P2P網(wǎng)絡(luò)的協(xié)同過(guò)濾推薦算法的研究與實(shí)現(xiàn)[J].小型微型計(jì)算機(jī)系統(tǒng),2006,27(3):417-421.
[4]Bell R M,Koren Y.Improved neighborhood—based col?laborative filtering[C].KDD Cup’07,San Jose,Califor?nia,USA,August 12,2007:7-14.
[5]Adomavicius G,Tuzhilin A.Context-aware recom?mender systems[M].Recommender Systems Hand?book,US:Springer,2011:217-256.
[6]趙一瀚.基于用戶行為的電子商務(wù)推薦算法研究[D].長(zhǎng)春:吉林大學(xué),2016.
A Kind of Personalized Recommendations Algorithm of P2P Lending According to the Customer Invest Hobby and Product Characteristic
ZHOU Qiong1,QU Xiaowei2,CHEN Xi1,SUN Yu1,YAO Fubin1,ZHAI Ruifeng1
(1.School of Computer Science and Technology,Changchun University of Science and Technolugy,Changchun 130022;2.Engineering Research Cente of Changchun Why-e Science and Technolugy Co.,Ltd.,Changchun 130000)
The booming development of Internet finance, brought the benefit of inclusive finance to investors, at the same time,also because of finance mangaing product of diversification,brought investor to choose the harassment of suiting own net loan product.Owing to this,this recommend system combines personal investment hobby of the P2 P net loan platform investor and the characteristic of the platform product and designs a kind of recommendation calculate way to lend totally winning of the platform by carrying out investor and net.
customer invest hobby;product characteristic;P2P lending;personalized recommendation
TP391
A
1672-9870(2017)02-0132-03
2017-01-14
2017吉林省科技計(jì)劃重大科技成果轉(zhuǎn)化項(xiàng)目
周瓊(1993-),男,碩士研究生,E-mail:15755886S3@qq.com
長(zhǎng)春理工大學(xué)學(xué)報(bào)(自然科學(xué)版)2017年2期