張世睿
摘要摘要:運(yùn)營(yíng)數(shù)據(jù)通常是用戶對(duì)移動(dòng)應(yīng)用喜好最直接的體現(xiàn),運(yùn)營(yíng)數(shù)據(jù)中存在著很多有價(jià)值的信息。如果能夠更快地通過運(yùn)營(yíng)數(shù)據(jù)分析和了解用戶、迎合用戶喜好,就能贏得更多的用戶,在競(jìng)爭(zhēng)中占據(jù)有利地位。針對(duì)移動(dòng)應(yīng)用設(shè)計(jì)復(fù)雜、運(yùn)營(yíng)數(shù)據(jù)分析不直觀的特點(diǎn),提出一種基于BP人工神經(jīng)網(wǎng)絡(luò)的運(yùn)營(yíng)數(shù)據(jù)分析方法,建立了以移動(dòng)應(yīng)用關(guān)卡常見數(shù)據(jù)為輸入,運(yùn)營(yíng)數(shù)據(jù)為輸出的神經(jīng)網(wǎng)絡(luò)模型。實(shí)驗(yàn)表明,該方法能夠有效對(duì)移動(dòng)應(yīng)用關(guān)卡設(shè)計(jì)和配置所吸引的用戶數(shù)量和復(fù)玩率進(jìn)行預(yù)測(cè),從而指導(dǎo)移動(dòng)應(yīng)用的開發(fā)、設(shè)計(jì)及評(píng)價(jià)。
關(guān)鍵詞關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);運(yùn)營(yíng)數(shù)據(jù);游戲關(guān)卡
DOIDOI:10.11907/rjdk.161379
中圖分類號(hào):TP301文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào)文章編號(hào):16727800(2016)007002103
0引言
隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展和智能設(shè)備的普及,移動(dòng)應(yīng)用在人們?nèi)粘I钪凶兊迷絹碓街匾絹碓蕉嗟膹S商投入到移動(dòng)應(yīng)用的開發(fā)中來,各種相似功能的應(yīng)用層出不窮。因此,如何在移動(dòng)互聯(lián)網(wǎng)發(fā)展的浪潮下了解用戶需求,開發(fā)更加吸引用戶、使用戶滿意的產(chǎn)品,從而在激烈的行業(yè)競(jìng)爭(zhēng)中獲取最多的用戶數(shù)量,就成了目前移動(dòng)應(yīng)用開發(fā)商重點(diǎn)關(guān)注的問題。移動(dòng)應(yīng)用的運(yùn)營(yíng)數(shù)據(jù)是用戶評(píng)價(jià)最直觀的反饋,如何從大量且無規(guī)律的運(yùn)營(yíng)數(shù)據(jù)中了解用戶的想法就成了當(dāng)今移動(dòng)互聯(lián)網(wǎng)界研究的重點(diǎn)。本文提出一種基于人工神經(jīng)網(wǎng)絡(luò)的運(yùn)營(yíng)數(shù)據(jù)分析方法,通過對(duì)移動(dòng)運(yùn)營(yíng)數(shù)據(jù)加以分析,預(yù)測(cè)并指導(dǎo)移動(dòng)應(yīng)用設(shè)計(jì)的方向。實(shí)驗(yàn)結(jié)果表明,基于人工神經(jīng)網(wǎng)絡(luò)的移動(dòng)應(yīng)用數(shù)據(jù)分析具有很強(qiáng)的指導(dǎo)作用,結(jié)果符合實(shí)際,可大大提高產(chǎn)品吸引力。
1移動(dòng)運(yùn)營(yíng)數(shù)據(jù)分析的一般方法
移動(dòng)運(yùn)營(yíng)數(shù)據(jù)的分析方法一般分為兩大類,一類是很多中小公司采用的較為簡(jiǎn)單的分析方法,即根據(jù)應(yīng)用每日用戶的登錄頻次、滯留時(shí)間、特定功能的使用情況等繪制合適的曲線,分析哪一塊功能更容易受用戶的青睞,根據(jù)版本更新之后用戶的數(shù)量是否增加等制定下一階段的開發(fā)和設(shè)計(jì)任務(wù)。這種方法的好處是實(shí)現(xiàn)起來較為簡(jiǎn)單,不需要很多的知識(shí)儲(chǔ)備,數(shù)據(jù)收集和分析也比較容易。然而這種方法的缺點(diǎn)也是顯而易見的,即對(duì)數(shù)據(jù)的分析更多是基于人的主觀認(rèn)識(shí),而非理性客觀的評(píng)價(jià),容易導(dǎo)致產(chǎn)生帶有偏見的結(jié)果,不利于企業(yè)的發(fā)展。另一類運(yùn)營(yíng)數(shù)據(jù)的分析方法是基于數(shù)據(jù)挖掘知識(shí),目前研究較多的有針對(duì)用VOLOS H, NALLI S, PANNEERSELVAM S,et al.Aerie:flexible filesystem interfaces to storageclass memory .Proceedings of the Ninth European Conference on Computer Systems. ACM, 2014: 14.
P M CHEN, W T NG,S CHANDRA,et al.The rio file cache:surviving operating system crashes[J].In Proc. of the Architectural Support for Programming Languages and Operating Systems,1996.
ANI A WANG,GEOFFREY H KUENNING, PETER REIHER,et al.The conquest file system:better performance through a disk/persistentRAM hybrid design[J].ACM Transactions on Storage,2006(3):309348.
CHEN J, WEI Q, CHEN C,et al.FSMAC: A file system metadata accelerator with nonvolatile memory .Mass Storage Systems and Technologies (MSST), 2013 IEEE 29th Symposium on. IEEE, 2013: 111.
QIU S, REDDY A L.Nvmfs:a hybrid file system for improving random write in nandflash ssd.Mass Storage Systems and Technologies (MSST), 2013 IEEE 29th Symposium,2013: 15.
CHEN F, MESNIER M P, HAHN S. A protected block device for persistent memory.Mass Storage Systems and Technologies (MSST), 2014 30th Symposium on. IEEE, 2014: 112.
責(zé)任編輯(責(zé)任編輯:陳福時(shí))戶忠誠(chéng)度方面的分析[1]、用戶流失方面的預(yù)測(cè)分析[24],以及用戶興趣挖掘[5]和聚類分析[6]等。這些分析和預(yù)測(cè)方法為移動(dòng)運(yùn)營(yíng)提供了較為理性和可靠的數(shù)據(jù),對(duì)于應(yīng)用開發(fā)商的計(jì)劃訂制和用戶群體分析有很大幫助。
然而,這些方法都只是通過運(yùn)營(yíng)數(shù)據(jù)對(duì)用戶某一單方面的行為進(jìn)行分析和預(yù)測(cè),沒有考慮到應(yīng)用系統(tǒng)設(shè)計(jì)和運(yùn)營(yíng)過程中諸如設(shè)計(jì)、獎(jiǎng)勵(lì)、活動(dòng)等復(fù)雜因素。本文提出一種基于BP人工神經(jīng)網(wǎng)絡(luò)的移動(dòng)運(yùn)營(yíng)數(shù)據(jù)分析方法,具有利用人工神經(jīng)網(wǎng)絡(luò)可逼近任意復(fù)雜非線性關(guān)系、可學(xué)習(xí)和自適應(yīng)的特點(diǎn),建立起了相應(yīng)的數(shù)學(xué)模型。
2人工神經(jīng)網(wǎng)絡(luò)的基本原理
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network)是由大量簡(jiǎn)單的處理單元連接組成的一種網(wǎng)絡(luò)模型,主要用來模擬人類大腦運(yùn)行的一些基本邏輯和結(jié)構(gòu),反映了人腦功能的很多基本特性,但是人工神經(jīng)網(wǎng)絡(luò)并不是人腦真實(shí)反映,只是對(duì)人腦作出了某種程度的簡(jiǎn)化和模擬[7]。圖1展示了一個(gè)較為典型的人工神經(jīng)網(wǎng)絡(luò)細(xì)胞。
由于人工神經(jīng)網(wǎng)絡(luò)是由大量的神經(jīng)元根據(jù)某種結(jié)構(gòu)組合而成,因此通常按照其組合方式進(jìn)行分類。較為常見的網(wǎng)絡(luò)結(jié)構(gòu)可以分為前饋神經(jīng)網(wǎng)絡(luò)、反饋型神經(jīng)網(wǎng)絡(luò)和自組織網(wǎng)絡(luò)三類。前饋網(wǎng)絡(luò)也稱前向網(wǎng)絡(luò)。該網(wǎng)絡(luò)只在訓(xùn)練過程會(huì)有反饋信號(hào),層間沒有向后的反饋信號(hào),因此被稱為前饋網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)屬于前饋網(wǎng)絡(luò)的一種。反饋型神經(jīng)網(wǎng)絡(luò)是一種從輸出到輸入具有反饋連接的神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)比前饋網(wǎng)絡(luò)要復(fù)雜得多。
自組織神經(jīng)網(wǎng)絡(luò)是一種無導(dǎo)師學(xué)習(xí)網(wǎng)絡(luò)。它通過自動(dòng)尋找樣本中的內(nèi)在規(guī)律和本質(zhì)屬性,自組織、自適應(yīng)地改變網(wǎng)絡(luò)參數(shù)與結(jié)構(gòu)。網(wǎng)絡(luò)運(yùn)作過程分為學(xué)習(xí)和工作兩種狀態(tài)。網(wǎng)絡(luò)學(xué)習(xí)主要是指根據(jù)學(xué)習(xí)算法來調(diào)整神經(jīng)元間的聯(lián)接權(quán)值,使得網(wǎng)絡(luò)輸出更符合實(shí)際。學(xué)習(xí)算法分為有導(dǎo)師學(xué)習(xí)與無導(dǎo)師學(xué)習(xí)兩類。
有導(dǎo)師學(xué)習(xí)算法將一組訓(xùn)練集送入網(wǎng)絡(luò),根據(jù)網(wǎng)絡(luò)的實(shí)際輸出與期望輸出間的差別來調(diào)整連接權(quán)。有導(dǎo)師學(xué)習(xí)算法的主要步驟包括:①?gòu)臉颖炯现腥∫粋€(gè)樣本(Ai,Bi);②計(jì)算網(wǎng)絡(luò)的實(shí)際輸出O;③求D=Bi-O;④根據(jù)D調(diào)整權(quán)矩陣W;⑤對(duì)每個(gè)樣本重復(fù)上述過程,直到對(duì)整個(gè)樣本集來說,誤差不超過規(guī)定范圍。
BP算法是一種出色的有導(dǎo)師學(xué)習(xí)算法。由于本文針對(duì)移動(dòng)運(yùn)營(yíng)數(shù)據(jù)進(jìn)行分析,從而建立起應(yīng)用設(shè)計(jì)和運(yùn)營(yíng)數(shù)據(jù)相關(guān)的數(shù)學(xué)模型,因而選擇基于BP算法的有導(dǎo)師人工神經(jīng)網(wǎng)絡(luò),采用已知的運(yùn)營(yíng)數(shù)據(jù)作為訓(xùn)練集進(jìn)行網(wǎng)絡(luò)訓(xùn)練,建立數(shù)學(xué)模型,并通過該模型來驗(yàn)證實(shí)際項(xiàng)目中的數(shù)據(jù)情況,以此來驗(yàn)證該網(wǎng)絡(luò)模型的準(zhǔn)確程度和可靠性。
3樣本數(shù)據(jù)與模型構(gòu)造
3.1樣本數(shù)據(jù)
本文以國(guó)內(nèi)某手機(jī)游戲公司的一款跑酷游戲?yàn)槔?,由于其關(guān)卡模式為當(dāng)前主推模式且數(shù)據(jù)信息較多,因此選擇該模式下的前40關(guān)為研究對(duì)象,考察不同關(guān)卡布局、設(shè)計(jì)和獎(jiǎng)勵(lì)下玩家總體的游玩次數(shù)。
本文選取版本3.2的前40關(guān)數(shù)據(jù)作為訓(xùn)練集構(gòu)造神經(jīng)網(wǎng)絡(luò)模型。選取版本4.0的前40關(guān)的數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證該模型的準(zhǔn)確性。
3.2模型構(gòu)造
神經(jīng)網(wǎng)絡(luò)模型的建立主要需考慮兩方面的問題: 一是確定網(wǎng)絡(luò)結(jié)構(gòu) ; 二是調(diào)整學(xué)習(xí)參數(shù)。首先考慮神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)結(jié)構(gòu)主要包括網(wǎng)絡(luò)的鏈接方式、網(wǎng)絡(luò)層數(shù)和各網(wǎng)絡(luò)層節(jié)點(diǎn)的個(gè)數(shù),本文采用目前使用最為廣泛的神經(jīng)網(wǎng)絡(luò)。
模型輸入?yún)?shù)選取可以直觀獲得、不需要加工的數(shù)值,避免因?yàn)槿藶橹饔^因素的干擾導(dǎo)致模型無法客觀對(duì)應(yīng)用的設(shè)計(jì)進(jìn)行評(píng)價(jià)從而無法模擬出真實(shí)移動(dòng)運(yùn)營(yíng)數(shù)據(jù)。在關(guān)卡設(shè)計(jì)中,常見的對(duì)數(shù)據(jù)產(chǎn)生影響的直觀因素如下:
(1)關(guān)卡序號(hào)。越靠前的關(guān)卡越容易吸引更多的用戶參與,關(guān)卡序號(hào)的表示方法從1開始,依次遞增。
因此,根據(jù)上述信息,將關(guān)卡的序號(hào)、類型、獎(jiǎng)勵(lì)級(jí)別、挑戰(zhàn)次數(shù)作為網(wǎng)絡(luò)模型的數(shù)據(jù)參數(shù)。模型的輸出參數(shù)代表所關(guān)心的玩家對(duì)應(yīng)用喜好意愿的表達(dá),通常認(rèn)為以下參數(shù)能夠表達(dá)玩家對(duì)于關(guān)卡的喜好:關(guān)卡挑戰(zhàn)次數(shù)、關(guān)卡復(fù)玩率、下一關(guān)挑戰(zhàn)率。
通過資料可知[8],三層的BP網(wǎng)絡(luò)可以逼近任意的映射關(guān)系,且與通常使用的一個(gè)隱藏層的網(wǎng)絡(luò)相比,兩個(gè)隱藏層的網(wǎng)絡(luò)對(duì)提高最終的預(yù)測(cè)準(zhǔn)確率來說并沒有顯著幫助。隱藏層中節(jié)點(diǎn)數(shù)目選擇較復(fù)雜,并沒有統(tǒng)一的規(guī)則去指導(dǎo),因此本文根據(jù)設(shè)置隱藏層節(jié)點(diǎn)個(gè)數(shù)的不同對(duì)數(shù)據(jù)準(zhǔn)確性進(jìn)行了測(cè)試,最終確定隱藏層幾點(diǎn)的個(gè)數(shù)為20。
本文輸入數(shù)據(jù)均為正數(shù),因此通過線性歸一化方法將數(shù)據(jù)歸一化到[0,1]范圍上:f(x)=x-minmax-min(1)由于數(shù)據(jù)均歸一化到[0,1]區(qū)間,因此第一層激活函數(shù)選擇S型函數(shù),第二層激活函數(shù)選擇線性激活函數(shù),公式如下:f(x)=11+e-x(0 按照上文所述構(gòu)建網(wǎng)絡(luò)模型,訓(xùn)練函數(shù)選擇有動(dòng)量和自適應(yīng)lr的梯度下降法進(jìn)行訓(xùn)練,訓(xùn)練參數(shù)設(shè)置迭代次數(shù)為20 000次,訓(xùn)練目標(biāo)最小誤差位0.003,訓(xùn)練速度為0.01。 網(wǎng)絡(luò)訓(xùn)練完成后,將一組測(cè)試數(shù)據(jù)輸入程序中,用來測(cè)試該網(wǎng)絡(luò)的識(shí)別成功率,將上下浮動(dòng)5%的數(shù)據(jù)作為正確數(shù)據(jù)進(jìn)行處理,進(jìn)行了四次實(shí)驗(yàn),得到結(jié)果如表3所示。 識(shí)別準(zhǔn)確率都穩(wěn)定在80%以上,尤其是復(fù)玩率,穩(wěn)定在87.5%以上。將上述模型數(shù)據(jù)與常規(guī)運(yùn)營(yíng)數(shù)據(jù)分析方法的結(jié)果進(jìn)行對(duì)比,從圖2可以看到基于BP神經(jīng)網(wǎng)絡(luò)的方法更加準(zhǔn)確客觀,不摻雜分析人員的主觀因素。 4結(jié)語 本文提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的移動(dòng)運(yùn)營(yíng)數(shù)據(jù)分析方法,建立起移動(dòng)游戲關(guān)卡設(shè)計(jì)因素和運(yùn)營(yíng)數(shù)據(jù)之間的關(guān)系。經(jīng)過仿真實(shí)驗(yàn)證明了該方法有效,相對(duì)于傳統(tǒng)的人工分析方法準(zhǔn)確率較高且穩(wěn)定可靠,可以作為一種提高運(yùn)營(yíng)數(shù)據(jù)分析準(zhǔn)確率的方法應(yīng)用于實(shí)踐。 參考文獻(xiàn)參考文獻(xiàn): [1] 劉芳,郭宇春.基于數(shù)據(jù)挖掘的用戶忠誠(chéng)度分析[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013,23(7):1417. [2]劉光遠(yuǎn),苑森淼,董立巖.數(shù)據(jù)挖掘方法在用戶流失預(yù)測(cè)分析中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(9):154156. [3]葉進(jìn),林士敏.基于貝葉斯網(wǎng)絡(luò)的推理在移動(dòng)客戶流失分析中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2005,25(3):673675. [4]田玲,邱會(huì)中,鄭莉華.基于神經(jīng)網(wǎng)絡(luò)的電信客戶流失預(yù)測(cè)主題建模及實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用,2007,27(9):22942297. [5]郭巖,白碩,楊志峰,等.網(wǎng)絡(luò)日志規(guī)模分析和用戶興趣挖掘[J].計(jì)算機(jī)學(xué)報(bào),2005,28(9):14831496. [6]徐涌,陳恩紅,王煦法.基于神經(jīng)網(wǎng)絡(luò)的Web用戶行為聚類分析[J].小型微型計(jì)算機(jī)系統(tǒng),2001,22(6):699702. [7]施鴻寶 .神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[D].西安: 西安交通大學(xué)出版社 ,1993. [8]LIPPMANN R P.An introd