摘 要:文章利用了人工神經(jīng)網(wǎng)絡(luò)模型,通過被調(diào)查者的基本信息、手游時長、消費(fèi)態(tài)度等方面,預(yù)測被調(diào)查者是否存在長期消費(fèi)的現(xiàn)象,以期更容易辨認(rèn)出氪金玩家與平民玩家,使得開發(fā)者的宣傳以及策劃更具有目的性和有效性。
關(guān)鍵詞:長期消費(fèi)行為;手機(jī)游戲消費(fèi);人工網(wǎng)絡(luò)模型
中圖分類號:F49 文獻(xiàn)標(biāo)識碼:A 文章編號:1005-6432(2022)05-0123-02
DOI:10.13939/j.cnki.zgsc.2022.05.123
1 引言
如今的社會中,科技迅速發(fā)展,手機(jī)也變成人手一個的生活必需品,網(wǎng)上支付的便捷性和安全性也使手機(jī)從20年前的聯(lián)系工具,變成了人們移動的錢包。對于公司而言,能從龐大的玩家群體尋找出未來可能存在長期消費(fèi)行為的人群,會使其策劃、宣傳的過程中的對象更加集中,對于手游公司來說百利而無一害。宋子健等[1]通過構(gòu)建二元Logistic回歸模型消費(fèi)者的游戲意愿和消費(fèi)意愿進(jìn)行實證分析得到“年齡”“平均每天游戲時長”“接觸手機(jī)游戲時間”對消費(fèi)者的消費(fèi)意愿均起到正向作用這一結(jié)論。洪晶[2]考慮通過神經(jīng)網(wǎng)絡(luò)算法預(yù)測出每一位客戶最終所屬的消費(fèi)模式類別,能夠幫助客戶服務(wù)人員按照每一類客戶群體消費(fèi)行為的特點(diǎn)提供相應(yīng)的服務(wù)和采取針對性的營銷策略。本文采取人工神經(jīng)網(wǎng)絡(luò)模型,通過玩家的基本信息、游戲時長等方面對玩家是否存在長期消費(fèi)行為進(jìn)行預(yù)測,使得游戲開發(fā)商能夠針對不同的玩家采取不同的策劃宣傳方式。
2 理論概述
人工神經(jīng)網(wǎng)絡(luò),就是人們利用計算機(jī)模仿生物的神經(jīng)網(wǎng)絡(luò),解決信息分類處理的模型[2]。神經(jīng)元大致可以分為樹突、突觸、細(xì)胞體和軸突。神經(jīng)元在神經(jīng)系統(tǒng)中,起著接收信息、傳遞信息、處理信息的作用。而人工神經(jīng)網(wǎng)絡(luò),將輸入數(shù)據(jù)看成是接收信息,而激活函數(shù)則是神經(jīng)元處理信息的能力,輸出數(shù)據(jù)則是經(jīng)過神經(jīng)元多層處理傳出的信息。經(jīng)過一層層神經(jīng)元的處理之后,便可以由原始的輸入數(shù)據(jù)得到對應(yīng)的輸出數(shù)據(jù)。由于迭代的次數(shù),神經(jīng)元的層數(shù)比較多,相比于大多回歸模型,預(yù)測精度可能會更高,擬合效果會更好。
本文經(jīng)過多層神經(jīng)元處理所得到的神經(jīng)網(wǎng)絡(luò)模型:
其中的g(i),i=1,2,3,…,n指的是每一層的激活函數(shù),在每一層中神經(jīng)元處理數(shù)據(jù)所遵循的函數(shù)。而b(i),i=1,2,3,…,n代表了每一層的閾值,在生物神經(jīng)元中,只有足量的信息輸入神經(jīng)元后,達(dá)到一定的閾值之后,神經(jīng)元才會向下一層神經(jīng)元傳遞信息,這里用bi表示第i層的閾值。W(i),i=1,2,3,…,n指的是每一層神經(jīng)元中的權(quán)重,用來說明每一層對應(yīng)分量的影響程度。上述模型,就是模擬了輸入數(shù)據(jù)經(jīng)過一層層神經(jīng)元激活函數(shù)的作用后,輸出對應(yīng)y的過程。
3 變量選取
本文中所研究的問題存在12個自變量,所以設(shè)X=(x1,x2,…,x12)為輸入數(shù)據(jù),而調(diào)查中所得到的數(shù)據(jù)中存在缺失的問題,倘若學(xué)生并沒有進(jìn)行過手機(jī)游戲的消費(fèi)行為,那么手機(jī)的消費(fèi)體驗以及更傾向的消費(fèi)模式的數(shù)據(jù)就會缺失,設(shè)計問卷時,有意將y=0看作是玩家無消費(fèi)行為。因此,筆者將缺失的部分?jǐn)?shù)據(jù)用0進(jìn)行對應(yīng)的補(bǔ)齊。輸入數(shù)據(jù)X包括性別、收入、游戲時間、手機(jī)內(nèi)游戲數(shù)量、最近所玩游戲的游戲時長,以及對于游戲品質(zhì)、社交系統(tǒng)等屬性偏好,共12方面,通過被調(diào)查者的選擇,預(yù)測被調(diào)查者是否大概率存在消費(fèi)狀況。
y為問題中的輸出數(shù)據(jù),由于筆者感興趣的是消費(fèi)玩家的是否存在長期穩(wěn)定的消費(fèi)行為,所以如果玩家存在氪金的情況,筆者設(shè)y=1,若玩家不氪金,設(shè)y=0,相當(dāng)于筆者將其看成了一個二分類的問題。由于數(shù)據(jù)本身并非如上的表示方法,所以筆者對數(shù)據(jù)y進(jìn)行了一定的處理,方便后續(xù)模型的建立。
4 模型的建立
由于解釋變量X存在12個分量,所以在設(shè)計第一層神經(jīng)元時,遵從規(guī)律,設(shè)計約為變量個數(shù)的百分之七十五,第一層的神經(jīng)元個數(shù)設(shè)置約為8個。在構(gòu)建模型之時,所選用的激活函數(shù)是“relu”函數(shù):
相比于其他函數(shù),經(jīng)過測試發(fā)現(xiàn),“relu”函數(shù)的迭代次數(shù)更少,并且更快地達(dá)到了所需要的精度。由于問題最后的輸出數(shù)據(jù)為二分類型,為了能更好地映射到0,1上面,輸出層的激活函數(shù)使用“sigmoid”,公式如下所示:
通過以上兩種形式激活函數(shù),便可以將輸入數(shù)據(jù)進(jìn)行有效的分類,使得最后的輸出數(shù)據(jù)對應(yīng)想得到的0,1。
為了驗證模型的準(zhǔn)確性,將數(shù)據(jù)集分為三個部分,從理論上說,訓(xùn)練集、測試集、驗證集的比例為8∶1∶1,根據(jù)所得到的數(shù)據(jù)數(shù)量共792組,將其分為訓(xùn)練集634組,測試集79組,驗證集79組。首先,利用634組訓(xùn)練集的數(shù)據(jù),對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練構(gòu)建好模型,利用測試集的數(shù)據(jù),對模型的擬合度等進(jìn)行測試。
在本文中,筆者利用loss函數(shù),以及模型的精度,對模型進(jìn)行檢驗。所采取的loss函數(shù)是可以度量預(yù)測值與實際值之間的差異的二分類交叉熵公式:
筆者先分別在訓(xùn)練集、測試集中計算其loss函數(shù)。訓(xùn)練集中損失函數(shù)的值越大,說明訓(xùn)練集中預(yù)測的差異與真實情況越大,驗證集中的損失函數(shù)同理。
如圖1的上方圖所示,點(diǎn)集代表訓(xùn)練集的loss函數(shù)值,線條代表驗證集的loss函數(shù)值。隨著迭代次數(shù)的增加,兩者都在逐步減小,可見迭代的次數(shù)增加,模型的預(yù)測效果會更好。當(dāng)訓(xùn)練集和測試集的loss函數(shù)值在迭代了20次時,兩者接近重合,可見其擬合的效果。最為重要的是,隨著迭代的次數(shù)增加到80次后時,訓(xùn)練集和驗證集的loss函數(shù)值已經(jīng)無限的趨近于0,可見在兩者中,模型的預(yù)測值與真實值的差異逐步減少,甚至是消失。如圖1的下方圖所示,就算是迭代的次數(shù)不超過20,訓(xùn)練集所訓(xùn)練的模型的精度也高達(dá)0.6,而隨著迭代的次數(shù)逐步增加,在迭代次數(shù)達(dá)到40時,不管是訓(xùn)練集,還是驗證集,產(chǎn)生的模型精度都高達(dá)0.9以上。筆者為了測試模型的精度,繪制訓(xùn)練集與測試集的精度圖。為了確保模型的準(zhǔn)確性,利用測試集對模型進(jìn)行了同樣的測試,結(jié)果如圖2所示。
如圖2所示,當(dāng)?shù)螖?shù)足夠時,測試集的loss函數(shù)足夠小,精度也同樣足夠高,所以可以說本文所提到的模型通過了檢驗。也可以根據(jù)測試集的數(shù)量,將數(shù)據(jù)分為10組,每組79份,每組都進(jìn)行精度的計算,得出精度分別為0.9744、0.9465、0.9487、0.8077、0.8846、0.8846、0.9872、0.9615、0.6538、0.6538,算出其平均值約為0.8703,在多次訓(xùn)練的模型精度的平均水平達(dá)到了0.8703,可見相比于logistic回歸模型,神經(jīng)網(wǎng)絡(luò)的模型預(yù)測的能力之強(qiáng),結(jié)果之準(zhǔn)確。除已有的數(shù)據(jù)外,又收取了10份問卷,將其數(shù)據(jù)處理之后,代入到已經(jīng)訓(xùn)練好的模型中,發(fā)現(xiàn)在迭代多次后,最多只會出現(xiàn)一次錯誤,大多數(shù)情況甚至沒有出現(xiàn)預(yù)測錯誤的情況。
5 結(jié)論
倘若對數(shù)據(jù)使用Logistic回歸模型,預(yù)測的正確率只有60%左右,神經(jīng)網(wǎng)絡(luò)的精度高達(dá)90%,其預(yù)測的效果有著極大差距。神經(jīng)網(wǎng)絡(luò)模型所訓(xùn)練出的模型,其精度較高,預(yù)測出錯的概率在迭代次數(shù)較高時,非常低,利用神經(jīng)網(wǎng)絡(luò)構(gòu)建的模型,可以通過玩家的一些基本信息,平時游戲的時長,還有其對于游戲內(nèi)一些消費(fèi)內(nèi)容的偏好性,很好地預(yù)測玩家是否存在消費(fèi)行為。玩家如果經(jīng)過神經(jīng)網(wǎng)絡(luò)的檢測之后,輸出的數(shù)據(jù)為1時,可以認(rèn)定玩家存在著長期的、穩(wěn)定的手機(jī)游戲消費(fèi)行為,是未來游戲盈利的主要對象,可以針對其游戲偏好設(shè)置一些更新內(nèi)容,道具,促使消費(fèi);當(dāng)輸出結(jié)果為0時,玩家被認(rèn)定為平民玩家,消費(fèi)的潛在可能性較低,在策劃運(yùn)營過程可以不用太過于迎合其心理需求。綜上而言,本文所得出的神經(jīng)網(wǎng)絡(luò)模型,可以有效且高精度地判斷學(xué)生是否為一個有著長期穩(wěn)定消費(fèi)行為的群體,可以方便游戲開發(fā)商針對這些長期穩(wěn)定的消費(fèi)群體做出合理的游戲運(yùn)營策略。
參考文獻(xiàn):
[1]宋子健,陳家樂,趙家悅.手機(jī)游戲廣告對消費(fèi)者游戲意愿和消費(fèi)意愿的影響因素:基于Logistics回歸和SEM模型[J].現(xiàn)代經(jīng)濟(jì)信息,2019(13):129-131.
[2]洪晶. 聚類和神經(jīng)網(wǎng)絡(luò)算法研究及其在電信業(yè)客戶消費(fèi)模式中的應(yīng)用[D].景德鎮(zhèn):景德鎮(zhèn)陶瓷學(xué)院,2007.
[作者簡介]朱文瑞,男,漢族,江西南昌人,研究生學(xué)歷,研究方向:數(shù)理統(tǒng)計。