王瀟瀟 郭旭林 陳建 陳夢昕
【提??要】智慧養(yǎng)老體系參與意愿影響因素本身是一個(gè)具有豐富內(nèi)涵并受復(fù)雜因素影響的管理問題,傳統(tǒng)研究因方法所限難以全面揭示其內(nèi)在影響機(jī)制。本文在理論和實(shí)證研究基礎(chǔ)上,以北京為例通過社會調(diào)研選擇最優(yōu)機(jī)器學(xué)習(xí)模型算法來訓(xùn)練和檢驗(yàn)大數(shù)據(jù),開展多層次數(shù)據(jù)挖掘進(jìn)行探索性研究,揭示影響智慧養(yǎng)老體系參與意愿的主要因素。
【關(guān)鍵詞】??智慧養(yǎng)老;參與意愿;數(shù)據(jù)挖掘
一、研究背景
隨著中國老齡化問題日益加重,如何養(yǎng)老已經(jīng)成為需要認(rèn)真研究的重大社會問題。根據(jù)國家統(tǒng)計(jì)局?jǐn)?shù)據(jù)顯示,截至2019年末,我國60歲以上老齡人口已經(jīng)達(dá)到約25388萬人,占總?cè)丝诒壤秊?8.1%,其中65歲及以上老年人口達(dá)17603萬人,占總?cè)丝诘?2.6%。國際上通常將60歲以上的人口比重達(dá)到10%,或65歲以上的人口比重達(dá)到7%的國家或地區(qū)劃分為老齡化社會。因此,當(dāng)前我國人口老年化問題已經(jīng)相當(dāng)嚴(yán)重。北京是中國老齡化態(tài)勢最具代表性的城市之一,據(jù)北京市統(tǒng)計(jì)局?jǐn)?shù)據(jù)顯示,2019年北京市60歲及以上常住人口371.3萬人,占17.2%,遠(yuǎn)遠(yuǎn)超過10%的標(biāo)準(zhǔn)。據(jù)北京民政局預(yù)計(jì),2030年北京市老齡化將達(dá)到重度,戶籍老年人口占比超過30%,2050年北京市戶籍老年人將超過630萬,并且這種人口結(jié)構(gòu)和社會形態(tài)將持續(xù)50年。我國傳統(tǒng)的養(yǎng)老模式難以滿足日益增長的老年人口的需求。因此,將大數(shù)據(jù)、互聯(lián)網(wǎng)科技等金融科技應(yīng)用于養(yǎng)老服務(wù),加速傳統(tǒng)養(yǎng)老模式向智慧化方向轉(zhuǎn)變,應(yīng)該成為緩解養(yǎng)老壓力的一種有效途徑。
(一)智慧養(yǎng)老的定義
英國生命信托基金首次提出“智慧養(yǎng)老”,所謂“智慧”即利用物聯(lián)網(wǎng)、云計(jì)算和人工智能等現(xiàn)代科技,打破原有的時(shí)間和空間束縛,將老人、社區(qū)、醫(yī)護(hù)人員、醫(yī)療機(jī)構(gòu)、政府、服務(wù)機(jī)構(gòu)形成一個(gè)有機(jī)整體,以此提高養(yǎng)老服務(wù)質(zhì)量。國內(nèi)關(guān)于智慧養(yǎng)老的相關(guān)研究最早可追溯到2007年胡黎明在《新型數(shù)字化居家式養(yǎng)老社區(qū)解決方案》一文中所提到的“數(shù)字化養(yǎng)老”,隨后陸續(xù)發(fā)展成?“信息化養(yǎng)老”(2010)、?“科技養(yǎng)老”(2011)?、“網(wǎng)絡(luò)化養(yǎng)老”(2012)?等概念。2013年以后,學(xué)術(shù)界開始統(tǒng)一使用“智慧養(yǎng)老”來代替上述概念。
學(xué)者們大多從服務(wù)內(nèi)容、科學(xué)技術(shù)以及其優(yōu)勢特點(diǎn)來闡釋智慧養(yǎng)老的概念。左美云(2014)認(rèn)為智慧養(yǎng)老是以互聯(lián)網(wǎng)等現(xiàn)代科技為媒介,一方面為老年人提供安全、醫(yī)療保健、娛樂休閑、學(xué)習(xí)交流等服務(wù),另一方面對涉老信息進(jìn)行監(jiān)測、上傳、分析、處理,從而滿足老年人各項(xiàng)需求,提高其生活質(zhì)量;向運(yùn)華和姚虹(2016)認(rèn)為智慧養(yǎng)老是利用物聯(lián)網(wǎng)技術(shù)采集匯聚老年人的健康狀況和需求等信息,從而實(shí)現(xiàn)緊急救助、生活照料、健康預(yù)警、遠(yuǎn)程診療等各種養(yǎng)老需求的智能供需交互。張雷和韓永樂(2017)認(rèn)為智慧養(yǎng)老利用科技促進(jìn)老人更多參與互動,不僅豐富了老人物質(zhì)生活,也滿足了老年人的精神生活需求,提升了老人的幸福感。雖然學(xué)者們的側(cè)重點(diǎn)和表達(dá)多有不同,但立足點(diǎn)還是在“智慧”這個(gè)核心上,“智”是綜合利用互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、大數(shù)據(jù)等先進(jìn)技術(shù)和智能化產(chǎn)品,“慧”是為老年人提供更加安全便捷、健康舒適的貼心服務(wù)。
通過對文獻(xiàn)研究的比較以及網(wǎng)絡(luò)公開資料的闡釋,筆者認(rèn)為以下對智慧養(yǎng)老概念的界定符合本文研究范圍和內(nèi)容的要求:智慧養(yǎng)老是一種以數(shù)據(jù)為基礎(chǔ)的養(yǎng)老模式,核心是數(shù)據(jù)采集,政府和社會服務(wù)機(jī)構(gòu)對數(shù)據(jù)進(jìn)行整理分析,歸納老年人需求以及生活中所遇到的問題,對養(yǎng)老服務(wù)進(jìn)行升級和完善。最終使政府監(jiān)管更加及時(shí)透明,數(shù)據(jù)化決策更加精準(zhǔn),居家、社區(qū)、機(jī)構(gòu)服務(wù)終端管理更加智能,推動社會養(yǎng)老資源的高效配置。
(二)智慧養(yǎng)老的發(fā)展
伴隨著大數(shù)據(jù)、互聯(lián)網(wǎng)科技和金融科技的發(fā)展與廣泛應(yīng)用,養(yǎng)老模式逐漸向智慧養(yǎng)老模式發(fā)展。2015年國務(wù)院印發(fā)《關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》,明確提出了“促進(jìn)智慧健康養(yǎng)老產(chǎn)業(yè)發(fā)展”的目標(biāo)任務(wù);2017年發(fā)布的《智慧健康養(yǎng)老產(chǎn)業(yè)發(fā)展行動計(jì)劃(2017-2020年)》,明確提出要加快智慧健康養(yǎng)老產(chǎn)業(yè)發(fā)展,到2020年基本形成覆蓋全生命周期的智慧健康養(yǎng)老產(chǎn)業(yè)體系。這些政策的出臺,說明智慧養(yǎng)老已經(jīng)上升到國家戰(zhàn)略層面。同期,北京市按照《工業(yè)和信息化部辦公廳、民政部辦公廳、國家衛(wèi)生計(jì)生委辦公廳關(guān)于開展智慧健康養(yǎng)老應(yīng)用試點(diǎn)示范的通知》要求,大力促進(jìn)北京地區(qū)智慧健康養(yǎng)老的發(fā)展。
目前,北京市“智慧養(yǎng)老”發(fā)展成果已經(jīng)初顯,截至2019年年底,北京市16個(gè)區(qū)中有7個(gè)區(qū)已經(jīng)建成包括網(wǎng)頁和手機(jī)端App的智慧養(yǎng)老服務(wù)信息平臺,有5個(gè)區(qū)正在建設(shè)智慧養(yǎng)老服務(wù)平臺。這些“智慧養(yǎng)老”項(xiàng)目均借助大數(shù)據(jù)與互聯(lián)網(wǎng)等技術(shù)來滿足老人和家庭的現(xiàn)代化、科學(xué)化和人性化的養(yǎng)老需求,也推動了北京市智慧養(yǎng)老產(chǎn)業(yè)的發(fā)展。
二、基于數(shù)據(jù)挖掘的智慧養(yǎng)老參與意愿影響因素研究
學(xué)者們在有關(guān)意愿研究中所選取的研究方法多為描述性統(tǒng)計(jì)分析和logistic回歸方法。但是logistic回歸要求只有顯著力量才可納入,而智慧養(yǎng)老參與意愿影響因素較多,許多不顯著因素的綜合作用可能會對參與意愿產(chǎn)生較大影響,因此logistic回歸方法不一定能夠準(zhǔn)確預(yù)測和判別參與智慧養(yǎng)老意愿。而數(shù)據(jù)挖掘方法能夠較好處理高緯度、線性不可分?jǐn)?shù)據(jù),對多變量問題進(jìn)行建模,廣泛應(yīng)用于分類數(shù)據(jù)的判別與預(yù)測,常用的分類模型有決策樹、支持向量機(jī)和隨機(jī)森林等。其中,決策樹具有分類速度快、可讀性高等優(yōu)點(diǎn)(Breiman L I et al,2008)。支持向量機(jī)模型在研究分類問題時(shí)運(yùn)用較多,通過將向量映射到一個(gè)更高維的空間里,對非線性、多維度的小樣本數(shù)據(jù)表現(xiàn)較好(Cortes C and Vapnik V, 1995)。隨機(jī)森林模型是一種多數(shù)表決的分類算法,分類擬合效果較好,也在研究分類問題時(shí)得到廣泛應(yīng)用(Breiman L,2001)??傮w來說,雖然支持向量機(jī)、決策樹、隨機(jī)森林的方法已經(jīng)有廣泛的應(yīng)用,但目前在智慧養(yǎng)老需求意愿問題方面的研究性應(yīng)用還不多。因此本文嘗試用決策樹、支持向量機(jī)和隨機(jī)森林等數(shù)據(jù)挖掘方法對智慧養(yǎng)老需求意愿進(jìn)行建模和預(yù)測。
(一)模型研究的主要內(nèi)容
1. 智慧養(yǎng)老需求意愿的影響因素。高林等(2019)提出,“智慧養(yǎng)老”需求意愿包括老年人文化程度、健康狀況自評、自理能力、精神需求、物質(zhì)生活水準(zhǔn)、經(jīng)濟(jì)情況、子女壓力、社區(qū)宣傳和政策體制等。本文將結(jié)合高林等學(xué)者提出的幾個(gè)影響因素并納入老人對智能終端的熟悉程度、子女經(jīng)濟(jì)狀況、老人子女?dāng)?shù)等變量,通過描述統(tǒng)計(jì)、方差分析、卡方檢驗(yàn)等方法探究影響需求意愿的主要原因。
2.智慧養(yǎng)老需求意愿及變化數(shù)據(jù)挖掘模型。對適齡老人“智慧養(yǎng)老”需求意愿及變化建立?Logistic 回歸、決策樹數(shù)據(jù)挖掘模型,對適齡老人“智慧養(yǎng)老”需求意愿做出判別和預(yù)測,基于正確率、查準(zhǔn)率、查全率、AUC、Press'Q 這?5 個(gè)指標(biāo)評價(jià)模型的性能。
(二)數(shù)據(jù)搜集
1.樣本選取
本文以北京市為例進(jìn)行智慧養(yǎng)老相關(guān)調(diào)查研究,以北京市16個(gè)行政區(qū)為調(diào)研對象,收集到了包括東城區(qū)、西城區(qū)、朝陽區(qū)、豐臺區(qū)、石景山區(qū)、海淀區(qū)、門頭溝區(qū)、房山區(qū)、通州區(qū)、順義區(qū)、昌平區(qū)、大興區(qū)、平谷區(qū)、密云區(qū)在內(nèi)的14個(gè)區(qū)的203個(gè)有效數(shù)據(jù)。樣本分布情況如表2所示。
2. 問卷調(diào)查
問卷調(diào)查對象為北京市各行政區(qū)內(nèi)?50歲以上老人,調(diào)查時(shí)間為?2019 年?12月20日-2020年1月15日,調(diào)查方式為社區(qū)實(shí)地問卷,調(diào)查內(nèi)容包括居住地所在行政區(qū)、年齡、文化程度、身體健康狀況、收入情況、子女?dāng)?shù)、子女收入情況、生活自理能力、對智能終端熟悉程度、社區(qū)對智慧養(yǎng)老宣傳力度、社區(qū)是否建立了智慧養(yǎng)老平臺、老人是否接觸過類似智慧平臺13個(gè)方面。
3.調(diào)查結(jié)果概述及統(tǒng)計(jì)性分析
本次調(diào)查一共收集有效問卷203份,問卷調(diào)查的基本情況見表3。
(三)數(shù)據(jù)挖掘模型對比分析
1.Logistic回歸。上文描述性統(tǒng)計(jì)分析了“智慧養(yǎng)老”需求意愿的影響因素,但僅檢驗(yàn)了各自變量與因變量單獨(dú)的關(guān)系,并沒有把各個(gè)因素結(jié)合起來。此部分將用Logistic回歸研究各自變量與因變量之間的關(guān)系。通過Logistic回歸,顯著的自變量會被引入模型。但是考慮到影響智慧養(yǎng)老需求意愿的因素很多,許多因素并不顯著,但其綜合影響可能較大,因此需要進(jìn)一步改進(jìn)。
(1)數(shù)據(jù)準(zhǔn)備及變量賦值
由于影響“智慧養(yǎng)老”需求意愿的因素較多,本文結(jié)合以往學(xué)者的研究成果,建模時(shí)以智慧養(yǎng)老需求意愿為因變量,其中將“打算參加智慧養(yǎng)老”賦值為1,“不打算參加智慧養(yǎng)老”的賦值為0;以老年人文化程度、年齡、經(jīng)濟(jì)情況、子女?dāng)?shù)、子女經(jīng)濟(jì)狀況(子女月平均工資)、自覺健康狀況、自理能力、對手機(jī)等智能終端的熟悉度、社區(qū)宣傳力度、是否了解或接觸過智慧養(yǎng)老平臺或相關(guān)類似平臺、政府智慧養(yǎng)老平臺是否建立完善11個(gè)變量為自變量,具體變量賦值見表4。
(2)模型回歸
Logistic模型使用逐步回歸分析方法篩選變量,最后進(jìn)入模型的變量包括:老年人的文化水平(受教育程度edu)、老人的月收入情況(pay)、老人生活自理能力(self)和老人對智能終端的熟悉程度四個(gè)變量(見表5)。
(3)智慧養(yǎng)老需求意愿建模預(yù)測
采用?5 折交叉驗(yàn)證法,并重復(fù)?10 次,建立?Logistic 回歸模型并進(jìn)行預(yù)測。步驟如下:第一,把總樣本平均分為?5 份,每次取其中?4 份作為訓(xùn)練集,剩余?1 份作為測試集,進(jìn)行建模預(yù)測;第二,更換訓(xùn)練集和測試集,再次進(jìn)行建模,共建立?5 次模型;第三,重復(fù)?1、2 步驟?10 次;第四,最后基于50 次測試結(jié)果,比較各分類算法的性能。建立?Logistic 回歸模型時(shí),調(diào)用?R 語言軟件的“nnet”包。表6 為?Logistic 回歸模型?50次建模預(yù)測的平均結(jié)果,其中實(shí)際參與智慧養(yǎng)老意愿的平均值為31,無參與意愿的平均值為16.4 。適齡老人實(shí)際有參與意愿,且被預(yù)測為有參與意愿的平均值為26.3 ,被預(yù)測為無參與意愿的平均值為?4.7;實(shí)際無參與意愿,但被預(yù)測為有參與意愿的平均值為2.8,被預(yù)測為無參與意愿的平均值為?13.6。
2.數(shù)據(jù)挖掘模型。Logistic 回歸模型對智慧養(yǎng)老需求意愿進(jìn)行了建模,11 個(gè)變量中只有4個(gè)進(jìn)入到模型中,但現(xiàn)實(shí)中影響智慧養(yǎng)老需求意愿的因素很多,許多單個(gè)因素雖然不顯著,但這些因素的綜合作用可能會對結(jié)果產(chǎn)生較大影響。而數(shù)據(jù)挖掘的方法在建模時(shí)不要求影響因素是顯著的,同時(shí)能較好處理高緯度、線性不可分?jǐn)?shù)據(jù),其廣泛應(yīng)用于分類數(shù)據(jù)的判別與預(yù)測。因此本文接下來將通過決策樹模型方法,對智慧養(yǎng)老參與意愿進(jìn)行建模預(yù)測。
True positives(TP)表示實(shí)際結(jié)果為正例,預(yù)測結(jié)果也為正例的樣本數(shù);False positives(FP)表示實(shí)際結(jié)果為負(fù)例,但被預(yù)測為正例的樣本數(shù);False negatives(FN)表示實(shí)際結(jié)果為正例,但被預(yù)測為負(fù)例的樣本數(shù);True negatives(TN)表示實(shí)際結(jié)果為負(fù)例,預(yù)測結(jié)果也為負(fù)例的樣本數(shù)。混淆矩陣如表7所示。
模型預(yù)測結(jié)果根據(jù)以下幾個(gè)指標(biāo)評價(jià)性能:
正確率(Accuracy):Accuracy =(TP+TN)/( TP+FN+FP+TN),是正確分類的樣本數(shù)與總樣本數(shù)的比值,若正確率越高,則對樣本分類的效果越好。
查準(zhǔn)率(Precision):Precision=TP/(TP+FP),表示在被預(yù)測為正例的樣本中,其中實(shí)際為正例的占比。
查全率(Recall):Recall=TP/(TP+FN),表示在實(shí)際為正例的樣本中,其中被預(yù)測為正例的占比。
AUC:表示?ROC 曲線下面積的大小,AUC 的值在區(qū)間(0.5,1.0)內(nèi),在該區(qū)間內(nèi)AUC的值越大,則說明模型的準(zhǔn)確性越高。
Press'Q:
其中?N 是樣本總數(shù),n 是被正確分類的樣本數(shù),k 是分類組數(shù)。該工具是為了檢測模型的分類結(jié)果與隨機(jī)的分類結(jié)果之間是否具有顯著性差異,其服從自由度為?1 的卡方分布,當(dāng)?Press'Q 的值大于?3.84 時(shí),說明兩者具有顯著性差異。
同時(shí),在建立模型中容易造成過擬合現(xiàn)象,為了避免這種現(xiàn)象,因此我們采用?5 折交叉驗(yàn)證法,并重復(fù)?10 次,建立模型并進(jìn)行預(yù)測。
(1)決策樹模型
決策樹模型是一種分類模型,模型呈樹狀結(jié)構(gòu),廣泛應(yīng)用于自然科學(xué)領(lǐng)域,具有可讀性好,擬合速度快等優(yōu)點(diǎn)。在分類時(shí),依據(jù)基尼系數(shù)進(jìn)行特征選取;建模時(shí),通過訓(xùn)練集數(shù)據(jù),基于損失函數(shù)最小化的原則進(jìn)行建模;預(yù)測時(shí),根據(jù)已建立的決策樹模型對預(yù)測集數(shù)據(jù)進(jìn)行分類(Breiman L I et al ,2008)。決策樹算法一般由兩步組成:(a)決策樹生成,根據(jù)訓(xùn)練集數(shù)據(jù)生成一個(gè)盡可能大的決策樹;(b)決策樹剪枝,用測試集數(shù)據(jù),依據(jù)損失函數(shù)最小化原則,對決策樹進(jìn)行剪枝。同時(shí),為了確保模型的準(zhǔn)確度,本文調(diào)用?R 語言軟件中的“rpart”包,通過設(shè)置復(fù)雜性參數(shù)?CP 值,經(jīng)過多次實(shí)驗(yàn)發(fā)現(xiàn)?CP 值為?0.014 時(shí),模型的準(zhǔn)確率最高,最終,建立模型并進(jìn)行預(yù)測。
表?8 為決策樹模型?50 次建模預(yù)測的平均結(jié)果,其中實(shí)際具有智慧養(yǎng)老需求意愿的平均值為31,無需求意愿的平均值為?16.4。適齡老人實(shí)際有需求意愿,且被預(yù)測為有需求意愿的平均值為28.9,被預(yù)測為無需求意愿的平均值為2.1;實(shí)際無需求意愿,但被預(yù)測為有需求意愿的平均值為?0.2,被預(yù)測為無需求意愿的平均值為?16.2。
整體來說,數(shù)據(jù)挖掘模型的決策樹模型在正確率、查準(zhǔn)率、查全率、AUC、PressQ方面的結(jié)果都好于Logistic回歸模型。其中決策樹模型的正確率95.1%大于Logistic模型的84.2%,查準(zhǔn)率99.3%大于Logistic回歸模型的90.3%,查全率93.2%大于Logistic回歸模型的84.8%。AUC決策樹模型較接近1,且決策樹模型的PressQ值4.01大于Logistic模型的3.92,表明決策樹分類方法好于Logistic模型的結(jié)果。
三、主要結(jié)論與建議
由Logistic回歸模型和數(shù)據(jù)挖掘模型可知,北京地區(qū)適齡老人對智慧養(yǎng)老需求意愿的主要影響因素是老年人的文化程度、老年人的月收入水平、老年人的生活自理能力、老年人對智慧終端的熟悉程度。而老年人年齡、子女?dāng)?shù)、子女經(jīng)濟(jì)狀況(子女月平均工資)、社區(qū)宣傳力度、是否了解或接觸過智慧養(yǎng)老平臺或相關(guān)類似平臺、政府智慧養(yǎng)老平臺是否建立完善等因素對老人的智慧養(yǎng)老需求的影響并不大。
近年來多項(xiàng)相關(guān)養(yǎng)老政策的出臺的確提高了一部分人加入智慧養(yǎng)老體系的意愿,但我國自古以來養(yǎng)兒防老理念早已深入人心,導(dǎo)致總體而言人們的智慧養(yǎng)老參與意愿仍不高。未來幾年是智慧養(yǎng)老推行和實(shí)施的關(guān)鍵期和成熟期,如何更好地解決上述問題,完善智慧養(yǎng)老體系,提高養(yǎng)老服務(wù)水平,增強(qiáng)對老年人的安全保障等,是當(dāng)今學(xué)者和實(shí)務(wù)界人士需重點(diǎn)考慮的問題。譬如,利用社區(qū)力量組織舉辦各種豐富的教育文化活動,同時(shí)鼓勵(lì)民間組織開展老年人再教育活動,為愿意學(xué)習(xí)各種書法、繪畫、舞蹈以及棋類等的老年人提供平臺;加大對老年人信息服務(wù)建設(shè)的投入力度,比如購置智能檢測儀,時(shí)刻關(guān)注老年人的身體健康以及出行安全等情況,從而能為應(yīng)對老年人出現(xiàn)的突發(fā)情況提供應(yīng)急措施。
參考文獻(xiàn)
[1]高林:《社區(qū)老年人“智慧養(yǎng)老”需求意愿影響因素分析》,《衛(wèi)生職業(yè)教育》,2019年第12期。
[2]胡黎明:《新型數(shù)字化居家式養(yǎng)老社區(qū)解決方案》,《智能建筑》,2007年第11期。
[3]向運(yùn)華、姚虹:《養(yǎng)老服務(wù)體系創(chuàng)新:智慧養(yǎng)老的地方實(shí)踐與對策》,《西安財(cái)經(jīng)學(xué)院學(xué)報(bào)》,2016年第6期。
[4]張雷、韓永樂:《當(dāng)前我國智慧養(yǎng)老的主要模式、存在問題與對策》,《社會保障研究》,2017年第2期。
[5]左美云:《智慧養(yǎng)老的內(nèi)涵、模式與機(jī)遇》,《中國公共安全》,2014年第10期。
[6]Breiman L I et al, “Classification and Regression Trees (CART)”, Encyclopedia of Ecology, 2008, Vol.3:582-588.
[7]Cortes C,Vapnik V, “Support-Vector Networks”, Kluwer Academic Publishers,1995,Vol.20:273-279.
[8]Breiman L, “Random Forests”, Machine Learning, 2001, Vol.1:5-32.
(*王瀟瀟、郭旭林、陳建,中國政法大學(xué)商學(xué)院(研究生院);陳夢昕,中國礦業(yè)大學(xué)管理學(xué)院(北京)。本文是2019年度教育部哲學(xué)社會科學(xué)研究后期資助重大課題《全生命周期養(yǎng)老準(zhǔn)備的金融理論與實(shí)踐創(chuàng)新研究》的階段性成果(項(xiàng)目編號:19JHQ007)。責(zé)任編輯:崔克亮)
RESEARCH ON INFLUENCING FACTORS OF
PARTICIPATION INTENTION OF BEIJING SMART PENSION
SYSTEM BASED ON DATA MINING
Wang Xiaoxiao, Guo Xulin, Chen Jian, Chen Mengxin
Abstract: The smart pension system itself has a management problem with rich content and influenced by complex factors. The traditional research is difficult to reveal its comprehensive inner influence mechanism because of the limitation of methods. This paper collects large sample data through social investigation on the basis of theoretical and empirical research, selects the optimal machine learning model algorithm to train and test the large data, carries out multi-level data mining for exploratory research, reveals influencing factors of participation intention of Beijing smart pension system.
Keywords: Smart Pension; Participation Intention; Data Mining