陶祥興,楊 崢,季彥颋
(浙江科技學(xué)院 理學(xué)院,浙江 杭州 310023)
隨著社會經(jīng)濟的迅速發(fā)展和醫(yī)療水平的大幅進步,世界人口死亡率逐漸降低,老齡化問題日益嚴重。人口壽命的非預(yù)期延長導(dǎo)致養(yǎng)老事業(yè)發(fā)展滯后于人口老齡化的進程,給養(yǎng)老金機構(gòu)和人壽保險公司帶來巨大壓力,進而可能影響整個社會經(jīng)濟的發(fā)展。因此,提高死亡率預(yù)測精度對于政府制定未來人口政策、經(jīng)濟政策以及養(yǎng)老政策至關(guān)重要。
縱觀學(xué)者對死亡率模型的研究,影響力最大的當(dāng)屬Lee-Carter模型。該模型是由李(Lee)和卡特(Carter)提出的一個對數(shù)雙線性模型,首次考慮時間因素和年齡因素對對數(shù)中心死亡率的影響,并通過時間序列ARIMA模型來外推預(yù)測死亡率[1]。Lee-Carter模型由于其形式簡單、計算方便、參數(shù)可解釋性強的特點被各國學(xué)者廣泛應(yīng)用。隨著研究的不斷深入,Lee-Carter模型也暴露出一定缺陷,如模型對參數(shù)的假設(shè)條件過高等。為了提高預(yù)測的精確性,國內(nèi)外學(xué)者從不同方向?qū)?jīng)典Lee-Carter模型進行了改進研究,其改進方面主要有:一是放寬了模型的假設(shè)條件。在經(jīng)典Lee-Carter模型中關(guān)于死亡率誤差的假設(shè)是獨立同分布的,針對這一假設(shè)條件過強的情況,勃朗恩斯(Brouhns)等假設(shè)死亡人數(shù)服從泊松分布,提出泊松對數(shù)雙線性模型,并對死亡率進行了預(yù)測[2]。二是對經(jīng)典Lee-Carter模型參數(shù)估計方法的改進。經(jīng)典Lee-Carter模型采用奇異值分解(SVD)法[3-4]進行參數(shù)估計,吳曉坤等學(xué)者采用加權(quán)最小二乘(WLS)法[5-7],極大似然(ML)法[8-9]和貝葉斯馬爾科夫蒙特卡洛(MCMC)法[10]進行參數(shù)估計,發(fā)現(xiàn)這三種方法在提高參數(shù)估計的擬合優(yōu)度和死亡率預(yù)測的精度上都有很好的表現(xiàn)。三是對有限死亡率數(shù)據(jù)下的預(yù)測方法的改進。Lee-Carter模型對死亡率數(shù)據(jù)的連續(xù)性有著較高的要求,大大限制了該模型在有限數(shù)據(jù)國家的應(yīng)用??紤]到中國死亡率數(shù)據(jù)量較小,王曉軍和黃順林通過改進時序中的波動性來提高模型預(yù)測的精度[11]。四是對刻畫Lee-Carter模型中的時間項參數(shù)kt的改進。傳統(tǒng)的Lee-Carter模型運用ARIMA方法擬合并預(yù)測kt的值,但該方法并不能捕捉到死亡率數(shù)據(jù)中的長記憶性特征,存在一定的缺陷。有學(xué)者采用一個帶漂移項的隨機游走模型來刻畫Lee-Carter模型中的時間項kt,并證明該方法同樣適用于稀疏數(shù)據(jù)[12]。而對于死亡率中存在的跳躍性變化,田夢和鄧穎璐采用雙指數(shù)跳躍擴散模型來描述這一特征,并得到了較好的預(yù)測效果[13]。
近年來,我國對Lee-Carter模型中的時間項kt的改進研究較少,大多都是單獨利用離散方法或是連續(xù)方法對時間項kt進行擬合和預(yù)測,很少在此基礎(chǔ)上引入機器學(xué)習(xí)方法對時間項kt的擬合和預(yù)測進行改進。因此本文在Lee-Carter模型預(yù)測死亡率的基礎(chǔ)上提出對時間項kt進行擬合和預(yù)測的兩種創(chuàng)新方法:第一,引入機器學(xué)習(xí)中的長短期記憶網(wǎng)絡(luò)模型(Long Short-Term Memory,LSTM),在Lee-Carter模型中時間項kt用離散ARIMA模型擬合的基礎(chǔ)上,運用LSTM模型修正其殘差并對死亡率進行短期預(yù)測;第二,引入分數(shù)布朗運動驅(qū)動的O-U過程來刻畫Lee-Carter模型中的時間項kt,通過機器學(xué)習(xí)中的遺傳算法來估計分數(shù)布朗運動驅(qū)動的O-U過程中的未知參數(shù)并進行死亡率的短期預(yù)測。本文通過殘差圖和三種回歸指標(biāo)將兩種創(chuàng)新方法和ARIMA方法的死亡率預(yù)測效果進行對比,確定出一個短期預(yù)測精度最高的死亡率預(yù)測方法,為政府預(yù)測未來死亡率提供了一種新的思路,也為相關(guān)機構(gòu)研究長壽風(fēng)險提供了一定的依據(jù)。
Lee-Carter模型考慮了年齡因素和時間因素對模型的影響,具體模型表達式如下:
ln(mx,t)=αx+ktβx+εx,t
(1)
由模型可知{αx,βx,kt}是模型的一組解,取任意一個不為0的常數(shù)c,將參數(shù)變換成{αx,βx/c,ckt}或{αx-cβx,βx,kt+c},都可使得原模型保持不變。因此本文對參數(shù)增加以下的約束條件使得模型滿足唯一的參數(shù)估計結(jié)果:
∑xβx=1,∑tkt=0
(2)
由于現(xiàn)實中死亡率誤差獨立同分布的假設(shè)通常不成立,故本文采用勃朗恩斯等去除了εx,t同方差的假定[2],提出用極大似然法來進行參數(shù)估計。該方法假設(shè)死亡人數(shù)dx,t服從參數(shù)為λx,t的泊松分布,即dx,t~Poisson(mx,tEx,t),其中λx,t=mx,tEx,t,mx,t=exp(αx+ktβx),Ex,t表示t時刻年齡為x的暴露人數(shù)。傳統(tǒng)Lee-Carter模型的極大似然函數(shù)可表達為:
L(αx,βx,kt)=∑x,t[dx,t(αx+ktβx)-Ex,teαx+ktβx]+C
(3)
(4)
(5)
(6)
圖1 1971—2020年中國香港男性死亡率三維圖
本文采用1971—2020年香港男性分年齡組死亡率、死亡人口以及暴露人口的數(shù)據(jù),參照簡易生命表和已有文獻的年齡分組,將香港男性數(shù)據(jù)分為19個年齡組(即0—4歲、5—9歲、……、85—89歲以及90歲及以上),其中每個年齡組的死亡率數(shù)據(jù)采用5年死亡率數(shù)據(jù)的算數(shù)平均。數(shù)據(jù)來源于人類死亡率數(shù)據(jù)庫(Huamn Mortality Database)和香港特別行政區(qū)政府統(tǒng)計處。根據(jù)這些數(shù)據(jù)繪制了分年齡組死亡率三維圖,如圖1所示。
從圖1中能夠看出每一個年齡組的死亡率都呈現(xiàn)出普遍下降的趨勢,這符合死亡率正在逐漸降低的社會環(huán)境,但降低的程度在每個年齡組都有著差異。接下來將對死亡率模型的參數(shù)進行估計、擬合和預(yù)測。
選取1971—2018年香港男性完整死亡率數(shù)據(jù),采用極大似然法運用R軟件進行參數(shù)估計,得到Lee-Carter模型的參數(shù)估計值如圖2所示。
圖2 Lee-Carter模型參數(shù)的估計值
從圖2可以看出,參數(shù)αx表示年齡因素對死亡率的影響,這一影響隨著年齡的增長呈現(xiàn)出了先下降后上升的趨勢;βx隨著年齡的增加而逐漸下降,且低年齡組和高年齡組βx值下降幅度相對較大,表明這兩個年齡段對死亡率時間因子變化的敏感度相對較高;而參數(shù)kt的估計值隨著時間的推移表現(xiàn)出顯著的遞減趨勢。
本文利用1971—2018年的香港男性死亡率數(shù)據(jù),對模型進行擬合,并根據(jù)上述參數(shù)估計結(jié)果,采用ARIMA(0,1,1)模型預(yù)測2019、2020年的kt值(見圖3)。
根據(jù)kt的預(yù)測值和式(1),可以得到2019—2020年香港男性分年齡組人口的死亡率預(yù)測值,結(jié)果如表1所示。
圖3 時間項kt的預(yù)測值
長短期記憶深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)是一種改良過的循環(huán)神經(jīng)網(wǎng)絡(luò),因其能夠有效解決長時間依賴問題,被廣泛應(yīng)用于時間序列的預(yù)測。LSTM神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)流向和傳遞過程如圖4所示。
表1 基于ARIMA方法的2019—2020年死亡率預(yù)測值
(7)
其中,W表示權(quán)重,b表示模型的偏置。
圖4 LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
本文引用具有長記憶性并且適用于時間序列建模的LSTM神經(jīng)網(wǎng)絡(luò)對ARIMA模型進行修正,具體步驟如下。
(1)對獲得到的kt序列進行平穩(wěn)性檢驗。首先對kt序列作圖來判斷序列是否平穩(wěn),即是否需要經(jīng)過差分處理。對差分后的序列進行單位根(ADF)檢驗,若通過ADF檢驗表明差分后的序列已經(jīng)平穩(wěn),則不需要進行差分處理,否則需要在此基礎(chǔ)上再進行差分處理。
(3)對殘差序列{eit}進行白噪聲(Ljung-Box)檢驗,若通過白噪聲檢驗說明擬合模型充分提取了原序列中的相關(guān)信息。
圖5 流程建模圖
表2 基于ARIMA-LSTM方法的2019—2020年死亡率預(yù)測值
分數(shù)O-U過程是由分數(shù)布朗運動驅(qū)動的O-U過程,對于處理實際問題中的長記憶性有著十分普遍的應(yīng)用。我們考慮以下形式的分數(shù)O-U過程來刻畫Lee-Carter模型中的時間項kt:
(8)
將式(8)離散化得到如下表達式:
(9)
根據(jù)Hurst參數(shù)的研究成果[15],本文得到分數(shù)布朗運動驅(qū)動的分數(shù)O-U過程中Hurst參數(shù)H的估計:
(10)
利用二次變差法計算出σ2估計量的值:
(11)
利用機器學(xué)習(xí)方法中的遺傳算法來進行最后一個未知參數(shù)λ的估計。遺傳算法(Genetic Algorithm,GA)是一種通過模擬自然進化過程搜索最優(yōu)解的方法,它克服了傳統(tǒng)極大似然等方法容易陷入局部極值丟失最優(yōu)解的缺點,其具體步驟如下。
(1)編碼。隨機產(chǎn)生一個種群作為該問題的初始解,并運用合適的編碼方案對種群中的每一個個體進行編碼,如二進制編碼或?qū)嵵稻幋a等。本文采用的編碼方式是二進制編碼,其編碼過程簡單易行,相應(yīng)的交叉算子、變異算子等操作運用位運算即可實現(xiàn)。
(4)交叉與變異。交叉是將隨機配對的兩個個體相互交換本體中的部分基因,其主要的方法有單點交叉、多點交叉等,本文采用多點交叉法,交叉點根據(jù)交叉概率隨機選取。變異是指個體上的某些基因發(fā)生改變,主要的變異方法有基本位變異、均勻變異等。本文采用基本位變異法,根據(jù)變異的概率隨機確定每個個體想要發(fā)生變異的基因點位,然后將二進制編碼中的“1”變?yōu)椤?”,“0”變?yōu)椤?”。
表3 分數(shù)布朗運動驅(qū)動的分數(shù)O-U過程的參數(shù)估計值
表4 基于分數(shù)布朗運動驅(qū)動的O-U過程的2019—2020年死亡率預(yù)測值
(5)參數(shù)選擇(交叉概率、變異概率、種群規(guī)模、迭代次數(shù))。遺傳算法中,參數(shù)的選擇是否合理將直接影響模型的精度和有效性。本文通過多次試驗后,選取交叉概率為0.6,變異概率為0.1,種群規(guī)模為50,遺傳算法迭代次數(shù)為500。
利用PYTHON實現(xiàn)上述遺傳算法代碼編程,可得分數(shù)布朗運動驅(qū)動的O-U過程的參數(shù)估計值如表3所示。
將分數(shù)布朗運動驅(qū)動的O-U過程的參數(shù)估計值代入其離散表達式(9),可以對2019—2020年的香港分年齡組的死亡率進行預(yù)測,預(yù)測結(jié)果如表4所示。
根據(jù)上述預(yù)測結(jié)果,結(jié)合2019—2020年真實死亡率數(shù)據(jù)的對比圖(見圖6)發(fā)現(xiàn),2019年和2020年,80歲以下三種模型預(yù)測的死亡率均表現(xiàn)出較好的預(yù)測效果,而80歲以上死亡率的預(yù)測值與真實值之間存在較小偏差。
圖6 2019—2020年死亡率數(shù)值對比圖
為進一步評估三種方法的預(yù)測效果,本文選用殘差圖以及三個評價指標(biāo)對預(yù)測值進行綜合比較,并選擇出相對最優(yōu)的預(yù)測方法。
由于三種預(yù)測方法得到的死亡率預(yù)測值與真實值之間均存在一定的差異,故本文通過考察分年齡組的死亡率殘差圖(見圖7)來初步評估三種方法的預(yù)測效果。圖7顯示,60歲以下三種方法的死亡率殘差值均位于0線附近,且并未表現(xiàn)出明顯差異,表明該年齡段內(nèi),三種方法的預(yù)測效果較為穩(wěn)定且精度較高;高年齡組的預(yù)測殘差值差異較為明顯,整體上ARIMA-LSTM方法的短期預(yù)測表現(xiàn)相對最好,傳統(tǒng)的ARIMA方法次之。
圖7 2019—2020年死亡率殘差對比圖
為了進一步比較三種方法的預(yù)測效果,本文引入平均絕對百分比誤差(MAPE)、均方誤差(MSE)和平均絕對誤差(MAE)三個評價指標(biāo)來評價模型的預(yù)測效果。
(12)
(13)
(14)
表5 三種方法預(yù)測精度對比
本文采用中國香港1971—2020年男性分年齡組數(shù)據(jù),在Lee-Carter模型的基礎(chǔ)上,提出了兩種改進方法對模型中時間項進行擬合和預(yù)測。第一種是引入機器學(xué)習(xí)LSTM模型,在Lee-Carter模型中時間項kt用離散ARIMA模型擬合的基礎(chǔ)上,運用LSTM來修正其殘差并進行死亡率短期預(yù)測。第二種是引入分數(shù)布朗運動驅(qū)動的O-U過程來刻畫Lee-Carter模型中時間項kt,通過遺傳算法來估計分數(shù)O-U過程中的未知參數(shù)并進行死亡率短期預(yù)測。
將本文提出的兩種改進方法與傳統(tǒng)ARIMA方法的預(yù)測效果作對比,結(jié)合預(yù)測殘差圖發(fā)現(xiàn),60歲以下三種方法的死亡率殘差值基本位于0線附近,而高年齡組的殘差值表現(xiàn)出較大差異,整體上ARIMA-LSTM方法的殘差值明顯低于其他兩種方法,表明ARIMA-LSTM方法的短期預(yù)測效果相對較好。
最后引入MAPE、MSE和MAE指標(biāo)進一步考察三種方法的預(yù)測效果,結(jié)果表明ARIMA-LSTM方法具有較好的短期預(yù)測能力。綜合殘差圖和評估指標(biāo),本文認為ARIMA-LSTM方法能夠更加精確地描述死亡率的短期變化,表明將機器學(xué)習(xí)方法應(yīng)用于死亡率的短期預(yù)測中是切實有效的,有助于改善人口老齡化給政府和相關(guān)長壽保險機構(gòu)帶來的負面影響。
在進一步的研究中,將嘗試運用ARIMA-LSTM方法對大陸的死亡率數(shù)據(jù)進行擬合預(yù)測。同時考慮到大陸死亡率數(shù)據(jù)有限且有缺失,將采用貝葉斯方法進行參數(shù)估計,該方法能夠有效減少數(shù)據(jù)質(zhì)量不高帶來的不利影響。