王曉軍 趙曉月 陳惠民
摘 要:退休年齡以上的老年人群死亡率預(yù)測是養(yǎng)老金精算和長壽風(fēng)險度量的基礎(chǔ)。針對我國大陸地區(qū)退休年齡以上人群死亡率數(shù)據(jù)量較小且波動較大的問題,借助多人口聯(lián)合建模思想,基于單人口CBD模型,提出了一個適用于老齡死亡率建模的Logistic多人口模型。通過加入更多相關(guān)人口數(shù)據(jù)信息來預(yù)測我國老年人口死亡率,選取我國臺灣地區(qū)分性別死亡率相關(guān)數(shù)據(jù),與我國大陸地區(qū)分性別死亡率數(shù)據(jù)進行聯(lián)合建模。研究發(fā)現(xiàn),Logistic多人口死亡率模型比單人口CBD模型表現(xiàn)出更好的擬合效果和長期預(yù)測一致性效果。
關(guān)鍵詞:老年人口;死亡率;Logistic模型;多人口模型
中圖分類號:C921 ?文獻標(biāo)識碼:A ??文章編號:1000-4149(2021)02-0045-12
DOI:10.3969/j.issn.1000-4149.2021.00.011
收稿日期:2020-08-28; 修訂日期:2021-01-25
基金項目:教育部哲學(xué)社會科學(xué)研究重大課題攻關(guān)項目“健康中國2030背景下的健康老齡化體系優(yōu)化研究”(20JZD023)。
作者簡介:王曉軍,中國人民大學(xué)應(yīng)用統(tǒng)計科學(xué)研究中心研究員,統(tǒng)計學(xué)院教授;趙曉月,中國人民大學(xué)統(tǒng)計學(xué)院博士研究生;陳惠民,中國人民大學(xué)統(tǒng)計學(xué)院博士研究生。
Modeling and Coherent Forecasting of the Elderly Mortality
with Multiple Populations
WANG? Xiaojun1,2, ZHAO? Xiaoyue2, CHEN? Huimin2
(1.Center for Applied Statistics,? Renmin University of China,? Beijing 100872,
China;2.School of Statistics, Renmin University of China, Beijing 100872, China)
Abstract:
The mortality prediction of the elderly above retirement age is the basis of pension actuarial valuation and longevity risk measurement. In order to solve the problem of small amount and large fluctuation of mortality data of people above retirement age in mainland China,
this paper proposes a Logistic
multi-population model for the elderly mortality model based on a single population
Cairns-Blake-Dowd (CBD) model.
By adding more relevant population data information to predict the mortality rate of the elderly population in China, this paper selects the gender specific mortality data in Taiwan and carries out joint modeling with the gender specific mortality rate in mainland China. It is found that compared with single population CBD model, the Logistic multi-population mortality model has a better fitting
and long-term coherent prediction effect.
Keywords:aging population;mortality;Logistic model;multiple population model
一、引言
退休年齡以上的老年人群死亡率預(yù)測是養(yǎng)老金精算和長壽風(fēng)險度量的基礎(chǔ)。依據(jù)國家統(tǒng)計局公布的數(shù)據(jù),截至2019年末,我國60歲及以上老年人口數(shù)達到2.54 億人,占總?cè)丝诘谋壤^18%。人口預(yù)期壽命逐年增加,2015年我國男、女性出生預(yù)期壽命分別達到73.64歲和79.43歲。另外,依據(jù)聯(lián)合國《世界人口展望2019年》的預(yù)測結(jié)果,未來人口預(yù)期壽命仍然保持約每5年增加一歲的趨勢,人口預(yù)期壽命增長的不確定性給養(yǎng)老金風(fēng)險管理帶來挑戰(zhàn)。
在我國,分年齡的死亡人數(shù)和生存人數(shù)來源于人口普查和人口抽樣調(diào)查,除了每10年的人口普查和每5年的1%人口抽樣調(diào)查,其他年份均是千分之一左右的人口變動抽樣調(diào)查,對應(yīng)的分年齡性別人數(shù)較少,分年齡性別的死亡率波動較大。用這些數(shù)據(jù)直接建模,很難捕捉死亡率隨年齡和時間的變動規(guī)律。
考慮到人類死亡率變動具有共同規(guī)律性的特點,近年來,研究者開始關(guān)注對多人口死亡率的聯(lián)合建模。這里的多人口指研究人群范圍為兩個或兩個以上的具有相似特征的不同人口群體,可以是具有相似經(jīng)濟文化背景或地理位置相近的國家或地區(qū),也可以是同一地區(qū)的不同種族或性別。有學(xué)者指出,密切相關(guān)人群的死亡率模式和軌跡可能類似,可以通過考慮多人口的聯(lián)合建模方式來提高個別國家的死亡率預(yù)測精度[1]。
多人口死亡率模型一般包括公共因素項和附加的特定因素項,公共因素描述整個人口死亡率隨時間變化的主要長期趨勢,附加因素考慮不同人口的短期差異。多人口死亡率模型可以分為三大類:一是對男女性聯(lián)合建模,能夠有效避免男女死亡率在中長期預(yù)測中出現(xiàn)死亡率交叉或分離的不合理問題;二是對不同國家或地區(qū)的多個人口進行死亡率聯(lián)合建模,以達到長期的一致性預(yù)測;三是對不同國家和地區(qū)的不同性別人口死亡率進行聯(lián)合建模,既考慮不同人口間的協(xié)整關(guān)系,又保證同一人口不同性別間的相依關(guān)系。
我國大陸地區(qū)高齡人口死亡數(shù)據(jù)的時間序列短,分年齡性別的風(fēng)險暴露人數(shù)少,死亡率數(shù)據(jù)的波動性較大,因此在現(xiàn)有大陸地區(qū)人口死亡率數(shù)據(jù)的基礎(chǔ)上,加入更多相關(guān)人口數(shù)據(jù)信息,可以實現(xiàn)對我國高齡人口死亡率更好地建模和預(yù)測。本文基于CBD模型和Logistic兩人口死亡率模型,提出一種包括分地區(qū)和分性別的老齡多人口死亡率模型,在性別因子的基礎(chǔ)上加入國別和地區(qū)別因子,假設(shè)死亡人數(shù)服從泊松分布,利用極大似然估計進行參數(shù)估計。
選擇人種相同、地理位置相近的中國大陸、中國臺灣分男女共四類人口的數(shù)據(jù)進行聯(lián)合建模,通過捕捉死亡率變動的共同規(guī)律,擬對中國大陸人口死亡率做出更合理預(yù)測。
二、死亡率模型的研究綜述
早期的死亡率模型只是能描述死亡率隨年齡變動的靜態(tài)模型,之后死亡率模型中加入時間項,發(fā)展為單個人口動態(tài)模型,動態(tài)死亡率模型的典型代表是1992年提出的 Lee-Carter 模型[2],該模型假設(shè)對數(shù)死亡率由年齡效應(yīng)、時間效應(yīng)以及與年齡相關(guān)且與時間有交互效應(yīng)的項組成,因其形式簡單且參數(shù)的可解釋性強等特點被廣泛應(yīng)用。之后,有許多研究在Lee-Carter 模型基礎(chǔ)上進行了擴展。倫肖(Renshaw)等在Lee-Carter模型的基礎(chǔ)上加入了隊列效應(yīng),對于過去觀察到隊列效應(yīng)的國家,該模型可以更好地擬合歷史數(shù)據(jù)[3]??吕铮–urrie)提出了含有年齡、時期、隊列的Age-Period-Cohort(APC)模型,該模型可以視作倫肖所提
模型的簡化形式,模型不需要平滑性的條件,消除了可能存在的穩(wěn)健性問題[4]。凱恩斯(Cairns)等又提出了適用于高齡死亡率的CBD(Cairns-Black-Dowd)模型,CBD模型引入了兩個時間效應(yīng)因子,區(qū)分了高年齡人群的死亡率隨時間的改善效應(yīng),使模型對高年齡段的擬合和預(yù)測效果更好[5]。凱恩斯等人在CBD模型的基礎(chǔ)上,考慮二次項和隊列效應(yīng)項,給出了一些CBD擴展模型,并指出加入二次項和隊列項的模型擬合效果更好[6]。
隨著研究的進行,研究者發(fā)現(xiàn)單人口死亡率模型在死亡率的長期預(yù)測中容易出現(xiàn)不合理的交叉或偏離情況,有違人類死亡率變動的一般規(guī)律性,從而提出多人口聯(lián)合建模和預(yù)測的思路。有學(xué)者在Lee-Carter模型基礎(chǔ)上進行擴展,提出了公共因子(Common Factor,CF)模型及增廣公因子(Augmented Common Factor,ACF)模型,它包含了整個人群的一個共同因素,以及擴展模型中的一個額外的性別特定因素[1]。公共因素描述了整個人口死亡率隨時間變化的長期主要趨勢,附加因素考慮了每個性別的短期差異。使用公共因子模型避免了不同人口死亡率隨時間出現(xiàn)的交叉或偏離問題,并確保根據(jù)觀察到的歷史模式,每個年齡段的男性死亡率與女性死亡率的比率在長期收斂到一個常數(shù)。又有學(xué)者使用泊松分布直接對死亡人數(shù)建模,同時將模型結(jié)構(gòu)廣義化,提出了泊松公共因子模型(Poisson Common Factor Model,簡稱PCFM模型),該模型為數(shù)據(jù)分析、參數(shù)估計和模型選擇提供了嚴格的統(tǒng)計框架,同時模型可以擴展為多個特定因素,可以更好地捕獲殘差中的其他系統(tǒng)特征[7]。他們利用10個人口死亡率數(shù)據(jù),進一步評估了泊松公共因子模型的擬合和預(yù)測性能,結(jié)果表明,該方法能確保每個年齡段的男女死亡率在長期內(nèi)收斂到一個常數(shù),并提供更準(zhǔn)確的男女死亡率預(yù)測[8]。此后,又有學(xué)者在擴展公共因子模型的基礎(chǔ)上加入了國別(不同國家或地區(qū))因子,提出了兩層擴展公共因子模型,并使用英國的英格蘭和威爾士、蘇格蘭和北愛爾蘭的數(shù)據(jù),對模型進行了驗證,對死亡率作出了一致的預(yù)測[9]。
學(xué)者們又對單人口CBD 模型進行擴展,在截距項和斜率項中分別加入了性別參數(shù),提出了一個適用于高齡的Logistic兩人口死亡率模型,并使用模型對比利時、瑞典、瑞士、英國四個國家的高齡死亡率數(shù)據(jù)進行建模預(yù)測,取得了良好的擬合和預(yù)測效果[10]。
三、Logistic死亡率模型
1. CBD模型
凱恩斯等人提出的CBD模型是一種單人口Logistic動態(tài)模型,適用于高齡人群死亡率的擬合和預(yù)測[5]。模型形式如下:
logit(qx,t)=κ(1)t+(x-)κ(2)t+εx,t(1)
其中,qx,t是t年x歲的死亡概率,κ(1)t、κ(2)t是兩個時間項,εx,t為隨機誤差項。
2. Logistic兩人口死亡率模型
如前所述,采用單人口模型對男性和女性高齡人口死亡率進行單獨建模和預(yù)測時往往在預(yù)測期內(nèi)會出現(xiàn)兩性別死亡率的交叉或分離等脫離實際的現(xiàn)象,因此需要考慮對兩性別死亡率的聯(lián)合建模。
2019年,學(xué)者們提出適用于高齡的Logistic兩人口死亡率模型[10],模型形式如下:
logitq(i)x,t=αt+βt(x-)+τ(i)t+ν(i)t(x-)(2)
其中,q(i)x,t表示x歲的人在時間t的死亡概率,i代表性別(i=1代表女性,i=2代表男性),αt和βt是兩個性別的共同參數(shù),τ(i)t和υ(i)t是分性別參數(shù),αt+τ(i)t和βt+υ(i)t分別代表死亡率曲線對性別i在時間t的截距項和斜率項。表示建模年齡段的平均年齡。
在模型(2)的基礎(chǔ)上加入個體曲率項可以進一步擴展為模型(3),具體形式如下:
logitq(i)x,t=αt+βt(x-)+τ(i)t+ν(i)t(x-)+γ(i)t[(x-)2-σ2](3)
其中,γ(i)t是關(guān)于性別i的曲率項,σ2是建模所覆蓋的年齡范圍下(x-)2的均值。如果男女之間的曲率相似,即第三項為公共曲率項,則模型(3)可簡化為模型(4):
logitq(i)x,t=αt+βt(x-)+τ(i)t+ν(i)t(x-)+γt[(x-)2-σ2](4)
其中,γt為兩性別的共同參數(shù)項。
3. Logistic多人口死亡率模型
以上兩人口模型可以避免男女死亡率隨時間的交叉問題,但沒有考慮不同人口之間死亡率的長期一致性。本文在Logistic兩人口死亡率模型的基礎(chǔ)上,加入人口別(不同國家或地區(qū))因子,提出一種Logistic多人口死亡率模型,既考慮不同人口之間的協(xié)整關(guān)系,又考慮性別間的相依關(guān)系,構(gòu)建高維多人口死亡率模型,捕捉人類死亡率變動的共同規(guī)律,使對不同人口的死亡率預(yù)測具有一致性。模型形式如下:
logitqx,t,i,j=αt+βt(x-)+τt,i,j+νt,i,j(x-)(5)
其中,qx,t,i,j表示x歲的人在時間t的死亡概率,i代表性別(i=1代表女性,i=2代表男性),j=n表示n個不同的人口(國家或地區(qū))數(shù)據(jù), αt和βt是共同參數(shù),τt,i,j和υt,i,j是分性別參數(shù)。
αt+τt,i,j和βt+υt,i,j分別代表死亡率曲線對性別i在時間t的截距項和斜率項,表示建模年齡段的平均年齡。
在模型(5)的基礎(chǔ)上加入分性別分人口曲率項可以進一步擴展為:
logitqx,t,i,j=αt+βt(x-)+τt,i,j+νt,i,j(x-)+γt,i,j
[(x-)2-σ2](6)
其中,γt,i,j是關(guān)于性別i人口j的曲率項,σ2是建模所覆蓋的年齡范圍下(x-)2的均值。
為確保死亡率預(yù)測的一致性,假設(shè)共同的參數(shù)遵循帶漂移的隨機游走,性別參數(shù)和人口別參數(shù)均遵循自回歸過程AR(1):
αt=δ1+αt-1+εt,1(7)
βt=δ2+βt-1+εt,2(8)
γt=δ3+γt-1+εt,3(9)
τt,i,j=φ(i,j)0,1+φ(i,j)1,1τt-1,i,j+ω(i,j)t,1(10)
υt,i,j=φ(i,j)0,2+φ(i,j)1,2υt-1,i,j+ω(i,j)t,2(11)
γt,i,j=φ(i,j)0,3+φ(i,j)1,3γt-1,i,j+ω(i,j)t,3(12)
其中,δ1,δ2和δ3是漂移項,φ(i,j)0,1,φ(i,j)0,2和φ(i,j)0,3是截距項,φ(i,j)1,1,φ(i,j)1,2和φ(i,j)1,3是自回歸參數(shù),εt,1,εt,2,εt,3,ω(i,j)t,1,ω(i,j)t,2和ω(i,j)t,3是正態(tài)誤差項。它們相互關(guān)聯(lián),跨時間獨立。
4. 參數(shù)估計方法
運用極大似然估計方法
估計參數(shù),以模型(6)為例,假設(shè)死亡人數(shù)服從泊松分布:
Dx,t,i,j~Poisson(ex,t,i,j μx,t,i,j)(13)
其中,Dx,t,i,j是死亡人數(shù),ex,t,i,j是中心暴露數(shù)。令logitμx,t,i,j=ηx,t,i,j,則μx,t,i,j=exp(ηx,t,i,j)/[1+exp(ηx,t,i,j)]。似然函數(shù)為:
l=∑x,t,i,j[dx,t,i,jlnex,t,i,j+dx,t,i,jlnμx,t,i,j-ex,t,i,jμx,t,i,j-ln(dx,t,i,j?。(14)
參數(shù)估計迭代更新方程為:θ*=θ-lθ/l2θ2,迭代更新步驟如下。
步驟1:設(shè)置參數(shù)初始值(建議αt=-2,βt=0.1,τx,t,i,j=0,νx,t,i,j=0,γx,t,i,j=0),并計算所有的μx,t,i,j和ηx,t,i,j的擬合值;
步驟2:對所有的t更新αt,然后重新計算所有μx,t,i,j和ηx,t,i,j的擬合值;
步驟3:對所有的t更新βt,然后重新計算所有μx,t,i,j和ηx,t,i,j的擬合值;
步驟4:對所有i和t更新τx,t,i,j,然后重新計算所有μx,t,i,j和ηx,t,i,j的擬合值;
步驟5:對所有i和t更新νx,t,i,j,然后重新計算所有μx,t,i,j和ηx,t,i,j的擬合值;
步驟6:對所有i和t更新γx,t,i,j,然后重新計算所有μx,t,i,j和ηx,t,i,j的擬合值;
步驟7:對所有i和t,調(diào)整α*t=αt+cτ和τ*t,i,j=τt,i,j-cτ,其中cτ=∑tτ(1)t/Nt,Nt為年數(shù);
步驟8:對所有i和t,調(diào)整β*t=βt+cτ和υ*t,i,j=υt,i,j-cυ,其中cν=∑tν(1)t/Nt,Nt為年數(shù);
步驟9:計算對數(shù)似然函數(shù);
步驟10:重復(fù)步驟2到9,直到對數(shù)似然函數(shù)收斂。對于其他形式的模型,可以簡單修改上面的一些步驟,實現(xiàn)參數(shù)估計。
四、死亡率聯(lián)合建模
1. 數(shù)據(jù)描述
中國大陸人口死亡率數(shù)據(jù)來自歷年《中國人口統(tǒng)計年鑒》和《中國人口和就業(yè)統(tǒng)計年鑒》,目前公布的數(shù)據(jù)有1994—2018年共25年連續(xù)數(shù)據(jù)。其中2000年和2010年為全國人口普查數(shù)據(jù),1995年、2005年、2015年為全國1%人口抽樣調(diào)查數(shù)據(jù),對于普查年數(shù)據(jù)和1%人口抽樣調(diào)查數(shù)據(jù),分年齡分性別有0歲到100歲及以上數(shù)據(jù)。其他年份為1‰左右變動抽樣數(shù)據(jù),其中1996年數(shù)據(jù)從0歲到85歲及以上,對于85—89歲死亡率采用插值法處理,其他年份數(shù)據(jù)從0歲到90歲及以上。
中國臺灣人口死亡率數(shù)據(jù)來自人類死亡率數(shù)據(jù)庫HMD(Human Mortality Database),根據(jù)公布的分年齡分性別數(shù)據(jù),臺灣地區(qū)有1970—2014年共45年連續(xù)數(shù)據(jù),臺灣地區(qū)分年齡分性別數(shù)據(jù)從0歲到110歲及以上。相比中國大陸地區(qū)而言,中國臺灣地區(qū)的死亡率數(shù)據(jù)時間段較長,數(shù)據(jù)質(zhì)量較高。柳向東等認為我國大陸地區(qū)和臺灣地區(qū)人口死亡率存在長期均衡關(guān)系[11]。段白鴿指出我國大陸和臺灣地區(qū)各年齡死亡率、平均預(yù)期壽命之間的差異明顯縮小,未來死亡率呈現(xiàn)趨同化發(fā)展[12]。因此我們選擇中國大陸和中國臺灣分性別老齡數(shù)據(jù)進行聯(lián)合建模,對中國大陸老齡人口死亡率數(shù)據(jù)進行修勻和預(yù)測。
2. 模型擬合和模型選擇
我們選擇中國大陸、中國臺灣共同數(shù)據(jù)區(qū)間1994—2014年男性和女性分年齡60—89歲死亡率數(shù)據(jù)進行聯(lián)合建模??紤]到中國大陸人口基數(shù)較大,為了充分利用死亡率信息,以中國大陸地區(qū)的風(fēng)險暴露數(shù)為基準(zhǔn),按1∶1的比例調(diào)整中國臺灣地區(qū)的風(fēng)險暴露數(shù),再以臺灣地區(qū)的中心死亡率調(diào)整死亡人數(shù),最后運用極大似然方法對死亡人數(shù)進行建模。
選擇赤池信息準(zhǔn)則(Akaike Information Criterion,AIC)和貝葉斯信息準(zhǔn)則 (Bayes Information Criterion,BIC)來評估模型的擬合效果。其中,
AIC=2k-2ln(L)(15)
BIC=kln(n)-2ln(L)(16)
其中,k為模型參數(shù)個數(shù),n為樣本量,L為似然函數(shù)。AIC準(zhǔn)則和BIC準(zhǔn)則的區(qū)別在于BIC準(zhǔn)則考慮了樣本量,對模型復(fù)雜度的懲罰力度更大,當(dāng)樣本量較大時,可以有效防止模型擬合精度過高而造成的模型復(fù)雜度過高的現(xiàn)象。AIC和BIC值越小模型效果越好。
表1給出了Logistic多人口模型的2個模型擬合得到的AIC值和BIC值。模型(6)的AIC和BIC值均比模型(5)小了大約13%,因此選擇模型(6)對數(shù)據(jù)進行建模。
我們還可以通過計算樣本內(nèi)平均絕對百分比誤差(Mean Absolute Percentage Error, MAPE)來評價模型的擬合效果,MAPE表達式為:
表2給出了模型(1)—模型(6)中國大陸、中國臺灣擬合結(jié)果的MAPE值,其中模型(1)為單人口CBD模型,模型(2)、(3)為僅加入性別項的兩人口模型,模型(5)、(6)為加入了性別項和人口項的多人口模型。結(jié)果顯示,無論是男性還是女性,加入性別項的兩人口模型與同時加入性別和人口項的多人口模型的MAPE值相同,均小于單人口CBD模型,而加入曲率項的模型(3)和模型(6)的男女死亡率擬合結(jié)果均優(yōu)于沒有加曲率項的模型。與CBD模型相比,在模型(6)下的擬合結(jié)果中國大陸男女MAPE值分別減小了6%和5.5%,中國臺灣男女MAPE值分別減小了46%和35.7%,擬合效果有明顯改善。
運用模型(6)對數(shù)據(jù)進行聯(lián)合建模,圖1給出了模型(6)的擬合殘差圖,可見,中國大陸、中國臺灣男女的殘差分布均滿足隨機性。對于中國大陸而言,可以看到數(shù)據(jù)質(zhì)量較好的普查年份和1%抽樣調(diào)查年份的殘差明顯較小,說明模型對這部分的數(shù)據(jù)擬合效果較好,這也符合我們的預(yù)期結(jié)果。對于中國臺灣而言,整體擬合殘差值較小。
圖2給出了模型(6)下中國大陸男女死亡率原始數(shù)據(jù)和修勻結(jié)果,可以看出模型(6)修勻效果有較好的光滑性,男女死亡率隨時間變化呈遞減趨勢。
對于上述擬合結(jié)果,考慮到我國大陸地區(qū)分年齡死亡率波動性較大,高齡部分數(shù)據(jù)稀疏的情況,我們選擇數(shù)據(jù)量較大,數(shù)據(jù)質(zhì)量較好的普查年和1%抽樣調(diào)查年的1995年、2000年、2005年、2010年四年的分性別死亡率數(shù)據(jù),將幾個模型的擬合結(jié)果做對比。表3給出了中國大陸地區(qū)這四個年份分性別擬合結(jié)果的MAPE值。結(jié)果表明,對于中國大陸地區(qū),模型(6)對數(shù)據(jù)擬合優(yōu)于CBD模型,而且對于數(shù)據(jù)質(zhì)量較好的年份,男女MAPE值分別減少了29%和25.85%,擬合結(jié)果也優(yōu)于單人口的CBD模型。
圖3、圖4分別給出了中國大陸地區(qū)男性和女性在CBD模型和模型(6)下1995年、2000年、2005年、2010年的擬合效果圖??梢姡瑹o論是男性還是女性,CBD模型擬合結(jié)果均低于模型(6),模型(6)在CBD模型的基礎(chǔ)上提高了擬合精度。
3. 死亡率預(yù)測
在死亡率預(yù)測中,為確保預(yù)測一致性,假設(shè)共同的參數(shù)遵循帶漂移的隨機游走,性別參數(shù)和人口別參數(shù)均遵循自回歸過程AR(1)。圖5給出了共同參數(shù)αt和βt的估計和預(yù)測結(jié)果,參數(shù)αt反映了死亡率整體下降的趨勢,參數(shù)βt呈緩慢下降趨勢。圖6給出了中國大陸分性別參數(shù)的估計和預(yù)測結(jié)果,可以看到分性別和人口別的參數(shù)在弱平穩(wěn)過程下收斂到常數(shù),同時也給出了參數(shù)的95%預(yù)測區(qū)間。
使用上述參數(shù)預(yù)測值,可以對死亡率做出預(yù)測,將死亡率外推到2050年,并與單人口死亡率預(yù)測結(jié)果進行對比。圖7給出了中國大陸地區(qū)、中國臺灣地區(qū)在CBD模型、模型(3)、模型(6)下2050年的分性別分地區(qū)的預(yù)測結(jié)果對比圖。圖中CBD模型死亡率曲線從上到下依次為中國大陸男性、中國臺灣男性、中國大陸女性、中國臺灣女性,可以看到在長期預(yù)測中,CBD模型男女死亡率產(chǎn)生偏離現(xiàn)象;模型(3)結(jié)果顯示男女死亡率呈現(xiàn)一致性預(yù)測,男女死亡率曲線趨于平行,但不同人口之間死亡率差異性較明顯;模型(6)的結(jié)果顯示,男女死亡率呈現(xiàn)一致性預(yù)測,男女死亡率曲線趨于平行,且不同人口之間死亡率也呈現(xiàn)一致性預(yù)測。
在模型(6)參數(shù)估計的結(jié)果下,可以計算得出中國大陸地區(qū)男女死亡率預(yù)測值。表4給出了2020年、2030年、2040年、2050年的60—89歲死亡率預(yù)測值??梢?,隨著時間推移,男女死亡率均呈下降趨勢,60歲男性死亡率從2020年的0.0105降到了2050年的0.0075,大約降低28.6%;60歲女性死亡率從2020年的0.0058降到2050年的0.0043,約降低25.9%。同一時期女性死亡率明顯低于男性,隨著時間推移男女死亡率差距逐漸減小。
五、結(jié)論
本文在CBD模型和Logistic兩人口死亡率模型基礎(chǔ)上對模型進行擴展,在分性別因子
基礎(chǔ)上加入國家和地區(qū)別因子,提出了Logistic多人口模型,用于對多個人口分性別的聯(lián)合建模,以捕捉不同人口死亡率的共同特性,更好地預(yù)測死亡率變動趨勢。模型打破了單人口模型與兩性別或多人口聯(lián)合建模的局限,將性別與人口別同時聯(lián)合建模,將模型推向高維。
針對中國大陸地區(qū)高齡死亡率數(shù)據(jù)波動大,數(shù)據(jù)質(zhì)量差的問題,我們選擇中國大陸地區(qū)、臺灣地區(qū)
分男女死亡率相關(guān)數(shù)據(jù),以中國大陸數(shù)據(jù)為基礎(chǔ),并按1∶1數(shù)據(jù)量調(diào)整臺灣數(shù)據(jù),對其進行聯(lián)合建模和預(yù)測,來擬合和預(yù)測中國大陸未來死亡率變化模式;與單人口CBD模型相比,從擬合結(jié)果MAPE值來看,中國大陸、中國臺灣男女死亡率擬合效果均有所改善。在長期預(yù)測中,Logistic多人口模型避免了單人口CBD模型可能出現(xiàn)的死亡率交叉或偏離問題,能夠給出死亡率的一致預(yù)測。
在進一步的研究中,Logistic多人口模型還可以嘗試加入隊列效應(yīng)對模型進行擴展,以適用于能夠捕捉到隊列效應(yīng)國家或地區(qū)的數(shù)據(jù);
也可以采用貝葉斯技術(shù),該技術(shù)可以提供合理的框架來同時處理死亡率結(jié)構(gòu)和時間序列過程。
參考文獻:
[1]LI N,LEE R.Coherent mortality forecasts for a group of populations: an extension of the Lee-carter method[J]. Demography, 2005,42(3):575-594.
[2]LEE R D, CARTER L R. Modeling and forecasting U.S. mortality[J]. Journal of the American Statistical Association, 1992,87(419): 659-671.
[3]RENSHAW A E, HABERMAN S. A cohort-based extension to the Lee-carter model for mortality reduction factors[J]. Insurance: Mathematics and Economics, 2006, 38(3):556-570.
[4]CURRIE I D. Smoothing and forecasting mortality rates with p-splines[R]. Institute of Actuaries, 2006.
[5]CAIRNS A J G, BLAKE D, DOWD K. A two-factor model for stochastic mortality with parameter uncertainty: theory and calibration[J]. Journal of Risk and Insurance,2006,73(4): 687-718.
[6]CAIRNS A J G, BLAKE D, DOWD K et.al. A quantitative comparison of stochastic mortality models using data from England & Wales and the United States[J]. North American Actuarial Journal,2009,13(1):1-35.
[7]LI J.A poisson common factor model for projecting mortality and life expectancy jointly for females and males[J]. Population Studies,2013,67(1):111-126.
[8]LI J, TICKLE L, PARR N.A multi-population evaluation of the poisson common factor model for projecting mortality jointly for both sexes[J]. Journal of Population Research,2016, 33(4):333-360.
[9]CHEN R Y, MILLOSSOVICH P. Sex-specific mortality forecasting for UK countries:a coherent approach[J]. Eur.Actuar.J,2018,8(1):69-95.
[10]LI J, LIU J. A Logistic two-population mortality projection model for modelling mortality at advanced ages for both sexes[J]. Scandinavian Actuarial Journal, 2019(2):97-112.
[11]柳向東,范洋洋. 基于均衡關(guān)系的中國人口死亡率預(yù)測模型[J].統(tǒng)計與信息論壇,2016(10):3-9.
[12]段白鴿.我國全年齡段人口平均預(yù)期壽命的動態(tài)演變[J].人口與經(jīng)濟,2015(1):49-63.
[責(zé)任編輯 劉愛華]