摘 要:以經(jīng)典的LeeCarter死亡率模型為工具,采用中國1994—2019年死亡數(shù)據(jù),構建LeeCarter死亡率模型,研究中國人口平均預期壽命預測問題。研究表明:雖然中國死亡數(shù)據(jù)資源越來越豐富,但不同來源數(shù)據(jù)質量差距和沖突依然比較明顯。隨著死亡水平的下降,1994年以來1‰人口變動抽樣調(diào)查死亡數(shù)據(jù)面臨的質量問題比較突出。從LeeCarter死亡率模型擬合效果來看,模型擬合年齡別死亡率平均相對誤差較小的年齡組為40—84歲,0歲組擬合效果較差,而0歲人口死亡率的數(shù)據(jù)質量在模型擬合、平均預期壽命推算和預測過程中非常重要。由于年齡別死亡率數(shù)據(jù)誤差相抵的原因,對出生人口平均預期壽命的推算誤差明顯下降。在平均預期壽命研究結果的應用過程中,對不同年齡人口平均預期壽命的相對誤差和絕對誤差需要區(qū)別對待??紤]到中國歷史數(shù)據(jù)的質量問題,在建模過程中需要防止模型對基礎數(shù)據(jù)的過度擬合問題。由于死亡人口重報,特別是多報的可能性很小,現(xiàn)有數(shù)據(jù)和模型對人口平均預期壽命的估計或預測肯定是一個高估。
關鍵詞:LeeCarter模型;平均預期壽命;死亡率;數(shù)據(jù)質量
中圖分類號:C921 ? 文獻標識碼:A ? 文章編號:1000-4149(2021)06-0022-18
DOI:10.3969/j.issn.1000-4149.2021.00.046
Abstract: By means of the classical LeeCarter mortality model and Chinese mortality data from 1994 to 2019, this paper constructs the LeeCarter mortality model to study the prediction of Chinese life expectancy at birth. The research shows that although Chinese mortality data sources are get rich step by step, the gap and conflict of data quality from different sources are still obvious. With the decline of mortality level, the quality problem of mortality data in 1‰ population change sampling survey since 1994 is more prominent. From the fitting effect of Lee-Carter mortality model, the age group with small average relative error in fitting agespecific mortality is 40-84 years old, and the fitting effect of 0-yearold group is poor. The data quality of 0-yearold population mortality is very important in the process of model fitting, calculation and prediction of life expectancy at birth. Due to the error offset of agespecific mortality data, the estimation error of life expectancy at birth decreased significantly. In the application of the research results of life expectancy at birth, the relative error and absolute error of life expectancy at birth of population for different ages need to be treated differently. Considering the quality of Chinese historical data, it is necessary to prevent the model from over fitting in the modeling process. Since there is little possibility of rereporting, especially over reporting, the existing data and models must overestimate or over prediction the life expectancy at birth.
Keywords:LeeCarter model;life expectancy;mortality;data quality
一、研究背景
平均預期壽命不僅是人口科學研究的重要指標,同時也是很多相關科學研究關注的重要內(nèi)容。平均預期壽命之所以重要,是因為一方面平均預期壽命是健康水平的重要測量指標,另一方面平均預期壽命也是社會發(fā)展和科技進步的標志。在人類社會進步的歷史長河中,對壽命的關注遠遠超出許多其他事物。1662年從格蘭特(Graunt)提出生命表開始[1],平均預期壽命的基本概念和測量體系逐步成為人口科學、社會保障、衛(wèi)生健康等許多基礎研究的重要分析工具。長期以來,平均預期壽命不僅是聯(lián)合國開發(fā)計劃署人類發(fā)展指數(shù)(HDI)構建的三大重要基礎變量之一,同時也是中國國民經(jīng)濟和社會發(fā)展規(guī)劃的重要指標。
2016年10月,中共中央、國務院印發(fā)了《“健康中國2030”規(guī)劃綱要》。2017年10月,十九大報告中指出實施健康中國戰(zhàn)略。2019年11月,中共中央、國務院印發(fā)了《國家積極應對人口老齡化中長期規(guī)劃》,2020年10月,《中國共產(chǎn)黨第十九屆中央委員會第五次全體會議公報》提出實施積極應對人口老齡化國家戰(zhàn)略。無論是健康中國戰(zhàn)略還是積極應對人口老齡化國家戰(zhàn)略都離不開對未來健康水平的監(jiān)測評估,而平均預期壽命正是連接和判斷兩大國家戰(zhàn)略進展情況的重要統(tǒng)計指標和分析工具。
除了國家重大發(fā)展戰(zhàn)略外,隨著社會經(jīng)濟的發(fā)展和數(shù)據(jù)采集能力的提高,國民經(jīng)濟和社會發(fā)展規(guī)劃對平均預期壽命予以高度重視。早在“十二五”規(guī)劃中,人均預期壽命出生人口平均預期壽命或平均預期壽命在各項規(guī)劃中均簡化為人均預期壽命。就被列為重要的規(guī)劃目標。“十二五”期間人均預期壽命規(guī)劃目標是到2015年人均預期壽命達到74.5歲,但2015年實際人均預期壽命為76.34歲數(shù)據(jù)來源:《中華人民共和國國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃綱要》,簡稱“十三五”規(guī)劃綱要。,遠遠超過規(guī)劃目標的要求?!笆濉币?guī)劃人均預期壽命則列為預期性指標,并沒有明確提出預期目標的具體大小數(shù)據(jù)來源:《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》,簡稱“十四五”規(guī)劃綱要。綱要顯示,2019年數(shù)據(jù)實際情況為77.3歲。。“十四五”規(guī)劃中人均預期壽命也被列為預期性指標,對2025年的目標沒有提出具體的規(guī)劃要求。雖然對平均預期壽命不斷增長的目標和方向不變,但具體到未來社會經(jīng)濟發(fā)展能夠使得平均預期壽命有多大的變化,卻是一個非常困難的研究問題,特別是不同區(qū)域或省際之間如何設定規(guī)劃目標困難重重:目標太低,很快實現(xiàn)了,目標太高,又無法判斷是否確實難以達到,很難確認是預測出現(xiàn)很大偏差還是基礎數(shù)據(jù)問題引起的誤判。平均預期壽命規(guī)劃目標難以確定一方面是對平均預期壽命的狀況水平測量結果有很大爭議,嬰兒死亡率數(shù)據(jù)質量問題突出[2-3],特別是在人口規(guī)模較少或調(diào)查樣本較小的情況下,死亡數(shù)據(jù)可能偏差很大;另一方面是對平均預期壽命預測結果的可靠性存在疑問,直接通過時間序列數(shù)據(jù)對平均預期壽命進行模型外推,還是通過預測年齡別死亡率結果再推算平均預期壽命[4-5]?因此,科學測量和準確預測平均預期壽命的基本狀況和變化趨勢,不僅具有重要的科學研究價值,同時也具有非常重要的現(xiàn)實意義。
二、文獻綜述
平均預期壽命是人口分析的關鍵指標之一,是人口預測模型的基礎。對平均預期壽命的預測關系到人口預測模型的質量。平均預期壽命參數(shù)估計方法與普通預測既有相同的一面,又有不同的一面。相同之處在于可以采用歷史數(shù)據(jù)建立回歸模型,然后進行趨勢外推。不同之處在于不同人口所處的發(fā)展階段不同,可以通過已有其他人口作為重要的基礎數(shù)據(jù),進行回歸建模,然后進行參數(shù)預測,比如模型生命表方法就屬于這類應用,這個做法通常是解決現(xiàn)有人口基礎數(shù)據(jù)質量不高或時間序列數(shù)據(jù)相對較少的問題。
平均預期壽命預測包括兩部分研究工作,第一部分是對年齡別死亡率的預測,第二部分是根據(jù)預測的年齡別死亡率建立相應的生命表,從而得到平均預期壽命的預測結果。平均預期壽命的預測首先需要解決年齡別死亡率的預測問題。對年齡別死亡率的預測通常采用LeeCarter 模型[6]。LeeCarter 模型是該領域研究最典型的方法,對死亡率隨機預測研究影響巨大,世界各國的相關應用和方法改進文獻不計其數(shù)[7-11]。
回顧中國預期壽命研究的歷史,基礎數(shù)據(jù)收集主要是人口普查、1%人口抽樣調(diào)查和年度1‰人口變動抽樣調(diào)查,基礎數(shù)據(jù)質量和數(shù)量都受到很大限制,因此多數(shù)應用是根據(jù)模型生命表進行經(jīng)驗估計。2000年以來,特別是2010年以來,對年齡別死亡率的預測研究隨著基礎數(shù)據(jù)的不斷豐富而開始有很多文獻[12]。然而,對于平均預期壽命的預測主要是采用LeeCater模型,多數(shù)研究也僅限于對中國年齡別死亡率預測方法方面的基礎應用研究。有學者研究認為,在我國死亡率數(shù)據(jù)較少的背景下,以LeeCater模型為框架的隨機死亡率預測模型效果欠佳[13],但對預測效果欠佳的具體情況和面臨的問題并沒有非常詳盡的文獻描述。與此同時,有些研究也是采用了LeeCater模型為框架的隨機死亡率預測模型,而且采用的數(shù)據(jù)也很少,僅僅是1992—2002年(不含1995年),研究認為LeeCater模型對中國死亡率數(shù)據(jù)具有很好的擬合效果[14],兩類研究之間的矛盾確實令人匪夷所思。此外,還有一些研究提出有限數(shù)據(jù)死亡率的建模方法和中國的具體應用[15-16]。隨著死亡率數(shù)據(jù)的增加,預測模型效果是否有所改善,效果如何,都需要認真研究和深入探討。此外,LeeCater模型在中國具體應用過程中,很少涉及對不同年齡預期壽命預測結果的進一步討論或預測結果的實證檢驗。
有研究認為,利用人口統(tǒng)計數(shù)據(jù)建立LeeCater死亡率模型對于預測誤差的控制通常采用簡單外推方法,存在系統(tǒng)的低估偏差[17]。即使是對死亡率隨時間變化的速度(kt)分布進行區(qū)間估計的方法,由于基礎模型在很大程度上決定了模型誤差的大小,因此,需要進一步改進模型。特別是在應用過程中,反而忽略了基礎數(shù)據(jù)本身對預測偏差的影響。2019年有學者提出通過對基礎數(shù)據(jù)進行平滑的方法來控制數(shù)據(jù)的偏差[18]??傊嵘A測結果的科學性、可靠性的主要方法無非是改善輸入數(shù)據(jù)的質量和改進預測方法,解決問題的途徑通常是從理論和實踐兩個方面進行努力。
三、LeeCarter 模型與簡略生命表算法
雖然目前國內(nèi)有很多學者采用中國或國外數(shù)據(jù)對LeeCarter模型進行了一些相關應用研究,但絕大多數(shù)研究采用國外學者編制的R語言程序,并沒有對算法的實際計算過程和所有細節(jié)進行重復演算或驗證,包括對LeeCarter模型1992年出現(xiàn)的經(jīng)典文獻[6]也沒有進行仔細的重復檢驗,同時,在研究過程中,還存在為了模型擬合“效果”舍棄重要可獲得數(shù)據(jù)的現(xiàn)象。
本文采用Python語言對相關研究進行重復檢驗,并對計算過程的細節(jié)進行盡可能完整的描述,目的是在檢驗LeeCarter模型的同時,補充一些文獻對關鍵算法語焉不詳或訂正相關研究可能存在的缺陷或錯誤,也有利于研究者對本研究進行重復檢驗。
1. LeeCarter模型算法
LeeCarter 模型參數(shù)估計主要是采用經(jīng)典的SVD分解方法、加權最小二乘方法和極大似然估計方法。在只有年齡別死亡率時間序列數(shù)據(jù)的情況下,也可以使用最小二乘方法進行參數(shù)估計。
2. 簡略生命表算法
生命表是平均預期壽命估計的標準化方法。由于采用的基礎數(shù)據(jù)不同,生命表可以分為簡略生命表和完全生命表兩種。完全生命表是單歲年齡分組為基礎數(shù)據(jù),而簡略生命表則主要是采用5歲年齡分組的數(shù)據(jù)。由于受數(shù)據(jù)質量的限制,本項研究采用簡略生命表進行預期壽命的估計,具體算法見筆者2009年的研究[20]。
總之,采用LeeCarter模型進行平均預期壽命預測需要完成四個步驟:第一步,通過歷史數(shù)據(jù)對αx、βx和kt進行參數(shù)估計;第二步,對kt進行預測,預測的方法可以采用時間序列回歸或自回歸模型;第三步,對年齡別死亡率進行預測,使用αx、βx和預測的kt對nmx, t進行預測;第四步,通過預測nmx, t得到平均預期壽命預測結果。
四、數(shù)據(jù)來源與面臨的問題
中國歷史上雖然有悠久的人口登記傳統(tǒng),但規(guī)范的現(xiàn)代人口基礎數(shù)據(jù)收集還是從1949年以來才開始的。從死亡率變動模型研究的角度看,可供使用的中國人口死亡數(shù)據(jù)還是存在以下幾個方面的問題。
第一,死亡數(shù)據(jù)比較缺乏。雖然自1953年第一次全國人口普查以來,我國經(jīng)歷了多次人口普查、1%人口抽樣調(diào)查和年度1‰人口變動抽樣調(diào)查,但與其他數(shù)據(jù)相比,死亡方面的數(shù)據(jù)還是比較缺乏的。比如,1982年以前的人口普查沒有收集死亡數(shù)據(jù)。1982年人口普查才開始系統(tǒng)收集年齡別人口死亡數(shù)據(jù),而1982年人口普查死亡數(shù)據(jù)與年齡結構時點數(shù)據(jù)還存在半年的差距,即收集了1981年的死亡人口情況,在數(shù)據(jù)的使用過程中面臨很多困難需要解決。1986年我國開始公布年齡結構及其年齡別死亡人口數(shù),從時間序列以及對于研究年齡別死亡率變動規(guī)律來說,目前收集的死亡人口數(shù)據(jù)還是比較缺乏的。特別是,由于時間序列模型是對不規(guī)則因素進行分析,所以樣本點不能過少,至少應該在30個以上[19],我國的人口死亡數(shù)據(jù)還不能滿足這一點。
第二,公布數(shù)據(jù)標準化程度不高。比如1986年及以后公布的死亡人口數(shù)據(jù),有些年份公布的年齡組截至100歲及以上(100+),有些年份的年齡組截至85歲及以上(85+),還有些年份的年齡組截至90歲及以上(90+)。且不論數(shù)據(jù)質量如何,在數(shù)據(jù)使用過程中,仍然面臨時間序列數(shù)據(jù)缺失或完整性問題。
第三,單歲年齡組數(shù)據(jù)缺失問題越來越突出。由于年度人口變動抽樣調(diào)查的抽樣比在1‰左右,而死亡是一個小概率事件,特別是死亡率較低或人口數(shù)據(jù)較少的個別單歲年齡組,經(jīng)常會出現(xiàn)抽樣死亡人口數(shù)為0的情況,隨著年齡別死亡率的下降,這個問題會越來越突出。
第四,數(shù)據(jù)質量問題不同程度地存在。對中國嬰兒死亡率數(shù)據(jù)質量問題和漏報問題的研究由來已久。國家衛(wèi)生統(tǒng)計系統(tǒng)公布的嬰兒死亡率一直高于國家統(tǒng)計局人口普查或抽樣調(diào)查公布的數(shù)據(jù),而且兩者的差距不斷擴大,比如,國家統(tǒng)計局人口抽樣調(diào)查公布的1994年嬰兒死亡率為38.79‰,而《中國衛(wèi)生統(tǒng)計年鑒》公布的嬰兒死亡率為39.9‰,兩者相差1‰左右,相對誤差不到3%。國家統(tǒng)計局人口普查公布的2000年嬰兒死亡率為26.90‰對第五次人口普查死亡數(shù)據(jù)修正后重新計算,修正后2000年嬰兒死亡率為28.41‰,見《人口和計劃生育常用數(shù)據(jù)手冊(2018)》。,而《中國衛(wèi)生統(tǒng)計年鑒》公布的2000年嬰兒死亡率為32.2‰,兩者的差距擴大到5‰以上,相對誤差近20%。國家統(tǒng)計局人口普查公布的2010年嬰兒死亡率為3.82‰,《中國衛(wèi)生統(tǒng)計年鑒》公布的2010年嬰兒死亡率為13.1‰,兩者的差距達到3.43倍??梢?,隨著嬰兒死亡率的下降,國家統(tǒng)計局人口普查數(shù)據(jù)與國家衛(wèi)生統(tǒng)計系統(tǒng)公布數(shù)據(jù)之間的差距越來越大,這必然影響到對模型估計可靠性的判斷。因此,采用國家統(tǒng)計局人口普查或抽樣調(diào)查公布的年齡別死亡數(shù)據(jù)進行模型擬合時,需要特別注意對預期壽命高估和模型過度擬合所帶來的更大誤差或錯誤風險。
由于受數(shù)據(jù)的連續(xù)性和可獲得性的限制,本項研究采用1994—2019年全國人口普查、1%人口抽樣調(diào)查和年度1‰人口變動抽樣調(diào)查數(shù)據(jù)。其中,1996年的數(shù)據(jù)為0—85+,為了與多數(shù)年份人口變動抽樣調(diào)查數(shù)據(jù)年齡組一致,即0—90+,將人口普查、1%人口抽樣調(diào)查90歲及以上人口數(shù)據(jù)合并,同時,對1996年85—89歲和90歲及以上數(shù)據(jù)進行估計。為了避免單歲年齡組數(shù)據(jù)缺失或數(shù)據(jù)不穩(wěn)定問題,采用5歲組數(shù)據(jù)。此外,對0—4歲年齡組進一步細分為0歲和1—4歲兩個年齡組,對90歲及以上進行合并。
五、中國人口平均預期壽命預測
采用LeeCarter模型進行中國平均預期壽命預測的關鍵是通過時間序列歷史數(shù)據(jù)對參數(shù)αx、βx和kt進行估計,特別是對kt的估計和預測。下面將通過實際數(shù)據(jù)對模型的估計結果進行檢驗,并以此為基礎,對中國人口平均預期壽命預測結果進行分析。
1. LeeCarter模型參數(shù)估計
首先看αx的估計結果。由于年齡別死亡率的性別差異很大,因此,αx性別差異明顯。從0歲、1—4歲年齡組開始,αx的性別差異逐漸增大,到35—39歲達到最大,隨后逐漸減小。從80歲開始,兩者的差距明顯縮小。另外,采用極大似然估計方法對αx進行重新估計,但估計結果與SVD方法估計的結果差別不大(見圖1)。
其次看βx的估計結果。從不同方法對βx的估計來看,經(jīng)典的LeeCarter模型SVD分解得到的βx與極大似然估計或加權最小二乘法之間還是存在明顯差別的。差別主要是表現(xiàn)在三個方面:第一方面差別是男女之間女性差別更大一些;第二方面差別主要表現(xiàn)在0歲、10—34歲;第三方面是SVD方法0歲βx明顯比其他兩種方法低,而10—34歲比其他兩種方法高(見圖2)。
總之,由于不同方法估計的αx的差距相對較小,而不同方法估計的βx和kt差距相對較大,其含義是在LeeCarter模型參數(shù)估計過程中,βx和kt作為模型參數(shù)是模型構建的關鍵,也是基礎模型差別的重要原因。也就是說,死亡率隨時間變化的時期因子kt和年齡因子βx估計對模型產(chǎn)生重要的影響。
2. 預測可靠性的歷史數(shù)據(jù)檢驗
為了檢驗中國人口平均預期壽命預測方法的可靠性,根據(jù)1994—2015年調(diào)查數(shù)據(jù)建立預測模型,然后,根據(jù)模型預測2016—2019年中國人口平均預期壽命,再將預測結果與實際調(diào)查數(shù)計算的平均預期壽命進行比較,這個比較的前提是假定國家統(tǒng)計局基礎調(diào)查數(shù)據(jù)反映的趨勢和模式可靠。
(1)回歸模型。LeeCarter模型用于年齡別死亡率預測主要是估計kt,本項研究采用經(jīng)典的LeeCarter模型對αx、βx和kt進行估計,通過一元線性回歸方法建立時間與kt的相互關系,回歸模型參數(shù)見表1。從表1可以看到,1994—2015年中國人口無論男性還是女性,歷史數(shù)據(jù)kt與時間高度相關。男性和女性的相關系數(shù)都在92%以上,男性相關系數(shù)為92.4%,女性為94.2%??梢?,女性的相關系數(shù)更高一些。從自變量回歸系數(shù)來看,女性kt隨時間下降的速度為-1.0424,比男性的-0.7497更快一些,也就是說,現(xiàn)有歷史數(shù)據(jù)中女性年齡別死亡率的時期敏感性比男性更高一些,即在人口平均預期壽命的提高過程中,女性更快一些。
(2)歷史數(shù)據(jù)擬合。為了充分看到模型對歷史數(shù)據(jù)的擬合效果,下面從年齡別死亡率和人口平均預期壽命兩個方面來進行分析。
首先來看死亡率的擬合。從總體上看,對于不同的年份,無論男性還是女性,年齡別死亡率擬合數(shù)據(jù)與實際調(diào)查數(shù)據(jù)的年齡別變化趨勢還是非常一致的(見圖4)。
從時期的角度看,除了人口普查和1%人口抽樣調(diào)查的相對誤差較小外,1994—2015年隨著死亡水平的降低,各年齡組年齡別死亡率相對誤差有明顯的增加趨勢(見表2)。1994年各年齡組年齡別死亡率平均相對誤差男性為10.63%,女性為18.42%,到2015年分別上升到17.73%和18.31%。各年齡組年齡別死亡率平均相對誤差時期變化的明顯特征是,在波動上升的過程中,人口普查年份各年齡組年齡別死亡率平均相對誤差相對較低,比如2000年男性為5.13%,女性為8.80%,2010年男性為7.43%,女性為7.84%,明顯低于1%人口抽樣調(diào)查年份各年齡組年齡別死亡率平均相對誤差,比如1995年男性為6.03%,女性為7.89%,2005年男性為10.11%,女性為4.30%。同樣,人口普查和1%人口抽樣調(diào)查年份的各年齡組年齡別死亡率平均相對誤差明顯低于1‰人口變動抽樣調(diào)查(見表2)。
從隊列的角度看,不同時期各隊列死亡率平均相對誤差較小的年齡組為40—84歲,男性和女性各隊列死亡率平均相對誤差在11%以內(nèi),擬合比較差的是0歲組(見表3),男性0歲組平均相對誤差超過20%,女性0歲組平均相對誤差超過30%。1994—2015年0歲人口死亡率表現(xiàn)出明顯的大起大落(見圖5)。1994—2015年中,有9年的0歲死亡率比上一年的水平上升,其中,1997年、2006年、2008年和2011年發(fā)生了0歲人口死亡率非常明顯的上升,2008年上升或許和汶川地震有關,但其他年份難以解釋。此外,從男性和女性各年齡組的擬合數(shù)據(jù)來看,女性擬合效果比男性差一些,原因是女性的死亡率比較低,測量的相對誤差更大一些。
不同年齡的死亡率不同,而從年齡別死亡率與平均預期壽命之間的關系來看,低年齡組年齡別死亡率對出生人口平均預期壽命的影響更大,其他年齡組只影響平均預期壽命的余壽。雖然在年齡別死亡率變化過程中,0歲人口的死亡率遠遠低于老年人口,但0歲人口死亡率的變動將會影響到其他各個年齡的平均預期壽命。0歲人口死亡率的大起大落必然引起出生人口平均預期壽命的明顯波動。因此,0歲人口死亡率的數(shù)據(jù)質量和模型擬合在平均預期壽命推算和預測過程中非常重要。
其次來比較人口平均預期壽命的差別。出生人口平均預期壽命是預期壽命最重要的指標,需要進行細致的分析。如圖6所示,無論男性還是女性,雖然兩者的出生人口平均預期壽命有一定的差距,但模型推算預期壽命與實際調(diào)查預期壽命的相對誤差都在2.05%以內(nèi),有一半以上的年份在1.0%以內(nèi),絕大多數(shù)年份在1.5%以內(nèi),相對誤差較大的年份為1995、2000、2006、2014和2015年。男性出生人口平均預期壽命的平均相對誤差為0.7184歲,女性出生人口平均預期壽命的平均相對誤差為0.7282歲。從出生人口平均預期壽命的變化趨勢來看,隨著時間的變化,個別年份平均預期壽命大幅度上升(如2001、2006、2009、2015年)或下降(如1997、2008、2010年),尤其是大幅度下降與平均預期壽命的變化規(guī)律相違背。根據(jù)世界各國平均預期壽命變化的歷史數(shù)據(jù),在沒有戰(zhàn)爭、大范圍自然災害、瘟疫或饑餓情況下,平均預期壽命大幅度下降是不太可能的。同樣,沒有顯著的疾病防治水平突破性進展或營養(yǎng)健康水平的大幅度改善,平均預期壽命大幅度提升也是不太可能的,這反映了基礎數(shù)據(jù)在模型建立過程中的問題或缺陷。
為了反映模型擬合情況,可以從時期和隊列兩個方面進行觀察:從時期(各年度)的角度觀察模型擬合各隊列(年齡組)平均預期壽命的平均相對誤差的大小,從隊列(各年齡組)的角度可以觀察各時期(年度)平均相對誤差的大小。
從時期的角度看,除了人口普查和1%人口抽樣調(diào)查的相對誤差較小外,1994—2015年隨著預期壽命的提高,各年齡組平均預期壽命的相對誤差有明顯不斷增加的趨勢(見表2)。1994年各年齡組平均預期壽命的平均相對誤差男性為0.6%,女性為1.31%,到2015年分別上升到5.18%和5.05%,其中2006年的平均相對誤差最大,男性為9.05%,女性為7.23%。誤差在波動上升的過程中,1%人口抽樣調(diào)查和人口普查年份各年齡組平均預期壽命的平均相對誤差相對較低,比如2005年男性為0.87%,女性為0.42%,2010年男性為1.53%,女性為2.37%等等。
從隊列的角度看,0歲人口平均預期壽命的平均相對誤差最小,男性為0.97%,女性為0.94%,隨著年齡的增加,無論男性還是女性平均預期壽命的平均相對誤差不斷增大,到90歲及以上分別增加到13.80%和11.36%(見表3)。增加的原因在于在平均預期壽命生命表中T (x)是剩余存活人年數(shù),由于0歲人口平均預期壽命是各隊列死亡概率或存活人年數(shù)累計結果的反映,因此,由于各隊列誤差相抵的原因,累計的誤差相對較小。根據(jù)這個特性,在平均預期壽命預測結果的使用過程中需要注意的是,雖然隨著年齡增加,平均預期壽命在不斷下降,預測的絕對誤差可能保持不變或不斷減小,但相對誤差逐漸增大的特征和性質不變。
(3)模型預測與實際調(diào)查對比。歷史上數(shù)據(jù)建模以及對模型檢驗的目的是檢驗LeeCarter模型對中國人口死亡率歷史數(shù)據(jù)擬合的可靠性和存在的問題。為了進一步檢驗LeeCarter模型在中國人口平均預期壽命預測中的可靠性,可以根據(jù)歷史數(shù)據(jù)建立的模型進行預測,并與實際數(shù)據(jù)結果進行比較。
首先來看年齡別死亡率預測的情況。男性年齡別死亡率模型預測值比實際調(diào)查年齡別死亡率高的年齡組主要是1—40歲,0歲人口的預測值明顯低于調(diào)查值(見圖7),2016年預測數(shù)據(jù)的差距最明顯,其他年份的數(shù)據(jù)相對好一些。女性與男性不同,2016年和2018年15—19歲和2019年5—9歲年齡組出現(xiàn)了明顯調(diào)查異常值。由此可見,隨著死亡水平的下降,1‰人口變動抽樣調(diào)查年齡別死亡率數(shù)據(jù)將越來越多地面臨這個測量問題。
其次來檢驗人口平均預期壽命。根據(jù)1994—2015年數(shù)據(jù)建立回歸模型,對2016—2019年中國人口平均預期壽命進行預測,預測結果見表4。從表4可以看到,通過回歸模型計算年齡別死亡率然后建立簡略生命表,得到的平均預期壽命預測值與實際調(diào)查值計算的平均預期壽命的相對誤差在2.1%以內(nèi),總體上,男性的相對誤差比女性大一些。特別需要指出的是2018年和2019年實際調(diào)查值計算的平均預期壽命低于預測值,而且處于連續(xù)下降趨勢,男性2019年平均預期壽命實際調(diào)查計算結果比2017年低1.77歲,女性低1.56歲,這個大幅度下降與通常的預期壽命變動規(guī)律是相矛盾的。
總之,雖然不同年齡死亡率預測結果與調(diào)查值之間存在的差距不同,而且40歲人口的波動比較大。由于誤差相抵的原因,出生人口的平均預期壽命與實際調(diào)查推算值之間存在誤差,但誤差的范圍在2%以內(nèi)。模型預測與調(diào)查值之間的差別一方面反映了模型擬合需要改進的問題,另一方面也說明數(shù)據(jù)質量本身面臨的困難和導致的問題。如果調(diào)查數(shù)據(jù)精度很高,那么,不太可能出現(xiàn)平均預期壽命的大幅度下降或上升,也不太可能發(fā)生嬰兒死亡率的大幅度上升,考慮到與國家衛(wèi)生統(tǒng)計系統(tǒng)嬰兒死亡率的一致性,因此,在基礎數(shù)據(jù)和模型應用過程中,需要對基礎數(shù)據(jù)和模型的偏差方向有一個基本的判斷和正確的理解。
3. 未來預期壽命預測
根據(jù)1994—2015年基礎數(shù)據(jù)和LeeCater模型參數(shù)估計,對未來中國人口的年齡別死亡率進行預測,然后得到不同年齡的平均預期壽命。在生命表構建的指標中,出生人口平均預期壽命、老年人口平均預期壽命以及高齡老人平均預期壽命是非常重要的指標。關于老年人口的界定,考慮到中國法定退休年齡,提供60歲和65歲兩個統(tǒng)計口徑。雖然預測模型可以提供平均預期壽命的95%置信區(qū)間,但考慮到死亡人口漏報對死亡率低估以及國家統(tǒng)計局調(diào)查數(shù)據(jù)的偏差問題,實際平均預期壽命預測結果高估的可能性很大。為了避免系統(tǒng)性高估,本項研究認為平均預期壽命預測結果在預測值的下限和均值之間的可能性更大。下面將分別對男性和女性平均預期壽命的預測結果進行分析。
(1)男性平均預期壽命。首先,從男性出生人口平均預期壽命的預測下限來看,2020年預測的下限為76.35歲,預計到2030年提高到79.11歲,10年提高2.76歲,平均每年提高0.28歲。60歲男性人口平均預期壽命從2020年的20.72歲提高到2030年的22.63歲,提高1.91歲。80歲男性人口平均預期壽命從2020年的8.01歲提高到2030年9.11歲,提高1.1歲。從平均預期壽命的構成和變化來看,2020年男性60歲平均預期壽命占出生人口平均預期壽命的27.28%,2030年提升到28.61%;80歲平均預期壽命占出生人口平均預期壽命的10.58%,2030年提升到11.52%;由此可見,男性60歲平均預期壽命提高的幅度占出生人口平均預期壽命提升比例的69.20%,而且平均預期壽命的提高主要是60歲及以上人口提升更加迅速形成的(見表5)。
其次,從男性出生人口平均預期壽命的預測均值來看,2020年預測的均值為78.89歲,到2030年提高到82.01歲,提高3.12歲,平均每年提高0.31歲;60歲男性人口平均預期壽命從2020年的22.47歲提高到2030年的24.87歲,提高2.4歲;80歲男性人口平均預期壽命從2020年的8.87歲提高到2030年10.47歲,提高1.46歲。同樣,從平均預期壽命構成的比例及其變化來看,2020年男性60歲平均預期壽命占出生人口平均預期壽命的28.48%,2030年提升到30.33%;80歲平均預期壽命占出生人口平均預期壽命的11.42%,2030年提升到12.77%;盡管男性人口預測均值相對于下限來說變化的幅度相對大一些,但兩者的結構變動特征不變。
再次,從均值與下限差距來看,2020年預測的均值與下限相差2.54歲,到2030年擴大至2.9歲。從平均預期壽命歷史變化的平均速度來看,預測的下限與均值兩者的差距相當于平均預期壽命增長需要8—9年的時間。
(2)女性平均預期壽命。女性和男性平均預期壽命的最大差別是女性出生人口平均預期壽命明顯高于男性。增長速度通常也是女性快于男性,其結果是隨著預期壽命的提升,兩者的差距擴大。
首先,從女性出生人口平均預期壽命的預測下限來看,2020年預測的下限為81.87歲,預計到2030年提高到84.74歲,比2020年提高2.87歲,平均每年提高0.29歲。60歲女性人口平均預期壽命從2020年的24.30歲提高到2030年的26.39歲,10年間提高2.09歲。80歲女性人口平均預期壽命從2020年的9.70歲提高到2030年的11.00歲,提高1.3歲。與男性相比,女性提高的幅度更大一些,出生人口平均預期壽命下限的差距從2020年的5.52年提高到2030年的5.63年。從平均預期壽命構成的比例來看,2020年女性60歲平均預期壽命占出生人口平均預期壽命的29.68%,2030年提升到30.99%;80歲平均預期壽命占出生人口平均預期壽命的11.85%,2030年提升到12.86%。從提高的幅度來看,女性人口60歲平均預期壽命提升幅度占出生人口平均預期壽命提升幅度的72.82%(見表6)。
其次,從女性出生人口平均預期壽命的預測均值來看,2020年預測的均值為84.1歲,到2030年提高到87.25歲,提高3.15歲,平均每年提高0.32歲;60歲女性人口平均預期壽命從2020年的25.89歲提高到2030年的28.45歲,10年間提高2.56歲;80歲女性人口平均預期壽命從2020年的10.68歲提高到2030年的12.41歲,提高1.73歲。同樣,從平均預期壽命構成的比例和變化來看,2020年女性60歲平均預期壽命占出生人口平均預期壽命的30.78%,2030年提升到32.61%;80歲平均預期壽命占出生人口平均預期壽命的12.84%,2030年提升到14.23%;與男性類似,預測下限相對于均值來說變化的幅度相對小一些,但女性兩者的結構變動特征不變。而且,平均預期壽命的提高主要是60歲及以上人口提升更加迅速形成的。
再次,從均值與下限差距來看,2020年預測的均值與下限相差2.23歲,到2030年擴大至2.51歲。從女性平均預期壽命變化的歷史速度來看,兩者的差距相當于7—8年的增長幅度,與男性相比女性稍快一些。
總之,死亡人口的數(shù)據(jù)質量問題是影響未來人口平均預期壽命預測的基礎性因素,與其他數(shù)據(jù)不同,死亡人口漏報的可能性遠遠大于重報,更不太可能存在利益驅動的多報。因此,目前收集到的死亡人口數(shù)低估的可能性遠遠大于高估的可能性。特別是《中國衛(wèi)生統(tǒng)計年鑒》公布的嬰兒死亡率不僅一直高于國家統(tǒng)計局人口普查和抽樣調(diào)查推算的數(shù)據(jù),而且兩者的差距無論是絕對差距還是相對差距都隨著死亡水平的下降而逐漸擴大??紤]到低齡人口死亡是一個小概率事件,因此,死亡率或死亡概率的計算對分子漏報非常敏感,且具有死亡水平越低,漏報對相對誤差影響越大的特點。因此,采用現(xiàn)有數(shù)據(jù)及其所構建的模型為基礎,對未來中國人口平均預期壽命預測結果的估計處于均值與下限之間,或更接近下限的可能性要大一些。
六、研究結論與討論
中國人口平均預期壽命預測不僅是人口科學研究的難題,同時,也是相關應用研究的難題。研究困難既涉及基礎數(shù)據(jù)的質量問題,也涉及模型實際應用的問題。通過對中國1994年以來死亡基礎數(shù)據(jù)的研究和LeeCarter死亡率模型應用,本項研究得出以下幾個基本結論。
第一,雖然中國死亡數(shù)據(jù)收集能力有了很大的改進和提升,但死亡數(shù)據(jù)質量和數(shù)據(jù)之間的沖突和矛盾依然比較明顯。國家統(tǒng)計局的時間序列數(shù)據(jù)與國家衛(wèi)生統(tǒng)計公布數(shù)據(jù)之間的差距加大。
第二,男性死亡率相對較高,但與男性的數(shù)據(jù)質量相比較,女性調(diào)查數(shù)據(jù)的相對誤差可能更大。隨著死亡水平的下降,1994年以來,現(xiàn)有1‰人口變動抽樣調(diào)查年齡別死亡率數(shù)據(jù)面臨越來越嚴重的數(shù)據(jù)質量問題。
第三,LeeCarter死亡率模型在中國年齡別死亡率中平均相對誤差較小的年齡組為40—84歲,擬合比較差的是0歲組。由于0歲人口死亡率的變動將會影響到其他各個年齡的平均預期壽命,0歲人口死亡率的大起大落必然引起出生人口平均預期壽命的明顯波動。因此,0歲人口死亡率的質量和模型擬合結果在平均預期壽命推算、預測過程中非常重要。
第四,LeeCarter死亡率模型在中國年齡別死亡率預測過程中,需要對基礎數(shù)據(jù)進行深入研究和必要的調(diào)整,模型應用的關鍵既有基礎質量的問題,也有模型構建的問題??紤]到中國歷史數(shù)據(jù)的質量問題,在沒有科學調(diào)整數(shù)據(jù)的前提下,在建模過程中需要考慮并防止模型對基礎數(shù)據(jù)的過度擬合問題。由于死亡人口重報,特別是多報的可能性很小,因此現(xiàn)有數(shù)據(jù)和模型對平均預期壽命的估計肯定是一個高估。
第五,盡管中國死亡歷史數(shù)據(jù)存在一些缺陷,但由于年齡別死亡率數(shù)據(jù)誤差相抵的原因,對出生人口平均預期壽命推算的結果誤差明顯下降。因此,在數(shù)據(jù)應用過程中,對不同年齡人口平均預期壽命的相對誤差或絕對誤差需要區(qū)別對待。
LeeCarter死亡率模型在世界各國死亡率預測中應用廣泛,在中國也有很大的基礎研究和實際應用價值。在模型的應用過程中,需要充分考慮基礎數(shù)據(jù)的來源和數(shù)據(jù)質量的差距問題,由于高齡人口年齡別人口數(shù)比較少,觀察數(shù)據(jù)的穩(wěn)定性和數(shù)據(jù)質量問題更加突出,特別是長期預測時,因為90歲及以上或100歲及以上數(shù)據(jù)缺乏或粗略,長期預測可能面臨現(xiàn)有基礎數(shù)據(jù)和模型應用的缺陷或其他問題。此外,為了解決低齡模型估計誤差和嬰兒死亡率數(shù)據(jù)質量帶來的誤差問題,進一步提高數(shù)據(jù)的穩(wěn)定性,研究時往往采用時間序列數(shù)據(jù)平滑、貝葉斯估計等方法,這些方法理論上必然會對統(tǒng)計推斷和模型應用的改進有很大的幫助,但也需要防止人為過度擬合的問題。因此,針對中國人口平均預期壽命預測面臨的問題,今后還需要更多的理論、方法和中國實證研究來加以完善。
總之,本項研究的主要目的是在中國現(xiàn)有數(shù)據(jù)條件下考察應用LeeCarter模型所面臨的問題和挑戰(zhàn),嘗試對中國人口平均預期壽命的變化趨勢和水平提供一個估計,從而形成與經(jīng)驗估計或趨勢外推結果的對照和互驗,避免在中國平均預期壽命實際變化趨勢或水平研究過程中由于研究者僅憑主觀想象或判斷而可能引起的嚴重偏差與誤判。
參考文獻:
[1]DAVID S, NATHAN K. Mathematical Demography [M]. Berlin: Springer-Verlag, 1977: 1-2.
[2]黃榮清,曾憲新.“六普”報告的嬰兒死亡率誤差和實際水平的估計[J].人口研究,2013(2):3-16.
[3]黃潤龍.1991—2014年我國嬰兒死亡率變化及其影響因素[J].人口與社會,2016(3):67-75.
[4]OEPPEN J, VAUPEL J W. Broken limits to life expectancy[J]. Science, 2002, 296(5570):1029-1031.
[5]LEE R D. Mortality forecasts and linear life expectancy trends[EB/OL].[2003-03-25].https://escholarship.org/uc/item/3sd9m7d5.
[6]LEE R D, CARTER L R. Modeling and forecasting U.S.mortality[J]. Journal of the American Statistical Association, 1992,87(419): 659-671.
[7]LAWRENCE R C. Forecasting U.S.mortality: a comparison of BoxJenkins ARIMA and structural time series models[J].The Sociological Quarterly, 1996, 37(1): 127- 144.
[8]BOOTH H. Demographic forecasting: 1980 to 2005 in review[J]. International Journal of Forecasting, 2006,22(3): 547-581.
[9]Egle· Ignataviiūte·, Rasa Mikalauskait e·-Arminien e·, Jonas iaulys.Lee-Carter mortality forecasting[J]. Lithuanian Journal of Statistics, 2012,51(1): 22-35.
[10]張秋蕓.LeeCarter模型在死亡率預測中的應用[J].統(tǒng)計學與應用,2015(3):155-161.
[11]Csar Neves, Cristiano Fernandes, Henrique Hoeltgebaum.Five different distributions for the Lee-Carter model of mortality forecasting: a comparison using GAS models[J]. Insurance: Mathematics and Economics, 2017, 75(4):48-57. [12]盧仿先,尹莎.LeeCarter方法在預測中國人口死亡率中的應用[J].保險職業(yè)學院學報,2005(6):9-11.
[13]王曉軍,趙明.中國高齡人口死亡率隨機波動趨勢分析[J].統(tǒng)計研究,2014(9):51-57.
[14]李志生,劉恒甲.LeeCarter死亡率模型的估計與應用——基于中國人口數(shù)據(jù)的分析[J].中國人口科學,2010(3):46-56.
[15]韓猛,王曉軍.LeeCarter模型在中國城市人口死亡率預測中的應用與改進[J].保險研究,2010(10):3-9.
[16]王曉軍,任文東.有限數(shù)據(jù)下LeeCarter模型在人口死亡率預測中的應用[J].統(tǒng)計研究,2012(6):87-94.
[17]吳曉坤,李姚潔.LeeCarter模型外推預測死亡率及偏差糾正[J].統(tǒng)計與決策,2016(20):19-21.
[18]CARLO G. Smooth constrained mortality forecasting[J]. Demographic Research, 2019,41(38):1091-1130.
[19]孫佳美.生命表編制理論與實驗[M].天津:南開大學出版社,2013:122-126,132.
[20]王廣州.Python人口統(tǒng)計[M].廣州:廣東高等教育出版社,2019:87-97.
[責任編輯 武 玉 ]