沙元霞
(大慶師范學院 數(shù)學科學學院,黑龍江 大慶 163712)
人口預測是指根據(jù)現(xiàn)有的人口狀況測算未來某個時間的人口規(guī)模、水平和趨勢??刂迫丝谝?guī)模是城市規(guī)劃和土地利用規(guī)劃中的一個重要指標,不但會影響到未來的經(jīng)濟發(fā)展和社會動態(tài)的發(fā)展,而且還會影響到可持續(xù)發(fā)展的生態(tài)環(huán)境[1]。 建立數(shù)學模型對人口發(fā)展過程進行描述、分析和預測,并進而研究控制人口增長和老化的生育策略,以引起社會各方面的極大關注,是數(shù)學在社會發(fā)展中的重要應用領域[2]。
本文將黑龍江省2001年至2007年人口數(shù)據(jù)作為依據(jù)(來源于“黑龍江統(tǒng)計年鑒”數(shù)據(jù)),利用統(tǒng)計回歸的方法進行建模,并對黑龍江人口進行分析和預測;最后對2012年至2016年黑龍江省的未來人口數(shù)和人口發(fā)展趨勢進行了預測。
表1數(shù)據(jù)來源于《黑龍江省統(tǒng)計年鑒——2007》,本文應用此數(shù)據(jù)構建統(tǒng)計回歸模型。
表1 2001—2007年黑龍江省人口 (單位:萬人)
為了研究這些數(shù)據(jù)中所蘊含的規(guī)律性,首先將數(shù)據(jù)用散點圖的形式表現(xiàn)出來,把各個年份作為橫坐標,將2001—2007年每年總?cè)丝跀?shù)作為縱坐標,將這些數(shù)據(jù)點標在平面直角坐標圖上,分析點的分布情況,如圖1所示。
在圖1中可以看出,數(shù)據(jù)點得分布較有規(guī)律,既可看做分布在一條直線周圍,又可看做分布在一條二次的拋物線附近。所以,為了使模型更加精確,我們將擬合出兩條線,即構造兩個回歸模型,通過對比分析的方式,選取其中誤差較小的回歸模型。
圖1 2001—2007年每年總?cè)丝跀?shù)散點圖
1)假設。假設變量x和y滿足如下關系式:y=β0+β1x+ε,其中,β0和β1是未知常數(shù);ε是隨機誤差,滿足E(ε)=0,var(ε)=σ2。
3)檢驗。一般我們采用統(tǒng)計檢驗方法檢驗,如F檢驗,如果F和y有線性關系,則
在給定顯著水平α下,上述F值應大于F分布表中的臨界值Fα。進行檢測有F=82.59849≥0.00000=F0.05(1,10),這表明x與y有十分顯著的線性相關關系,這說明時間對人口總數(shù)有顯著影響,回歸系數(shù)效果顯著。
1)假設。假設變量x和y滿足如下二元關系式:y=β0+β1x+β2x2+ε,其中,β0,β1,β2為回歸系數(shù);ε是隨機誤差。
2)擬合回歸參數(shù)。當所設回歸模型是二次時,仍可以采用最小二乘法去計算,但考慮到計算量相對于一元模型來說非常大,故采用Matlab軟件編程[2]求解。
程序如下:X=[1,1,1;1,2,4;1,3,9;1,4,16;1,5,25;1,6,36;1,7,49]
Y=[3811;3813;3815;3816.8;3820;3830.8;3848.8]
[b,bint,r,rint,stats]=regress(Y,X)
運行結果為:b=3818.3,;-6.6;1.5
bint=[3804.8,3831.8],[-14.3,1.2],[0.6,2.5]
stats=0.9638,53.2075,0.0013
3)將上述得到的回歸系數(shù)帶入所設模型中得:y=3818.3-6.6x+1.5x2+ε。
4)檢驗及分析
①模型所得相關系數(shù)的平方為0.9638,說明因變量y的96.38%可由此模型確定。
②模型的F檢驗值為53.2075,遠超過F檢驗的臨界值。
③p=0.0013遠小于α=0.05。
④回歸系數(shù)β1的置信區(qū)間包含零點,說明變量x的效果不顯著,但考慮到β2的置信區(qū)間較好,所以保留一次項。
將以上兩個模型的預測值與實際值進行比較,得2001—2007年的相對誤差率,如下表所示:
表2 模型一與模型二比較
通過表中數(shù)據(jù)我們得到:二次回歸模型平均相對誤差率為0.05%,而一次線性回歸模型的平均相對誤差率為0.76%,說明這兩種模型相比二次回歸模型能做到更好、更準確的預測。
應用二次回歸模型預測2012年至2016年黑龍江省的人口數(shù)目,如下表所示:
表3 2012—2016年黑龍江省人口的預測值 (單位:萬人)
上述數(shù)據(jù)表明未來幾年我省人口的增長有較穩(wěn)定的狀態(tài),這一結果可為政府相關部門制定政策提供參考依據(jù)。同時可以看到,按此模型隨著時間的增長,人口的增長率越來越大,說明我們的模型還存在改進的空間,可以將人口老齡化的比率等因素加進去,構造多元統(tǒng)計回歸模型[3],以達到更好的結果。
[參考文獻]
[1] 劉鑫,徐世英.基于組合預測模型的西藏人口分析[J].中央民族大學學報:自然科學版,2008(3):22-24.
[2] 楊松,曾永年,吳桂平,等.改進的最優(yōu)組合人口預測模型及其應用[J].長江流域資源與環(huán)境,2008(3):14-17.
[3] 宋洪文.應用統(tǒng)計[M].北京:高等教育出版社,2003.