郝 樂,吳 頔
(1.遼寧大學(xué) 國(guó)際關(guān)系學(xué)院,遼寧 沈陽 110036;2.沈陽大學(xué) 經(jīng)濟(jì)學(xué)院,遼寧 沈陽 110041;3.平安銀行股份有限公司 沈陽分行,遼寧 沈陽 110001)
?
線性回歸組合預(yù)測(cè)模型
——以中國(guó)人口老齡化預(yù)測(cè)為例
郝樂1,2,吳頔3
(1.遼寧大學(xué) 國(guó)際關(guān)系學(xué)院,遼寧 沈陽110036;2.沈陽大學(xué) 經(jīng)濟(jì)學(xué)院,遼寧 沈陽110041;3.平安銀行股份有限公司 沈陽分行,遼寧 沈陽110001)
摘要:利用不同時(shí)期的數(shù)據(jù)分段建立線性回歸模型,然后依照誤差最小的原則將其組合成精度更高的線性回歸組合預(yù)測(cè)模型。并以中國(guó)人口老齡化預(yù)測(cè)為例,說明了該預(yù)測(cè)模型的應(yīng)用。
關(guān)鍵詞:線性回歸;組合;預(yù)測(cè)模型;老齡化
預(yù)測(cè)模型種類很多,主要有線性回歸模型、指數(shù)模型、冪函數(shù)模型、灰色系統(tǒng)GM(1,1)模型、Logistic模型等等[1-4],各種模型都有其自身的特點(diǎn)和適用的范圍,在進(jìn)行預(yù)測(cè)之前,對(duì)于模型的選擇是很關(guān)鍵的。要構(gòu)建一個(gè)科學(xué)的預(yù)測(cè)模型并不是一件十分容易的事,因?yàn)轭A(yù)測(cè)模型是否科學(xué),一方面取決于預(yù)測(cè)結(jié)果是否準(zhǔn)確,另一方面取決于模型本身是否簡(jiǎn)單。然而,這兩方面卻是矛盾的,模型簡(jiǎn)單,預(yù)測(cè)結(jié)果就不會(huì)太準(zhǔn)確;而預(yù)測(cè)結(jié)果相對(duì)準(zhǔn)確,模型就不會(huì)太簡(jiǎn)單。線性回歸模型是最基本的一種預(yù)測(cè)模型,隨著數(shù)據(jù)信息的更新,采用信息分段建模,將幾個(gè)線性回歸模型組合后進(jìn)行預(yù)測(cè),精度會(huì)更高。
一、一元線性回歸模型
設(shè)自變量x與變量y對(duì)應(yīng)的觀測(cè)值見表1。
表1 自變量x與變量y對(duì)應(yīng)的觀測(cè)值
如果變量間存在著線性關(guān)系,則可用直線
來擬合它們之間的變化關(guān)系。由最小二乘法,a,b應(yīng)使
二、一元線性回歸組合模型
構(gòu)建預(yù)測(cè)模型時(shí),隨著時(shí)間的推移和條件的變化,不同時(shí)期的數(shù)據(jù)信息的作用是不同的,近期的數(shù)據(jù)信息顯然比遠(yuǎn)期的數(shù)據(jù)信息顯得更有價(jià)值,一元組合線性回歸模型的思想就是:逐次舍棄前面一定數(shù)量的歷史數(shù)據(jù),分別建立m個(gè)一元線性回歸模型,再將m個(gè)模型按誤差最小的原則進(jìn)行組合。構(gòu)建組合線性回歸模型的基本方法是:
(3)舍棄最前面的N2組數(shù)據(jù),對(duì)剩余的n-
?
(m)舍棄最前面的Nm-1組數(shù)據(jù),對(duì)剩余的n-Nm-1組數(shù)據(jù),作一元線性回歸模型:
所以
[k1,…,km]T令K=[k1,…,km]
則R=K·E·KT,令U=[1,…,1]T,于是問題變?yōu)樵诩s束條件K·U=1之下,求R=K·E·KT的最小值。
設(shè)F=K·E·KT+λ(KU-1)兩邊對(duì)K求導(dǎo)有
三、中國(guó)人口老齡化預(yù)測(cè)
作為線性回歸組合模型的應(yīng)用,根據(jù)國(guó)家統(tǒng)計(jì)局官方網(wǎng)站(http:∥www.stats.gov.cn/)提供的2001—2012年全國(guó)65歲以上人口的統(tǒng)計(jì)數(shù)椐見表2.表2~表8中x代表年份、y代表人口數(shù),人口數(shù)單位(萬人)。對(duì)我國(guó)未來幾年65歲以上人口的變化情況進(jìn)行預(yù)測(cè):
表2 2001—2012年全國(guó)65歲以上人口的統(tǒng)計(jì)數(shù)椐 萬人
表3 2001—2012年12組數(shù)據(jù)對(duì)應(yīng)的一元線性回歸模型所產(chǎn)生的誤差
表4 2004—2012年9組數(shù)據(jù)對(duì)應(yīng)的一元線性回歸模型所產(chǎn)生的誤差
表5 2007—2012年6組數(shù)據(jù)對(duì)應(yīng)的一元線性回歸模型所產(chǎn)生的誤差
(4)三個(gè)線性回歸模型對(duì)應(yīng)2007—2012年6組(n-(m-1)N=6)。數(shù)據(jù)擬合產(chǎn)生的誤差見表6。
表6 三個(gè)線性回歸模型對(duì)應(yīng)2007—2012年6組數(shù)據(jù)擬合產(chǎn)生的誤差
計(jì)算得:
于是得到組合線性模型:
組合回歸模型對(duì)應(yīng)2007—2012年數(shù)據(jù)產(chǎn)生的誤差見表7。
依此對(duì)我國(guó)2013—2020年65歲以上人口的預(yù)測(cè)值見表8.
表7 組合回歸模型對(duì)應(yīng)2007—2012年數(shù)據(jù)產(chǎn)生的誤差
表8 組合回歸模型對(duì)我國(guó)2013—2020年65歲以上人口的預(yù)測(cè)值
四、結(jié)語
參考文獻(xiàn):
[1] 黃明知,羅榮桂,吳兵,等.區(qū)域最優(yōu)人口規(guī)模測(cè)評(píng)模型研究[J].武漢理工大學(xué)學(xué)報(bào),2004,26(8):93-95.
[2] 周南,左玉輝,柏益堯,等.生態(tài)城市規(guī)劃中人口預(yù)測(cè)——以昆山市生態(tài)城市規(guī)劃為例[J].環(huán)境科學(xué)與技術(shù),2005,28(2):61-63.
[3] 易亮.基于MATLAB的人口預(yù)測(cè)方法分析[J].價(jià)值工程,2012,28(3):226-227.
[4] 李菲.基于兩種模型的河南省人口預(yù)測(cè)及對(duì)策研究[J].開封大學(xué)學(xué)報(bào),2012,26(1):77-80.
[5] 葉中行.概率論與數(shù)理統(tǒng)計(jì)[M].北京:北京大學(xué)出版社,2010:402-407.
【責(zé)任編輯肖景魁】
Linear Regression Combination Forecasting Model:Taking China’s Ageing Population Forecast as an Example
Hao Le1,2,Wu Di3
(1.College of International Relations,Liaoning University,Shenyang 110036,China;2.School of Economics,Shenyang University,Shenyang 110041,China;3.Shenyang Branch,Ping An Bank Co.,Ltd.,Shenyang 110001,China)
Abstract:Piecewise linear regression model is established by using data in different periods,and linear regression combination forecasting model with higher precision is combined according to the principle of minimum error.China’s ageing population forecast is taken as an example to illustrate the application of the forecasting model.
Key words:linear regression;combination;prediction model;aging
收稿日期:2015-08-03
基金項(xiàng)目:遼寧省社會(huì)科學(xué)基金資助項(xiàng)目(L13CJY052)。
作者簡(jiǎn)介:郝樂(1984-),女,遼寧沈陽人,沈陽大學(xué)講師,遼寧大學(xué)博士研究生。
文章編號(hào):2095-5464(2016)03-0290-04
中圖分類號(hào):N 945.15
文獻(xiàn)標(biāo)志碼:A
沈陽大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2016年3期