王明輝
將一個國家核算期內(nèi)(通常是一年)實現(xiàn)的國內(nèi)生產(chǎn)總值與這個國家的常住人口(或戶籍人口)相比進行計算,得到的人均國內(nèi)生產(chǎn)總值(人均GDP),不僅是衡量各國人民生活水平的重要標準,而且是人們了解和把握一個國家的宏觀經(jīng)濟運行狀況的有效工具,常作為經(jīng)濟學(xué)中衡量經(jīng)濟發(fā)展狀況的指標,是最重要的宏觀經(jīng)濟指標之一。特別是從2010年起,我國GDP總量超越日本位居世界第二后,主流意識都逐漸強調(diào)起人均GDP的重要性,這是一種必要的戒驕戒躁、理性清醒和自覺,因為我國的人均GDP和發(fā)達國家相比差距還很大,要認識到“第二大”并不等于“第二強”。所以,較為精確地分析并預(yù)測人均GDP的變化趨勢是非常有必要的。
在過去的70多年里,時間序列分析,尤其是線性時間序列ARIMA模型[1]發(fā)展迅速、成果豐富。其研究日趨成熟,并得到廣泛且非常成功的應(yīng)用。然而在很多領(lǐng)域,例如在經(jīng)濟、金融、環(huán)境、氣象和生物等諸多領(lǐng)域,存在著大量涉及非線性時間序列的問題,用線性時序分析方法去研究和解決這些問題,易丟失信息,效果欠佳。經(jīng)驗表明,非線性時間序列分析方法在這些領(lǐng)域已經(jīng)取得成功的應(yīng)用。非線性時間序列,哪怕是很簡單的非線性時間序列,都能顯示出奇異的現(xiàn)象,足以令人新奇不已。況且,非線性時間序列分析與許多非線性科學(xué)領(lǐng)域有著密切的聯(lián)系,例如與混沌、分形和神經(jīng)網(wǎng)絡(luò)等領(lǐng)域均有密切的關(guān)系。這也說明非線性時間序列能表現(xiàn)出更豐富、更復(fù)雜的客觀現(xiàn)象,比線性時間序列有著更廣闊的應(yīng)用前景,能解決許多復(fù)雜的實際問題。事實上,在很多領(lǐng)域,已經(jīng)顯示出非線性時間序列分析的應(yīng)用前景。因此,近年來對非線性時間序列分析的研究受到廣泛關(guān)注[2]。
研究非線性時間序列,很難仿效或沿用已有的線性時間序列的理論與方法,而且所面臨的困難也遠遠超過線性情況。正像在其他非線性科學(xué)領(lǐng)域一樣,人們遇到了許多新的激動人心的挑戰(zhàn)。常見的處理非線性關(guān)系的方法有數(shù)據(jù)轉(zhuǎn)換方法和神經(jīng)網(wǎng)絡(luò)、支持向量機、投影尋蹤和基于樹的方法等高計算強度方法。然而,這些方法要么在實際使用過程中有很大的局限性,要么得到的結(jié)果無法解釋。使用半?yún)?shù)模型來模擬非線性關(guān)系則在一定程度可以避免這些問題。
半?yún)?shù)模型是二十世紀八十年代發(fā)展起來的一類重要的統(tǒng)計模型。這類模型由于引入了表示模型誤差或其他系統(tǒng)誤差的非參數(shù)分量,因而既含有參數(shù)分量,又含有非參數(shù)分量,兼顧了參數(shù)模型和非參數(shù)模型的優(yōu)點,較之參數(shù)模型或非參數(shù)模型有更大的適應(yīng)性,也具有更強的解釋能力,同時又可避免許多“維數(shù)災(zāi)難”問題。
因此,本文采用1978~2016年的人均GDP數(shù)據(jù),嘗試建立半?yún)?shù)時間序列模型,通過分析其變化特征,預(yù)測未來三年的數(shù)值,并給出其95%的置信區(qū)間,以期對現(xiàn)有模型進行一定程度的擴充,同時給未來的研究者提供一定的借鑒意義,也可為促進經(jīng)濟更好更快地發(fā)展提供參考依據(jù)。
半?yún)?shù)時間序列模型是一類非線性時間序列模型的統(tǒng)稱,包括可加、單指標和變系數(shù)等模型,其中一種較為簡單的模型為具有自回歸誤差項的部分線性模型。Yu等[3]對于具有獨立同分布誤差項的自回歸模型,假定回歸函數(shù)來自某個參數(shù)分布族,使用條件最小二乘方法得到參數(shù)估計后,再運用非參數(shù)核方法進行調(diào)整,最后證明了回歸函數(shù)估計量具有弱相合性。Farnoosh和Mortazavi[4]則將該方法運用到具有一階自相關(guān)誤差項的自回歸模型中。Farnoosh等[5]研究了具有獨立同分布誤差項的部分線性自回歸模型中回歸函數(shù)的半?yún)?shù)估計和性質(zhì)。
本文主要采用具有一階自回歸誤差項的部分線性模型:
圖1 人均GDP時序圖
本文主要研究1978~2016年的人均GDP(1978年=100),原始數(shù)據(jù)Yt來源于《中國統(tǒng)計年鑒—2017》,對于=Yt/1000繪制時序圖。
圖2 一階差分序列時序圖
從圖1可看出該序列在這39年間呈曲線增長趨勢,顯然非平穩(wěn),一階差分后的時序圖見圖2,仍顯示不平穩(wěn),但二階差分后在顯著性水平0.05下,變?yōu)榘自肼曅蛄校虼瞬贿m合采用ARIMA模型進行擬合。
取 g(x,θ)=θex,采用上節(jié)所述方法建立具有一階自回歸誤差項的部分線性時間序列模型,所得擬合方程如下:
圖3 的真實值(實線)與估計值(虛線)對比
對參數(shù)進行顯著性檢驗,結(jié)果顯示在表1中,因此在0.05的顯著性水平下,三個參數(shù)均顯著。
表1 參數(shù)顯著性檢驗結(jié)果
圖4 殘差序列Q-Q圖
圖4為殘差序列的Q-Q圖,用來描述殘差序列是否服從正態(tài)分布。圖中的數(shù)據(jù)點基本上按照對角直線排列,趨于一條直線,并被對角直接穿過,且有95%的樣本點落在[-2,2]值區(qū)間內(nèi),故應(yīng)認為殘差序列近似服從正態(tài)分布。再加上采用Shapiro-Wilk正態(tài)性檢驗方法,所得統(tǒng)計量的值為0.9682,對應(yīng)的P值為0.3618,更加印證了殘差序列具有正態(tài)性。兩者從側(cè)面反映了本節(jié)方法的擬合效果。
利用上節(jié)模型預(yù)測2017~2019年的,并還原為人均GDP,所得結(jié)果見表2,同時給出它們的95%置信區(qū)間,預(yù)測結(jié)果延續(xù)了該序列的增長趨勢,2019年的數(shù)據(jù)將突破3000,會是1978年的30倍。
表2 2017~2019年的預(yù)測值
前面已經(jīng)做過分析,該人均GDP序列不適合采用ARIMA模型進行擬合,為了說明本文方法的可行性,我們采用二次回歸、三次回歸、指數(shù)回歸和冪模型進行建模,各方法所對應(yīng)方程如下:
表3列出了本文所用方法與其他方法的參數(shù)估計和模型匯總。經(jīng)過顯著性檢驗,發(fā)現(xiàn)上述模型的擬合方程均在0.05的顯著性水平下顯著,同時模型殘差也能通過正態(tài)性檢驗。只有兩個參數(shù)在該顯著性水平下不顯著,刪除這兩個參數(shù)后的擬合方程也包含在表中。與其他方法相比,本文采用的方法擬合效果較好,具有一定的優(yōu)越性。
本文以我國人均GDP為研究對象,利用1978~2016年的數(shù)據(jù),通過建立半?yún)?shù)時間序列模型分析其變化特征,并預(yù)測了未來三年的數(shù)值,給出了其95%的置信區(qū)間。該方法不僅是對現(xiàn)有模型的擴展,而且具有一定的參考價值和實用價值。
不可否認,該建模方法也存在一定的難點和不足。首先,模型的定階存在一定難度,即Yt和ut滯后階數(shù)的確定暫時沒有較為完善的方法。其次,參數(shù)分布族{g(x,θ);θ∈Θ}的確定也具有一定的難度,且直接影響模型的擬合效果。這些難點都對研究者提出較大挑戰(zhàn),需要其較為準確地把握數(shù)據(jù)本身的趨勢,這將是我們下一步的研究重點。
表3 參數(shù)估計和模型匯總