馮 瀟,黃昱馨
(電子科技大學(xué) 成都學(xué)院, 四川 成都 611731)
長期以來中國與東南亞國家都保持著良好的經(jīng)貿(mào)合作關(guān)系,而“一帶一路”建設(shè)更進一步推進了彼此的經(jīng)貿(mào)往來合作。目前東南亞已成為中國三大核心貿(mào)易伙伴之一,因此預(yù)測中國-東南亞各國的進出口貿(mào)易額,對研判中國-東南亞貿(mào)易趨勢、制定貿(mào)易政策等具有重要意義。
關(guān)于中國與東南亞國家貿(mào)易預(yù)測的研究,常用的預(yù)測模型有經(jīng)濟計量模型,如劉宓雯等通過面板回歸對東南亞各國的貿(mào)易總量進行了預(yù)測;余振岳等通過計算HM 指數(shù)評估了中國與東南亞的貿(mào)易趨勢。也有學(xué)者運用了機器學(xué)習(xí)對貿(mào)易額進行預(yù)測,如鄧洋洋構(gòu)建了多種機器學(xué)習(xí)的中國-東盟貿(mào)易額預(yù)測模型。本文在前人研究的基礎(chǔ)上,基于線性回歸和非線性回歸的視角,構(gòu)建多種機器學(xué)習(xí)模型對中國-東南亞各國進出口總額的歷史數(shù)據(jù)進行建模測算,并在此基礎(chǔ)上提出多模型組合的中國-東南亞貿(mào)易預(yù)測模型。
線性回歸旨在尋找一條直線或者一個平面對新的數(shù)據(jù)進行預(yù)測:
J(θ)為損失函數(shù),計算方法主要有最小二乘法(OLS)和梯度下降法(SGD)。OLS 是對J(θ)中的每個θ 直接求偏導(dǎo)的過程。而SGD 是根據(jù)J(θ)更小的原則對θ 進行修改,直到J(θ)達到最小的過程。當(dāng)變量個數(shù)較多且有相關(guān)關(guān)系時,Lasso 回歸能夠通過正則化項實現(xiàn)對變量的選?。?/p>
漸進梯度回歸樹(GBRT)與RF 類似,是一種迭代的決策樹回歸算法,計算如下:
而極端梯度提升(XGBoost)對損失函數(shù)L 進行了二階泰勒展開,并在L 里加入了正則項:
本文選取中國與東南亞11 國的GDP、人口總量和CPI 作為回歸模型的輸入變量,時間范圍為2000-2019年,輸出變量時間范圍為2001-2020 年。本文將存在缺失值的年份數(shù)據(jù)進行刪除,并將各經(jīng)濟數(shù)據(jù)的量綱進行歸一化:
本文將前16 年的數(shù)據(jù)作為訓(xùn)練集,將后3 年的數(shù)據(jù)作為測試集對訓(xùn)練模型進行評估,評估指標(biāo)為平均百分比誤差(MAPE):
7 種回歸模型在測試集上的MAPE 值如表1 所示。從該表可以看出,除OLS 線性回歸模型外,其余線性回歸模型和非線性回歸模型在不同國家數(shù)據(jù)集上有不同的預(yù)測優(yōu)勢,其中SGD 與XGBoost 在多個數(shù)據(jù)集上預(yù)測效果較好。盡管LASSO 在多個國家數(shù)據(jù)集上預(yù)測效果不佳,但與其他模型相比,LASSO 在中國-文萊進出口數(shù)據(jù)預(yù)測上的預(yù)測效果最好。
表1 單個預(yù)測模型評估結(jié)果
為了綜合各機器學(xué)習(xí)回歸預(yù)測模型的優(yōu)點,本文分別對各模型賦予不同權(quán)重,然后將各模型預(yù)測的加權(quán)平均值作為組合回歸預(yù)測結(jié)果,具體計算公式如下:
本文首先將各模型進行兩兩組合,通過對組合回歸模型目標(biāo)函數(shù)進行求解,以得到單個模型在組合模型中的權(quán)重,隨后將組合模型對測試集的進出口貿(mào)易總額進行預(yù)測,檢驗結(jié)果如表2 所示。與表1 進行比較可以看出,組合后的模型能夠綜合兩個模型所包含的信息,有效降低單個模型的預(yù)測誤差,取得比單個模型更好的預(yù)測效果。同時從表2 可以看出,在15 種組合模型中,SGD-LASSO 組合模型預(yù)測誤差最小,故本文首先選取SGD回歸模型與LASSO 回歸模型進行模型組合。
表2 兩種模型組合評估結(jié)果
由于組合模型的基模型均是線性模型,而中國-東南亞國家進出口貿(mào)易總額與各國經(jīng)濟變量之間并非存在著嚴(yán)格的線性關(guān)系,故本文將4 種非線性模型與SGD-LASSO 組合模型再次進行模型組合,以進一步降低對中國-東南亞進出口總額的預(yù)測誤差。模型評估結(jié)果及各模型權(quán)重計算結(jié)果如表3、表4 所示,從表3 可以看出,將SGD-LASSO 組合模型與各非線性回歸模型進一步組合后,模型預(yù)測誤差均有了不同程度的降低,其中SGD-LASSO-XGBoost 模型的MAPE 值低于其他組合預(yù)測模型的MAPE 值,說明在針對中國-東南亞進出口總額的預(yù)測問題上,SGD-LASSO-XGBoost 模型有更好的預(yù)測性能。
表3 線性-非線性組合模型評估結(jié)果
表4 SGD-LASSO-XGBoost 組合模型權(quán)重計算結(jié)果
本文從線性和非線的視角選擇了7 種常用的機器學(xué)習(xí)回歸模型分別對中國-東南亞11 國的進出口總額進行模型訓(xùn)練,使用評估指標(biāo)MAPE 值對測試集進行評估,發(fā)現(xiàn)線性模型與非線性模型在不同的數(shù)據(jù)集上有各自的預(yù)測優(yōu)勢。因此結(jié)合線性模型與非線性模型的特點,對不同模型賦予不同權(quán)重,構(gòu)建SGD-LASSO-XGBoost 組合回歸預(yù)測模型,得到了更準(zhǔn)確的預(yù)測結(jié)果。