[摘 要]文章以湖南省2010—2019年地方財(cái)政收入經(jīng)濟(jì)指標(biāo)數(shù)據(jù)為樣本數(shù)據(jù),通過Lasso特征選擇影響財(cái)政收入的關(guān)鍵因素,再建立單個(gè)屬性的灰色預(yù)測模型,對已被Lasso特征篩選出的2020年各解釋變量的值進(jìn)行預(yù)測,最后通過支持向量回歸預(yù)測模型得出2020年湖南省財(cái)政收入。
[關(guān)鍵詞] 財(cái)政收入;Lasso特征選擇;灰色預(yù)測模型;支持向量回歸預(yù)測
[DOI]10.13939/j.cnki.zgsc.2021.29.040
財(cái)政收入是政府為滿足支出需要,并依據(jù)相關(guān)的權(quán)利原則,通過國家財(cái)政集中的一定數(shù)量的貨幣或?qū)嵨镔Y產(chǎn)收入。財(cái)政收入直接決定可用財(cái)力,能充分發(fā)揮財(cái)政支持經(jīng)濟(jì)建設(shè)的職能作用,還能保證基層政治穩(wěn)定、社會安定以及改革發(fā)展的需要。因此,對于財(cái)政收入方面的研究極具意義,故本文以湖南省為例對影響該省財(cái)政收入的因素進(jìn)行分析并進(jìn)行相關(guān)預(yù)測。
從現(xiàn)有的文獻(xiàn)來看,大多采用傳統(tǒng)的統(tǒng)計(jì)方法,而本文先通過Lasso方法進(jìn)行特征選擇,再基于灰色預(yù)測模型預(yù)測解釋變量的值,最后結(jié)合支持向量機(jī)回歸預(yù)測模型進(jìn)行預(yù)測。上述分析與預(yù)測步驟均于Python軟件下進(jìn)行代碼實(shí)現(xiàn)。
1 模型建立
1.1 Lasso變量選擇模型
Lasso回歸方法通過構(gòu)建一個(gè)懲罰函數(shù)得到一個(gè)精煉的函數(shù),以縮小特征集的思想,將特征的系數(shù)進(jìn)行壓縮并使某些回歸系數(shù)變成0,用來進(jìn)行模型的改進(jìn)與選擇。Lasso參數(shù)估計(jì)定義如下[1]:
2.2 Lasso變量篩選
本文基于Python軟件編制的程序?qū)τ绊懞鲜∝?cái)政收入的變量進(jìn)行篩選,結(jié)果如表1所示。
2.3.2 構(gòu)建支持向量機(jī)回歸預(yù)測組合模型
對上述影響湖南省財(cái)政收入的變量建立支持向量機(jī)預(yù)測模型,并結(jié)合所構(gòu)建的灰色預(yù)測模型所得的影響因素值對財(cái)政收入進(jìn)行預(yù)測,所得的結(jié)果經(jīng)整理后如表3所示。
從運(yùn)行結(jié)果可以得知,2020年湖南省財(cái)政收入的預(yù)測值為5285.784154億元。同時(shí)繪制2010—2019年財(cái)政收入真實(shí)值與預(yù)測值的線形圖,如圖1所示。
從圖1中可以看到模型擬合效果良好,財(cái)政收入的真實(shí)值與預(yù)測值十分貼近,誤差較小。
3 結(jié)論
利用Lasso回歸方法識別影響財(cái)政收入的重要影響因素分別為在崗職工工資總額、城鎮(zhèn)居民人均可支配收入、常住人口、全社會固定資產(chǎn)投資額、第三產(chǎn)業(yè)與第二產(chǎn)業(yè)產(chǎn)值比、居民消費(fèi)水平。同時(shí)根據(jù)支持向量回歸預(yù)測各年財(cái)政收入的結(jié)果與真實(shí)值的誤差較小,可以認(rèn)為基于Lasso變量篩選后,建立的灰色預(yù)測模型和支持向量回歸預(yù)測模型是有意義的,預(yù)測結(jié)果也是較為精準(zhǔn)的。
參考文獻(xiàn):
[1]李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].2版.北京:清華大學(xué)出版社,2019.
[2]鄧華麗,張良均.綜合灰色及回歸模型的地方財(cái)政收入預(yù)測法[J].中國管理信息化,2016,19(5):145-148.
[3]徐子卿.貴州省財(cái)政收入影響因素分析及預(yù)測[J].農(nóng)村經(jīng)濟(jì)與科技,2019,30(6):158-159.
[作者簡介]秦權(quán)(1998—),男,湖南永州人,廣西師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,在讀碩士研究生,研究方向:應(yīng)用統(tǒng)計(jì)。