眾所周知,充分就業(yè)是每一個國家都必須面對的熱點問題,同時也是每個國家重要的經(jīng)濟(jì)發(fā)展目標(biāo)。世界上各個國家的就業(yè)狀況并不容樂觀,時有波瀾。而我國就業(yè)形勢雖然也面臨著重大的挑戰(zhàn),但是在經(jīng)濟(jì)高速發(fā)展之下,新增就業(yè)崗位數(shù)得到快速增長,僅針對福建一省所收集到的20年數(shù)據(jù)來看,就業(yè)人數(shù)增長迅速,有著顯著的上升趨勢。福建的地理位置比較特殊,它位于我國的東南沿海,是長江三角與珠江三角的連接點,并且與臺灣相隔不遠(yuǎn),因此,福建省在我國經(jīng)濟(jì)發(fā)展中也有著特殊的戰(zhàn)略地位,對福建省就業(yè)影響因素的研究就顯得尤為重要。
針對我國的現(xiàn)狀、福建省的現(xiàn)狀,建立一套對于就業(yè)人數(shù)的科學(xué)的預(yù)測體系是把握住控制就業(yè)的主動性的前提。因此,本文想收集大量的歷史數(shù)據(jù),通過利用統(tǒng)計學(xué)的知識與R語言科學(xué)地分析福建省就業(yè)的影響因素,建立回歸模型,進(jìn)而對就業(yè)人數(shù)進(jìn)行預(yù)測,并將預(yù)測的結(jié)果與現(xiàn)實情況進(jìn)行對比,判斷模型是否有效。
查閱相關(guān)的資料,可知影響就業(yè)人數(shù)的主要因素有:地區(qū)生產(chǎn)總值、每萬常住人口擁有的在校大學(xué)生數(shù)、人口自然增長率、稅收、教育支出。本文將這些因素作為變量、就業(yè)人數(shù)作為因變量,對二十余年的具體數(shù)據(jù)建立回歸方程,進(jìn)行多重共線性、異方差、自相關(guān)的檢驗與消除,用最后確定的模型進(jìn)行對就業(yè)人數(shù)的預(yù)測,對比分析結(jié)果,解釋其中存在的互動關(guān)系。最后初步進(jìn)行總結(jié),提出相應(yīng)的政策建議,以促進(jìn)福建的就業(yè)人數(shù)的增長,優(yōu)化就業(yè)結(jié)構(gòu),營造良好的就業(yè)環(huán)境,以實現(xiàn)充分就業(yè)的經(jīng)濟(jì)發(fā)展目標(biāo)。
使用數(shù)據(jù)為1997-2007年福建省就業(yè)相關(guān)數(shù)據(jù),共21條。包括5個自變量變量(地區(qū)生產(chǎn)總值、每萬常住人口擁有在校大學(xué)生數(shù)、人口增長率、稅收、教育支出)和一個因變量(就業(yè)人數(shù))。數(shù)據(jù)來自《中國統(tǒng)計年鑒》《福建統(tǒng)計年鑒》(1997年至2017年)。
利用R語言將數(shù)據(jù)導(dǎo)入并得到散點圖。由散點圖可見x1地區(qū)生產(chǎn)總值、x2每萬常住人口擁有在校大學(xué)生數(shù)、x3人口自然增長率、x4稅收、x5教育支出與y就業(yè)人數(shù)基本呈線性關(guān)系,所以初步可以建立方程。
初步建立回歸模型可知x1、x2與x4對y起正影響,x3與x5對y起負(fù)影響,這與定性分析結(jié)果顯然不一致,從數(shù)據(jù)可直接看出這5個變量對y都起正影響,原因可能是自變量數(shù)目太多,變量之間存在著相關(guān)關(guān)系。
給定顯著性水平為0.05,x3相應(yīng)的p值為0.103234,沒有通過回歸系數(shù)的顯著性檢驗,說明x3對因變量的影響不顯著。決定系數(shù)為0.9949,從相對水平上看,回歸方程能解釋因變量y的99.49%的方差波動?;貧w標(biāo)準(zhǔn)差為35.95?;貧w模型的F值為585,p值<2.2e-16,由此可知回歸方程整體上高度顯著,這與相關(guān)系數(shù)的檢驗結(jié)果是相一致的。
多元線性回歸模型的一個基本假設(shè)即設(shè)計矩陣X的秩rank(X)=p+1。即要求各解釋變量之間線性無關(guān)。而這一假設(shè)在實際問題中卻是常常難以滿足的,比如在該研究問題中,涉及了5個自變量,自變量的數(shù)目比較多,并且很難從其中找到一組自變量,它們之間是完全不相關(guān)的關(guān)系。在實際的問題中,如果一個經(jīng)濟(jì)社會現(xiàn)象受到多個重要的因素影響時,這些解釋變量之間往往有一定的相關(guān)性。當(dāng)解釋變量的相關(guān)性比較弱時,我們可以認(rèn)為近似滿足多元線性回歸模型的基本假設(shè);當(dāng)一組變量之間的相關(guān)性比較強時,就認(rèn)為違背了基本假設(shè)。
x1,x2,x3,x4,x5之間的相關(guān)系數(shù)很高,且在第三步線性回歸中,x3與x5的回歸系數(shù)正負(fù)號與定性分析結(jié)果相違背,這初步說明了該模型有多重共線性。這與基本預(yù)測是相一致的,當(dāng)所研究的經(jīng)濟(jì)社會問題是關(guān)于時間序列的資料時,由于這些變量隨時間往往有著相一致的變化趨勢且關(guān)聯(lián)密切,多重共線性的問題很難避免。因此進(jìn)行逐步回歸,并且按照AIC準(zhǔn)則刪去多余變量,對剩下變量做回歸。
從輸出顯著性結(jié)果可看出,當(dāng)保留x1,x2時,各參數(shù)t檢驗通過,說明模型擬合較好。決定系數(shù)為0.9913,從相對水平上看,該模型能解釋因變量y的99.13%的方差波動?;貧w標(biāo)準(zhǔn)差為42.92。從方差分析表中可以看到,回歸模型的F值為1023,p值<2.2e-16,由此可知回歸方程整體上高度顯著。
因此,最終方程為y=1422+0.03387x1+1.656x2。
現(xiàn)實中的問題是充滿復(fù)雜性的,對于此類問題進(jìn)行回歸分析時,往往其中的某些因素隨著解釋變量觀測值的變化,而對被解釋變量產(chǎn)生復(fù)雜的影響,導(dǎo)致隨機誤差項產(chǎn)生不同的方差。當(dāng)一個回歸問題存在異方差時,常常會破壞模型的有效性,因此本模型中需要對異方差進(jìn)行檢驗。
異方差的檢驗結(jié)果可看出,P=0.05638>0.05,說明模型不存在異方差。
在時間序列中,往往會出現(xiàn)正的序列相關(guān)。而建立線性回歸方程的一個基本假設(shè)就是其中的隨機誤差項不存在序列相關(guān)。因此,診斷隨機擾動項是否存在自相關(guān)性,對于問題的研究和模型的建立是一個重要的方面。
對模型進(jìn)行自相關(guān)的檢驗,可得P=0.1812>0.05,因此該模型不存在自相關(guān)。
一個模型通過了t檢驗或者F檢驗并不能夠確保這個模型是有效的或者這個模型對數(shù)據(jù)擬合得很好,只是說明解釋變量與被解釋變量之間有比較顯著的線性關(guān)系。還時可能存在其他的一些問題導(dǎo)致數(shù)據(jù)并不可靠。比如異常值與周期性干擾。殘差值是實際數(shù)據(jù)與通過回歸方程得到的回歸結(jié)果之間的差值。只有通過檢驗殘差項相關(guān)的檢驗,才能夠保證回歸模型的正確性可靠性。因此在以下的步驟中,通過使用殘差圖,來判斷模型的效果與質(zhì)量,檢驗基本假定是否滿足。
圖1 殘差圖與回歸圖
圖1可以看出,第15、16、21樣本點顯然出現(xiàn)了不同程度的偏離,因此可以將這三個點看做異常點。在接下來的步驟中進(jìn)一步確定這三個點是否存在問題。
如果殘差是正態(tài)分布,那它就是具備著隨機性的,進(jìn)一步可以看做比較好的擬合了隨機誤差。
對殘差進(jìn)行正態(tài)性檢驗可得,P=0.1046>0.05,說明模型的殘差是正態(tài)性的,滿足了線性回歸模型的假設(shè)。
利用R語言對建立的模型求得預(yù)測結(jié)果與預(yù)測區(qū)間。將預(yù)測輸出結(jié)果與實際數(shù)據(jù)做對比分析,發(fā)現(xiàn)實際的數(shù)據(jù)都落在預(yù)測區(qū)間內(nèi),因此表明此模型的擬合效果很好。
最終得到的結(jié)果模型為:y=1422+0.03387x1+1.656x2。
可以看出,在其他變量不變的情況下,地區(qū)生產(chǎn)總值每增加1億元,就業(yè)人數(shù)增加0.03387萬人;每萬常住人口擁有大學(xué)生數(shù)每增加1人,就業(yè)人數(shù)增加1.656萬人。
通過對福建省就業(yè)因素的研究可以看出,從宏觀經(jīng)濟(jì)來講,地區(qū)生產(chǎn)總值會對就業(yè)人數(shù)的上升起到積極的影響。當(dāng)社會開始出現(xiàn)經(jīng)濟(jì)衰退、生產(chǎn)消費不振時,常常伴隨著失業(yè)人數(shù)增加、勞動力供給水平降低的情況。政府在就業(yè)問題中起著關(guān)鍵的作用,科學(xué)有效的財稅政策對于社會經(jīng)濟(jì)發(fā)展起到重要的指導(dǎo)作用。政府需要扮演好自己的角色,掌控好宏觀經(jīng)濟(jì),才能保持經(jīng)濟(jì)穩(wěn)定增長與繁榮,促進(jìn)社會發(fā)展,最大程度降低失業(yè)率,實現(xiàn)充分就業(yè)。從發(fā)展產(chǎn)業(yè)來看,短期內(nèi)就業(yè)增長最有效的方式是把重點放在勞動密集型企業(yè),以此增加人民就業(yè);而從長期來看,技術(shù)與資本密集型企業(yè)是經(jīng)濟(jì)發(fā)展的最大帶動力,以此才能在這個科技高速發(fā)展的時代保持長期穩(wěn)定的經(jīng)濟(jì)繁榮。在政策制定時應(yīng)該二者兼顧,做好短期與長期的有機鏈接,將經(jīng)濟(jì)增長與帶動就業(yè)更好的結(jié)合起來。
除了社會宏觀經(jīng)濟(jì)方面的影響,每萬常住人口擁有的大學(xué)生數(shù)也是就業(yè)增長的一個重要因素,從中體現(xiàn)出來的是教育問題、人才培養(yǎng)問題。政府部門應(yīng)該考慮加大對教育方面的財政投入,對教育結(jié)構(gòu)進(jìn)行科學(xué)的調(diào)整,引導(dǎo)社會各界的力量去促進(jìn)教育的發(fā)展,切實提高教育質(zhì)量。除此之外,政府也應(yīng)該考慮到教育資源分配不協(xié)調(diào)的問題,現(xiàn)如今,寒門越來越難出貴子,教育資源應(yīng)該往農(nóng)村地區(qū)貧困地區(qū)有所傾斜,保證貧困家庭孩子也能接收到高質(zhì)量的教育,這是促進(jìn)貧困地區(qū)弱勢群體經(jīng)濟(jì)內(nèi)生增長的有效方式。