張秋穎
摘 要: 首先梳理出科技產(chǎn)出能力的所有可能的影響因素,并在數(shù)據(jù)可獲得的前提下,以2000-2008年為時(shí)間維,采集科技產(chǎn)出能力及其影響因素的相關(guān)數(shù)據(jù),然后對(duì)科技產(chǎn)出能力及其影響因素之間的相互關(guān)系進(jìn)行回歸分析,并利用多元線性回歸分析方法從所有相關(guān)因素中篩選出影響程度較高的因素,構(gòu)建科技產(chǎn)出能力的影響因素與預(yù)測(cè)模型,并對(duì)模型進(jìn)行檢驗(yàn)。
關(guān)鍵詞: 回歸分析法 科技產(chǎn)出能力 影響因素分析 預(yù)測(cè)研究
一、回歸分析理論簡(jiǎn)介
回歸分析方法是多元統(tǒng)計(jì)分析的各種方法中應(yīng)用最廣泛的一種。它是處理多個(gè)變量間相互依賴(lài)關(guān)系的一種數(shù)理統(tǒng)計(jì)方法。
1.多元線性回歸
多元統(tǒng)計(jì)分析是運(yùn)用數(shù)理統(tǒng)計(jì)方法來(lái)研究解決多指標(biāo)問(wèn)題的理論和方法。多元回歸分析方法是根據(jù)實(shí)際問(wèn)題的要求,在眾多相關(guān)變量中,考查其中一個(gè)或幾個(gè)變量與其余變量的依賴(lài)關(guān)系。
2.多元線性回歸模型
稱(chēng)此模型為經(jīng)典多元線性回歸模型,其中Y是可觀測(cè)的隨機(jī)向量,?蘚是不可觀測(cè)的隨機(jī)向量,C是已知矩陣,β,σ是未知參數(shù),并設(shè)n>m,且rank(C)=m+1.
3.回歸預(yù)測(cè)的步驟
第一步:獲取自變量和因變量的觀測(cè)值。
第二步:繪制XY散點(diǎn)圖。
第三步:寫(xiě)出帶未知參數(shù)的回歸方程。
第四步:確定回歸方程中參數(shù)值。
第五步:判斷回歸方程的擬合優(yōu)度。
第六步:進(jìn)行預(yù)測(cè)。
4.回歸模型的檢驗(yàn)
(1)判定系數(shù)R
用來(lái)判斷回歸方程的擬合優(yōu)度,通常可以認(rèn)為當(dāng)R大于0.9時(shí),所得到的回歸曲線擬合得較好,而當(dāng)R小于0.5時(shí),所得到的回歸曲線很難說(shuō)明變量之間的依賴(lài)關(guān)系。
(2)t統(tǒng)計(jì)量
如果對(duì)于某個(gè)自變量,其t統(tǒng)計(jì)量的p值小于顯著水平(或稱(chēng)置信度、置信水平α),則可認(rèn)為該自變量與因變量是相關(guān)的。
(3)F統(tǒng)計(jì)量
如果F統(tǒng)計(jì)量的P值小于顯著水平(或稱(chēng)置信度、置信水平),則可認(rèn)為方程的回歸效果顯著[1]。
二、回歸分析法的應(yīng)用
本文根據(jù)黑龍江省高校2000-2008年的理工類(lèi)科技數(shù)據(jù)進(jìn)行回歸分析,文中數(shù)據(jù)來(lái)源于《歷年統(tǒng)計(jì)年鑒》。我們將研究2000-2008年中影響黑龍江省高??萍籍a(chǎn)出能力的因素并作出回歸模型,以便于預(yù)測(cè)其他年份的科技產(chǎn)出能力。
文中高校的科研產(chǎn)出能力用高校當(dāng)年產(chǎn)出的論文與著作的加權(quán)和衡量,高校當(dāng)年的經(jīng)費(fèi)使用情況我們采用當(dāng)年經(jīng)費(fèi)支出的數(shù)據(jù)[3]。我們用Y來(lái)表示黑龍江省21所高校科技產(chǎn)出能力(單位:項(xiàng)),為黑龍江省21所高校當(dāng)年經(jīng)費(fèi)支出總數(shù)(單位:百元),為黑龍江省高校當(dāng)年投入的人員總數(shù)(單位:人)。把這九年的數(shù)據(jù)錄入到SAS中,輸出結(jié)果見(jiàn)表1[2]。
表1 輸出結(jié)果
The REG Procedure
Model:MODEL1
Dependent Varible:y
Analysis of Variance
Sourc DF Sum of Squares Mean Square F Value pr>F
Model 2 46454159 23227079 11.61 0.0087
Error 6 12002893 2000482
Corrected Total 8 58457052
Root MSE 1414.38400 R-Square 0.7947
Dependent Mean 9727.88889 Adj R-Sq 0.7262
Coeff Var 14.53948
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value pr>|t|
Intercept 1 -348.67105 4372.23945 -0.80 0.4566
X1 1 0.00400 0.00082996 4.82 0.0030
X2 1 0.23290 0.11848 1.97 0.0969
表1的輸出結(jié)果中截距項(xiàng)的p值為0.4566大于顯著性水平α,顯著性水平α取為0.05,截距項(xiàng)在模型中不顯著,可以將截距項(xiàng)去掉,修改程序重新擬合模型,輸出結(jié)果見(jiàn)表2。
表2 輸出結(jié)果
The REG Procedure
Model:MODEL1
Dependent Varible:y
Analysis of Variance
Sourc DF Sum of Squares Mean Square F Value pr>F
Model 1 896874210 2095.20175 236.57 <0.0001
Error 7 13269242 1895606
Uncorrected Total 8 2103.98725
Root MSE 1376.81007 R-Square 0.9854
Dependent Mean 8.17193 Adj R-Sq 0.9957
Coeff Var 6.62214
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value pr>|t|
X1 1 0.00360 0.00709 84.58 <0.0001
X2 1 0.14238 0.00721 8.09 0.0030
1.回歸方程
2.回歸方程顯著性檢驗(yàn)的結(jié)果
均方誤差MSE=13269242/7=1895606,它是模型中誤差方差σ的估計(jì);該表還給出檢驗(yàn)統(tǒng)計(jì)量F值為236.57,P值小于0.0001,這表示擬合的模型是高度顯著的,該模型解釋了這組數(shù)據(jù)總變差中的主要部分。
3.回歸系數(shù)顯著性檢驗(yàn)的結(jié)果
該輸出中參數(shù)估計(jì)表不僅給出回歸方程的系數(shù),并給出檢驗(yàn)∶β=0(i=0,1,…,m)的結(jié)果:見(jiàn)該圖的最右邊列Prob>|T|(即顯著性概率P值),若給定α=0.05自變量x的P值均小于0.05,說(shuō)明這個(gè)模型是高度顯著的[4]。
4.有關(guān)的回歸統(tǒng)計(jì)量
決定系數(shù)R=0.9854,標(biāo)準(zhǔn)差σ的估計(jì)量為1376.81007回歸平方和U=896874210殘差平方和Q=13269242.
輸出的方差分析表顯示,各項(xiàng)指標(biāo)都較好,說(shuō)明模型擬合較好,同時(shí)這是一個(gè)意義直觀且便于應(yīng)用的二元線性模型。模型表明:每年的綜合成果數(shù)與當(dāng)年用于課題的經(jīng)費(fèi)投入成正相關(guān)關(guān)系,即經(jīng)費(fèi)投入越多,相應(yīng)的成果產(chǎn)出也較多;同時(shí)綜合成果數(shù)與當(dāng)年用于課題的人員投入也成正相關(guān)關(guān)系,也就是說(shuō),投入的人員多也意味著有較多產(chǎn)出,因而從這幾年理工類(lèi)課題的人員投入趨勢(shì)看,其一直都在增加,各個(gè)高校似乎也抓住了這一規(guī)律。
當(dāng)然,基于這一關(guān)系,我們便可以進(jìn)行合理預(yù)測(cè)和控制。我們已知2009年黑龍江省高校投入的經(jīng)費(fèi)總數(shù)為2503876千元和人員投入的總數(shù)為35746人,應(yīng)用以上模型預(yù)測(cè)2009年黑龍江省的綜合成果總數(shù)14103.5項(xiàng)。而2009年綜合成果總數(shù)的真實(shí)值為15308.8項(xiàng)。相對(duì)誤差為7.9%,根據(jù)區(qū)間估計(jì)的理論我們可求出回歸函數(shù)在x=2503876,x=35746處的值的置信水平為0.95的置信區(qū)間為[10464.66908,17742.26908]而我們的真實(shí)值又確實(shí)落在其中,所以又一次證明了我們的模型較好,我們可以通過(guò)這個(gè)模型進(jìn)行預(yù)測(cè),為政府部門(mén)的決策提供參考。
參考文獻(xiàn):
[1]李衛(wèi)東.應(yīng)用多元統(tǒng)計(jì)分析[M].北京大學(xué)出版社,2008.
[2]黃燕,吳平.SAS統(tǒng)計(jì)分析及應(yīng)用[M].機(jī)械工業(yè)出版社,2005.
[3]蔣明.SAS軟件在回歸分析中的應(yīng)用[J].計(jì)算機(jī)與農(nóng)業(yè),2003(8):15-16.
[4]劉仁義,陳士俊.高校教師科技績(jī)效評(píng)價(jià)指標(biāo)體系與權(quán)重[J].統(tǒng)計(jì)與決策(理論版),2007(3):135-137.