張學(xué)新
(湖北工程學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖北孝感 432000)
考研成績的路徑分析及SAS程序
張學(xué)新
(湖北工程學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖北孝感 432000)
本文闡述了結(jié)構(gòu)方程模型與路徑分析的原理,并基于某校2011-2013年理科考研情況的調(diào)查數(shù)據(jù),利用路徑分析方法研究考研英語、考研政治、專業(yè)課一、專業(yè)課二、學(xué)校類別、體育基礎(chǔ)對理科考研成績的作用路徑及影響力度,給出了路徑分析的SAS實(shí)現(xiàn)過程。
結(jié)構(gòu)方程模型;路徑分析;CALIS過程;理科考研成績;效應(yīng)分析
當(dāng)面臨多個因變量,或者一個變量既是自變量又是因變量時,多元回歸顯得不能兼顧,結(jié)構(gòu)方程模型則顯示出優(yōu)勢。結(jié)構(gòu)方程模型(SEM)泛指一組實(shí)證現(xiàn)有理論有效性的統(tǒng)計(jì)模型,是單因素方差分析、多元回歸分析等廣義線性建模過程的擴(kuò)展。它的主要優(yōu)點(diǎn)是可以研究由多個指標(biāo)測度的潛在結(jié)構(gòu)間的關(guān)系,適用于經(jīng)驗(yàn)數(shù)據(jù)與非經(jīng)驗(yàn)數(shù)據(jù)、截面數(shù)據(jù)、縱向數(shù)據(jù)。SEM包括路徑分析(PA)、因果模型、協(xié)方差結(jié)構(gòu)分析,是經(jīng)濟(jì)和行為科學(xué)中重要的統(tǒng)計(jì)工具。本文應(yīng)用路徑分析探討理科學(xué)生的課程學(xué)習(xí)與考研成績之間的相互關(guān)系。
關(guān)于理科學(xué)生考研成功率的影響因素,國內(nèi)已有一些研究成果。朱璟[1]認(rèn)為,惟有準(zhǔn)確、完整、系統(tǒng)地掌握高等數(shù)學(xué)基礎(chǔ)知識,靈活運(yùn)用解題方法,注重綜合分析問題和解決實(shí)際問題能力的培養(yǎng),才能在考研中取得良好的效果。王艷潔[2]認(rèn)為加強(qiáng)對學(xué)生的教育和管理,采用數(shù)學(xué)分層次教學(xué)法和開設(shè)選修課對提高考研率有一定的積極作用。蘇國榮, 戴中寅[3]基于粗糙集理論中的屬性依賴度原理,分析高考成績、高等數(shù)學(xué)課程成績和高等數(shù)學(xué)培訓(xùn)成績對考研高等數(shù)學(xué)成績的影響大小。王小清,林榮華[4]利用考研心態(tài)調(diào)查問卷,對影響大學(xué)生考研心態(tài)的因素進(jìn)行相關(guān)性分析。這些文獻(xiàn)通過對考研現(xiàn)狀的調(diào)查,探討了影響理科學(xué)生考研成功率的一些因素,但存在以下不足之處:一是僅通過簡單的描述性統(tǒng)計(jì)方法來分析考研成功率的影響因素,沒有估計(jì)影響的大小,分析不夠精確;二是僅僅研究了應(yīng)變量和自變量之間的直接作用,而沒有考慮變量之間的間接關(guān)系。李建寧[5]利用路徑分析實(shí)證山西省1983-1993年份的大學(xué)入學(xué)率與人均GNP、全社會勞動生產(chǎn)率、人均教育經(jīng)費(fèi)支出等因素之間的相互關(guān)系, 但沒有給出用SAS 軟件程序。
本文介紹路徑分析原理,并結(jié)合我校2011-2013年理科考研情況的調(diào)查數(shù)據(jù),給出路徑分析的SAS 軟件程序?qū)嵗?/p>
1.1 路徑分析的基本思想及概念
SEM與PA廣泛應(yīng)用于社會科學(xué)領(lǐng)域,其基本特征見參考文獻(xiàn)[6-7]。SEM對結(jié)構(gòu)理論的多元分析采用實(shí)證方法檢驗(yàn)其中多個變量之間規(guī)定的因果關(guān)系,目標(biāo)是確任一個假設(shè)的模型與采集的反應(yīng)它的數(shù)據(jù)是否一致。SEM由兩個部分組成,即測量模型和結(jié)構(gòu)模型。測量模型把可觀測響應(yīng)“指標(biāo)”與潛變量,有時也與可觀察的協(xié)變量聯(lián)系起來。結(jié)構(gòu)模型則指定潛變量之間的關(guān)系,把潛變量在可觀測變量上進(jìn)行回歸。路徑分析則是結(jié)構(gòu)方程模型的特殊情形,它只有可觀測變量而無潛變量,只有一個結(jié)構(gòu)模型,而且每個變量只有一個指標(biāo)。完整的SEM包含路徑分析與因子分析,使用潛變量考慮測量誤差。
在PA和SEM中的基本概念:顯變量(測量變量),可直接測量;潛變量,不可直接測量的變量;外生變量,有出自它但沒有進(jìn)入它的路徑(彎箭頭只簡單的描述變量間的相關(guān)性,不是路徑);內(nèi)生變量,具有至少一條指向它的路徑。由于測量有誤差,所有的內(nèi)生變量都附加一個誤差項(xiàng),表示內(nèi)生變量未被解釋的部分。
SEM路徑圖中常用圖標(biāo)的含義:圓或橢圓表示潛變量或因子,正方形或長方形表示顯變量或指標(biāo),單向箭頭表示單向影響或效應(yīng),雙向(彎)箭頭表示相關(guān),單向箭頭指向因子表示殘差項(xiàng),單向箭頭指向指標(biāo)表示測量誤差。
結(jié)構(gòu)理論中的內(nèi)生變量的因果模式是先驗(yàn)的,即在PA中必須確定:(1)哪些路徑是重要的(直箭頭);(2)外生變量的方差是什么;(3)外生變量如何與另一個關(guān)聯(lián)(彎箭頭或協(xié)方差);(4)內(nèi)生變量的誤差項(xiàng)(擾動項(xiàng))是什么。
1.2 路徑系數(shù)
1.3 使用路徑分析的步驟
(1)根據(jù)相關(guān)理論和文獻(xiàn)資料,繪制一個沒有路徑系數(shù)的路徑圖。(2)以每一個內(nèi)生變量為響應(yīng)變量,以箭頭指向它的變量為自變量建立線性回歸方程。(3)改進(jìn)模型。將路徑系數(shù)不顯著的路徑從路徑圖中剔除,然后重新建立回歸模型,給出各路徑系數(shù)與殘差。(4)模型評價:包括結(jié)構(gòu)檢驗(yàn)、相關(guān)性檢驗(yàn)、測量模型可靠度檢驗(yàn)、模型總體評價等。
2.1 假設(shè)路徑圖
圖1 考研成績影響因素的初始路徑圖
本文數(shù)據(jù)來自湖北工程學(xué)院2011-2013屆應(yīng)用數(shù)學(xué)班和統(tǒng)計(jì)班考取研究生的所有學(xué)生。應(yīng)用數(shù)學(xué)班的專業(yè)課一、專業(yè)課二分別指線性代數(shù)和高等代數(shù),統(tǒng)計(jì)班的專業(yè)課一、專業(yè)課二分別指考研科目數(shù)學(xué)三和統(tǒng)計(jì)學(xué)。英語基礎(chǔ)指考生的四學(xué)期的大學(xué)英語平均成績,數(shù)學(xué)基礎(chǔ)指三個學(xué)期的數(shù)學(xué)分析、概率論、常微分方程、高等代數(shù)平均成績,四個學(xué)期的體育平均成績稱為體育基礎(chǔ),思想道德修養(yǎng)與法律基礎(chǔ)、毛澤東思想鄧小平理論、三個代表重要思想、馬克思主義基本原理以及中國近代史綱要各科的平均成績稱為政治基礎(chǔ)。對于考生的考研成績?nèi)∑淇佳谐煽兺ㄖ獑紊系姆謹(jǐn)?shù)。關(guān)于學(xué)校類別,對211學(xué)?;?85學(xué)校賦值1,其它院校賦值0。初始路徑圖(ei表示殘差項(xiàng))設(shè)定為圖1。
2.2 SAS統(tǒng)計(jì)分析過程
在SAS中引導(dǎo)作路徑分析和SEM的程序是 CALIS過程[8]。 CALIS可用于分析協(xié)方差結(jié)構(gòu)模型(實(shí)證因子分析)、含潛變量的線性結(jié)構(gòu)方程、路徑分析模型。它們中的變量間的假設(shè)關(guān)系依據(jù)方差和協(xié)方差指定,再擬合到一個可觀測方差矩陣。CALIS過程的數(shù)據(jù)輸入有三種方式:(1)含有每個變量的標(biāo)準(zhǔn)偏差和觀測值數(shù)目的相關(guān)矩陣;(2)協(xié)方差矩陣;(3)使用原始數(shù)據(jù)作為輸入。本文使用相關(guān)矩陣,數(shù)據(jù)一旦被輸入,就得到用于實(shí)行路徑分析的描述性統(tǒng)計(jì)和相關(guān)系數(shù)。
2.2.1 SAS程序
DATA path1(TYPE=CORR);
INPUT _TYPE_ $ _NAME_ $ V1-V10;
LABEL
V1 = '英語基礎(chǔ)'
…
V10 = '考研成績';
CARDS;
N . 55 55 55 55 55 55 55 55 55 55
STD . 4.1265 3.0780 9.0208 11.2919 12.0444 21.9459 23.6689 3.9220 0.4903 31.9286
CORR V1 1.0000 . . . . . . . . .
CORR V2 .3602 1.0000 . . . . . . . .
……
CORR V9 .0937 -.0752 .1196 .1100 .03597 .0319-.01192 -.0695 1.0000 .
CORR V10 .0318 .2242 .2613 .4985 .5311 .6923 .5869 .1226 .1992 1.0000
;
PROC CALIS COVARIANCE CORR RESIDUAL MODIFICATION ;
LINEQS
V4 = PV4V9 V9 + PV4V1 V1 + E2,
……
V10 = PV10V4 V4 + PV10V5 V5 + PV10V6 V6 + PV10V7 V7 + PV10V8 V8+ PV10V9 V9 + E1;
STD
E1 = VARE1,
…
E5 = VARE5,
V1 = VARV1,
...
V9 = VARV9;
COV
V1 V2 = CV1V2,
…
V8 V9 = CV8V9;
VAR V1 V2 V3 V4 V5 V6 V7 V8 V9 V10;
RUN;
有關(guān)語句說明n =55是觀測值數(shù)目。在PROC CALIS語句選項(xiàng)中,首先,COVARIANCE告訴SAS要使用協(xié)方差矩陣進(jìn)行分析。即使把相關(guān)矩陣作為數(shù)據(jù)輸入,SAS 仍為 CALIS過程計(jì)算協(xié)方差矩陣。CORR選項(xiàng)指定想要的輸出以包括賴以分析的相關(guān)矩陣或協(xié)方差矩陣。RESIDUAL選項(xiàng),輸出絕對殘差和標(biāo)準(zhǔn)化殘差。MODIFICATION選項(xiàng)告訴SAS打印修正指標(biāo)(如拉格朗日乘數(shù)檢驗(yàn)等)。
LINEQS,給SAS提供特定的線性方程組,它們指定了要估計(jì)路徑。其中的第一個可以理解為:V4通過V4和V9之間的路徑、V4和V1之間的路徑、與V4相關(guān)聯(lián)的誤差的方差而受到因果影響。接下來是標(biāo)準(zhǔn)差線,它指定要估計(jì)的方差。最后,COV語句指定所有需要估計(jì)的協(xié)方差。變量線則簡單地列出了在分析中使用的變量。
提交程序運(yùn)行后,產(chǎn)生長達(dá)26頁的輸出。其中,第11頁包括迭代歷史,顯示ABSGCONV收斂準(zhǔn)則得到滿足。第13頁顯示擬合指數(shù),RMSEA(近似誤差平方根)= 0.0527,接近0.05, Bentler & Bonett的標(biāo)準(zhǔn)化擬合指數(shù)NFI=0.8244,均表明較好的擬合。第15頁顯示標(biāo)準(zhǔn)化的殘差矩陣和10大標(biāo)準(zhǔn)化殘差,這些值接近零,意味著擬合較好。第17頁以原始形式顯示每個路徑系數(shù),以及t值和標(biāo)準(zhǔn)誤差。第19頁提供了如下標(biāo)準(zhǔn)化的路徑系數(shù)和各內(nèi)生變量的復(fù)相關(guān)系數(shù)的平方。
V4 = 0.1409*V1 + 0.0968*V9 + 0.9840 E2
PV4V1 PV4V9
……
V10 = 0.1294*V4 + 0.0395*V5 + 0.4925*V6 + 0.3011*V7
PV10V4 PV10V5 PV10V6 PV10V7
+ 0.1126*V8 + 0.2041*V9 + 0.7247 E1
PV10V8 PV10V9
最后一個的標(biāo)簽表達(dá)式:考研成績=0.1294*考研英語+0.0395*考研政治+0.4925*專業(yè)課二+0.3011*專業(yè)課一+0.1126*體育基礎(chǔ)+0.2041*學(xué)校類別+0.7247 E1,它的=0.4749。從第20頁開始是修正指標(biāo)的列表,一直繼續(xù)到26頁輸出結(jié)束。
2.2.2 修改并完成路徑圖的繪制
在線性回歸方程中考慮雙箭頭,從路徑圖中剔除路徑系數(shù)不顯著的路徑,然后重新建立回歸模型,給出各路徑系數(shù)與殘差。修改后的路徑如圖2,其中括號內(nèi)的數(shù)值為決定系數(shù),括號外的數(shù)值為路徑系數(shù)。
圖2 考研成績及其影響因素路徑圖
直接效應(yīng)=自變量與考研成績的直接路徑系數(shù),間接效應(yīng)=各路徑系數(shù)的乘積,表示自變量通過其他變量間接的影響考研成績的程度。由圖2可知,專業(yè)課一除了對考研成績有直接效應(yīng)外,還通過專業(yè)課二對考研成績產(chǎn)生間接影響。具體求解如下:
Effpart
V10<- V7 V6;
run;
提交后,可得專業(yè)課一對考研成績的直接效應(yīng)為0.266,專業(yè)課一通過專業(yè)課二對考研成績的間接影響為0.69×0.421=0.29049,專業(yè)課一對考研成績的總效應(yīng)為0.266+0.29049=0.55649。
同理得到專業(yè)課二對考研成績的總效應(yīng)0.60853,學(xué)校類別對考研成績的總效應(yīng)為0.33562,考研英語對考研成績的總效應(yīng)為0.11042,考研政治對考研成績的總效應(yīng)為0.09132。至此完成具有標(biāo)準(zhǔn)化路徑系數(shù)的路徑圖。
3.1 初步結(jié)論
根據(jù)以上的分析結(jié)果,可以得出以下初步結(jié)論:
(1)考研英語、考研政治、專業(yè)課一、專業(yè)課二和學(xué)校類別與考研成績呈顯著的正相關(guān),而體育基礎(chǔ)、英語基礎(chǔ)、數(shù)學(xué)基礎(chǔ)、政治基礎(chǔ)對考研成績有一定的影響,但是不顯著,這可解釋為大學(xué)期間平時的考試只考察基本知識,考生只針對要考試的內(nèi)容來復(fù)習(xí),復(fù)習(xí)不全面,因而成績都相差不是很大,即各考生的平時基礎(chǔ)成績相差不大,因此對考研成績的影響不是很顯著,影響考研成績的是考生考研期間的態(tài)度與心態(tài)。
(2)專業(yè)課一與專業(yè)課二有強(qiáng)的相關(guān)關(guān)系,這可以解釋為二者在學(xué)習(xí)過程中有很多相通的地方;學(xué)校類別通過專業(yè)課二間接影響考研成績,這是因?yàn)閷I(yè)課二是學(xué)校自主命題,考試難度自然也有所不同;考研政治通過影響考研英語來間接影響考研成績,在于考研英語和考研政治的許多命題與解題的方式大致相同,都以分析為主,需要較強(qiáng)的推理能力;考研英語與學(xué)校類別有直接的因果關(guān)系,雖然是統(tǒng)考試卷,但是學(xué)校對英語的劃線卻有所不同,因此考研英語也會影響到學(xué)校類別。
(3)對考研成績總效應(yīng)的大小排序分別為:專業(yè)課二(0.60853)、專業(yè)課一(0.55649)、學(xué)校類別(0.33562)、考研英語(0.11042)和考研政治(0.09132)。
3.2 討論
本文路徑分析的部分結(jié)論不完全符合預(yù)期的假設(shè),這或許與樣本容量大小有關(guān)。SEM是大樣本技術(shù),樣本量依賴于模型復(fù)雜度、采用的估計(jì)方法及觀測變量的分布特征。為了增加樣本容量,本文合并兩個不同專業(yè)的考生數(shù)據(jù),但對專業(yè)課進(jìn)行了區(qū)分,數(shù)學(xué)基礎(chǔ)變量的取值也是根據(jù)專業(yè)課對應(yīng)的必修課程來計(jì)算,這對最終的結(jié)果仍會產(chǎn)生一定的影響。實(shí)例分析表明,路徑分析的確是一種檢驗(yàn)顯變量和潛變量之間的假設(shè)關(guān)系的綜合統(tǒng)計(jì)方法,是一種表示、評估和測試變量間主要線性關(guān)系構(gòu)成的理論網(wǎng)絡(luò)的方法論。PROC CALIS路徑模型語言非常容易設(shè)定路徑模型,EFFPART 陳述能夠清楚地給出直接效應(yīng)、間接效應(yīng)及總效應(yīng)。因而利用SAS中的PROC CALIS作路徑分析是非常便捷的。
[1]朱璟,鄧鵬.立足考研看高等數(shù)學(xué)的學(xué)習(xí)[J].高等數(shù)學(xué)研究,2006,9(3):59-64.
[2]王艷潔.學(xué)生考研數(shù)學(xué)的現(xiàn)狀分析及對策探討[J].中國林業(yè)教育,2009,27(2):11-13.
[3]蘇國榮,戴中寅.基于屬性依賴度的考研高等數(shù)學(xué)成績影響因素分析[J].蘇州大學(xué)學(xué)報:自然科學(xué)版,2012,28(3):89-94.
[4]王小清,林榮華.影響大學(xué)生考研心態(tài)的因素探析[J].沈陽教育學(xué)院學(xué)報,2009,11(4):19-21.
[5]李建寧.路徑分析在教育發(fā)展戰(zhàn)略研究中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2001(8):142-144.
[6]Karada·,E.Basic features of structural equation modeling & Path analysis and its place and importance in educational research methodology[J].Bulgarian Journal of Science and Education Policy (BJSEP),2012,6(1):194-211.
[7]Lleras,Christy.Path Analysis.The Encyclopedia of Social Measurement[M].New York:Academic Press,2005.
[8]SAS Institute Inc. Chapter 25: The CALIS Procedure. SAS/STAT 9.2 User's Guide. Cary, NC: SAS Institute Inc,2008:828-1023.
Path Analysis of the National PG Entrance Exam Results and SAS Proc Calis
ZHANG Xue-xin
(School of Mathematics and Statistics, Hubei Engineering University, Xiaogan Hubei 432000,China)
This study expounds the detailed structural equation model and the principle of analysis, and based on the sample of a college science student’s grad-school entrance exam from 2011 to 2013, path analysis can be viewed as a special case to explore English exam, Politics exam , Specialized Course One and Two, the family of school and Physical basis by what paths and how much influences to affect post-graduate entrance exam scores. Finally, it gives example of path analysis using the SAS proc calis.
SEM; PA; proc calis; PG entrance exam score; effect analysis
2013-10-23
張學(xué)新(1966- ),男,湖北宜城人,湖北工程學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院講師,博士,從事變點(diǎn)檢測、可靠性統(tǒng)計(jì)分析研究。
O212.4
A
1008-178X(2014)01-0047-05