?
探索性因子分析中主軸法下的平行分析
高石1,楊莉萍1*,白福寶2
(1.南京師范大學(xué)心理學(xué)院,南京 210097;2.安徽農(nóng)業(yè)大學(xué)人文社會科學(xué)學(xué)院,合肥 230036)
摘要:在探索性因子分析中,決定因子的提取數(shù)至關(guān)重要。平行分析是確定因子提取數(shù)較為常用的方法。目前國內(nèi)的心理學(xué)研究較多使用主成分方法下的平行分析,對主軸方法下的平行分析則鮮有論及。本研究介紹了主軸方法下平行分析的原理,并以具體實例說明了該方法在心理統(tǒng)計中的具體運用,希望藉此解決以傳統(tǒng)方法確定因子提取數(shù)所存在的問題。
關(guān)鍵詞:探索性因子分析;主軸法;平行分析
1以傳統(tǒng)方法確定因子提取數(shù)存在的問題
因子分析是目前使用最為廣泛的多元統(tǒng)計分析方法。它是用少數(shù)幾個因子來描述許多指標(biāo)或變量間的聯(lián)系,在某一事物所蘊含的眾多變量中尋找能夠描述該事物的幾個潛變量(或因子)的統(tǒng)計方法。該方法最早于1904由英國心理學(xué)家斯皮爾曼在研究智力結(jié)構(gòu)時提出。其發(fā)表的論文《客觀決定和測量一般智力》(General Intelligence,Objectively Determined and Measured)被視為因子分析方法誕生的標(biāo)志。然而,在使用因子分析方法的過程中,確定因子提取的個數(shù)一直是個比較棘手但又至關(guān)重要的問題。有研究者認(rèn)為,它可能比因子提取和因子旋轉(zhuǎn)方式的選擇更為重要。
目前確定因子提取個數(shù)最為常用的方法是特征值大于1準(zhǔn)則和Cattell陡階檢驗(又稱碎石圖檢驗)。這兩種方法之所以常用,可能在于它們是SPSS的默認(rèn)選項。然而這些方法自身存在一定的局限性。對于特征值大于1準(zhǔn)則而言,Hayton(2004)提出存在三種批評:首先,運用特征值大于1準(zhǔn)則將得到總體相關(guān)矩陣的秩(the rank of population correlation matrix)的下限(Guttman,1954)。相關(guān)矩陣的秩等同于最小抽取的因子個數(shù)。因此,在實際操作中,我們將其視為抽取因子數(shù)的標(biāo)準(zhǔn)并不合理。其次,這一準(zhǔn)則適用于總體相關(guān)矩陣,而在實際操作中,由于抽取的是樣本,抽樣誤差往往會增加矩陣的秩,導(dǎo)致所抽取的因子數(shù)過多(Horn,1965)。第三,研究者有時會面臨特征值略高或略低于1的情況。在使用這一規(guī)則時,常常表現(xiàn)得武斷(Fabrigar et al.,1999)。當(dāng)前在SPSS中,無論使用哪一種因子提取方法,都使用特征值大于1的準(zhǔn)則。而有研究者指出,這一準(zhǔn)則只適用于主成分分析,在主軸法中是不適用的(Russell,2002)。對于Cattell陡階檢驗,因其主觀性和武斷性,所遭受的批評更多。例如,在特征值之間不存在明顯突變(break)時,很難確定適當(dāng)?shù)囊蜃犹崛?shù)。
2基于主軸因子法的平行分析原理
在眾多確定因子提取數(shù)的方法之中,平行分析(Parallel Analysis)是較為理想的方法之一。該方法是由Horn(1965)提出的平行檢驗方法發(fā)展而來。平行分析基于對矩陣特征值的計算與比較,通過比較真實數(shù)據(jù)矩陣與隨機數(shù)據(jù)矩陣特征值的平均值或第95百分位數(shù)來決定因子的取舍(Russell,2002)。比較均值或是第95百分位數(shù)的結(jié)果通常具有一致性。假如出現(xiàn)不一致,則比較第95百分位數(shù)可以避免選取因子數(shù)過多(Hayton,2004)。因此,平行分析的關(guān)鍵在于矩陣特征值的計算。
目前探索性因子分析主要采用兩種方法:主成分分析法和主軸因子法。在使用這兩種方法時,特征值計算所依據(jù)的矩陣有所不同,分別為相關(guān)矩陣和約相關(guān)矩陣。相關(guān)矩陣通常表示為R,約相關(guān)矩陣通常表示為R*(方便起見,以下直接使用R和R*表示),由此產(chǎn)生相對應(yīng)的兩組特征值,即R的特征值和R*的特征值(顏鐵成,2007)。這里R與R*的區(qū)別在于矩陣對角線元素。前者對角線元素均為1,后者的對角線元素則可采用多種方法進(jìn)行估計,例如最大相關(guān)法(max|r|),參照析因迭代法(iteration by refactoring),復(fù)相關(guān)系數(shù)的平方(squared multiple correlation,簡稱SMC)等(王權(quán),1993)。此外,Widaman(1985)提出,可用復(fù)相關(guān)系數(shù)的平方作為初始估計,通過不斷迭代,使用最小二乘法來估計矩陣的對角線元素。
主成分分析是依據(jù)R的特征值進(jìn)行,其假定所有觀測變量的方差都能為公因子所解釋,即公因子方差為1。而主軸因子法則是基于R*的特征值進(jìn)行的,其假定所有觀測變量的方差不一定完全被公因子所解釋,公因子方差不一定是1?;绢A(yù)設(shè)不同原本是主成分分析與主軸因子法之間的一個重要區(qū)別(孫曉軍,周宗奎,2009)。但在實際運用中,無論是采用主成分分析還是主軸因子法,SPSS所給出的特征值都是基于主成分分析法所得到的特征值(顏鐵成,2007)。有研究者比較這兩組特征值的大小,發(fā)現(xiàn)R矩陣的特征值通常要比R*的特征值要大(顏鐵成,2007)。因此,在采用主軸因子方法的前提下,根據(jù)SPSS所輸出的特征值來進(jìn)行平行分析是不合理的。
主軸法下平行分析的做法應(yīng)該是:首先對約相關(guān)矩陣R*的主對角線元素進(jìn)行估計,產(chǎn)生真實數(shù)據(jù)的約相關(guān)矩陣R*的估計矩陣,以此計算出對應(yīng)的特征值。再按照相同過程計算出隨機矩陣的約相關(guān)矩陣R*的特征值。隨機矩陣的被試人數(shù)和變量數(shù)要求與真實矩陣相同。因為特征值代表了因子所解釋的變異,通過比較真實數(shù)據(jù)的特征值與隨機數(shù)據(jù)的特征值可以決定因子的取舍。當(dāng)從真實數(shù)據(jù)中抽取的因子所解釋的變異比從模擬的隨機數(shù)據(jù)中抽取的相應(yīng)因子所解釋的變異大時,應(yīng)保留該因子,否則當(dāng)舍棄。
以下擬借助一個實例,說明在主軸因子法下應(yīng)如何正確使用平行分析。
3基于主軸因子法的平行分析實例
3.1工具性軟件
實現(xiàn)平行分析的具體方法有很多,例如在SPSS、SAS中通過編寫程序語言來實現(xiàn)(Oconnor,2000),或使用具有平行分析功能的軟件Vista(The Visual Statistics System)(Young,2003)等。前者所涉及的軟件雖具有較高的普及性,但編寫程序語言并非易事。盡管已經(jīng)有研究者公布了這一實現(xiàn)過程的程序語言,然而對于一般的初學(xué)者,仍然很不方便。因此,本研究選擇采用第二種方法。Vista是由北卡羅來納州大學(xué)教堂山分校教授Young及其學(xué)生歷時10年開發(fā)的一種可視化統(tǒng)計分析軟件。該軟件是公開、免費的,可以直接從開發(fā)者的網(wǎng)站下載。軟件的安裝、運行、導(dǎo)入數(shù)據(jù)、分析數(shù)據(jù)等一系列操作均在可視化操作界面上完成,易于掌握。
3.2數(shù)據(jù)來源
本案所使用的數(shù)據(jù)來自一項對大學(xué)生公正感的問卷調(diào)查研究。該研究在文獻(xiàn)研究的基礎(chǔ)上,通過規(guī)范的量表編制程序,編制了與大學(xué)生公正感有關(guān)的特質(zhì)公正感問卷,來了解大學(xué)生公正感的基本情況。該問卷采用自陳方式,共包含24個題項,從“1-非常不符合”到“5-非常符合”,共分五個等級計分。
本案采用分層隨機抽樣,在福建、浙江和江蘇3省的六所大學(xué)抽取大學(xué)生被試,共發(fā)放問卷430份,回收有效問卷409份,回收有效率為95.12%。信度檢驗表明為,問卷測量的內(nèi)部一致性系數(shù)為0.882,達(dá)到顯著水平。
3.3統(tǒng)計處理
首先,使用SPSS16.0對數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)的KMO測量值為0.860,處于0.80.9之間,表明適合作因子分析。本研究的主要目的在于提供如何在主軸法下進(jìn)行平行分析的樣本,因而選用主軸法來提取因子和計算特征值。表1是使用Vista對數(shù)據(jù)進(jìn)行平行分析得出的結(jié)果,同時根據(jù)表1結(jié)果繪制了圖1:
表1 真實樣本與隨機樣本的特征值比較
圖1 真實數(shù)據(jù)特征值與隨機數(shù)據(jù)特征值比較
從表1可以看出,真實數(shù)據(jù)特征值在第八個因子時大于隨機數(shù)據(jù)特征值的平均值,但小于95%分位值。根據(jù)前文提到的原則,比較隨機數(shù)據(jù)特征值第95百分位數(shù),保留七個因子。同時應(yīng)參考這七個因子對方差的累積貢獻(xiàn)率以及經(jīng)旋轉(zhuǎn)后因子的可解釋性。如果這七個因子的方差貢獻(xiàn)率太低,則可考慮適當(dāng)多保留一些因子。圖1顯示,因子數(shù)在13以后出現(xiàn)了負(fù)值。這是因為當(dāng)R的對角線元素被小于單位1的數(shù)取代后,比如,用變量的公共因素的估計值取代后,從理論上說,矩陣的R的正定和半正定特性將得以保持。但在實際操作中,約相關(guān)矩陣R*并沒有保持正定和半正定性,此即會有負(fù)的特征值出現(xiàn)(王權(quán),1993)。
在此需要說明的是,由于對R*的對角線元素進(jìn)行估計有多種方法,因此采用不同的估計方法所算出的特征值會略有不同,但并不會對平行分析的結(jié)果產(chǎn)生實質(zhì)性影響。本研究所使用的Vista在對R*對角線元素進(jìn)行估計時,采用的是前文提到的復(fù)相關(guān)系數(shù)的平方作為估計值,進(jìn)而計算出特征值。這一方法與前文提到的SPSS程序語言所使用的方法一致(Oconnor,2000)。另外,對于因子個數(shù)的保留問題還應(yīng)參照其他標(biāo)準(zhǔn),進(jìn)行綜合判斷,即在遵守簡約性原則與完備性原則的前提下,根據(jù)研究者前期的理論建構(gòu)、自身的專業(yè)知識及研究經(jīng)驗綜合決定因子的取舍(沐守寬,顧海根,2011)。
致謝:感謝美國西北大學(xué)William.Revelle教授,愛荷華州立大學(xué)Daniel W.Russell教授以及南京師范大學(xué)數(shù)學(xué)系周宇給予本研究的指導(dǎo)和幫助。
參考文獻(xiàn)
沐守寬,顧海根.(2011).探索性因素分析因子抽取方法的比較.心理學(xué)探新,31(5),477-484.
孫曉軍,周宗奎.(2005).探索性因素分子分析及其在應(yīng)用中存在的主要問題.心理科學(xué),28(6),1440-1442.
王權(quán).(1993).現(xiàn)代因素分析.杭州:杭州大學(xué)出版社.
顏鐵成.(2007).因素分析中三種特征值大小的比較.統(tǒng)計與決策,4,134.
Fabrigar,L.R.,Wegener,D.T.,MacCallum,R.C.,& Strahan,E.J.(1999).Evaluating the use of exploratory factor analysis in psychological research.PsychologicalMethods,4,272-299.
Guttman,L.(1954).Some necessary conditions for common factor analysis.Psychometrika,19,149-162.
Hayton,J.C.(2004).Factor retention decisions in exploratory factor analysis:A tutorial on parallel analysis.OrganizationalResearchMethods,7(2),191-205.
Horn,J.L.(1965).A rationale and test for the number of factors in factor analysis.Psychometrika,32,179-185.
Oconnor,B.P.(2000).SPSS and SAS programs for determing the number of components using parallel analysis and Velicer’s MAP test.BehaviorResearchMethods,32(3),396-402.
Russell,D.W.(2002).In search of underlying dimensions:The use(and abuse)of factor analysis in personality and social psychology bulletin.PersonalityandSocialPsychologyBulletin,28(12),1629-1646.
Widaman,K.F.,& Herringer,L.G.(1985).Iterative least squares estimates of communality:Initial estimate need not affect stabilized value.Psychometrika,50,469-477.
Young,F(xiàn).W.(2003).Vista(The Visual Statistics System).[computer software] [on-line].Retrieved from http://forrest.psych.unc.edu/research/index.html.
The Application of Parallel Analysis Based on(Using)the Principal
Axis Factoring in Exploratory Factor Analysis
Gao Shi1,Yang Liping1,Bai Fubao2
(1.School of Psychology,Nanjing Normal University,Nanjing 210097;
2.School of Humanities & Social Sciences,Anhui Agricultural University,Hefei 230036)
Abstract:The decision of how many factors to retain is a critical issue in exploratory factor analysis.Parallel analysis(PA)is one of the most commonly used methods.Present domestic studies have focused mainly on parallel analysis using principal component factoring(PA-PCF),but parallel analysis using principal axis factoring(PA-PAF)is rarely found.In this article,the rationale of PA-PAF is introduced and the specific procedure of conducting PA-PAF in exploratory factor analysis by using raw data is presented in order to deal with the challenge of factor retention encountered in traditional methods.
Key words:exploratory factor analysis;principal axis factoring;parallel analysis
中圖分類號:B841.2
文獻(xiàn)標(biāo)識碼:A
文章編號:1003-5184(2015)05-0471-03
通訊作者:*楊莉萍,E-mail:lpy2908@yahoo.com.cn。