董德朋,劉 巍,孫世超
?
CTT、IRT、FT:體育科學(xué)量表編制中的應(yīng)用
——以《特質(zhì)流暢量表》為研究例證
董德朋,劉 巍,孫世超
以《特質(zhì)流暢量表》為案例工具,對(duì)763名不同項(xiàng)目和級(jí)別的運(yùn)動(dòng)員進(jìn)行了問(wèn)卷調(diào)查,通過(guò)3個(gè)應(yīng)用研究探索CTT(經(jīng)典測(cè)量理論)、IRT(項(xiàng)目反應(yīng)理論)以及FT(層面理論)在量表編制中的使用及優(yōu)化組合,驗(yàn)證了研究中提出的假設(shè)。研究認(rèn)為,1)FT的映射語(yǔ)句對(duì)題項(xiàng)建立之初的內(nèi)容效度方面具有自身的優(yōu)越性;2)CTT和IRT應(yīng)用于項(xiàng)目分析階段,樣本量達(dá)400時(shí)是一個(gè)穩(wěn)定閾值,且CTT對(duì)量表題項(xiàng)的刪減并不能代替IRT分析,但并不建議在此階段使用FT的SSA技術(shù);3)CTT和IRT結(jié)合應(yīng)用于量表信度分析時(shí)能夠從宏觀與微觀給出量表和題項(xiàng)的信度情況,CTT中的結(jié)構(gòu)方程模型與FT中的SSA技術(shù)相結(jié)合能避免量表結(jié)構(gòu)效度過(guò)于強(qiáng)調(diào)定量分析,而忽視內(nèi)容理論框架的缺陷。
經(jīng)典測(cè)量理論;項(xiàng)目反應(yīng)理論;層面理論;量表
如何實(shí)現(xiàn)研究方法的組合優(yōu)化是體育科學(xué)在研究方法上不斷進(jìn)取的方向,也正如我國(guó)學(xué)者張力為所言,“體育科學(xué)研究者很可能在科學(xué)標(biāo)準(zhǔn)這個(gè)最高層面和具體方法這個(gè)基礎(chǔ)層面達(dá)成共識(shí)”[21],這也正體現(xiàn)出體育科學(xué)研究方法的“歷時(shí)態(tài)”演變軌跡[2]。體育科學(xué)量表的編制是體育科學(xué)研究的一個(gè)重要領(lǐng)域。然而, 20世紀(jì)初期,以真分?jǐn)?shù)作為核心假設(shè)和由隨機(jī)化為理論基礎(chǔ)的經(jīng)典測(cè)量理論(Classical Test Theory,簡(jiǎn)稱CTT,下同)在體育科學(xué)量表編制的應(yīng)用中占有著絕對(duì)的統(tǒng)治地位,且在許多領(lǐng)域中發(fā)揮了重要價(jià)值,尤其是在社會(huì)科學(xué)[5,10,25]、教育學(xué)[13,17,34]、心理學(xué)[12,27]領(lǐng)域。時(shí)至今日,它仍將在這些領(lǐng)域中的測(cè)驗(yàn)開發(fā)、分析、應(yīng)用等方面繼續(xù)發(fā)揮著巨大作用。但是,由于CTT在理論體系上的先天不足,致使在指導(dǎo)實(shí)踐過(guò)程中也逐漸暴露出了許多局限,例如:參數(shù)過(guò)分依賴于被試樣本,項(xiàng)目特性與被試特性之間沒(méi)有建立內(nèi)在聯(lián)系,測(cè)量誤差估計(jì)具有不精確性、籠統(tǒng)性[8]等等,從而限制了它的深入發(fā)展與應(yīng)用,也致使體育科學(xué)量表的編制研究存在一定的先天不足,至少在方法上還需不斷嘗試和努力。
代表現(xiàn)代測(cè)量理論,以潛在特質(zhì)和數(shù)學(xué)統(tǒng)計(jì)模型為基礎(chǔ)的項(xiàng)目反應(yīng)理論(Item Response Theory,簡(jiǎn)稱IRT,下同)為這些局限的解決提供了一些很好的方法,具有自身的一些優(yōu)勢(shì),例如:1)具有參數(shù)不變的特性,克服了CTT依賴于被試樣本這一缺陷;2)被試能力參數(shù)與項(xiàng)目參數(shù)建立了相同的參照尺度。通常,被試在項(xiàng)目上作答的結(jié)果受兩個(gè)主要因素影響,其一是被試本身,其二是項(xiàng)目的計(jì)量學(xué)屬性,而IRT將這兩種主要因素的聯(lián)合作用對(duì)被試作答結(jié)果的影響用概率函數(shù)來(lái)表示(項(xiàng)目特征曲線,Item Characteristic Curve,簡(jiǎn)稱ICC,下同),從而在同一基準(zhǔn)下估算出被試能力水平與項(xiàng)目參數(shù),建立了內(nèi)部關(guān)聯(lián);3)測(cè)驗(yàn)及項(xiàng)目的測(cè)量誤差得到精確估計(jì)。由于信度是評(píng)價(jià)隨機(jī)誤差造成測(cè)驗(yàn)結(jié)果一致性問(wèn)題的重要指標(biāo),而CTT只提供了一個(gè)籠統(tǒng)的信度指標(biāo),從而產(chǎn)生了高信度題項(xiàng)掩蓋低信度題項(xiàng)的現(xiàn)象,IRT卻對(duì)測(cè)驗(yàn)及每個(gè)項(xiàng)目均為不同被試特質(zhì)水平提供了獨(dú)立的信度指標(biāo),從而更有利于指導(dǎo)測(cè)驗(yàn)的編制。因此,它不僅為社會(huì)科學(xué)[15]、教育測(cè)量[33]以及心理測(cè)量[3]的相關(guān)研究提供了強(qiáng)有力的理論依據(jù),更可為體育科學(xué)量表的編制提供技術(shù)支持。層面理論(Facet Theory,簡(jiǎn)稱FT,下同)是隨著科學(xué)技術(shù)發(fā)展而出現(xiàn)的又一測(cè)量理論,它的基礎(chǔ)是以物理空間呈現(xiàn)概念空間,且能夠?qū)⒎妒交治?理論構(gòu)建:映射語(yǔ)句)與內(nèi)部數(shù)據(jù)分析(實(shí)證研究:Smallest Space Analysis ,簡(jiǎn)稱SSA,下同)相結(jié)合,從而避免過(guò)分強(qiáng)調(diào)復(fù)雜的定量分析,而忽視研究概念理論框架的缺陷[22,26,32]。
傳統(tǒng)上CTT理論作為經(jīng)典測(cè)量理論在體育科學(xué)量表編制領(lǐng)域被廣泛應(yīng)用,而如何結(jié)合IRT、FT兩種理論開展組合優(yōu)化研究似乎應(yīng)成為一種基礎(chǔ)方法上的突進(jìn)方向,尤其是如何促使我國(guó)體育科研人員更有效的將各種方法的組合優(yōu)化應(yīng)用于體育學(xué)科領(lǐng)域。為此,根據(jù)量表的編制過(guò)程與各測(cè)量理論的本身優(yōu)勢(shì),研究提出如下假設(shè):1)FT中的映射語(yǔ)句可能在體育科學(xué)量表編制中,對(duì)題項(xiàng)建立之初的內(nèi)容效度構(gòu)建存在一定的優(yōu)勢(shì)。2) CTT和IRT結(jié)合應(yīng)用于量表的項(xiàng)目分析階段時(shí),可能更有利于題項(xiàng)的刪減,但兩者的結(jié)合對(duì)題項(xiàng)的篩選存在樣本量的極大依賴性,且應(yīng)該存在樣本量的穩(wěn)定性閾值。3)CTT、IRT、FT三者的結(jié)合應(yīng)用于信效度分析時(shí),CTT可從宏觀方面給出量表或分量表的整體信度,而IRT則可以從微觀方面給出量表各個(gè)項(xiàng)目的信度情況,若兩者結(jié)合應(yīng)用于信度分析可能更全面的展現(xiàn)量表的外、內(nèi)信度水平;CTT中的結(jié)構(gòu)方程模型與FT中的SSA技術(shù)能夠避免量表結(jié)構(gòu)效度過(guò)分強(qiáng)調(diào)定量分析,而忽視研究?jī)?nèi)容概念理論框架的缺陷。
基于這樣的認(rèn)識(shí)或假設(shè),筆者以運(yùn)動(dòng)員《特質(zhì)流暢量表》作為實(shí)證案例工具展開例證。之所以選擇這一測(cè)評(píng)工具,主要是考慮到:1)該測(cè)評(píng)工具發(fā)展已相對(duì)成熟,且關(guān)于運(yùn)動(dòng)員的流暢狀態(tài)研究在國(guó)內(nèi)、外體育科學(xué)領(lǐng)域已有多人研究與應(yīng)用[6,11,18,23,24,29-31,35,36,38];2)正值課題組為部分國(guó)家隊(duì)運(yùn)動(dòng)員進(jìn)行心理測(cè)評(píng)服務(wù),可以更為便利地獲取相關(guān)數(shù)據(jù)。在這里想再次引用我國(guó)學(xué)者張力為的一句話:“兼具自然科學(xué)和社會(huì)科學(xué)特征的體育科學(xué),其研究領(lǐng)域的包容性如此之大,使概括它的方法學(xué)特征和進(jìn)展也非常之難。但我們?nèi)钥刹扇∫渣c(diǎn)帶面、自下而上的方式,……,來(lái)探討體育科學(xué)研究方法的問(wèn)題與對(duì)策”[20]。也正是基于這樣的考慮,本研究希望能夠發(fā)揮以點(diǎn)帶面的作用,驗(yàn)證以上3種假設(shè),認(rèn)識(shí)和理解CTT、IRT、FT 3種理論在體育科學(xué)量表編制中的組合優(yōu)化應(yīng)用。
2.1 研究對(duì)象
本研究選取了部分國(guó)家隊(duì)、省隊(duì)、體育院校以及普通高等學(xué)校體育學(xué)院的專業(yè)隊(duì)隊(duì)員為調(diào)查對(duì)象,發(fā)放運(yùn)動(dòng)員中文簡(jiǎn)化版《特質(zhì)流暢量表》800份,回收有效問(wèn)卷763份,回收率為95.38%,其中,國(guó)家隊(duì)85人(11.14%),省隊(duì)109人(14.29%),體育院校238人(31.19%),以及高等學(xué)校體育學(xué)院331人(43.38%),男、女運(yùn)動(dòng)員分別為354人(46.40%),409人(53.60%),年齡15~27歲,平均年齡為:19.53±3.78(男)、18.91±2.87(女),訓(xùn)練年限為:6.33±3.43(男)、5.90±3.31(女),運(yùn)動(dòng)等級(jí)分為健將(48人,占6.29%)、一級(jí)(174人,占22.80%)、二級(jí)(352人,占46.13%)以及無(wú)運(yùn)動(dòng)等級(jí)(189人,占24.77%)。項(xiàng)目涵蓋了籃球、排球、足球、乒乓球、網(wǎng)球、羽毛球、摔跤、跆拳道、空手道、擊劍、拳擊、撐桿跳、跳高、體操等。
2.2 研究方法
2.2.1 問(wèn)卷調(diào)查法
本研究采用中文簡(jiǎn)化版《特質(zhì)流暢量表》(Jackson等人編制,劉維娜跨文化檢驗(yàn)與簡(jiǎn)化,本研究采用中文簡(jiǎn)化版本[6,7])作為測(cè)量工具進(jìn)行施測(cè)。相關(guān)研究顯示,該工具各維度均具有較好的信效度水平(表1)。該量表包括流暢狀態(tài)的9個(gè)維度,即挑戰(zhàn)-技能平衡、清晰的目標(biāo)、行動(dòng)-意識(shí)融入、全神貫注于當(dāng)前任務(wù)、時(shí)間的變化、自我意識(shí)的喪失、控制感、明確的反饋以及享受的體驗(yàn)。采用李克特式5點(diǎn)記分法,包括從未(“1”)、很少(“2”)、有時(shí)(“3”)、經(jīng)常(“4”)、總是(“5”),且題序沿用了中文版《特質(zhì)流暢量表》的題項(xiàng)序號(hào),即V1~V33。由于在多個(gè)地點(diǎn)施測(cè),本研究統(tǒng)一制定了一致的測(cè)評(píng)原則,首先,由帶隊(duì)教練員或教師統(tǒng)一組織足夠長(zhǎng)的時(shí)間統(tǒng)一施測(cè),保證運(yùn)動(dòng)員作答時(shí)間;其次,教練員或教師說(shuō)明認(rèn)真填寫的現(xiàn)實(shí)意義,例如:可能根據(jù)各自的薄弱環(huán)節(jié)提出針對(duì)性建議等等,同時(shí)確保作答結(jié)果將完全保密;最后,要保證運(yùn)動(dòng)員在作答過(guò)程中并無(wú)商討。
2.2.2 數(shù)理統(tǒng)計(jì)法
本研究主要通過(guò)對(duì)CTT、IRT以及FT中的一些方法運(yùn)用,例如:CTT中的臨界比率法、積差相關(guān)法、因子分析法等等(SPSS 16.0軟件實(shí)現(xiàn)),IRT中的區(qū)分度分析、難度分析、最大信息量分析(IRTPRO軟件實(shí)現(xiàn)),以及FI中的映射語(yǔ)句分析、SSA等(Hudap軟件實(shí)現(xiàn)),來(lái)對(duì)研究提出的假設(shè)做以驗(yàn)證。
表1 本研究《特質(zhì)流暢量表》的基本情況一覽表
Table 1 A List of Dispositional Flow Scale
維度情況 題 項(xiàng)信度情況 效度情況挑戰(zhàn)-技能平衡V1、V8、V17、V250.720χ2=1274.71、df=459、CFI=0.902、NNFI=0.887、SRMR=0.05、RMSEA=0.051行動(dòng)-意識(shí)融合V9、V18、V260.672清晰的目標(biāo)V2、V10、V270.763明確的反饋V3、V11、V19、V280.784全神貫注于當(dāng)前任務(wù)V4、V12、V20、V290.776控制感V13、V21、V300.713時(shí)間的變化V6、V15、V23、V320.774自我意識(shí)的喪失V5、V14、V22、V310.722享受的體驗(yàn)V7、V16、V24、V330.779
量表中題項(xiàng)的建立是量表編制過(guò)程中的重要步驟,目前,我國(guó)體育科學(xué)量表題項(xiàng)的建立主要采用訪談法、問(wèn)卷調(diào)查法、相關(guān)量表引用法、理論分析法等,當(dāng)然,這些方法均有各自的優(yōu)點(diǎn),通過(guò)這些方法,也已編制出了信效度很好的體育科學(xué)測(cè)評(píng)量表。但是,它們的缺點(diǎn)也是顯而易見的,比如:訪談法中調(diào)查對(duì)象的隱蔽性及主、被試之間的交互影響、理論分析法的主觀色彩以及科學(xué)研究范式的欠缺等。就拿題項(xiàng)初始建立而言,目前,大多數(shù)體育科學(xué)測(cè)評(píng)量表對(duì)效度的控制主要放在了題項(xiàng)建立之后,包括專家對(duì)量表內(nèi)容效度的評(píng)價(jià)以及之后的信效度檢驗(yàn)等。事實(shí)上,在題項(xiàng)的建立之初,就應(yīng)該具有較好的內(nèi)容效度,才能進(jìn)一步保證后續(xù)分析的科學(xué)性。因?yàn)?,題項(xiàng)的質(zhì)量從一開始就牽制著后期的種種努力行為[4]。
從具體測(cè)評(píng)量表的題項(xiàng)中也不時(shí)會(huì)發(fā)現(xiàn)一些問(wèn)題,不少題項(xiàng)存在讓受試者產(chǎn)生模棱兩可的感覺(jué),因?yàn)檫@樣的題項(xiàng)同時(shí)包括了有交集的多個(gè)概念詞語(yǔ)。究其原因,這與題項(xiàng)建立階段缺乏規(guī)范化有一定的關(guān)聯(lián),尤其是方法運(yùn)用的規(guī)范性。另外,在許多體育科學(xué)測(cè)評(píng)量表的編制之初,提到了在開放式訪談法中遵循問(wèn)題的提綱來(lái)展開,從而把握面談的方向與節(jié)奏[14],盡管這有利于對(duì)后續(xù)結(jié)構(gòu)的構(gòu)建,但是,并未明確指出是如何構(gòu)建這一提綱,這一提綱的科學(xué)范式如何也沒(méi)有明確指出?;谶@些現(xiàn)象,筆者認(rèn)為,這類研究的重點(diǎn)放在后續(xù)的量表檢驗(yàn)與驗(yàn)證上是欠妥的,而應(yīng)該在題項(xiàng)建立之初就應(yīng)該使之具有較好的內(nèi)容效度。由此看來(lái),體育科學(xué)研究中量表題項(xiàng)的編制從方法上得以突破是一個(gè)重要的現(xiàn)實(shí)趨勢(shì),格特曼提出的映射語(yǔ)句具有范式化分析的特點(diǎn),強(qiáng)調(diào)了理論構(gòu)建與概念結(jié)構(gòu)的合理性,在幫助科研人員窮盡和區(qū)分相關(guān)概念、變量的基礎(chǔ)上,深入挖掘更有含義的語(yǔ)句,從而使量表在建立之初就具有較好的內(nèi)容效度。
本研究依據(jù)運(yùn)動(dòng)員《特質(zhì)流暢量表》為藍(lán)本(9個(gè)維度),遵循FT理論將該量表各維度進(jìn)行歸屬分類,設(shè)計(jì)映射語(yǔ)句(圖1)。一個(gè)事件的完成,必然包括任務(wù)層面、時(shí)間層面以及行為層面,而流暢狀態(tài)的9個(gè)維度,均可以很好的通過(guò)這些層面來(lái)對(duì)其進(jìn)行分類。通過(guò)對(duì)層面理論的映射語(yǔ)句進(jìn)行范式化分析,可以發(fā)現(xiàn)理論構(gòu)建和概念結(jié)構(gòu)的合理性。通過(guò)分析,本研究進(jìn)一步發(fā)現(xiàn)如下兩類問(wèn)題:
1.理論構(gòu)建因素涵蓋不全,例如,行為層面中,僅享受的體驗(yàn)維度屬于情緒行為,而這一維度的題項(xiàng)或是主要集中在一些社會(huì)化情緒,例如:榮譽(yù)感、自豪感等,或者主要集中在基本情緒,例如:快樂(lè)等。然而,卻缺乏對(duì)復(fù)合情緒的涉及,例如:焦慮、羞愧等。但是,在高水平運(yùn)動(dòng)員的比賽中,這種對(duì)復(fù)合情緒的控制感似乎是一個(gè)非常關(guān)鍵的因素,而在運(yùn)動(dòng)員特質(zhì)流暢狀態(tài)維度的理論構(gòu)建時(shí),卻缺少對(duì)這一內(nèi)容的設(shè)計(jì),這從問(wèn)卷題項(xiàng)上可以得到證實(shí)。當(dāng)然,流暢狀態(tài)的任務(wù)層面與時(shí)間層面中因素的涉及還是較為合理的。
同時(shí),在這里需要指明的是,內(nèi)容涵蓋面僅是量表編制的一個(gè)方面,題項(xiàng)的重復(fù)交叉是不可回避的又一問(wèn)題。由于心理學(xué)家在編制量表時(shí)常常處于兩難境地,即如果希望提高信度,最簡(jiǎn)單的辦法之一就是車轱轆話來(lái)回問(wèn)。如果希望提高內(nèi)容的全面性(覆蓋面),最簡(jiǎn)單的方法之一就是問(wèn)相互關(guān)聯(lián)但有所不同的問(wèn)題,這常常導(dǎo)致內(nèi)部一致性的下降。而這里談到的層面理論中的映射語(yǔ)句,雖然也能夠?qū)崿F(xiàn)交叉重復(fù)性題項(xiàng)的編制,但更側(cè)重于提高量表內(nèi)容的全面性(覆蓋面),這就可能導(dǎo)致內(nèi)部一致性的下降。因此,研究提示,采用映射語(yǔ)句方法應(yīng)該結(jié)合其他方法(有助于信度提高的方法)一同來(lái)彌補(bǔ)這一兩難境地。當(dāng)然,研究中還得根據(jù)研究者的需要而定。
2.缺乏對(duì)更深層次題項(xiàng)的挖掘,從該量表的題項(xiàng)可知,應(yīng)該設(shè)計(jì)一些能夠深入挖掘運(yùn)動(dòng)員流暢狀態(tài)的高層次含義的題項(xiàng),例如:我的既定任務(wù)失敗后,通過(guò)客觀分析原因出色完成了任務(wù),從而享受這一過(guò)程(映射語(yǔ)句組合:a1b3c9),這似乎是高水平運(yùn)動(dòng)員的一種更高境界。當(dāng)然,設(shè)計(jì)深層次含義的題項(xiàng),并不代表在項(xiàng)目分析中必然被保留,只是一份科學(xué)量表的項(xiàng)目設(shè)計(jì)初期,包括這類的項(xiàng)目而已。
綜上分析,F(xiàn)T理論中的映射語(yǔ)句應(yīng)用于體育科學(xué)測(cè)評(píng)量表題項(xiàng)的編制初期存在一定的優(yōu)勢(shì),尤其是對(duì)內(nèi)容效度的構(gòu)建,包括,有助于題項(xiàng)覆蓋內(nèi)容的全面性,從而提高內(nèi)容效度以及對(duì)深層次題項(xiàng)的挖掘等。
圖1 本研究運(yùn)動(dòng)員特質(zhì)流暢狀態(tài)映射語(yǔ)句圖
Figure 1. Mapping Sentence of Athletes Dispositional Flow State
運(yùn)動(dòng)員《特質(zhì)流暢量表》的項(xiàng)目刪減主要依據(jù)CTT中的因子載荷、修正指數(shù)等相關(guān)指標(biāo)。盡管后來(lái)研究中也進(jìn)行了進(jìn)一步的刪減,依據(jù)也僅是選擇每個(gè)維度中最大的因子載荷來(lái)設(shè)定,如果載荷相似,則根據(jù)題項(xiàng)的表面效度來(lái)決定[近期,Jackson(2008)僅采用每個(gè)維度中因子載荷最大的題項(xiàng)來(lái)反映各維度[30]]。而采用CTT對(duì)量表的項(xiàng)目進(jìn)行刪減時(shí)還存在很多方法,在我國(guó)大部分體育科學(xué)量表編制的研究中也一直有所沿用。有研究指出[1],在對(duì)量表進(jìn)行題項(xiàng)刪減時(shí),臨界比率法、積差相關(guān)法、標(biāo)準(zhǔn)差法以及因素分析法是必不可少的。為此,本研究運(yùn)用CTT與IRT的相關(guān)方法對(duì)收集的數(shù)據(jù)進(jìn)行了項(xiàng)目分析:1)驗(yàn)證CTT與IRT的結(jié)合,能否對(duì)量表做進(jìn)一步刪減(檢驗(yàn)1);2)驗(yàn)證兩種理論的結(jié)合應(yīng)用于運(yùn)動(dòng)員這一群體在比賽這一特定情境中,樣本量多少較為合適(檢驗(yàn)2)。
4.1 檢驗(yàn)1
首先,采用CTT中的鑒別指數(shù)法、標(biāo)準(zhǔn)差法、相關(guān)分析法以及因素分析法分別對(duì)運(yùn)動(dòng)員《特質(zhì)流暢量表》進(jìn)行了項(xiàng)目分析(樣本量:763人)。1)鑒別指數(shù)法:計(jì)算量表總分,并分別對(duì)其進(jìn)行降序、升序排列,找出得分前27%和得分后27%的分?jǐn)?shù)值,將其分為高分組和低分組,并對(duì)高、低分組的所有題目進(jìn)行獨(dú)立樣本t檢驗(yàn)。結(jié)果發(fā)現(xiàn),所有題目均存在顯著性差異(P<0.01),因此,根據(jù)此方法并未對(duì)項(xiàng)目進(jìn)行刪減。2)標(biāo)準(zhǔn)差法:通過(guò)對(duì)量表題項(xiàng)進(jìn)行描述性統(tǒng)計(jì),找出那些標(biāo)準(zhǔn)差小于1的題項(xiàng),由于標(biāo)準(zhǔn)差過(guò)小,說(shuō)明被試回答較為集中,缺乏鑒別力,應(yīng)予以刪除,通過(guò)分析,發(fā)現(xiàn)V11(SD=0.852)、V14(SD=0.884)、V15(SD=0.896)、V33(SD=0.812)4個(gè)題項(xiàng)的標(biāo)準(zhǔn)差小于1,因此將其刪除。3)積差相關(guān)法:通過(guò)對(duì)量表題項(xiàng)得分與總得分進(jìn)行相關(guān)分析,刪除那些r<0.3的題項(xiàng),因?yàn)檫@些題項(xiàng)與量表的整體構(gòu)念關(guān)系不大。而本研究在實(shí)際分析中,各個(gè)題項(xiàng)均與量表總分存在顯著性相關(guān)(P<0.01),因此,該步驟中并無(wú)題項(xiàng)刪減。4)因素分析法:項(xiàng)目分析階段共進(jìn)行了兩次因素分析,每次分析均對(duì)數(shù)據(jù)做以KMO和Bartlett的球形檢定(第1次:0.894,P<0.001;第2次:0.895,P<0.001),采用抽取因素的方法為主成分分析法,并勾選相關(guān)矩陣、陡坡圖,特征值設(shè)定為1,選擇最大變異法進(jìn)行正交轉(zhuǎn)軸。第1次分析由于V6、V23僅2個(gè)題項(xiàng)在一個(gè)因素層面內(nèi),涵蓋內(nèi)容較少,將其刪除,而第2次因素分析則每個(gè)因素層面均大于3個(gè)題項(xiàng)。基于以上分析,采用CTT的這4種方法最終刪減6項(xiàng)題目。
表2 本研究CTT相關(guān)方法對(duì)《特質(zhì)流暢量表》的刪減一覽表
Table 2 The Statistic of Dispositional Flow Scale Deleted by CTT
方法 刪題標(biāo)準(zhǔn)刪除題項(xiàng)第1步臨界比率法高(前27%)、低(后27%)組獨(dú)立樣本t檢驗(yàn),若P>0.05,刪除題項(xiàng)。無(wú)第2步標(biāo)準(zhǔn)差法 若SD<1,則刪除題項(xiàng)V11(SD=0.852);V14(SD=0.884);V15(SD=0.896);V33(SD=0.812)第3步積差相關(guān)法若r<0.30,則刪除題項(xiàng)無(wú)第4步因素分析法若萃取的因子中僅包括2個(gè)及以下題項(xiàng),則刪除該因子所包括的題項(xiàng)。第1次刪除:V6;V23第2次刪除:0
其次,采用IRT中(雙參數(shù)Logistic模型)的區(qū)分度指標(biāo)(a)、難度指標(biāo)(b)以及信息量指標(biāo)(Imax)對(duì)剩余題項(xiàng)做進(jìn)一步刪減①篩選的標(biāo)準(zhǔn):有的研究提出a≤0.2,或者a≥3;b≤-3或b≥4則需要將其刪除;有的提出a≤0.3,或者a≥4;b≤-2.59或b≥2.59;c≥0.4。本研究中設(shè)定為a≤0.2或a≥3,b≤-3或b≥4。另外,信息量可以用于評(píng)價(jià)一個(gè)量表的信度,即用信息量來(lái)代表信度的概念,并把信息量定義到了每個(gè)題項(xiàng)及其被試上,可以為檢驗(yàn)結(jié)果是否可信提供更優(yōu)的信度,一般情況下,Imax≤0.2時(shí)認(rèn)為該題項(xiàng)提供的信息量較少,應(yīng)予以刪除。,運(yùn)用IRTPRO軟件對(duì)數(shù)據(jù)進(jìn)行分析,IRT最重要的檢驗(yàn)為單維性檢驗(yàn),通常,采用探索性因素分析結(jié)果的第1因素特征根大于第2因素特征根3倍及其以上這一標(biāo)準(zhǔn)來(lái)進(jìn)行檢驗(yàn)[37]。本研究通過(guò)對(duì)剩余題項(xiàng)進(jìn)行探索性因素分析,發(fā)現(xiàn)第1因素特征根為7.556,第2因素特征根為2.051,第1因素特征根是第2因素特征根的3.684倍,因此符合標(biāo)準(zhǔn)。且從陡坡圖來(lái)看,第1因素到第2因素直線下降,拐點(diǎn)明顯,符合單維性檢驗(yàn)?;谝陨蠙z驗(yàn),此量表剩余題項(xiàng)適宜進(jìn)行IRT分析。通過(guò)IRT分析發(fā)現(xiàn),依據(jù)區(qū)分度指標(biāo)并未對(duì)任何題項(xiàng)進(jìn)行刪減(標(biāo)準(zhǔn):a≤0.2或a≥3[39]),而難度指標(biāo)則對(duì)V1(b=-3.55)、V3(b=-4.71)、V5(b=-6.27)、V9(b=-4.86)、V10(b=-3.40)、V20(b=-4.36)以及V32(b=-4.86)可進(jìn)行刪除(標(biāo)準(zhǔn):b≤-3或b≥4[39]),最大信息量指標(biāo)則應(yīng)該將V5(Imax=0.04)、V18(Imax=0.19)、V22(Imax=0.09)、V31(Imax=0.12)以及V32(Imax=0.15)予以刪除(標(biāo)準(zhǔn):Imax≤0.2[39])。因此,通過(guò)IRT的區(qū)分度、難度以及最大信息量指標(biāo)可刪除10道題項(xiàng),具體情況見表3。
綜上分析,不僅CTT中的方法能夠?qū)︻}項(xiàng)進(jìn)一步篩選,而且,在采用CTT中的方法進(jìn)行刪減之后,IRT分析仍能夠?qū)︻}項(xiàng)進(jìn)行更深層次的精簡(jiǎn),從而說(shuō)明僅通過(guò)CTT對(duì)量表的項(xiàng)目分析并不能代替IRT分析。因此,兩者的結(jié)合,有利于體育科學(xué)量表題項(xiàng)的進(jìn)一步刪減和精確。
表3 本研究IRT對(duì)《特質(zhì)流暢量表》的刪減一覽表
Table 3 The Statistic of Dispositional Flow Scale Deleted by IRT
題項(xiàng)as.e.bs.e.ImaxV11.410.14-3.550.360.36V31.060.12-4.710.580.27V50.430.09-6.271.300.10V90.980.12-4.860.630.23V101.300.14-3.400.340.31V180.810.12-2.410.170.19V201.170.14-4.360.540.29V220.470.10-1.970.140.09V310.640.11-2.160.210.12V320.100.03-4.860.590.15
4.2 檢驗(yàn)2
一個(gè)值得思考的問(wèn)題,兩種理論的結(jié)合是應(yīng)該按照哪種理論所必須的樣本數(shù)量來(lái)進(jìn)行調(diào)查,無(wú)可否認(rèn)的是,樣本數(shù)量越大,既可為量表的編制提高精確度,也有助于提高結(jié)果的穩(wěn)定性。但是,在條件有限的情況下,設(shè)計(jì)合適的調(diào)查樣本,既可以避免耗時(shí)耗力的弊端,也可以得出較為科學(xué)的測(cè)評(píng)量表。而就CTT和IRT兩種理論應(yīng)用于體育科學(xué)量表編制時(shí)所需要的樣本量問(wèn)題,目前似乎并無(wú)一致結(jié)論,大多數(shù)研究也只能根據(jù)實(shí)際情況而定。對(duì)于CTT的研究而言,描述性研究的樣本數(shù)最好占母群體的10%,相關(guān)研究、因果比較研究最好受試者在30人以上等等。而對(duì)于IRT,使用雙參數(shù)模型最好被試在600人以上。但是,在體育科學(xué)研究領(lǐng)域,許多研究的樣本量會(huì)受到限制,兩種理論整合應(yīng)用于體育科學(xué)量表編制中項(xiàng)目分析時(shí)樣本量多少合適還有待于進(jìn)一步探索?;诖?,本研究通過(guò)CTT中前面所述的4種方法(鑒別指數(shù)法、標(biāo)準(zhǔn)差法、相關(guān)分析法以及因素分析法)以及IRT(區(qū)分度指標(biāo)a、難度指標(biāo)b以及最大信息量指標(biāo)Imax)對(duì)100名、200名、300名、400名、500名、600名以及700名的樣本量依次進(jìn)行了項(xiàng)目分析(順序依然按照先CTT后IRT,圖2)。通常,對(duì)于新量表的編制而言,CTT的刪題數(shù)量會(huì)多于IRT分析,但是,由于該研究所采用的量表是以往學(xué)者基于CTT方法分析所得,因此,在圖2中所表現(xiàn)為CTT刪題曲線在IRT之下。同時(shí),圖2展示了樣本量的一個(gè)關(guān)鍵問(wèn)題,即CTT在樣本達(dá)到300名左右時(shí),刪題數(shù)量達(dá)到穩(wěn)定,而IRT在樣本量達(dá)到400名左右時(shí),刪題數(shù)量才逐漸穩(wěn)定,若樣本量少于這一界限,會(huì)存在部分題項(xiàng)誤刪的可能性?;诖?,研究認(rèn)為,兩種理論的結(jié)合應(yīng)用于體育科學(xué)量表編制時(shí),樣本量應(yīng)該不少于400名受試者。
圖2 本研究CTT、IRT對(duì)不同樣本量刪題數(shù)目統(tǒng)計(jì)示意圖
測(cè)驗(yàn)的信度是指測(cè)驗(yàn)的可靠程度,它表現(xiàn)為測(cè)驗(yàn)結(jié)果的一貫性、一致性、再現(xiàn)性以及穩(wěn)定性,而效度是指一個(gè)測(cè)驗(yàn)在測(cè)量某項(xiàng)指標(biāo)時(shí)所具有的準(zhǔn)確程度或有效程度[19]。對(duì)量表的信、效度分析是體育科學(xué)量表編制的必備過(guò)程。我國(guó)學(xué)者對(duì)體育科學(xué)測(cè)評(píng)量表信度的分析通常采用的是克隆巴赫α系數(shù),而對(duì)效度的分析也主要集中于結(jié)構(gòu)效度。在信度方面,一個(gè)量表或分量表僅給出一個(gè)克隆巴赫α系數(shù)可能會(huì)有不妥之處,即存在高信度題項(xiàng)掩蓋低信度題項(xiàng)的可能性,這也許是體育科學(xué)量表的癥結(jié)所在?;谶@一認(rèn)識(shí),本節(jié)主要檢驗(yàn)運(yùn)用IRT中的信息量來(lái)代表信度的概念,并將信息量定義到每個(gè)題項(xiàng)上,從而檢驗(yàn)與CTT中體現(xiàn)宏觀特性的方法進(jìn)行優(yōu)化組合的可行性(檢驗(yàn)1)。事實(shí)上,對(duì)結(jié)構(gòu)效度的重視有一定的必然性,無(wú)論是效標(biāo)效度還是內(nèi)容效度,在與結(jié)構(gòu)效度相比時(shí)均不會(huì)完全處于同一地位,結(jié)構(gòu)效度作為一個(gè)廣泛的概念在一定程度上包括了其他效度[9]。當(dāng)然,在有充足條件的情況下,對(duì)其他效度均應(yīng)加以檢驗(yàn)。為了避免對(duì)量表結(jié)構(gòu)效度的檢驗(yàn)時(shí)過(guò)分強(qiáng)調(diào)定量分析,而忽視研究?jī)?nèi)容的概念理論框架,本節(jié)采用結(jié)構(gòu)方程模型與SSA的組合來(lái)對(duì)《特質(zhì)流暢量表》剩余題項(xiàng)組成的量表進(jìn)行了結(jié)構(gòu)效度分析,檢驗(yàn)兩者的結(jié)合是否能使理論與統(tǒng)計(jì)相權(quán)衡(檢驗(yàn)2)。檢驗(yàn)步驟:1)運(yùn)用結(jié)構(gòu)方程模型檢驗(yàn)結(jié)構(gòu)效度,統(tǒng)計(jì)擬合指數(shù);2)運(yùn)用驗(yàn)證性SSA進(jìn)行驗(yàn)證,并結(jié)合理論探討題項(xiàng)是否應(yīng)該重新界定,若題項(xiàng)有改變,則再次進(jìn)行結(jié)構(gòu)方程模型分析,對(duì)比前后擬合指數(shù),從而確定最佳選擇。
5.1 檢驗(yàn)1
該部分主要檢驗(yàn)CTT給量表一個(gè)統(tǒng)一信度指標(biāo)的同時(shí),IRT是否能夠相應(yīng)的補(bǔ)全每個(gè)測(cè)驗(yàn)項(xiàng)目的信度情況,對(duì)CTT理論的缺陷加以彌補(bǔ),從而為后續(xù)研究將兩者結(jié)合更好的應(yīng)用于體育科學(xué)量表編制中提供借鑒。研究采用克隆巴赫α系數(shù)對(duì)整體量表信度進(jìn)行了檢驗(yàn),檢驗(yàn)結(jié)果為克隆巴赫α系數(shù)=0.881(剩余17個(gè)題項(xiàng)),從整體量表來(lái)看,信度較高。而從每個(gè)維度來(lái)看(表4),由于刪除題項(xiàng)后,自我意識(shí)的喪失維度與時(shí)間的變換維度的題項(xiàng)均未被保留,僅剩下7個(gè)維度,而這7個(gè)維度中,又有部分維度僅存在一個(gè)題項(xiàng)(行動(dòng)-意識(shí)融合)或兩個(gè)題項(xiàng)(清晰的目標(biāo)、明確的反饋以及享受的體驗(yàn)),致使克隆巴赫α系數(shù)值不高(<0.60),僅挑戰(zhàn)-技能的平衡、關(guān)注于當(dāng)前任務(wù)以及控制感維度具有較好的信度,克隆巴赫α系數(shù)均大于0.65。導(dǎo)致這一原因主要有兩點(diǎn):1)由于量表是依據(jù)定性方法所得,在設(shè)置維度的題項(xiàng)時(shí),所設(shè)計(jì)內(nèi)容不全面,換句話說(shuō),量表的初始內(nèi)容效度欠佳,這一點(diǎn)也可以從前面所述的映射語(yǔ)句對(duì)量表維度分析時(shí)得以證實(shí);2)盡管有關(guān)研究表明[16],在一個(gè)潛變量含義很清晰的情況下,該變量可用2個(gè)甚至1個(gè)可測(cè)變量來(lái)反映,但是,不可否認(rèn)的是,該研究部分維度的克隆巴赫α系數(shù)值較低,而總量表信度較高,說(shuō)明量表維度設(shè)置過(guò)多又是另一因素,可能需要進(jìn)一步更改維度的設(shè)置。
表4 本研究量表的信度檢驗(yàn)(克隆巴赫α系數(shù))一覽表
Table 4 Reliability Test of the Scale(Cloning Bach Alpha)
總量表平衡目標(biāo)反饋集中控制享受融合時(shí)間意識(shí)0.8820.6710.5520.5790.6810.6600.554僅1題無(wú)題無(wú)題
從各個(gè)題項(xiàng)來(lái)看,通過(guò)IRT分析(IRTPRO軟件實(shí)現(xiàn)),剩余17個(gè)題項(xiàng)均具有很好的信度(Imax≥0.3),由此,本研究給出了題項(xiàng)V2的項(xiàng)目特征曲線和信息量混合曲線圖,也給出了在項(xiàng)目分析中根據(jù)信息量指標(biāo)所刪除的題項(xiàng)V5的項(xiàng)目特征曲線和信息量混合曲線圖(圖3)。首先,從項(xiàng)目特征曲線來(lái)分析,在理想狀態(tài)下第0條曲線(對(duì)應(yīng)本研究量表題項(xiàng)選擇中的1分值)應(yīng)該是一個(gè)單調(diào)遞減曲線,即隨著受試者能力水平的提高,得1分的幾率逐漸降低。第4條曲線(5分值)應(yīng)該是一個(gè)單調(diào)遞增曲線,即隨著受試者能力水平的提高,得5分的幾率逐漸提升。而項(xiàng)目第1~3條曲線(2~4分值)應(yīng)該符合正態(tài)分布。但是,在實(shí)際中,很多時(shí)候并不能完全符合這種理想狀態(tài)。本研究的題項(xiàng)V2較為符合這種狀態(tài),說(shuō)明該題項(xiàng)能夠很好的對(duì)不同水平的受試者進(jìn)行區(qū)分。當(dāng)然,所剩余的其他題項(xiàng)也基本滿足項(xiàng)目特征曲線這一特點(diǎn),這里不做一一列舉,而通過(guò)項(xiàng)目分析中所刪除的V5,卻無(wú)法體現(xiàn)這種項(xiàng)目特征曲線的特征,區(qū)分能力較差。其次,就信息量來(lái)看,V2的最大信息量在0.8以上,說(shuō)明信息量較大,該題項(xiàng)的信度較高,而V5的信息量?jī)H在0.1的水平(刪除標(biāo)準(zhǔn)為Imax≤0.2),說(shuō)明該題項(xiàng)的信度欠佳。
由此看來(lái),CTT從宏觀分析給出量表的整體信度之后,通過(guò)IRT可以從微觀進(jìn)一步得到各個(gè)題項(xiàng)的信度情況(驗(yàn)證假設(shè)3)。這種結(jié)合,不僅提高了體育科學(xué)測(cè)評(píng)量表編制的科學(xué)性和準(zhǔn)確性,也有助于后續(xù)研究進(jìn)一步探討某個(gè)特定能力的特質(zhì)水平點(diǎn)。
圖3 本研究題項(xiàng)V2、V5的項(xiàng)目特征曲線與信息量混合示意圖
5.2 檢驗(yàn)2
采用結(jié)構(gòu)方程模型與SSA的組合來(lái)對(duì)量表的結(jié)構(gòu)效度進(jìn)行檢驗(yàn),主要針對(duì)于維度的設(shè)定來(lái)自探索性因素分析。因?yàn)?,該結(jié)合的主要目的是為了避免量表將統(tǒng)計(jì)置于理論之上的缺陷 ,即通過(guò)探索性因素分析后,根據(jù)因素內(nèi)主要題項(xiàng)代表的理論概念來(lái)命名維度。但是,通常情況下各維度中又存在與大多數(shù)題項(xiàng)代表概念不一的題項(xiàng),又不能想當(dāng)然的將該題進(jìn)行重新歸類,需要有統(tǒng)計(jì)上的支持。由于《特質(zhì)流暢量表》在編制之初的9個(gè)維度是依據(jù)定性方法所得,同時(shí),考慮前面分析該量表維度過(guò)多可能是導(dǎo)致分量表信度較低的一個(gè)原因。因此,本研究?jī)H對(duì)探索性因素分析所得維度結(jié)構(gòu)進(jìn)行檢驗(yàn),并通過(guò)這一檢驗(yàn)過(guò)程來(lái)驗(yàn)證這一方法優(yōu)化的可行性。
首先,本研究對(duì)量表剩余題項(xiàng)(17項(xiàng))進(jìn)行探索性因素分析。當(dāng)然,在量表編制中這一步驟應(yīng)該放于項(xiàng)目分析階段來(lái)進(jìn)行,但是,本研究并非是編制量表,而只是對(duì)兩者的優(yōu)化構(gòu)想做以實(shí)證。因此,在通過(guò)探索性因素分析之后,緊接著對(duì)量表結(jié)構(gòu)效度進(jìn)行檢驗(yàn),做以明確對(duì)比,以更好的凸顯本研究的實(shí)際研究目的。探索性因素分析的KMO值為0.910,球形檢驗(yàn)的卡方值為1 900.847,自由度為136,且在0.001水平上達(dá)到顯著,因此,適宜進(jìn)行因素分析(表5)。從累計(jì)解釋方差百分比來(lái)看,僅為49.468%,數(shù)值偏低,主要原因在于量表內(nèi)容效度不高,這也正呼應(yīng)了本研究在第1部分中的研究結(jié)論。從萃取的因素來(lái)看(設(shè)定特征值大于1),共得到3個(gè)因素,第1個(gè)因素中的題項(xiàng)主要涉及到原量表的挑戰(zhàn)-技能平衡、行動(dòng)-意識(shí)融合以及控制感3個(gè)維度,因此,將其命名為挑戰(zhàn)-行為控制的融合,即比賽情境的高要求與運(yùn)動(dòng)員行為控制能力的平衡;第2因素中的題項(xiàng)主要涉及到原量表中明確反饋與享受體驗(yàn)2個(gè)維度。因此,將其命名為反饋-享受的體驗(yàn),即運(yùn)動(dòng)員對(duì)比賽的表現(xiàn)做出反饋,并享受認(rèn)知結(jié)果的體驗(yàn)過(guò)程;第3因素則主要涉及清晰的目標(biāo)與全神貫注于當(dāng)前任務(wù)2個(gè)維度,因此,命名為目標(biāo)-集中,只有集中于目前任務(wù),設(shè)定目標(biāo)才能進(jìn)一步施展行為。當(dāng)然,本研究對(duì)其有何種命名并不是重點(diǎn),重點(diǎn)在于通過(guò)探索性因素分析所設(shè)定維度的量表,如何在信效度檢驗(yàn)中避免將統(tǒng)計(jì)置于理論之上的缺陷(驗(yàn)證假設(shè)3)。
表5 本研究運(yùn)動(dòng)員特質(zhì)流暢狀態(tài)探索性因素分析及其因子命名一覽表
Table 5 The List for Exploratory Factor Analysis and Factor Named of Athletes Dispositional Flow State
主成分特征值(旋轉(zhuǎn)-未旋轉(zhuǎn))累計(jì)解釋方差百分比題項(xiàng) 主成分命名因子載荷13.210-5.90518.883V17挑戰(zhàn)-行為控制融合0.677V130.660V210.610V80.584V250.575V300.564V260.538V240.46522.678-1.38634.634V7反饋-享受的體驗(yàn)0.670V190.599V160.570V280.555V290.53732.522-1.11849.468V4目標(biāo)-集中0.722V20.613V120.570V270.516
隨后,通過(guò)結(jié)構(gòu)方程模型結(jié)合SSA技術(shù)對(duì)量表結(jié)構(gòu)效度進(jìn)行了分析。第1步,運(yùn)用Amos 17.0軟件實(shí)現(xiàn)了對(duì)量表結(jié)構(gòu)效度的初步驗(yàn)證工作,在分析中勾選了最大似然估計(jì)、模型擬合等指標(biāo),并對(duì)輸出報(bào)告的模型擬合指標(biāo)進(jìn)行了初步統(tǒng)計(jì),做好記錄。第2步,采用FT的SSA技術(shù)進(jìn)行分析,在分析時(shí),僅設(shè)定了一個(gè)層面,但該層面分為3個(gè)元素,對(duì)應(yīng)于量表的3個(gè)維度(挑戰(zhàn)-行為控制融合、反饋-享受的體驗(yàn)、目標(biāo)-集中),分析過(guò)程中,對(duì)各個(gè)元素中的題項(xiàng)進(jìn)行了對(duì)應(yīng)的屬性設(shè)定。圖4展示了SSA分析的兩種結(jié)構(gòu)的整合(分析時(shí)單個(gè)進(jìn)行分析),即極化結(jié)構(gòu)與模塊結(jié)構(gòu),同時(shí)也對(duì)應(yīng)的給出了異化系數(shù)①異化系數(shù):是SSA技術(shù)的重要評(píng)價(jià)指標(biāo)為異化系數(shù)與區(qū)域化系數(shù),其中,異化系數(shù)表示與完美擬合之間的差異,其值不超過(guò)0.20是可以接受的[24]。和區(qū)域化系數(shù)②區(qū)域化系數(shù):是指維度對(duì)空間圖進(jìn)行的完美分區(qū)程度,取值范圍在0~1之間,數(shù)值越大,區(qū)分度越好,在0.90以上可以認(rèn)為結(jié)構(gòu)較為合理[34]。擬合指標(biāo)情況。從圖4左圖來(lái)看,兩種結(jié)構(gòu)的異化系數(shù)為0.15654,在合理范圍之內(nèi),區(qū)域化系數(shù)為1,說(shuō)明該量表的維度能夠?qū)臻g圖進(jìn)行完美的區(qū)分。就圖4右圖而言,異化系數(shù)與左圖一樣,而極化結(jié)構(gòu)的區(qū)域化系數(shù)為0.933,模塊結(jié)構(gòu)的區(qū)域化系數(shù)為0.917。盡管這一結(jié)果說(shuō)明量表維度不能夠?qū)臻g圖進(jìn)行完美區(qū)分,但是依然在0.90以上,因此,具有合理的結(jié)構(gòu)。進(jìn)一步觀察右圖出現(xiàn)偏差的原因,主要在于題項(xiàng)V24劃分到了反饋-享受的體驗(yàn)維度,而題項(xiàng)V29劃分到了目標(biāo)-集中維度。就題項(xiàng)內(nèi)容來(lái)看,似乎V24(這種體驗(yàn)讓我感到欣喜若狂)更加符合反饋-享受的體驗(yàn)維度,V29(我全神貫注于當(dāng)前的任務(wù))也更符合目標(biāo)-集中維度。盡管左圖展示了V24在挑戰(zhàn)-行為控制融合維度,V29在反饋-享受的體驗(yàn)所得出的區(qū)域化系數(shù)更高,但是結(jié)合理論來(lái)分析,右圖的劃分更加符合實(shí)際。由此推測(cè),對(duì)于通過(guò)探索性因素分析這種單純依據(jù)統(tǒng)計(jì)所得維度的量表,可能會(huì)造成在理論上的不足,同時(shí),也不能想當(dāng)然的依據(jù)題項(xiàng)含義對(duì)題項(xiàng)進(jìn)行重新界定,而通過(guò)SSA技術(shù),便能夠給以題項(xiàng)進(jìn)行重新界定的理由,理論方面也可能更為符合實(shí)際。同時(shí),部分研究在編制量表時(shí)[15],通過(guò)SSA技術(shù)來(lái)進(jìn)行題項(xiàng)刪減,但通過(guò)本研究來(lái)看,將跨區(qū)域題項(xiàng)刪除似乎存在一定的缺陷,這將導(dǎo)致應(yīng)該歸屬于另一區(qū)域的題項(xiàng)誤刪的可能。因此,本研究不建議將FT中的SSA技術(shù)應(yīng)用于量表的項(xiàng)目分析階段。
當(dāng)然,在對(duì)題項(xiàng)進(jìn)行重新界定之后,第3步便是需要再次對(duì)量表進(jìn)行結(jié)構(gòu)方程模型分析,來(lái)驗(yàn)證結(jié)構(gòu)效度是否符合標(biāo)準(zhǔn),驗(yàn)證過(guò)程同第1步,并對(duì)擬合指標(biāo)進(jìn)行統(tǒng)計(jì),與第1步統(tǒng)計(jì)結(jié)果做以比較,本研究對(duì)2次結(jié)構(gòu)方程模型的擬合指標(biāo)統(tǒng)計(jì)見表6。從中得知,題項(xiàng)變更前后,結(jié)構(gòu)方程模型的各擬合指標(biāo)并未出現(xiàn)較大變動(dòng),盡管存在部分?jǐn)M合指標(biāo)降低現(xiàn)象,例如,RMSEA從0.059降到0.058,但是大多數(shù)指標(biāo)擬合更優(yōu),僅相對(duì)擬合指標(biāo)的NFI不太令人滿意,這可能與量表所建構(gòu)的題項(xiàng)內(nèi)容全面性有關(guān)。當(dāng)然,該指標(biāo)通常也被認(rèn)為是易被低估的指標(biāo)。但無(wú)論如何,該指標(biāo)與0.90的標(biāo)準(zhǔn)[28]相差并不大,綜合來(lái)看,該量表結(jié)構(gòu)的擬合效度良好,具有較好的結(jié)構(gòu)效度。
圖4 本研究運(yùn)動(dòng)員特質(zhì)流暢狀態(tài)層面圖(基于三維結(jié)構(gòu)的SSA)
注:左圖:異化系數(shù)=0.156 54,區(qū)域化系數(shù)=1(極化結(jié)構(gòu),模塊結(jié)構(gòu)); 右圖:異化系數(shù)=0.156 54(極化結(jié)構(gòu),模塊結(jié)構(gòu)),區(qū)域化系數(shù)=0.933(極化結(jié)構(gòu)),0.917(模塊結(jié)構(gòu))。
表6 本研究結(jié)構(gòu)效度擬合指標(biāo)一覽表
Table 6 The List for Fitting Index of Structure Validity
χ2/dfGFIRMSEANFICFI第1次2.3230.9220.0590.8610.915第2次2.2550.9250.0580.8650.919
本研究通過(guò)3個(gè)應(yīng)用探討了CTT、IRT、FT 3種理論的使用特點(diǎn)和優(yōu)化組合。應(yīng)用1表明(驗(yàn)證假設(shè)1),通過(guò)映射語(yǔ)句的范式化分析,有助于對(duì)量表各維度的概念以及內(nèi)涵充分的理解和把握,從而進(jìn)一步設(shè)計(jì)題項(xiàng)或發(fā)現(xiàn)量表存在的問(wèn)題。例如,在本研究映射語(yǔ)句的情緒行為方面僅存在享受的體驗(yàn)維度,但該維度并未涉及復(fù)合情緒的有關(guān)題項(xiàng),而高水平運(yùn)動(dòng)員在比賽情境下對(duì)復(fù)合情緒的控制感似乎也是具有重要意義的,它是不得不涉及的一項(xiàng)重要內(nèi)容。這一方面的欠缺,在一定程度上降低了量表的內(nèi)容效度,通過(guò)FT中映射語(yǔ)句的范式化分析,能夠凸顯這一問(wèn)題,同時(shí),映射語(yǔ)句還有助于對(duì)更深層次題項(xiàng)的挖掘。例如,通過(guò)設(shè)計(jì)映射語(yǔ)句組合:a1b3c9,運(yùn)用采樣題目編制出“我的既定任務(wù)失敗后,通過(guò)客觀分析原因,出色完成了任務(wù),從而享受這一過(guò)程”。盡管不能保證在后續(xù)地項(xiàng)目分析中一定被保留,但是,這似乎更加符合運(yùn)動(dòng)員的流暢體驗(yàn)。由此推測(cè),將FT的映射語(yǔ)句應(yīng)用于題項(xiàng)建立之初,對(duì)內(nèi)容效度的提高存在一定的優(yōu)越性。但是,在這里需要指出的是,側(cè)重于提高量表內(nèi)容的全面性(覆蓋面),可能導(dǎo)致內(nèi)部一致性的下降。研究認(rèn)為,采用這一方法與其他方法(有助于信度提高的方法)的有機(jī)結(jié)合可能更有利于提高量表題項(xiàng)建立之初的科學(xué)性。
應(yīng)用2表明(驗(yàn)證假設(shè)2),CTT和IRT兩個(gè)理論在結(jié)合使用時(shí),樣本量是不可回避的問(wèn)題之一,通過(guò)檢驗(yàn)發(fā)現(xiàn),CTT在樣本量達(dá)到300名左右時(shí),刪題數(shù)量達(dá)到穩(wěn)定,而IRT在樣本量達(dá)到400名左右時(shí),刪題數(shù)量才逐漸穩(wěn)定。因此,兩者的結(jié)合應(yīng)用于體育科學(xué)量表編制時(shí),不少于400名受試者作為樣本量是較為合理的,至少目前這一結(jié)論從運(yùn)動(dòng)員這一群體在比賽這一特定情境下來(lái)看,是一個(gè)較為穩(wěn)定的閾值,而進(jìn)一步擴(kuò)大范圍的研究將是今后的一個(gè)研究方向。在采用已編制成型的體育科學(xué)量表應(yīng)用于各項(xiàng)目運(yùn)動(dòng)員某方面特征研究時(shí),對(duì)樣本量的要求可能沒(méi)有如此苛刻。而這一結(jié)論也與一些教育測(cè)評(píng)的研究存在一定的差異(IRT雙參數(shù)模型樣本量最好在600人以上),導(dǎo)致這一結(jié)果的原因可能與運(yùn)動(dòng)員群體和比賽情境存在一定關(guān)聯(lián)。同時(shí),通過(guò)CTT與IRT項(xiàng)目分析發(fā)現(xiàn),CTT對(duì)題項(xiàng)的刪減并不能代替IRT對(duì)題項(xiàng)的刪減,兩者的結(jié)合將更有利于量表題項(xiàng)的進(jìn)一步剔除。
應(yīng)用3表明(驗(yàn)證假設(shè)3),CTT中體現(xiàn)宏觀特性的克隆巴赫α系數(shù)與IRT中體現(xiàn)微觀特性的項(xiàng)目信息量結(jié)合有助于優(yōu)化量表的信度這一構(gòu)想,即兩者的結(jié)合能夠給出最終整體量表以及每個(gè)題項(xiàng)的信度情況,避免以往體育科學(xué)測(cè)評(píng)量表僅給出一個(gè)籠統(tǒng)信度指標(biāo)的缺陷。同時(shí),也驗(yàn)證了將CTT中的結(jié)構(gòu)方程模型結(jié)合FT中的SSA技術(shù)對(duì)量表結(jié)構(gòu)效度進(jìn)行檢驗(yàn)的構(gòu)想。當(dāng)然,依據(jù)某些題項(xiàng)所在的模塊化區(qū)域進(jìn)行選擇或調(diào)整時(shí),可能存在更為復(fù)雜的理論問(wèn)題和主觀判斷問(wèn)題,但無(wú)論如何,SSA在所得層面圖擬合指標(biāo)尚可的情況下,能夠?qū)Σ糠诸}項(xiàng)所屬維度進(jìn)行重新界定,避免了量表的結(jié)構(gòu)效度過(guò)分強(qiáng)調(diào)定量分析,而忽視了研究?jī)?nèi)容理論框架的缺陷。通過(guò)SSA分析發(fā)現(xiàn),不建議將該技術(shù)應(yīng)用于量表的項(xiàng)目分析階段,因?yàn)?,這易導(dǎo)致應(yīng)該歸屬于另一區(qū)域的題項(xiàng)誤刪的可能。但是,這里需要說(shuō)明的是,量表編制過(guò)程所涉及的信、效度問(wèn)題相當(dāng)復(fù)雜,僅信度就包括重測(cè)信度、復(fù)本信度、分半信度、同質(zhì)性信度以及評(píng)分者信度,而效度又涵蓋了結(jié)構(gòu)效度、內(nèi)容效度以及校標(biāo)效度。同時(shí),針對(duì)同一類信、效度的評(píng)價(jià)又存在多種不同的方法,例如,結(jié)構(gòu)效度的評(píng)價(jià)方法,即因素分析法、與標(biāo)準(zhǔn)化測(cè)驗(yàn)的相關(guān)法、聚合效度檢驗(yàn)和區(qū)分效度檢驗(yàn)等[19]。而本研究?jī)H從方法結(jié)合的角度來(lái)提高體育科學(xué)量表編制的信、效度問(wèn)題,驗(yàn)證了克隆巴赫α系數(shù)與項(xiàng)目信息量結(jié)合、結(jié)構(gòu)方程模型與SSA技術(shù)結(jié)合的構(gòu)想,希望能夠進(jìn)一步提高量表編制的信、效度科學(xué)化水平。
在體育科學(xué)測(cè)評(píng)量表研制中,傳統(tǒng)上CTT理論作為經(jīng)典測(cè)量理論被廣泛應(yīng)用,而結(jié)合IRT、FT兩種理論開展的應(yīng)用性研究還相對(duì)欠缺,雖然也有學(xué)者逐步提出了將三者結(jié)合的優(yōu)化構(gòu)想,如戴儉慧(2014)發(fā)表的“體育科學(xué)量表編制中幾個(gè)主要問(wèn)題探究—— 一種方法優(yōu)化的思考”一文[1],就提供了諸多的思考空間,但這些研究還主要是停留在一種提法和觀念的層面,缺乏實(shí)證性案例的探究。本研究認(rèn)為,F(xiàn)T中的映射語(yǔ)句在提高量表題項(xiàng)建立之初的內(nèi)容效度方面具有自身的優(yōu)越性;CTT與IRT的結(jié)合使用中,樣本量在400時(shí)是一個(gè)穩(wěn)定性閾值,CTT對(duì)量表題項(xiàng)的刪減并不能代替IRT分析;CTT與IRT能夠從宏觀與微觀分別給出量表及題項(xiàng)的信度情況,有助于發(fā)現(xiàn)研究樣本某個(gè)特定能力的特質(zhì)水平點(diǎn)。同時(shí),結(jié)構(gòu)方程模型與SSA技術(shù)結(jié)合能夠在一定程度上避免量表結(jié)構(gòu)效度過(guò)分強(qiáng)調(diào)定量分析,忽視研究?jī)?nèi)容理論框架的缺陷。當(dāng)然,對(duì)于本研究確立的這些應(yīng)用結(jié)論還有待于實(shí)踐的不斷檢驗(yàn),案例也需不斷擴(kuò)大,但藉此希望能夠發(fā)揮“以點(diǎn)帶面”的作用,逐步提升CTT、IRT、FT三種理論在體育科學(xué)量表編制研究中的規(guī)范化應(yīng)用。
[1]戴儉慧,金亞虹.體育科學(xué)量表編制中幾個(gè)主要問(wèn)題探究——一種方法優(yōu)化的思考[J].體育科學(xué),2014,34(3):88-封三.
[2]董德龍,劉文明,SEAMUS KELLY.歸屬、規(guī)模、規(guī)制:對(duì)中國(guó)體育學(xué)科發(fā)展的認(rèn)識(shí)[J].體育科學(xué),2015,35(3):83-89.
[3]董德朋,岳曉燕,劉巍,等.我國(guó)專業(yè)運(yùn)動(dòng)員賽時(shí)自我調(diào)控測(cè)量工具的研制與檢驗(yàn)[J].體育科學(xué),2013,33(12):49-58.
[4]金瑜.心理測(cè)量[M].上海:華東師范大學(xué)出版社,2001.
[5]李華,俞衛(wèi).政府衛(wèi)生支出對(duì)中國(guó)農(nóng)村居民健康的影響[J].中國(guó)社會(huì)科學(xué),2013,(10):41-60,205.
[6]劉微娜.體育運(yùn)動(dòng)中流暢狀態(tài)的心理特征及其認(rèn)知干預(yù)[D].上海:華東師范大學(xué),2009.
[7]劉微娜.《簡(jiǎn)化狀態(tài)流暢量表》和《簡(jiǎn)化特質(zhì)流暢量表》中文版修訂[J].體育科學(xué),2010,30(12):64-71.
[8]羅照盛.項(xiàng)目反應(yīng)理論基礎(chǔ)[M].北京:北京師范大學(xué)出版社,2012.
[9]漆書青.現(xiàn)代教育與心理測(cè)量學(xué)原理[M].北京:高等教育出版社,2002.
[10]王存同.中國(guó)人工流產(chǎn)的社會(huì)學(xué)實(shí)證研究:1979-2012[J].中國(guó)社會(huì)科學(xué),2014,(10):63-78,206.
[11]王洪,符明秋.高水平運(yùn)動(dòng)員流暢狀態(tài)特征研究[J].西安體育學(xué)院學(xué)報(bào),2005,22(4):127-130.
[12]謝寶國(guó),龍立榮.職業(yè)生涯高原對(duì)員工工作滿意度、組織承諾、離職意愿的影響[J].心理學(xué)報(bào),2008,40(8):927-938.
[13]楊寶琰,萬(wàn)明剛.城鄉(xiāng)高中教育機(jī)會(huì)分配的影響因素及作用模式:結(jié)構(gòu)決定抑或行動(dòng)選擇[J].教育研究,2014,(10):26-34.
[14]楊劍,祝捷.體育專業(yè)大學(xué)生心理和諧問(wèn)卷的編制[J].沈陽(yáng)體育學(xué)院學(xué)報(bào),2011,30(5):25-28.
[15]楊建原,臧運(yùn)洪,趙守盈.應(yīng)用項(xiàng)目反應(yīng)理論對(duì)友誼質(zhì)量量表修訂——以結(jié)構(gòu)方程、層面理論多種技術(shù)支持修訂量表的質(zhì)量[J].心理學(xué)進(jìn)展,2011,(1):97-105.
[16]易丹輝.結(jié)構(gòu)方程模型方法與應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,2008.
[17]岳昌君,張愷.高校畢業(yè)生求職結(jié)果及起薪的影響因素研究——基于2013年全國(guó)高校抽樣調(diào)查數(shù)據(jù)的實(shí)證分析[J].教育研究,2014,(11):72-83.
[18]張劍杰,徐囡囡,斯力格,等.心理干預(yù)對(duì)國(guó)家自由式滑雪空中技巧女運(yùn)動(dòng)員操作表現(xiàn)的影響[J].天津體育學(xué)院學(xué)報(bào),2014,29(2):128-131.
[19]張力為.體育科學(xué)研究方法[M].北京:高等教育出版社,2002.
[20]張力為.研究方法總是使我們處于科學(xué)研究的十字路口[J].體育科學(xué),2004,24(6):1-6.
[21]張力為.研究方法在制約我們的追求嗎? [J].體育科學(xué),2005,25(4):74-80.
[22]趙守盈.層面理論原理、方法與應(yīng)用[M].北京:北京師范大學(xué)出版社,2010.
[23]CHRISTIAN S,DAVID P,LEE C,etal.Exploring the interactions underlying flow states:A connecting analysis of flow occurrence in European tour golfers[J].Psychol Sport Exe,2015,16(3):60-69.
[24]CSIKSZENTMIHALYI M.Flow:The Psychology of Optimal Experience[M].New York:Harper Row,1990.
[25]DEROSE K P,GRESENZ C R,RINGEL J S.Understanding disparities in health care access and reducing them through a focus on public health[J].Health Affairs,2011,30(10):1844-1851.
[26]DONALD I,COOPER R.A facet approach to extending the normative component of the theory of reasoned action[J].Brit J Soc Psychol,2001,40(4):599-621.
[27]FOSCO G M,GRYCH J H.Emotional,cognitive,and family systems mediators of children’s adjustment to interparental conflict[J].J Family Psychol,2008,22(6):843-854.
[28]GUTTMAN R,GREENBAUM C W.Facet theory:Its development and current status[J].Eur Psychol,1998,3(1):13-36.
[29]JACKSON S A,EKLUND R C.Assessing flow in physical activity:The flow state sacle-2 and dispositional flow state scale-2[J].J Sport Exe Psychol,2002,(24):133-150.
[30]JACKSON S A,MARTIN A J.EKLUND R C.Long and short measures of flow:The construct validity of the FSS-2,DFS-2,and new brief counterparts[J].J Sport Exe Psychol,2008,(30):561-587.
[31]JACKSON S A,ROBERTS G C.Positive performance states of athletes:Toward a conceptual understanding of peak performance[J].Sport Psychol,1992,6(2):156-171.
[32]JACOB H.The facet design approach to the construction of multivariate marketing models[J].Eur J Market,2001,8(2):146-157.
[33]MASLOVATY N.The placement of moral contents:Priorities and structure of the belief system of teachers and high school students[J].Edu Res Evaluation,2003,9(1):109-134.
[34]NAM Y,HUANG J.Equal opportunity for all? Parental economic resources and children’s educational attainment[J].Chil Youth Ser Rev,2009,31(6):625-634.
[35]RAVIZZA K.Peak experience in sport[J].J Humanistic Psychol,1977,17(4):35-40.
[36]REBHUN U.Jewish identity in America:Structural analysis of attitudes and behaviors[J].Rev Religious Res,2004,46(1):43-63.
[37]SHAPIRO D H.Manual for the Shapiro Control Inventory[M].Cupertino,CA:Behavior-data,Inc,1994.
[38]STAVROU N A,JACKSON S A,ZERVAS Y,etal.Flow experience and athletes’ performance with reference to the orthogonal model of flow[J].Sport Psychol,2007,21(4):438-457.
[39]SUSSMAN J,BEAUJEAN A A,WORRELL F C,etal.An analysis of cross racial identity scale using classical test theory and rasch item response models[J].Measure Evaluat Counsel Dev,2012,46(2):136-153.
CTT,IRT,FT:The Application of Scale in Sport Science——Taking “the Dispositional Flow Scale” as an Example
DONG De-peng,LIU Wei,SUN Shi-chao
Based on the short dispositional flow scale,763 athletes were investigated from different items and levels,and using three application research,this paper explores the using and optimum combination of CTT,IRT,FT in development of scale.The result shows that 1) Mapping sentence of FT has its advantages in content validity of items establishment;2)Sample size that is greater than 400 is a stability threshold when CTT and IRT is applied in item analysis,and CTT can’t replace IRT analysis in deletion of terms,meanwhile,SSA of FT will be not recommend in this stage;3)The combination of CTT and IRT can give the reliability of scale and item form macroscopic and microscopic,the combination of structural equation model of CTT and SSA of FT can avoid too much emphasis on the quantitative analysis,and ignore the defect of concept theory framework.
classicaltesttheory;itemresponsetheory;facettheory;scale
2015-05-28;
2015-08-14
吉林省社會(huì)科學(xué)基金資助項(xiàng)目(2015B8);吉林大學(xué)研究生創(chuàng)新基金資助項(xiàng)目(2015067)。
董德朋(1988-),男,山東濰坊人,在讀碩士研究生,主要研究方向?yàn)閷m?xiàng)競(jìng)技運(yùn)動(dòng)理論與方法,E-mail:depeng_d@126.com;劉巍(1973-),男,吉林長(zhǎng)春人,副教授,博士,主要研究方向?yàn)轶w育教學(xué)與訓(xùn)練,E-mail:JLUWEI_L@126.com;孫世超(1991-)男,河南平頂山人,在讀碩士研究生,主要研究方向?yàn)閷m?xiàng)競(jìng)技運(yùn)動(dòng)理論與方法,E-mail:sunshichao2013@sina.com。
吉林大學(xué) 體育學(xué)院,吉林 長(zhǎng)春 130012 Jilin University,Changchun 130012,China.
1000-677X(2015)09-0075-09
10.16469/j.css.201508000
G804.8
A