戴儉慧,金亞虹
體育科學(xué)量表編制中幾個(gè)主要問(wèn)題探究
——一種方法優(yōu)化的思考
戴儉慧1,金亞虹2
體育科學(xué)量表編制是科學(xué)測(cè)量領(lǐng)域的重要分支之一,追求的目標(biāo)在于其權(quán)威性、可靠性和有效性,其測(cè)量理論主要涉及經(jīng)典測(cè)量理論(Classical Test Theory,簡(jiǎn)稱(chēng)CTT)、概化理論(Generalizability Theory,簡(jiǎn)稱(chēng)GT)、項(xiàng)目反應(yīng)理論(Item Response Theory,簡(jiǎn)稱(chēng)IRT)及層面理論(Facet Theory,簡(jiǎn)稱(chēng)FT)。基于對(duì)不同測(cè)量理論的認(rèn)識(shí),重點(diǎn)圍繞量表編制中的維度與題項(xiàng)、項(xiàng)目分析及信效度3個(gè)問(wèn)題展開(kāi)介紹,闡釋以隨機(jī)化為理論基礎(chǔ)的經(jīng)典測(cè)量理論的優(yōu)勢(shì)和弊端,也給出以潛在特質(zhì)為基礎(chǔ)的項(xiàng)目反應(yīng)理論及非計(jì)量化層面理論的應(yīng)用方法和主要作用。作者突出介紹了它們?cè)隗w育科學(xué)量表編制中的方法組合優(yōu)化問(wèn)題,列舉了相應(yīng)的研究案例,并認(rèn)為,這種方法上的組合優(yōu)化不失為一種可取的或值得嘗試的思路,也理應(yīng)成為體育科學(xué)量表編制逐步走向規(guī)范、精確和深入的重要標(biāo)志之一。
量表;方法優(yōu)化;項(xiàng)目反應(yīng)理論;心理測(cè)量
:Sports science scale is an important branch of scientific measurement field,the pursuit of the goal lies in its authority,reliability and validity.The measurement theory mainly relates to the classical test theory (referred to as CTT),generalizability theory (referred to as GT),item response theory (referred to as IRT) and facet theory (referred to as FT).Based on the understanding of different measurement theory,the author introduced the dimensions and items,the item analysis,reliability and validity in scale development,explained the advantages and disadvantages of the classical test theory as the theoretical basis of the randomization,also gave main analysis method of the item response theory based on latent trait and function of facet theory based on non quantitative level.Among them,the author specifically focused on how to achieve the best optimization in sports science scale,lists the corresponding cases,and pointed out that,the method of combinatorial optimization was a desirable or worthwhile ideas,also should become one of the important sign of sports science scale gradually moving towards standardized and accurate.
心理測(cè)量主要存在三大理論流派,即經(jīng)典測(cè)量理論(Classical Test Theory,簡(jiǎn)稱(chēng)CTT)、概化理論(Generalizability Theory,簡(jiǎn)稱(chēng)GT)和項(xiàng)目反應(yīng)理論(Item Response Theory,簡(jiǎn)稱(chēng)IRT),測(cè)量理論的發(fā)展又出現(xiàn)了層面理論(Facet Theory,簡(jiǎn)稱(chēng)FT)。體育科學(xué)量表編制是心理測(cè)量領(lǐng)域的一個(gè)細(xì)小分支,其編制方法的主要特征還停留在經(jīng)典測(cè)量理論的基礎(chǔ)之上,即以隨機(jī)抽樣為基礎(chǔ)。隨著項(xiàng)目反應(yīng)理論(以潛在特質(zhì)和數(shù)學(xué)統(tǒng)計(jì)模型為基礎(chǔ))和層面理論(以物理空間呈現(xiàn)概念空間,最重要模型為WASSA1)的發(fā)展,經(jīng)典測(cè)量理論的局限性也越來(lái)越凸顯。體育科學(xué)量表編制是體育科學(xué)研究中值得關(guān)注的領(lǐng)域之一,也是近些年來(lái)體育科學(xué)研究領(lǐng)域的重要分支,其編制方法的合理性和規(guī)范性不僅影響到量表的信效度,即有效的測(cè)量問(wèn)題,更會(huì)影響到體育學(xué)科學(xué)術(shù)水平的發(fā)展。農(nóng)納利(Nunnally)在很早以前就已經(jīng)指出,缺乏合理統(tǒng)計(jì)方法的運(yùn)用將會(huì)阻礙測(cè)量科學(xué)的進(jìn)步[38]。在現(xiàn)代科學(xué)測(cè)量不斷深入發(fā)展的今天,無(wú)論是國(guó)外[25,,31,33,37,39,41]還是國(guó)內(nèi)[4,13,17-19],越來(lái)越多的學(xué)科不僅僅依賴(lài)于來(lái)自經(jīng)典測(cè)量理論的統(tǒng)計(jì)方法,而是更加注重對(duì)一些傳統(tǒng)測(cè)量方法的修補(bǔ)和完善,并與一些較新的方法進(jìn)行組合運(yùn)用,以提升研究的規(guī)范性和科學(xué)性。如同質(zhì)性研究方法在傳統(tǒng)定性研究方法基礎(chǔ)上的發(fā)展一樣,方法的規(guī)范化和組合優(yōu)化已成為科學(xué)測(cè)量的一種新取向。其中,不少研究指出[18,25,27,30,44-48],項(xiàng)目反應(yīng)理論以及運(yùn)用到社會(huì)科學(xué)和心理學(xué)的層面理論已表現(xiàn)出越來(lái)越廣泛的應(yīng)用。例如,Thelma 等人運(yùn)用項(xiàng)目反應(yīng)理論分析了關(guān)節(jié)炎患者運(yùn)動(dòng)行為的自我效能感[46],Glenda 等人運(yùn)用項(xiàng)目反應(yīng)理論研發(fā)了護(hù)理專(zhuān)業(yè)學(xué)生的自我效能感量表[23]以及Maslovaty運(yùn)用層面理論對(duì)教育心理的研究[36,37]等等。同時(shí),這在國(guó)內(nèi)的一些母學(xué)科中也逐步有所運(yùn)用,尤其是在心理學(xué)和教育學(xué)中量表的編制領(lǐng)域。楊建原等人運(yùn)用項(xiàng)目反應(yīng)理論及層面理論對(duì)友誼質(zhì)量量表進(jìn)行了修訂[13],趙守盈等人運(yùn)用多層面模型編制了教學(xué)效能感量表[18]等。
然而,這些方法在體育科學(xué)量表編制中的應(yīng)用顯得還有些滯后。面對(duì)許多新的理論或方法,雖然不能一味吸收,但至少在方法上的組合優(yōu)化應(yīng)成為一種新的值得嘗試的路徑。因此,體育科學(xué)工作者絕不能因?yàn)槟承┓椒ǖ膹?fù)雜而退縮,只要它們確有優(yōu)勢(shì)之處,就應(yīng)該加以研究和引用。目前,從國(guó)外體育科學(xué)量表的研究來(lái)看,大部分運(yùn)用了前面提出的項(xiàng)目反應(yīng)理論或?qū)用胬碚摚@些理論或方法在我國(guó)體育科學(xué)量表的編制中還尚顯不足或缺乏規(guī)范性使用。
因此,本研究針對(duì)以我國(guó)體育科學(xué)量表編制中經(jīng)常運(yùn)用到的方法為線(xiàn)索,對(duì)量表編制中方法運(yùn)用的更優(yōu)組合進(jìn)行探討。相關(guān)研究指出[16,46],目前體育科學(xué)研究中,量表編制中的固定模式或方法存在一些弊端,而作為測(cè)量領(lǐng)域三大理論(經(jīng)典測(cè)量理論、概化理論、項(xiàng)目反應(yīng)理論)之一的項(xiàng)目反應(yīng)理論,可以對(duì)其缺陷進(jìn)行很好的彌補(bǔ)和輔助。例如,項(xiàng)目反應(yīng)理論可以用信息量來(lái)代表信度,它既可以檢驗(yàn)整體量表的信度,也可以對(duì)每個(gè)題項(xiàng)的信度進(jìn)行檢驗(yàn)(羅照盛,2012[7];楊建原,2011[13]);另外,傳統(tǒng)量表編制中通常用被試的通過(guò)率來(lái)估計(jì)題項(xiàng)難度參數(shù),用題總相關(guān)來(lái)評(píng)價(jià)區(qū)分度參數(shù)(這里的題總相關(guān)指的就是題項(xiàng)分?jǐn)?shù)與測(cè)驗(yàn)總分的相關(guān),測(cè)驗(yàn)總分也稱(chēng)之為效標(biāo)分?jǐn)?shù),通常被作為區(qū)分度的一種分析方法[5,14]),這樣比較容易導(dǎo)致失去內(nèi)在的統(tǒng)一性,而項(xiàng)目反應(yīng)理論則把這兩個(gè)參數(shù)(難度參數(shù)和區(qū)分度參數(shù))定義在了同一個(gè)能力量尺上,從而使之具有相同的單位基礎(chǔ),來(lái)保證它們協(xié)調(diào)統(tǒng)一的解釋特性。當(dāng)然,體育科學(xué)量表編制中還存在一些其它缺陷,如觀察分?jǐn)?shù)權(quán)重線(xiàn)性的累加以及依賴(lài)被試樣本等等。盡管項(xiàng)目反應(yīng)理論不能說(shuō)是對(duì)其全部進(jìn)行了彌補(bǔ),但說(shuō)對(duì)其部分進(jìn)行了彌補(bǔ)還是不為過(guò)的。之所以提出相互結(jié)合的理論基礎(chǔ)還在于,首先:在聯(lián)系被試反應(yīng)與潛在特質(zhì)的過(guò)程中,經(jīng)典測(cè)量理論和項(xiàng)目反應(yīng)理論均是建立在數(shù)據(jù)模型的基礎(chǔ)之上;其次:經(jīng)典測(cè)量理論以真分?jǐn)?shù)為理論基礎(chǔ),項(xiàng)目反應(yīng)理論以潛在特質(zhì)為理論基礎(chǔ),采用不同的度量方式來(lái)表示同一心理特征,使建立的測(cè)量更具有對(duì)應(yīng)的關(guān)聯(lián)[26];最后:經(jīng)典測(cè)量理論可以從宏觀的層面把總體與題項(xiàng)結(jié)合,并運(yùn)用通過(guò)率以及鑒別指數(shù)來(lái)體現(xiàn)其外在特性,而項(xiàng)目反應(yīng)理論從微觀層面把題項(xiàng)與潛在特質(zhì)聯(lián)系起來(lái),并通過(guò)難度以及區(qū)分度等來(lái)體現(xiàn)內(nèi)在特征,這樣,內(nèi)、外結(jié)合使其具有更高的信效度。同時(shí),項(xiàng)目反應(yīng)理論打破了人們一直以來(lái)所認(rèn)為的觀點(diǎn)(即為了保證更優(yōu)的信度,測(cè)驗(yàn)長(zhǎng)度越長(zhǎng)越好的觀點(diǎn)),并證明了精簡(jiǎn)的測(cè)驗(yàn)同樣可以具有良好的信度。因此,本研究主張使用項(xiàng)目反應(yīng)理論與經(jīng)典測(cè)量理論的優(yōu)化組合來(lái)篩選出更優(yōu)的題項(xiàng)以及構(gòu)建更高的量表信度。
通常,為了使量表具有更優(yōu)的內(nèi)容效度以及構(gòu)想效度,也可配合使用層面理論中的部分方法。層面理論(FT)作為一種研究策略,將其范式化分析與內(nèi)部數(shù)據(jù)分析結(jié)合起來(lái),其中,范式化分析針對(duì)的是理論構(gòu)建(運(yùn)用映射語(yǔ)句),而內(nèi)部數(shù)據(jù)分析則主要針對(duì)的是實(shí)證研究,主要是運(yùn)用最小空間分析技術(shù)(Smallest Space Analysis,簡(jiǎn)稱(chēng)SSA)[17,29]。在許多學(xué)科的研究中,過(guò)分強(qiáng)調(diào)復(fù)雜的定量分析而忽視了所研究?jī)?nèi)容的概念理論框架,這種做法是欠妥的。層面理論可以在一定程度上權(quán)衡這一問(wèn)題,它強(qiáng)調(diào)了理論構(gòu)建與概念結(jié)構(gòu)的合理性,把理論構(gòu)建和實(shí)證研究相結(jié)合,并運(yùn)用最小空間分析技術(shù)來(lái)探索和驗(yàn)證理論結(jié)構(gòu),從而很好地克服了將統(tǒng)計(jì)置于理論之上的錯(cuò)誤[1]。并且,層面理論的范式化分析與數(shù)據(jù)處理技術(shù)比量表編制中所使用的因素分析具有多種優(yōu)越性:首先,在量表的編制過(guò)程中,運(yùn)用層面理論的映射語(yǔ)句可以幫助科研人員窮盡和區(qū)分相關(guān)概念和變量,從而使建立的量表結(jié)構(gòu)更加科學(xué)以及具有更優(yōu)的內(nèi)容效度;其次,針對(duì)樣本的要求,因素分析高于層面理論分析,這就可能給研究人員在研究中帶來(lái)很大的限制因素和不確定因素;最后,層面理論不需要變量呈多元正態(tài)分布,這是因?yàn)椋谝蛩胤治鲋羞\(yùn)用的是積矩相關(guān)系數(shù),而在層面理論數(shù)據(jù)處理技術(shù)中,則是把原始數(shù)據(jù)轉(zhuǎn)換成區(qū)分各變量接近程度的“距離”[17]。在許多研究中,不管其變量是否是正態(tài)分布或者線(xiàn)性分布,便泛泛采用了因素分析方法,這是不可取的,這在競(jìng)技體育領(lǐng)域諸多特殊現(xiàn)象分析時(shí)顯得尤為重要。當(dāng)然,在確保被試總體屬于正態(tài)分布以及所選樣本能夠充分代表研究總體的情況下,其經(jīng)典測(cè)量理論的分析技術(shù)(例如因素分析)的結(jié)果還是很穩(wěn)定的,但不應(yīng)該崇尚它的簡(jiǎn)單,而應(yīng)該在方法上向更深一層地邁進(jìn)。
由此看來(lái)。不同測(cè)量理論或方法的優(yōu)化組合是提高體育科學(xué)量表編制的一種新取向。因?yàn)椋挥杏行У亟M合與運(yùn)用方法才能得出更加真實(shí)、精確的結(jié)果?;诖?,本研究將對(duì)體育科學(xué)量表編制中存在的主要問(wèn)題進(jìn)行探究和述評(píng),并就其如何與項(xiàng)目反應(yīng)理論、層面理論來(lái)優(yōu)化組合進(jìn)行理論梳理,以供探討和商榷。
2.1 初始與最終數(shù)量分析
量表的維度和題項(xiàng)是量表編制過(guò)程中涉及到的重要步驟。雖然不同的研究者對(duì)初始和最終確定的數(shù)量持不同觀點(diǎn),但不少研究者認(rèn)為(Devellis,1991),一般情況下初始題項(xiàng)數(shù)最好應(yīng)該是最終題項(xiàng)數(shù)的3~4倍,但是如果研究的是某個(gè)領(lǐng)域的特定內(nèi)容,或者是基于以往的研究來(lái)編制的題項(xiàng),理論上不需要過(guò)多的題項(xiàng)就可以使得出的最終量表具有較好的內(nèi)部一致性,初始題項(xiàng)數(shù)是最終題項(xiàng)數(shù)的1.5倍即可[20];對(duì)于量表維度的確立,通常采用經(jīng)典測(cè)量理論的因子分析等方法確立得到,沒(méi)有相對(duì)固定的維度數(shù)量標(biāo)準(zhǔn),僅根據(jù)自身研究需要而定。
為了使人們對(duì)體育科學(xué)研究領(lǐng)域量表編制中的題項(xiàng)數(shù)和維度數(shù)有更為直觀的認(rèn)識(shí),有必要對(duì)我國(guó)近幾年體育類(lèi)量表編制中的題項(xiàng)數(shù)和維度數(shù)進(jìn)行統(tǒng)計(jì)。本研究以2008—2012年間的13家體育類(lèi)核心期刊為調(diào)查來(lái)源(《體育科學(xué)》、《北京體育大學(xué)學(xué)報(bào)》、《中國(guó)體育科技》、《上海體育學(xué)院學(xué)報(bào)》、《體育學(xué)刊》、《體育文化導(dǎo)刊》、《體育與科學(xué)》、《天津體育學(xué)院學(xué)報(bào)》、《武漢體育學(xué)院學(xué)報(bào)》、《西安體育學(xué)院學(xué)報(bào)》、《成都體育學(xué)院學(xué)報(bào)》、《廣州體育學(xué)院學(xué)報(bào)》和《山東體育學(xué)院學(xué)報(bào)》),共收集了體育類(lèi)量表研制性論文116篇。隨后,對(duì)這116篇論文進(jìn)行了再次篩選(主要是剔除修訂性量表研究和沒(méi)有交代初始題項(xiàng)數(shù)或維度數(shù)的研究論文以及直接翻譯性量表),最終刪除不符合要求的文章61篇,從而確定55篇量表編制的文章作為分析對(duì)象。在對(duì)量表進(jìn)行分析的同時(shí),若量表具有多級(jí)維度,僅計(jì)算至二級(jí)維度數(shù)。表1顯示了2008—2012年間13家體育類(lèi)核心期刊發(fā)表的量表編制性論文對(duì)初測(cè)與最終題項(xiàng)數(shù)和維度數(shù)的統(tǒng)計(jì)。
表 1 體育科學(xué)量表編制中初始與最終維度和題項(xiàng)數(shù)統(tǒng)計(jì)一覽表
通常而言,初始維度數(shù)與最終維度數(shù)之間不會(huì)有很大差別,而初始題項(xiàng)數(shù)與最終題項(xiàng)數(shù)則會(huì)有較大差距。因此,表1僅展示了初始維度和最終維度的平均值,以便對(duì)體育科學(xué)量表維度的制定有大體的了解。針對(duì)初始題項(xiàng)數(shù)和最終題項(xiàng)數(shù),則不僅進(jìn)行了平均值的統(tǒng)計(jì),而且還進(jìn)行了初始題項(xiàng)數(shù)與最終題項(xiàng)數(shù)的比值計(jì)算。從表1中對(duì)初始題項(xiàng)數(shù)與最終題項(xiàng)數(shù)的比值來(lái)看,《體育科學(xué)》的比值為1.82,而其他核心期刊平均為1.60??傮w來(lái)看,我國(guó)體育科研中量表編制的初始題項(xiàng)數(shù)是最終題項(xiàng)數(shù)的1.71倍,考慮到本研究排除了量表修訂的文獻(xiàn),因此,推測(cè)導(dǎo)致這個(gè)原因只有以下幾種可能,第1種可能是體育科學(xué)量表編制中的題項(xiàng)數(shù)的確需要進(jìn)一步減少,以達(dá)到更加精簡(jiǎn)量表的目的;第2種可能是在量表編制過(guò)程中,題目的編制內(nèi)容不夠全面,使其漏編了部分題項(xiàng),這樣可能使部分優(yōu)良的題項(xiàng)也漏編了;第3種可能是體育科學(xué)研究中的量表編制大多數(shù)是針對(duì)特定內(nèi)容的研究;最后一種則是一些研究者可能根本就不知道初始量表的題項(xiàng)數(shù)與最終量表的題目數(shù)之間的關(guān)系。但無(wú)論哪種可能,體育科學(xué)量表的編制在題項(xiàng)和維度的確立上需要有更加嚴(yán)謹(jǐn)?shù)某绦蚝头椒▉?lái)進(jìn)行篩選和確立。
2.2 初始維度與題項(xiàng)的建立
初始維度與題項(xiàng)的建立往往涉及到編制量表內(nèi)容的合理性與否,因?yàn)椋陔S后的工作中將主要考察所選維度和題項(xiàng)的驗(yàn)證性,這就要求在初始維度和題項(xiàng)的建立方面盡量做到科學(xué)合理。從目前體育科研量表的初始維度和題項(xiàng)建立來(lái)看(表2),在維度確立方面,大部分量表編制運(yùn)用了理論分析法、相關(guān)量表的引用、訪談法以及問(wèn)卷調(diào)查法和專(zhuān)家評(píng)價(jià)法,并通過(guò)相關(guān)分析、因素分析、描述統(tǒng)計(jì)等分析資料的方法進(jìn)一步確立初始維度。從總體來(lái)看,我國(guó)體育科研量表編制中維度的初始確立首選的方法為理論分析法和訪談法;其次為問(wèn)卷調(diào)查法、相關(guān)量表引用以及專(zhuān)家評(píng)價(jià)法。在題項(xiàng)編制方面,運(yùn)用方法最多的則為相關(guān)量表引用,其次可為問(wèn)卷調(diào)查法以及訪談法等。
表 2 體育科學(xué)量表初始維度制定和題項(xiàng)編制中常用方法一覽表
綜上所述,理論分析法、訪談法以及相關(guān)量表引用法在這一階段運(yùn)用的比較頻繁,它們有著自身的優(yōu)勢(shì),但也不能忽視它們?cè)谶\(yùn)用過(guò)程中的缺點(diǎn)。理論分析方法帶有很強(qiáng)的主觀色彩,缺乏必要的科學(xué)研究范式;訪談法在研究過(guò)程中可能會(huì)有一些意想不到的發(fā)現(xiàn),但具有樣本小,主、被試之間存在一定的相互影響,缺乏規(guī)范化結(jié)構(gòu)以及調(diào)查對(duì)象可能對(duì)調(diào)查問(wèn)題具有很強(qiáng)的隱蔽性等弊端,因此常與其他方法結(jié)合使用。盡管相關(guān)量表引用帶有一定的科學(xué)范式含義,但是,被引用量表在編制過(guò)程中也可能運(yùn)用了比較主觀的編制題項(xiàng)的方法,而且,很難保證被引用量表是否具有權(quán)威性以及符合自己的研究問(wèn)題。這些方面的不足恰恰是當(dāng)前層面理論的優(yōu)勢(shì),層面理論中通過(guò)映射語(yǔ)句,會(huì)使在維度的選擇以及題項(xiàng)的編制過(guò)程中偏向一種具有規(guī)范化的范式結(jié)構(gòu),從而權(quán)衡以往應(yīng)用方法中過(guò)于主觀的部分缺陷。
2.3 方法的優(yōu)化組合
目前,許多體育科學(xué)量表在編制過(guò)程中運(yùn)用的是評(píng)價(jià)內(nèi)容效度的方式,例如,專(zhuān)家訪談法或?qū)<以u(píng)價(jià)法,且對(duì)效度的控制重點(diǎn)放在了量表的編制之后。實(shí)際上,編制題項(xiàng)也是量表編制過(guò)程中最重要和直觀的一個(gè)步驟。因?yàn)?,題項(xiàng)的質(zhì)量從一開(kāi)始就牽制著后期的種種努力行為[3]。例如,在統(tǒng)計(jì)的資料中有一篇關(guān)于“大學(xué)生體育鍛煉效果自評(píng)量表的研制”的文獻(xiàn)[2],有個(gè)題項(xiàng)為“我親身感受到體育鍛煉能有效地控制體重和體型”。這句話(huà)似乎在編制過(guò)程中就有些缺陷,由于體重和體型不能同等看待,而只能說(shuō)是這兩個(gè)概念有交集。受試者在回答這一問(wèn)題的時(shí)候很可能產(chǎn)生模棱兩可的感覺(jué)。因?yàn)?,他有時(shí)候感覺(jué)控制住了自己的體重,但沒(méi)有控制住自己的體型,比如:體重下降了,但是腿變粗了,這讓他怎樣回答這個(gè)問(wèn)題。因此,此題項(xiàng)談何效度?再就是,前面已經(jīng)了解到體育科學(xué)量表編制中初測(cè)的題項(xiàng)是最終題項(xiàng)的1.71倍,而導(dǎo)致這個(gè)結(jié)果的其中一種可能是在編制題項(xiàng)之初就已經(jīng)漏編了一些題項(xiàng),而這些漏編的題項(xiàng)可能是包含具有很好信效度的題項(xiàng)。因此,為了在建立之初就要有比較好的內(nèi)容效度,就需要引入層面理論中的核心技術(shù)概念,即映射語(yǔ)句。由格特曼提出的映射語(yǔ)句來(lái)做研究設(shè)計(jì)可以把研究者的視野避免過(guò)度集中于無(wú)數(shù)的題項(xiàng)上,而是集中在一個(gè)數(shù)目有限的概念層面[22,42,43],且它可以將被試層面、內(nèi)容層面以及反應(yīng)范圍層面有機(jī)地連接起來(lái),從而系統(tǒng)地闡述題項(xiàng)的內(nèi)容(圖1)。
映射語(yǔ)句中包括兩種成分,其主要的成分就是圖中所有的層面成分(另一成分為連接這些層面的詞語(yǔ)),這一成分具有嚴(yán)格和規(guī)范的特點(diǎn)。圖1顯示,層面包括:P層面(目標(biāo)人群層面)、C層面(內(nèi)容層面)以及R層面(反應(yīng)范圍層面),這些層面共同來(lái)界定研究的范疇,其中,P層面和C層面構(gòu)成了研究范圍[19]。P層面即為所研究的目標(biāo)人群(被試);C層面即為所研究?jī)?nèi)容的一系列核心的概念,當(dāng)然也可以設(shè)定其為觀察變量,其內(nèi)容層面又包含各種子層面[19],對(duì)這些子層面的設(shè)計(jì)便是映射語(yǔ)句的關(guān)鍵。圖中的反應(yīng)范圍層面通常也可以被記為R層面,反應(yīng)可以從完全符合到完全不符合或非常同意到非常不同意等等(主要對(duì)應(yīng)于Likert 量表)。在實(shí)際應(yīng)用中,映射語(yǔ)句一般用來(lái)定義比較復(fù)雜理論框架的構(gòu)建,可以通過(guò)查閱工具書(shū)以及大量文獻(xiàn)經(jīng)常涉及到與研究?jī)?nèi)容相關(guān)聯(lián)的方面,并對(duì)其歸納總結(jié),從而設(shè)計(jì)出簡(jiǎn)單的映射語(yǔ)句。在編制過(guò)程中從每個(gè)層面僅選擇一個(gè)元素來(lái)進(jìn)行組合,然后,采用覆蓋題目或采樣題目的編寫(xiě)方法來(lái)編寫(xiě)題項(xiàng)。當(dāng)然,為了完善映射語(yǔ)句,可以通過(guò)元素?cái)U(kuò)展和層面擴(kuò)展來(lái)進(jìn)行充實(shí),具體的映射語(yǔ)句運(yùn)用方法本文不做贅述,具體運(yùn)用可以參閱相關(guān)書(shū)籍和文獻(xiàn)。
圖 1 層面理論中映射語(yǔ)句的一般表達(dá)式示意圖
為了更加清楚地表述這一過(guò)程,本研究給出了一個(gè)成就動(dòng)機(jī)編寫(xiě)的例子。在以往對(duì)成就動(dòng)機(jī)的諸多研究當(dāng)中,涉及比較多的相關(guān)概念主要有:不確定性、估計(jì)風(fēng)險(xiǎn)、困難、問(wèn)題解決、責(zé)任以及需要的滿(mǎn)足。根據(jù)前面的表述,這6個(gè)概念可以歸結(jié)為映射語(yǔ)句的內(nèi)容層面(C層面),而為了使映射語(yǔ)句框架更加符合研究?jī)?nèi)容實(shí)際,則需要對(duì)內(nèi)容層面進(jìn)行分解(內(nèi)容層面可包括多個(gè)子層面)。根據(jù)概念范疇可以將其分為時(shí)間子層面主要包括任務(wù)完成之前(不確定性和評(píng)估風(fēng)險(xiǎn))、任務(wù)完成之中(困難和解決問(wèn)題)以及任務(wù)完成之后(責(zé)任和滿(mǎn)足需要);面對(duì)的類(lèi)型子層面主要包括:挑戰(zhàn)性問(wèn)題(不確定性、困難以及責(zé)任)和問(wèn)題的解決(評(píng)估風(fēng)險(xiǎn)、解決問(wèn)題以及滿(mǎn)足需要);行為特征子層面主要包括:喜歡、滿(mǎn)意以及承擔(dān)責(zé)任。根據(jù)以上的表述,繪制成就動(dòng)機(jī)題項(xiàng)的映射語(yǔ)句(圖2),可以得出2×3×3=18種組合,每一種組合采用覆蓋題目或采樣題目的編寫(xiě)方法可以編寫(xiě)出不同的題項(xiàng),從而可以展開(kāi)進(jìn)一步的題項(xiàng)研究。
總之,層面、元素和映射語(yǔ)句是層面理論的3個(gè)要素,其主要核心要素為映射語(yǔ)句,是一種把理論建構(gòu)和實(shí)證研究結(jié)合起來(lái)的方法,并且可以合理地將概括化的理論概念轉(zhuǎn)變成更合適的實(shí)證觀察概念。通過(guò)映射語(yǔ)句這種偏于科學(xué)范式的方法來(lái)對(duì)研究?jī)?nèi)容進(jìn)行整理與分析,可以幫助科研人員窮盡和區(qū)分相關(guān)概念和變量,從而彌補(bǔ)過(guò)去比較主觀的編寫(xiě)方法的不足,最終編制出結(jié)構(gòu)更加科學(xué)以及具有更優(yōu)內(nèi)容效度的量表。
圖 2 成就動(dòng)機(jī)題項(xiàng)的映射語(yǔ)句示意圖
3.1 項(xiàng)目分析方法
部分論文對(duì)于項(xiàng)目分析的方法展示或是比較模糊或是劃分不規(guī)范,如在《大學(xué)生體育課學(xué)習(xí)滿(mǎn)意度測(cè)查量表編制》[10]中的鑒別指數(shù)和區(qū)分度被劃分成了兩個(gè)范疇。鑒別指數(shù)是用臨界比率(或稱(chēng)為極端分組法)來(lái)計(jì)算的,通常與相關(guān)系數(shù)法一起被歸為區(qū)分度的計(jì)算方法當(dāng)中[11,12]。從目前體育科學(xué)量表編制中的項(xiàng)目分析方法來(lái)看,主要有相關(guān)分析、鑒別指數(shù)、標(biāo)準(zhǔn)差、探索性因素分析、驗(yàn)證性因素分析及難度-平均得分率等方法。其中,相關(guān)分析法可包括題總相關(guān)、題他相關(guān)以及題項(xiàng)與所屬維度的相關(guān),而且,對(duì)區(qū)分度進(jìn)行分析的相關(guān)系數(shù)法也均歸入相關(guān)分析法之內(nèi)。其他方法運(yùn)用相對(duì)較少,如頻數(shù)統(tǒng)計(jì)、逐步回歸分析以及克隆巴赫系數(shù)α分析等。
不同方法的運(yùn)用自然會(huì)對(duì)量表的信效度有很大影響,盡管相關(guān)分析法在量表編制中運(yùn)用得比較頻繁,例如,題總相關(guān)、題他相關(guān)以及題項(xiàng)與所屬維度相關(guān)等。最值得注意的是探索性因素分析法,它是在單純一種方法運(yùn)用中使用次數(shù)最多的,運(yùn)用此方法既可以來(lái)確定維度,又可以根據(jù)因子載荷刪減題項(xiàng)等。而鑒別指數(shù)法則是對(duì)題目的區(qū)分度進(jìn)行分析,從而刪除那些區(qū)分度小的題目。整體而言,對(duì)于一個(gè)量表的研制這3種方法是必不可少的。需要強(qiáng)調(diào)的是,既然是量表的研制,就應(yīng)該既要指明區(qū)分度,又要指明難度,才能使量表比較完整和規(guī)范。然而,在我國(guó)體育科學(xué)量表編制中對(duì)難度的分析甚少,盡管有對(duì)其分析的文獻(xiàn),也只是對(duì)量表整體通過(guò)率進(jìn)行寬泛地概括,而沒(méi)有對(duì)其更深入地界定。
3.2 方法的優(yōu)化組合
前面在維度與題項(xiàng)的編制中已經(jīng)了解到,體育科學(xué)量表編制中的初測(cè)題項(xiàng)數(shù)是最終題項(xiàng)數(shù)的1.71倍,這與其他學(xué)科通常的研究表述有所差距,即需要繼續(xù)刪減題項(xiàng)來(lái)簡(jiǎn)化量表。雖然這個(gè)標(biāo)準(zhǔn)僅是一種參考,并不代表體育科學(xué)研究中量表題項(xiàng)存在的主要問(wèn)題,但至少題項(xiàng)的不斷簡(jiǎn)練和準(zhǔn)確是一種追求,值得對(duì)不同的方法進(jìn)行嘗試和組合使用,如前面提到的層面理論。值得思考的是,通過(guò)層面理論的最小空間分析技術(shù)(SSA)來(lái)刪減題項(xiàng)雖然具有一定的結(jié)構(gòu)優(yōu)勢(shì),但是,最小空間分析技術(shù)無(wú)法精確地完成對(duì)跨區(qū)域題項(xiàng)的篩選,這就可能導(dǎo)致某些題項(xiàng)的確應(yīng)該在某一區(qū)域而產(chǎn)生誤刪的可能。所以,實(shí)際運(yùn)用當(dāng)中,筆者主張把最小空間分析安排在結(jié)構(gòu)效度驗(yàn)證的階段,與結(jié)構(gòu)方程模型一起組成更優(yōu)的組合來(lái)使其理論結(jié)構(gòu)更加合理。項(xiàng)目反應(yīng)理論是從微觀層面把題項(xiàng)與潛在特質(zhì)聯(lián)系起來(lái),并通過(guò)難度、區(qū)分度以及信息量等指標(biāo)來(lái)體現(xiàn)內(nèi)在特征。這樣,優(yōu)化組合可以使編制的量表具有更高的信效度。因此,在這里引入了來(lái)自經(jīng)典測(cè)量理論又優(yōu)于經(jīng)典測(cè)量理論的項(xiàng)目反應(yīng)理論相關(guān)內(nèi)容來(lái)優(yōu)化題項(xiàng)刪減和驗(yàn)證的過(guò)程,如通過(guò)Lord提出的三參數(shù)模型公式[34]:
來(lái)繪制項(xiàng)目反應(yīng)特征曲線(xiàn)(圖3)。式中,Pij(θj)表示能力為θ的人在項(xiàng)目上正確作答的概率,θj表示被試的能力或潛在特質(zhì),bi表示項(xiàng)目i的難度參數(shù),e表示自然對(duì)數(shù)之底=2.71828,ai表示項(xiàng)目i的區(qū)分度參數(shù),ci表示項(xiàng)目i的偽機(jī)遇參數(shù),習(xí)慣稱(chēng)猜測(cè)參數(shù)[8]。
圖 3 項(xiàng)目反應(yīng)理論三參數(shù)項(xiàng)目特征曲線(xiàn)示意圖
從圖3中可以看出,如果同一個(gè)題項(xiàng),對(duì)于不同受試來(lái)說(shuō),其項(xiàng)目反應(yīng)理論的疊加會(huì)是如圖的項(xiàng)目反應(yīng)理論曲線(xiàn),而經(jīng)典測(cè)量理論則高低疊加相抵,出現(xiàn)適中,這就損失了很多信息,表現(xiàn)出了經(jīng)典測(cè)量理論依賴(lài)于樣本的特性。在這里,主要討論的是運(yùn)用項(xiàng)目反應(yīng)理論的難度、區(qū)分度以及信息量并結(jié)合前面運(yùn)用的方法來(lái)對(duì)題項(xiàng)進(jìn)行更優(yōu)的刪減。因此,這里主要探討圖中項(xiàng)目反應(yīng)理論的有關(guān)參數(shù)。由于在三參數(shù)模型的情況下,其區(qū)分度、難度以及猜測(cè)參數(shù)均可以被包括,所以,主要討論三參數(shù)模型的參數(shù)以及刪題標(biāo)準(zhǔn),而雙參數(shù)模型是在三參數(shù)模型的猜測(cè)參數(shù)等于零的情況下的特例,單參數(shù)則是在猜測(cè)參數(shù)和區(qū)分度參數(shù)均為零的情況下的特例。圖中b為橫坐標(biāo)能力尺度上的一個(gè)點(diǎn),此點(diǎn)決定了項(xiàng)目特征曲線(xiàn)在坐標(biāo)軸的位置,稱(chēng)為項(xiàng)目的位置參數(shù),但是大多數(shù)情況下稱(chēng)它為難度參數(shù)。特征曲線(xiàn)在b點(diǎn)處的斜率為a,此點(diǎn)代表了項(xiàng)目的區(qū)分度,其值越高,則區(qū)分能力越大。c點(diǎn)則代表了猜測(cè)參數(shù),它的理論值在0.0~1.0之間,如果過(guò)高則不被接受。很多研究針對(duì)難度、區(qū)分度以及猜測(cè)參數(shù)定義的刪題標(biāo)準(zhǔn)不是很一致,但是這可能與研究的樣本有一定關(guān)系。有的研究[32]提出,a≤0.2,或a≥3;b≤-3或b≥4;c≥0.35則需要將其刪除。有的提出[6]a≤0.3,或a≥4;b≤-2.59或b≥2.59;c≥0.4,這需要根據(jù)具體情況而定。另外,信息量可以用于評(píng)價(jià)一個(gè)量表的信度,即用信息量來(lái)代表信度的概念,并把信息量定義到每個(gè)題項(xiàng)及其被試上,可以為檢驗(yàn)結(jié)果是否可信提供更優(yōu)的信度。一般情況下,信息量高于25時(shí),說(shuō)明此量表質(zhì)量良好;在16~25的情況下,表明量表有待改進(jìn);如果低于16,則說(shuō)明此量表較差[7,18],整個(gè)計(jì)算過(guò)程需要在專(zhuān)門(mén)軟件上來(lái)完成(如Parscale,Multilog,Bilog等軟件)。需要提醒的是,在項(xiàng)目反應(yīng)理論中的難度指標(biāo)不影響題項(xiàng)最大信息量的取值,僅會(huì)影響其位置,而區(qū)分度以及猜測(cè)參數(shù)對(duì)其均具有很大影響。區(qū)分度參數(shù)越高,則題項(xiàng)所提供的信息量也將變大;而猜測(cè)參數(shù)越大,則信息量參數(shù)就會(huì)越小。
4.1 信效度的選擇
測(cè)驗(yàn)的信度是指測(cè)驗(yàn)的可靠程度,而效度則是指一個(gè)測(cè)驗(yàn)在測(cè)量某項(xiàng)指標(biāo)時(shí)所具有的準(zhǔn)確程度[14]。通常,在體育科學(xué)量表編制中使用的信度主要有內(nèi)部一致性系數(shù)、重測(cè)信度及評(píng)分者信度等;效度主要有內(nèi)容效度、結(jié)構(gòu)效度及效標(biāo)關(guān)聯(lián)效度等[15]。同時(shí),結(jié)構(gòu)效度包括收斂效度和判別效度,效標(biāo)效度又稱(chēng)為實(shí)證效度,它包括預(yù)測(cè)效度和同時(shí)效度。在信度方面,有些體育科學(xué)量表的編制中既用了克隆巴赫α系數(shù)的方法也用了折半法,但是僅用α系數(shù)即可,它優(yōu)于折半法。由于折半法是對(duì)測(cè)試題項(xiàng)對(duì)等分開(kāi),這本身就降低了信度,而克隆巴赫系數(shù)法克服了折半法的部分缺點(diǎn)。另外,體育科學(xué)量表編制中,量表的同質(zhì)性信度和結(jié)構(gòu)效度使用率是非常高的,可能是因?yàn)檫@兩種方法被認(rèn)可的程度較高。但是從理論上來(lái)說(shuō),內(nèi)容效度和效標(biāo)效度,在有條件的情況下均應(yīng)該進(jìn)行驗(yàn)證。很早以前,美國(guó)心理學(xué)會(huì)就已經(jīng)把效度分為了3大類(lèi):內(nèi)容效度、結(jié)構(gòu)效度以及關(guān)聯(lián)效度。因此,這3種不同的效度對(duì)于一個(gè)量表來(lái)說(shuō)均具有參考價(jià)值。
除了前面分析的信度以外,較多的是驗(yàn)證了重測(cè)信度,但是效標(biāo)效度和內(nèi)容效度的驗(yàn)證還有所欠缺。在今后的研究中結(jié)合層面理論的映射語(yǔ)句運(yùn)用,可以在一定程度上保證內(nèi)容效度的提高,而效標(biāo)效度可以采用相關(guān)分析、區(qū)分度分析以及命中率分析來(lái)檢驗(yàn)[14]。但是,建議應(yīng)該更加重視的是結(jié)構(gòu)效度,因?yàn)?,無(wú)論是內(nèi)容效度還是效標(biāo)關(guān)聯(lián)效度在與結(jié)構(gòu)效度相比的情況下均不會(huì)處于同一地位,結(jié)構(gòu)效度是作為一個(gè)廣泛的概念在一定程度上包括了其他效度[9]。因此,本研究主張將結(jié)構(gòu)方程模型方法結(jié)合層面理論的最小空間分析(SSA)技術(shù)來(lái)優(yōu)化量表編制中的結(jié)構(gòu)效度。
4.2 方法的優(yōu)化組合
層面理論中數(shù)據(jù)處理的關(guān)鍵技術(shù)為多維尺度分析(MultiDimensional Scaling, 簡(jiǎn)稱(chēng)MDS),而MDS的一個(gè)重要模型是最小空間分析(SSA)[24,28],它既可以在研究?jī)?nèi)容概念結(jié)構(gòu)還不是很確定的情況下進(jìn)行探索性SSA;也可以在理論結(jié)構(gòu)初步確立之后,進(jìn)行驗(yàn)證性SSA。通過(guò)采用驗(yàn)證性SSA來(lái)進(jìn)行結(jié)構(gòu)性驗(yàn)證,可以為在理論上某題項(xiàng)更適合哪一維度提供統(tǒng)計(jì)上的數(shù)據(jù)支持,從而可以對(duì)此題項(xiàng)所屬維度進(jìn)行重新界定,并運(yùn)用結(jié)構(gòu)方程模型來(lái)最后對(duì)運(yùn)用驗(yàn)證性SSA之前的模型與之后改變的模型進(jìn)行擬合度比較,從而得出最優(yōu)的結(jié)構(gòu)模型。
SSA主要是先計(jì)算變量或題項(xiàng)之間的相關(guān),然后在一個(gè)多維空間用點(diǎn)來(lái)表示每個(gè)題項(xiàng)或變量,其結(jié)果是空間中的距離關(guān)系代表了題項(xiàng)之間的相似系數(shù)關(guān)系[13]。最重要的是,SSA的圖形結(jié)構(gòu)中可以直觀地展示某個(gè)區(qū)域是否特定地代表了某一個(gè)維度的元素,如果代表了共同的層面,則說(shuō)明這一設(shè)計(jì)是合理的[21]。SSA還可以通過(guò)區(qū)域的形狀以及同一層面元素的關(guān)系來(lái)驗(yàn)證層面所扮演的角色,為理論結(jié)構(gòu)的假設(shè)提供依據(jù),例如極化角色、模塊角色等等[25]。為了更加直觀起見(jiàn),筆者繪制了圖4,圖中的1、2、3、4等點(diǎn)為假設(shè)的各個(gè)題項(xiàng),且假設(shè)層面A包括3個(gè)元素分別為a、b和c;而層面B包括d、e和f;層面C包括g、h和j。
圖 4 SSA的圓柱形結(jié)構(gòu)及其分解示意圖
由圖4可以發(fā)現(xiàn),層面A中包含的3個(gè)元素是一個(gè)軸線(xiàn)層面,對(duì)應(yīng)著圖右邊分解后的軸線(xiàn)角色;層面B包含的元素將空間分為3個(gè)扇形的區(qū)域,對(duì)應(yīng)著圖右邊分解的極化角色;層面C將空間分為3個(gè)圓環(huán)區(qū)域,對(duì)應(yīng)著圖右邊分解的模塊角色。其極化層面與模塊層面共同可以構(gòu)成圖右邊的雷達(dá)圖結(jié)構(gòu),越靠近中心的區(qū)域,元素相關(guān)以及題項(xiàng)相關(guān)越緊密,并且具有單向相關(guān)順序;而軸線(xiàn)層面也具有這種特點(diǎn),如果在這個(gè)基礎(chǔ)上再加入此軸線(xiàn)層面,即加入了一個(gè)縱向維度,則成為圖左邊的圓柱形空間結(jié)構(gòu)圖[35,36]。當(dāng)然,SSA所得的結(jié)果不必是三維空間圖,可以是上面分解后圖形中的任何一種,并且圖形不會(huì)如此的規(guī)則[37]。
圖4中各層面看似分散,實(shí)際各層面元素都是連續(xù)的,并且題項(xiàng)之間的差異越小,區(qū)域的分離越不明顯。在不同的層面中,預(yù)測(cè)效度通常為雷達(dá)圖中心的元素優(yōu)于遠(yuǎn)離中心的元素。例如,圖4中f中的題項(xiàng)在g元素中的得分來(lái)預(yù)測(cè)d中的題項(xiàng)在g元素中的得分,往往優(yōu)于f中的題項(xiàng)在j元素中的得分來(lái)預(yù)測(cè)d中的題項(xiàng)在j元素中的得分。但這里更加關(guān)注的是,在進(jìn)行SSA分析之后,找出哪些是處于跨區(qū)域的題項(xiàng),從而結(jié)合理論,探討是否對(duì)這些題項(xiàng)進(jìn)行重新劃分或者將其剔除,這樣就在一定程度上權(quán)衡了驗(yàn)證性因素分析數(shù)據(jù)至上的弊端。因此,量表編制中結(jié)構(gòu)效度的驗(yàn)證程序應(yīng)該是首先進(jìn)行結(jié)構(gòu)方程模型分析,然后進(jìn)行SSA,再對(duì)規(guī)整后的數(shù)據(jù)進(jìn)行結(jié)構(gòu)方程模型分析,最后比較前后擬合指數(shù),結(jié)合理論分析得出更優(yōu)的理論結(jié)構(gòu)以及結(jié)構(gòu)效度。
由于圖4結(jié)構(gòu)理解起來(lái)相對(duì)比較抽象,因此,本研究在以往研究的基礎(chǔ)上給出一個(gè)案例,2012年在《心理科學(xué)》發(fā)表的一篇《基于多層面模型的教學(xué)效能感量表》的研究[18],該研究對(duì)收回的問(wèn)卷(162份)數(shù)據(jù)進(jìn)行了SSA分析,并對(duì)跨區(qū)域題項(xiàng)進(jìn)行了剔除,最后對(duì)剩余題項(xiàng)進(jìn)行了重新命名與驗(yàn)證。在本研究所指的SSA分析側(cè)重的便是驗(yàn)證,即:如果在驗(yàn)證性SSA分析中出現(xiàn)跨區(qū)域題項(xiàng),則應(yīng)該結(jié)合實(shí)際理論考慮這些跨區(qū)域題項(xiàng)是否應(yīng)該進(jìn)行重新劃分,這樣便在一定程度上權(quán)衡了驗(yàn)證性因素分析數(shù)據(jù)至上的弊端。另外,根據(jù)層面理論原理,測(cè)量的維度驗(yàn)證既可以通過(guò)同心圓來(lái)劃分,也可以通過(guò)軸線(xiàn)來(lái)劃分(圖5)。
圖 5 SSA分析中兩個(gè)層面的最小空間軸線(xiàn)結(jié)構(gòu)圖[18]
趙守盈(2012)的研究指出[18],兩個(gè)同心圓包括了知識(shí)傳授、課堂組織管理和品德行為教育(研究中將其稱(chēng)為任務(wù)層面);而根據(jù)4條軸線(xiàn)可以將教學(xué)效能感量表分為素質(zhì)能力、學(xué)生反饋、積極體驗(yàn)和情緒喚醒(研究中將其稱(chēng)為認(rèn)識(shí)來(lái)源層面),它們處于同等重要的位置(因?yàn)槭瞧叫械年P(guān)系[18])。事實(shí)上,圖5便是圖4中模塊角色與極化角色的疊加,從而構(gòu)成了圖4中的雷達(dá)圖結(jié)構(gòu)。由此可見(jiàn),采用層面理論的SSA技術(shù)可以更加直觀的根據(jù)題項(xiàng)的距離進(jìn)行理論框架的驗(yàn)證。
在這樣的分析過(guò)程中,擬合指標(biāo)是不可缺少的參考指標(biāo),最小空間分析進(jìn)行數(shù)據(jù)的轉(zhuǎn)換過(guò)程中,很多情況下是無(wú)法完全對(duì)應(yīng)的,而只能說(shuō)是在一定程度上的滿(mǎn)足。例如,圖5中異化系數(shù)為0.15356,在可接受的范圍之內(nèi);區(qū)域指數(shù)為1.000,說(shuō)明圖形的區(qū)分度非常好,無(wú)跨區(qū)域現(xiàn)象。通常,這一分析過(guò)程可通過(guò)相應(yīng)軟件來(lái)計(jì)算完成(如Hubag6.0),并需要多次迭代計(jì)算。因此,無(wú)論SSA是在反映概念結(jié)構(gòu)以及成功的構(gòu)建理論,還是在驗(yàn)證其準(zhǔn)確性中,均需要擬合指數(shù)來(lái)進(jìn)行判定。在SSA中,經(jīng)常采用的擬合指標(biāo)為異化系數(shù),它表示與完美擬合之間的差異,反映了原始輸入數(shù)據(jù)通過(guò)SSA之后得出多維空間中輸出數(shù)據(jù)的不一致程度[40]。一般情況下應(yīng)該小于0.15,但有時(shí)在不超過(guò)0.20時(shí)也可以接受,這需要根據(jù)具體研究的內(nèi)容以及情況而定[21]。通常情況下,有兩種方式可以減小異化系數(shù)的數(shù)值,分別為增加維度數(shù)和刪除極端數(shù)據(jù)。這里,區(qū)域指數(shù)表示了某一維度對(duì)空間圖的區(qū)分程度,取值在0~1之間,其數(shù)值越大,說(shuō)明區(qū)分程度越好。
因此,未來(lái)體育科研量表的編制需要將計(jì)量化和非計(jì)量化的手段結(jié)合使用是一個(gè)有價(jià)值的思路,通過(guò)優(yōu)勢(shì)互補(bǔ)達(dá)到編制量表的科學(xué)與規(guī)范。當(dāng)然,這種結(jié)合應(yīng)該以計(jì)量化手段為主體,這是遵從科學(xué)研究范式的基本前提,然而,添加非計(jì)量化的考察方法可能會(huì)得出更加理想化的結(jié)果。
5.1 量表初建以及方法的優(yōu)化
目前,我國(guó)體育科學(xué)量表編制中維度的初次確定運(yùn)用比較多的方法為理論分析法和訪談法;題項(xiàng)編制過(guò)程中運(yùn)用比較多的方法為相關(guān)量表引用法、因子分析法以及訪談法等。經(jīng)過(guò)對(duì)2008—2012期間我國(guó)體育類(lèi)核心期刊(13家)發(fā)表的量表編制文獻(xiàn)的研究顯示,我國(guó)體育類(lèi)量表編制中初始題項(xiàng)數(shù)是最終題項(xiàng)數(shù)的1.71倍(當(dāng)然,這僅是一種均值反映)。這與Devellis[20](1991)對(duì)量表編制中的觀點(diǎn)(初測(cè)是最終的3~4倍)有一定的出入,當(dāng)然,這可能與其專(zhuān)業(yè)特色有一定的關(guān)系,因?yàn)?,畢竟體育研究是一個(gè)特殊的領(lǐng)域。但是,不可否認(rèn)的是,體育科學(xué)量表編制在研究方法上還存在單一性和機(jī)械性,對(duì)題項(xiàng)的篩減幾乎完全遵從固有的統(tǒng)計(jì)模式,缺少對(duì)多元方法的綜合運(yùn)用或組合運(yùn)用,而一些較為新穎的理論和方法可能會(huì)有更大的益處(如層面理論的映射語(yǔ)句),這便對(duì)來(lái)自經(jīng)典測(cè)量理論的方法提出了極大挑戰(zhàn),找到更加合適的方法與之進(jìn)行優(yōu)化組合可能會(huì)達(dá)到意想不到的結(jié)果。
層面理論之所以表現(xiàn)出較大優(yōu)勢(shì),就在于首先從宏觀來(lái)分析,在運(yùn)用中主要是通過(guò)查閱大量工具書(shū)以及文獻(xiàn),或者運(yùn)用一些體育科研中常用的方法(訪談法、問(wèn)卷調(diào)查等)來(lái)對(duì)所研究的內(nèi)容進(jìn)行歸納與演繹,設(shè)計(jì)出映射語(yǔ)句框架。從微觀來(lái)分析,在宏觀的映射語(yǔ)句框架下,從每個(gè)層面僅選擇一個(gè)元素來(lái)進(jìn)行組合,再采用覆蓋題目或采樣題目的編寫(xiě)方法來(lái)編寫(xiě)具有更好內(nèi)容效度的題項(xiàng),這就使得量表的編制更加科學(xué)與規(guī)范。同時(shí),為了完善映射語(yǔ)句,也可以對(duì)其通過(guò)元素?cái)U(kuò)展和層面擴(kuò)展來(lái)進(jìn)行充實(shí)。當(dāng)然,對(duì)于更加具體的知識(shí)運(yùn)用則需要讀者進(jìn)行相關(guān)書(shū)籍的閱讀。5.2 量表項(xiàng)目分析及方法的優(yōu)化
總體來(lái)看,我國(guó)體育類(lèi)量表編制中項(xiàng)目分析方法運(yùn)用較多的為相關(guān)分析法(如高低分組)、探索性因素分析法和鑒別指數(shù)法。但需要注意的是,探索性因素分析在體育量表編制中往往為單純的一種方法,而相關(guān)分析法則包括了許多的相關(guān),例如:題總相關(guān)、題他相關(guān)以及其他各種相關(guān)。從而可以看出探索性因素分析的重要性,因?yàn)椋瓤梢詠?lái)確定維度,也可以根據(jù)因子載荷來(lái)刪減題項(xiàng)等等。當(dāng)然,對(duì)于一個(gè)量表的編制,這3種方法是均不可少的,但對(duì)量表的難度分析卻有待改進(jìn)。因此,筆者認(rèn)為,在結(jié)合經(jīng)典測(cè)量理論的基礎(chǔ)上,引入項(xiàng)目反應(yīng)理論的相關(guān)內(nèi)容來(lái)進(jìn)行題項(xiàng)的刪減尤為重要,至少可成為一種新的嘗試或取向。本研究針對(duì)Lord提出的三參數(shù)公式繪制了項(xiàng)目反應(yīng)理論三參數(shù)的項(xiàng)目特征曲線(xiàn)(雙參數(shù)和單參數(shù)均可以由三參數(shù)得到),并對(duì)其進(jìn)行了解釋說(shuō)明。雖然,不同的研究?jī)?nèi)容或樣本不同,可能導(dǎo)致考察的指標(biāo)或參考的評(píng)判標(biāo)準(zhǔn)不一,但經(jīng)過(guò)項(xiàng)目反應(yīng)理論分析來(lái)進(jìn)行刪減,不僅可以對(duì)量表的整體進(jìn)行分析,而且還可以對(duì)每個(gè)題項(xiàng)進(jìn)行考察,從而得出更優(yōu)的題項(xiàng)。
5.3 信效度分析以及方法的優(yōu)化
研究中發(fā)現(xiàn),對(duì)于我國(guó)體育科研中整體量表編制信度的檢驗(yàn),基本所有的論文均對(duì)同質(zhì)性信度進(jìn)行了檢驗(yàn),還有部分對(duì)其重測(cè)信度進(jìn)行了檢驗(yàn)。方法運(yùn)用最多的則是克隆巴赫α系數(shù),這與調(diào)查中基本都對(duì)其同質(zhì)性信度進(jìn)行了檢驗(yàn)是一致的。當(dāng)然,克隆巴赫α系數(shù)克服了折半法的缺點(diǎn),而且克隆巴赫α系數(shù)是目前比較認(rèn)可的信度評(píng)價(jià)指標(biāo)。但是,思考一個(gè)量表或者分量表僅給出一個(gè)α系數(shù)信度指標(biāo)可能會(huì)有不妥之處。因?yàn)椋@樣可能存在有的題目因?yàn)樾哦群芨叨巡糠中哦群艿偷念}目掩蓋了。考慮到這層原因,本研究提出了運(yùn)用項(xiàng)目反應(yīng)理論中的信息量來(lái)代表信度的概念,并可以把信息量定義到每個(gè)題項(xiàng)以及被試上,從而結(jié)合前面經(jīng)典測(cè)量理論的分析方法來(lái)制定出量表更好的信度(參照標(biāo)準(zhǔn)前文已述)。更重要的是,它可以與經(jīng)典測(cè)量理論中能夠體現(xiàn)外在特性的方法進(jìn)行優(yōu)化組合,從而構(gòu)成內(nèi)外結(jié)合的范式,使量表可以具有更高的信效度。
對(duì)于我國(guó)體育科學(xué)量表編制的效度的檢驗(yàn),則基本都對(duì)結(jié)構(gòu)效度進(jìn)行了檢驗(yàn),內(nèi)容效度和效標(biāo)效度使用不一,這可能與它們的評(píng)價(jià)目的不一有關(guān)。但內(nèi)容效度和效標(biāo)效度,若有條件均應(yīng)該進(jìn)行驗(yàn)證,因?yàn)?,?nèi)容效度、結(jié)構(gòu)效度以及關(guān)聯(lián)效度(效標(biāo)效度)對(duì)量表均具有參考價(jià)值。但是若在沒(méi)有很好的條件下,就應(yīng)該更加注重結(jié)構(gòu)效度的驗(yàn)證,這是因?yàn)椋舭阉c內(nèi)容效度和效標(biāo)效度來(lái)進(jìn)行相比,它們是不會(huì)處于同一地位的,結(jié)構(gòu)效度作為一種廣泛的概念在一定程度上包括了其他的效度[9]。因此,本研究提出了更加優(yōu)化的方法組合來(lái)改善和驗(yàn)證量表的結(jié)構(gòu)效度。具體的做法應(yīng)該是:對(duì)編制的量表運(yùn)用結(jié)構(gòu)方程模型來(lái)檢驗(yàn),然后運(yùn)用驗(yàn)證性SSA來(lái)進(jìn)行驗(yàn)證,并結(jié)合理論來(lái)探討哪些題項(xiàng)需重新界定,再結(jié)合結(jié)構(gòu)方程模型來(lái)最后對(duì)驗(yàn)證性SSA之前的模型與之后改變的模型擬合度比較,從而確立最佳選擇。當(dāng)然,不同的量表編制對(duì)SSA模型以及指標(biāo)的評(píng)判標(biāo)準(zhǔn)會(huì)不一致,至于最終如何選擇,還需研究者自己來(lái)決定。
體育科學(xué)量表編制是體育科學(xué)研究中的一個(gè)重要分支,其科學(xué)性、規(guī)范性和精確性不僅影響到各種測(cè)量的準(zhǔn)確,更是彰顯著一種學(xué)科的發(fā)展水平,是每一位體育工作者對(duì)體育科學(xué)學(xué)科規(guī)范的一種追求。雖然,在這個(gè)道路上,大家可能缺乏統(tǒng)一的研究范式或結(jié)構(gòu),但對(duì)研究方法的不斷創(chuàng)新和追求應(yīng)該達(dá)成一種共識(shí)。研究中方法的使用也可能還存在這樣或那樣的誤區(qū),但它不能成為我們對(duì)方法追求的絆腳石。
體育科學(xué)量表編制在經(jīng)歷了經(jīng)典測(cè)量理論之后,勢(shì)必對(duì)概化理論和項(xiàng)目反應(yīng)理論有所應(yīng)用上的突破,經(jīng)典測(cè)量理論有著非常好的量化優(yōu)勢(shì),但對(duì)樣本的追求過(guò)高,其完全的統(tǒng)計(jì)學(xué)意義也不一定符合特定領(lǐng)域的研究,尤其是體育這一特殊領(lǐng)域。而項(xiàng)目反應(yīng)理論在一定程度上對(duì)此進(jìn)行了彌補(bǔ),并且指向了測(cè)驗(yàn)分?jǐn)?shù)的解釋階段,側(cè)重于測(cè)驗(yàn)的精確度,從而使題項(xiàng)具有更優(yōu)的信度;層面理論則指向項(xiàng)目的編寫(xiě)階段,側(cè)重于測(cè)驗(yàn)的效度,從而使其具有更優(yōu)的內(nèi)容效度和結(jié)構(gòu)效度??上攵簩⑦@些理論結(jié)合起來(lái)優(yōu)化運(yùn)用必將使體育量表的編制進(jìn)一步深入發(fā)展。因此,對(duì)新方法或理論的不斷追求應(yīng)成為我們每一位科研工作者的傳統(tǒng),讓我們的體育學(xué)科更加規(guī)范、有序發(fā)展。
[1]邊玉芳.警惕心理學(xué)研究中的統(tǒng)計(jì)誤用[J].心理科學(xué)進(jìn)展,2002,10(4):447-452.
[2]陳善平,潘秀剛,張平,等.大學(xué)生體育鍛煉效果自評(píng)量表(EEI)的編制和信效度檢驗(yàn)[J].北京體育大學(xué)學(xué)報(bào),2008,31(10):1404-1406.[3]金瑜.心理測(cè)量[M].上海:華東師范大學(xué)出版社,2001:209-216.[4][美]羅伯特·F·德威利斯.量表編制:理論與應(yīng)用[M].魏勇剛,龍長(zhǎng)權(quán),宋武譯.重慶:重慶大學(xué)出版社,2004.
[5]劉電芝.教育與心理研究方法[M].重慶:西南師范大學(xué)出版社,2001.
[6]劉全,劉汀.基于項(xiàng)目反應(yīng)理論的社情民意調(diào)查問(wèn)卷設(shè)計(jì)[J].統(tǒng)計(jì)與決策,2012,(10):29-32.[7]羅照盛.項(xiàng)目反應(yīng)理論基礎(chǔ)[M].北京:北京師范大學(xué)出版社,2012.[8]漆書(shū)青,戴海琦.項(xiàng)目反應(yīng)理論及其應(yīng)用研究[M].南昌:江西高校出版社,1992.
[9]漆書(shū)青.現(xiàn)代教育與心理測(cè)量學(xué)原理[M].北京:高等教育出版社,2002:262-275.
[10]史青.大學(xué)生體育課學(xué)習(xí)滿(mǎn)意度測(cè)查量表編制[J].體育學(xué)刊,2010,17(7):56-60.
[11]陶西平,張秀媛,李吉會(huì).教育評(píng)價(jià)辭典[M].北京:北京師范大學(xué)出版社,1998.
[12]吳明隆.SPSS統(tǒng)計(jì)應(yīng)用實(shí)務(wù)[M].北京:中國(guó)鐵道出版社,2001.
[13]楊建原,臧運(yùn)洪,趙守盈.應(yīng)用項(xiàng)目反應(yīng)理論對(duì)友誼質(zhì)量量表修定——以結(jié)構(gòu)方程、層面理論多種技術(shù)支持修定量表的質(zhì)量[J].心理學(xué)進(jìn)展,2011,(1):97-105.
[14]張力為.體育科學(xué)研究方法[M].北京:高等教育出版社,2002.[15]張力為.研究方法在制約我們的追求嗎?——閱讀《體育科學(xué)》2003年社會(huì)科學(xué)論文的聯(lián)想[J].體育科學(xué),2005,25(4):74-80.[16]趙必華,顧海根.心理量表編制中的若干問(wèn)題及題解[J].心理科學(xué),2010,33(6):1467-1469.
[17]趙守盈,江新會(huì).行為科學(xué)研究設(shè)計(jì)與理論構(gòu)建的一種重要策略——層面理論述評(píng)[J].貴州師范大學(xué)學(xué)報(bào),2006,24(2):113-118.
[18]趙守盈,楊建原,臧運(yùn)紅.基于多層面模型的教學(xué)效能感量表[J].心理科學(xué),2012,35(6):1484-1490.
[19]趙守盈,王艷,SAMUEL SHYE.層面理論的核心技術(shù)概念——映射語(yǔ)句[J].貴州師范大學(xué)學(xué)報(bào),2010,28(3):41-45.
[20]DEVELLIS R F,BLALOCK S J,HOLT K D,etal.Arthritis patients’reactions to unavoidable social comparisons[J].Person Social Psycho Bulletin,1991,17(4):392-399.
[21]DONALD I,COOPER R.A facet approach to extending the normative component of the theory of reasoned action[J].Bri J Soc Psycho,2001,40(4):599-621.
[22]GUTTMAN L.Introduction to facet design and analysis[A].Proceedings of the Fifteenth International Congress of Psychology[C].Acta Psycho ,1959.
[23]GLENDA S,STUMP,JENEFER H,etal.The nursing student self-efficacy scale[J].Nurs Res,2012,61(3):149-158.
[24]GUTTMAN R,GREENBAUM C W.Facet theory:its development and current status [J].Eur Psycho,1998,3(1):13-36.
[25]HACKETT P,FOXALL G.Consumers’evaluation of an international airport:a facet theoretical approach[J].Int Rev Retail Distribut Consum Res,1997,7(4):339-349.
[26]HAMBLETON R K,JONES R W.Comparison of Classical Test Theory and Item Response Theory and Their Application to Test Development[J].Edu Measure Issue Practice,1993,12(3):38-47.
[27]HIDEYUKI T.Scale development for measuring junior high and high school students’ enjoyment,benefit,and psychological barrier for exercise by item response theory[J].Int J Sport Health Sci,2005,(3):129-141.
[28]HILDEBRANDT L.A facet theoretical approach for testing measurement and structural theories:an application of confirmatory MDS[J].Advances Consum Res,1986,13(1):523-528.
[29]HORNIK J.The facet design approach to the construction of multivariate marketing models[J].Eur J Market,2001,8(2):146-157.
[30]HOYT A L,RHODES R E,HAUSENBLAS H A,etal.Intergrating five-factor model facet-level traits with the theory of planned behavior and exercise[J].Psycho Sport Exe,2009,10(5):565-572.
[31]JAMES F F,ESWAR K,MATTHIAS R,etal.Improved responsiveness and reduced sample size requirements of PROMIS physical function scales with item response theory[J].Arth Res Therapy,2011,13(5):147-155.
[32]JOSHUA S A,ALEXANDER B,FRANK C W,et.al.An Analysis of Cross Racial Identity Scale Scores Using Classical Test Theory and Rasch Item Response Models[J].Measure Evaluat Counsel Develop,2012,46(2):136-153.
[33]KERN M L,FRIDMAN H S.Do conscientious individuals live longer:A quantitative review [J].Health Psycho,2008,27(5):505-512.
[34]LORD F M.Applications of item response theory to practical testing problems[M].Hillsdale,NJ:Lawrence Erlbaum Associates,1980.
[35]MANABE K.Applying facet theory to studies of Japanese society:verification of laws of human behavior[J].Soc Summary,2003,95(10):37-44.
[36]MASLOVATY N.Teachers’ perceptions structured thorough facet theory:smallest space analysis versus factor analysis[J].Edu Psycho Measure,2001,61(1):71-84.
[37]MASLOVATY N.The Placement of moral contents:priorities and structure of the belief system of teacher and high school students[J].Edu Res Evaluat,2003,9(1):109-134.
[38]NUNNALLY J C.Psychometric Theory(2nd Ed)[M].New York :McGraw-Hill,1978.
[39]RAPSON G.Item response theory analyses of adolescent self-ratings of the ADHD symptoms in the Disruptive Behavior Rating Scale[J].Personal Individual Differ,2012,53(8):963-968.
[40]REBHUN U.Jewish identity in America:Structural analysis of attitudes and behaviors[J].Rev Religious Res,2004,46(1):43-63.
[41]ROD,WARD R,etal.The search for meaning in nursing:could facet theory be a way forward [J].J Advance Nurs,1993,18(4):549-557.
[42]ROSE W,RUFINA W,CARMEN G,etal.Culturally Sensitive Depression Assessment for Chinese American Immigrants:Development of a Comprehensive Measure and a Screening Scale Using an Item Response Approach[J].Asian Am J Psycho,2012,3(4):230-253.
[43]SHYE S,ELIZUR D.Introduction to facet theory:Content design and intrinsic data analysis in behavioral research[M].Thousand Oaks CA:Sage,1994.
[44]SHYE S.On the search for laws in the behavioral sciences.Theory Construction and Data Analysis in the Behavioral Sciences[M].San Francisco:Jossey-Bass,1978.
[45]SYMONS D D,GRAHAM G M,YANG S,etal.Youth exercise intention and past exercise behavior:examining the moderating influences of sex and meeting exercise recommendations[J].Res Q Exe Sport,2006,77(1):91-99.
[46]THELMA J,MIELENZ MICHAEL CEDWARDS LEIGH,etal.Item-Response-Theory Analysis of two scales for self-efficacy for exercise behavior in people with arthritis[J].J Aging Physical Activity,2011,19(3):239-248.
[47]VAN D,LINDEN W J.Handboo of Modern Item Response Theory[M].New York:Springer,1996.
[48]VIRGINIA G,BORJA S,LUIS Y,etal.Depressive dimensions and item response analysis of the Hamilton Depression Rating Scale-17 in eating disorders[J].Compreh Psychiatry,2012,53(4):396-402.
DiscussiononSeveralMainProblemsinSportsScienceScaleConstruction——AThinkingonMethodsOptimization
DAI Jian-hui1,JIN Ya-hong2
scale;methodsoptimization;itemresponsetheory;facettheory
1000-677X(2014)03-0088-10
2013-11-14;
:2014-01-23
教育部人文社會(huì)科學(xué)研究規(guī)劃基金資助項(xiàng)目 (13YJA890004)。
戴儉慧(1967-),女,安徽宣城人,副教授,博士,碩士研究生導(dǎo)師,主要研究方向?yàn)轶w育科研方法學(xué)、社會(huì)體育學(xué)和體育社會(huì)學(xué),Tel:(0512)67162281,E-mail: sddjh@suda.edu.cn;金亞虹(1976-),女,上海人,教授,博士,碩士研究生導(dǎo)師,主要研究方向?yàn)轶w育科研方法學(xué)、運(yùn)動(dòng)與認(rèn)知,Tel:(022)23012331,E-mail:yahongking@hotmail.com。
1.蘇州大學(xué) 體育學(xué)院,江蘇 蘇州 215021;2.天津體育學(xué)院 健康與運(yùn)動(dòng)科學(xué)系,天津 300381 1.Soochow University,Suzhou 215021,China;2.Tianjin Institute of Sport,Tianjin 300381,China.
G804.8
:A