柯友枝,孫建剛,李 博,劉 陽,4
(1. 上海體育學(xué)院 體育教育學(xué)院,上海 200438;2. 皖西學(xué)院 體育教育學(xué)院,安徽 六安 237012;3. 南通大學(xué) 體育科學(xué)學(xué)院,江蘇 南通 226019;4. 上海市學(xué)生體質(zhì)健康研究中心,上海 200438)
問卷調(diào)查法是目前社會(huì)學(xué)研究中應(yīng)用較為廣泛的資料收集方法,尤其在社會(huì)調(diào)查中,問卷調(diào)查法的使用最為普遍。美國社會(huì)學(xué)家艾爾·巴比稱“問卷調(diào)查是社會(huì)研究的支柱”,英國社會(huì)學(xué)家莫澤說“10項(xiàng)社會(huì)調(diào)查中就有9項(xiàng)是采用問卷進(jìn)行的”,由此可見,問卷調(diào)查法在社會(huì)研究領(lǐng)域的巨大作用[1]。近年來,體育研究持續(xù)快速發(fā)展,作為體育社會(huì)研究領(lǐng)域中主要的研究方法之一,問卷調(diào)查法對體育科研工作者收集資料以開展相關(guān)研究起到了重要作用[2?3]。其中,問卷的研制與使用具有嚴(yán)格的標(biāo)準(zhǔn),問卷的信度與效度檢驗(yàn)是運(yùn)用問卷調(diào)查法的關(guān)鍵步驟,影響研究結(jié)果的可靠性和準(zhǔn)確性[4?6]。可信的問卷不一定是有效的問卷,但有效的問卷必是可信的問卷[7?8]。因此,效度是評價(jià)調(diào)查問卷最關(guān)鍵的指標(biāo),其代表問卷可準(zhǔn)確測出所測變量的程度,在一定程度上直接影響整個(gè)調(diào)查問卷的質(zhì)量[9?10]。
效度是指一項(xiàng)測驗(yàn)或量表所測量結(jié)果的準(zhǔn)確程度,即實(shí)際測出的結(jié)果和預(yù)想結(jié)果的一致程度[11]。對于使用調(diào)查問卷的研究者而言,為確保所使用的調(diào)查問卷具有較高的有效性,需要對調(diào)查問卷進(jìn)行效度檢驗(yàn),根據(jù)效度檢驗(yàn)結(jié)果修改問卷,調(diào)整問卷的內(nèi)容和結(jié)構(gòu),以提高調(diào)查問卷的效度,保證調(diào)查問卷所獲結(jié)果的準(zhǔn)確性和科學(xué)性[12?13]。然而,張力為[14]對100名2003年本科畢業(yè)生的學(xué)位論文進(jìn)行分析發(fā)現(xiàn),僅有2篇論文交待了調(diào)查問卷的效度;之后,張力為[15]對《體育科學(xué)》2003年發(fā)表的社會(huì)科學(xué)論文進(jìn)行調(diào)查發(fā)現(xiàn),很大一部分研究者忽略了調(diào)查問卷的效度檢驗(yàn)。有學(xué)者[16]還發(fā)現(xiàn),存在對效度評價(jià)方法分類不明確的問題,部分文章將效標(biāo)效度和區(qū)分效度并列進(jìn)行評價(jià)。另外,還有文章未明確說明進(jìn)行效度檢驗(yàn)的具體方法以及評價(jià)系數(shù)的具體值等[17?18]。一項(xiàng)嚴(yán)謹(jǐn)、規(guī)范的學(xué)術(shù)研究須以嚴(yán)謹(jǐn)、規(guī)范的科學(xué)方法為支撐,而調(diào)查問卷存在的效度問題使其研究結(jié)論的科學(xué)性和可靠性受到質(zhì)疑[19]。
目前,大多數(shù)運(yùn)用問卷調(diào)查法的體育科學(xué)研究都與相關(guān)理論問題密切相關(guān),有的甚至是開展某一重大體育科研項(xiàng)目的關(guān)鍵,對研究任務(wù)的完成和學(xué)科發(fā)展有著不可忽視的作用[20]。因此,對體育學(xué)科研究論文中問卷調(diào)查法的效度檢驗(yàn)情況進(jìn)行剖析,揭示問卷調(diào)查法的運(yùn)用現(xiàn)狀,有助于及時(shí)發(fā)現(xiàn)在問卷調(diào)查法應(yīng)用過程中存在的問題。本文在對2010—2020年中文社會(huì)科學(xué)引文索引(CSSCI)收錄體育期刊刊發(fā)的使用問卷調(diào)查法的文獻(xiàn)進(jìn)行調(diào)查和分析的基礎(chǔ)上,總結(jié)效度檢驗(yàn)現(xiàn)狀與存在的問題,并提出在體育科學(xué)研究中調(diào)查問卷效度檢驗(yàn)的方法和流程,以推動(dòng)問卷調(diào)查法的規(guī)范使用,完善體育學(xué)科研究方法體系,促進(jìn)體育學(xué)科良性發(fā)展。
以我國體育科學(xué)研究領(lǐng)域中的調(diào)查問卷效度檢驗(yàn)情況為研究對象,以2010—2020年CSSCI收錄的9本體育類學(xué)術(shù)期刊(2010—2020年無變動(dòng)的期刊)中采用問卷調(diào)查法的文獻(xiàn)為調(diào)查對象,納入的9本期刊分別是《體育科學(xué)》《上海體育學(xué)院學(xué)報(bào)》《中國體育科技》《北京體育大學(xué)學(xué)報(bào)》《體育學(xué)刊》《體育與科學(xué)》《天津體育學(xué)院學(xué)報(bào)》《武漢體育學(xué)院學(xué)報(bào)》《西安體育學(xué)院學(xué)報(bào)》。
運(yùn)用文獻(xiàn)資料法收集相關(guān)文獻(xiàn),運(yùn)用數(shù)理統(tǒng)計(jì)法對研究信息進(jìn)行統(tǒng)計(jì)與分析。以中國知網(wǎng)(CNKI)高級檢索程序?yàn)闄z索工具,以CSSCI收錄的9本體育類學(xué)術(shù)期刊為文獻(xiàn)來源,文獻(xiàn)的刊發(fā)時(shí)間段為2010年1月1日—2020年12月31日。在精確文獻(xiàn)來源期刊和刊發(fā)時(shí)間的基礎(chǔ)上,將符合研究條件的各期刊所有文獻(xiàn)導(dǎo)入文獻(xiàn)閱讀與管理軟件。共檢索到16 191篇文獻(xiàn),通過閱讀文獻(xiàn)題目、摘要和全文的方式進(jìn)行人工篩選,最終納入1 375篇文獻(xiàn)(圖1)。以數(shù)理統(tǒng)計(jì)法對納入文獻(xiàn)進(jìn)行信息提取與整理分析。
納入標(biāo)準(zhǔn):2010年1月1日—2020年12月31日,在9本期刊上刊發(fā)的運(yùn)用問卷調(diào)查法(包括使用各類量表)的學(xué)術(shù)論文。
剔除標(biāo)準(zhǔn):未采用問卷調(diào)查法的論文;僅采用由詢問事實(shí)性問題組成問卷的論文;所有作者均為國外研究者的論文;非定量研究范式的論文;會(huì)議論文、刊訊、題錄、通知等。
圖2為納入文獻(xiàn)問卷調(diào)查法的應(yīng)用情況。總體而言,2010—2020年各年度應(yīng)用問卷調(diào)查法的論文比例浮動(dòng)較小,除了2018年的89篇(6.5%)和2019年的52篇(3.8%)外,基本均保持在100篇以上。2017年之前均在120篇(8.9%)左右,2010年甚至有191篇??梢姡傮w上問卷調(diào)查法的應(yīng)用較為廣泛。體育學(xué)科同時(shí)具備社會(huì)學(xué)科和自然學(xué)科的性質(zhì),這也決定了體育學(xué)科研究方法的交叉性和滲透性[20]。同時(shí),這也說明體育科研工作者已不再滿足于運(yùn)用單一方法進(jìn)行研究,熟練掌握和正確運(yùn)用各種研究方法進(jìn)行綜合研究已成為體育科學(xué)研究發(fā)展的趨勢[19]。然而,無論使用哪種研究方法,科學(xué)和規(guī)范是關(guān)鍵。體育學(xué)科的發(fā)展與科學(xué)、規(guī)范的研究方法緊密相連,要保證體育學(xué)科的穩(wěn)步發(fā)展,必須重視對學(xué)科研究方法的規(guī)范和探索,不斷充實(shí)和完善學(xué)科研究方法體系[21]。目前,問卷調(diào)查法是體育學(xué)科研究領(lǐng)域中應(yīng)用廣泛的研究方法之一,其以有效的數(shù)據(jù)實(shí)現(xiàn)對復(fù)雜、宏觀體育現(xiàn)象或問題的精準(zhǔn)把握,也為解決問題和改進(jìn)現(xiàn)狀并促進(jìn)學(xué)科發(fā)展提供理論依據(jù)[22]。因此,問卷調(diào)查法的質(zhì)量高低將會(huì)直接關(guān)系研究結(jié)果的可靠性和準(zhǔn)確性,進(jìn)而影響學(xué)科未來的長遠(yuǎn)發(fā)展。
圖2 2010—2020年納入文獻(xiàn)問卷調(diào)查法的應(yīng)用情況Figure 2 Use of questionnaire survey in included studies from 2010 to 2020
近年來,問卷調(diào)查法在體育科學(xué)研究中依舊扮演著重要角色,但運(yùn)用問卷調(diào)查法過程中的規(guī)范性問題令人擔(dān)憂。在本文納入的1 375篇使用問卷調(diào)查法的論文中,對使用的調(diào)查問卷進(jìn)行效度檢驗(yàn)的有701篇(51%),其余674篇(49%)未對文中調(diào)查問卷的效度進(jìn)行報(bào)告或說明(表1)。“引用問卷”通常需要簡要介紹前人研制問卷的效度情況,有312篇文獻(xiàn)使用“引用問卷”,其中,54.8%的文獻(xiàn)說明了“引用問卷”的效度情況,45.2%的文獻(xiàn)未提及“引用問卷”的效度情況?!白跃巻柧怼毙鑼柧磉M(jìn)行效度檢驗(yàn),并詳細(xì)說明檢驗(yàn)的方法和結(jié)果,共777篇文獻(xiàn)使用“自編問卷”進(jìn)行調(diào)查,其中51.1%的文獻(xiàn)未對調(diào)查問卷進(jìn)行效度檢驗(yàn)。根據(jù)自身研究需要對成熟量表進(jìn)行改編的問卷,由于地區(qū)文化、樣本的差異,也應(yīng)進(jìn)行效度分析,保證改編后的調(diào)查問卷的質(zhì)量,有139篇文獻(xiàn)采用“改編問卷”,其中25.9%的文獻(xiàn)未對“改編問卷”的效度進(jìn)行檢驗(yàn)。此外,還有147篇文獻(xiàn)僅說明運(yùn)用問卷調(diào)查法,但未交代調(diào)查問卷的來源,其中,32.0%的文獻(xiàn)對問卷的效度“一筆帶過”,68.0%的文獻(xiàn)未提及問卷的效度。這在一定程度上反映出國內(nèi)體育科學(xué)研究者在運(yùn)用問卷調(diào)查法的過程中仍缺乏規(guī)范性。究其因[20,23]:一方面,問卷調(diào)查法本身具有嚴(yán)格的操作標(biāo)準(zhǔn)與科學(xué)的流程,但部分體育科學(xué)研究者對問卷調(diào)查法的流程與操作不夠熟悉;另一方面,部分體育科學(xué)研究者對調(diào)查問卷效度檢驗(yàn)的重要性認(rèn)識不足,導(dǎo)致在方法運(yùn)用過程中忽略了一些必要步驟。
表1 不同類型問卷效度報(bào)告情況Table 1 Reported validity of different types of questionnaires
根據(jù)調(diào)查問卷目的和效度的功能范圍可將效度分為內(nèi)容效度(content validity)、結(jié)構(gòu)效度(construct validity)和效標(biāo)效度(criterion-related validity)[11],其解釋的內(nèi)容具有一定的差別[24]。因此,研究者在應(yīng)用問卷調(diào)查法進(jìn)行效度檢驗(yàn)時(shí),應(yīng)明確說明該問卷進(jìn)行效度檢驗(yàn)所揭示的具體效度類型,一方面確保該效度檢驗(yàn)方法選用的準(zhǔn)確性,另一方面為同類研究提供足夠的參考信息。結(jié)果顯示,對問卷效度測評類型進(jìn)行明確說明的僅有547篇文獻(xiàn)(39.8%),對問卷效度測評類型無明確說明的有828篇文獻(xiàn)(60.2%),其中131篇文獻(xiàn)在文中僅以“效度良好”“效度達(dá)到標(biāo)準(zhǔn)”“效度經(jīng)過檢驗(yàn)”等描述調(diào)查問卷的效度檢驗(yàn)情況(未說明該問卷使用何種類型的效度檢驗(yàn)方法,以及進(jìn)行效度檢驗(yàn)的具體值)(表2)。這表明,在納入文獻(xiàn)中,對調(diào)查問卷進(jìn)行效度報(bào)告的過程中普遍存在效度檢驗(yàn)具體信息缺失的問題。
表2 問卷效度類型報(bào)告情況(n=1 375)Table 2 Reports of validity types of questionnaires
從效度檢驗(yàn)的方法看,在納入文獻(xiàn)中有246篇(17.9%)使用結(jié)構(gòu)效度、193篇(14.0%)使用內(nèi)容效度、3篇(0.2%)使用效標(biāo)效度進(jìn)行問卷效度檢驗(yàn)??傮w而言,目前效度評價(jià)所應(yīng)用的方法較為集中,缺乏全面性和多樣性。效度是一個(gè)多層面的概念[24],需要根據(jù)效度適應(yīng)范圍和特定功能,從不同的角度分別進(jìn)行效度評估[25]。在對調(diào)查問卷進(jìn)行效度檢驗(yàn)時(shí),僅使用一種效度檢驗(yàn)方法進(jìn)行評估可能會(huì)存在不足。一般而言,對于一份新的問卷(或用于不同條件下的經(jīng)典問卷),需根據(jù)實(shí)際情況對其進(jìn)行內(nèi)容效度、結(jié)構(gòu)效度和效標(biāo)效度的檢驗(yàn),應(yīng)盡量避免僅使用一種效度檢驗(yàn)方法[11]。在本文納入文獻(xiàn)中,僅有105篇采用2種以上的效度檢驗(yàn)方法進(jìn)行檢驗(yàn),其中,100篇(7.3%)同時(shí)報(bào)告了內(nèi)容效度和結(jié)構(gòu)效度,5篇(0.4%)同時(shí)進(jìn)行了結(jié)構(gòu)效度和效標(biāo)效度檢驗(yàn)。由此可知,大部分研究者在進(jìn)行調(diào)查問卷效度檢驗(yàn)時(shí)僅使用了一種方法,說明部分研究者在使用問卷調(diào)查法進(jìn)行效度檢驗(yàn)的過程中,對于效度規(guī)范應(yīng)用的認(rèn)識仍存在一定的欠缺。
此外,還有18篇文獻(xiàn)(1.3%)在報(bào)告問卷效度時(shí)僅表明該問卷效度已得到驗(yàn)證,達(dá)到了可接受及以上的標(biāo)準(zhǔn),并未具體說明引入效度的類型以及具體檢驗(yàn)值。值得注意的是,不同的問卷所適用的情景和人群存在差異,特別對于“引用問卷”,還需要考慮該問卷在不同文化背景下在語言、測量和功能上的等值性[26?27]。嚴(yán)格而言,如果“引用問卷”中任意一個(gè)等值性發(fā)生變化,則表明該問卷可能無法適用,應(yīng)重新修訂和檢驗(yàn)信效度[28]。因此,應(yīng)用“引用問卷”時(shí),應(yīng)對照分析原始問卷的研究對象和研究背景等,如完全適用,則應(yīng)明確說明原始問卷進(jìn)行效度檢驗(yàn)的具體信息,以供讀者參考。
由上可知,在體育科學(xué)研究領(lǐng)域中問卷調(diào)查法的效度評價(jià)存在不規(guī)范、不合理現(xiàn)象。究其因,研究者對問卷調(diào)查法缺乏科學(xué)的認(rèn)識和定位,對于效度評價(jià)的相關(guān)知識掌握不夠充分[29]。問卷調(diào)查法有其特定的方法論背景和基礎(chǔ),只有嚴(yán)謹(jǐn)、規(guī)范地使用問卷調(diào)查法,重視問卷的信度和效度問題,才能獲得科學(xué)的研究結(jié)果[20,30]。另外,對于學(xué)術(shù)期刊而言,對相關(guān)問題進(jìn)行嚴(yán)格把關(guān)對規(guī)范問卷調(diào)查法的使用具有一定作用。
明確表明進(jìn)行各類效度檢驗(yàn)的具體方法是確保效度檢驗(yàn)準(zhǔn)確的基礎(chǔ)。在納入的1 375篇文獻(xiàn)中,對問卷效度類型明確說明的有547篇(其中內(nèi)容效度、結(jié)構(gòu)效度和效標(biāo)效度均被使用)。但回溯原文發(fā)現(xiàn),部分研究者對不同類型的效度存在不同程度的誤用和濫用。
在明確表明效度類型的547篇文獻(xiàn)中,有193篇(35.3%)使用內(nèi)容效度進(jìn)行問卷效度評價(jià)(表3),其中:190篇文獻(xiàn)明確說明了內(nèi)容效度檢驗(yàn)的具體操作方法(其中186篇采用的是專家評定法);3篇文獻(xiàn)未明確說明內(nèi)容效度檢驗(yàn)的具體方法。從對內(nèi)容效度檢驗(yàn)的最終呈現(xiàn)方式看,152篇文獻(xiàn)(78.8%)明確描述了內(nèi)容效度檢驗(yàn)值,38篇文獻(xiàn)(19.6%)未明確描述內(nèi)容效度檢驗(yàn)值。綜上可見,大部分研究者僅對調(diào)查問卷的內(nèi)容效度進(jìn)行檢驗(yàn),且大多以專家評定法進(jìn)行驗(yàn)證。有研究[31]表明,在使用自制問卷時(shí)僅以專家評定法評估調(diào)查問卷的內(nèi)容效度無法保證調(diào)查問卷的質(zhì)量,更無法保障研究結(jié)果的準(zhǔn)確性。因此,將內(nèi)容效度作為調(diào)查問卷唯一的效度檢驗(yàn)指標(biāo)的科學(xué)性存疑,且存在將內(nèi)容效度檢驗(yàn)歸責(zé)于“專家”的嫌疑。
表3 不同效度類型的應(yīng)用情況(n=547)Table 3 Evaluation of different validity types
共246篇文獻(xiàn)對問卷的結(jié)構(gòu)效度進(jìn)行檢驗(yàn)。239篇文獻(xiàn)在進(jìn)行結(jié)構(gòu)效度檢驗(yàn)時(shí)寫明了具體方法,其中,67篇采用探索性因子分析法,84篇采用驗(yàn)證性因子分析法,且46篇文獻(xiàn)對探索性因子和驗(yàn)證性因子分析結(jié)果均有交代。同時(shí),15篇文獻(xiàn)僅說明使用結(jié)構(gòu)效度的具體方法,但未顯示具體結(jié)果。此外,7篇文獻(xiàn)僅說明使用結(jié)構(gòu)效度檢驗(yàn),但未明確表明檢驗(yàn)方法和具體結(jié)果。由此可見,部分研究者在進(jìn)行結(jié)構(gòu)效度檢驗(yàn)時(shí)對具體的檢驗(yàn)方法和檢驗(yàn)結(jié)果交代不明,這可能源于對結(jié)構(gòu)效度的應(yīng)用缺乏理解且對具體檢驗(yàn)方法不明。結(jié)構(gòu)效度一般用于分析定量數(shù)據(jù)的設(shè)計(jì)合理性,如果是非經(jīng)典問卷,研究者在進(jìn)行結(jié)構(gòu)效度檢驗(yàn)的同時(shí)還應(yīng)使用內(nèi)容效度進(jìn)行綜合分析,從而全面論證調(diào)查問卷的合理性,以保證調(diào)查結(jié)果的準(zhǔn)確性。就本文納入文獻(xiàn)中采用問卷調(diào)查法的效度檢驗(yàn)情況看,絕大多數(shù)研究者僅使用結(jié)構(gòu)效度對調(diào)查問卷進(jìn)行效度評估,反映出研究者對調(diào)查問卷結(jié)構(gòu)效度的認(rèn)識不充分。
使用效標(biāo)效度進(jìn)行檢驗(yàn)的文獻(xiàn)僅有3篇(0.5%),主要采用相關(guān)系數(shù)進(jìn)行驗(yàn)證,其中,2篇文獻(xiàn)明確說明效標(biāo)效度檢驗(yàn)的方法且有具體值,1篇未明確說明檢驗(yàn)方法和具體值。相對而言,對調(diào)查問卷進(jìn)行效度檢驗(yàn)時(shí)效標(biāo)效度的使用較少,可能源于找到一個(gè)適用的效標(biāo)通常比較困難,導(dǎo)致效標(biāo)效度的應(yīng)用受限[13]。
共5篇文獻(xiàn)(0.9%)在文中同時(shí)對結(jié)構(gòu)效度和效標(biāo)效度進(jìn)行檢驗(yàn),其中,4篇明確說明了效度檢驗(yàn)的方法和具體值,1篇未說明檢驗(yàn)方法和具體值。共100篇文獻(xiàn)(18.3%)同時(shí)對內(nèi)容效度和結(jié)構(gòu)效度進(jìn)行檢驗(yàn),其中:60篇文獻(xiàn)明確說明了內(nèi)容效度和結(jié)構(gòu)效度檢驗(yàn)的方法(57篇顯示了效度檢驗(yàn)的具體值,3篇僅說明方法未明確顯示具體值);40篇文獻(xiàn)未明確說明內(nèi)容效度和結(jié)構(gòu)效度檢驗(yàn)的具體方法,僅說明使用專家評定法得出該問卷的內(nèi)容效度和結(jié)構(gòu)效度良好。此現(xiàn)象反映出部分研究者在進(jìn)行效度檢驗(yàn)過程中的不規(guī)范與不科學(xué)。應(yīng)注意到,“科學(xué)”與“經(jīng)驗(yàn)”雖有聯(lián)系,但也存在差異。在問卷調(diào)查研究中,以專家評定法所得的內(nèi)容效度在一定程度上依據(jù)專家的經(jīng)驗(yàn),但專家經(jīng)驗(yàn)在未得到科學(xué)驗(yàn)證之前,只能作為參考,不能作為科學(xué)證據(jù),更不能以此評價(jià)調(diào)查問卷結(jié)構(gòu)效度的高低[28]。在通常情況下,檢驗(yàn)一份調(diào)查問卷的效度,對于非量表題宜檢驗(yàn)內(nèi)容效度,對于量表類應(yīng)根據(jù)實(shí)際情況檢驗(yàn)結(jié)構(gòu)效度或效標(biāo)效度[11]。
從效度報(bào)告的整體趨勢(圖3)看,自2014年開始效度報(bào)告的比例達(dá)到50%之后呈穩(wěn)步上升狀態(tài),在2018年達(dá)到頂峰,效度報(bào)告比例超70%,2019、2020年再次回到50%左右。這一現(xiàn)象說明,近年來對效度進(jìn)行報(bào)告的相關(guān)研究數(shù)量整體有所提升,但上升趨勢不穩(wěn)定。反之也可以看出,問卷調(diào)查法在體育研究領(lǐng)域中的使用仍存在較多效度報(bào)告缺失的問題。運(yùn)用問卷調(diào)查法之前對問卷進(jìn)行效度檢驗(yàn)和報(bào)告是必不可少的。就目前的效度報(bào)告情況看,問卷調(diào)查法使用的規(guī)范程度還有待提升。
圖3 2010—2020年效度報(bào)告的趨勢Figure 3 Trends of reliability reports from 2010 to 2020
為方便研究結(jié)果的橫向比較及優(yōu)質(zhì)問卷的推廣普及,在使用問卷時(shí)應(yīng)對問卷的效度參數(shù)值進(jìn)行準(zhǔn)確描述,讓讀者獲取更多與問卷有關(guān)的信息,即效度結(jié)果呈現(xiàn)應(yīng)具有完整性。從效度結(jié)果呈現(xiàn)的完整性(圖4)看,“有具體值描述”即對效度的具體參數(shù)進(jìn)行量化描述的研究所占比例整體呈上升趨勢,且2014年后上升顯著,但在2020年又呈現(xiàn)顯著下降的趨勢。進(jìn)行“主觀描述”即對問卷效度進(jìn)行“形容式”描述(如“效度較好”“效度較優(yōu)”“效度可接受”,但沒有具體參數(shù)的描述)的研究比例整體呈下降趨勢,下降的態(tài)勢較為平緩,在2019年所占比例達(dá)到最低(10.4%)?!盁o任何說明”(并未提及效度問題)的研究比例總體也呈下降趨勢,2020年與2010年相比,下降了13.9%。從目前情況看,體育科研工作者在問卷調(diào)查法效度描述規(guī)范化方面仍有很大的提升空間。
圖4 2010—2020年度效度評價(jià)結(jié)果的呈現(xiàn)趨勢Figure 4 Trends of validity assessment results from 2010 to 2020
效度的檢驗(yàn)方式有多種,不同檢驗(yàn)方式的適用場景和效果略有不同。對效度檢驗(yàn)方式的說明能給予讀者相關(guān)信息,對于解讀和重現(xiàn)研究結(jié)果有積極意義。從圖5可以看出,在對問卷進(jìn)行效度檢驗(yàn)的方法選擇上,使用結(jié)構(gòu)效度檢驗(yàn)的研究比例呈顯著上升趨勢,說明結(jié)構(gòu)效度在整個(gè)效度檢驗(yàn)方法中占據(jù)了十分重要的位置,尤其在對研制的新問卷進(jìn)行效度分析時(shí),更需要進(jìn)行結(jié)構(gòu)效度檢驗(yàn)[10,32]。從2010—2020年效度檢驗(yàn)類型應(yīng)用的變化趨勢看,隨著科學(xué)研究規(guī)范性的提高,結(jié)構(gòu)效度逐漸被廣大學(xué)者所接受和重視。從內(nèi)容效度的應(yīng)用情況看,2010—2020年應(yīng)用內(nèi)容效度的比例浮動(dòng)較小(處于10%~20%),這可能與使用的問卷類型和評價(jià)的目的不同有關(guān)。由于應(yīng)用效標(biāo)效度的研究較少,故未用趨勢圖的形式呈現(xiàn)。此外,對問卷效度類型未報(bào)告的文獻(xiàn)呈現(xiàn)顯著減少趨勢,值得注意的是,2010年有70%的文獻(xiàn)未對效度類型進(jìn)行明確說明,2018年僅39%的文獻(xiàn)未報(bào)告效度類型。總體來看,對于問卷效度檢驗(yàn)類型的選用呈現(xiàn)向好趨勢,但仍存在部分文獻(xiàn)的問卷效度檢驗(yàn)方法不規(guī)范的問題。
圖5 2010—2020年度效度類型報(bào)告的趨勢Figure 5 Trends of validity type reports from 2010 to 2020
在納入文獻(xiàn)中,大部分文獻(xiàn)未報(bào)告所使用問卷的效度,盡管有部分文獻(xiàn)對問卷進(jìn)行了效度檢驗(yàn),但其測評方法存在介紹不清楚或選用方法不合理的情況,這些都可能造成效度檢驗(yàn)的結(jié)果存疑,使文獻(xiàn)結(jié)果的科學(xué)性面臨挑戰(zhàn)。以下對體育科學(xué)研究中常見的問卷效度檢驗(yàn)方法進(jìn)行介紹,為體育科研工作者在使用問卷調(diào)查法進(jìn)行效度檢驗(yàn)時(shí)提供借鑒。
3.1.1 內(nèi)容效度
問卷的內(nèi)容效度是指一份問卷各題項(xiàng)所要測量的內(nèi)容是否反映研究者想測量的內(nèi)容,即調(diào)查對象對各題項(xiàng)的理解或回答與調(diào)查問卷設(shè)計(jì)者想要收集內(nèi)容的一致程度[33]。對于一份全新研制的調(diào)查問卷而言,如果包含非量表題,則無法使用統(tǒng)計(jì)方法進(jìn)行效度檢驗(yàn),在這種情況下應(yīng)對問卷的內(nèi)容效度進(jìn)行分析,以證明問卷設(shè)計(jì)的合理性[34]。調(diào)查問卷具有較高的內(nèi)容效度需具備2個(gè)條件[11]:一是調(diào)查問卷要有定義好的內(nèi)容范圍;二是測量題目的取樣需要有一定代表性。嚴(yán)格而言,對于全新研制的問卷都需進(jìn)行內(nèi)容效度的檢驗(yàn),因其可揭示題項(xiàng)與所規(guī)定內(nèi)容之間的符合程度,從而保障選題的合理性,避免其他無關(guān)變量對研究質(zhì)量的影響[31]。但應(yīng)避免僅使用內(nèi)容效度證明調(diào)查問卷的效度合格,這種做法無法很好地保障調(diào)查問卷的質(zhì)量[32]。
評價(jià)問卷內(nèi)容效度主要有以下2種方法:①專家評定。為了檢驗(yàn)初始問卷是否有內(nèi)容效度,最常見的方法是邀請相關(guān)領(lǐng)域的專家對問卷的各個(gè)題項(xiàng)與原定內(nèi)容的一致程度做出判斷,評價(jià)問卷的各個(gè)條目是否恰當(dāng)?shù)卮砹讼胍獪y量的內(nèi)容。為了提高專家評判的客觀性,應(yīng)盡可能對問卷的編制過程、設(shè)計(jì)的理論與實(shí)證依據(jù)進(jìn)行詳細(xì)說明,并編制專家調(diào)查表,便于專家進(jìn)行客觀評定。如果問卷的題目具有較好的代表性,則說明問卷具有較好的內(nèi)容效度[31]。一般最少需要3位專家評估,當(dāng)專家人數(shù)≤5時(shí),要求所有專家的效度評估意見均在“可接受”水平以上[條目水平的內(nèi)容效度指數(shù)(Item-level Content Validity Index,I-CVI)>1.00];當(dāng)專家人數(shù)≥6時(shí),可有1位或以上專家給出不同的效度評估意見(I-CVI>0.78)[33]。此外,須對問卷的編制過程和參考依據(jù)、參評專家的基本信息和評價(jià)過程進(jìn)行描述說明,并以數(shù)據(jù)報(bào)告專家的評價(jià)結(jié)果。②統(tǒng)計(jì)分析。主要以問卷單個(gè)條目和總和相關(guān)分析法進(jìn)行判定,即計(jì)算單個(gè)題項(xiàng)得分與題項(xiàng)總分的相關(guān)系數(shù),根據(jù)相關(guān)性是否顯著判斷是否有效。若問卷中有反向條目,應(yīng)將其進(jìn)行逆向處理后再計(jì)算總分[13]。
3.1.2 結(jié)構(gòu)效度
問卷的結(jié)構(gòu)效度也稱構(gòu)想效度,是指問卷在多大程度上正確驗(yàn)證編制問卷的理論構(gòu)想[35],其反映了效度概念最為本質(zhì)的要求[36]。對于調(diào)查問卷而言,結(jié)構(gòu)效度是其確定性、穩(wěn)定性和有效性的重要指標(biāo)[37]。在研制一套新問卷時(shí),通常根據(jù)所測量的內(nèi)容特性提出設(shè)想來編制問卷,然后檢驗(yàn)調(diào)查結(jié)果在多大程度上符合構(gòu)想的理論[38?39]。因此,對于全新研制的問卷均應(yīng)進(jìn)行結(jié)構(gòu)效度的檢驗(yàn)。與其他效度相比,結(jié)構(gòu)效度的概念和內(nèi)容都有一定的區(qū)別[40?41],其效度概念相對更加明晰,包含內(nèi)容也更寬泛,且在效度概念中占有較為重要的地位[42]。但結(jié)構(gòu)效度也存在一定的局限性,當(dāng)所獲結(jié)果不能驗(yàn)證原本的構(gòu)想時(shí),無法根據(jù)結(jié)果判定這是由問卷構(gòu)想問題還是內(nèi)容效度較低導(dǎo)致的[43]。因此,在研制問卷時(shí)應(yīng)將結(jié)構(gòu)效度和內(nèi)容效度結(jié)合使用。
調(diào)查問卷結(jié)構(gòu)效度的評價(jià)分為兩步:第一步提出結(jié)構(gòu)假設(shè);第二步對結(jié)構(gòu)假設(shè)進(jìn)行驗(yàn)證[44?45]。因子分析是評估調(diào)查問卷結(jié)構(gòu)效度的常用方法,意在了解調(diào)查問卷中同一條目下不同題項(xiàng)是否屬于同一公共因子[46?47]。在進(jìn)行驗(yàn)證性因子分析時(shí),可以采用基于共變異數(shù)的結(jié)構(gòu)方程模型(Covariance-Based Structural Equation Modeling,CB-SEM)和基于偏最小平方法的結(jié)構(gòu)方程模型(Partial Least Squares Structural Equation Modeling,PLS-SEM),這2類結(jié)構(gòu)方程模型在基本原理和適用條件等方面存在諸多差異,且各自都有一定的優(yōu)勢和劣勢[48]。目前,在對問卷的結(jié)構(gòu)效度進(jìn)行檢驗(yàn)時(shí)通常采用CB-SEM較多,本文主要介紹基于CBSEM的驗(yàn)證性因子分析法,關(guān)于PLS-SEM方法應(yīng)用的詳細(xì)介紹建議參考駱雷[48]的研究。
探索性因子分析通常用于未知影響因子和沒有理論支持情況下的試探性分析,其主要目的是找出影響觀測變量的因子個(gè)數(shù)[49]。在因子分析前,通過KMO與Bartlett's球形檢驗(yàn)判斷問卷是否能進(jìn)行因子分析。其標(biāo)準(zhǔn)是:KMO位于0~1,當(dāng)KMO小于0.5時(shí)不適合進(jìn)行因子分析,KMO大于0.6而小于0.7時(shí)勉強(qiáng)可以進(jìn)行因子分析,KMO大于0.7、0.8、0.9分別表示尚可、適合、極適合進(jìn)行因子分析[46,50]。提取公共因子一般遵守如下原則[50-51]:①結(jié)合碎石圖并提取特征值大于1的因子;②各個(gè)條目的因子載荷系數(shù)大于0.4;③公共因子的累積方差貢獻(xiàn)率為50%以上。
驗(yàn)證性因子分析是在已知因子和有預(yù)設(shè)理論支持的情況下,檢驗(yàn)調(diào)查數(shù)據(jù)是否按原先設(shè)想的結(jié)構(gòu)產(chǎn)生作用,其主要目的是考評預(yù)設(shè)的因子模型擬合實(shí)際調(diào)查數(shù)據(jù)的能力[52]。一般用于評價(jià)模型的指標(biāo)有3類[53]:第1類為簡約適配度指數(shù),如卡方自由度比(χ2/df)、PGFI、PNFI;第 2 類為增值適配度指數(shù),如 NFI、RFI、IFI、TLI、CFI等;第 3 類為絕對適配度指數(shù),如 GFI、AGFI、RMSEA等。通常采用驗(yàn)證性因子分析評價(jià)問卷的指標(biāo)及擬合標(biāo)準(zhǔn)[51?53]如下:①簡約適配度指數(shù)采用χ2/df,χ2/df為2~3時(shí)可以認(rèn)為模型擬合較好,樣本較大時(shí)χ2/df為5左右可以接受;②增值適配度指數(shù)采用比較適配指數(shù)(Comparative Fit Index,CFI)、增值適配指數(shù)(Incremental Fit Index,IFI)、非規(guī)準(zhǔn)適配指數(shù)(Tacker-Lewis Index,TLI),當(dāng)它們的值大于 0.90 時(shí)認(rèn)為模型具有較好的擬合度,若它們的值超過0.95則表明模型的擬合度較理想;③絕對適配度指數(shù)采用近似誤差均方根(Root Mean Square Error of Approximation,RMSEA),RMSEA≤0.05表明擬合較好,RMSEA≤0.08表明擬合合理。
11月22日下午,由《中國烹飪》雜志社、科隆展覽(北京)有限公司聯(lián)合主辦的“中國烹飪·食享會(huì):第十席:從原產(chǎn)地到餐桌”在北京世界食品博覽會(huì)上舉行,來自中國各地的餐飲品牌創(chuàng)始人、名廚、美食家、媒體人、原產(chǎn)地食材供應(yīng)商等百余人匯聚于此,專業(yè)餐飲人與原產(chǎn)地風(fēng)味面對面,分享、交流關(guān)于從原產(chǎn)地到餐桌的經(jīng)驗(yàn)和痛點(diǎn)。
在進(jìn)行問卷的標(biāo)準(zhǔn)化研究或制定新問卷時(shí),往往將2種因子分析法并用,即先做探索性因子分析再做驗(yàn)證性因子分析,這樣可以保證問卷的確定性、穩(wěn)定性和可靠性,提高問卷的結(jié)構(gòu)效度[31,54?55]。聚合效度和區(qū)分效度是結(jié)構(gòu)效度的又一證據(jù),聚合效度是指問卷中不同觀測變量是否真正反映了同一個(gè)潛在變量,通常采用計(jì)算平均變異系數(shù)提取量(Average Variance Extracted,AVE)與組合信度(Composite Reliability,CR)來判斷。AVE≥0.5,CR>0.7,說明問卷具有較好的聚合效度[56]。區(qū)分效度是指不同潛變量之間是否存在顯著性差異,通常以AVE進(jìn)行判斷,若每個(gè)潛變量AVE的平方根大于該潛變量與任意其他潛變量之間的相關(guān)系數(shù),則問卷區(qū)分效度較好[57]。
3.1.3 效標(biāo)效度
問卷的效標(biāo)效度也稱實(shí)證效度或效標(biāo)關(guān)聯(lián)效度,是指以一個(gè)公認(rèn)有效的效標(biāo)作為標(biāo)準(zhǔn),檢驗(yàn)新問卷與效標(biāo)測得結(jié)果的相關(guān)性,以判斷對特定情境中的個(gè)體行為進(jìn)行預(yù)測的準(zhǔn)確程度[11]。通常以調(diào)查問卷的分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)之間的相關(guān)系數(shù)來評估效標(biāo)效度,相關(guān)系數(shù)越大表示問卷的效標(biāo)效度越好。但在很多調(diào)查問卷的效度分析中很難選出一個(gè)合適的效標(biāo)以進(jìn)行比較,導(dǎo)致這種方法的適用性較差,且僅以效標(biāo)效度對全新的問卷進(jìn)行效度檢驗(yàn)不足以全面保障問卷質(zhì)量[58]。根據(jù)效標(biāo)獲取的時(shí)間可將效標(biāo)效度分為同時(shí)效度(concurrent validity)和預(yù)測效度(predictive validity)[11],前者反映調(diào)查問卷所獲結(jié)果與當(dāng)前效標(biāo)間的關(guān)系,后者反映調(diào)查問卷的結(jié)果與將來效標(biāo)間的關(guān)系[59]。衡量同時(shí)效度的方法是用新舊2份問卷測量同一批對象,將新舊2份問卷的結(jié)果進(jìn)行相關(guān)分析,獲得效度系數(shù),系數(shù)越高說明同時(shí)效度越好[11],一般在0.4~0.8表明問卷的同時(shí)效度較為理想[60]。衡量預(yù)測效度的常用方法是分析調(diào)查問卷的結(jié)果與同一對象未來發(fā)展?fàn)顩r之間的相關(guān)關(guān)系,相關(guān)系數(shù)越高表明預(yù)測效度越好[11]。效標(biāo)效度的分析可通過SPSS統(tǒng)計(jì)分析軟件實(shí)現(xiàn),具體操作方法如下:在SPSS統(tǒng)計(jì)分析軟件中的Analyze分析菜單下選擇Correlation并點(diǎn)擊Bivariate選項(xiàng),當(dāng)測量變量為連續(xù)變量時(shí)應(yīng)采用Pearson相關(guān)系數(shù),當(dāng)測量變量為分類變量時(shí)應(yīng)采用Kendall或Spearman等級相關(guān)系數(shù),相關(guān)系數(shù)>0.4表明問卷的效標(biāo)效度較為理想。目前,在對問卷進(jìn)行效標(biāo)效度檢驗(yàn)時(shí)僅考察同時(shí)效度,預(yù)測效度評價(jià)較復(fù)雜,所以很少被使用[61]。
調(diào)查結(jié)果顯示,部分研究者對于調(diào)查問卷效度的檢驗(yàn)方法認(rèn)識不夠充分,且在效度檢驗(yàn)流程的規(guī)范性上有所欠缺。因此,本文總結(jié)歸納了問卷效度檢驗(yàn)的一般流程(圖6),旨在為保證問卷調(diào)查法的科學(xué)化和規(guī)范化提供一定借鑒。
圖6 問卷調(diào)查法效度檢驗(yàn)流程Figure 6 Validity test flow chart of questionnaire survey method
在對效度進(jìn)行測評時(shí),首先判斷該問卷是否是已有問卷。如果是已有問卷,則查詢該問卷是否經(jīng)過效度檢驗(yàn),并確定原問卷在語言、測量以及功能上是否與本研究相同或類似,效度檢驗(yàn)方法是否正確,效度檢驗(yàn)結(jié)果是否明確報(bào)告,效度評估標(biāo)準(zhǔn)是否符合要求。如果該問卷符合以上所有條件,則可被引用并說明具體的效度情況。如果該問卷不符合以上條件或是新研制問卷,則應(yīng)進(jìn)行規(guī)范的效度檢驗(yàn)。①確定測驗(yàn)內(nèi)容。明確需要進(jìn)行效度檢驗(yàn)的內(nèi)容,并非所有內(nèi)容都需要進(jìn)行效度檢驗(yàn)。②選擇效度指標(biāo)。應(yīng)根據(jù)需要測驗(yàn)的內(nèi)容、問卷的種類和問卷的整體性設(shè)計(jì)選擇效度指標(biāo)。一般而言,新研制的問卷根據(jù)實(shí)際情況需要同時(shí)考慮內(nèi)容效度、結(jié)構(gòu)效度和效標(biāo)效度。③確定效度檢驗(yàn)方法。不同效度類型應(yīng)用的檢驗(yàn)方法不同。④計(jì)算效度結(jié)果。根據(jù)應(yīng)用的效度類型計(jì)算效度結(jié)果。⑤評價(jià)效度結(jié)果是否符合標(biāo)準(zhǔn)。根據(jù)所應(yīng)用效度類型的評價(jià)標(biāo)準(zhǔn)對所得效度結(jié)果進(jìn)行分析,以此判斷該問卷的效度,如果所得結(jié)果符合效度評價(jià)標(biāo)準(zhǔn)則表明該問卷效度合格,反之則應(yīng)修改問卷再次進(jìn)行規(guī)范的效度檢驗(yàn)直至符合評價(jià)標(biāo)準(zhǔn)。
3.2.1 引用成熟問卷的效度檢驗(yàn)描述示例
本文采用的量表是陳善平等[62]基于MPAM-R所編制的簡化版量表—“鍛煉動(dòng)機(jī)簡化量表”,其中包括健康、外貌、樂趣、能力與社交5個(gè)子維度,每個(gè)維度3個(gè)項(xiàng)目共15個(gè)項(xiàng)目。評分標(biāo)準(zhǔn)以Likert 5點(diǎn)計(jì)分,1為“非常不強(qiáng)烈”,5為“非常強(qiáng)烈”,得分越高表示動(dòng)機(jī)水平越高。問卷的結(jié)構(gòu)效度各項(xiàng)擬合指標(biāo)為CFI=0.963,NFI=0.960,NNFI=0.955,EIFI=0.963,RMSEA=0.080 1,SRMR=0.068 5,根據(jù)吳明隆[46]的評價(jià)標(biāo)準(zhǔn),該問卷的結(jié)構(gòu)效度較好。
3.2.2 全新研制的問卷效度檢驗(yàn)描述示例
(1)內(nèi)容效度。本文以文獻(xiàn)資料調(diào)研為基礎(chǔ),根據(jù)研究目的和內(nèi)容,查找與兒童青少年身體活動(dòng)相關(guān)的文獻(xiàn),結(jié)合已有理論,進(jìn)行初始問卷的編制。請6位相關(guān)領(lǐng)域的專家參與問卷內(nèi)容效度的評價(jià)(專家信息見表4),對問卷的每一條目與相應(yīng)內(nèi)容維度的關(guān)聯(lián)性(或代表性)做出選擇。可選項(xiàng)為4等級評分:1代表“不相關(guān)”,2代表“弱相關(guān)”,3代表“較強(qiáng)相關(guān)”,4代表“非常相關(guān)”。根據(jù)專家B和專家C的意見,將條目4“放學(xué)后參與身體活動(dòng)時(shí)間”改為“學(xué)校課堂之外參與身體活動(dòng)時(shí)間”。 I-CVI、PC(隨機(jī)一致性概率)及K*(計(jì)算調(diào)整后的Kappa值)見表5。該問卷的I-CVI均大于 0.78[33],K*大于 0.74[63],評價(jià)為優(yōu)秀,S-CVI(量表水平的內(nèi)容效度指數(shù))為 0.98(>0.9)[64],均符合要求,說明該問卷的內(nèi)容效度較好。
表4 專家信息Table 4 Information of experts
表5 內(nèi)容效度分析Table 5 Content validity analysis
(2)結(jié)構(gòu)效度。運(yùn)用因子分析檢驗(yàn)問卷的結(jié)構(gòu)效度。利用SPSS 24.0進(jìn)行因子分析,結(jié)果發(fā)現(xiàn)KMO為 0.806,并通過 Bartlett's球形檢驗(yàn)(P<0.001),依據(jù)Kaiser等[50]的評價(jià)標(biāo)準(zhǔn),適宜進(jìn)行因子分析。采用主成分分析法,根據(jù)碎石圖陡階檢驗(yàn)并提取特征值大于1的因子、累積解釋方差百分比至少50%、因子載荷系數(shù)大于0.4等指標(biāo)對初始問卷的題項(xiàng)進(jìn)行刪減。利用探索性因子分析將題項(xiàng)刪除后,借助統(tǒng)計(jì)軟件包AMOS 24.0對剩余題項(xiàng)進(jìn)行驗(yàn)證性因子分析,結(jié)果顯示,χ2/df=2.375,RMSEA=0.063,CFI、TLI、IFI均大于0.9,根據(jù)吳明隆[46]的評價(jià)標(biāo)準(zhǔn),該問卷的結(jié)構(gòu)效度較好。為更好地分析各題項(xiàng)的鑒別度,進(jìn)行了區(qū)分效度和聚合效度分析,結(jié)果顯示,各變量AVE值的平方根均大于該變量與任意其他潛變量之間的相關(guān)系數(shù),說明本問卷具有較好的區(qū)分效度[57],同一潛在變量的觀測變量的AVE≥0.5、CR>0.7,說明本問卷具有較好的聚合效度[56]。
(3)效標(biāo)效度。將加速度計(jì)作為效標(biāo)檢驗(yàn)“學(xué)生校外身體活動(dòng)問卷”的效標(biāo)效度,利用加速度計(jì)測得學(xué)生校外平均每天的身體活動(dòng)水平,將問卷的整體得分與加速度計(jì)計(jì)數(shù)值進(jìn)行相關(guān)分析,相關(guān)系數(shù)為0.51,根據(jù)Streiner等[60]的評價(jià)標(biāo)準(zhǔn),該問卷的效標(biāo)效度較好。
研究方法在體育科學(xué)研究中居于關(guān)鍵地位,研究方法的科學(xué)化和規(guī)范化與科學(xué)研究的質(zhì)量息息相關(guān),在一定程度上體現(xiàn)學(xué)科的發(fā)展水平[19],因此,規(guī)范研究方法的使用至關(guān)重要。目前,在體育學(xué)研究領(lǐng)域,問卷調(diào)查法的效度檢驗(yàn)仍存在較多問題,這可能是對效度種類認(rèn)識不充分、對檢驗(yàn)方法不了解造成的??蒲泄ぷ髡邞?yīng)加強(qiáng)對調(diào)查問卷效度檢驗(yàn)的了解與學(xué)習(xí),明確效度檢驗(yàn)方法,規(guī)范效度檢驗(yàn)流程,助力提升我國體育學(xué)研究的科學(xué)化、國際化水平。
作者貢獻(xiàn)聲明:
柯友枝:搜集統(tǒng)計(jì)數(shù)據(jù),設(shè)計(jì)論文框架,撰寫、修改論文;
孫建剛:搜集統(tǒng)計(jì)數(shù)據(jù),修改論文;
李 博:核實(shí)內(nèi)容,修改論文;
劉 陽:提出論文主題,調(diào)整論文框架,指導(dǎo)修改論文。
上海體育學(xué)院學(xué)報(bào)2023年2期