劉可 張美芬 張利峰 卜秀青
(中山大學(xué)護(hù)理學(xué)院,廣東 廣州 510089)
?
·教 與 學(xué)·
護(hù)理研究中如何檢驗(yàn)測(cè)量工具的信度
劉可 張美芬 張利峰 卜秀青
(中山大學(xué)護(hù)理學(xué)院,廣東 廣州 510089)
本文作者從測(cè)量的基本理論出發(fā),探討了護(hù)理研究中通過穩(wěn)定性、等同性和內(nèi)部一致性來進(jìn)行測(cè)量工具的信度的檢驗(yàn)方法;同時(shí)介紹了信度的評(píng)價(jià)方法;以及如何應(yīng)用及提高測(cè)量工具信度的方法。通過對(duì)測(cè)量工具信度的深入理解來提高護(hù)理研究中測(cè)量的質(zhì)量。
護(hù)理研究; 測(cè)量工具; 信度
Nursing research; Measuing tool; Reliability
在護(hù)理研究的過程中,對(duì)研究變量進(jìn)行測(cè)量是非常關(guān)鍵和重要的一個(gè)步驟。而測(cè)量工具的質(zhì)量好壞直接影響測(cè)量結(jié)果的準(zhǔn)確性以及研究結(jié)論的科學(xué)性和推廣性。一個(gè)信度良好的測(cè)量工具是得到可信的測(cè)量結(jié)果的必要條件。筆者從測(cè)量的基本理論出發(fā),介紹了測(cè)量工具的信度檢驗(yàn)以及如何提高測(cè)量工具的信度。
1.1 經(jīng)典測(cè)量理論 在傳統(tǒng)的測(cè)量理論中,測(cè)量所得到的觀察值(observed score) =真實(shí)值(true score) + 測(cè)量誤差(error variance),測(cè)量誤差包括隨機(jī)誤差(chance /random error)和系統(tǒng)誤差(systematic error)。隨機(jī)誤差難以控制,如受試者的狀態(tài)、測(cè)量的環(huán)境、工具的使用及操作過程等,系統(tǒng)誤差是由于受試者的特性對(duì)測(cè)量結(jié)果所造成的偏倚,如社會(huì)期望性、回應(yīng)偏倚、教育程度等。由于誤差的存在,真實(shí)值不可能直接獲得,必須通過測(cè)量觀察值來估計(jì)。觀察值是通過測(cè)量工具得到的某個(gè)特定時(shí)間特定環(huán)境下某個(gè)受試者的變量特性的反映。因此每次測(cè)量得到的觀察值都不同,要想最接近真實(shí)值,可以通過無數(shù)次測(cè)量值取得平均數(shù)。
在經(jīng)典理論中,信度就是真實(shí)值變異與觀察值變異的比值,信度的估計(jì)方法就是考慮了環(huán)境因素等所導(dǎo)致的隨機(jī)誤差,以及由此帶來的誤差變異對(duì)變量真實(shí)值的變異的貢獻(xiàn)程度。在經(jīng)典理論指導(dǎo)下的信度估計(jì),通常是采用相關(guān)分析的方法[1]。
1.2 概化理論 概化理論是對(duì)經(jīng)典理論的擴(kuò)展,它認(rèn)為測(cè)量是否準(zhǔn)確取決于在不同的測(cè)量條件和測(cè)量目的的情況下,測(cè)量值是否能準(zhǔn)確反映真實(shí)值。測(cè)量的不同條件(facet)可以影響測(cè)量的結(jié)果,測(cè)量者希望在這些不同的特定條件下得到的測(cè)量值都能夠接近真實(shí)值。概化理論中,全域分?jǐn)?shù)(universe score)即真實(shí)值,概化系數(shù)(generalizability coefficient) 類似于傳統(tǒng)的信度系數(shù),是全域內(nèi)預(yù)期的分?jǐn)?shù)變異和樣本分?jǐn)?shù)變異的比率。概化理論強(qiáng)調(diào)測(cè)試的條件和測(cè)試的目的,不僅關(guān)注測(cè)試工具本身好壞,還強(qiáng)調(diào)工具用在什么目的或什么條件下的好或壞?例如,在需要不同的評(píng)定者的情況下,選擇多少個(gè)評(píng)定者或哪些評(píng)定者時(shí)概化系數(shù)最大(即測(cè)量信度最高)?概化理論通過方差分析的方法,檢測(cè)不同特定條件對(duì)測(cè)量過程的影響,即測(cè)量情境對(duì)誤差的影響,從而估計(jì)誤差的來源,保證測(cè)量的等同性[1]。
目前,護(hù)理領(lǐng)域常用的信度計(jì)算方法主要是基于經(jīng)典理論和概化理論,IRT理論以及認(rèn)知判斷理論還未涉及。
信度(reliability),是指用某種測(cè)量手段所得資料的精確程度。不同的計(jì)算方法可以導(dǎo)致不同的對(duì)信度的概念化和操作性定義。我們可以從以下三個(gè)方面來檢驗(yàn)測(cè)量工具的信度。
2.1 穩(wěn)定性(stability) 是指重復(fù)測(cè)量所得結(jié)果的一致程度,反映了同一樣本,同一工具,在測(cè)量環(huán)境一致的情況下,測(cè)量工具對(duì)外界因素的敏感程度。
基于經(jīng)典測(cè)量理論,如果我們希望得到一個(gè)可信的測(cè)量結(jié)果,那么這個(gè)結(jié)果首先應(yīng)該是穩(wěn)定的,也就是說,在不同的測(cè)量情境下,測(cè)量值應(yīng)該是相似的。 但是,得到一個(gè)穩(wěn)定的測(cè)量值受很多因素的影響。例如,概念本身的真實(shí)變化、現(xiàn)象的系統(tǒng)性的波動(dòng)、測(cè)量方法或受試者的變化(如疲勞)、以及工具的穩(wěn)定性都可以影響重測(cè)的值,這些也都反映了真實(shí)值的變化和測(cè)量的誤差所導(dǎo)致的測(cè)量值的不穩(wěn)定。因此,通過重復(fù)測(cè)量,可以反映測(cè)量工具的穩(wěn)定性。重測(cè)信度(test-retest reliability)反映的就是不同情境下測(cè)量工具的穩(wěn)定性,可以通過兩次測(cè)量的相關(guān)性來計(jì)算。
2.2 等同性 (equivalence) 是指不同觀察者,或者兩個(gè)相似的工具同時(shí)應(yīng)用時(shí)測(cè)量的一致性。
在不同的測(cè)量條件下,我們需要考慮測(cè)量的等同性,也就是概化理論所提出的測(cè)量的概化性。重測(cè)信度是在不同時(shí)間使用同一工具測(cè)量,如果我們把不同版本的工具在同一時(shí)間測(cè)量,就可以用復(fù)本系數(shù) (alternate forms reliability)來反映測(cè)量的等同性。如果研究需要在測(cè)量中使用復(fù)本,就需要評(píng)價(jià)復(fù)本信度,即評(píng)價(jià)是否不同版本的工具測(cè)量的是同一概念。如果要同時(shí)考慮穩(wěn)定性與等同性,我們可以在不同時(shí)間交換測(cè)量不同版本。有時(shí),測(cè)量過程中為了避免受試者的應(yīng)試技巧“test-wiseness”,而使用平行條目或平行工具(parallel or alternate form)。 平行條目必須是基于相同概念或亞概念的相同類型的條目,但用詞不同。但通常情況下,編制真正平行的兩個(gè)版本是非常困難的。
如果是通過直接觀察行為來測(cè)量,那就需要計(jì)算不同觀察者評(píng)分之間的等同性,即評(píng)定者間信度??捎?jì)算兩個(gè)人對(duì)一組受試者分別計(jì)分,或多個(gè)人同時(shí)對(duì)多個(gè)受試者評(píng)分,即組內(nèi)系數(shù)(intraclass coefficient),或和諧系數(shù)(coefficient of concordance)。如果評(píng)分的等級(jí)多,可以用相關(guān)系數(shù)來計(jì)算評(píng)定者間信度;如果評(píng)定者多于2人,但評(píng)分等級(jí)少(定性資料)時(shí)可以用一致性百分比(agreement)或者Kappa系數(shù)來計(jì)算;組內(nèi)相關(guān)系數(shù)ICC(intraclass correlation coefficient)適用于定量資料的一致性評(píng)價(jià)。有時(shí),等同性的測(cè)量可反映什么人來使用某種工具更適合。如壓瘡危險(xiǎn)因素評(píng)估,通過檢測(cè)不同觀察者之間的等同性,可以發(fā)現(xiàn)該工具由注冊(cè)護(hù)士使用比助理護(hù)士使用更適合。
2.3 內(nèi)部一致性 (internal consistency) 指測(cè)量工具各條目的同質(zhì)性或內(nèi)在相關(guān)性。即是否所有的部分都是測(cè)同一變量,反映了量表形成階段選擇條目時(shí)的誤差。
基于經(jīng)典理論基礎(chǔ)上設(shè)計(jì)的量表通常用不同的條目來測(cè)量某個(gè)現(xiàn)象(變量)。由于不能直接觀察條目與變量的關(guān)系,但可以通過條目之間的關(guān)系來反映。如果條目與變量相關(guān),那么條目之間必定也是高度相關(guān)的。因?yàn)闂l目之間密切相關(guān),意味著它們有一個(gè)共同的原因,即這些條目都測(cè)量的是同一變量。如果條目之間是密切相關(guān)的,那么這個(gè)量表的內(nèi)部就是一致的。因此,單維度的量表或多維度量表的各個(gè)維度的所有條目之間都應(yīng)該是高度相關(guān)的。內(nèi)部一致性反映了條目的同質(zhì)性,但不能反映不同的施測(cè)條件和施測(cè)時(shí)間的影響。內(nèi)部一致性可以通過折半系數(shù) Spearman-Brown prophecy formula、Cronbach’s alpha、Kuder-Richardson formula 20、21 ( KR 20、KR-21)來計(jì)算。
如果我們把同一測(cè)量工具拆分成兩個(gè)部分,把這兩個(gè)部分看成是“復(fù)本”,就可以得到折半信度(split-half reliability)。可以將量表的條目進(jìn)行前后拆分,但這樣可能量表前、中、后的條目的不同可能會(huì)造成選擇性偏倚;或者將奇數(shù)部分的條目和偶數(shù)部分的條目拆分成兩個(gè)部分;還可以根據(jù)某一種特征或某幾種特征來平衡:如使用第一人稱語句的條目、長(zhǎng)短句平衡等進(jìn)行平衡拆分;也可以將所有條目進(jìn)行隨機(jī)拆分,但如果量表的條目數(shù)少,或條目來源于幾個(gè)不同的維度時(shí),隨機(jī)得到的兩個(gè)部分并不一定具有可比性。在這種情況下要保證拆分的兩個(gè)部分中的條目來源于所有的維度。因此,拆分的方法取決于當(dāng)時(shí)的實(shí)際情況,關(guān)鍵在于拆分出基本相等的兩個(gè)部分來進(jìn)行比較??墒褂肧pearman-Brown 公式進(jìn)行計(jì)算。
Cronbach’s alpha是目前最普遍、最常用的方法,是把所有分半方法得到的信度系數(shù)的平均值,來作為整個(gè)工具的信度。KR-20 、KR-21是 alpha 的特殊類型,適用于兩分類的資料。KR-21假設(shè)所有條目的難度相等,估計(jì)的信度更加保守,更容易計(jì)算。
由于內(nèi)部一致性要求工具內(nèi)部條目反映的是同一概念,反映的是工具的獨(dú)一性一維性,條目之間必須相關(guān)或相互補(bǔ)充。因此,如果測(cè)量的概念包括了亞概念,就必須報(bào)告各維度的信度值。這也是在某些情況下,維度信度值高于總量表信度值的原因。
以上介紹了不同的信度特征及計(jì)算方法,在實(shí)際的運(yùn)用過程中,每開展一個(gè)新的研究,我們都需要對(duì)測(cè)量工具的信度進(jìn)行檢測(cè),無論是已廣泛使用過的舊工具還是修訂過的舊工具,或者是根據(jù)新的研究設(shè)計(jì)的新工具。因?yàn)椋碌难芯酷槍?duì)的是,不同的研究環(huán)境下新的研究總體,也就是說,測(cè)量工具的信度不是針對(duì)工具本身,而是針對(duì)特定環(huán)境下特定樣本的研究工具。根據(jù)研究的實(shí)際情況,我們可以選擇不同的方法來檢測(cè)測(cè)量工具的信度。如果測(cè)量的變量本身具備穩(wěn)定的特性,我們可以選擇穩(wěn)定性來反映工具的信度,例如身高、個(gè)性、能力等概念的測(cè)量。而生理狀態(tài)、情緒等本身容易發(fā)生改變的概念就不適合運(yùn)用重測(cè)信度的方法。而且,重測(cè)信度需要進(jìn)行兩次測(cè)量,操作起來不太方便。因此,可以選擇內(nèi)部一致性的檢測(cè)。用內(nèi)部一致性檢測(cè)只需要進(jìn)行一次測(cè)量,比較經(jīng)濟(jì)、容易操作,也更適用于心理社會(huì)學(xué)概念的測(cè)量。如果研究中涉及不同版本工具的使用或者不同的測(cè)量者來進(jìn)行測(cè)量,那就需要進(jìn)行等同性的檢測(cè)??傊鶕?jù)研究的實(shí)際情況來選擇適合的方法。如果是新設(shè)計(jì)的工具,還要考慮運(yùn)用各種適合的方法從不同角度來檢測(cè)工具的信度特征。單條目量表只能用重測(cè)的方法檢驗(yàn),所以盡量不要單獨(dú)使用單條目的測(cè)量工具,除非是配合其他工具同時(shí)使用。
在相同的樣本量下,信度高的工具可以增加統(tǒng)計(jì)效能(statistical power),也就是說,可以更好地區(qū)分兩組測(cè)量對(duì)象的不同。信度高的測(cè)量,就如同大的樣本量,可以減少統(tǒng)計(jì)分析的誤差。因此,我們?cè)谘芯康脑O(shè)計(jì)階段就要知道如何評(píng)價(jià)和選擇信度高的測(cè)量工具。
目前,信度相關(guān)系數(shù) (reliability efficient coefficient alpha) 廣泛使用。通常,Alpha在0~1之間,如果出現(xiàn)負(fù)值,表明有錯(cuò),可以檢查是否有反向計(jì)分的條目或刪除某些與其他條目或維度呈負(fù)相關(guān)的條目。太低的信度說明條目之間的一致性或者測(cè)量的穩(wěn)定性、等同性不高。一般情況下,信度Alpha要高于0.7。DeVellis(2003)認(rèn)為,信度<0.6,為不可接受,信度0.6~0.65為不理想,信度0.65~0.7為基本可以接受,信度0.7~0.8為較理想,信度0.8 ~0.9則很好[1]。也有學(xué)者指出,已使用過的工具要求信度達(dá)到0.8,新工具0.7或0.6即可。也可以考慮測(cè)量的目的,是進(jìn)行兩組的比較,還是嚴(yán)格的選拔,從而設(shè)定不同的標(biāo)準(zhǔn)[2]。Kappa系數(shù)及ICC值可參閱統(tǒng)計(jì)文獻(xiàn)[3]。
但是,信度值也不是越高越好。過高的信度值表示測(cè)量的一致性或者重復(fù)性非常高,也就是說,測(cè)量的區(qū)分程度不高,不能區(qū)分不同的對(duì)象或者不同時(shí)間下的測(cè)量變異。因此,信度高于0.9,可以考慮通過刪減條目來縮短量表[1]。
從經(jīng)典的測(cè)量理論我們知道,信度alpha代表著真實(shí)值變異與觀察值變異的比值,而每個(gè)條目的變異值由變量的某一部分的真實(shí)值和誤差值構(gòu)成。因此,信度決定于量表各個(gè)條目的變異度,量表的信度受條目的變異程度以及條目的數(shù)目的影響。那么,所有和單一條目有關(guān)的問題:例如偏中心的均值、低的變異、條目間的負(fù)相關(guān)、條目之間或者條目與總分的相關(guān)性低,都會(huì)降低信度,同時(shí)條目數(shù)也會(huì)影響信度[1]。當(dāng)測(cè)量的得分,條目的得分,評(píng)分的等級(jí),被評(píng)估的變量的變異較大時(shí),測(cè)量的變異就大,信度也較高。還可以通過以下方法來提高工具的信度。
4.1 增加條目 增加條目是常用的提高信度的方法。增加測(cè)量長(zhǎng)度,以增加測(cè)量得分的變異,可以提高信度。但所增加的條目必須與原來?xiàng)l目一致,測(cè)量的是同樣的內(nèi)容。但如果原本信度已經(jīng)較高 ,通過增加條目而增加信度的程度就較小。
4.2 刪減條目 可以考慮去除對(duì)內(nèi)部一致性貢獻(xiàn)小的條目??梢酝ㄟ^統(tǒng)計(jì)軟件查看去除某個(gè)條目后對(duì)信度的影響。如果對(duì)信度僅有最小的負(fù)性影響或最強(qiáng)的正性影響,該條目是最先要去掉的。還可以看條目與總分的相關(guān)性,相關(guān)性最低的條目也可以去除??梢匀サ舻陀谄骄鶙l目間相關(guān)性的條目而保留與平均條目間相關(guān)性相等、高于或僅僅是稍低的條目,這些方法都有助于增加信度。
通常,較短的量表減少了對(duì)測(cè)試者的負(fù)擔(dān),但長(zhǎng)的量表信度值較高,因此要權(quán)衡二者,不能為了簡(jiǎn)潔而犧牲信度,必須通過測(cè)量得到足夠的有信息的值。
4.3 增加測(cè)試樣本的異質(zhì)性 樣本的異質(zhì)性越大,個(gè)體差異的范圍越大,得分的變異也越大,信度就越高。因此,在進(jìn)行信度檢測(cè)時(shí),要盡量選擇具有不同特征的樣本,例如具有不同的人口學(xué)特征或者有可能在測(cè)量變量上有不同的樣本。
以上介紹了關(guān)于測(cè)量工具信度的基本檢驗(yàn)方法以及如何評(píng)價(jià)并提高工具的信度,一些具體的計(jì)算公式或方法請(qǐng)參閱相關(guān)統(tǒng)計(jì)文獻(xiàn)。
[1] DeVellis RF. Scale development: Theory and applications[M].2nded.London:SAGE publications,2003:8-20.
[2] Polit DF & Hungler BP. Nursing Research: Principles and methods(6th edition) [M]. Philadelphia: Lippoincott,2004,407-436.
[3] 方積乾. 生物醫(yī)學(xué)研究的統(tǒng)計(jì)方法[M].北京:高等教育出版社,2007:238-255.
劉可(1972-),女,遼寧,博士,副教授,教研室主任,研究方向:護(hù)理教育,兒科護(hù)理,社區(qū)護(hù)理
R471
A
1002-6975(2015)13-1201-03
2015-01-30)