護(hù)理研究中如何檢驗(yàn)測(cè)量工具的信度

2015-03-18 11:21:45劉可張美芬張利峰卜秀青

護(hù)士進(jìn)修雜志 2015年13期

關(guān)鍵詞：信度一致性變異

劉可張美芬張利峰卜秀青

(中山大學(xué)護(hù)理學(xué)院，廣東廣州 510089)

·教與學(xué)·

護(hù)理研究中如何檢驗(yàn)測(cè)量工具的信度

劉可張美芬張利峰卜秀青

(中山大學(xué)護(hù)理學(xué)院，廣東廣州 510089)

本文作者從測(cè)量的基本理論出發(fā)，探討了護(hù)理研究中通過穩(wěn)定性、等同性和內(nèi)部一致性來進(jìn)行測(cè)量工具的信度的檢驗(yàn)方法；同時(shí)介紹了信度的評(píng)價(jià)方法；以及如何應(yīng)用及提高測(cè)量工具信度的方法。通過對(duì)測(cè)量工具信度的深入理解來提高護(hù)理研究中測(cè)量的質(zhì)量。

護(hù)理研究；測(cè)量工具；信度

Nursing research； Measuing tool; Reliability

在護(hù)理研究的過程中，對(duì)研究變量進(jìn)行測(cè)量是非常關(guān)鍵和重要的一個(gè)步驟。而測(cè)量工具的質(zhì)量好壞直接影響測(cè)量結(jié)果的準(zhǔn)確性以及研究結(jié)論的科學(xué)性和推廣性。一個(gè)信度良好的測(cè)量工具是得到可信的測(cè)量結(jié)果的必要條件。筆者從測(cè)量的基本理論出發(fā)，介紹了測(cè)量工具的信度檢驗(yàn)以及如何提高測(cè)量工具的信度。

1 測(cè)量的基本理論

1.1 經(jīng)典測(cè)量理論在傳統(tǒng)的測(cè)量理論中，測(cè)量所得到的觀察值(observed score) =真實(shí)值(true score) + 測(cè)量誤差(error variance)，測(cè)量誤差包括隨機(jī)誤差(chance /random error)和系統(tǒng)誤差(systematic error)。隨機(jī)誤差難以控制，如受試者的狀態(tài)、測(cè)量的環(huán)境、工具的使用及操作過程等，系統(tǒng)誤差是由于受試者的特性對(duì)測(cè)量結(jié)果所造成的偏倚，如社會(huì)期望性、回應(yīng)偏倚、教育程度等。由于誤差的存在，真實(shí)值不可能直接獲得，必須通過測(cè)量觀察值來估計(jì)。觀察值是通過測(cè)量工具得到的某個(gè)特定時(shí)間特定環(huán)境下某個(gè)受試者的變量特性的反映。因此每次測(cè)量得到的觀察值都不同，要想最接近真實(shí)值，可以通過無數(shù)次測(cè)量值取得平均數(shù)。

在經(jīng)典理論中，信度就是真實(shí)值變異與觀察值變異的比值，信度的估計(jì)方法就是考慮了環(huán)境因素等所導(dǎo)致的隨機(jī)誤差，以及由此帶來的誤差變異對(duì)變量真實(shí)值的變異的貢獻(xiàn)程度。在經(jīng)典理論指導(dǎo)下的信度估計(jì)，通常是采用相關(guān)分析的方法[1]。

1.2 概化理論概化理論是對(duì)經(jīng)典理論的擴(kuò)展，它認(rèn)為測(cè)量是否準(zhǔn)確取決于在不同的測(cè)量條件和測(cè)量目的的情況下，測(cè)量值是否能準(zhǔn)確反映真實(shí)值。測(cè)量的不同條件(facet)可以影響測(cè)量的結(jié)果，測(cè)量者希望在這些不同的特定條件下得到的測(cè)量值都能夠接近真實(shí)值。概化理論中，全域分?jǐn)?shù)(universe score)即真實(shí)值，概化系數(shù)(generalizability coefficient) 類似于傳統(tǒng)的信度系數(shù)，是全域內(nèi)預(yù)期的分?jǐn)?shù)變異和樣本分?jǐn)?shù)變異的比率。概化理論強(qiáng)調(diào)測(cè)試的條件和測(cè)試的目的，不僅關(guān)注測(cè)試工具本身好壞，還強(qiáng)調(diào)工具用在什么目的或什么條件下的好或壞？例如，在需要不同的評(píng)定者的情況下，選擇多少個(gè)評(píng)定者或哪些評(píng)定者時(shí)概化系數(shù)最大(即測(cè)量信度最高)？概化理論通過方差分析的方法，檢測(cè)不同特定條件對(duì)測(cè)量過程的影響，即測(cè)量情境對(duì)誤差的影響，從而估計(jì)誤差的來源，保證測(cè)量的等同性[1]。

目前，護(hù)理領(lǐng)域常用的信度計(jì)算方法主要是基于經(jīng)典理論和概化理論，IRT理論以及認(rèn)知判斷理論還未涉及。

2 信度的計(jì)算

信度(reliability)，是指用某種測(cè)量手段所得資料的精確程度。不同的計(jì)算方法可以導(dǎo)致不同的對(duì)信度的概念化和操作性定義。我們可以從以下三個(gè)方面來檢驗(yàn)測(cè)量工具的信度。

2.1 穩(wěn)定性(stability) 是指重復(fù)測(cè)量所得結(jié)果的一致程度，反映了同一樣本，同一工具，在測(cè)量環(huán)境一致的情況下，測(cè)量工具對(duì)外界因素的敏感程度。

基于經(jīng)典測(cè)量理論，如果我們希望得到一個(gè)可信的測(cè)量結(jié)果，那么這個(gè)結(jié)果首先應(yīng)該是穩(wěn)定的，也就是說，在不同的測(cè)量情境下，測(cè)量值應(yīng)該是相似的。但是，得到一個(gè)穩(wěn)定的測(cè)量值受很多因素的影響。例如，概念本身的真實(shí)變化、現(xiàn)象的系統(tǒng)性的波動(dòng)、測(cè)量方法或受試者的變化(如疲勞)、以及工具的穩(wěn)定性都可以影響重測(cè)的值，這些也都反映了真實(shí)值的變化和測(cè)量的誤差所導(dǎo)致的測(cè)量值的不穩(wěn)定。因此，通過重復(fù)測(cè)量，可以反映測(cè)量工具的穩(wěn)定性。重測(cè)信度(test-retest reliability)反映的就是不同情境下測(cè)量工具的穩(wěn)定性，可以通過兩次測(cè)量的相關(guān)性來計(jì)算。

2.2 等同性 (equivalence) 是指不同觀察者，或者兩個(gè)相似的工具同時(shí)應(yīng)用時(shí)測(cè)量的一致性。

在不同的測(cè)量條件下，我們需要考慮測(cè)量的等同性，也就是概化理論所提出的測(cè)量的概化性。重測(cè)信度是在不同時(shí)間使用同一工具測(cè)量，如果我們把不同版本的工具在同一時(shí)間測(cè)量，就可以用復(fù)本系數(shù) (alternate forms reliability)來反映測(cè)量的等同性。如果研究需要在測(cè)量中使用復(fù)本，就需要評(píng)價(jià)復(fù)本信度,即評(píng)價(jià)是否不同版本的工具測(cè)量的是同一概念。如果要同時(shí)考慮穩(wěn)定性與等同性，我們可以在不同時(shí)間交換測(cè)量不同版本。有時(shí)，測(cè)量過程中為了避免受試者的應(yīng)試技巧“test-wiseness”，而使用平行條目或平行工具(parallel or alternate form)。平行條目必須是基于相同概念或亞概念的相同類型的條目，但用詞不同。但通常情況下，編制真正平行的兩個(gè)版本是非常困難的。

如果是通過直接觀察行為來測(cè)量，那就需要計(jì)算不同觀察者評(píng)分之間的等同性，即評(píng)定者間信度?？捎?jì)算兩個(gè)人對(duì)一組受試者分別計(jì)分，或多個(gè)人同時(shí)對(duì)多個(gè)受試者評(píng)分，即組內(nèi)系數(shù)(intraclass coefficient)，或和諧系數(shù)(coefficient of concordance)。如果評(píng)分的等級(jí)多，可以用相關(guān)系數(shù)來計(jì)算評(píng)定者間信度；如果評(píng)定者多于2人，但評(píng)分等級(jí)少(定性資料)時(shí)可以用一致性百分比(agreement)或者Kappa系數(shù)來計(jì)算；組內(nèi)相關(guān)系數(shù)ICC(intraclass correlation coefficient)適用于定量資料的一致性評(píng)價(jià)。有時(shí)，等同性的測(cè)量可反映什么人來使用某種工具更適合。如壓瘡危險(xiǎn)因素評(píng)估，通過檢測(cè)不同觀察者之間的等同性，可以發(fā)現(xiàn)該工具由注冊(cè)護(hù)士使用比助理護(hù)士使用更適合。

2.3 內(nèi)部一致性 (internal consistency) 指測(cè)量工具各條目的同質(zhì)性或內(nèi)在相關(guān)性。即是否所有的部分都是測(cè)同一變量，反映了量表形成階段選擇條目時(shí)的誤差。

基于經(jīng)典理論基礎(chǔ)上設(shè)計(jì)的量表通常用不同的條目來測(cè)量某個(gè)現(xiàn)象(變量)。由于不能直接觀察條目與變量的關(guān)系，但可以通過條目之間的關(guān)系來反映。如果條目與變量相關(guān)，那么條目之間必定也是高度相關(guān)的。因?yàn)闂l目之間密切相關(guān)，意味著它們有一個(gè)共同的原因，即這些條目都測(cè)量的是同一變量。如果條目之間是密切相關(guān)的，那么這個(gè)量表的內(nèi)部就是一致的。因此，單維度的量表或多維度量表的各個(gè)維度的所有條目之間都應(yīng)該是高度相關(guān)的。內(nèi)部一致性反映了條目的同質(zhì)性,但不能反映不同的施測(cè)條件和施測(cè)時(shí)間的影響。內(nèi)部一致性可以通過折半系數(shù) Spearman-Brown prophecy formula、Cronbach’s alpha、Kuder-Richardson formula 20、21 ( KR 20、KR-21)來計(jì)算。

如果我們把同一測(cè)量工具拆分成兩個(gè)部分，把這兩個(gè)部分看成是“復(fù)本”，就可以得到折半信度(split-half reliability)。可以將量表的條目進(jìn)行前后拆分，但這樣可能量表前、中、后的條目的不同可能會(huì)造成選擇性偏倚；或者將奇數(shù)部分的條目和偶數(shù)部分的條目拆分成兩個(gè)部分；還可以根據(jù)某一種特征或某幾種特征來平衡：如使用第一人稱語句的條目、長(zhǎng)短句平衡等進(jìn)行平衡拆分；也可以將所有條目進(jìn)行隨機(jī)拆分，但如果量表的條目數(shù)少，或條目來源于幾個(gè)不同的維度時(shí)，隨機(jī)得到的兩個(gè)部分并不一定具有可比性。在這種情況下要保證拆分的兩個(gè)部分中的條目來源于所有的維度。因此，拆分的方法取決于當(dāng)時(shí)的實(shí)際情況，關(guān)鍵在于拆分出基本相等的兩個(gè)部分來進(jìn)行比較?？墒褂肧pearman-Brown 公式進(jìn)行計(jì)算。

Cronbach’s alpha是目前最普遍、最常用的方法，是把所有分半方法得到的信度系數(shù)的平均值，來作為整個(gè)工具的信度。KR-20 、KR-21是 alpha 的特殊類型，適用于兩分類的資料。KR-21假設(shè)所有條目的難度相等，估計(jì)的信度更加保守，更容易計(jì)算。

由于內(nèi)部一致性要求工具內(nèi)部條目反映的是同一概念，反映的是工具的獨(dú)一性一維性，條目之間必須相關(guān)或相互補(bǔ)充。因此，如果測(cè)量的概念包括了亞概念，就必須報(bào)告各維度的信度值。這也是在某些情況下，維度信度值高于總量表信度值的原因。

以上介紹了不同的信度特征及計(jì)算方法，在實(shí)際的運(yùn)用過程中，每開展一個(gè)新的研究，我們都需要對(duì)測(cè)量工具的信度進(jìn)行檢測(cè)，無論是已廣泛使用過的舊工具還是修訂過的舊工具，或者是根據(jù)新的研究設(shè)計(jì)的新工具。因?yàn)椋碌难芯酷槍?duì)的是，不同的研究環(huán)境下新的研究總體，也就是說，測(cè)量工具的信度不是針對(duì)工具本身，而是針對(duì)特定環(huán)境下特定樣本的研究工具。根據(jù)研究的實(shí)際情況，我們可以選擇不同的方法來檢測(cè)測(cè)量工具的信度。如果測(cè)量的變量本身具備穩(wěn)定的特性，我們可以選擇穩(wěn)定性來反映工具的信度，例如身高、個(gè)性、能力等概念的測(cè)量。而生理狀態(tài)、情緒等本身容易發(fā)生改變的概念就不適合運(yùn)用重測(cè)信度的方法。而且，重測(cè)信度需要進(jìn)行兩次測(cè)量，操作起來不太方便。因此，可以選擇內(nèi)部一致性的檢測(cè)。用內(nèi)部一致性檢測(cè)只需要進(jìn)行一次測(cè)量，比較經(jīng)濟(jì)、容易操作，也更適用于心理社會(huì)學(xué)概念的測(cè)量。如果研究中涉及不同版本工具的使用或者不同的測(cè)量者來進(jìn)行測(cè)量，那就需要進(jìn)行等同性的檢測(cè)?？傊鶕?jù)研究的實(shí)際情況來選擇適合的方法。如果是新設(shè)計(jì)的工具，還要考慮運(yùn)用各種適合的方法從不同角度來檢測(cè)工具的信度特征。單條目量表只能用重測(cè)的方法檢驗(yàn)，所以盡量不要單獨(dú)使用單條目的測(cè)量工具，除非是配合其他工具同時(shí)使用。

3 如何評(píng)價(jià)測(cè)量工具的信度？

在相同的樣本量下，信度高的工具可以增加統(tǒng)計(jì)效能(statistical power)，也就是說，可以更好地區(qū)分兩組測(cè)量對(duì)象的不同。信度高的測(cè)量，就如同大的樣本量，可以減少統(tǒng)計(jì)分析的誤差。因此，我們?cè)谘芯康脑O(shè)計(jì)階段就要知道如何評(píng)價(jià)和選擇信度高的測(cè)量工具。

目前，信度相關(guān)系數(shù) (reliability efficient coefficient alpha) 廣泛使用。通常，Alpha在0～1之間，如果出現(xiàn)負(fù)值，表明有錯(cuò)，可以檢查是否有反向計(jì)分的條目或刪除某些與其他條目或維度呈負(fù)相關(guān)的條目。太低的信度說明條目之間的一致性或者測(cè)量的穩(wěn)定性、等同性不高。一般情況下，信度Alpha要高于0.7。DeVellis(2003)認(rèn)為，信度<0.6,為不可接受，信度0.6～0.65為不理想，信度0.65～0.7為基本可以接受，信度0.7～0.8為較理想，信度0.8 ～0.9則很好[1]。也有學(xué)者指出，已使用過的工具要求信度達(dá)到0.8，新工具0.7或0.6即可。也可以考慮測(cè)量的目的，是進(jìn)行兩組的比較，還是嚴(yán)格的選拔，從而設(shè)定不同的標(biāo)準(zhǔn)[2]。Kappa系數(shù)及ICC值可參閱統(tǒng)計(jì)文獻(xiàn)[3]。

但是，信度值也不是越高越好。過高的信度值表示測(cè)量的一致性或者重復(fù)性非常高，也就是說，測(cè)量的區(qū)分程度不高，不能區(qū)分不同的對(duì)象或者不同時(shí)間下的測(cè)量變異。因此，信度高于0.9，可以考慮通過刪減條目來縮短量表[1]。

4 如何增加測(cè)量工具的信度？

從經(jīng)典的測(cè)量理論我們知道，信度alpha代表著真實(shí)值變異與觀察值變異的比值，而每個(gè)條目的變異值由變量的某一部分的真實(shí)值和誤差值構(gòu)成。因此，信度決定于量表各個(gè)條目的變異度，量表的信度受條目的變異程度以及條目的數(shù)目的影響。那么，所有和單一條目有關(guān)的問題：例如偏中心的均值、低的變異、條目間的負(fù)相關(guān)、條目之間或者條目與總分的相關(guān)性低，都會(huì)降低信度，同時(shí)條目數(shù)也會(huì)影響信度[1]。當(dāng)測(cè)量的得分，條目的得分，評(píng)分的等級(jí)，被評(píng)估的變量的變異較大時(shí)，測(cè)量的變異就大，信度也較高。還可以通過以下方法來提高工具的信度。

4.1 增加條目增加條目是常用的提高信度的方法。增加測(cè)量長(zhǎng)度，以增加測(cè)量得分的變異，可以提高信度。但所增加的條目必須與原來?xiàng)l目一致，測(cè)量的是同樣的內(nèi)容。但如果原本信度已經(jīng)較高，通過增加條目而增加信度的程度就較小。

4.2 刪減條目可以考慮去除對(duì)內(nèi)部一致性貢獻(xiàn)小的條目?？梢酝ㄟ^統(tǒng)計(jì)軟件查看去除某個(gè)條目后對(duì)信度的影響。如果對(duì)信度僅有最小的負(fù)性影響或最強(qiáng)的正性影響，該條目是最先要去掉的。還可以看條目與總分的相關(guān)性，相關(guān)性最低的條目也可以去除?？梢匀サ舻陀谄骄鶙l目間相關(guān)性的條目而保留與平均條目間相關(guān)性相等、高于或僅僅是稍低的條目，這些方法都有助于增加信度。

通常，較短的量表減少了對(duì)測(cè)試者的負(fù)擔(dān)，但長(zhǎng)的量表信度值較高，因此要權(quán)衡二者，不能為了簡(jiǎn)潔而犧牲信度，必須通過測(cè)量得到足夠的有信息的值。

4.3 增加測(cè)試樣本的異質(zhì)性樣本的異質(zhì)性越大，個(gè)體差異的范圍越大，得分的變異也越大，信度就越高。因此，在進(jìn)行信度檢測(cè)時(shí)，要盡量選擇具有不同特征的樣本，例如具有不同的人口學(xué)特征或者有可能在測(cè)量變量上有不同的樣本。

以上介紹了關(guān)于測(cè)量工具信度的基本檢驗(yàn)方法以及如何評(píng)價(jià)并提高工具的信度，一些具體的計(jì)算公式或方法請(qǐng)參閱相關(guān)統(tǒng)計(jì)文獻(xiàn)。

[1] DeVellis RF. Scale development: Theory and applications[M].2nded.London:SAGE publications,2003：8-20.

[2] Polit DF & Hungler BP. Nursing Research: Principles and methods(6th edition) [M]. Philadelphia: Lippoincott,2004,407-436.

[3] 方積乾. 生物醫(yī)學(xué)研究的統(tǒng)計(jì)方法[M].北京:高等教育出版社,2007：238-255.

劉可(1972-)，女，遼寧，博士，副教授，教研室主任，研究方向：護(hù)理教育，兒科護(hù)理，社區(qū)護(hù)理

R471

1002-6975(2015)13-1201-03

2015-01-30)

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

護(hù)理研究中如何檢驗(yàn)測(cè)量工具的信度

1 測(cè)量的基本理論

2 信度的計(jì)算

3 如何評(píng)價(jià)測(cè)量工具的信度？

4 如何增加測(cè)量工具的信度？

3 如何評(píng)價(jià)測(cè)量工具的信度？

4 如何增加測(cè)量工具的信度？