周晨,萬崇華,張晴晴,黃新萍,吳鈞俊,孫小媛
1廣東醫(yī)科大學(xué)生命質(zhì)量與應(yīng)用心理研究中心,廣東 東莞 523808;2山東省立醫(yī)院統(tǒng)計與病案管理科;3東莞市第八人民醫(yī)院內(nèi)分泌科;4廣東省東莞市大朗醫(yī)院內(nèi)分泌科
經(jīng)典測量理論(CTT)與項目反應(yīng)理論(IRT)是目前常用的兩種量表條目分析評價理論。CTT側(cè)重于宏觀層面的分析,以假設(shè)所有被測試的測量指標(biāo)誤差大小相等為前提,將總體與各部分條目的屬性進(jìn)行結(jié)合比較。其具有操作原理簡單、對樣本量要求不高等優(yōu)點(diǎn)[1-2],包括變異度法、相關(guān)系數(shù)法、因子分析法、克朗巴赫α系數(shù)法,但由于其主要注重量表信度效度的檢驗,對單個條目的信息分析不夠。在抽樣變動的情況下,CTT的誤差會產(chǎn)生不確定性,平行測量的假設(shè)也難以實(shí)現(xiàn)[3]。IRT可以彌補(bǔ)CTT不足,其具有條目的獨(dú)立性,每個條目可以通過各自的反應(yīng)函數(shù)和曲線來觀察,相較于CTT誤差較小,可反映條目潛在的內(nèi)在特性,是一種微觀的分析理論[4-5]。IRT的優(yōu)點(diǎn)還包括項目參數(shù)與能力參數(shù)的定義在同一個量表上,可以精確估計測量誤差[6]。本研究使用CTT與IRT兩種理論方法對本團(tuán)隊開發(fā)的慢性病患者生命質(zhì)量測定量表體系QLICD中第2版糖尿病患者生命質(zhì)量量表QLICD-DM(V2.0)[7-8]的各條目進(jìn)行深入分析,對量表加以修正,以便為糖尿病患者生命質(zhì)量評估、診療計劃制訂提供更加有效、準(zhǔn)確的參考。
1.1 臨床資料選擇2012年10月—2014年9月于廣東醫(yī)科大學(xué)附屬醫(yī)院、東莞市石龍博愛醫(yī)院、東莞市大朗醫(yī)院就診的242例糖尿病患者進(jìn)行自評式量表調(diào)查。納入標(biāo)準(zhǔn):①確診為糖尿病的患者;②具備閱讀、書寫和表達(dá)能力;③無其他嚴(yán)重精神疾病及精神障礙。共納入2型糖尿病患者242例,其中廣東醫(yī)科大學(xué)附屬醫(yī)院51例、東莞市石龍博愛醫(yī)院118例、東莞市大朗醫(yī)院73例。242例患者中,男130例(53.7%)、女112例(46.3%);年齡23~85歲;民族為漢族236例(97.5%)、其他6例(2.5%);婚姻狀況為未婚3例(1.3%)、已婚195例(80.6%)、離婚7例(2.9%)、喪偶23例(9.5%)、缺失14例(5.8%);文化程 度 小 學(xué) 及 以 下103例(42.5%)、初 中81例(33.5%)、高中或中專35例(14.5%)、大專14例(5.8%)、本科及以上9例(3.7%);職業(yè)為工人63例(26.0%)、農(nóng)民66例(27.3%)、教師3例(1.2%)、干部15例(6.2%)、個體27例(11.2%)、其他51例(21.1%);家庭經(jīng)濟(jì)情況差89例(36.8%)、中135例(55.8%)、好18例(7.4%)。所有患者對本研究知情同意并自愿參加研究。
1.2 QLICD-DM(V2.0)量表調(diào)查調(diào)查者向符合納入標(biāo)準(zhǔn)的患者說明調(diào)查目的,征得患者同意后發(fā)放QLICD-DM(V2.0)量表,讓患者根據(jù)自身主觀感受填寫,填寫完畢后由調(diào)查者檢查是否有漏項,如有漏項需補(bǔ)齊,檢查完成后收回。QLICD-DM(V2.0)量表由共性模塊QLICD-GM及特異模塊構(gòu)成。QLICD-GM模塊包括生理功能(9個條目)、心理功能(11個條目)、社會功能(8個條目)3個領(lǐng)域,9個側(cè)面,28個條目;糖尿病特異性模塊包含4個側(cè)面、14個條目。整個量表共4個領(lǐng)域、13個側(cè)面、42個條目,每個條目均為五級等級式條目。
1.3 基于CTT的條目分析①變異度法:分析條目的敏感性,計算每個條目的標(biāo)準(zhǔn)差,選擇標(biāo)準(zhǔn)差>0.9的條目;②相關(guān)系數(shù)法:分析條目的代表性與獨(dú)立性,計算每個條目與所在領(lǐng)域得分的相關(guān)系數(shù),選擇相關(guān)系數(shù)>0.50的條目;③因子分析法:分析條目的代表性,對條目進(jìn)行主成分分析后做最大方差旋轉(zhuǎn),選擇因子載荷>0.50的條目;④克朗巴赫α系數(shù)法:分析條目的內(nèi)部一致性,計算每個領(lǐng)域的克朗巴赫α系數(shù),刪除其中某一條目后計算該領(lǐng)域的α1系數(shù),選擇α≥α1的條目。四種方法中三種及以上方法數(shù)據(jù)達(dá)標(biāo),則該條目質(zhì)量好;兩種方法數(shù)據(jù)達(dá)標(biāo),則條目質(zhì)量有待改進(jìn);低于兩種方法數(shù)據(jù)達(dá)標(biāo),條目質(zhì)量為差[9]。
1.4 基于IRT的條目分析應(yīng)用IRT中等級多分類資料的Samejima模型[10]對量表各領(lǐng)域的條目進(jìn)行分析評價。經(jīng)過檢驗,QLICD-DM(V2.0)量表中的生理功能領(lǐng)域、心理功能領(lǐng)域、社會功能領(lǐng)域、特異模塊領(lǐng)域都符合單維性假設(shè)。因此,分別對各領(lǐng)域進(jìn)行分析。①條目信息量:反映各條目在估計被調(diào)查者能力所能提供信息量的多少,選取數(shù)值為-2、-1、0、1、2的5個點(diǎn),計算這5個點(diǎn)的信息函數(shù)θ參數(shù)及其平均值;條目平均信息量≥0.119(5/42)時條目評價為好,<0.119時條目評價為差[11]。②難度系數(shù):量表采用五點(diǎn)等距評分法,每個條目有4個難度系數(shù),分別是B1、B2、B3、B4,隨難度等級增加,各條目對應(yīng)的難度系數(shù)應(yīng)呈現(xiàn)單調(diào)遞增趨勢,范圍在[-4,4]的條目評價為好[12]。③區(qū)分度:區(qū)分度越大,提示條目的信息量越大,區(qū)分度>0.5的條目評價為好[13]。
1.5 統(tǒng)計學(xué)方法采用SPSS19.0軟件對錄入數(shù)據(jù)進(jìn)行分析。IRT分析采用Multilog7.03軟件。
2.1 基于CTT的條目分析結(jié)果基于變異度法、相關(guān)系數(shù)法、因子分析法、克朗巴赫α系數(shù)法對獲得的條目數(shù)據(jù)進(jìn)行分析,排除超過兩種方法評價不合格的條目,結(jié)果詳見表1。QLICD-DM(V2.0)量表的42個條目中,37個條目達(dá)到統(tǒng)計學(xué)測量標(biāo)準(zhǔn),5個條目有超過兩項統(tǒng)計學(xué)指標(biāo)不合格。在共性模塊中,除生理領(lǐng)域條目GPH3(影響性功能)、GPH4(大便正常)及心理領(lǐng)域條目GPS3(生活有樂趣)、GPS10(樂觀看待疾?。┬韪倪M(jìn)之外,其他24個條目均有較好的特性;特異模塊中,除DM10(眼瞼或雙下肢水腫)條目之外,其余的13個條目均有良好的特性。
表1 QLICD-DM(V2.0)量表基于CTT的條目分析結(jié)果
2.2 基于IRT的條目分析結(jié)果條目信息量評價中,各條目的平均信息量分布在0.161~0.576;共性模塊生理領(lǐng)域的9個條目及社會領(lǐng)域的GS04條目平均信息量低于0.381(16/42)、其余條目在0.381(16/42)~0.595(25/42),特異模塊的6個條目(DM5、DM7、DM8、DM10、DM11、DM12)平均信息量<0.381、其余條目在0.381~0.595;整個量表所有42個條目的平均信息量均>0.119(5/42),條目評價好。難度系數(shù)評價中,36個條目的難度系數(shù)分布在[-4,4],隨難度等級增加而呈現(xiàn)出單調(diào)遞增趨勢,未出現(xiàn)逆反閾值情況,但6個條目(GPH1、GPH6、GPH8、GS02、GS03、GS04)還需進(jìn)一步完善。區(qū)分度評價中,QLICD-DM(V2.0)量表42個條目的區(qū)分度分布在0.99~1.45,均大于0.5。見OSID碼圖1。
由于糖尿病的病程周期長、并發(fā)癥多且難以治愈,對于糖尿病患者的生命質(zhì)量評估也是綜合、全面的過程[14-15],需要包括社會功能、心理、生理等多維度、合理有效的工具,因此需要在使用生命質(zhì)量量表進(jìn)行評估的同時,不斷優(yōu)化條目的特性。本研究選擇的糖尿病患者來自廣東醫(yī)科大學(xué)附屬醫(yī)院、東莞市第八人民醫(yī)院、東莞市大朗醫(yī)院,三家醫(yī)院皆為廣東醫(yī)科大學(xué)在湛江及東莞地區(qū)的附屬醫(yī)院及教學(xué)點(diǎn)醫(yī)院,且湛江和東莞地區(qū)均為糖尿病患病率較高的地區(qū)。本課題組相關(guān)人員均接受相應(yīng)培訓(xùn),能夠確保生命質(zhì)量數(shù)據(jù)的順利收集。通過使用CTT與IRT兩種方法對QLICD-DM(V2.0)量表進(jìn)行各條目的特性分析,在統(tǒng)計學(xué)評價基礎(chǔ)上,綜合考慮臨床工作中該條目的問題對評估患者生命質(zhì)量有無影響。在CTT結(jié)果中,GPH3(影響性功能)條目與領(lǐng)域的相關(guān)系數(shù)偏小,可能是因為性功能對糖尿病患者的生命質(zhì)量影響較?。?6-17],而且被調(diào)查者對于此類問題多傾向于回避,所以此條目的效能需要進(jìn)一步探索。GPS10(樂觀看待疾?。PS3(生活有樂趣)條目刪除后α系數(shù)變高,可能是由于這兩個條目有相互重疊的含義或與心理領(lǐng)域的其他條目有內(nèi)容相似的情況。DM10(眼瞼或雙下肢水腫)條目顯示相關(guān)系數(shù)偏小,但不能完全說明該條目的表現(xiàn)與糖尿病患者生命質(zhì)量不相關(guān)。其特殊性在于,眼瞼和雙下肢水腫是糖尿病腎病的一種常見表現(xiàn)[18],該條目得分可以區(qū)分反映糖尿病患者病情嚴(yán)重程度。我們在調(diào)查中發(fā)現(xiàn),共性模塊中生理領(lǐng)域的克朗巴赫α系數(shù)普遍較小,提示內(nèi)部一致性可能較低,這可能是糖尿病并發(fā)癥復(fù)雜且臨床表現(xiàn)多樣導(dǎo)致的。
IRT分析中,QLICD-DM(V2.0)量表大部分條目難度系數(shù)分布在[-4,4],且是由B1→B4單調(diào)遞增的,沒有出現(xiàn)逆反閾值現(xiàn)象,說明條目的難度分布合理。但GPH6(料理日常生活)、GPH8(獨(dú)立行走)、GS04(家庭的關(guān)心或支持)三個條目的B1難度系數(shù)分別為-4.42、-4.05、-4.62;分別有181例(74.8%)、188例(77.7%)、153例(63.2%)選擇了5分,說明此三個條目的難度簡單,出現(xiàn)了“天花板效應(yīng)”,同時反映出大部分糖尿病患者的自理能力良好且能夠從家人朋友處獲得積極的支持,因而更容易選擇“非常好”和“比較好”的選項,忽略了“一般”的選項。在平均信息量方面,通常認(rèn)為,當(dāng)條目測驗的平均信息量總和達(dá)到25時表明測驗質(zhì)量良好,16~25時提示測驗有待改進(jìn),低于16時代表測驗較差[19]。但我們認(rèn)為,此標(biāo)準(zhǔn)過于嚴(yán)格,按照0.8的信度作為標(biāo)準(zhǔn)進(jìn)行推測,可知量表信息量達(dá)到5即可,因此將5定為信息量評價標(biāo)準(zhǔn)[20]。QLICD-DM(V2.0)量表具有42個條目,據(jù)此,當(dāng)條目平均信息量≥0.119(5/42)時條目評價為好,本量表所有條目平均信息量均高于0.119,質(zhì)量較好。
綜上所述,經(jīng)過CTT與IRT兩種理論分析,QLICD-DM(V2.0)量表大部分條目具有較好的特性,可作為評估糖尿病患者各個領(lǐng)域生命質(zhì)量的有效工具,為制訂診療計劃提供個性化幫助。不足之處在于,由于共性模塊是在開發(fā)慢性病生命質(zhì)量量表時針對各種慢性病研制的一個共性、廣泛的模塊,在與糖尿病特異模塊結(jié)合后,有內(nèi)容相似的情況,導(dǎo)致一些條目數(shù)值顯示獨(dú)立性與代表性相對較差;同時,在調(diào)查中,由于條目數(shù)量多,患者填寫時間較長,降低了調(diào)查的效率。對于上述問題,我們后續(xù)將對量表進(jìn)行簡化,將相似的內(nèi)容及統(tǒng)計學(xué)指標(biāo)差的條目斟酌刪減,研制出簡化版的量表,提高調(diào)查效率。另外,在運(yùn)用IRT理論對量表進(jìn)行條目分析時,通常要求樣本量達(dá)到250例,本研究共納入242例患者,基本符合要求,今后還需要擴(kuò)大樣本量進(jìn)一步分析。