PHQ-9在綜合醫(yī)院住院患者中信效度研究

2017-05-10 09:30:44余建英

四川精神衛(wèi)生 2017年2期

關鍵詞：重測劃界效度

陳然，王瑜，余建英，張嵐

(四川大學華西醫(yī)院心理衛(wèi)生中心，四川成都 610041*通信作者：張嵐，E-mail：zhangzilan102@126.com)

論著·預防

PHQ-9在綜合醫(yī)院住院患者中信效度研究

陳然，王瑜，余建英，張嵐*

(四川大學華西醫(yī)院心理衛(wèi)生中心，四川成都 610041*通信作者：張嵐，E-mail：zhangzilan102@126.com)

目的檢驗病人健康問卷抑郁量表(PHQ-9)在綜合醫(yī)院住院患者中應用的信度和效度，探索PHQ-9在綜合醫(yī)院住院患者中快速篩查抑郁的可行性。方法方便抽取四川大學華西醫(yī)院569名住院患者，在規(guī)定指導語下完成PHQ-9評定，采用隨機數(shù)字表法隨機抽取38名患者在完成初次評定2周后進行PHQ-9重測；以簡明國際神經精神訪談(MINI)作為“金標準”，評估中文版PHQ-9的效標效度，共139名患者接受MINI中文版訪談。結果 PHQ-9在本研究中的Cronbach' s α系數(shù)為0.839，各條目與總評分的相關系數(shù)r=0.484～0.724(P<0.01)，各條目間相關系數(shù)r=0.229～0.520(P<0.01)；兩周后重測系數(shù)r=0.846(P<0.01)；因子分析獲得3個公因子，分別為自我評價因子、情感因子和軀體化因子；最佳診斷劃界分為8分，敏感度為92.6%，特異度為60.6%；PHQ-9的ROC曲線下面積為0.841(95%CI：0.777～0.905)。結論 PHQ-9應用于綜合醫(yī)院住院患者抑郁評估中具有良好的信效度，8分為該量表的最佳劃界分。

PHQ-9；信度；效度；綜合醫(yī)院；住院患者

研究表明，中國普通人群的重性抑郁障礙發(fā)病率約為2.07%～6.87%[1-3]。然而在綜合醫(yī)院，由于缺乏對患者精神問題的關注，綜合醫(yī)院對普通住院患者抑郁發(fā)作識別率僅為13.0%～31.8%[4-5]，加之國內綜合醫(yī)院非精神科專業(yè)醫(yī)師對精神類疾病識別率低[6-7]，且目前國內尚未廣泛普及應用于普通住院患者快速篩查抑郁的工具，非精神科患者的抑郁問題往往被忽視。使得患者反復就醫(yī)、延誤治療、浪費醫(yī)療資源[8]，甚至患者在住院期間發(fā)生自傷、自殺等嚴重后果[9]。因此，在該人群中驗證一項便捷、可信度高的抑郁自評問卷意義重大。

病人健康問卷抑郁量表(Patients’ Health Questionnaire Depression Scale-9 item, PHQ-9)是以《精神障礙診斷與統(tǒng)計手冊(第4版)》(Diagnostic and Statistical Manual of Mental Disorders, fourth edition，DSM-IV)的重性抑郁障礙(Major depressive disorder，MDD)為標準編制而成的9個條目自評工具，臨床使用方便[10]。該量表已被翻譯為多種語言版本，在不同人群中應用顯示其具有良好的信效度[11-15]，在國外已成為基層醫(yī)療中篩查抑郁癥的首選工具之一。但目前還缺乏對該量表在綜合醫(yī)院普通住院患者中的信效度研究，在一定程度上限制了該量表的使用。本研究旨在檢驗PHQ-9在綜合醫(yī)院住院患者中的信效度，以便更好地服務于臨床。

1 對象與方法

1.1 對象

采用方便取樣，于2015年4月對四川大學華西醫(yī)院的心臟內科、腫瘤科、風濕免疫科、疼痛科、甲乳外科5個科室共582例住院患者進行問卷調查。其中腫瘤科238人，風濕免疫科134人，心臟內科96人，疼痛科64人，甲乳外科50人。入組標準：①年齡≥16歲；②受教育程度在初中及以上；③身體狀況能滿足獨立完成問卷評定；④患者自愿參加本研究并簽署知情同意書。排除標準：①調查當日安排出院的患者；②有明顯認知功能障礙或嚴重軀體疾病而無法完成調查者。

1.2 研究工具

采用自編一般資料調查表收集患者年齡、性別、民族、職業(yè)、婚姻情況、受教育程度、醫(yī)療保險、家庭年收入情況、目前疾病診斷、患病時間、健康狀況、生活質量、心理健康狀況自我評價。采用PHQ-9評估過去兩周患者抑郁癥狀的發(fā)生頻率，PHQ-9由9個四分類條目組成，0分為完全沒有，1分為有幾天， 2分為有一半以上的日子，3分為幾乎每天都有。以中文版簡明國際神經精神訪談(Mini International Neuropsychiatric Interview，MINI)評定結果作為“金標準”來評估PHQ-9的效標效度。

1.3 評定方法

預調查階段，在四川大學華西醫(yī)院住院患者中隨機選取9例進行預調查，重點考察對9例患者進行MINI評定的調查員的一致性，調查員均為經過統(tǒng)一MINI評定培訓的精神科醫(yī)生。

正式調查階段，由經過統(tǒng)一培訓的3名四川大學臨床心理學研究生進行自編一般資料調查表及PHQ-9的發(fā)放和收集，若患者因年齡、受教育程度、軀體疾病等而無法自行作答者，由調查員采取個別訪談的方式完成評定。問卷回收后當日交于質量控制員并編號。為了更有效地評價PHQ-9的校標效度，由質量控制員采用盲法分配方式將不同分數(shù)段的150名患者分配給調查員，由調查員在初次評定的當日或第二日對其進行面對面的MINI診斷訪談。

重測階段，在正式調查完成2周后，由控制員采用隨機數(shù)字表法抽取38名患者進行電話訪談以獲取其一般資料及PHQ-9信息。

1.4 質量控制

當調查員之間MINI評估結果出現(xiàn)分歧，則由高年資心理學專家協(xié)助討論，盡量提高研究者內部一致性。PHQ-9及MINI訪談問卷均在患者床旁、在研究者的指令下完成，調查時研究者與患者一一對應，避免患者相互討論，問卷完成時間少于3 min則視為無效問卷。

1.5 統(tǒng)計方法

采用SPSS 18.0進行統(tǒng)計分析。采用Cronbach' s α系數(shù)評估量表內部一致性；采用Spearman相關系數(shù)法評估條目間及條目與總評分的相關性；探索性因素分析(exploratory factor analysis，EFA)用于評估結構效度；采用受試者工作特征曲線(Receiver Operating Characteristic Curve，ROC)檢驗PHQ-9診斷效能，以最大Youden指數(shù)確定最佳劃界分。另外，根據(jù)數(shù)據(jù)分布特點，采用的統(tǒng)計方法包括描述性統(tǒng)計、方差分析、Bartlett球形檢驗、Mann-WitneyU檢驗等。檢驗水準α=0.05。

2 結果

2.1 一般資料

本研究共納入582例患者，其中13例未完成評定，最終回收有效問卷569份，有效問卷回收率為97.8%。其中男性264例(46.4%)，女性305例(53.6%)；年齡16～81歲，平均(51.0±15.0)歲?；颊叻植嫉目剖仪闆r：腫瘤科234例(41.1%)，風濕免疫科131例(23.0%)，心臟內科94例(16.5%)，疼痛科62例(10.9%)，甲乳外科48例(7.4%)。在569例患者中，初篩PHQ-9評分<10分者464例(81.5%)，PHQ-9評分≥10分者105例(18.5%)。隨機抽取40名患者進行PHQ-9重測，最終共完成38例(2例患者失訪)；對150例患者進行MINI訪談，最終完成139例(11例拒絕參與)。

2.2 信度檢驗

2.2.1 內部一致性檢驗

本研究中研究者內部一致性系數(shù)(intraclass correlation coefficient, ICC)為0.973，PHQ-9在本研究中的Cronbach' s α系數(shù)為0.839。

2.2.2 相關分析

Spearman相關分析顯示：各條目與總評分的相關系數(shù)為0.484～0.724(P均<0.01)，各條目間相關系數(shù)為0.229～0.520(P均<0.01)。見表1。

表1 PHQ-9各條目間及各條目與總評分的相關性(r)

注：aP<0.01(雙側檢驗)

2.2.3 重測信度

采用Spearman相關系數(shù)法對中文版PHQ-9初測與2周后重測結果進行分析，相關系數(shù)r=0.846(P<0.01)。

2.3 效度檢驗

2.3.1 結構效度檢驗

采用主成分分析法得到的KMO檢驗值為0.719，且Bartlett球形檢驗統(tǒng)計量為249.176(P<0.01)，表明可進行探索性因子分析，并提取到三個成分，其特征值均大于1(分別為2.975、1.315、1.042)，其累積方差貢獻率為59.248%。經方差最大旋轉后因子矩陣來看：條目 2(心情沮喪)、條目 6(自我否定)、條目 9(消極觀念)在因子1的負荷值在0.554～0.897之間，可歸為一個因子(自我評價因子)；條目 3(睡眠障礙)、條目 4(精力不足)、條目5(飲食障礙)在因子2的負荷值在0.688～0.752之間，可歸為一個因子(軀體化因子)；條目 1(興趣下降)、條目7(注意力難集中)、條目8(煩躁不安)在因子3的負荷值在0.530～0.720之間，可歸為一個因子(情感因子)。見表2。

2.3.2 ROC曲線

139例接受MINI評定的患者中，陽性68例(48.9%)，陰性71例(51.1%)。本研究中ROC曲線的標準為MINI診斷結果，以最大Youden指數(shù)(靈敏度+特異度-1)作為臨界值的篩選標準，而以陽性預測值和陰性預測值作為參考值。最終得出：本研究最佳劃界分為8分(對應的敏感度為92.6%，特異度為60.6%)。見表3。PHQ-9的ROC曲線下面積為0.841(95%CI：0.777～0.905，P<0.01)。見圖1。

表2 PHQ-9因子分析結果

3 討論

既往關于PHQ-9信效度檢測的研究主要局限于特定病種的患者和特定人群，而隨著近年來綜合醫(yī)院規(guī)模不斷擴大、病種日趨復雜化，住院患者總體的抑郁癥罹患率常常被低估。本研究對PHQ-9在綜合醫(yī)院住院患者中應用的信效度進行評估并探討最佳劃界分，旨在探索PHQ-9在該類群體中的應用價值。

表3 不同劃界分時PHQ-9篩查診斷性能指標

圖1 PHQ-9的ROC曲線

徐勇等[16]總結了PHQ-9在社區(qū)老年人群中應用的Cronbach' s α為0.832，各條目間的相關系數(shù)為0.233～0.523，各條目與量表總評分的相關系數(shù)為0.451～0.693，重測系數(shù)為0.934；胡星辰等[17]分析得到PHQ-9在青少年人群中的Cronbach' s α為 0.85，條目間相關系數(shù)為0.289～0.560，各條目與PHQ-9總評分相關系數(shù)為0.616～0.730，4周后重測信度為0.88；Wang等[15]對1 045例上海市社區(qū)普通人群進行分析得出Cronbach' s α為0.86，2周后重測信度為0.86。Gelaye等[18]研究顯示，PHQ-9在926例東非國家成人中的Cronbach' s α為0.85，重測信度為0.92。本研究顯示PHQ-9在綜合醫(yī)院住院患者中的Cronbach' s α為0.839，各條目評分與總評分之間的相關系數(shù)為0.484～0.724，提示該量表的內部一致性較好；其重測信度系數(shù)為0.81，表明PHQ-9具有良好的時間穩(wěn)定性，即可重復評定的特性，這與PHQ-9在國內外不同群體中的研究結果接近。

關于PHQ-9結構效度分析，國內外少量研究中采用探索性因子分析得出1個潛因子[15,17,19]，命名為“情感-軀體化因子”，而目前比較公認的為2因子結構，即“認知-情感和軀體因子”[12,14]。本研究得出三個特征值大于1的因子(自我評價因子、軀體化因子、情感因子)，累積方差貢獻率為59.248%，且各條目在其所屬因子的負荷值均在0.5以上而在其他因子的負荷值明顯較低，說明該量表具有良好的三因子結構。雖然為三因子結構，但本研究得出的“自我評價因子”仍可被認為是傳統(tǒng)“認知-情感因子”的一部分。

胡星辰等[17]總結的PHQ-9在471名青少年中的ROC曲線下面積(AUC)為0.984(95%CI: 0.969～0.993)，且PHQ-9評估抑郁情緒的最佳劃界分為10分；Wang等[15]總結的PHQ-9在1 045名中國普通人群中的ROC曲線下面積為0.92(95%CI: 0.86～0.97)，最佳劃界分為7分(敏感度為86%，特異度為86%)。而既往有研究認為PHQ-9的最佳劃界分為9～11分[20]。本研究PHQ-9應用于綜合醫(yī)院患者的ROC曲線下面積(AUC)為0.841，最佳診斷劃界分為8分(敏感度為92.6%、特異度為60.6%)，稍優(yōu)于10分(靈敏度為85.3%、特異度為67.6%)。本研究最佳劃界分下的敏感度高而特異度稍低于既往研究，可能與患者住院期間的抑郁狀況較平時嚴重有關，這也與臨床實際情況吻合。另外，較低的劃界分(8分)更有利于早期發(fā)現(xiàn)、及時干預。

總之，本研究驗證了PHQ-9在國內綜合醫(yī)院住院患者中應用具有良好的信效度，探討了在該人群中應用的最佳劃界分，為綜合醫(yī)院快速篩查抑郁癥患者提供了有效的工具。但本研究仍存在一定局限性，首先患者均來自西部同一所大型綜合醫(yī)院，可能存在選擇偏倚，不能代表全國所有綜合醫(yī)院。另外，PHQ-9為自評量表，會受到患者受教育程度及認知功能的影響，而本研究并未對此展開深入分析。在以后的臨床運用中，還需進一步加以研究和完善。

[1] Lee S, Tsang A, Huang Y, et al. The epidemiology of depression in metropolitan China[J]. Psychol Med, 2009, 39(5): 735-747.

[2] Phillips MR, Zhang J, Shi Q, et al. Prevalence, treatment, and associated disability of mental disorders in four provinces in China during 2001-05: an epidemiological survey[J]. Lancet, 2009, 373(9680): 2041-2053.

[3] Liu J, Yan F, Ma X, et al. Prevalence of major depressive disorder and socio-demographic correlates: results of a representative household epidemiological survey in Beijing, China[J]. J Affect Disord, 2015, 179(8): 74-81.

[4] 陸崢, 朱俊娟, 蔡軍, 等. 上海市綜合性醫(yī)院精神科門診醫(yī)師對抑郁癥識別及治療的對照研究[J]. 中華全科醫(yī)師雜志, 2008, 7(4): 231-234.

[5] Sang W, Sun X, Li B, et al. A cross-sectional survey on the identification and treatment rate for depression of inpatients in general hospitals at country and city levels in Baoding City[J]. J Nerv Ment Dis, 2013, 39(7): 347-351.

[6] 張國芳, 趙均, 饒順曾, 等. 2345名綜合醫(yī)院醫(yī)務人員精神衛(wèi)生知識知曉率的調查[J].上海精神醫(yī)學, 2005, 17(增刊): 17-18.

[7] Li XJ, He YL, Ma H, et al. Prevalence of depressive and anxiety disorders in Chinese gastroenterological outpatients[J]. World J Gastroenterol, 2012, 18(20): 2561-2568.

[8] Karasz A, Dowrick C, Byng R, et al. What we talk about when we talk about depression:doctor-patient conversations and treatment decision outcomes[J]. Br J Gen Pract, 2012, 62(594): e55-63.

[9] Ng CW, How CH, Ng YP. Depression in primary care: assessing suicide risk[J]. Singapore Med J, 2017, 58(2): 72-77.

[10] Kroenke K, Spitzer RL, Williams JB. The PHQ-9: validity of a brief depression severity measure[J]. J Gen Intern Med, 2001, 16(9): 606-613.

[11] Kiely KM, Butterworth P. Validation of four measures of mental health against depression and generalized anxiety in a community based sample[J]. Psychiatry Res, 2015, 225(3): 291-298.

[12] Beard C, Hsu KJ, Rifkin LS, et al. Validation of the PHQ-9 in a psychiatric sample[J]. J Affect Disord, 2016, 193(5): 267-273.

[13] Liu ZW, Yu Y, Hu M, et al. PHQ-9 and PHQ-2 for screening depression in Chinese rural elderly[J]. PLoS One, 2016, 11(3): 1-10.

[14] Hinz A, Mehnert A, Kocalevent RD, et al. Assessment of depression severity with the PHQ-9 in cancer patients and in the general population[J]. BMC Psychiatry, 2016, 16(22): 1-8.

[15] Wang W, Bian Q, Zhao Y, et al. Reliability and validity of the Chinese version of the Patient Health Questionnaire (PHQ-9) in the general population[J]. Gen Hosp Psychiatry, 2014, 36(5): 539-544.

[16] 徐勇, 吳海蘇, 徐一峰. 病人健康問卷抑郁量表(PHQ-9)在社區(qū)老年人群中的應用——信度與效度分析[J]. 上海精神醫(yī)學, 2007, 19(5): 257-259.

[17] 胡星辰, 張迎黎, 梁煒, 等. 病人健康問卷抑郁量表(PHQ-9)在青少年中應用的信效度檢驗[J]. 四川精神衛(wèi)生, 2014, 27(4): 357-360.

[18] Gelaye B, Williams MA, Lemma S, et al. Validity of the patient health questionnaire-9 for depression screening and diagnosis in East Africa[J]. Psychiatry Res, 2013, 210(2): 653-661.

[19] Kocalevent RD, Hinz A, Br?hler E. Standardization of the depression screener patient health questionnaire (PHQ-9) in the general population[J]. Gen Hosp Psychiatry, 2013, 35(5): 551-555.

[20] Manea L, Gilbody S, McMillan D. Optimal cut-off score for diagnosing depression with the Patient Health Questionnaire (PHQ-9): a meta-analysis[J]. CMAJ, 2012, 184(3): E191-196．

(本文編輯：陳霞)

Evaluation of the reliability and validity of PHQ-9 in general hospital inpatients

ChenRan,WangYu,YuJianying,ZhangLan*

(WestChinaHospitalofSichuanUniversity,Chengdu610041,China*Correspondingauthor:ZhangLan,E-mail:zhangzilan102@126.com)

Objective To investigate the reliability and validity of Patients' Health Questionnaire Depression Scale-9 item(PHQ-9) in general hospital inpatients and to explore the feasibility of PHQ-9 in screening hospitalized patients in general hospital.Methods To facilitate the extraction of 569 hospitalized patients in West China Hospital of Sichuan University, PHQ-9 was completed under the specified guidance. 38 patients were randomly selected by random number table and PHQ-9 retest was performed after 2 weeks of initial evaluation. Mini International Neuropsychiatric Interview(MINI) was used as the “gold standard” to evaluate the efficacy and validity of the Chinese version of PHQ-9. A total of 139 patients were interviewed by MINI Chinese version.Results The Cronbach' s α coefficient of PHQ-9 was 0.839 and the 2-week test-retest reliability was 0.846. The correlation coefficient of the items and total score was 0.484～0.724(P<0.01) and between items was 0.229～0.520(P<0.01). Factor analysis suggested a three-factor solution: self-assessment factor, affective factor and somatic symptom factor. The best diagnostic demarcation point is 8, maximizing the Youden Index, yielded a sensitivity of 92.6% and a specificity of 60.6%. The results of ROC analysis indicated that the area under the curve (AUC) was 0.841(95%CI: 0.777～0.905).Conclusion The Chinese version of PHQ-9 was shown to have good reliability and validity in general hospital inpatients. 8 is the best demarcation of the scale points.

PHQ-9; Reliability; Validity; General hospital; Inpatients

R749

10.11886/j.issn.1007-3256.2017.02.013

2017-02-27)

PHQ-9在綜合醫(yī)院住院患者中信效度研究

1 對象與方法

2 結 果

3 討 論

2 結果

3 討論