陳 然,王 瑜,余建英,張 嵐
(四川大學華西醫(yī)院心理衛(wèi)生中心,四川 成都 610041*通信作者:張 嵐,E-mail:zhangzilan102@126.com)
論著·預防
PHQ-9在綜合醫(yī)院住院患者中信效度研究
陳 然,王 瑜,余建英,張 嵐*
(四川大學華西醫(yī)院心理衛(wèi)生中心,四川 成都 610041*通信作者:張 嵐,E-mail:zhangzilan102@126.com)
目的 檢驗病人健康問卷抑郁量表(PHQ-9)在綜合醫(yī)院住院患者中應用的信度和效度,探索PHQ-9在綜合醫(yī)院住院患者中快速篩查抑郁的可行性。方法 方便抽取四川大學華西醫(yī)院569名住院患者,在規(guī)定指導語下完成PHQ-9評定,采用隨機數(shù)字表法隨機抽取38名患者在完成初次評定2周后進行PHQ-9重測;以簡明國際神經精神訪談(MINI)作為“金標準”,評估中文版PHQ-9的效標效度,共139名患者接受MINI中文版訪談。結果 PHQ-9在本研究中的Cronbach' s α系數(shù)為0.839,各條目與總評分的相關系數(shù)r=0.484~0.724(P<0.01),各條目間相關系數(shù)r=0.229~0.520(P<0.01);兩周后重測系數(shù)r=0.846(P<0.01);因子分析獲得3個公因子,分別為自我評價因子、情感因子和軀體化因子;最佳診斷劃界分為8分,敏感度為92.6%,特異度為60.6%;PHQ-9的ROC曲線下面積為0.841(95%CI:0.777~0.905)。結論 PHQ-9應用于綜合醫(yī)院住院患者抑郁評估中具有良好的信效度,8分為該量表的最佳劃界分。
PHQ-9;信度;效度;綜合醫(yī)院;住院患者
研究表明,中國普通人群的重性抑郁障礙發(fā)病率約為2.07%~6.87%[1-3]。然而在綜合醫(yī)院,由于缺乏對患者精神問題的關注,綜合醫(yī)院對普通住院患者抑郁發(fā)作識別率僅為13.0%~31.8%[4-5],加之國內綜合醫(yī)院非精神科專業(yè)醫(yī)師對精神類疾病識別率低[6-7],且目前國內尚未廣泛普及應用于普通住院患者快速篩查抑郁的工具,非精神科患者的抑郁問題往往被忽視。使得患者反復就醫(yī)、延誤治療、浪費醫(yī)療資源[8],甚至患者在住院期間發(fā)生自傷、自殺等嚴重后果[9]。因此,在該人群中驗證一項便捷、可信度高的抑郁自評問卷意義重大。
病人健康問卷抑郁量表(Patients’ Health Questionnaire Depression Scale-9 item, PHQ-9)是以《精神障礙診斷與統(tǒng)計手冊(第4版)》(Diagnostic and Statistical Manual of Mental Disorders, fourth edition,DSM-IV)的重性抑郁障礙(Major depressive disorder,MDD)為標準編制而成的9個條目自評工具,臨床使用方便[10]。該量表已被翻譯為多種語言版本,在不同人群中應用顯示其具有良好的信效度[11-15],在國外已成為基層醫(yī)療中篩查抑郁癥的首選工具之一。但目前還缺乏對該量表在綜合醫(yī)院普通住院患者中的信效度研究,在一定程度上限制了該量表的使用。本研究旨在檢驗PHQ-9在綜合醫(yī)院住院患者中的信效度,以便更好地服務于臨床。
1.1 對象
采用方便取樣,于2015年4月對四川大學華西醫(yī)院的心臟內科、腫瘤科、風濕免疫科、疼痛科、甲乳外科5個科室共582例住院患者進行問卷調查。其中腫瘤科238人,風濕免疫科134人,心臟內科96人,疼痛科64人,甲乳外科50人。入組標準:①年齡≥16歲;②受教育程度在初中及以上;③身體狀況能滿足獨立完成問卷評定;④患者自愿參加本研究并簽署知情同意書。排除標準:①調查當日安排出院的患者;②有明顯認知功能障礙或嚴重軀體疾病而無法完成調查者。
1.2 研究工具
采用自編一般資料調查表收集患者年齡、性別、民族、職業(yè)、婚姻情況、受教育程度、醫(yī)療保險、家庭年收入情況、目前疾病診斷、患病時間、健康狀況、生活質量、心理健康狀況自我評價。采用PHQ-9評估過去兩周患者抑郁癥狀的發(fā)生頻率,PHQ-9由9個四分類條目組成,0分為完全沒有,1分為有幾天, 2分為有一半以上的日子,3分為幾乎每天都有。以中文版簡明國際神經精神訪談(Mini International Neuropsychiatric Interview,MINI)評定結果作為“金標準”來評估PHQ-9的效標效度。
1.3 評定方法
預調查階段,在四川大學華西醫(yī)院住院患者中隨機選取9例進行預調查,重點考察對9例患者進行MINI評定的調查員的一致性,調查員均為經過統(tǒng)一MINI評定培訓的精神科醫(yī)生。
正式調查階段,由經過統(tǒng)一培訓的3名四川大學臨床心理學研究生進行自編一般資料調查表及PHQ-9的發(fā)放和收集,若患者因年齡、受教育程度、軀體疾病等而無法自行作答者,由調查員采取個別訪談的方式完成評定。問卷回收后當日交于質量控制員并編號。為了更有效地評價PHQ-9的校標效度,由質量控制員采用盲法分配方式將不同分數(shù)段的150名患者分配給調查員,由調查員在初次評定的當日或第二日對其進行面對面的MINI診斷訪談。
重測階段,在正式調查完成2周后,由控制員采用隨機數(shù)字表法抽取38名患者進行電話訪談以獲取其一般資料及PHQ-9信息。
1.4 質量控制
當調查員之間MINI評估結果出現(xiàn)分歧,則由高年資心理學專家協(xié)助討論,盡量提高研究者內部一致性。PHQ-9及MINI訪談問卷均在患者床旁、在研究者的指令下完成,調查時研究者與患者一一對應,避免患者相互討論,問卷完成時間少于3 min則視為無效問卷。
1.5 統(tǒng)計方法
采用SPSS 18.0進行統(tǒng)計分析。采用Cronbach' s α系數(shù)評估量表內部一致性;采用Spearman相關系數(shù)法評估條目間及條目與總評分的相關性;探索性因素分析(exploratory factor analysis,EFA)用于評估結構效度;采用受試者工作特征曲線(Receiver Operating Characteristic Curve,ROC)檢驗PHQ-9診斷效能,以最大Youden指數(shù)確定最佳劃界分。另外,根據(jù)數(shù)據(jù)分布特點,采用的統(tǒng)計方法包括描述性統(tǒng)計、方差分析、Bartlett球形檢驗、Mann-WitneyU檢驗等。檢驗水準α=0.05。
2.1 一般資料
本研究共納入582例患者,其中13例未完成評定,最終回收有效問卷569份,有效問卷回收率為97.8%。其中男性264例(46.4%),女性305例(53.6%);年齡16~81歲,平均(51.0±15.0)歲?;颊叻植嫉目剖仪闆r:腫瘤科234例(41.1%),風濕免疫科131例(23.0%),心臟內科94例(16.5%),疼痛科62例(10.9%),甲乳外科48例(7.4%)。在569例患者中,初篩PHQ-9評分<10分者464例(81.5%),PHQ-9評分≥10分者105例(18.5%)。隨機抽取40名患者進行PHQ-9重測,最終共完成38例(2例患者失訪);對150例患者進行MINI訪談,最終完成139例(11例拒絕參與)。
2.2 信度檢驗
2.2.1 內部一致性檢驗
本研究中研究者內部一致性系數(shù)(intraclass correlation coefficient, ICC)為0.973,PHQ-9在本研究中的Cronbach' s α系數(shù)為0.839。
2.2.2 相關分析
Spearman相關分析顯示:各條目與總評分的相關系數(shù)為0.484~0.724(P均<0.01),各條目間相關系數(shù)為0.229~0.520(P均<0.01)。見表1。
表1 PHQ-9各條目間及各條目與總評分的相關性(r)
注:aP<0.01(雙側檢驗)
2.2.3 重測信度
采用Spearman相關系數(shù)法對中文版PHQ-9初測與2周后重測結果進行分析,相關系數(shù)r=0.846(P<0.01)。
2.3 效度檢驗
2.3.1 結構效度檢驗
采用主成分分析法得到的KMO檢驗值為0.719,且Bartlett球形檢驗統(tǒng)計量為249.176(P<0.01),表明可進行探索性因子分析,并提取到三個成分,其特征值均大于1(分別為2.975、1.315、1.042),其累積方差貢獻率為59.248%。經方差最大旋轉后因子矩陣來看:條目 2(心情沮喪)、條目 6(自我否定)、條目 9(消極觀念)在因子1的負荷值在0.554~0.897之間,可歸為一個因子(自我評價因子);條目 3(睡眠障礙)、條目 4(精力不足)、條目5(飲食障礙)在因子2的負荷值在0.688~0.752之間,可歸為一個因子(軀體化因子);條目 1(興趣下降)、條目7(注意力難集中)、條目8(煩躁不安)在因子3的負荷值在0.530~0.720之間,可歸為一個因子(情感因子)。見表2。
2.3.2 ROC曲線
139例接受MINI評定的患者中,陽性68例(48.9%),陰性71例(51.1%)。本研究中ROC曲線的標準為MINI診斷結果,以最大Youden指數(shù)(靈敏度+特異度-1)作為臨界值的篩選標準,而以陽性預測值和陰性預測值作為參考值。最終得出:本研究最佳劃界分為8分(對應的敏感度為92.6%,特異度為60.6%)。見表3。PHQ-9的ROC曲線下面積為0.841(95%CI:0.777~0.905,P<0.01)。見圖1。
表2 PHQ-9因子分析結果
既往關于PHQ-9信效度檢測的研究主要局限于特定病種的患者和特定人群,而隨著近年來綜合醫(yī)院規(guī)模不斷擴大、病種日趨復雜化,住院患者總體的抑郁癥罹患率常常被低估。本研究對PHQ-9在綜合醫(yī)院住院患者中應用的信效度進行評估并探討最佳劃界分,旨在探索PHQ-9在該類群體中的應用價值。
表3 不同劃界分時PHQ-9篩查診斷性能指標
圖1 PHQ-9的ROC曲線
徐勇等[16]總結了PHQ-9在社區(qū)老年人群中應用的Cronbach' s α為0.832,各條目間的相關系數(shù)為0.233~0.523,各條目與量表總評分的相關系數(shù)為0.451~0.693,重測系數(shù)為0.934;胡星辰等[17]分析得到PHQ-9在青少年人群中的Cronbach' s α為 0.85,條目間相關系數(shù)為0.289~0.560,各條目與PHQ-9總評分相關系數(shù)為0.616~0.730,4周后重測信度為0.88;Wang等[15]對1 045例上海市社區(qū)普通人群進行分析得出Cronbach' s α為0.86,2周后重測信度為0.86。Gelaye等[18]研究顯示,PHQ-9在926例東非國家成人中的Cronbach' s α為0.85,重測信度為0.92。本研究顯示PHQ-9在綜合醫(yī)院住院患者中的Cronbach' s α為0.839,各條目評分與總評分之間的相關系數(shù)為0.484~0.724,提示該量表的內部一致性較好;其重測信度系數(shù)為0.81,表明PHQ-9具有良好的時間穩(wěn)定性,即可重復評定的特性,這與PHQ-9在國內外不同群體中的研究結果接近。
關于PHQ-9結構效度分析,國內外少量研究中采用探索性因子分析得出1個潛因子[15,17,19],命名為“情感-軀體化因子”,而目前比較公認的為2因子結構,即“認知-情感和軀體因子”[12,14]。本研究得出三個特征值大于1的因子(自我評價因子、軀體化因子、情感因子),累積方差貢獻率為59.248%,且各條目在其所屬因子的負荷值均在0.5以上而在其他因子的負荷值明顯較低,說明該量表具有良好的三因子結構。雖然為三因子結構,但本研究得出的“自我評價因子”仍可被認為是傳統(tǒng)“認知-情感因子”的一部分。
胡星辰等[17]總結的PHQ-9在471名青少年中的ROC曲線下面積(AUC)為0.984(95%CI: 0.969~0.993),且PHQ-9評估抑郁情緒的最佳劃界分為10分;Wang等[15]總結的PHQ-9在1 045名中國普通人群中的ROC曲線下面積為0.92(95%CI: 0.86~0.97),最佳劃界分為7分(敏感度為86%,特異度為86%)。而既往有研究認為PHQ-9的最佳劃界分為9~11分[20]。本研究PHQ-9應用于綜合醫(yī)院患者的ROC曲線下面積(AUC)為0.841,最佳診斷劃界分為8分(敏感度為92.6%、特異度為60.6%),稍優(yōu)于10分(靈敏度為85.3%、特異度為67.6%)。本研究最佳劃界分下的敏感度高而特異度稍低于既往研究,可能與患者住院期間的抑郁狀況較平時嚴重有關,這也與臨床實際情況吻合。另外,較低的劃界分(8分)更有利于早期發(fā)現(xiàn)、及時干預。
總之,本研究驗證了PHQ-9在國內綜合醫(yī)院住院患者中應用具有良好的信效度,探討了在該人群中應用的最佳劃界分,為綜合醫(yī)院快速篩查抑郁癥患者提供了有效的工具。但本研究仍存在一定局限性,首先患者均來自西部同一所大型綜合醫(yī)院,可能存在選擇偏倚,不能代表全國所有綜合醫(yī)院。另外,PHQ-9為自評量表,會受到患者受教育程度及認知功能的影響,而本研究并未對此展開深入分析。在以后的臨床運用中,還需進一步加以研究和完善。
[1] Lee S, Tsang A, Huang Y, et al. The epidemiology of depression in metropolitan China[J]. Psychol Med, 2009, 39(5): 735-747.
[2] Phillips MR, Zhang J, Shi Q, et al. Prevalence, treatment, and associated disability of mental disorders in four provinces in China during 2001-05: an epidemiological survey[J]. Lancet, 2009, 373(9680): 2041-2053.
[3] Liu J, Yan F, Ma X, et al. Prevalence of major depressive disorder and socio-demographic correlates: results of a representative household epidemiological survey in Beijing, China[J]. J Affect Disord, 2015, 179(8): 74-81.
[4] 陸崢, 朱俊娟, 蔡軍, 等. 上海市綜合性醫(yī)院精神科門診醫(yī)師對抑郁癥識別及治療的對照研究[J]. 中華全科醫(yī)師雜志, 2008, 7(4): 231-234.
[5] Sang W, Sun X, Li B, et al. A cross-sectional survey on the identification and treatment rate for depression of inpatients in general hospitals at country and city levels in Baoding City[J]. J Nerv Ment Dis, 2013, 39(7): 347-351.
[6] 張國芳, 趙均, 饒順曾, 等. 2345名綜合醫(yī)院醫(yī)務人員精神衛(wèi)生知識知曉率的調查[J].上海精神醫(yī)學, 2005, 17(增刊): 17-18.
[7] Li XJ, He YL, Ma H, et al. Prevalence of depressive and anxiety disorders in Chinese gastroenterological outpatients[J]. World J Gastroenterol, 2012, 18(20): 2561-2568.
[8] Karasz A, Dowrick C, Byng R, et al. What we talk about when we talk about depression:doctor-patient conversations and treatment decision outcomes[J]. Br J Gen Pract, 2012, 62(594): e55-63.
[9] Ng CW, How CH, Ng YP. Depression in primary care: assessing suicide risk[J]. Singapore Med J, 2017, 58(2): 72-77.
[10] Kroenke K, Spitzer RL, Williams JB. The PHQ-9: validity of a brief depression severity measure[J]. J Gen Intern Med, 2001, 16(9): 606-613.
[11] Kiely KM, Butterworth P. Validation of four measures of mental health against depression and generalized anxiety in a community based sample[J]. Psychiatry Res, 2015, 225(3): 291-298.
[12] Beard C, Hsu KJ, Rifkin LS, et al. Validation of the PHQ-9 in a psychiatric sample[J]. J Affect Disord, 2016, 193(5): 267-273.
[13] Liu ZW, Yu Y, Hu M, et al. PHQ-9 and PHQ-2 for screening depression in Chinese rural elderly[J]. PLoS One, 2016, 11(3): 1-10.
[14] Hinz A, Mehnert A, Kocalevent RD, et al. Assessment of depression severity with the PHQ-9 in cancer patients and in the general population[J]. BMC Psychiatry, 2016, 16(22): 1-8.
[15] Wang W, Bian Q, Zhao Y, et al. Reliability and validity of the Chinese version of the Patient Health Questionnaire (PHQ-9) in the general population[J]. Gen Hosp Psychiatry, 2014, 36(5): 539-544.
[16] 徐勇, 吳海蘇, 徐一峰. 病人健康問卷抑郁量表(PHQ-9)在社區(qū)老年人群中的應用——信度與效度分析[J]. 上海精神醫(yī)學, 2007, 19(5): 257-259.
[17] 胡星辰, 張迎黎, 梁煒, 等. 病人健康問卷抑郁量表(PHQ-9)在青少年中應用的信效度檢驗[J]. 四川精神衛(wèi)生, 2014, 27(4): 357-360.
[18] Gelaye B, Williams MA, Lemma S, et al. Validity of the patient health questionnaire-9 for depression screening and diagnosis in East Africa[J]. Psychiatry Res, 2013, 210(2): 653-661.
[19] Kocalevent RD, Hinz A, Br?hler E. Standardization of the depression screener patient health questionnaire (PHQ-9) in the general population[J]. Gen Hosp Psychiatry, 2013, 35(5): 551-555.
[20] Manea L, Gilbody S, McMillan D. Optimal cut-off score for diagnosing depression with the Patient Health Questionnaire (PHQ-9): a meta-analysis[J]. CMAJ, 2012, 184(3): E191-196.
(本文編輯:陳 霞)
Evaluation of the reliability and validity of PHQ-9 in general hospital inpatients
ChenRan,WangYu,YuJianying,ZhangLan*
(WestChinaHospitalofSichuanUniversity,Chengdu610041,China*Correspondingauthor:ZhangLan,E-mail:zhangzilan102@126.com)
Objective To investigate the reliability and validity of Patients' Health Questionnaire Depression Scale-9 item(PHQ-9) in general hospital inpatients and to explore the feasibility of PHQ-9 in screening hospitalized patients in general hospital.Methods To facilitate the extraction of 569 hospitalized patients in West China Hospital of Sichuan University, PHQ-9 was completed under the specified guidance. 38 patients were randomly selected by random number table and PHQ-9 retest was performed after 2 weeks of initial evaluation. Mini International Neuropsychiatric Interview(MINI) was used as the “gold standard” to evaluate the efficacy and validity of the Chinese version of PHQ-9. A total of 139 patients were interviewed by MINI Chinese version.Results The Cronbach' s α coefficient of PHQ-9 was 0.839 and the 2-week test-retest reliability was 0.846. The correlation coefficient of the items and total score was 0.484~0.724(P<0.01) and between items was 0.229~0.520(P<0.01). Factor analysis suggested a three-factor solution: self-assessment factor, affective factor and somatic symptom factor. The best diagnostic demarcation point is 8, maximizing the Youden Index, yielded a sensitivity of 92.6% and a specificity of 60.6%. The results of ROC analysis indicated that the area under the curve (AUC) was 0.841(95%CI: 0.777~0.905).Conclusion The Chinese version of PHQ-9 was shown to have good reliability and validity in general hospital inpatients. 8 is the best demarcation of the scale points.
PHQ-9; Reliability; Validity; General hospital; Inpatients
R749
A
10.11886/j.issn.1007-3256.2017.02.013
2017-02-27)