趙雨蕾,蔣 蓉,余 艷,王 蕓,周麗娟,王 芝,李文靜
卒中后抑郁(post-stroke depression,PSD)是腦卒中后常出現(xiàn)的情感功能障礙,以情緒低沉、自責(zé)、睡眠障礙、興味索然等為主要特征,常伴隨有軀體癥狀[1, 2]。卒中患者在長期康復(fù)過程中的不同階段均有可能罹患PSD[3],有研究表明,我國PSD發(fā)生率為34.9%[4]。PSD的高致殘率與高死亡率嚴(yán)重影響了腦卒中患者的認(rèn)知、神經(jīng)及肢體功能恢復(fù),導(dǎo)致患者的家庭與社會(huì)負(fù)擔(dān)加重、生活質(zhì)量下降等不良后果[5, 6]。有研究指出,采取針對性措施可改善PSD患者的結(jié)局,并在一定程度上改善患者的神經(jīng)功能狀態(tài)[7, 8]。因此,早期預(yù)測卒中患者抑郁情況以實(shí)施適當(dāng)干預(yù),對改善卒中患者預(yù)后、提高患者生命質(zhì)量具有積極影響。在醫(yī)療領(lǐng)域,機(jī)器學(xué)習(xí)模型可應(yīng)用于疾病診斷以及并發(fā)癥的預(yù)測[9],幫助醫(yī)護(hù)人員早期識(shí)別高危人群,為醫(yī)護(hù)人員制定正確的管理策略和個(gè)性化的干預(yù)措施提供支持。本文對PSD的機(jī)器學(xué)習(xí)風(fēng)險(xiǎn)預(yù)測模型的研究進(jìn)展進(jìn)行整理和總結(jié),旨在為PSD的風(fēng)險(xiǎn)預(yù)測模型構(gòu)建與預(yù)測模型的臨床應(yīng)用與研究提供參考與借鑒。
1.1 概述隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,醫(yī)療系統(tǒng)進(jìn)入了大數(shù)據(jù)和機(jī)器學(xué)習(xí)時(shí)代。機(jī)器學(xué)習(xí)是一門多學(xué)科交叉專業(yè)[10],使用機(jī)器學(xué)習(xí)技術(shù)建模可以深入挖掘數(shù)據(jù)的價(jià)值,并在有效利用數(shù)據(jù)和支持臨床決策方面發(fā)揮不可或缺的作用[11]。常用的機(jī)器學(xué)習(xí)算法包括K近鄰、樸素貝葉斯、Logistic回歸、決策樹、支持向量機(jī)、深度神經(jīng)網(wǎng)絡(luò)等[12]。風(fēng)險(xiǎn)預(yù)測模型作為一種預(yù)測工具,可通過數(shù)學(xué)公式估算個(gè)體目前患某種疾病或未來發(fā)生某種結(jié)局的可能性[13],依據(jù)應(yīng)用目的可將模型分為診斷和預(yù)后兩種類型[14]。預(yù)后模型指被診斷為某種疾癥后,對未來某一時(shí)間段內(nèi)的并發(fā)癥、復(fù)發(fā)、死亡等發(fā)生率進(jìn)行預(yù)測[15],本文研究的PSD風(fēng)險(xiǎn)預(yù)測模型屬于預(yù)后模型。如今,基于機(jī)器學(xué)習(xí)算法的風(fēng)險(xiǎn)預(yù)測模型已在醫(yī)療領(lǐng)域獲得廣泛應(yīng)用與發(fā)展,能夠較為精準(zhǔn)、高效地進(jìn)行疾病預(yù)測和診斷,識(shí)別高危群體,并協(xié)助醫(yī)務(wù)人員及時(shí)有效地制定干預(yù)措施,進(jìn)而減少不良結(jié)局的發(fā)生,提高患者生命品質(zhì)。
1.2 預(yù)測模型的評估目前,研究者常采用鑒別能力來評價(jià)預(yù)測模型,其主要評判指標(biāo)包括特異度、靈敏度以及受試者工作特征曲線下面積(area under curve,AUC)等。AUC值也被稱作C-統(tǒng)計(jì)值,通常作為綜合性指標(biāo)評估預(yù)測模型的準(zhǔn)確性[16, 17],取值在0.5~1,值越大表示該模型鑒別能力越高;靈敏度反映模型篩選陽性患者的能力;特異度反映模型確定陰性患者并將其排除的能力[18]。
1.3 預(yù)測模型的驗(yàn)證由于臨床應(yīng)用場景與研究對象的變化等因素,患者數(shù)據(jù)可能會(huì)呈現(xiàn)出不同特征,這為模型的預(yù)測結(jié)果帶來干擾,好的模型應(yīng)當(dāng)具備一定的泛化能力來避免這種干擾。因此,完整的預(yù)測模型研究需要通過驗(yàn)證其內(nèi)部效度及外部效度來評估模型的準(zhǔn)確性與泛化能力[15]。Bootstrap重抽樣、交叉驗(yàn)證等常用作預(yù)測模型的內(nèi)部驗(yàn)證,內(nèi)部驗(yàn)證指測試集和訓(xùn)練集同源;而外部驗(yàn)證常收集不同源、不同時(shí)間段的數(shù)據(jù)進(jìn)行測試和驗(yàn)證[19]。
PSD的危險(xiǎn)因素很多,篩選并確定PSD的高危因素,可以降低建模難度,提高模型預(yù)測效果。因此,基于危險(xiǎn)因素的研究可為PSD風(fēng)險(xiǎn)預(yù)測模型的構(gòu)建奠定基礎(chǔ)。高春林等[20]總結(jié)了PSD的主要影響因素,包括卒中后病殘、卒中前抑郁病史、卒中嚴(yán)重程度與認(rèn)知功能障礙,焦慮和社會(huì)家庭支持缺失也對PSD具有一定影響。馬瑾等[21]認(rèn)為PSD的風(fēng)險(xiǎn)因素涵蓋生理-心理-社會(huì)三個(gè)層面,具體的因素除與高春林等研究的結(jié)果一致外,還應(yīng)包括腦血管病危險(xiǎn)因素、缺氧、個(gè)性內(nèi)向、獨(dú)居、家庭負(fù)擔(dān)重、自理能力差。張亞恒等[22]Meta分析顯示,PSD的高風(fēng)險(xiǎn)因素包括瘦素含量高、高身體質(zhì)量指數(shù)(BMI)、高mRS評分、基底節(jié)區(qū)梗死、額葉梗死、多病灶、家庭支持缺乏,年齡及女性。這些研究結(jié)果可為PSD風(fēng)險(xiǎn)預(yù)測模型研究在數(shù)據(jù)收集以及構(gòu)建方法等方面提供參考。
3.1 卒中后抑郁Logistic回歸預(yù)測模型Logistic回歸是一種有監(jiān)督的分類學(xué)習(xí)模型,根據(jù)因變量的數(shù)量可分為二元分類和多元分類,是反映因變量與多種影響因素之間關(guān)系的回歸分析方法[23]。Ginkel等[24]采用前瞻性多隊(duì)列研究方法獲得410例卒中患者的社會(huì)人口學(xué)資料、心腦血管危險(xiǎn)因素、既往史、卒中后功能評估資料等,在Logistic回歸分析的基礎(chǔ)上構(gòu)建模型,內(nèi)部檢驗(yàn)得出AUC值為0.78,靈敏度和特異度分別是0.73和0.75,結(jié)果顯示該模型具有良好的預(yù)測性能。研究表示該模型可協(xié)助醫(yī)護(hù)人員在1周內(nèi)及時(shí)預(yù)測患者未來發(fā)生PSD的風(fēng)險(xiǎn)。但該模型只進(jìn)行了內(nèi)部測試,缺乏外部驗(yàn)證支持。且該研究收集的是患者中風(fēng)后1周內(nèi)的數(shù)據(jù)資料,病情較重的患者被排除在外。有研究發(fā)現(xiàn)[25],病情越嚴(yán)重的卒中患者PSD診斷率越高,因此,PSD的實(shí)際發(fā)生率可能高于此研究結(jié)果,這與其他研究者[26, 27]在探究PSD發(fā)病率時(shí)所忽略的問題一致。
3.2 卒中后抑郁Cox回歸預(yù)測模型Cox比例風(fēng)險(xiǎn)回歸模型可對生存結(jié)局與生存時(shí)間進(jìn)行分析,并可同時(shí)納入多個(gè)因素,在流行病學(xué)的多因素生存關(guān)系分析問題當(dāng)中得到較好的應(yīng)用[28]。Leentjens等[29]采用前瞻性研究方法收集190例卒中患者資料,在患者卒中后1個(gè)月根據(jù)《診斷與統(tǒng)計(jì)手冊:精神障礙》以及漢密爾頓抑郁量表行重度抑郁評估。并在第3、6、9和12個(gè)月時(shí)對患者進(jìn)行隨訪,通過自評量表再次對患者進(jìn)行抑郁評估。研究者首先以重度抑郁評估作為結(jié)果變量,基于四種社區(qū)抑郁癥的危險(xiǎn)因素(性別、既往抑郁癥個(gè)人史、抑郁癥陽性家族史和非卒中影響的軀體合并癥)構(gòu)建了Cox回歸模型。而后,又在此基礎(chǔ)上輸入五種潛在危險(xiǎn)因素(殘疾,認(rèn)知功能低下,半球間病變、半球內(nèi)病變以及全身性血管損傷),結(jié)果證明殘疾程度是唯一可以提高該模型預(yù)測性能的危險(xiǎn)因素。但該研究在構(gòu)建模型時(shí)納入的因素有限,未考慮到其他可能會(huì)影響PSD的危險(xiǎn)因素,如社會(huì)心理因素等。此外,該模型未說明內(nèi)外部驗(yàn)證情況,故預(yù)測性能與臨床適用性有待進(jìn)一步評估。
3.3 卒中后抑郁列線圖預(yù)測模型列線圖又稱諾莫圖(Nomogram),其基于多因素回歸分析,通過具有刻度的線段依照特定比例在同一平面上描繪指標(biāo),以此表示不同變量間的相關(guān)性[30]。喬嘉璐等[31]通過回顧性分析篩選出具有建模能力的5個(gè)因素,包括日常生活能力量表評分、入院當(dāng)天美國國立衛(wèi)生研究院卒中量表評分(national institute of health stroke scale,NIHSS)、左額葉FA值、左顳葉FA值和左前扣帶回FA值。此研究內(nèi)外部驗(yàn)證AUC分別為0.8535和0.8972,結(jié)果表明該模型具有較好的識(shí)別及預(yù)測能力,且臨床適用性較好。分析此研究雖進(jìn)行了驗(yàn)證,但構(gòu)建的模型規(guī)模較小,訓(xùn)練數(shù)據(jù)較少,在后續(xù)的研究中還需加大訓(xùn)練樣本量,規(guī)避模型過擬合風(fēng)險(xiǎn)??戮w芬等[32]通過前瞻性研究法收集了321例卒中患者的資料。結(jié)果顯示以下7個(gè)獨(dú)立危險(xiǎn)因素:腦力型職業(yè)、額葉病變、基底核區(qū)病變、腦干病變、丘腦病變、同型半胱氨酸水平≥15 μmol/L以及NIHSS評分≥6分,訓(xùn)練集和驗(yàn)證集的AUC分別為0.826和0.793。此外,該模型還進(jìn)行內(nèi)部驗(yàn)證,證明該模型較好的鑒別能力和預(yù)測性能。但未進(jìn)行外部驗(yàn)證,且在收集患者資料時(shí)未考慮到社會(huì)心理因素,后續(xù)研究在納入因素時(shí),仍需考慮綜合危險(xiǎn)因素。Li等[27]報(bào)道了急性缺血性腦卒中患者發(fā)病3個(gè)月時(shí)PSD風(fēng)險(xiǎn)預(yù)測列線圖模型。研究者通過Logistic回歸分析確定以下7個(gè)強(qiáng)相關(guān)因子:年齡,NIHSS評分,改良Rankin評分量表,血清鈣磷產(chǎn)品,教育水平,高血壓病史和心房顫動(dòng)史。該模型C-統(tǒng)計(jì)量為0.81,靈敏度和特異度分別為0.711和0.786,顯示較好的鑒別性能。此模型進(jìn)行了內(nèi)部測試并進(jìn)行校準(zhǔn),但未見外部驗(yàn)證結(jié)果,故今后還需對該模型進(jìn)行多中心的外部臨床驗(yàn)證,以增加其預(yù)測可靠性與臨床應(yīng)用價(jià)值。
3.4 卒中后抑郁樹模型樹模型能很好地表達(dá)非線性關(guān)系,適用于分類與回歸任務(wù),且樹狀方法使模型擁有更高、更穩(wěn)定的精確率及可視化的預(yù)測結(jié)果,因此,樹模型的使用較為廣泛。決策樹由一系列節(jié)點(diǎn)構(gòu)成,可基于訓(xùn)練集對實(shí)例進(jìn)行分類或回歸;而隨機(jī)森林是以決策樹為基礎(chǔ)分類器,可同時(shí)訓(xùn)練多個(gè)決策樹,并綜合分析每個(gè)決策樹的結(jié)論,最終得出預(yù)測結(jié)果[12]。
Liu等[25]前瞻性地收集562例患者的資料,在Logistic回歸模型的基礎(chǔ)上轉(zhuǎn)化為決策樹模型,模型的AUC值為0.85,準(zhǔn)確度、靈敏度和特異度分別為0.86、0.70、0.83。研究者認(rèn)為兩個(gè)模型的預(yù)測性能差別不大,但是決策樹模型更為簡單直觀,更方便臨床應(yīng)用。此外,該研究還指出,社會(huì)心理因素對于在1個(gè)月內(nèi)識(shí)別PSD的風(fēng)險(xiǎn)非常重要,并有助于卒中后康復(fù)。但該研究方法存在以下不足:一是該研究未納入實(shí)驗(yàn)室檢查等風(fēng)險(xiǎn)因素,后續(xù)研究需結(jié)合更多風(fēng)險(xiǎn)因素進(jìn)行綜合分析;二是未說明模型的內(nèi)外部驗(yàn)證情況,其預(yù)測性能和臨床適用性尚無法明確。羅曉舟等[33]首先在回顧性研究的基礎(chǔ)上運(yùn)用單規(guī)則算法,判別并提取出688例卒中患者并發(fā)抑郁的高危因素:病灶位置、中醫(yī)藥干預(yù)手段及抑郁家族史。雖然此研究樣本量大,但未詳細(xì)說明抑郁結(jié)果的判別標(biāo)準(zhǔn),且病例來自不同醫(yī)院,在干預(yù)手段數(shù)據(jù)記錄中無法統(tǒng)一,因此,在做臨床干預(yù)時(shí)還需進(jìn)一步思考。再者,該模型仍需外部驗(yàn)證來為其能否適用于臨床提供依據(jù)。錢淑霞等[34]將320例卒中患者作為研究對象,通過構(gòu)建分類回歸樹模型確定以下危險(xiǎn)因素:腦卒中病史、BMI、社會(huì)支持評定量表、多倫多述情障礙量表、漢密爾頓焦慮量表及NIHSS。此研究未運(yùn)用評價(jià)指標(biāo)評估模型,且缺乏外部驗(yàn)證,模型的預(yù)測性能與臨床應(yīng)用價(jià)值尚無法評價(jià)。
隨著大數(shù)據(jù)與機(jī)器學(xué)習(xí)技術(shù)的發(fā)展與應(yīng)用,研究者對醫(yī)工結(jié)合領(lǐng)域的關(guān)注度居高不下,國內(nèi)關(guān)于卒中患者PSD的機(jī)器學(xué)習(xí)預(yù)測模型也得到了較好的研究與發(fā)展。但由于現(xiàn)有研究在危險(xiǎn)因素、研究方法、模型評估指標(biāo)、驗(yàn)證方法等方面存在差異,無法進(jìn)行較為客觀的比較,且現(xiàn)有方法仍存在一定局限性,未來需要運(yùn)用更科學(xué)、更全面和更先進(jìn)的研究方法進(jìn)行PSD風(fēng)險(xiǎn)預(yù)測模型的探索。首先,在納入危險(xiǎn)因素時(shí),需要從多角度綜合考量,并在實(shí)踐過程中不斷校準(zhǔn)和更新,全方位地分析PSD的影響因素,從而為醫(yī)務(wù)人員有針對性地提出干預(yù)對策奠定理論基石;其次,預(yù)測模型的準(zhǔn)確性及臨床適用性是醫(yī)務(wù)人員在實(shí)際運(yùn)用模型時(shí)需要考慮的指標(biāo)。因此,在今后的模型構(gòu)建研究中,為了提高預(yù)測穩(wěn)定性、準(zhǔn)確性和適用性,除進(jìn)行內(nèi)部驗(yàn)證外,針對不同群體的多中心的外部驗(yàn)證也是必要的。預(yù)測模型研究的價(jià)值除了所構(gòu)建的模型本身,更重要的是其在臨床中的實(shí)用和推廣,這也是研究的出發(fā)點(diǎn)和落腳點(diǎn),故預(yù)測模型構(gòu)建之后的跟蹤研究,需要得到研究人員更多關(guān)注。