梁 浩, 孫義竹, 李雨捷, 黃家號, 宋艾璘, 舒 欣, 易 斌
陸軍軍醫(yī)大學第一附屬醫(yī)院 麻醉科,重慶 400038
術(shù)后急性腎損傷(postoperative acute kidney injury,PO-AKI)是圍術(shù)期常見并發(fā)癥,會導致血漿廢物積累及細胞外液容量和電解質(zhì)失調(diào),與病死率增加及住院時間延長相關(guān)[1-2]。有研究報道,PO-AKI的發(fā)生率為5%~42%,因研究定義和手術(shù)類型而異[3-4]。影響PO-AKI發(fā)生的危險因素包括年齡、基線估計腎小球率過濾(esti mated glomerularfiltrationrate,eGFR)、合并癥(糖尿病和高血壓等)、高危手術(shù)、敗血癥、低白蛋白血癥和貧血等。目前,PO-AKI診斷中應(yīng)用較為廣泛的是改善全球腎病預后組織(KDIGO)的診斷標準,但其診斷依賴血清肌酐變化,遲滯于腎功能損害,難以早期及時發(fā)現(xiàn)[5]。多個團隊收集圍術(shù)期數(shù)據(jù),開發(fā)了PO-AKI風險預測模型預測心臟術(shù)后AKI[6-9]。Gameiro等[10]開發(fā)PO-AKI風險預測模型預測腹部大手術(shù)PO-AKI風險,Lee等[11]開發(fā)PO-AKI風險預測模型預測肝移植手術(shù)術(shù)后發(fā)生AKI的風險。目前,機器學習被廣泛應(yīng)用于疾病預測[12-13]。有研究報道,機器學習算法在AKI預測方面性能優(yōu)于傳統(tǒng)回歸模型[14-18]。但現(xiàn)有的將機器算法應(yīng)用于PO-AKI預測領(lǐng)域主要局限于心臟手術(shù),尚缺乏全手術(shù)類型PO-AKI的風險預測模型。本研究基于機器學習算法,構(gòu)建預測全手術(shù)類型PO-AKI的風險預測模型,并探討模型效能,同時建立PO-AKI網(wǎng)頁預測模型,以期早期識別高危患者,為優(yōu)化圍術(shù)期患者管理路徑提供參考?,F(xiàn)報道如下。
1.1 數(shù)據(jù)來源 本研究數(shù)據(jù)來源于國內(nèi)3家不同區(qū)域大型綜合醫(yī)院開發(fā)的多中心數(shù)據(jù)庫。本研究通過3家醫(yī)院倫理委員會批準,包括陸軍軍醫(yī)大學附屬西南醫(yī)院(2014年1月至2019年6月,倫理審查批件號:KY201936)、四川大學附屬華西醫(yī)院(2019年5月至2020年1月,倫理審查批件號:2021-349)、中山大學附屬第一醫(yī)院(2019年6月至2019年12月,倫理審查批件號:2019-385)。
1.2 納入與排除標準 納入標準:年齡≥18歲;住院手術(shù)。排除標準:術(shù)前腎小球濾過率(glomerular filtration rate,GFR)輕度以上降低[定義為eGFR≤60 ml/(min·1.73 m2)];手術(shù)次數(shù)≥2次;住院期間死亡;接受腎移植受體手術(shù);接受局部麻醉或監(jiān)護麻醉;術(shù)前或術(shù)后7 d內(nèi)血肌酐檢驗值缺失;重要病歷資料缺失>30%。按照納入、排除標準,共篩選出635例AKI患者納入PO-AKI組。采用病例對照研究設(shè)計方案,按陽性∶陰性=1∶3比例傾向匹配同期手術(shù)后未發(fā)生AKI的1905例患者納入非PO-AKI組。
1.3 數(shù)據(jù)收集 收集手術(shù)患者常見臨床指標。一般資料包括年齡、性別、體質(zhì)量指數(shù)(body mass index,BMI);既往史包括術(shù)前腎功能史、吸煙史、飲酒史、過敏史、輸血史、高血壓史、糖尿病史、心臟病史;手術(shù)相關(guān)信息包括麻醉方式、手術(shù)類型、手術(shù)時長和急診情況。實驗室檢驗包括白細胞計數(shù)、紅細胞計數(shù)、血小板計數(shù)、血紅蛋白、紅細胞比容、淋巴細胞計數(shù)、國際標準化比值、活化部分凝血活酶時間、凝血酶時間、白蛋白、谷丙轉(zhuǎn)氨酶、谷草轉(zhuǎn)氨酶、堿性磷酸酶、總蛋白、白球比值、總膽紅素、血肌酐、血尿素、血尿酸、血糖、鉀離子、鈉離子。
1.4 數(shù)據(jù)預處理 采用多重插補方法對缺失率<30%的指標進行填補。對于連續(xù)性變量,用range函數(shù)縮放,處理后的數(shù)據(jù)取值0~1,以消除指標之間不同量綱的影響。對于分類變量,行One-Hot編碼,使用N位狀態(tài)寄存器對N個狀態(tài)進行編碼,每個狀態(tài)均有獨立的寄存器位,使之更符合機器學習計算過程,以提高計算效率。數(shù)據(jù)處理后,各指標處于同一數(shù)量級。將納入統(tǒng)計的數(shù)據(jù)按7∶3的比例隨機拆分為建模組(n=1 778)和驗證組(n=762)。建模組中,采用Smote采樣改善數(shù)據(jù)不平衡情況,使用LASSO方法進行特征選擇,以篩選獨立且有效的危險因素,從而確定預測指標。
1.5 模型開發(fā) 在建模組中,輸入預測指標,使用R軟件‘caret’包中包含的6種代表性模型算法進行模型訓練,模型算法分別為梯度提升模型(gradient boosting model,GBM)、廣義線性模型(generalize linear model,GLM)、K-近鄰(K-nearest neighbor,KNN)、樸素貝葉斯(naive bayes,NB)、神經(jīng)網(wǎng)絡(luò)(neural network,NNET)、支持向量機(support vector machine linear,SVM)。每種模型在建立時均使用了10折交叉驗證并迭代了5次,以增強模型性能。機器學習數(shù)據(jù)預處理、模型開發(fā)、驗證由R軟件(4.3.0版本)完成。
1.6 模型評估 在驗證組中,采用受試者工作特征曲線下面積(area under the receiver operating characteristic curve,AUC)、敏感度、特異度、準確度和F1分數(shù)(精確率和召回率的一種加權(quán)平均)評估各模型的預測效能。
1.7 模型網(wǎng)頁建立 通過對多個模型的綜合評估,確定適合PO-AKI的最佳預測模型,并使用Python軟件的‘shinydashboard’包將模型映射到網(wǎng)頁,通過輸入患者預測指標信息即可出現(xiàn)患PO-AKI的風險概率,從而量化結(jié)果風險。
2.1 兩組患者一般資料比較 兩組患者年齡、性別、吸煙史、飲酒史、過敏史、輸血史、高血壓史、糖尿病史、心臟病史、麻醉方式、手術(shù)類型、手術(shù)時長、紅細胞計數(shù)、血小板計數(shù)、血紅蛋白、紅細胞比容、淋巴細胞計數(shù)、活化部分凝血活酶時間、血清白蛋白、谷丙轉(zhuǎn)氨酶、谷草轉(zhuǎn)氨酶、堿性磷酸酶、總蛋白、白球比值、血肌酐、血糖、鈉離子比較,差異有統(tǒng)計學意義(P<0.05)。見表1。
表1 兩組患者一般資料比較/例(百分率/%)
2.2 特征變量篩選結(jié)果 使用LASSO回歸分析選取特征系數(shù)在一個方差范圍內(nèi)仍不為0的變量,最終有意義的變量如下。(1)一般信息:年齡、BMI;(2)既往史:慢性腎病1期、吸煙史、飲酒史、輸血史、過敏史、糖尿病史、心臟病史;(3)手術(shù)相關(guān)指標:急診、手術(shù)類型、手術(shù)時長;(4)實驗室檢驗:白細胞計數(shù)、紅細胞計數(shù)、血小板計數(shù)、淋巴細胞計數(shù)、國際標準化比值、活化部分凝血活酶時間、凝血酶時間、谷草轉(zhuǎn)氨酶、堿性磷酸酶、總蛋白、白球比值、總膽紅素、血肌酐、血尿素、血尿酸、血糖、鉀離子、鈉離子、紅細胞比容。見表2。
表2 LASSO特征選擇結(jié)果及系數(shù)
2.3 模型預測性能及驗證結(jié)果 基于NNET算法開發(fā)的模型在驗證組獲得了最佳的鑒別能力(AUC為0.942,95%可信區(qū)間0.926~0.958)和最佳的F1分數(shù)(0.759)。模型綜合性能比較見表3。6種機器學習算法模型在驗證組的受試者工作特征曲線見圖1。
圖1 6種機器學習模型在驗證組的受試者工作特征曲線圖
表3 機器學習預測模型綜合性能比較
2.4 網(wǎng)頁模型建立 基于NNET算法開發(fā)的預測模型被映射到網(wǎng)頁(https://lh123.shinyapps.io/nnet1poaki/),在預測網(wǎng)頁界面輸入患者術(shù)中特征信息后,點擊預測即可出現(xiàn)該患者發(fā)生PO-AKI的概率。見圖2。
圖2 基于NNET模型的PO-AKI預測網(wǎng)頁
PO-AKI是常見的圍術(shù)期并發(fā)癥,此類患者住院時間更長,醫(yī)療費用更高,且更可能進展成為慢性腎病。有研究報道,輕微的PO-AKI與患者的存活率降低有關(guān)[19]。PO-AKI病理生理機制復雜,目前尚未完全清楚,已知低灌注、缺血再灌注損傷、神經(jīng)激素激活、炎癥、腎毒素暴露可能與PO-AKI有關(guān)[20]。機器學習算法在醫(yī)學影像、疾病的分類和預測、藥物反應(yīng)和治療策略等方面被廣泛應(yīng)用[21]。
有研究表明,結(jié)合機器學習可以實現(xiàn)早期預測AKI[5]。機器學習算法已經(jīng)應(yīng)用于ICU患者[22]、住院患者[23]、燒傷患者[24-25]、肝腎綜合征患者[26]、行冠脈造影術(shù)患者[27]后等人群AKI風險預測,但仍缺乏全手術(shù)類型PO-AKI方面的研究。
本研究基于已發(fā)表的國內(nèi)外文獻,篩選出研究相關(guān)的指標,再經(jīng)過LASSO方法進行特征選擇并且進行交叉驗證,結(jié)果發(fā)現(xiàn),年齡、BMI、吸煙史、飲酒史、過敏史、輸血史、糖尿病史、心臟病史、慢性腎病1期、手術(shù)時長、急診手術(shù)、手術(shù)類型、白細胞計數(shù)、紅細胞計數(shù)、血小板計數(shù)、紅細胞比容、國際標準化比值、活化部分凝血活酶時間、凝血酶時間、谷草轉(zhuǎn)氨酶、堿性磷酸酶、總蛋白、白球比值、總膽紅素、血肌酐、血尿素、血尿酸、血糖、鉀離子、鈉離子可能與PO-AKI的發(fā)生有關(guān)。其中,血肌酐水平是PO-AKI的診斷指標,也是AKI程度的分期標準,可用于指導AKI治療[28]。多項研究表明,年齡、BMI、手術(shù)時長、急診是AKI的獨立危險因素[29-31]。有研究表明,糖尿病、基線eGFR是PO-AKI的危險因素[30]。吸煙史、心臟病史、紅細胞計數(shù)、血尿酸與AKI的關(guān)系也有相關(guān)研究闡明[31-33]。
本研究基于GBM、GLM、KNN、NB、NNET及SVM算法構(gòu)建了住院手術(shù)PO-AKI的風險預測模型,并比較了這6種模型的預測效能。目前,這6種算法是應(yīng)用較為廣泛的集成學習算法。GBM能精確地找到分割點,但數(shù)據(jù)對計算機空間的消耗大;GLM可解釋性較強,但當某些特征相關(guān)性較強時,其他特征的重要性將被削弱;KNN理論簡單,新數(shù)據(jù)可以直接加入數(shù)據(jù)集而不必進行重新訓練,但在樣本不平衡時,預測偏差較大;NB在處理大規(guī)模的訓練集時能有效選出相對較少的特征數(shù),但在樣本屬性有關(guān)聯(lián)時其效果較差;NNET分類準確度高,學習能力極強,但在學習過程中無法觀察中間結(jié)果,存在黑盒效應(yīng);SVM在處理非線性、小樣本及二分類數(shù)據(jù)時有優(yōu)勢,但是對缺失數(shù)據(jù)敏感且在大規(guī)模樣本中難以實施[21,34-35]。本研究中,KNN模型AUC為0.793,敏感度為74.2%,特異度為70.6%,F1分數(shù)為0.565,準確度為71.5%,在6種模型中預測效能最差;而NNET模型AUC為0.942,敏感度為85.3%,特異度為86.9%,F1分數(shù)為0.759,準確度為86.5%,該模型區(qū)分度好。本研究存在局限性:首先,數(shù)據(jù)集雖然來自3家國內(nèi)大型綜合醫(yī)院,但均為回顧性信息;其次,本研究使用了31個特征指標構(gòu)建模型和預測網(wǎng)頁,應(yīng)用于臨床時不夠簡便;最后,由于病例資料丟失,未納入美國麻醉醫(yī)師協(xié)會分級、術(shù)中尿量、手術(shù)失血量、術(shù)中血壓等特征。因此,后續(xù)應(yīng)開展前瞻性、篩選指標數(shù)量精簡且納入更多術(shù)中相關(guān)特征的研究。
綜上所述,本研究采用AKI最新定義(KDIGO標準)基于多個機器學習算法用多中心數(shù)據(jù)開發(fā)PO-AKI預測模型,綜合比較了各模型的預測性能和臨床實用性,最終篩選出了基于NNET算法開發(fā)的最佳預測模型,搭建預測網(wǎng)頁,以量化PO-AKI風險,對手術(shù)患者進行早期風險分層,為指導圍術(shù)期AKI評估和預防性治療提供可能。