• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于現(xiàn)實世界研究中臨床隨訪數(shù)據(jù)的兩種動態(tài)預(yù)測建模方法的實證研究

      2021-11-15 07:58:00尤東方黃麗紅魏朝暉
      中國臨床醫(yī)學 2021年5期
      關(guān)鍵詞:界標動態(tài)建模

      楊 鋒, 陳 欣, 尤東方, 黃麗紅, 魏朝暉, 趙 楊,6*

      1. 南京醫(yī)科大學公共衛(wèi)生學院生物統(tǒng)計學系,南京 211166 2. 嘉興泰格數(shù)據(jù)管理有限公司,嘉興 314000 3. 南京醫(yī)科大學醫(yī)學大數(shù)據(jù)中心,南京 210000 4. 復(fù)旦大學附屬中山醫(yī)院生物統(tǒng)計室,上海 200032 5. 杭州泰格醫(yī)藥科技股份有限公司,杭州 310000 6. CSCO生物統(tǒng)計學專家委員會RWE項目組

      現(xiàn)實世界研究(real-world study, RWS)中一種常見的研究方式是回顧性隊列研究。近年來,隨著電子信息化系統(tǒng)的不斷完善及大型專病隊列的不斷建立,這類研究開展得越來越廣泛?;颊甙凑找欢ǖ臅r間間隔接受診療,從而產(chǎn)生了臨床隨訪數(shù)據(jù)。例如,重癥肺炎患者在ICU住院期間,每天都會進行若干次實驗室檢查,總計可達十余次;腫瘤患者術(shù)后,遵醫(yī)囑定期隨訪,每次也會獲得腫瘤標志物以及影像學檢查的結(jié)果。再以健康體檢為例,體檢者每年在相對固定的時間前往體檢中心,采血后對血常規(guī)、血生化及腫瘤標志物等實驗室指標進行測量,若受試者十余年來在同一體檢中心,則可積累十余次檢驗結(jié)果等。

      除了采用生存分析分析結(jié)局事件的影響因素外,這類隨訪數(shù)據(jù)可用于建立臨床預(yù)測模型。所謂臨床預(yù)測模型,是指以年齡、性別及生物標志物等預(yù)測因素為條件,對某個體的疾病風險或某結(jié)局事件發(fā)生的可能性進行估計[1]。一般而言,臨床預(yù)測模型的建立需要通過變量篩選、模型建立、模型驗證、校準和模型表達等階段。例如,Hu等[2]報道了血漿微小RNA表達譜與非小細胞肺癌(non-small cell lung cancer, NSCLC)患者生存期的關(guān)系,首先將30例長生存期及30例短生存期NSCLC患者作為發(fā)現(xiàn)階段樣本,最終篩選出了4個差異表達的微小RNA。第二階段,選擇120例NSCLC受試者作為訓練集,利用發(fā)現(xiàn)階段選出的位點,基于Cox比例風險模型,最終建立的危險度得分模型能較好地區(qū)分長生存期和短生存期NSCLC患者。這種基于隨訪開始時的特征建立模型,對未來一段時間內(nèi)的結(jié)局事件進行預(yù)測,稱為靜態(tài)預(yù)測。

      近年來,醫(yī)學工作者越來越關(guān)心,如何充分利用疾病發(fā)生發(fā)展過程中具有預(yù)測價值的指標的動態(tài)變化,尤其是專病隊列、醫(yī)療大數(shù)據(jù)中不斷累積的隨訪數(shù)據(jù),來對被觀察個體在未來某個時間段內(nèi)是否發(fā)生感興趣的終點事件進行預(yù)測。例如,Kurtz等[3]利用腫瘤標志物的序貫變化來預(yù)測乳腺癌預(yù)后。He等[4]利用血小板相關(guān)實驗室指標的動態(tài)變化軌跡預(yù)測重癥肺炎患者預(yù)后。同時,臨床醫(yī)生常關(guān)注給定條件下觀察對象發(fā)生某種事件的概率。例如,若某腫瘤患者術(shù)后已存活3年,他再存活5年的概率有多大?即所謂的動態(tài)風險預(yù)測。

      本研究將介紹如何通過界標法和聯(lián)合建模法,利用縱向歷史數(shù)據(jù)對未來結(jié)局進行動態(tài)預(yù)測,并以現(xiàn)實案例數(shù)據(jù)動態(tài)預(yù)測患者死亡風險的實證研究來探討2種方法的實際應(yīng)用價值。

      1 資料與方法

      1.1 案例數(shù)據(jù)來源 案例數(shù)據(jù)來源于Yan等[5]于2020年1月10日至2月18日,在某醫(yī)院收集的375例某型肺炎患者的社會人口學信息及住院期間多次實驗室測量指標。375例患者中,包括197例普通患者、27例重癥患者和151例危重患者,其中男性占59.7%,患者平均年齡為58.83歲。375例患者中位隨訪時間為11 d,最長隨訪時間為35 d,最終201例(53.6%)患者存活。因部分患者數(shù)據(jù)缺失,最終分析使用了358例患者的數(shù)據(jù)。本研究所用數(shù)據(jù)可從https://www.nature.com/articles/s42256-020-0180-7#MOESM3下載。

      Yan等[5]采用XGBoost機器學習算法,利用最后一次患者實驗室指標測量值,從數(shù)十個實驗室指標中,篩選了乳酸脫氫酶(LDH)、淋巴細胞百分比和高敏C-反應(yīng)蛋白(hs-CRP)3個與預(yù)后密切相關(guān)的指標,建立預(yù)測模型。因此,本研究直接采用文獻[5]篩選所得的3個指標進行建模分析,分別使用界標法和聯(lián)合建模法預(yù)測患者條件生存概率,界標時間點分別為第5天、第10天和第15天。

      1.2 基于界標法的動態(tài)預(yù)測 對于動態(tài)預(yù)測,一種典型的方法是由van Houwelingen等[6]提出的界標法。在使用界標法時,需首先將整個時間尺度,按照若干個界標時間點,劃分為若干個時間段。界標點的選擇可以按照醫(yī)學知識來確定,例如腫瘤術(shù)后1年、3年、5年等。令i代表個體,j代表訪視,對于某個界標時間點k,對此時仍處于觀察中的個體(即在上一個時間段沒有發(fā)生死亡這一結(jié)局事件,也未刪失),利用截止到時間點k的縱向數(shù)據(jù)以及基線特征信息, 擬合Cox比例風險模型為hik(t)=hk,0(t)exp(γ1Xi+γkYik)。

      模型中,納入預(yù)測因子Y位于界標點k的變量值Yk,也可直接將k之前的Y以時依協(xié)變量的形式納入,X表示基線協(xié)變量。基于所建立Cox模型,可對于在k時刻尚處于觀察中的個體i,對在界標點k后一段時間內(nèi)(k,t)的條件生存率進行估計,即πi(t|k)=P(Ti*≥t|Ti*>k,Yi(k),X),其中,t>k。

      1.3 基于聯(lián)合建模的動態(tài)預(yù)測 聯(lián)合建模充分利用整個隨訪過程中的數(shù)據(jù)[7],其基本特征是縱向重復(fù)測量和生存數(shù)據(jù)同時建模。聯(lián)合模型一般可分解為2個子模型,最常見的是將縱向測量值的混合效應(yīng)模型和生存結(jié)局的Cox比例風險模型通過共享(shared)隨機效應(yīng)進行連接:

      (1)Yij(t)=Y*i(t)+εij=βXij+BiWij+εij

      (2)hi(t|Ki,Y*i(t))=h0(t)exp(γ1Ki+γ2Y*i(t))

      以LDH為例,(1)式首先建立了一個描述了整個隨訪過程中受試者i的LDH隨時間變化,同時受其他因素影響的混合效應(yīng)模型。其中,β為固定效應(yīng),體現(xiàn)了具有不同特征(X)的人之間在LDH上的平均差異;Bi為隨機效應(yīng),服從于均數(shù)為0的正態(tài)分布,體現(xiàn)了因素Wij(可以是時間或者其他因素)對LDH的影響在人與人之間存在不同。另外,混合效應(yīng)模型中也包括了隨機誤差ε。基于模型(1),可將每個時間點上的Y*重新預(yù)測出來,再以預(yù)測出的預(yù)測因子Y*及其他變量,擬合(2)式中時依Cox比例風險模型,對某個界標時間之后一段時間內(nèi)的死亡概率或累積生存率進行估計。聯(lián)合建模的參數(shù)估計可采用限制性極大似然法完成(restricted maximum likelihood method, REML)。

      本研究案例數(shù)據(jù)分析研究中首先利用混合效應(yīng)模型,在調(diào)整了年齡和性別影響后,擬合LDH、hs-CRP和淋巴細胞百分比3個預(yù)測因子的時間變化估計,然后將其與Cox模型聯(lián)合,利用聯(lián)合模型分別估計患者第5天、第10天和第15天后的條件生存概率。

      1.4 分析步驟 統(tǒng)計分析使用R軟件完成,并需要安裝survival、survivalROC、survminer、JMbayes等幾個R軟件包。界標法和聯(lián)合建模法的分析步驟見圖1。

      圖1 2種動態(tài)建模方法的分析步驟

      1.4.1 界標法動態(tài)預(yù)測分析步驟 (1)首先整理數(shù)據(jù),按照隨訪次數(shù)將某一個觀察對象的記錄轉(zhuǎn)換為若干行;(2)當選擇界標時間為第5天時,只需要選擇在該時間點仍然存活患者的第5天及以前的數(shù)據(jù)進行分析,擬合Cox回歸,其他界標時間對應(yīng)的分析以此類推;(3)估計時間依賴的AUC。

      1.4.2 聯(lián)合建模法動態(tài)預(yù)測分析步驟 (1)整理數(shù)據(jù);(2)先分別建立LDH、hS-CRP和Lymphocyte與時間的混合效應(yīng)模型,并納入年齡、性別等基線因素,其中時間為隨機效應(yīng),嵌套于個體中;(3)建立Cox比例風險模型;(4)使用JMBayes提供的函數(shù),進行聯(lián)合建模;(5)進行模型預(yù)測。

      2 結(jié) 果

      2.1 案例數(shù)據(jù)特征分析 對上述某型肺炎預(yù)后數(shù)據(jù)進行分析發(fā)現(xiàn):(1)在分析數(shù)據(jù)集包含的358例患者中,共計163例(45.53%)出現(xiàn)了死亡這一結(jié)局事件,剩余195例(54.47%)未死亡;(2)死亡患者中,中位死亡時間為6 d,而未死亡患者中,中位觀察時間為14 d;(3)患者最多進行了13次觀察,平均觀察次數(shù)為5次。

      2.2 預(yù)后動態(tài)預(yù)測效果對比 2種方法所建立模型的受試者工作特征曲線下面積(AUC)表明,當界標點取第5天、第10天、第15天時,界標法對某肺炎患者未來死亡風險的預(yù)測精度略好于聯(lián)合建模法(表1)。

      表1 界標法和聯(lián)合建模法的預(yù)測結(jié)果對比

      動態(tài)預(yù)測可對每個個體在各個界標時間預(yù)測其未來某時間點發(fā)生結(jié)局事件的概率。以患者a(第5天死亡)、患者b(第10天死亡)和患者c(存活)為例,分別在患者a第1天、第5天,患者b的第1天、第5天和第9天及患者c的第1天、第6天和第10天預(yù)測其未來生存概率。橫軸表示患者隨訪時間,縱軸為患者的預(yù)測生存概率,藍色虛線和黃色點劃線分別為聯(lián)合建模法和界標法的預(yù)測結(jié)果(圖2)?;颊遖的死亡風險一直較高(圖2);患者b在存活10 d后死亡風險增加(圖2),表現(xiàn)為生存概率的明顯下壓;而患者c的死亡風險一直較小。

      3 討 論

      隨著國家對臨床專病隊列投入的不斷增加及電子病歷系統(tǒng)的廣泛應(yīng)用,采用回顧性隊列研究形式的現(xiàn)實世界數(shù)據(jù)不斷產(chǎn)生。如何基于這類縱向數(shù)據(jù),對疾病結(jié)局進行預(yù)測成為研究者所關(guān)注的問題。傳統(tǒng)的預(yù)測模型往往基于基線的生物學標志物和環(huán)境因素,對未來結(jié)局發(fā)生的可能性進行預(yù)測。近年來,研究者開始關(guān)注如何使用動態(tài)變化的歷史數(shù)據(jù)進行預(yù)測。基于不斷變化的數(shù)據(jù),理論上應(yīng)當比只使用基線的數(shù)據(jù)更為準確[8]。同時,動態(tài)預(yù)測模型可回答醫(yī)學工作者在臨床實踐中經(jīng)常提出的問題,例如,若受觀察對象已暴露于空氣污染10年,他在未來10年發(fā)生心血管疾病的風險有多高?以“dynamic risk prediction”、“dynamic risk model”或“dynamic risk assessment”為關(guān)鍵詞在Pubmed進行搜索,自2001年以來共有25 000余篇,而2015年之后就有約15 000篇。不難想象,隨著大量基于電子病歷的現(xiàn)實世界研究和大型隊列研究的進一步開展和數(shù)據(jù)共享機制的不斷完善,動態(tài)預(yù)測模型也將得到越來越廣泛的應(yīng)用。

      隨著個體化醫(yī)療的發(fā)展,為臨床醫(yī)生提供有效、有力的工具來動態(tài)估計個體一定時間內(nèi)的生存概率,有助于為患者規(guī)劃特定的最佳治療時間和治療策略。本研究對界標法和聯(lián)合建模法進行了實證研究,這兩種動態(tài)預(yù)測法均可較為便利地用于縱向?qū)嶒炇抑笜说念A(yù)測建模。兩者的主要區(qū)別在于對界標點前的數(shù)據(jù)利用方式不一樣。界標模型只將在界標時間點仍然存活的研究對象以及該時間點之前的變量測量信息(包括該時間點)納入分析。聯(lián)合建模法則主要是通過擬合預(yù)測因子的縱向變化軌跡,利用隨機效應(yīng)將其與生存模型連接起來。

      對于界標法,模型中既可納入預(yù)測因子位于界標點的變量值,也可直接將界標點之前的變量值以時依協(xié)變量的形式納入。也有學者提出,可直接將界標時間點之前所測量的預(yù)測因子采用某種方式整合成一個值。整合的方式有多種,最簡單一種是選擇最接近界標時間點的測量值。也可以先擬合一個在界標點之前預(yù)測因子隨時間變化的模型,預(yù)測該預(yù)測因子在界標時間點的取值。另外,也可借助于軌跡分析的思路[9],將患者界標點前的縱向測量結(jié)果轉(zhuǎn)換為一條軌跡,再用軌跡代替原測量結(jié)果進行建模。

      聯(lián)合建模法可以用于隊列和臨床隨訪數(shù)據(jù)中存在測量誤差的情形。以腎功能不全患者的隨訪研究為例,利用肌酐等指標估計出的估計腎小球濾過率(eGFR)和利用同位素測量的GFR不一定恰好相等。這種測量誤差可能導致回歸“稀釋”偏倚,即因帶有測量誤差的自變量導致回歸系數(shù)向0偏倚[10]。聯(lián)合建模法利用混合效應(yīng)模型,借用其他測量信息,考慮測量誤差,對界標點的暴露變量進行預(yù)測,在一定程度上校正了這種偏倚。此外,基于聯(lián)合建模的動態(tài)預(yù)測模型可以與機器學習方法緊密結(jié)合,獲得更為豐富的結(jié)論與精確的結(jié)果。例如,Chen等[11]基于近2 000例的新型冠狀病毒肺炎患者的預(yù)后數(shù)據(jù),首先使用機器學習方法篩選了11個生物學標志物,利用聯(lián)合建模,在訓練集和2個驗證集中分別獲得了98.3%、96.5%和98.4%的AUC。此外,聯(lián)合建模法也可與軌跡分析、平滑模型等方式結(jié)合,獲得更為靈活的結(jié)果。

      基于臨床隨訪數(shù)據(jù)建立預(yù)測模型時,不管是界標法還是聯(lián)合建模法,都有“變量篩選”的過程,即基于統(tǒng)計學方法或?qū)I(yè)知識,選擇具有預(yù)測價值的指標進入預(yù)測模型。有部分學者認為,預(yù)測模型所納入的預(yù)測因子,應(yīng)當是與結(jié)局存在因果關(guān)系的因子。但本研究認為,尋找“因果關(guān)系”的危險因素研究,與建立“預(yù)測模型”的預(yù)測研究,具有不同的“因果”含義。對于前者,應(yīng)當盡可能排除已知和未知混雜干擾,并通過一系列敏感性分析展示結(jié)果的穩(wěn)健性。而對于后者,只要變量具有預(yù)測價值,哪怕其與結(jié)局間不是因果關(guān)系,也可以被納入預(yù)測模型[12]。例如,攜帶打火機與肺癌是否發(fā)生并沒有因果關(guān)系,但知道某人習慣性攜帶打火機,卻可以預(yù)測其發(fā)生肺癌的可能性較大。

      變量篩選和模型驗證是臨床預(yù)測建模的重要步驟。本研究案例分析中,因篇幅所限,直接使用了原案例建模使用的3個變量,也未進行模型的驗證工作。但在實際臨床預(yù)測建模工作中,應(yīng)當將原樣本分成訓練集和測試集,通過訓練集完成變量篩選和建模工作,并將得到的模型在測試集中進行外部驗證;在樣本量有限時,也可考慮交叉驗證。動態(tài)建模中的變量選擇一般較單純基于基線變量的建模更為復(fù)雜,因為需要同時將變量的變化趨勢納入考慮,此時的解決方案包括時依Cox比例風險模型[13]、歷史回歸樹[14]等。在實際應(yīng)用中,研究人員可根據(jù)具體數(shù)據(jù)情況,篩選對結(jié)局有預(yù)測效能的變量,再選擇合適的方法,建立合理的模型,從而獲得準確和有效的估計。

      對于2種動態(tài)預(yù)測方法,R軟件都給出了相應(yīng)的程序包。實際上,若僅使用界標法,由于混合效應(yīng)模型和Cox比例風險模型是分開擬合的,故常規(guī)軟件(如SPSS、SAS等)均可使用,但聯(lián)合建模法則需一定的編程技巧方能實現(xiàn)。感興趣的讀者可以訪問作者網(wǎng)站(https://zyktz.coding.net/public/ketizudaima/Dynamic_risk_prediction/git/files),獲得分析代碼。

      綜上所述,界標法和聯(lián)合建模法都可用于現(xiàn)實世界研究的縱向數(shù)據(jù)分析,這2種動態(tài)預(yù)測法較傳統(tǒng)的僅基于基線變量的靜態(tài)預(yù)測法能獲得更為豐富的信息,值得推廣。

      利益沖突:所有作者聲明不存在利益沖突。

      猜你喜歡
      界標動態(tài)建模
      國內(nèi)動態(tài)
      國內(nèi)動態(tài)
      國內(nèi)動態(tài)
      聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
      動態(tài)
      基于PSS/E的風電場建模與動態(tài)分析
      電子制作(2018年17期)2018-09-28 01:56:44
      不對稱半橋變換器的建模與仿真
      英語介詞一詞多義的認知研究
      北方文學(2017年18期)2017-07-31 10:31:05
      英語介詞一詞多義的認知研究
      三元組輻射場的建模與仿真
      万年县| 花莲县| 凯里市| 汉阴县| 沂南县| 临夏市| 佳木斯市| 奉化市| 乐陵市| 哈密市| 磐安县| 阿合奇县| 通辽市| 平原县| 正安县| 尼玛县| 东乡族自治县| 东城区| 屏山县| 司法| 新田县| 乳山市| 屏南县| 南宫市| 三门峡市| 龙泉市| 梁河县| 昭平县| 翼城县| 松江区| 温州市| 南召县| 丰县| 安吉县| 吴江市| 巴南区| 万安县| 大埔区| 北海市| 南丹县| 建瓯市|