王定坤 楊杉
摘要:文章用Cox比例風險模型對心力衰竭的影響因素進行了數據分析,研究結論顯示,影響心力衰竭的主要因素是年齡、射血分數、高血壓情況、血清肌酐濃度。根據模型我們可以幫助醫(yī)療專業(yè)人員了解患者存在的潛在風險,以便專業(yè)人員能夠更早地采取行動。
關鍵詞:Cox比例風險模型;Schoenfeld殘差分析;心力衰竭影響因素
心力衰竭是指人體心臟的收縮功能的減退以及舒張功能受阻,不能很好地將靜脈回心血量排到心臟外,造成靜脈系統(tǒng)血液堆積,動脈系統(tǒng)血液不夠,從而引起肺瘀血、腔靜脈瘀血等疾病。心力衰竭是心臟方面的疾病,并且發(fā)病大多是從左心衰竭開始的。隨著時間的推移,心臟逐漸不能提供全身的供血進而引起下半身腫脹、心跳加快或不規(guī)則、突然嚴重的呼吸急促和咳嗽等癥狀。心力衰竭已成為全球的最大死因,我國心衰患病率估計已達1.3%,保守估計至少有1000萬人患有心力衰竭,特別是老年人占據大部分比例。如今中國已成為全球擁有最多心衰患者群的國家之一。本研究將死亡事件設置為結局,探究可能引起病人死亡的主要因素,由于每一個研究對象都有其各自的生存時間(從隨訪開始的時間一直到死亡、失訪或隨訪結束的時間),由于這一特性所以選用Cox比例風險模型(Cox proportional-hazards model,也稱為Cox回歸)進行分析處理。數據由13個變量組成,對此13個變量進行Cox生存分析以評估影響患者死亡最大因素進而盡最大的可能提升患者的生存幾率。
1 相關知識
1.1 Cox回歸原理分析
Cox回歸模型又被人們稱為比例風險回歸模型。由于生存時間與生存結果作為該回歸模型的因變量,并且多個變量也可被同時分析進而分析出對生存期的影響。因為該模型上述的特性,自從模型被研發(fā)以來,大量運用在了醫(yī)學分析領域。并且該模型能分析帶有截尾生存時間的資料,且不要求估計資料的生存分布類型。由于其上述顯著的優(yōu)勢,該模型已被大量的學者所使用。
2 模型建立及實例分析
2.1數據集簡介
本數據集為從R公司檢索到的心力衰竭預測數據集。該數據集由13個變量組成分別描述了患者的基本狀況。年齡:用于描述患者患病年齡的定量數據、是否貧血(1/0):為一個二進制變量、肌酐磷酸激酶、是否患有糖尿?。?/0):為一個二進制變量、射血分數百分數:用于顯示每次收縮時離開心臟的血液百分比、是否高血壓(1/0)、血小板:發(fā)揮的主要作用,是生理性止血以及維持血管內皮完整性。血清肌酐:一種定量數據,用于描述腎臟功能的好壞、血清鈉:一種定量變量,顯示患者血液中的血清鈉水平,以mmol/L為單位、性別男性1女性0、是否吸煙(1/0):為一個二進制變量、到訪時間:一個定量數據顯示患者死亡前幾天的到訪時間、是否死亡(1/0):為一個二進制變量。
2.2模型構建
本次研究方法使用的軟件為IBM SPSS Statistics 26統(tǒng)計分析軟件,在進行Cox回歸分析之前,先利用單變量分析的方法例如KM法繪制生存曲線或者Logrank檢驗等方法檢測所有因變量與自變量之間存在的關系,篩選掉一些可能不存在實際意義的變量,之后再通過多因素分析的方法,以保證其結果更加精確可靠。納入的變量主要包括單因素分析差異有統(tǒng)計學意義的變量,為避免漏掉一些重要因素,作為探索性分析,此時將P值小于0.1,均作為具備統(tǒng)計學差異。在進行單因素分析時,并沒有發(fā)現(xiàn)差異有統(tǒng)計學意義,但是在實驗中認為與因變量關系密切的自變量。
在創(chuàng)建Cox回歸分析時,我們將時間選取為到訪時間,狀態(tài)選取為是否死亡,協(xié)變量選取為是否貧血、肌酐磷酸激酶、是否患有糖尿病、射血分數百分數、是否高血壓、血小板、血清肌酐、性別、是否吸煙,對于變量的篩選選取的方法為最大似然估計的向前逐步回歸法(Forward LR)。
最終得到的模型如表1所示:
由表1可發(fā)現(xiàn),血清肌酐、年齡、射血分數(百分數)、高血壓的回歸系數均為0,其次Score統(tǒng)計量為77.352, P<0.01;對數似然比檢驗x2=70.522, P<0.01,由以上數據可說明模型中至少有一個自變量的HR值不為1,模型整體檢驗有統(tǒng)計學意義,而且隨著變量的加入,-2log likelihood的值逐漸變小,說明引入新的自變量后模型效果更加優(yōu)秀,新納入的變量是有效的。
2.3 數據分析
由表2的數據可得出參數估計的結果,從表格中可看出通過最后篩選后的模型僅包含通過變量篩選最終納入模型的變量存在4個,包括年齡/射血分數/高血壓情況/血清肌酐濃度。表達式為h(t)=h0(t)exp(0.044*年齡+(-0.049)*射血分數(百分數)+0.466*高血壓+0.338*血清肌酐)。
1)其中由年齡P<0.001,具有統(tǒng)計學意義,相對危險度HR=Exp(B)=1.045,95%可信區(qū)間為(1.027,1.064),說明年齡為影響患者生存的獨立危險因素?;颊呙吭黾右粴q,引起將來死亡風險為原來的1.045倍。
2)射血分數:P<0.001,具有統(tǒng)計學意義,相對危險度HR=Exp(B)=0.952, 95%可信區(qū)間為(0.933,0.971),說明射血分數值為影響患者生存的獨立保護因素?;颊呱溲謹得吭黾右粋€單位,引起將來死亡風險為原來的0.952倍。
3)高血壓情況:P=0.027,具有統(tǒng)計學差異,相對危險度HR=Exp(B)=1.594, 95%可信區(qū)間為(1.053,2.414),說明高血壓為影響患者生存的獨立危險因素?;颊呋加懈哐獕阂饘硭劳鲲L險為不患有高血壓的1.594倍。
4)血清肌酐濃度:P<0.001,具有統(tǒng)計學意義,相對危險度HR=Exp(B)=1.402, 95%可信區(qū)間為(1.231,1.596),說明血清肌酐濃度值為影響患者生存的獨立危險因素?;颊哐寮◆吭黾右粋€單位,引起將來死亡風險為原來的1.402倍。
為更好地解釋危險因素風險,將連續(xù)變量年齡按照四分位數進行四等分轉化為等級資料,其結果如下:
其余變量解釋如前,將年齡四分位之后,其解釋如下,年齡每增加一個等級,其發(fā)病風險為原有的1.401倍。
2.4 模型驗證
而在實際的生存分析過程中,一些自變量對風險函數的影響會發(fā)生改變,而Cox回歸模型在應用之前的前提為進行比例風險假定,該比例風險假定也被稱為PH假定,只有當PH假定條件成立時,
Cox回歸模型的結果有意義??紤]到年齡和死亡發(fā)生事件一般不呈線性關系,即對此假設進行假設檢驗。采用的方法為Schoenfeld殘差法進行檢驗。
由圖1可知,年齡與死亡發(fā)生存在正相關性,即隨著年齡的增大,死亡發(fā)生的風險也在增大。即不滿足該PH假定:年齡與死亡發(fā)生事件無關。即采用Cox時間依存協(xié)變量進行分段Cox回歸分析。
由圖易得實驗結果與前方實驗結果一致,得出結論時間協(xié)變量并無意義。
3 結語
對于患有心血管疾病或者有患心血管疾病隱患的病人,我們應該采取的手段是早發(fā)現(xiàn)早治療。通過我們的模型,我們可以分析出例如患者每增加一歲,引起將來死亡風險為原來的1.045倍?;颊呋加懈哐獕阂饘硭劳鲲L險為不患有高血壓的1.594倍。
患者血清肌酐每增加一個單位,引起將來死亡風險為原來的1.402倍。從我們的模型中可以發(fā)現(xiàn)對于年齡較大,有高血壓且血清肌酐較大的患者,我們更應該重點關注其患者的各項體征進而最大限度地提高患者的生存機率。因此,我們模型的最終目的是幫助醫(yī)療專業(yè)人員了解患者存在的潛在風險,以便專業(yè)人員能夠更早地采取行動。畢竟對于預測一個疾病的發(fā)生再采取行動總比當疾病發(fā)生了再去阻止更加有效。
參考文獻:
[1] 張旭.基于COX比例風險模型的高職單招生行為影響因素與管理對策分析[J].無線互聯(lián)科技,2020,17(19):86-87,92.
【通聯(lián)編輯:唐一東】