劉芳芳,包關水,2,閆夢俠
1.上海交通大學醫(yī)學院附屬第九人民醫(yī)院神經內科,上海 200011;2.上海交通大學醫(yī)學院臨床研究中心,上海 200025
頭痛是神經內科門診最常見的癥狀之一,90%的人一年內都會發(fā)生頭痛[1]。頭痛分為原發(fā)性頭痛和繼發(fā)性頭痛,原發(fā)性頭痛占神經內科門診頭痛的80%以上。據報道,我國原發(fā)性頭痛患病率已經高達23.8%[2]。由于龐大的人口基數(shù),據估計,中國可能是世界上頭痛人口最多的國家[3]。盡管大部分頭痛不會危害患者的生命,但對患者的生理、心理、家庭以及國民經濟都帶來了沉重的負擔[4-5]。
在原發(fā)性頭痛中,偏頭痛和緊張型頭痛的患病率位居前2位,其中偏頭痛為9.3%,緊張型頭痛為10.3%[2]。數(shù)據[6]顯示,偏頭痛的發(fā)作頻率和程度會大大影響患者的生活質量,嚴重者可致殘。偏頭痛包括無先兆偏頭痛和有先兆偏頭痛。無先兆偏頭痛是持續(xù)4~72 h的反復頭痛;典型表現(xiàn)為頭痛呈單側、搏動性,中重度日常體力活動可加劇,伴惡心/嘔吐、畏光/畏聲。而有先兆偏頭痛則是在頭痛發(fā)作之前逐漸出現(xiàn)單側可完全恢復的視覺、感覺或其他中樞神經系統(tǒng)癥狀。緊張型頭痛則是原發(fā)性頭痛最常見的類型:頭痛發(fā)作不頻繁,每次持續(xù)數(shù)分鐘至數(shù)日;典型表現(xiàn)為輕到中度雙側壓迫性或緊箍樣頭痛,不因日常體力活動而加重,常不伴隨惡心/嘔吐或畏光/畏聲。盡管典型的偏頭痛和緊張型頭痛具有很大差異,但大多數(shù)患者的癥狀并不典型,尤其是無先兆偏頭痛和緊張型頭痛,對兩者的鑒別經常存在困難。
目前國內外通行的頭痛診斷標準是國際頭痛疾患分類標準Ⅲ(international classification of headache disorder Ⅲ,ICHD Ⅲ)[7],但由于認識不足以及對頭痛的不重視,各級醫(yī)院的臨床醫(yī)師仍使用不規(guī)范的頭痛診斷標準和分類,如“血管性頭痛”“神經性頭痛”“血管神經性頭痛”等。因此,規(guī)范頭痛診斷標準,提高診斷準確率顯得尤為重要。
臨床決策模型或臨床預測模型是指利用多因素模型估算患有某種疾病的概率,是實現(xiàn)正確診斷、個體化精準治療的一種有效方式。目前對頭痛相關決策模型的研究,主要是基于ICHD及機器學習。如尹梓名等[8]提出的原發(fā)性頭痛輔助決策系統(tǒng),盡管在門診評估過程中取得了較好的敏感度和特異度,但對于非典型的頭痛患者,該系統(tǒng)可能無法正確判別。有學者[9-11]曾提出通過機器學習實現(xiàn)對原發(fā)性頭痛的自動診斷,但機器學習對于臨床醫(yī)師來說是個陌生的領域,其結果的可解釋性較差。臨床決策模型是促進醫(yī)學轉化的有效工具,近年來得到了廣泛的應用。列線圖是一種可視化的臨床決策模型。它將復雜的回歸方程,轉變成可視化的圖形,使模型的結果更具有可讀性,方便對患者進行評估。盡管國內外多位學者致力于頭痛決策模型的建立,但仍未開發(fā)出基于列線圖的原發(fā)性頭痛決策模型。為此,本研究通過問卷收集頭痛患者的臨床資料,建立基于列線圖的臨床決策模型,以提高原發(fā)性頭痛診斷的準確性。
回顧性收集2019年10月—2020年12月就診于上海交通大學醫(yī)學院附屬第九人民醫(yī)院神經內科門診的頭痛患者。納入標準:符合ICHD Ⅲ中偏頭痛和緊張型頭痛的診斷標準;年齡>18歲,性別不限;臨床資料完整。排除標準:有器質性病變的繼發(fā)性頭痛患者;嚴重焦慮、抑郁患者;有全身系統(tǒng)性疾病患者,如嚴重的肝腎疾病或嚴重感染。將2019年10月—2020年8月就診的偏頭痛或緊張型頭痛患者152例作為建模組,用于模型的建立,通過1 000次重復采樣的Bootstrap方法對模型進行內部驗證。將2020年9月—2020年12月就診的58例偏頭痛和緊張型頭痛患者作為驗證組,用于模型的外部驗證。所有患者均為中國居民。
采用自行設計的問卷,設置了19個問題,分別收集患者的人口學資料(年齡、性別、職業(yè)、身高、體質量)和頭痛的特征(病程、持續(xù)時間、性質、部位、嚴重程度、伴隨癥狀、誘因、緩解方式、活動是否加重)。
為了保證臨床醫(yī)師對ICHD Ⅲ掌握的一致性,減少主觀性偏倚,除首診醫(yī)師的診斷外,同時邀請了2位有經驗的神經內科醫(yī)師根據問卷做出診斷,三者一致時才被納入研究。因本研究只進行了二分類建模,針對多種頭痛合并存在的情況,主張患者進行頭痛日記的記錄,將發(fā)作最頻繁、對患者生活影響最大的頭痛類型作為該患者的診斷。
本研究獲得上海交通大學醫(yī)學院附屬第九人民醫(yī)院倫理委員會的批準(批件號:SH9H-2021-T72-1),并符合《赫爾辛基宣言》的要求。所有患者均簽署知情同意書。
由于患者頭痛的性質、伴隨癥狀較多,本研究將問卷的所有問題拆分為二分類變量進行數(shù)據處理,共49個變量??紤]到部分變量發(fā)生率極低,首先采用χ2檢驗對偏頭痛和緊張型頭痛患者的數(shù)據進行比較,共篩選出12個差異具有統(tǒng)計學意義(P<0.05)的特征變量納入研究。在建立列線圖模型時,根據Harrel[12]的標準,當結局變量是二分類時,最小樣本量必須滿足特征變量數(shù)的10倍,根據目前納入的變量,至少需要120例。本研究建模組152例患者,符合樣本量要求。
使用SPSS21.0 軟件和R軟件(版本4.0.3 )進行統(tǒng)計分析。定性資料采用χ2檢驗。危險因素采用單因素和多因素Logistic回歸分析。采用了容忍度(tolerance,Tol)和方差膨脹因子(variance inflation factor,VIF)評估特征變量的共線性問題,其中Tol均>0.10 且VIF均<10則表示變量之間不存在共線性。將單因素Logistic回歸中P<0.1 的自變量納入多因素Logistic回歸分析,并用逐步向前法篩選最終納入模型的變量。基于自變量的回歸系數(shù),建立了偏頭痛和緊張型頭痛個體化列線圖作為決策模型。從區(qū)分度和校準度2個方面對模型進行驗證。用R軟件繪制列線圖、受試者操作特征曲線(receiver operator characteristic curve,ROC曲線)和校準曲線。P<0.05 表示差異具有統(tǒng)計學意義。
本研究共納入210例患者,其中建模組152例,驗證組58例。2組患者在一般人口學資料和頭痛特征上差異無統(tǒng)計學意義(表1)。
表1 建模組和驗證組患者基線特征比較Tab 1 Comparison of baseline characteristics of patients in the modeling group and validation group
單因素Logistic分析顯示(表2),性別、病程、頭痛是否位于后枕部、頭痛的嚴重程度、是否伴有惡心/嘔吐、是否伴有畏光/畏聲、活動后頭痛的變化、與經期是否有關在鑒別偏頭痛和緊張型頭痛中差異具有統(tǒng)計學意義。另外,頭痛緩解方式變量的P=0.053 (P<0.1 ),也納入了下一步的多因素分析。共線性分析結果表明,上述9個特征變量間不存在共線性(表3)。將9個特征變量納入非條件二元多因素Logistic回歸顯示(表2),病程、頭痛是否位于后枕部、頭痛的嚴重程度、是否伴有惡心/嘔吐、是否伴有畏光/畏聲、活動后頭痛的變化是鑒別偏頭痛和緊張型頭痛的獨立預測因素。在非條件二元多因素Logistic回歸分析的基礎上,將上述6個因素納入決策模型。由于偏頭痛對患者生活的影響程度較重,本研究將偏頭痛設為主要結局變量,并利用R軟件rms程序包編程建立并繪制偏頭痛的個體化列線圖模型(圖1A)。根據列線圖模型中以上各個特征變量對是否發(fā)生偏頭痛的貢獻程度,給每個特征變量的取值水平進行賦分,然后再將各個分值相加得到總評分,最后通過總評分與偏頭痛發(fā)生概率之間的函數(shù)轉換關系計算個體發(fā)生偏頭痛的概率(緊張型頭痛發(fā)生的概率=1-偏頭痛發(fā)生的概率)。例如,如果一位原發(fā)性頭痛患者活動后頭痛程度加重、伴有惡心/嘔吐、畏光/畏聲、頭痛程度較重、不伴有后枕部的疼痛、病程較長,那么他總得分為412分,對應的概率為0.996,即該患者發(fā)生偏頭痛的概率為99.6%(圖1B)。根據以上預測,該患者為偏頭痛的可能性很大。
表2 單因素和多因素Logistic回歸分析Tab 2 Univariate and multivariate Logistic regression analysis
表3 各特征變量的共線性分析Tab 3 Collinearity analysis of each characteristic variable
Note:A.Nomogram model to predict migraine.B.An example of nomogram model to predict migraine.
2.3.1 區(qū)分度 通過繪制預測概率的ROC曲線,分別計算了建模組和驗證組的曲線下面積(area under the curve,AUC)(圖2)。建模組和驗證組判別的AUC分別為0.896[95%置信 區(qū) 間(confidence interval,CI)0.842 ~0.950 ]和0.884 (95%CI0.793 ~0.976 ),說明列線圖預測模型具有良好的區(qū)分度。
圖2 建模組(A)和驗證組(B)的ROC曲線Fig 2 ROC curve of the modeling group(A)and validation group(B)
2.3.2 校準度 建模組和驗證組的校準曲線圖(圖3A、3B)顯示,2組校準曲線與標準曲線均極為接近,說明模型在建模組和驗證組中較為一致。
圖3 建模組(A)和驗證組(B)的校準曲線Fig 3 Calibration curve of the modeling group(A)and validation group(B)
頭痛是臨床上最常見的癥狀之一。頭痛病因多達數(shù)百種,對頭痛進行正確診斷就普通臨床醫(yī)師而言是一項極具挑戰(zhàn)性的任務。尤其針對原發(fā)性頭痛,因為缺乏明確的實驗室或影像學檢查輔助,沒有比較客觀的金標準,診斷分類較困難,且受醫(yī)師的主觀因素影響較大,結論穩(wěn)定性差,治療效果往往不佳。偏頭痛和緊張型頭痛位居原發(fā)性頭痛前2位。2017年全球疾病負擔調查[13]結果顯示,按失能所致生命損失年計算,偏頭痛為第二位致殘性疾病。在2019年神經系統(tǒng)疾病負擔排名中,偏頭痛單病種的疾病負擔位列第二,僅次于卒中(缺血性+出血性)[14]。頭痛的高患病率、高致殘率、高經濟負擔的部分原因是由于目前的診療不規(guī)范。規(guī)范頭痛診斷,提高頭痛臨床診斷準確率極為重要。在繁忙的門診工作中,排除繼發(fā)性頭痛預警指標后,對原發(fā)性頭痛如何進行快速分類診斷,仍是目前研究的方向。預測模型可以實現(xiàn)高危人群的篩查,實現(xiàn)個體化的診斷預測。列線圖則是預測模型的一種。列線圖將復雜繁瑣的回歸方程可視化,更加方便臨床醫(yī)師獲得數(shù)據。近年來,列線圖預測模型已廣泛應用于多種疾病的診斷和預后分析。
通過單因素和多因素Logistic分析,本研究得出幾個區(qū)分偏頭痛和緊張型頭痛的獨立診斷預測因子:病程、頭痛是否位于后枕部、頭痛的嚴重程度、是否伴有惡心/嘔吐、是否伴有畏光/畏聲、活動后頭痛的變化。既往針對簡化頭痛診斷標準的研究[15]中,通過惡心所建立的偏頭痛單變量模型可以達到陽性似然比4.80,陰性似然比0.23 ;通過惡心、畏光/畏聲、搏動性頭痛所建立的偏頭痛三變量模型,陽性似然比達到6.70 ,陰性似然比0.23 。Martin等[16]提出的一種偏頭痛簡化篩查工具,更是進一步強調了惡心、畏光在偏頭痛診斷中的重要性,其中是否具有致殘性、是否伴有惡心、是否伴有畏光3項特征所構成的篩查模型,達到了81%的敏感性。盡管緊張型頭痛患者易合并焦慮抑郁等情況,但導致患者食欲不振、惡心/嘔吐等情況較少??梢?,惡心/嘔吐、畏光/畏聲對診斷偏頭痛起著至關重要的作用,這與本研究結果一致。此外,本研究還得到了病程、頭痛是否位于后枕部、頭痛的嚴重程度、活動后頭痛的變化也是區(qū)分緊張型頭痛和偏頭痛的重要判別因子。病程較長,頭痛不位于后枕部、頭痛程度較重、活動后頭痛加重患者更易診斷為偏頭痛,與ICHD Ⅲ相一致。
本研究首次提出偏頭痛和緊張型頭痛診斷預測的列線圖模型。該模型基于6個臨床指標,可以幫助臨床醫(yī)師提高快速識別患者偏頭痛的概率。在建模組中,該模型的AUC值為0.896 ,在驗證組中為0.8 8 4 。校準曲線顯示,模型在建模組和驗證組具有較強的一致性。這些研究結果表明,該模型在區(qū)分偏頭痛和緊型性頭痛患者中具有較高的鑒別能力。
本研究也存在不足之處:①模型只納入了偏頭痛和緊張型頭痛2種發(fā)病率最高的頭痛類型,雖然解決了很大部分頭痛的診斷問題,但繼發(fā)性頭痛和其余多種原發(fā)性頭痛均未納入,需要進一步完善。②本研究納入的是就診的頭痛患者,對研究對象存在選擇偏倚,較輕的未就診的頭痛患者未能納入研究。③本研究樣本量仍然較少,盡管通過Bootstrap進行了模型的內部驗證,根據時間節(jié)點劃分進行了模型的外部驗證,但仍需收集更多的樣本,同時需要進行多中心的驗證,這將是下一步研究的方向。
綜上所述,本研究基于病程、頭痛是否位于后枕部、頭痛的嚴重程度、是否伴有惡心/嘔吐、是否伴有畏光/畏聲、活動后頭痛的變化構建了鑒別偏頭痛和緊張型頭痛的列線圖模型,提高了對偏頭痛和緊張型頭痛的早期識別和診斷能力。該模型在建模組和驗證組均具有較好的區(qū)分度和校準度,能實現(xiàn)對偏頭痛和緊張型頭痛的鑒別診斷,有助于臨床醫(yī)師進行快速直觀的評估,從而采取個體化的治療策略,幫助患者緩解頭痛。
參·考·文·獻
[1]Hagen K,?sberg AN,Uhlig BL,et al.The epidemiology of headache disorders:a face-to-face interview of participants in HUNT4[J].J Headache Pain,2018,19(1):25.
[2]Yu SY,Liu RZ,Zhao G,et al.The prevalence and burden of primary headaches in China:a population-based door-to-door survey[J].Headache,2012,52(4):582-591.
[3]Yao CY,Wang Y,Wang LJ,et al.Burden of headache disorders in China,1990—2017:findings from the Global Burden of Disease Study 2017[J].J Headache Pain,2019,20(1):102.
[4]Saylor D,Steiner TJ.The global burden of headache[J].Semin Neurol,2018,38(2):182-190.
[5]Takeshima T,Wan Q,Zhang Y,et al.Prevalence,burden,and clinical management of migraine in China,Japan,and South Korea:a comprehensive review of the literature[J].J Headache Pain,2019,20(1):111.
[6]Leonardi M,Raggi A.A narrative review on the burden of migraine:when the burden is the impact on people's life[J].J Headache Pain,2019,20(1):41.
[7]International Headache Society.Headache classification committee of the international headache society(IHS)the international classification of headache disorders,3rd edition[J].Cephalalgia,2018,38(1):1-211.
[8]尹梓名,董釗,孔祥勇.基于國際頭痛診斷標準的原發(fā)性頭痛輔助決策系統(tǒng)[J].計算機應用研究,2019,36(02):461-465.
[9]Krawczyk B,Simi? D,Simi? S,et al.Automatic diagnosis of primary headaches by machine learning methods[J].Central Eur J Med,2013,8(2):157-165.
[10]Khayamnia M,Yazdchi M,Heidari A,et al.Diagnosis of common deadaches using hybrid expert-based systems[J].J Med Signals Sens,2019,9(3):174-180.
[11]Simi? S,Bankovi? Z,Villar JR,et al.A hybrid fuzzy clustering approach for diagnosing primary headache disorder[J].Log J IGPL,2021,29(2):220-235.
[12]Jun FEH.Regression modeling strategies with applications to linear models,logistic regression,and survival analysis[M].New York:Springer Verlag,2001.
[13]GBD 2017 Disease and Injury Incidence and Prevalence Collaborators.Global,regional,and national incidence,prevalence,and years lived with disability for 354 diseases and injuries for 195 countries and territories,1990—2017:a systematic analysis for the Global Burden of Disease Study 2017[J].Lancet,2018,392(10159):1789-1858.
[14]GBD 2016 Neurology Collaborators.Global,regional,and national burden of neurological disorders,1990—2016:a systematic analysis for the Global Burden of Disease Study 2016[J].Lancet Neurol,2019,18(5):459-480.
[15]Martin VT,Penzien DB,Houle TT,et al.The predictive value of abbreviated migraine diagnostic criteria[J].Headache,2005,45(9):1102-1112.
[16]Lipton RB,Dodick D,Sadovsky R,et al.A self-administered screener for migraine in primary care:the ID migraine validation study[J].Neurology,2003,61(3):375-382.