范世平 朱飛奇 舒嵐 廖茂成
基于EHR和SPEEDMINER數(shù)據(jù)挖掘的粵北地區(qū)腦卒中高危人群篩查平臺的初步構建
范世平 朱飛奇 舒嵐 廖茂成
采用EHR與SPEEDMINER數(shù)據(jù)挖掘技術,結合臨床實踐,初步建立以粵北人民醫(yī)院為中心,輻射周邊地區(qū)的腦卒中高危人群智能分布性篩查平臺。通過對篩查結果的統(tǒng)計分析,實現(xiàn)對粵北地區(qū)腦卒中高危人群進行實時監(jiān)控,為各級醫(yī)療服務機構對高危人群進行針對性健康教育等干預措施提供參考依據(jù)。
電子健康檔案;數(shù)據(jù)挖掘;腦卒中篩查;高危人群
腦卒中是一種急性腦血管病,具有發(fā)病率高、致殘率高和死亡率高的特點。我國居民第三次死因調查結果顯示,腦血管病已成為國民第一位的死亡[1]。然而,我國目前腦卒中篩查與防控工作的開展,與現(xiàn)實存在較大的差距,主要表現(xiàn)在以下幾個方面:一是未廣泛開展高血壓與血清同型半胱氨酸篩查;二是未重視頸動脈粥樣硬化斑塊和狹窄的篩查與規(guī)范化治療;三是絕大部分醫(yī)院重腦卒中的治療,但輕預防;四是社區(qū)、農(nóng)村人群腦卒中高發(fā),但是該人群對腦卒中的篩查和預防極不關注;這些問題導致我國腦卒中發(fā)病率急劇增加。
腦卒中篩查與防治工程是我國一項重大的國民健康促進工程,是一項利國利民的德政工程。積極開展腦卒中篩查,可以做到防患于未然。腦卒中高危人群篩查和干預可提高國民防治知識知曉率、用藥率、控制率,綜合預防和聯(lián)合干預高血壓、高血糖、血脂異常、房顫及吸煙、飲酒等不健康生活方式,降低腦卒中發(fā)病率、復發(fā)率、致殘率和死亡率[2-3],減輕百姓、社會及政府的經(jīng)濟負擔。本平臺以居民電子健康檔案和數(shù)據(jù)挖掘為基礎,提供粵北地區(qū)腦卒中高危人群的智能分布,實現(xiàn)對腦卒中高危人群的動態(tài)監(jiān)控與干預。
粵北地區(qū)腦卒中高危人群初篩平臺以粵北區(qū)域醫(yī)療信息網(wǎng)絡服務平臺為依托,通過接口獲取區(qū)域平臺數(shù)據(jù),抽取整理后存入數(shù)據(jù)倉庫的數(shù)據(jù)庫。在初篩平臺上制定腦卒中高危人群智能分布的分析模型,通過Speedminer數(shù)據(jù)挖掘工具的報表和圖形功能來讀取結果,為臨床腦卒中防治與干預提供指引,進一步發(fā)揮粵北地區(qū)腦卒中篩查與防治基地的巨大作用?;洷钡貐^(qū)腦卒中高危人群篩查平臺的系統(tǒng)架構見圖1。
圖1 腦卒中初篩平臺架構
1.1 腦卒中篩查數(shù)據(jù)采集 腦卒中風險篩查的基本數(shù)據(jù)是整個平臺架構的基礎,腦卒中風險篩查包括:(1)BP≥140/90 mm Hg,或未知;(2)心房顫動(房顫)和心瓣膜?。ń?jīng)區(qū)/縣級以上醫(yī)院明確診斷);(3)吸煙(吸煙的定義為每天吸煙至少1支,連續(xù)1年以上);(4)血脂異常,或未知;(5)糖尿病;(6)很少進行體育活動(根據(jù)2000 年國民體質監(jiān)測方案,體育鍛煉的定義是每周體育鍛煉≥3次、每次堅持30分鐘、持續(xù)時間超過1年);(7)明顯超重或肥胖(BMI≥26.0 kg/m2);(8)有卒中家族史。對滿足以上8個條件中任意3個或3個以上危險因素,或者既往有卒中/短暫性腦缺血發(fā)(transient ischemic attack,TIA)病史的患者,則判定為腦卒中高危人群;以上8個條件中低于3個危險因素,但患有慢性?。ǜ哐獕骸⑻悄虿?、房顫或瓣膜性心臟病)之一者,定義為中危人群;以上8個條件中低于3個危險因素,并且無慢性病者為低危人群[4]。
在區(qū)域醫(yī)療平臺內,通過每位患者唯一的身份標識——個人主索引MPI(Mask Patient Index)獲取居民電子健康檔案(PHR)、電子健康記錄(EHR)和腦卒中篩查基本信息表,調取包括居民多次就診的HIS(醫(yī)院信息系統(tǒng))、LIS(實驗室信息管理系統(tǒng))、PACS(醫(yī)學影像存檔通訊系統(tǒng))、RIS(放射信息管理)、EMR(電子病歷)等一系列數(shù)據(jù)與信息,存儲到數(shù)據(jù)倉庫的數(shù)據(jù)庫,為腦卒中危險人群的判斷提供臨床依據(jù)。
1.2 腦卒中篩查數(shù)據(jù)分析評估 數(shù)據(jù)挖掘是一個從數(shù)據(jù)中提取模式的過程,是一個受多個學科影響的交叉領域,包括數(shù)據(jù)庫系統(tǒng)、統(tǒng)計學、機器學習、可視化和信息科學等; 數(shù)據(jù)挖掘反復使用多種數(shù)據(jù)挖掘算法從觀測數(shù)據(jù)中確定模式或合理模型,是一種決策支持過程。利用數(shù)據(jù)挖掘工具從數(shù)據(jù)倉庫中的大量數(shù)據(jù)獲取有效的、新穎的、潛在有用的、最終可理解的一個模式過程[5]。粵北地區(qū)腦卒中高危人群篩查平臺通過Speedminer數(shù)據(jù)挖掘技術提供腦卒中篩查數(shù)據(jù)的統(tǒng)計、分析與評估[6]。在平臺上建立腦卒中篩查主題,腦卒中危險人群的維度包括危險等級、性別、年齡、地區(qū)分布等,同時定義數(shù)據(jù)鉆取的順序,通過對數(shù)據(jù)庫數(shù)據(jù)的切片、切塊、鉆取和旋轉等各種分析、剖析,通過數(shù)據(jù)挖掘工具的報表和圖形功能來讀取結果,使用戶能從多角度、多側面地觀察數(shù)據(jù),展示腦卒中初步篩查的各項結果。腦卒中篩查平臺流程圖見圖2。
圖2 腦卒中初篩平臺業(yè)務流程
1.3 腦卒中篩查平臺統(tǒng)計分析實例 以下是利用腦卒中高危人群篩查平臺,以粵北地區(qū)各縣市2013年腦卒中篩查人員數(shù)據(jù)為基礎,進行抽樣統(tǒng)計分析。圖3為韶關3市轄區(qū)、4縣、1自治縣、2縣級市腦卒中篩查的低危、中危、高危、TIA、卒中患者分布情況。
圖3 腦卒中危險人群地區(qū)分布
在腦卒中危險人群分布圖的基礎上進一步進行數(shù)據(jù)鉆取。以韶關市武江區(qū)為例,從年齡、性別等維度對腦卒中危險人群進行數(shù)據(jù)挖掘與分析,如圖4、5所示。通過圖4與圖5的統(tǒng)計分析,可以初步判斷這一地區(qū)腦卒中高發(fā)人群集中在50~70歲之間,以男性居多。
圖4 腦卒中危險人群年齡分布
圖5 腦卒中危險人群性別分布
腦卒中篩查平臺除按照地區(qū)、性別、年齡篩查外,還可按照危險因素進行篩查。仍以韶關市武江區(qū)為例,通過平臺統(tǒng)計分析出腦卒中高危人群危險因素主要包括腦卒中、TIA、高血壓、高血脂、卒中家族史等。如果把危險因素作為第一層,可進一步挖掘數(shù)據(jù),統(tǒng)計分析各危險因素的年齡比例和性別比例。
我國每年用于治療腦血管病的費用估計約120多億元,再加上各種間接經(jīng)濟損失,每年因本病的總支出近200億元。腦卒中已對國民的生命健康造成嚴重威脅,并將大幅度增加疾病負擔?!?020健康中國”戰(zhàn)略規(guī)劃研究中考慮將“腦中風篩查與防控”列入重大專項。
基于EHR和SPEEDMINER數(shù)據(jù)挖掘的粵北地區(qū)腦卒中高危人群篩查平臺以粵北區(qū)域醫(yī)療平臺為基礎,利用區(qū)域平臺的個人健康檔案、電子健康記錄及腦卒中篩查基本信息表等獲取人員就診信息,以先進SPEEDMINER數(shù)據(jù)挖掘技術為工具,提供粵北地區(qū)腦卒中高危人群的智能分布,實現(xiàn)對腦卒中高危人群的動態(tài)監(jiān)控與干預,以指導腦卒中健康教育及區(qū)域防治干預,從源頭上促進國民健康工程的建設與發(fā)展,對于腦卒中篩查與防治工作具有重要意義。與此同時,以完善的信息系統(tǒng)和WLAN網(wǎng)絡技術為依托,將現(xiàn)代信息技術與醫(yī)學人文關懷融為一體,搭建以輻射農(nóng)村縣醫(yī)院為重點的區(qū)域醫(yī)療信息網(wǎng)絡服務系統(tǒng)平臺,實現(xiàn)將分散在不同機構的健康數(shù)據(jù)整合為一個邏輯完整的信息整體,滿足與其相關的各種機構和人員需要。該平臺的目標是使醫(yī)療服務人員在任何時間、任何地點都能及時獲取必要的信息,以支持高質量的醫(yī)療服務;使公共衛(wèi)生工作者能全面掌控人群健康信息,做好疾病預防、控制和健康促進工作;使居民能掌握和獲取自己完整的健康資料,參與健康管理,享受持續(xù)、跨地區(qū)、跨機構的醫(yī)療衛(wèi)生服務。
當然此平臺在統(tǒng)計分析方面不夠完善,分析因素比較單一,需要在以后的應用過程中不斷總結、探索與完善。
[1] 陳竺.全國第三次死因回顧抽樣調查報告[R].北京:中國協(xié)和醫(yī)科大學出版社,2008:14-17.
[2] 劉鳳群.腦卒中患者的健康指導與保健[J].中華現(xiàn)代護理學雜志,2006,3(3):260-261.
[3] 趙亞飛,杜雪平,董建琴.腦卒中社區(qū)防治的現(xiàn)狀及存在的問題[J].中國全科醫(yī)學,2010,13(14):1493-1495.
[4] 張振漢.北京市朝陽區(qū)八里莊地區(qū)40歲以上人群腦卒中危險因素現(xiàn)狀調查[J].中華腦血管病雜志(電子版),2010,7(6):322-329.
[5] 用戶指南V 1.0中文版[M/OL].[2011-10-20].http://ishare.iask. sina.com.cn/f/8971898.html.
[6] 時松和,施學忠,楊永利,等.基于數(shù)據(jù)挖掘的艾滋病綜合防治居民健康檔案管理信息系統(tǒng)設計與實現(xiàn)[J].現(xiàn)代預防醫(yī)學,2013,40(16): 2953-2957.
Applying the technology of EHR and SPEEDMINER data mining, combining clinical practices, the project preliminary builds a high-risk population stroke screening platform centered on YueBei People’s Hospital covering the surrounding areas.explore the establishment of stroke screening platform of YueBei region based on electronic health records and data mining. The project integrates with magnanimity information resources which aimed at building the platform of YueBei region. By the statistical analysis of screening results, it realizes real-time monitoring of YueBei region high-risk population, which helps to make health guidance and interventions for all medical service institution.
Electronic health records;Data mining;Stroke screening;High-risk groups
10.3969/j.issn.1009-4393.2016.2.104
2012年韶關市科技計劃(醫(yī)學類)項目(2012 CX-K 86)
廣東 512026 汕頭大學醫(yī)學院附屬粵北人民醫(yī)院辦公室 (范世平 舒嵐 廖茂成) 汕頭大學醫(yī)學院附屬粵北人民醫(yī)院神經(jīng)內科 (朱飛奇)
范世平 E-mail:82959680@qq.com