,
隨著醫(yī)療信息化程度日益加深,醫(yī)療數(shù)據(jù)大量積累,醫(yī)療大數(shù)據(jù)時代已經(jīng)到來[1-2]。醫(yī)療大數(shù)據(jù)是對患者在醫(yī)療活動中產(chǎn)生的全體數(shù)據(jù)的集合,包括患者個人信息、診療信息、電子病歷、用藥數(shù)據(jù)、醫(yī)學(xué)影像數(shù)據(jù)等[3]。醫(yī)療大數(shù)據(jù)為醫(yī)療衛(wèi)生事業(yè)的發(fā)展帶來了巨大的機遇,也為循證醫(yī)學(xué)的發(fā)展提供了寶貴的數(shù)據(jù)資源。為促進醫(yī)療大數(shù)據(jù)的發(fā)展,我國陸續(xù)出臺了多項相關(guān)政策,將醫(yī)療大數(shù)據(jù)發(fā)展納入國家大數(shù)據(jù)發(fā)展戰(zhàn)略,全面推進醫(yī)療大數(shù)據(jù)的挖掘和應(yīng)用[4-5]。如何科學(xué)有效地對醫(yī)療大數(shù)據(jù)進行挖掘與分析,為臨床實踐提供全面、可靠的數(shù)據(jù)支持,推動強調(diào)證據(jù)為基礎(chǔ)的循證醫(yī)學(xué)的發(fā)展,促進醫(yī)療大數(shù)據(jù)在醫(yī)學(xué)領(lǐng)域的應(yīng)用與研究,成為當(dāng)前醫(yī)療行業(yè)發(fā)展的必然趨勢[6-7]。
兒童的各個器官都處在生長發(fā)育的特殊階段,肝腎解毒功能較差,容易出現(xiàn)用藥安全問題[8]。據(jù)調(diào)查,我國每年約30 000名兒童由于用藥不當(dāng)導(dǎo)致耳聾, 約7 000名兒童因此失去生命[9]。因此,充分挖掘兒童用藥大數(shù)據(jù),發(fā)現(xiàn)其中潛在的規(guī)律,可為兒科醫(yī)生臨床用藥提供決策支持。本文嘗試將數(shù)據(jù)挖掘技術(shù)應(yīng)用于兒童過敏性紫癜用藥模式分析,為兒童用藥決策以及合理用藥提供循證醫(yī)學(xué)支持。
數(shù)據(jù)挖掘是指通過對大量有噪聲、不完整的模糊數(shù)據(jù)進行探索和分析,發(fā)現(xiàn)數(shù)據(jù)有潛在價值的模式和知識[10-11]。數(shù)據(jù)挖掘的流程包含數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、結(jié)果解釋與評價[12]。
數(shù)據(jù)挖掘有多種算法,本文使用關(guān)聯(lián)規(guī)則算法進行挖掘,關(guān)聯(lián)規(guī)則算法包含頻繁項集和關(guān)聯(lián)規(guī)則2個核心概念。頻繁項集是指經(jīng)常一起使用的藥品或藥品組合,包含k種藥品的項集稱為k-項集,頻繁項集要滿足最小支持度,即藥品出現(xiàn)的頻率要高于某一閾值;關(guān)聯(lián)規(guī)則是蘊含關(guān)系A(chǔ)→B,表示如果使用了藥品A,就會與使用藥品B產(chǎn)生關(guān)聯(lián)。強關(guān)聯(lián)規(guī)則要滿足最小支持度和最小置信度,有效的關(guān)聯(lián)規(guī)則要滿足提升度>1。支持度(Support)、置信度(Confidence)和提升度(Lift)的公式如下[13-14]:
Support(A→B)=P(A∪B)
Confidence(A→B)=P(B/A)
Lift(A→B)=P(B/A)/P(B)
本文利用數(shù)據(jù)挖掘技術(shù)對兒童用藥模式進行挖掘。過敏性紫癜是兒童多發(fā)的一種血管炎疾病,主要臨床表現(xiàn)為皮膚紫癜,伴有關(guān)節(jié)腫痛、腹痛、腎臟損害和消化道出血等癥狀[15-16]。通過對兒童過敏性紫癜藥品使用頻率、藥品之間的關(guān)聯(lián)性進行分析,發(fā)現(xiàn)兒童用藥的特點及規(guī)律。
收集2012年1月~2018年5月日照市某市級公立醫(yī)院收治的年齡介于2~14歲的505例(男孩309例,女孩196例)過敏性紫癜患兒用藥數(shù)據(jù)。
醫(yī)療大數(shù)據(jù)經(jīng)常存在噪聲、不完整和不一致的問題,因此在數(shù)據(jù)挖掘前要對兒童過敏性紫癜用藥數(shù)據(jù)進行預(yù)處理。
2.2.1 隱私保護和屬性提取
醫(yī)療大數(shù)據(jù)中包含多項患者的隱私信息,必須進行保護。首先對數(shù)據(jù)庫中的數(shù)據(jù)進行匿名化處理,隱藏與患者隱私相關(guān)的屬性,如姓名、家族病史等信息;然后根據(jù)數(shù)據(jù)挖掘的目標(biāo),在數(shù)據(jù)庫中進行屬性選擇,提取患者的病歷號、醫(yī)囑內(nèi)容、醫(yī)囑時間等屬性,忽略其他無關(guān)的屬性。
2.2.2 數(shù)據(jù)清洗
對數(shù)據(jù)庫中的醫(yī)囑數(shù)據(jù)進行清洗。除去臨床上常用的藥物溶媒以及護理、禁食等醫(yī)囑內(nèi)容,對不同時間段多次使用某種藥品造成的數(shù)據(jù)冗余進行消除重復(fù)處理,填補醫(yī)囑數(shù)據(jù)中的缺失,刪除醫(yī)囑數(shù)據(jù)中的異常值,提高數(shù)據(jù)的完整性。
2.2.3 藥品名規(guī)范和編碼
由于醫(yī)院數(shù)據(jù)庫中的藥品名稱不規(guī)范,根據(jù)《中華人民共和國藥典》將藥品名規(guī)范統(tǒng)一化。如將“西替利嗪糖漿”統(tǒng)一為“鹽酸西替利嗪糖漿”,“孟魯司特咀嚼片”統(tǒng)一為“孟魯司特鈉咀嚼片”,保證藥品名的一致性。最后,用d1,d2,……,dn對藥品名進行編碼,其中,“n”表示藥品種數(shù),能夠在某種程度上簡化挖掘過程。
在R語言中實現(xiàn)關(guān)聯(lián)規(guī)則Apriori算法,挖掘兒童過敏性紫癜用藥模式。為便于R語言接收,需要把數(shù)據(jù)另存為csv格式,通過read.csv()函數(shù)讀入R中,用data表示讀入的待挖掘數(shù)據(jù)。
2.3.1 用藥統(tǒng)計匯總
通過summary()函數(shù)對data統(tǒng)計匯總,得到最小值、最大值、四分位數(shù)和均值等統(tǒng)計信息。語句為summary(data)。
2.3.2 發(fā)現(xiàn)頻繁項集
通過eclat()函數(shù),設(shè)置支持度閾值為20%,最大項數(shù)為1,找出用藥數(shù)據(jù)的頻繁1項集。語句為eclat(data, parameter=list(support=0.2, maxlen=1))。
通過eclat()函數(shù),設(shè)置支持度閾值為30%,最小項數(shù)為2,最大項數(shù)為5,找出頻繁項集。語句為eclat(data, parameter=list(support=0.3, maxlen=5, minlen=2))。
2.3.3 發(fā)現(xiàn)關(guān)聯(lián)規(guī)則
通過apriori()函數(shù),設(shè)置支持度閾值70%,置信度閾值80%,得到用藥數(shù)據(jù)的關(guān)聯(lián)規(guī)則。語句為apriori(data,parameter=list(support=0.7,confidence=0.8))。
兒童過敏性紫癜用藥數(shù)據(jù)的統(tǒng)計信息見表1。
表1 兒童過敏性紫癜用藥統(tǒng)計信息
從表1可以看出,在不考慮溶媒的條件下,過敏性紫癜患兒在治療過程中最少使用2種藥品,最多使用13種藥品;四分之一的患兒用藥種數(shù)≤6種,一半的患兒用藥種數(shù)≤8種,四分之三的患兒用藥種數(shù)≤9種,而患兒平均用藥種數(shù)為7.604種。
3.2.1 頻繁1項集
利用函數(shù)inspect()察看支持度最高的前10項頻繁1項集,得到過敏性紫癜兒童最常用的10種藥品(表2)。
表2 過敏性紫癜兒童常用藥品
從表2可知,維生素C注射液、西咪替丁注射液、鹽酸西替利嗪糖漿、雙嘧達莫片和低分子肝素鈉注射液應(yīng)用最多。維生素C注射液主要用于紫癜的治療,西咪替丁注射液可以抗組胺、減輕腹痛,鹽酸西替利嗪糖漿主要是抗組胺,雙嘧達莫片用于阻止血小板聚集和血栓形成,低分子肝素鈉注射液可以抗凝血、預(yù)防血栓,說明過敏性紫癜的治療主要為對癥支持,抗組胺、抗凝治療。
3.2.2 頻繁項集
利用函數(shù)inspect()察看支持度最高的前10項頻繁項集,得到最常用的10種藥品組合(表3)。
表3 過敏性紫癜兒童常用藥品組合
在這些藥品組合中,維生素C注射液聯(lián)合西咪替丁注射液是減少紫癜和抗組胺,西咪替丁注射液聯(lián)合鹽酸西替利嗪糖漿是抗組胺和抗過敏,維生素C注射液聯(lián)合鹽酸西替利嗪糖漿是減少紫癜和抗組胺、抗過敏,西咪替丁注射液聯(lián)合雙嘧達莫片是抗組胺、減輕腹痛和抗凝,說明過敏性紫癜兒童可能與食物、微生物和藥物等因素相關(guān),但沒有確鑿證據(jù),因此發(fā)病原因難以確定。過敏性紫癜患兒的治療主要為對癥處理,補充維生素,應(yīng)用抗組胺藥物,腹痛時應(yīng)用西咪替丁、抗凝藥物、激素和免疫抑制劑,抗生素應(yīng)用較少。
利用inspect()函數(shù)按提升度>1.04篩選并察看關(guān)聯(lián)規(guī)則,得到12條藥品關(guān)聯(lián)規(guī)則(表4)。
表4 過敏性紫癜兒童藥品關(guān)聯(lián)規(guī)則
對部分關(guān)聯(lián)規(guī)則說明如下:
雙嘧達莫片和鹽酸西替利嗪糖漿聯(lián)合使用的概率是81.19%。如果患兒使用了雙嘧達莫片,則有95.35%的可能使用鹽酸西替利嗪糖漿;如果使用了鹽酸西替利嗪糖漿,則有91.11%的可能使用雙嘧達莫片。
鹽酸西替利嗪糖漿和西咪替丁注射液聯(lián)合使用的概率是88.12%。如果患兒使用了鹽酸西替利嗪糖漿,則有98.89%的可能使用西咪替丁注射液;如果使用了西咪替丁注射液,則有92.71%的可能使用到鹽酸西替利嗪糖漿。
鹽酸西替利嗪糖漿聯(lián)合低分子肝素鈉注射液和西咪替丁注射液的概率是73.27%。如果患兒使用了鹽酸西替利嗪糖漿和低分子肝素鈉注射液,則有100%的可能使用西咪替丁注射液。
維生素C注射液聯(lián)合雙嘧達莫片和鹽酸西替利嗪糖漿的概率是78.22%。如果患兒使用了維生素C注射液和雙嘧達莫片,則有95.18%的可能使用鹽酸西替利嗪糖漿;如果使用了維生素C注射液和鹽酸西替利嗪糖漿,則有90.80%的可能使用雙嘧達莫片。
總的來看,雙嘧達莫片與鹽酸西替利嗪糖漿,鹽酸西替利嗪糖漿與西咪替丁注射液在兒童過敏性紫癜治療中具有較高的相關(guān)性。雙嘧達莫片主要有抗凝的作用,鹽酸西替利嗪主要用于抗組胺、抗過敏,西咪替丁主要是抗組胺、解痙、減輕腹痛,說明抗凝、抗組胺、抗過敏是過敏性紫癜(皮膚型)的主要治療方案,而抗組胺、抗過敏、護胃解痙是過敏性紫癜(腹型)的主要治療方案。
此外,鹽酸西替利嗪糖漿與低分子肝素鈉注射液、西咪替丁注射液的關(guān)聯(lián)廣泛,3種藥品的合并用藥可以抗組胺、抗凝、解痙,治療過敏性紫癜腹痛。維生素C注射液與鹽酸西替利嗪糖漿、雙嘧達莫片的關(guān)聯(lián)關(guān)系說明在減輕紫癜的基礎(chǔ)上,抗組胺、抗凝是治療兒童過敏性紫癜的主要思路。
經(jīng)過與患兒所在醫(yī)院的兒科主任醫(yī)師溝通,以上挖掘結(jié)果與兒童過敏性紫癜的臨床用藥情況相符合,體現(xiàn)出了兒科醫(yī)師治療該病時的用藥習(xí)慣和診療思路,在輔助臨床給藥、傳承用藥經(jīng)驗和促進用藥規(guī)范等方面具有實用價值。
隨著醫(yī)療行業(yè)信息化的不斷深入,醫(yī)療大數(shù)據(jù)的價值正日益顯現(xiàn)。如何充分利用醫(yī)療大數(shù)據(jù),挖掘醫(yī)療大數(shù)據(jù)背后隱藏的價值,提高醫(yī)療服務(wù)水平,成為醫(yī)療大數(shù)據(jù)時代的重要研究領(lǐng)域。
本文利用醫(yī)療大數(shù)據(jù)和數(shù)據(jù)挖掘技術(shù),挖掘兒童過敏性紫癜的核心用藥及藥品間的關(guān)聯(lián)規(guī)則,分析兒童用藥的特點和規(guī)律,為指導(dǎo)兒童臨床用藥提供了偱證醫(yī)學(xué)支持。
但是需注意的是核心用藥及用藥規(guī)律仍要在臨床實踐中不斷驗證和評價,才能更好地發(fā)揮其在指導(dǎo)兒童用藥方面的作用。