倪杭建,何必仕,徐哲,沈偉富,何煒
1.杭州電子科技大學(xué) 自動化學(xué)院,浙江杭州 310018;2.杭州市衛(wèi)生信息中心,浙江 杭州 310001
區(qū)域醫(yī)療影像重復(fù)檢查分析及關(guān)聯(lián)挖掘
倪杭建1,何必仕1,徐哲1,沈偉富2,何煒2
1.杭州電子科技大學(xué) 自動化學(xué)院,浙江杭州 310018;2.杭州市衛(wèi)生信息中心,浙江 杭州 310001
本文對區(qū)域內(nèi)兩家三甲醫(yī)院影像重復(fù)性檢查進行了分析,并從醫(yī)療特色和檢查設(shè)備先進性兩方面來分析患者轉(zhuǎn)院治療原因,最后利用關(guān)聯(lián)規(guī)則算法挖掘了疾病類型與檢查設(shè)備的關(guān)聯(lián)性,為管理決策提供更準(zhǔn)確的參考依據(jù)。
區(qū)域醫(yī)療;影像重復(fù)檢查;關(guān)聯(lián)分析
近年來,患者在醫(yī)院就醫(yī)必先做大量醫(yī)技檢查,其中重復(fù)檢查成為影響醫(yī)患關(guān)系的原因之一,某種程度上加重“看病難、看病貴”問題。張麗等[1]曾對跨醫(yī)院短期重復(fù)超聲檢查現(xiàn)狀進行了調(diào)查、分析,但是研究局限在超聲檢查。本文將針對區(qū)域內(nèi)的兩家三甲醫(yī)院,并從醫(yī)療特色和檢查設(shè)備先進性兩方面對影像重復(fù)性檢查現(xiàn)象展開分析研究,同時挖掘各類疾病與檢查設(shè)備之間的關(guān)聯(lián)性。本文所研究的區(qū)域是以行政區(qū)域來劃分,具體以某市某一區(qū)來進行劃分,所研究的兩家三甲醫(yī)院是同一城市內(nèi)的兩家綜合性醫(yī)院。
1.1 數(shù)據(jù)預(yù)處理
為稽查重復(fù)性檢查,需要對驗證重復(fù)性的相關(guān)指標(biāo)進行說明:首先,轉(zhuǎn)院患者主要按照患者姓名、性別以及出生日期三個關(guān)鍵字段來核查;其次,同一患者重復(fù)性檢查主要以檢查設(shè)備和檢查部位兩個字段來進行核對,并且規(guī)定重復(fù)檢查的時間跨度在1個月之內(nèi)。根據(jù)上述關(guān)鍵字段以及時間限制等因素,針對原RIS數(shù)據(jù)庫中的患者信息、檢查信息和報告信息3個數(shù)據(jù)表進行抽取、轉(zhuǎn)換、加載(ETL),構(gòu)建“患者檢查表”,見表1。為保護患者隱私,僅提取2013年9月~2014年8月歷史數(shù)據(jù),“患者姓名+性別+出生年月”用同樣的Hash算法生成患者代號,既嚴(yán)格實現(xiàn)患者個人信息脫敏,又不影響患者核查及后續(xù)分析。
表1 患者檢查表
1.2 重復(fù)比例分析
從區(qū)域內(nèi)兩家三甲醫(yī)院提取到各自的患者檢查表,使用T-SQL語句對兩張表的數(shù)據(jù)進行分析,根據(jù)患者代號確定兩張表中的同一患者,將這兩個患者檢查表合并,分析患者轉(zhuǎn)院診療情況,以1個月內(nèi)患者是否出現(xiàn)在不同的醫(yī)院作為判斷患者轉(zhuǎn)院的依據(jù)。現(xiàn)針對區(qū)域內(nèi)兩家三甲醫(yī)院,分別以醫(yī)院B轉(zhuǎn)到醫(yī)院A,醫(yī)院A轉(zhuǎn)到醫(yī)院B為研究對象進行分析,結(jié)果見表2。
表2 患者轉(zhuǎn)院情況
從表2中的對比分析可以得出以下結(jié)論:
(1)從轉(zhuǎn)院人數(shù)可以看出,從醫(yī)院B轉(zhuǎn)院到醫(yī)院A的患者人數(shù)要高于醫(yī)院A轉(zhuǎn)到醫(yī)院B的轉(zhuǎn)院人數(shù),說明醫(yī)院A更有優(yōu)勢;
(2)從重復(fù)檢查人數(shù)以及重復(fù)檢查比例可以看出,醫(yī)院A轉(zhuǎn)到醫(yī)院B的平均重復(fù)檢查人數(shù)只為57人遠(yuǎn)少于從醫(yī)院B轉(zhuǎn)院到醫(yī)院A的平均重復(fù)檢查人數(shù)290。同時,醫(yī)院B轉(zhuǎn)院到醫(yī)院A的平均重復(fù)檢查比例高達(dá)36%,而醫(yī)院A轉(zhuǎn)院到醫(yī)院B的平均重復(fù)檢查比例只有12%。以上數(shù)據(jù)說明對于不同級別的醫(yī)院,上一級別的醫(yī)院對于下一級別醫(yī)院的影像檢查認(rèn)可度較低,大部分患者需要重新檢查;而下一級別的醫(yī)院對于上級別醫(yī)院的影像結(jié)果認(rèn)可度較高,患者影像重復(fù)檢查較少。
1.3 醫(yī)院醫(yī)療特色驗證分析
患者轉(zhuǎn)院治療的原因很多,比如醫(yī)療技術(shù)水平、醫(yī)療設(shè)備的差異等,但是其主要原因可以從醫(yī)院的特色醫(yī)療著手分析,絕大多數(shù)患者會根據(jù)所患疾病選擇該醫(yī)療領(lǐng)域較強的醫(yī)院。故針對轉(zhuǎn)院患者轉(zhuǎn)院前檢查出來的疾病類型進行分析,校驗其轉(zhuǎn)院原因是否和特色醫(yī)療相關(guān)。
首先通過文獻[2]方法,分析得知醫(yī)院A的特色領(lǐng)域主要是“泌尿生殖系統(tǒng)”、“呼吸系統(tǒng)”以及“肌肉骨骼系統(tǒng)和結(jié)締組織”3類疾病,而B醫(yī)院的特色領(lǐng)域主要是“妊娠、分娩和產(chǎn)褥期”、“泌尿生殖系統(tǒng)”和“呼吸系統(tǒng)”3類疾病。從上述轉(zhuǎn)院的患者中,按患者轉(zhuǎn)院前檢查出的疾病類型進行分析,結(jié)果見圖1,并按照患者疾病類型數(shù)量進行降序排列,見表3(表中為疾病類型簡稱)。
結(jié)合圖1(a)和表3可以發(fā)現(xiàn),從醫(yī)院B轉(zhuǎn)到醫(yī)院A的患者在醫(yī)院B檢查出來的疾病主要為泌尿生殖系統(tǒng)、呼吸系統(tǒng)以及肌肉骨骼系統(tǒng)和結(jié)締組織3大類疾病。由此可知,醫(yī)院A的醫(yī)療特色是促使醫(yī)院B的患者檢查后轉(zhuǎn)院的因素,同時佐證了醫(yī)院A的醫(yī)療特色的確為泌尿生殖系統(tǒng)、呼吸系統(tǒng)以及肌肉骨骼系統(tǒng)和結(jié)締組織3類疾病。結(jié)合圖1(b)和表3可以發(fā)現(xiàn),轉(zhuǎn)院的患者在醫(yī)院A檢查出來的疾病數(shù)量最多的前3類是呼吸系統(tǒng)疾病、泌尿生殖系統(tǒng)疾病和循環(huán)系統(tǒng)疾病,與醫(yī)院B的醫(yī)療特色領(lǐng)域相比較后,可知轉(zhuǎn)院患者符合醫(yī)院B的醫(yī)療特色領(lǐng)域。
圖1 患者疾病堆積柱形圖
1.4 檢查設(shè)備比較分析
不同級別的醫(yī)院,醫(yī)療設(shè)備配置存在差異,患者轉(zhuǎn)院前后所做的檢查項目存在差異。張麗[3]在文章中表明影響重復(fù)檢查的一個主要原因在于醫(yī)生為了避免醫(yī)患糾紛,醫(yī)生往往需要借助影像學(xué)檢查來證明其處方合理性,故出現(xiàn)大量重復(fù)檢查,例如患者都會進行血常規(guī)、US檢查等。在此對患者轉(zhuǎn)院前后做的檢查設(shè)備進行比較分析,以驗證上述觀點。
表3 轉(zhuǎn)院患者疾病類型數(shù)量排列表
分別研究兩個醫(yī)院特色醫(yī)療內(nèi)的患者在轉(zhuǎn)院前后做的設(shè)備檢查,按照轉(zhuǎn)院前檢查出來的疾病結(jié)果分類,抽取2013年9月~2014年8月的設(shè)備檢查量進行分析。其中,患者從醫(yī)院B轉(zhuǎn)到醫(yī)院A前后的設(shè)備檢查人數(shù),見表4,患者從醫(yī)院A轉(zhuǎn)到醫(yī)院B前后的設(shè)備檢查人數(shù),見表5。
表4 患者從醫(yī)院B轉(zhuǎn)到醫(yī)院A前后的設(shè)備檢查人數(shù)
表5 患者從醫(yī)院A轉(zhuǎn)到醫(yī)院B前后的設(shè)備檢查人數(shù)
從表4可知:① 對于呼吸系統(tǒng)疾病,轉(zhuǎn)院前在醫(yī)院B患者大部分做的檢查集中在CT、DR兩類較為普通的檢查手段,而轉(zhuǎn)院到醫(yī)院A后,患者一般都會先進行常規(guī)的US檢查,同時除了做CT、DR等醫(yī)院B常規(guī)設(shè)備檢查,部分患者還會使用更先進的檢查設(shè)備,如ECT、ES、URO設(shè)備等;② 對于泌尿系統(tǒng)疾病,轉(zhuǎn)院前患者在醫(yī)院B做的檢查集中在US檢查,而轉(zhuǎn)院到醫(yī)院A后,患者所做的檢查少數(shù)仍使用US檢查,但大部分患者使用DR、CT等設(shè)備檢查,同時部分患者使用醫(yī)院B沒有的設(shè)備進行檢查,如MR、ES設(shè)備等;③ 對于肌肉骨骼系統(tǒng)類疾病,轉(zhuǎn)院前患者在醫(yī)院B主要集中在DR、CT和MR檢查;而在轉(zhuǎn)院后,患者除了上述3種檢查外,大部分患者還做了US檢查。從表5可知,患者從醫(yī)院A轉(zhuǎn)到醫(yī)院B醫(yī)院后,3類疾病的患者在轉(zhuǎn)院后還是以US檢查為主,并且患者轉(zhuǎn)院前后做的檢查設(shè)備基本一致,患者轉(zhuǎn)院后沒有做高端設(shè)備檢查。
對上述表4和表5總結(jié)分析有以下結(jié)論:
(1)患者在不同級別醫(yī)院之間轉(zhuǎn)院治療,無論是從上級醫(yī)院A轉(zhuǎn)到下級醫(yī)院B,還是從下級醫(yī)院B轉(zhuǎn)到上級醫(yī)院A,患者在轉(zhuǎn)院后,進行檢查項目最多的為US常規(guī)超聲檢查。這也充分驗證了患者轉(zhuǎn)院后,大部分醫(yī)生都會選擇做基本的常規(guī)檢查,即使有時這些常規(guī)檢查作用并不明顯。
(2)從下級醫(yī)院B轉(zhuǎn)到上級醫(yī)院A后,大部分患者會做更先進醫(yī)療設(shè)備的檢查,說明醫(yī)療設(shè)備差異是導(dǎo)致影像重復(fù)檢查的一個原因。
(3)從上級別醫(yī)院A轉(zhuǎn)到下級別醫(yī)院B的患者,從檢查項目中可以發(fā)現(xiàn)大部分患者在醫(yī)院B做的檢查都是基礎(chǔ)的檢查,如泌尿生殖系統(tǒng)疾病和妊娠、分娩和產(chǎn)褥期疾病,在轉(zhuǎn)院前后檢查設(shè)備主要都是以US檢查為主,故可以判定大部分轉(zhuǎn)院到下級醫(yī)院的患者是在做康復(fù)期的定期復(fù)檢。
上述對區(qū)域內(nèi)患者轉(zhuǎn)院以及重復(fù)檢查進行了分析驗證,利用圖表形式分析了促使患者轉(zhuǎn)院的兩大因素:醫(yī)院的醫(yī)療特色以及醫(yī)院的檢查設(shè)備。但是對于深層次的數(shù)據(jù)挖掘,例如患者轉(zhuǎn)院與患者性別、年齡和患者類型之間,疾病類別和檢查設(shè)備之間是否存在關(guān)聯(lián)性等,需使用關(guān)聯(lián)規(guī)則算法對這些隱藏的信息進行深層的挖掘。
2.1 關(guān)聯(lián)規(guī)則概念
關(guān)聯(lián)規(guī)則可以描述如下[4]:設(shè)I = {i1,i2,…,im}是一項目集合,稱為項,事務(wù)數(shù)據(jù)庫D = {T1,T2,…,Tm},其中T包含在I中。在事務(wù)數(shù)據(jù)庫D中,其中項目集A包含的個數(shù),稱為項目集A的支持?jǐn)?shù),記為σA。項目集A的支持?jǐn)?shù)與D中事務(wù)總數(shù)的比值稱為項目集A的支持度,記為Support(A)來表示A在D中出現(xiàn)的概率:
若規(guī)定了最小支持度閾值min_Support,當(dāng)A的支持度大于等于min_Support,則將A項集稱為頻繁項集。
關(guān)聯(lián)規(guī)則可以用A→B的形式來表示,其中A∈I,B∈I且A∩B =,A是條件,而B是結(jié)果。關(guān)聯(lián)規(guī)則中包含有三個中重要的屬性[5]:
(1)支持度(Support),主要是指D中包含A和B的并的百分比,其支持度的表達(dá)式如下所示:
(2)置信度(Conf dence),指事務(wù)D中同時包含A、B,其表達(dá)式如下所示:
(3)重要性,也稱為提升度或者改善度(lift),主要描述了規(guī)則的先決條件和結(jié)果的關(guān)聯(lián)程度。重要性的表達(dá)式為:
2.2 Apriori算法
Apriori算法的核心思想是逐層搜索,其具體的迭代步驟為下述所述:① 第一次迭代,找到的是頻繁1項集的集合,并將此集合記為P1;② 第二次迭代,算法會根據(jù)第一次迭代的P1集合,通過再次查找數(shù)據(jù)庫來計算候選集的支持度,并將不滿足最小支持度的選項刪除,即可得到大小為2的頻繁項集,記為P2;③ 以此類推,重復(fù)以上兩步,就可以得到3、4、5…的頻繁項集,直到i項集。Apriori算法實現(xiàn)的偽代碼,可參考文獻[6],從偽代碼可以看到,在剪枝的過程中調(diào)用了has_infrequent_subset(c,LK-1)函數(shù),該函數(shù)主要用來判斷CK中是否含有非頻繁項集,刪除非頻繁項集,將會有利于提高算法的效率。
2.3 關(guān)聯(lián)規(guī)則算法應(yīng)用分析
本文對于關(guān)聯(lián)規(guī)則挖掘的內(nèi)容主要從兩個方面進行,首先針對患者轉(zhuǎn)院前后做的檢查設(shè)備以及檢查部位,分析驗證患者重復(fù)檢查的規(guī)則性;其次,分析挖掘患者所做的檢查設(shè)備與疾病類型之間的關(guān)聯(lián)性。
2.3.1 患者轉(zhuǎn)院前后重復(fù)檢查關(guān)聯(lián)規(guī)則分析
由于從醫(yī)院A轉(zhuǎn)院到醫(yī)院B的患者數(shù)量較少,關(guān)聯(lián)分析結(jié)果不明顯,故主要針對患者從醫(yī)院B轉(zhuǎn)院到醫(yī)院A后,對轉(zhuǎn)院前后的重復(fù)檢查關(guān)聯(lián)性進行分析。以患者類型、患者性別、患者在醫(yī)院B的檢查部位、檢查項目、患者在醫(yī)院B的檢查設(shè)備為輸入,以患者在醫(yī)院A的檢查項目、檢查部位、檢查設(shè)備為預(yù)測值。設(shè)定輸入、預(yù)測值,以及設(shè)置最小概率(置信度)為0.7,最小重要性為0.50后,總共得到了99條規(guī)則,對這些規(guī)則進行初步篩選后,抽取以下幾條進行分析:
(1)規(guī)則“DB2 Studies Examine Alias =胸部(肺部)CT平掃(XBBFBB), DB2Studies Modalities = CT -> Studies Modalities = CT”,該條規(guī)則的置信度為1,重要性為0.767。
(2)規(guī)則“DB2 Studies Examine Alias = 頭部(平掃)(TBBPSS), DB2 Studies Modalities = CT -> Studies Modalities = CT”,該條規(guī)則的置信度為1,重要性為0.626。
(3)規(guī)則“DB2 Patients Sex = F, DB2 Studies Modalities = US -> Studies Modalities = US”,其置信度為1,重要性為0.558。
(4)規(guī)則“DB2 Studies Examine Alias = 螺旋CT平掃(肺部), DB2 Patients Sex = M -> Studies Bodies Alias = 肺”,其置信度為0.7,重要性為1.088。
(5)規(guī)則“DB2 Studies Bodies Alias = 腎輸尿管膀胱, DB2 Patients Sex = M -> Studies Examine Alias = 雙腎+輸尿管+膀胱+前列腺(彩超)”,其置信度為0.750,重要性為1.403。
(6)規(guī)則“DB2 Studies Bodies Alias = 甲狀腺頸前淋巴結(jié),DB2 Studies Modalities = US -> Studies Examine Alias =甲狀腺+頸部淋巴結(jié)(淺表器官彩超)”,其置信度為0.721,重要性為0.725。
從以上6條規(guī)則中,表明患者從下級醫(yī)院B轉(zhuǎn)院到上級醫(yī)院A后,從檢查設(shè)備和部位的關(guān)聯(lián)規(guī)則中發(fā)現(xiàn)轉(zhuǎn)院后的重復(fù)性檢查較為嚴(yán)重,并且部分患者做的檢查,重復(fù)性的置信度都100%,其中有很多部位的設(shè)備檢查存在嚴(yán)重的重復(fù)檢查,例如胸部的CT掃面、頭部的CT掃描等。
2.3.2 患者疾病類型與檢查設(shè)備的關(guān)聯(lián)規(guī)則分析
參見醫(yī)院A和醫(yī)院B中患者檢查表(表1),輸入值字段為患者類型、患者性別、患者年齡、患者檢查部位、患者檢查項目以及患者檢查設(shè)備,預(yù)測字段為患者疾病類型。并且設(shè)定醫(yī)院A、醫(yī)院B關(guān)聯(lián)規(guī)則的最小概率為1.00,最小重要性為0.80。經(jīng)過關(guān)聯(lián)分析計算,醫(yī)院A獲得66條關(guān)聯(lián)規(guī)則,醫(yī)院B獲得22條關(guān)聯(lián)規(guī)則。分別對所有的這些規(guī)則進行篩選,以預(yù)測的患者類型為篩選的條件,由于患者疾病有10大類之多,先主要針對兩個醫(yī)院的醫(yī)療特色進行分析,醫(yī)院A抽取呼吸類、泌尿生殖類和骨骼系統(tǒng)疾病,而醫(yī)院B抽取妊娠類、呼吸類和泌尿生殖類進行分析。分別從兩家醫(yī)院的規(guī)則中選出幾條來分析,見表6。
表6 醫(yī)院A和醫(yī)院B患者疾病類型與檢查設(shè)備及部位間關(guān)聯(lián)規(guī)則
表6中所列規(guī)則,其置信度都是大于0.8的,重要性都大于0.5,故其規(guī)則質(zhì)量與其它規(guī)則相比,質(zhì)量還是比較可靠的。對表6分析后有以下結(jié)論:
(1)對于醫(yī)院A,在3類特色醫(yī)療中,呼吸系統(tǒng)疾病與DR檢查設(shè)備關(guān)聯(lián)系較好,表明在做胸部DR的患者中,患有呼吸系統(tǒng)疾病的概率會比較大,而骨骼疾病中,雖然檢查部位存在多樣性,但檢查設(shè)備主要集中在DR和MR上,泌尿系統(tǒng)疾病其檢查部位也存在多樣性,且其檢查設(shè)備也沒有固定性,但以DR、MR和URO為主。故醫(yī)院A的檢查設(shè)備中DR、MR的檢查數(shù)量將會比較突出。
(2)對于醫(yī)院B,其三類特色醫(yī)療領(lǐng)域中,呼吸系統(tǒng)疾病的檢查設(shè)備以CT、CR為主,妊娠疾病由于其特殊性,以超聲檢查US為主,而泌尿系統(tǒng)疾病其檢查設(shè)備主要為US。故醫(yī)院B的檢查設(shè)備中CT、CR、US的檢查數(shù)量會比較突出。
(3)對比醫(yī)院A、醫(yī)院B的疾病類型與檢查設(shè)備之間的關(guān)系,可以發(fā)現(xiàn),對于呼吸系統(tǒng)疾病和泌尿生殖系統(tǒng)疾病,醫(yī)院A所使用的檢查設(shè)備較醫(yī)院B先進。
本文對區(qū)域內(nèi)患者轉(zhuǎn)院檢查情況進行分析,得出上下級兩家三甲醫(yī)院之間的重復(fù)檢查相關(guān)結(jié)論,并驗證了醫(yī)療特色、設(shè)備先進性與患者轉(zhuǎn)院治療相關(guān),最后使用關(guān)聯(lián)規(guī)則算法,挖掘出患者疾病類型與檢查設(shè)備之間的關(guān)聯(lián)性。
[1] 張麗,董蓓莉,王丹丹,等.跨醫(yī)院短期重復(fù)超聲檢查現(xiàn)狀的調(diào)查與分析[J].全科醫(yī)學(xué)臨床與教育,2011,9(4):415-417.
[2] He BS,Ni HJ,Xu Z,et al.The Automatic Classif cation Research to Regional Medical Imaging Disease Based on Support Vector Machine [A].The International Conference on Computers and Information Processing Technologies[C].2015.
[3] 張麗,董蓓莉,任彥斌,等.影像學(xué)重復(fù)檢查原因剖析與應(yīng)對策略[J].浙江臨床醫(yī)學(xué),2011,13(4):477-478.
[4] 趙洪英,蔡樂才,李先杰.關(guān)聯(lián)規(guī)則挖掘的 Apriori 算法綜述[J].四川理工學(xué)院學(xué)報 (自然科學(xué)版),2011,24(1):66-70.
[5] 郭濤,張代遠(yuǎn).基于關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘 Apriori 算法的研究與應(yīng)用[J].計算機技術(shù)與發(fā)展,2011,21(6):101-103.
[6] 石正喜,葛科奇,曹財耀.基于關(guān)聯(lián)規(guī)則的利潤加權(quán)并行算法[J].計算機與網(wǎng)絡(luò),2013,(2):65-67.
Analysis and Associated Mining of Regional Repeated Medical Imaging Examinations
NI Hang-jian1, HE Bi-shi1, XU Zhe1, SHEN Wei-fu2, HE Wei2
1. School of Automation, Hangzhou Dianzi University, Hangzhou Zhejiang 310018, China; 2.Hangzhou Health Information Center, Hangzhou Zhejiang 310001, China
In this paper, the repeated medical imaging examinations in two hospitals in the region were analyzed. And the reasons of patients’ referral were also analyzed from two factors, including medical features and the advancement of examination equipment. Finally, the association between the diseases and examination equipment were mined by using association rule algorithms, which provided more accurate references for management decision-making.
regional medical; repetitive medical imaging examinations; association analysis
R445;R197.3
A
10.3969/j.issn.1674-1633.2016.10.051
1674-1633(2016)10-0154-05
2016-03-02
2016-03-21
浙江省重點企業(yè)研究院建設(shè)項目;浙江省智慧城市區(qū)域協(xié)同創(chuàng)新中心項目。
作者郵箱:19077340@qq.com