• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于診療知識庫和電子病歷的整合推薦方法研究

      2019-04-28 06:36:04胡德華方浩周宇葵羅愛靜
      關(guān)鍵詞:疾病診斷知識庫病歷

      胡德華,方浩,周宇葵,羅愛靜

      中南大學(xué)生命科學(xué)學(xué)院醫(yī)藥信息系,湖南長沙410083

      前言

      隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展和大數(shù)據(jù)時代的到來,電子醫(yī)療信息的規(guī)模也日益龐大[1-2]。受限于精力和記憶能力,人類的信息存儲量有限,無法對所有信息進(jìn)行有效的存儲和利用,信息過載所帶來的壓力也越來越明顯。同時人們對自身健康的關(guān)注度不斷提高,對醫(yī)療信息的質(zhì)量和準(zhǔn)確性不斷提出新的要求。

      近年來醫(yī)療信息化在政府和市場的推動下,已經(jīng)取得了一定的研究成果。但診療知識庫領(lǐng)域的研究方向多為診療知識庫的構(gòu)建和臨床輔助決策支持,研究如何為患者提供準(zhǔn)確且權(quán)威的疾病相關(guān)信息的文獻(xiàn)資料較少[3-5]。目前,患者自主了解自身疾病情況多采用互聯(lián)網(wǎng)檢索、詢問他人的方式,該方式雖然相對便捷,但無法保證獲取的疾病相關(guān)信息的準(zhǔn)確性和權(quán)威性,導(dǎo)致患者對自身健康情況的認(rèn)識產(chǎn)生偏差。因此,為保證患者獲取準(zhǔn)確的疾病知識,開展基于臨床診療知識庫和電子病歷的整合推薦方法研究具有重要的現(xiàn)實意義。

      本文探討根據(jù)臨床診療知識庫和患者電子病歷信息,通過對癥狀分詞,探討基于內(nèi)容推薦和協(xié)同過濾的整合推薦方法,識別其診療信息,并映射到疾病診療知識庫中相應(yīng)的疾病、檢查、藥品信息上,為患者提供診療過程中疾病相關(guān)信息,滿足其對自身健康管理的需求。

      1 國內(nèi)外研究現(xiàn)狀

      疾病、藥物、檢查、癥狀等醫(yī)療信息作為診療知識庫的核心內(nèi)容,貫穿患者的整個健康檔案,是醫(yī)生、患者最為關(guān)心的內(nèi)容。臨床診療知識庫可以為患者提供全面且權(quán)威的臨床指南、醫(yī)療知識,從而提高醫(yī)患整體的認(rèn)識水平。目前,國內(nèi)已構(gòu)建了許多診療知識庫,且各個知識庫的特點(diǎn)和內(nèi)容存在或多或少的差異,如中國醫(yī)院知識總庫、中國疾病知識總庫主要收錄臨床文獻(xiàn);萬方臨床診療知識庫、中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所臨床醫(yī)學(xué)知識庫則以疾病、檢查、藥品、指南為基礎(chǔ)[6]。相比之下,國外診療知識庫,如UpToDa 等,在臨床證據(jù)來源、規(guī)模、更新頻率、評價等方面更加完善,更注重臨床證據(jù)資源,加以整合分析,并對臨床診療證據(jù)的可信度進(jìn)行評估。UpToDa 等知識庫主要由知名出版機(jī)構(gòu)或者學(xué)術(shù)團(tuán)體創(chuàng)建和維護(hù),多為循證總結(jié)類的臨床知識庫,對知識庫內(nèi)容的編輯和審核都較為嚴(yán)格,這得益于其以醫(yī)生作者和專業(yè)編輯團(tuán)隊為核心,依靠臨床經(jīng)驗,并且根據(jù)臨床證據(jù)不斷對診療知識庫進(jìn)行更新和完善。雖然國外臨床知識庫的質(zhì)量優(yōu)于國內(nèi),但是礙于語言差異等因素,選擇國內(nèi)相對高質(zhì)量的知識庫作為臨床診療知識推薦的基礎(chǔ),實用性更強(qiáng)。因此,本文選擇同樣經(jīng)過臨床醫(yī)生編輯、審核構(gòu)建的萬方臨床診療知識庫,其無論在知識數(shù)據(jù)支持還是實用性上,都更為合適,能更好地為患者提供疾病、藥品、檢查、癥狀等方面的信息。

      在CNKI和WOS兩大數(shù)據(jù)庫中檢索發(fā)現(xiàn),“臨床知識庫”和“電子病歷”相關(guān)研究文獻(xiàn)以探討如何實現(xiàn)有效的臨床輔助和決策支持為主,依靠臨床知識庫或電子病歷中的規(guī)則約束醫(yī)療過程中醫(yī)生和患者的行為,為臨床診斷和治療提供建議,從而降低醫(yī)療意外的發(fā)生率,提高整體醫(yī)療質(zhì)量[7-9]。聶麗麗等[10]利用臨床藥學(xué)知識庫加強(qiáng)抗菌藥物的管理,規(guī)范激素類藥物與抗腫瘤藥物的使用,并為臨床用藥提供輔助作用,以降低患者用藥損害,從而提高醫(yī)生用藥水平,顯著降低用藥錯誤率,實現(xiàn)精準(zhǔn)化管理臨床用藥。尹梓名等[11]基于國際頭痛診斷標(biāo)準(zhǔn)構(gòu)建知識庫,并以此為基礎(chǔ),開發(fā)了覆蓋頭痛診斷整個流程的原發(fā)性頭痛輔助決策系統(tǒng),對常見的原發(fā)性頭痛診斷具有較高的準(zhǔn)確率。Ohno 等[12]構(gòu)建臨床知識庫,用于開發(fā)臨床決策支持系統(tǒng)和臨床數(shù)據(jù)的摘要,提出記錄的適當(dāng)參數(shù),并驗證疾病、藥物和實驗室結(jié)果??傊R床知識庫和電子病歷的相關(guān)研究從20 世紀(jì)90年代開始呈快速增長趨勢,并取得了一定的成果,主要面向醫(yī)療工作者,而針對患者群體,提供相應(yīng)醫(yī)療知識的研究較少。

      隨著人們生活水平的提高以及健康意識不斷加強(qiáng),對自我健康管理的需求也愈發(fā)強(qiáng)烈,而基于權(quán)威的臨床知識庫為患者推薦與其健康狀況相關(guān)的疾病知識,有助于提高患者對自身狀況的認(rèn)識,避免從其他渠道獲取錯誤知識而導(dǎo)致患者認(rèn)知的偏差。另一方面,醫(yī)患信息不對稱、患者缺乏醫(yī)學(xué)知識也是導(dǎo)致醫(yī)患關(guān)系緊張的重要因素。為患者推薦相關(guān)的醫(yī)學(xué)知識,有助于緩解醫(yī)患之間的緊張關(guān)系,推動醫(yī)患關(guān)系的健康良性發(fā)展[13]。因此,探究個性化的疾病知識推薦,對滿足患者健康管理的需求,了解自身健康狀況,改善醫(yī)患關(guān)系具有重要的理論意義和實踐價值。

      2 整合推薦方法

      本文在基于診療知識庫的內(nèi)容過濾推薦方法以及基于電子病歷的患者和疾病診斷的協(xié)同過濾推薦方法基礎(chǔ)上,提出一種整合推薦方法。整合推薦方法模型如圖1所示。

      2.1 基于診療知識庫的內(nèi)容過濾

      基于診療知識庫的內(nèi)容過濾采用中文分詞、TF-IDF、倒排索引等技術(shù)算法來實現(xiàn)。以臨床診療知識庫內(nèi)容為疾病診斷元數(shù)據(jù),以患者電子病歷中主述為主相關(guān)字段表達(dá)患者特征,計算兩者之間的相似度,得到患者與相應(yīng)疾病相關(guān)度的評分。針對疾病診斷元數(shù)據(jù)和電子病歷中的文本信息,以Python中的Jieba包為主要工具,加載基于臨床診療知識庫構(gòu)建的專業(yè)術(shù)語詞典,以優(yōu)化分詞效果,對文本信息進(jìn)行分析處理。TF-IDF是“詞頻”與“逆文檔頻率”的乘積,其與詞在某一記錄中出現(xiàn)的次數(shù)成正比,與所有記錄中出現(xiàn)的次數(shù)成反比[14]。

      本文引入了疾病診斷元數(shù)據(jù)的基于診療知識庫內(nèi)容的推薦,提升了推薦結(jié)果的相關(guān)性,使得推薦結(jié)果可解釋,也更易于被患者所感知,但同時,該評分結(jié)果缺乏個性化,且依賴于對疾病診斷元數(shù)據(jù)的深度分析。在此基礎(chǔ)上,引入患者屬性,可以構(gòu)建相應(yīng)的患者模型,分析其興趣需求,分析結(jié)果具有個性化,但推薦精度低,存在馬太效應(yīng)和因為患者F 行為稀疏而導(dǎo)致覆蓋率低等問題[15]。

      圖1 整合推薦方法模型圖Fig.1 Diagram of hybrid recommendation model

      2.2 基于電子病歷的患者協(xié)同過濾(Patient-based Collaborative Filtering,PbCF)

      基于電子病歷的PbCF 是電子病歷中具有類似疾病診斷的其他患者給予測試疾病診斷的相似度來估計測試患者對測試疾病診斷的相似度的一種過濾方法,其相似度計算公式如式(1)所示:

      其中,SUij表示標(biāo)號為i、j的兩個患者的相似度,I(i,j)表示患者i、j同時患有的疾病診斷集合,Rui表示患者u對疾病診斷i的評分,λ為懲罰(平滑)參數(shù),避免出現(xiàn)除零的情況。PbCF 的實現(xiàn)基于兩個假設(shè):當(dāng)前患者對于其相似患者所涉及的疾病存在一定的患病風(fēng)險;具有相似疾病的患者在未來也具有相似性的疾病。與基于內(nèi)容的推薦相比,協(xié)同過濾的優(yōu)勢表現(xiàn)在充分利用群體的智慧,其推薦精度要高于基于內(nèi)容的推薦算法,更加利于挖掘患者或疾病診斷間的隱含相關(guān)性,但相應(yīng)的,協(xié)同過濾的推薦結(jié)果解釋性較差,對時效性較強(qiáng)的疾病診斷不適用,同時面臨冷啟動問題[16]。冷啟動主要涉及患者冷啟動、疾病診斷冷啟動、系統(tǒng)冷啟動3個方面[17]。解決患者冷啟動可利用患者提供的年齡、性別等數(shù)據(jù)做粗粒度個性化處理,要求患者對一些疾病診斷進(jìn)行反饋,然后給患者推薦相似的疾病診斷。疾病診斷冷啟動,多利用內(nèi)容信息,將疾病診斷推薦給具有相似疾病診斷的患者,同時可以采用基于內(nèi)容的推薦來解決該問題,頻繁更新相關(guān)數(shù)據(jù)。再者,系統(tǒng)冷啟動需引入專家知識,通過高效的方式迅速建立起疾病診斷相關(guān)性矩陣。

      2.3 基于電子病歷的疾病診斷協(xié)同過濾(Diagnosticbased Collaborative Filtering,DbCF)

      基于電子病歷的DbCF是電子病歷中被同一患者患有的其他疾病診斷對應(yīng)測試患者的相似度來估計測試患者對測試疾病診斷的相似度的一種過濾方法。其相似度計算公式如式(2)所示:

      其中,SIij表示標(biāo)號為i、j的兩個疾病診斷的相似度,U(i,j)表示同時對i、j有評分的患者集合,Rui表示患者u對疾病診斷i的評分,λ為懲罰(平滑)參數(shù)。DbCF 是建立在患者可能患有與該疾病相關(guān)的其他疾病以及疾病之間的相關(guān)性較為穩(wěn)定兩個假設(shè)之上。與基于內(nèi)容的協(xié)同過濾相比,DbCF適合疾病診斷豐富且患者個性化需求強(qiáng)烈的領(lǐng)域,當(dāng)患者有新疾病,可以推薦與該疾病診斷相關(guān)的其他疾病,但必須在離線更新疾病診斷相似度表的情況下將新疾病診斷推薦給患者。

      2.4 整合推薦算法

      本文以患者-疾病診斷的交互評分矩陣為原始評分矩陣,結(jié)合基于診療知識庫內(nèi)容過濾所產(chǎn)生的歸一化后結(jié)果,形成整合評分矩陣,可防止評分矩陣過于稀疏,也將患者屬性所表達(dá)的與疾病診斷相關(guān)的因素引入評分矩陣,使得評分矩陣更加客觀。整合評分矩陣分別由基于患者和基于疾病診斷的協(xié)同過濾預(yù)測,再依據(jù)式(3)結(jié)合兩者評分得到最終預(yù)測結(jié)果:

      其中,Sij為最終預(yù)測結(jié)果,SUij和SIij分別為PbCF和DbCF的預(yù)測值,α和β分別表示PbCF和DbCF所對應(yīng)的權(quán)重值。α和β值采用線性規(guī)劃來確定最優(yōu)值[18]。本文采用的線性規(guī)劃模型如式(4)所示:

      該線性規(guī)劃模型為了求預(yù)測最終結(jié)果α·SUij+β·SIij和實際結(jié)果y之間差異最小時所對應(yīng)的α、β的值。其中yij代表患者i對疾病診斷j的實際評分值。本文采用十折交叉驗證,將整合評分矩陣分為10 組訓(xùn)練集和測試集,分別計算PbCF 和DbCF 的預(yù)測值,代入線性規(guī)劃模型,求得各組α、β的最優(yōu)值,最后取10 組數(shù)據(jù)結(jié)果的平均值,作為α、β的最終最優(yōu)值。

      3 實驗評估

      3.1 數(shù)據(jù)源

      本文所選取的數(shù)據(jù)源主要分為兩部分,分別是萬方臨床診療知識庫的高血壓相關(guān)數(shù)據(jù)和某醫(yī)院高血壓疾病患者的電子病歷數(shù)據(jù)。

      萬方臨床診療知識庫包含疾病庫、檢查庫、藥品庫、指南規(guī)范、循證文獻(xiàn)和病例報告等數(shù)據(jù)庫,由國內(nèi)上千名臨床資深專家團(tuán)隊共同創(chuàng)作,確保了診療知識庫的可靠性,為本文研究基于診療知識庫實現(xiàn)知識推薦提供有力的數(shù)據(jù)支持。其中,本文所實現(xiàn)的智能推薦功能,以疾病為結(jié)果,以患者為研究對象,進(jìn)行實驗評估。因此,在上述的6個數(shù)據(jù)庫中,選取與患者關(guān)系更為緊密的疾病數(shù)據(jù)庫,作為知識推薦的基礎(chǔ),且以高血壓相關(guān)的疾病數(shù)據(jù)作為示范疾病診斷元數(shù)據(jù)。抽取某醫(yī)院10 000名高血壓患者的電子病歷信息,以患者的診斷信息作為原始評分矩陣構(gòu)建的依據(jù),設(shè)定若患者具有某一疾病診斷結(jié)果,則該患者對該疾病診斷評分為1。雖然臨床診斷中有主要診斷和次要診斷之分,但兩者的劃分主要依據(jù)當(dāng)前住院的主要原因,且就患者個體而言,主要診斷與次要診斷所對應(yīng)的疾病與患者密切相關(guān)程度不一定具有較大差異,所以診斷結(jié)果中出現(xiàn)的診斷結(jié)果都將評分設(shè)為1。在此基礎(chǔ)上,引入基于診療知識庫內(nèi)容過濾的評分,可解決原始評分矩陣中評分的無差異化和稀疏問題。

      3.2 實驗結(jié)果和評估

      十折交叉驗證后,取α,β各組數(shù)據(jù)結(jié)果的均值,得到α=0.61,β=0.39 ,因此,最終預(yù)測結(jié)果Sij=0.61·SUij+0.39·SIij。本文選取平均絕對百分誤差(MAPE)作為預(yù)測結(jié)果的評價指標(biāo),對PbCF、DbCF 和整合推薦方法3 種方法進(jìn)行評估對比,每個方法都針對6組K近鄰(K-Nearest Neighbor,KNN)進(jìn)行試驗,由于K值一般不超過50,所以K選擇10、20、30、40、50、60,其中K=60 作為觀察結(jié)果,與其他結(jié)果做對比,分析MAPE 值是否有明顯的優(yōu)化[19]。結(jié)果如表1所示。

      上述3 種方法的最小MAPE 值對比結(jié)果表明整合推薦方法的MAPE 最小值為0.143,比PbCF 和DbCF所對應(yīng)的最小值0.176和0.186要小,表明整合推薦方法的預(yù)測效果明顯優(yōu)于PbCF和DbCF。

      表1 PbCF、DbCF和整合推薦方法的平均絕對百分誤差值Tab.1 Mean absolute deviation of PbCF,DbCF and hybrid recommendation method

      4 結(jié)論

      本文提出一種在診療知識庫內(nèi)容過濾的基礎(chǔ)上,融合PbCF 和DbCF 整合推薦方法。以臨床診療知識庫和電子病歷中高血壓數(shù)據(jù)為實驗數(shù)據(jù),對整合推薦方法進(jìn)行評估,為高血壓患者推薦診療知識庫中相關(guān)的疾病知識。結(jié)果表明,整合推薦方法比獨(dú)立的PbCF、DbCF 效果更好,為患者推薦疾病診療知識,具有廣泛的應(yīng)用前景。但由于所選診療知識庫的高血壓疾病種類覆蓋面不及電子病歷中高血壓患者所涉及的疾病種類,所以擴(kuò)大診療知識庫疾病覆蓋面對推薦結(jié)果的影響仍需進(jìn)一步探討。

      猜你喜歡
      疾病診斷知識庫病歷
      強(qiáng)迫癥病歷簿
      趣味(語文)(2021年9期)2022-01-18 05:52:42
      超高頻超聲在淺表器官疾病診斷中的應(yīng)用
      “大數(shù)的認(rèn)識”的診斷病歷
      《呼吸疾病診斷流程與治療策略》已出版
      基于TRIZ與知識庫的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計中的應(yīng)用
      為何要公開全部病歷?
      基于Web及知識推理的寵物狗疾病診斷專家系統(tǒng)
      高速公路信息系統(tǒng)維護(hù)知識庫的建立和應(yīng)用
      CD10表達(dá)在滋養(yǎng)葉細(xì)胞疾病診斷中的臨床意義
      基于Drupal發(fā)布學(xué)者知識庫關(guān)聯(lián)數(shù)據(jù)的研究
      圖書館研究(2015年5期)2015-12-07 04:05:48
      增城市| 武川县| 郁南县| 定结县| 桂平市| 邛崃市| 金川县| 石河子市| 合川市| 镇江市| 大田县| 穆棱市| 五寨县| 连山| 琼结县| 牟定县| 工布江达县| 武清区| 吴忠市| 宣武区| 申扎县| 夏邑县| 七台河市| 镇雄县| 阜南县| 乌鲁木齐县| 海口市| 汨罗市| 孟村| 保山市| 漳浦县| 林芝县| 宁波市| 南充市| 汾西县| 兴仁县| 稷山县| 齐河县| 灌阳县| 类乌齐县| 孝感市|