• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于區(qū)塊鏈的中醫(yī)電子病歷高效查詢方法研究

      2022-01-07 01:23:04柴凱杰丁有偉胡孔法
      軟件導(dǎo)刊 2021年12期
      關(guān)鍵詞:分片數(shù)據(jù)量病歷

      柴凱杰,丁有偉,胡孔法

      (南京中醫(yī)藥大學(xué)人工智能與信息技術(shù)學(xué)院,江蘇南京 210046)

      0 引言

      中醫(yī)電子病歷在醫(yī)院中發(fā)揮著重要作用。隨著大數(shù)據(jù)時代的到來,中醫(yī)電子病歷數(shù)據(jù)蘊含著巨大價值,具有重要的研究意義。當(dāng)前中醫(yī)電子病歷查詢主要是通過各種電子病歷系統(tǒng)實現(xiàn)的,但系統(tǒng)會受到各種攻擊,以及系統(tǒng)本身存在一些漏洞等因素,可能導(dǎo)致用戶隱私泄露,并且系統(tǒng)查詢結(jié)構(gòu)比較單一,查詢速度仍有待提高。因此,尋找一種可同時兼顧查詢性能與用戶隱私安全的中醫(yī)電子病歷查詢方法是中醫(yī)藥信息化發(fā)展過程中亟待解決的關(guān)鍵問題之一。

      由于中醫(yī)電子病歷數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)類型復(fù)雜等特性,在共享與存儲方面需要提出新的架構(gòu)[1]。肖勇等[2]對中醫(yī)藥防控救治信息化工作進行研究,并指出其中存在的信息共享不足等問題。區(qū)塊鏈技術(shù)可以很好地解決以上問題。區(qū)塊鏈?zhǔn)且环N新興的數(shù)據(jù)安全技術(shù),具有匿名性、去中心化、防篡改等特性,且目前發(fā)展日趨成熟。很多學(xué)者對其進行了大量研究,如邵奇峰等[3]詳細(xì)介紹區(qū)塊鏈體系架構(gòu),并從區(qū)塊鏈數(shù)據(jù)、共識機制、智能合約、可擴展性、安全性幾方面闡述了區(qū)塊鏈原理與技術(shù);蔡曉晴等[4]提取出區(qū)塊鏈的5 層核心架構(gòu),并就其中數(shù)據(jù)、網(wǎng)絡(luò)、共識3層基礎(chǔ)架構(gòu)進行詳細(xì)說明;潘晨等[5]對區(qū)塊鏈的性能缺陷進行總結(jié),并介紹了可提升區(qū)塊鏈性能及容量的相關(guān)技術(shù);Hung 等[6]通過分片技術(shù)提高了區(qū)塊鏈數(shù)據(jù)交易性能;劉懿中等[7]從共識機制方面對區(qū)塊鏈進行了詳細(xì)研究;方維維等[8]對PBFT 共識算法進行優(yōu)化,提高了區(qū)塊鏈的可擴展性。

      區(qū)塊鏈技術(shù)在中醫(yī)藥領(lǐng)域的應(yīng)用主要集中在中醫(yī)電子病歷方面。湯穎[9]分析了區(qū)塊鏈技術(shù)在電子病歷中的應(yīng)用;肖勇等[10]指出中醫(yī)信息化建設(shè)中存在的問題,并提出建設(shè)性意見。在安全性方面,牛淑芬等[11]提出基于聚合密鑰的密文檢索方案,提高了中醫(yī)電子病歷的安全性;侯姝言等[12]將可追蹤性安全機制應(yīng)用于藥品防偽溯源,同時將區(qū)塊鏈隱私保護應(yīng)用于電子健康病歷;張劍等[13]通過基于區(qū)塊鏈的電子病歷存儲系統(tǒng)提高了電子病歷數(shù)據(jù)的安全性。在查詢性能方面,徐知海等[14]提出基于蟻群算法的區(qū)域電子病歷查詢方法;肖麗等[15]提出基于區(qū)塊鏈技術(shù)的中醫(yī)電子病歷系統(tǒng)架構(gòu);郭坤等[16]為保證數(shù)據(jù)的高效訪問,創(chuàng)建排序索引以提高檢索性能;李莉等[17]通過分片技術(shù)提高了區(qū)塊鏈的可擴展性。以上文獻(xiàn)雖然分開考慮了中醫(yī)電子病歷的安全性與查詢性能,但是未能將兩者同時兼顧。

      針對中醫(yī)電子病歷無法兼顧安全性與查詢性能的問題,本文結(jié)合區(qū)塊鏈分片技術(shù)[18-22],提出一個基于地理位置劃分的區(qū)塊鏈分片方案,利用區(qū)塊鏈的去中心化、不可篡改等機制保證了中醫(yī)電子病歷查詢的安全性;采用分片技術(shù)將全國醫(yī)院按等級分片,對每個分片內(nèi)節(jié)點上存儲的數(shù)據(jù)增加索引,從而兼顧了中醫(yī)藥數(shù)據(jù)的安全性與查詢性能。實驗結(jié)果表明,通過對1 200 條數(shù)據(jù)進行查詢并且對比了區(qū)塊鏈分片與不分片的情況,發(fā)現(xiàn)分片查詢效果明顯優(yōu)于不分片查詢,同時增加索引查詢效果顯著優(yōu)于未添加索引查詢。本文的創(chuàng)新點如下:

      (1)提出基于地理位置劃分的區(qū)塊鏈分片方案,并且按照醫(yī)院級別設(shè)置全節(jié)點和輕節(jié)點,在緩解存儲交易壓力的同時,可提高中醫(yī)藥數(shù)據(jù)查詢性能。

      (2)通過區(qū)塊鏈的節(jié)點分片策略及索引技術(shù),提高了區(qū)塊鏈查詢性能,實現(xiàn)了對中醫(yī)藥數(shù)據(jù)定值查詢與范圍查詢的快速響應(yīng)。

      1 模型

      1.1 數(shù)據(jù)模型

      中醫(yī)病歷歷史悠久,經(jīng)歷了漫長的發(fā)展過程并發(fā)展為如今的中醫(yī)電子病歷。中醫(yī)電子病歷的主要記錄包括:編號、標(biāo)準(zhǔn)化臨床表現(xiàn)、標(biāo)準(zhǔn)化病機、膏方、劑量等。中醫(yī)電子病歷記錄的數(shù)據(jù)具有較高的潛在研究價值。區(qū)塊鏈電子病歷結(jié)構(gòu)表示例如表1 所示。

      Table 1 Blockchain electronic medical record structure example表1 區(qū)塊鏈電子病歷結(jié)構(gòu)表示例

      區(qū)塊鏈?zhǔn)且环N去中心化、不可篡改、可追溯、可信的分布式數(shù)據(jù)庫。區(qū)塊鏈?zhǔn)怯蓞^(qū)塊相互連接形成的一種鏈?zhǔn)酱鎯Y(jié)構(gòu),由區(qū)塊頭和區(qū)塊體組成。區(qū)塊頭存儲區(qū)塊的頭信息,包含上一個區(qū)塊的哈希值、隨機數(shù)、時間戳、難度值等;區(qū)塊體包含其交易信息,交易信息存儲在由Merkle 樹根組成的葉子節(jié)點中。中醫(yī)電子病歷區(qū)塊鏈結(jié)構(gòu)如圖1 所示。

      Fig.1 Blockchain structure of traditional Chinese medicine electronic medical records圖1 中醫(yī)電子病歷區(qū)塊鏈結(jié)構(gòu)

      表1 中每一條電子病歷記錄作為區(qū)塊鏈中的一個交易,兩兩進行哈希運算,將若干條交易打包形成一個區(qū)塊。區(qū)塊內(nèi)各交易以Merkle 樹的形式進行組織,區(qū)塊形成后插入到現(xiàn)有區(qū)塊鏈中。

      1.2 網(wǎng)絡(luò)模型

      醫(yī)院網(wǎng)絡(luò)主要由電子計算機與通信設(shè)備組成,為醫(yī)院所屬各部門提供用戶診斷信息的存儲、管理、收集、查詢與數(shù)據(jù)交換等服務(wù)。但這種中心化的網(wǎng)絡(luò)方式會造成數(shù)據(jù)隱私泄露及其他安全問題,且日益增長的數(shù)據(jù)會帶來存儲壓力,同時內(nèi)外網(wǎng)分離會造成數(shù)據(jù)信息孤島問題,不利于用戶信息共享。醫(yī)院網(wǎng)絡(luò)如圖2 所示。

      Fig.2 Hospital network圖2 醫(yī)院網(wǎng)絡(luò)

      使用區(qū)塊鏈可很好地解決以上問題,區(qū)塊鏈?zhǔn)且环N去中心化的網(wǎng)絡(luò),在區(qū)塊鏈網(wǎng)絡(luò)體系中不存在中心化的服務(wù)器,每一個節(jié)點都是對等的,不存在客戶端與服務(wù)器的區(qū)分。一方面,區(qū)塊鏈具有的不可篡改、加密等特性可保證數(shù)據(jù)安全;另一方面,可把每個醫(yī)院當(dāng)作一個節(jié)點,節(jié)點之間相互對等,從而去除了醫(yī)院對中心化服務(wù)器的依賴,并且少數(shù)節(jié)點被攻擊崩潰并不會影響整個區(qū)塊鏈網(wǎng)絡(luò)的正常運行。同時,節(jié)點之間相互通信,可很好地解決數(shù)據(jù)信息孤島問題。

      本文將全國醫(yī)院都當(dāng)作節(jié)點,各個節(jié)點之間相互通信,構(gòu)成區(qū)塊鏈網(wǎng)絡(luò)。為減輕存儲壓力、提高查詢性能,對節(jié)點進行分片。根據(jù)省份地區(qū)及醫(yī)院等級進行分片,將區(qū)塊鏈分片與地理位置相關(guān)聯(lián),從而使區(qū)塊鏈中醫(yī)電子病歷的理論模型映射到現(xiàn)實生活中。若各個分片內(nèi)包含節(jié)點數(shù)量過多,可再次按市、縣(鎮(zhèn))進行分片,從而構(gòu)建基于地理位置的區(qū)塊鏈分片網(wǎng)絡(luò)。區(qū)塊鏈分片如圖3 所示。

      Fig.3 Blockchain sharding圖3 區(qū)塊鏈分片

      為充分利用各醫(yī)院的存儲與計算資源,提高中醫(yī)電子病歷查詢性能,具體分片規(guī)則如下:①將中醫(yī)藥數(shù)據(jù)依次按照省進行分片劃分;②各個省市的三甲醫(yī)院為全節(jié)點,主要負(fù)責(zé)同步全國所有分片內(nèi)的交易,其他醫(yī)院為輕節(jié)點,負(fù)責(zé)處理各自醫(yī)院的交易。該方法的優(yōu)點是可以同步所有數(shù)據(jù)交易,同時減輕存儲壓力。

      通過將醫(yī)院網(wǎng)絡(luò)映射到區(qū)塊鏈網(wǎng)絡(luò),最后構(gòu)建基于地理位置的區(qū)塊鏈分片網(wǎng)絡(luò),一方面可緩解存儲壓力,另一方面可在每個分片內(nèi)獨立并行地處理交易。若需跨分片交易,則進行同步或異步跨分片交易。通過分片提高了交易處理性能,并通過各個節(jié)點之間的相互通信解決了孤島問題。該方法同時兼顧了安全性與查詢性能,提高了區(qū)塊鏈的可擴展性。

      2 查詢方法

      2.1 數(shù)據(jù)存儲

      目前,電子病歷存儲方式十分多樣化,包括分科室、分階段、分內(nèi)容存儲,以及基于XML 的電子病歷存儲等,但是這些存儲方式都過于中心化。

      在實際應(yīng)用中,中醫(yī)醫(yī)院一般包括中醫(yī)診所、社區(qū)醫(yī)院、縣級醫(yī)院、市級醫(yī)院和省級醫(yī)院等,醫(yī)院所在地之間有明確的行政隸屬關(guān)系,每個醫(yī)院的規(guī)模、產(chǎn)生的數(shù)據(jù)量、數(shù)據(jù)存儲及處理能力各不相同。將中醫(yī)電子病歷存儲在區(qū)塊鏈上可保證其安全性,但其查詢過程需要所有醫(yī)院之間進行共識,共識過程復(fù)雜且遠(yuǎn)距離的數(shù)據(jù)通信延遲較大,導(dǎo)致查詢性能低下。因此,在保證安全性的同時,可通過分片及增加索引的方式提高區(qū)塊鏈數(shù)據(jù)查詢性能。

      數(shù)據(jù)存儲采用CouchDB 數(shù)據(jù)庫進行鍵值對存儲,在每個分片內(nèi),節(jié)點存儲的數(shù)據(jù)相同,并且所有數(shù)據(jù)根據(jù)分片數(shù)量平均進行存儲。利用CouchDB 數(shù)據(jù)庫的優(yōu)勢,可對中醫(yī)電子病歷數(shù)據(jù)進行更復(fù)雜的查詢。通過私有數(shù)據(jù)對中醫(yī)藥數(shù)據(jù)進行存儲,可保護用戶的隱私安全,并且對數(shù)據(jù)進行分類及增加索引。對數(shù)據(jù)進行分類可使中醫(yī)藥數(shù)據(jù)的管理更加動態(tài)化、合理化及規(guī)律化;通過索引可大大提高查詢速度,從而保證了數(shù)據(jù)的安全性和查詢性能。

      2.2 數(shù)據(jù)查詢

      本實驗查詢主要分為定值查詢與范圍查詢。

      (1)定值查詢:查詢存儲的某一條數(shù)據(jù)。例如:查詢姓名為張三(或編號為HS001)的全部電子病歷記錄描述。

      (2)范圍查詢:查詢存儲數(shù)據(jù)索引參數(shù)某一范圍內(nèi)的數(shù)據(jù)。例如:查詢編號為HS001~HS100(或住院日期為1~5 天內(nèi))患者的全部電子病歷記錄描述。

      使用CouchDB 數(shù)據(jù)庫、增加索引的優(yōu)勢在于當(dāng)存儲大量數(shù)據(jù)時,不必按順序遍歷每一條數(shù)據(jù)進行一一對比,并且減少了磁盤的I/O 操作,可很快定位到數(shù)據(jù)所在位置。其高效查詢的具體設(shè)計與實現(xiàn)流程如下:①以raft 方式啟動網(wǎng)絡(luò);②啟用CouchDB 數(shù)據(jù)庫;③對中醫(yī)藥數(shù)據(jù)創(chuàng)建索引;④安裝實例化鏈碼;⑤選擇查詢條件;⑥根據(jù)查詢條件選擇對應(yīng)鏈碼進行查詢;⑦對查詢結(jié)果進行驗證,多次查詢并在最后進行對比的目的是為了防止惡意節(jié)點進行破壞。具體查詢流程如圖4 所示。

      Fig.4 Query flow圖4 查詢流程

      2.3 安全性分析

      隨著可信時代的到來,人們越來越重視個人的隱私安全。本文主要通過以下4 方面保證人們的隱私安全:

      (1)利 用Hyperledger Fabric平臺存儲數(shù)據(jù),Hyperledger Fabric 平臺具有特有的許可、加密處理等機制。

      (2)通過建立通道保證數(shù)據(jù)的隱私性,各分片內(nèi)的各個節(jié)點都可相互建立通道。只有通道內(nèi)的節(jié)點可以查看該部分?jǐn)?shù)據(jù),而其他加入通道內(nèi)的節(jié)點無法查看。

      (3)采用私有數(shù)據(jù),在保證安全性的同時,可減少建立通道時的管理開銷,一定程度上提高了可擴展性。

      (4)Fabric1.4 版本的raft 協(xié)議具有“崩潰容錯”的特性,在安全性方面具有一定保障。

      通過以上4 個方面,利用區(qū)塊鏈本身較強的安全性以及平臺的獨特優(yōu)勢,可實現(xiàn)中醫(yī)藥數(shù)據(jù)的安全保障及隱私保護等。同時利用區(qū)塊鏈去中心化的特性以及平臺“崩潰容錯”等特性,使基于區(qū)塊鏈的中醫(yī)電子病歷相比普通中心化的中醫(yī)電子病歷具有不可比擬的優(yōu)勢。

      3 實驗及分析

      3.1 實驗環(huán)境

      實驗環(huán)境為VMware? Workstation 14 Pro,Hyperledger Fabric1.4 版本,ubuntu 虛擬機內(nèi)存為2GB。在此虛擬機上搭建Fabric1.4,以raft 方式啟動網(wǎng)絡(luò),選擇CouchDB 數(shù)據(jù)庫,在不分片單solo 模式下以及兩個分片以raft 方式啟動網(wǎng)絡(luò)多個order 的情況下,比較傳輸交易時間及不同數(shù)據(jù)量的查詢時間,存儲數(shù)據(jù)使用私有數(shù)據(jù)的方式以保證安全性,同時添加了索引功能以實現(xiàn)范圍查詢,可大大提高查詢速度。

      Hyperledger Fabric 是一個開源的企業(yè)級許可分布式賬本平臺,具有高度模塊化與可配置的架構(gòu),支持可插拔共識協(xié)議及多種通用編程語言等,并通過MSP(成員服務(wù)提供商)、PKI(公鑰基礎(chǔ)設(shè)施)、數(shù)字證書等保證安全性與隱私性。

      3.2 實驗結(jié)果分析

      本實驗在目前比較流行的Hyperledger Fabric 平臺上進行部署,設(shè)置了10 個節(jié)點,其中有4 個全節(jié)點、6 個輕節(jié)點。首先,以raft 方式啟動網(wǎng)絡(luò),該方式的優(yōu)點是可以在每個分片內(nèi)分配一個order 節(jié)點,從而加快每個分片內(nèi)的交易處理性能,提高了可擴展性。通過Org1 和Org2 兩個組織模擬分片,在每個組織內(nèi)分配兩個節(jié)點,并通過安裝調(diào)用實例化鏈碼實現(xiàn)對中醫(yī)藥數(shù)據(jù)的查詢。

      為測試本文算法的性能,在具有1 200 條真實數(shù)據(jù)的電子病歷數(shù)據(jù)集上對區(qū)塊鏈各方面查詢性能進行比較。不分片是在單solo 模式下進行的,而分片是以raft 模式啟動網(wǎng)絡(luò),可在每個分片內(nèi)分配一個order,從而大大提高分片對交易的處理性能。

      如圖5 所示,按數(shù)據(jù)量等值遞增設(shè)置6 組實驗,分別測試在分片和不分片情況下不同數(shù)據(jù)交易量的查詢時間對比。實驗結(jié)果表明,在相同數(shù)據(jù)量下,分片的查詢速度明顯優(yōu)于不分片的查詢速度,這是分片的必然結(jié)果。同時隨著數(shù)據(jù)量的增大,分片查詢交易時間的增長速率明顯慢于不分片的情況,這是由于在大量數(shù)據(jù)下,每個分片獨立并行進行查詢,因此體現(xiàn)出分片的查詢優(yōu)勢。

      Fig.5 Comparison of query time for different transaction volumes圖5 不同數(shù)據(jù)交易量查詢時間對比

      如圖6 所示,按數(shù)據(jù)量等值遞增設(shè)置6 組實驗,分別測試在分片和不分片情況下不同數(shù)據(jù)交易量的傳輸交易時間對比。實驗結(jié)果表明,在相同數(shù)據(jù)量下,分片傳輸交易速度大于不分片的情況,并且隨著數(shù)據(jù)量的增大,分片傳輸交易時間的增長速率慢于不分片的情況,這是分片帶來的必然結(jié)果。

      Fig.6 Comparison of different data transaction volume transmission time圖6 不同數(shù)據(jù)交易量傳輸時間對比

      如圖7 所示,設(shè)置6 組實驗,在對中醫(yī)藥數(shù)據(jù)增加索引后,分片測試不同數(shù)據(jù)量下范圍查詢與無索引查詢時間對比。實驗結(jié)果表明,在相同數(shù)據(jù)量下,增加索引可很快地提高查詢速度,并且隨著數(shù)據(jù)量的增大,增加索引的時間波動不大且趨于穩(wěn)定,而無索引查詢時間則與數(shù)據(jù)量的增加成正比,可顯著體現(xiàn)增加索引帶來的優(yōu)勢。

      Fig.7 Time comparison between range query and non-indexed query圖7 范圍查詢與無索引查詢時間對比

      不同數(shù)據(jù)交易量傳輸時間對比如圖8 所示,數(shù)據(jù)量1的存儲量是數(shù)據(jù)量2 的30 倍。實驗結(jié)果表明,不同存儲量的交易不會影響其查詢速度,總體來說查詢時間趨于穩(wěn)定,波動不大。

      Fig.8 Comparison of query time for different data transaction volumes圖8 不同數(shù)據(jù)交易量傳輸時間對比

      4 結(jié)語

      本文對基于區(qū)塊鏈的中醫(yī)電子病歷高效查詢方法進行研究,通過分片及增加索引提高了查詢性能,使得中醫(yī)藥數(shù)據(jù)管理更加規(guī)范化與動態(tài)化。但是本文方法在跨分片交易方面還存在不足,這將是下一步研究的重點。區(qū)塊鏈“不可能三角”一直是需要攻克的難點,相信在不久的將來,區(qū)塊鏈的應(yīng)用將會越來越普遍。

      猜你喜歡
      分片數(shù)據(jù)量病歷
      上下分片與詞的時空佈局
      詞學(xué)(2022年1期)2022-10-27 08:06:12
      強迫癥病歷簿
      趣味(語文)(2021年9期)2022-01-18 05:52:42
      基于大數(shù)據(jù)量的初至層析成像算法優(yōu)化
      計算Lyapunov指數(shù)的模糊C均值聚類小數(shù)據(jù)量法
      分片光滑邊值問題的再生核方法
      “大數(shù)的認(rèn)識”的診斷病歷
      CDN存量MP4視頻播放優(yōu)化方法
      高刷新率不容易顯示器需求與接口標(biāo)準(zhǔn)帶寬
      寬帶信號采集與大數(shù)據(jù)量傳輸系統(tǒng)設(shè)計與研究
      電子制作(2019年13期)2020-01-14 03:15:18
      基于模糊二分查找的幀分片算法設(shè)計與實現(xiàn)
      盘锦市| 柞水县| 绥芬河市| 新安县| 翁源县| 永寿县| 彝良县| 邳州市| 奉节县| 镇沅| 客服| 两当县| 来凤县| 兴业县| 松原市| 长顺县| 卢龙县| 隆德县| 建阳市| 桃源县| 珲春市| 明星| 都江堰市| 惠安县| 镇沅| 鄂州市| 东平县| 远安县| 宜章县| 监利县| 吉水县| 定州市| 万州区| 富裕县| 建水县| 呼伦贝尔市| 乐亭县| 忻城县| 洪雅县| 手机| 清原|