林 攀,陳健美,王遠(yuǎn)朋
?
基于混合技術(shù)的EMR系統(tǒng)醫(yī)學(xué)信息保護(hù)
林 攀,陳健美,王遠(yuǎn)朋
(江蘇大學(xué)醫(yī)學(xué)研究所,江蘇 鎮(zhèn)江 212013)
隨著電子病歷記錄(EMR)系統(tǒng)在諸多醫(yī)院的廣泛使用,醫(yī)生可以利用計(jì)算機(jī)云交互和共享醫(yī)學(xué)數(shù)據(jù),并通過(guò)下一代臨床決策支持系統(tǒng)提取醫(yī)學(xué)記錄信息,從而做出精確診斷。為解決EMR系統(tǒng)傳輸過(guò)程中的醫(yī)學(xué)信息泄露或篡改問(wèn)題,將EMR系統(tǒng)中經(jīng)過(guò)B++編碼后的醫(yī)學(xué)數(shù)據(jù)嵌入到病人的指紋中,通過(guò)基于非下采樣Contourlet變換的數(shù)字水印算法,提取含有特征結(jié)構(gòu)信息和注冊(cè)密鑰的指紋,并將其嵌入到病人的醫(yī)學(xué)圖像中,提高EMR系統(tǒng)醫(yī)學(xué)信息的安全性。實(shí)驗(yàn)結(jié)果表明,該方法實(shí)現(xiàn)的醫(yī)學(xué)水印圖像具有較高的魯棒性,并且由于允許高容量的醫(yī)學(xué)信息嵌入,保證了醫(yī)學(xué)數(shù)據(jù)的完整性。
電子病歷記錄;非下采樣Contourlet變換;B++編碼;生物認(rèn)證;指紋;數(shù)字水印
在信息通信技術(shù)的推動(dòng)下,醫(yī)療保健服務(wù)被提出后,電子健康在很多國(guó)家得到廣泛應(yīng)用。而電子健康的重要部分是電子病歷記錄(Electronic Medical Records, EMR)系統(tǒng)。EMR包括病程記錄、檢查檢驗(yàn)結(jié)果、醫(yī)囑、手術(shù)記錄和診斷圖像等。由于EMR系統(tǒng)在諸多醫(yī)院得到了廣泛使用,不但可以通過(guò)計(jì)算機(jī)云交互和共享醫(yī)學(xué)數(shù)據(jù),而且利用下一代臨床決策支持系統(tǒng)(Clinical Decision Support Systems, CDSS)提取醫(yī)學(xué)記錄信息幫助醫(yī)生做出精確的診斷。在這樣的背景下,醫(yī)學(xué)數(shù)據(jù)可以輕易偽造或非法買(mǎi)賣(mài)給第三方。因此,保護(hù)個(gè)人醫(yī)療信息的完整性具有十分重要的意義。
生物認(rèn)證又稱生物識(shí)別,是通過(guò)計(jì)算機(jī)利用人體所固有的生理特征或行為特征來(lái)進(jìn)行個(gè)人身份鑒定。常用的生物特征包括臉像、虹膜、指紋、掌紋、聲音、筆跡等。指紋是一個(gè)人獨(dú)有的信息,通過(guò)指紋固有的圖案可以分辨具體的人。指紋技術(shù)目前發(fā)展十分成熟。比如文獻(xiàn)[1]研究指紋幾何結(jié)構(gòu)特征;文獻(xiàn)[2]利用脊的特征來(lái)識(shí)別指紋。醫(yī)學(xué)數(shù)字水印技術(shù)被用于醫(yī)學(xué)圖像[3],但是沒(méi)有充分考慮到醫(yī)學(xué)水印的安全需求。文獻(xiàn)[4]提出將病人數(shù)據(jù)加密后的信息嵌入到醫(yī)學(xué)圖像的最低有效位上;文獻(xiàn)[5]提出通過(guò)誤差控制代碼技術(shù)隱藏病人信息,實(shí)現(xiàn)可靠地傳輸、存儲(chǔ)醫(yī)學(xué)圖像;文獻(xiàn)[6]利用離散余弦變換(Discrete Cosine Transform, DCT)實(shí)現(xiàn)數(shù)據(jù)隱藏,把電子病患記錄(Electronic Patient Records, EPR)數(shù)據(jù)嵌入DCT的低頻系數(shù)上,具有良好的魯棒性,同時(shí)可抗普通的旋轉(zhuǎn)、壓縮和加噪等攻擊;文獻(xiàn)[7]通過(guò)分析和提取醫(yī)學(xué)圖像的敏感區(qū)域?qū)崿F(xiàn)無(wú)損數(shù)字水印技術(shù),不僅增加了醫(yī)學(xué)圖像的安全性,同時(shí)也提高了嵌入容量。隨著水印技術(shù)的發(fā)展,小波變換、奇異值分解和粒子群系統(tǒng)優(yōu)化等技術(shù)[8-10]不斷應(yīng)用到醫(yī)學(xué)水印方面。
為了保證不降低醫(yī)學(xué)圖像的質(zhì)量,使大量的醫(yī)學(xué)信息經(jīng)處理后最終只是少量嵌入到醫(yī)學(xué)圖像中,因此,提出B++編碼的方法,使醫(yī)學(xué)數(shù)據(jù)轉(zhuǎn)換為矩陣,同時(shí)產(chǎn)生注冊(cè)密鑰,然后把編碼信息和注冊(cè)密鑰嵌入到病人的指紋中,鑒定醫(yī)學(xué)圖像的合法性。在提取指紋過(guò)程中,對(duì)指紋進(jìn)行對(duì)比分析處理。把含有醫(yī)學(xué)信息的指紋嵌入到病人的醫(yī)學(xué)圖像中,但是水印的嵌入不能改變醫(yī)學(xué)圖像質(zhì)量,否則會(huì)導(dǎo)致誤 診[11]。本文采用非下采樣Contourlet變換(Non-subsampled Contourlet Transform, NSCT)的水印技術(shù)可以避免這個(gè)問(wèn)題。本文數(shù)字水印算法在校附屬醫(yī)院的EMR系統(tǒng)進(jìn)行測(cè)試,存儲(chǔ)的水印醫(yī)學(xué)圖像的魯棒性較高,對(duì)醫(yī)學(xué)的診斷沒(méi)有影響。
NSDFB是由扇形濾波器和重采樣操作組成的,圖1、圖2分別為金字塔NSDFB、扇形NSDFB,通過(guò)將雙通道NSDFB應(yīng)用到NSCT構(gòu)建中,消除了方向?yàn)V波器的上采樣和下采樣,具有方向不變性,但會(huì)產(chǎn)生冗余。
圖1 金字塔非下采樣方向?yàn)V波器組
圖2 扇形非下采樣方向?yàn)V波器組
非下采樣Contourlet的計(jì)算過(guò)程如下:采用NSP對(duì)圖像多尺度分解來(lái)捕獲奇異點(diǎn);由NSDFB將各尺度的高頻子帶進(jìn)行多方向分解,從而將分別在同一尺度、同一方向的奇異點(diǎn)合并為一個(gè)尺度。為了達(dá)到雙優(yōu)的條件,將NSP和NSDFB結(jié)合起來(lái),實(shí)現(xiàn)NSCT變換。NSP確保了NSCT的多尺度分析的特性,但是不具有方向性;NSDFB確保了NSCT的多方向分析的特性,對(duì)高頻部分能很好地分解,但對(duì)低頻不能很好地分解,兩者結(jié)合彌補(bǔ)了雙方各自的不足。在NSCT的高頻子帶嵌入水印具有較好的不可見(jiàn)性,但是水印嵌在低頻子帶,能提高水印的魯棒性。NSCT的特性表現(xiàn)如下:(1)多尺度捕獲圖像的特征;(2)NSCT變換后子帶系數(shù)是非線性相關(guān);(3)NSCT變換有4/3的冗余。
B++編碼的具體過(guò)程如下:
字符儲(chǔ)存在字符表,字符處理后存放在編碼表中,根據(jù)字符表和編碼表的對(duì)應(yīng)關(guān)系,建立一一映射關(guān)系。
圖3 某字符的曲線部分
圖4 B++塊示意圖
假設(shè)有塊,塊1中的字母矩陣根據(jù)異或運(yùn)算結(jié)果參與到塊2的異或之中,依次類(lèi)推,得到所有塊的異或結(jié)果R,為增強(qiáng)醫(yī)學(xué)數(shù)據(jù)的安全,R需要與注冊(cè)密鑰進(jìn)行異或運(yùn)算,R+1是數(shù)據(jù)編碼信息。具體計(jì)算過(guò)程如下:
當(dāng)=5時(shí),6作為編碼信息。異或運(yùn)算最常見(jiàn)于多項(xiàng)式除法,不過(guò)它最重要的性質(zhì)還是自反性:() Xor () Xor ()=,即對(duì)給定的數(shù),用同樣的運(yùn)算因子()作2次異或運(yùn)算后仍得到本身,根據(jù)自反性質(zhì),進(jìn)行解碼:將編碼信息和注冊(cè)密鑰異或的結(jié)果再和編碼信息異或,依次倒推下去,直到完全解出字母矩陣。由于相鄰的2個(gè)塊尾和塊首的元素相同,按照這個(gè)規(guī)則可恢復(fù)這些字符的次序。
在26個(gè)字母中,假如每個(gè)字母出現(xiàn)的概率相同,(x)為1/26,則信源X的不確定性表示為:
其中,(X)是信源X中每個(gè)事件出現(xiàn)的平均信息量,或者表示信源X中各符號(hào)出現(xiàn)的平均不確定性。編碼信息源的數(shù)據(jù)量變大,則(X)的不確定性變小。
EMR系統(tǒng)對(duì)醫(yī)學(xué)信息的完整性和隱私性要求嚴(yán)格,本文提出了結(jié)合數(shù)字水印和生物認(rèn)證技術(shù)的醫(yī)學(xué)圖像水印算法,水印的嵌入分為3個(gè)層次,如圖5所示。
圖5 水印嵌入過(guò)程
通過(guò)3個(gè)層次增設(shè)安全機(jī)制,如注冊(cè)密鑰是第三方持有的私有數(shù)據(jù),沒(méi)有注冊(cè)密鑰是無(wú)法恢復(fù)EPR數(shù)據(jù)的。另外,考慮到醫(yī)學(xué)圖像某個(gè)區(qū)域的改變,會(huì)降低醫(yī)學(xué)圖像的質(zhì)量,從而造成誤診,因此,采用質(zhì)量較高的NSCT數(shù)學(xué)變換技術(shù)可以保留更多的描述細(xì)節(jié);采用病人的指紋圖像可以省略一些病人的基本信息,用指紋代替這些信息,通過(guò)生物認(rèn)證技術(shù)-指紋驗(yàn)證可以鑒定身份的合法性。
水印嵌入的具體步驟如下:
(1)預(yù)處理階段。對(duì)醫(yī)學(xué)信息EPR或DIC(Doctor Identity Code)數(shù)據(jù)進(jìn)行B++編碼,得到編碼信息5×5大小的0和1的,是5×5大小的矩陣,同時(shí)在編碼中生成注冊(cè)密鑰,為醫(yī)學(xué)數(shù)據(jù)的注冊(cè)信息,具有唯一性。采取病人×的灰度指紋圖像,提取指紋圖像的敏感區(qū)域(Region of Interest, ROI),把矩陣重置為1×25的矩陣,隱藏在Finger圖像的ROI中,對(duì)二值水印指紋圖像進(jìn)行Arnold置亂加密,得到加密信息矩陣,則變換公式為:
(3)數(shù)字水印的嵌入。對(duì)1奇異值分解[,S,]=(1),把信息嵌入S系數(shù)上,2=S–α×,其中,是隨機(jī)產(chǎn)生的0、1密鑰,對(duì)SVD的系數(shù)替代變換,即2=S,×2×’;完成低頻子帶的相關(guān)的系數(shù)值的修改。
水印提取的具體過(guò)程如圖6所示,該過(guò)程主要修改低頻系數(shù),但是需要注冊(cè)密鑰解碼出醫(yī)學(xué)信息,對(duì)于提取的指紋圖像需要驗(yàn)證指紋的合法性,當(dāng)確定是病人的完整指紋時(shí),才進(jìn)行醫(yī)學(xué)信息的提取,具體步驟如下:
(1)對(duì)含有醫(yī)學(xué)水印圖像進(jìn)行NSCT三級(jí)分解,分別得到低頻子帶和高頻子帶,對(duì)低頻子帶8×8塊的離散值分解DCT(64×64塊),分別抽出每個(gè)塊的第一位的數(shù)值組成矩陣,然后奇異值分解[,,]=()。
(2)生成與嵌入時(shí)相同的隨機(jī)數(shù)密鑰,進(jìn)行以下的計(jì)算:2=S+(×),=×2×',=,=(?)×8;根據(jù)Arnold的置亂周期,恢復(fù)指紋圖像’。
(3)編碼信息的提取。分析指紋ROI,對(duì)其DCT操作得到相關(guān)的0、1的序列信息,記作5×5矩陣。
(4)生物認(rèn)證:使用指紋識(shí)別技術(shù),采取病人的原始圖像和提取的指紋圖像進(jìn)行對(duì)比分析。
(5)從第三方得到注冊(cè)密鑰,與矩陣相結(jié)合,進(jìn)行B++解碼,分別得到每個(gè)字符的編碼,根據(jù)存儲(chǔ)的編碼表,映射到對(duì)應(yīng)的字符表,最后得到醫(yī)學(xué)數(shù)據(jù)。
圖6 水印提取過(guò)程
為評(píng)估本文提出的水印算法的性能,實(shí)驗(yàn)采用8位灰度512×512的醫(yī)學(xué)圖像和來(lái)源于校附屬醫(yī)院的64×64的指紋圖像;信息數(shù)據(jù)EPR/DIC有128個(gè)字母組成;參數(shù)=0.05;在NSCT變換中使用“9-7”金字塔濾波器和“”方向?yàn)V波器的三級(jí)分解。
為了衡量水印算法的性能,從峰值信噪比(Peak Signal to Noise Ratio, PSNR)和歸一化相關(guān)系數(shù)(Normalization Correlation, NC)方面進(jìn)行實(shí)驗(yàn)分析,實(shí)驗(yàn)結(jié)果如圖7~圖9所示。使用PSNR評(píng)定添加水印后的圖像質(zhì)量:
圖7 醫(yī)學(xué)原始圖像
圖8 醫(yī)學(xué)水印圖像
圖9 提取的指紋水印圖像(NC=1)
在多次實(shí)驗(yàn)數(shù)據(jù)基礎(chǔ)上,對(duì)于醫(yī)學(xué)信息EPR的恢復(fù),當(dāng)水印的>75且≥0.996時(shí),便可恢復(fù)醫(yī)學(xué)信息,同時(shí)考慮到遠(yuǎn)程醫(yī)療需要傳輸醫(yī)學(xué)圖像和信息,需要壓縮醫(yī)學(xué)圖像。在實(shí)驗(yàn)中,使用JEPG 10%和60%的壓縮,恢復(fù)的信息與編碼信息相同,說(shuō)明了在不同比例下的壓縮編碼信息沒(méi)有嚴(yán)重地受損。
表1顯示了各類(lèi)攻擊后的實(shí)驗(yàn)結(jié)果,本文實(shí)驗(yàn)與文 獻(xiàn)[10]、文獻(xiàn)[13]算法進(jìn)行NC方面的比較。從實(shí)驗(yàn)數(shù)據(jù)看出,本文算法明顯優(yōu)于其他2種算法,尤其在JEPG壓縮方面,本文算法適合在EMR系統(tǒng)環(huán)境下使用。
表1 算法NC指標(biāo)的比較分析
對(duì)于本文提出的B++編碼,分析嵌入容量對(duì)魯棒性的影響。文獻(xiàn)[4]處理信息的方法是將信息BCH碼進(jìn)行處理,使用AES加密算法。圖10顯示水印嵌入容量對(duì)圖像PSNR的影響,當(dāng)嵌入容量達(dá)到4 000以上,PSNR開(kāi)始下降,所存在的問(wèn)題是編碼長(zhǎng)度隨信息增加,致使圖像的質(zhì)量降低。當(dāng)采用本文非B++編碼醫(yī)學(xué)信息的算法時(shí),從圖10可以看出,PSNR結(jié)果不太理想,采用B++編碼后,應(yīng)盡量減少嵌入數(shù)量,隨著數(shù)據(jù)量的增大,PSNR微變,實(shí)現(xiàn)高容量的嵌入信息,由于解碼需要注冊(cè)密鑰的配合,安全性更高,但是缺點(diǎn)是由于眾多的位的疊加,某關(guān)鍵幾位出現(xiàn)錯(cuò)誤會(huì)造成解碼錯(cuò)位(丟失)現(xiàn)象。
圖10 水印嵌入容量對(duì)圖像峰值信噪比的影響
本文采用FVC2004的AFIS性能指標(biāo)REJenroll(Numberof Rejected Fingerprints During Enrollment)表示由于圖像質(zhì)量太差而被拒絕處理的指紋數(shù)量。采取一組指紋圖像10張、每組5次的水印操作。提取了50張含有醫(yī)療信息的指紋圖像,通過(guò)某指紋識(shí)別軟件進(jìn)行測(cè)試,共47個(gè)指紋成功,=6%,說(shuō)明了本文提出的數(shù)字水印算法魯棒性較好,不會(huì)對(duì)指紋圖像識(shí)別產(chǎn)生很大影響。
本文結(jié)合數(shù)字水印和生物認(rèn)證,提出一種EMR系統(tǒng)環(huán)境下的醫(yī)學(xué)信息保護(hù)方法。將醫(yī)學(xué)圖像和醫(yī)學(xué)文本信息作為水印信息,嵌入到病人指紋圖像中增加醫(yī)學(xué)信息的完整性。與其他算法進(jìn)行對(duì)比分析,實(shí)驗(yàn)結(jié)果表明該算法效果較好,使用B++編碼可以實(shí)現(xiàn)大量信息壓縮后少量的嵌入,但存在位丟失的問(wèn)題,今后將對(duì)其改進(jìn)。同時(shí)考慮到計(jì)算機(jī)云技術(shù)的發(fā)展,將通過(guò)改進(jìn)水印算法進(jìn)一步提高EMR系統(tǒng)的安全性。
[1] Liang Xuefeng, Bishnu A, Asano T. Robust Fingerprint Index- ing Scheme Using Minutia Neighborhood Structure and Low-order Delaunay[J]. IEEE Transactions on Information Forensics and Security, 2007, 2(4): 721-733.
[2] Biswas S, Ratha N, Connell J. Exploring Ridge Curvature for Fingerprint Indexing[C]//Proceedings of the 2nd IEEE International Conference on Biometrics: Theory, Applications and Systems. Arlington, USA: IEEE Press, 2008: 1-6.
[3] 馮前進(jìn), 陳凌劍, 楊 豐. 基于整數(shù)小波變換的醫(yī)學(xué)圖像易碎水印方法[J]. 中國(guó)圖象圖形學(xué)報(bào), 2006, 11(5): 736-741.
[4] Ananad D, Niranjan U C. Watermarking Medical Images with Patient Information[C]//Proceedings of the 20th Annual International Conference on Engineering in Medicine and Biology Society. Hong Kong, China: [s. n.], 1998: 703-706.
[5] Nayak J, Bhat P S, Kumar M S, et al. Reliable Transmission and Storage of Medical Images with Patient Information Using Error Control Codes[C]//Proceedings of IEEE INDICON’04. [S. l.]: IEEE Press, 2004: 147-150.
[6] Chao H M, Hsu C M, Miaou S G. A Data Hiding Technique with Authentication Integration and Confidentiality for Electronic Patient Records[J]. IEEE Transactions on Information Technology in Biomedicine, 2002, 6(1): 46-53.
[7] Kamran M, Farooq M. An Optimized Information-persevering Relational Database Watermarking Scheme for Ownship Protection of Medical Data[Z]. 2011.
[8] 歐陽(yáng)春娟, 劉昌鑫, 楊群生. 小波包特征熵分解的圖像水印算法[J]. 計(jì)算機(jī)工程與應(yīng)用, 2009, 45(32): 159-160.
[9] 周 波, 陳 健. 基于奇異值分解的、抗幾何失真的數(shù)字水印算法[J]. 中國(guó)圖象圖形學(xué)報(bào), 2004, 9(4): 124-130.
[10] 肖尚勤. 魯棒數(shù)字水印算法研究[D]. 武漢: 華中科技大學(xué),2008.
[11]Nyeen H, Boles W. A Review of Medical Image Watermarking Requirements for Teleradiology[J]. Journal of Digital Imaging, 2013, 26(2): 326-329.
[12] da Cunha A L, Zhou Janping. The Nonsubsampled Contourlet Transform: Theory, and Applications[J]. IEEE Transactions on Image Processing, 2006, 15(10): 3089-3101.
[13] Bi Hongbo, Li Xueming. A Blind Robust Watermarking Scheme Based on CT and SVD[C]//Proceedings of the 10th International Conference on Signal Processing. Beijing, China: [s. n.], 2010: 881-884.
編輯 陸燕菲
Medical Information Protection of EMR System Based on Hybrid Technology
LIN Pan, CHEN Jian-mei, WANG Yuan-peng
(Institute of Medicine, Jiangsu University, Zhenjiang 212013, China)
As the Electronic Medical Records(EMR) system is widely used in many hospitals, doctor can use computer to cloud interaction and share medical data. It extracts the medical record information by Clinical Decision Support Systems(CDSS), and helps doctor to make accurate diagnosis. To solve the problem of medical information disclosure or tamper in the transmission process of EMR system, medical data after B++ encoding is embedded in a patient’s finger. The finger with feature information and registration key are embedded in medical image by digital watermarking algorithm based on Non-subsampled Contourlet Transform(NSCT), and it can improve the safety of medical information in EMR system. Experimental results show that the method ensures higher robustness of the watermarking image, and it protects the integrity of the medical data by embedding high capacity medical information.
Electronic Medical Records(EMR); Non-subsampled Contourlet Transform(NSCT); B++ coding; biometric authentication; fingerprint; digital watermarking
1000-3428(2014)03-0175-05
A
TP309.2
教育部博士點(diǎn)基金資助項(xiàng)目(20113227110010);江蘇省高校自然科學(xué)基金資助項(xiàng)目(10KJB520004);江蘇省軟件和集成電路專項(xiàng)基金資助項(xiàng)目(蘇信軟2009[100]);江蘇省普通高校研究生科研創(chuàng)新計(jì)劃基金資助項(xiàng)目(CXZZ11_0575)。
林 攀(1989-),男,碩士,主研方向:醫(yī)學(xué)圖像處理,信息安全;陳健美,教授;王遠(yuǎn)朋,碩士。
2013-02-22
2013-04-16 E-mail:767251745@qq.com
10.3969/j.issn.1000-3428.2014.03.036