張雷
摘要:在醫(yī)療行業(yè)中,醫(yī)院信息系統(tǒng)基本完成了醫(yī)院內(nèi)部的流程管理、數(shù)據(jù)積累等工作,現(xiàn)在正面臨著海量數(shù)據(jù)的挑戰(zhàn),進入了大數(shù)據(jù)時代。近年來,隨著機器學習技術和人工智能的發(fā)展,大數(shù)據(jù)和醫(yī)療的結合更是被推向縱深。從圖像識別、圖像檢索到復雜疾病的診斷,人工智能無一不正發(fā)揮著重要作用。隨著技術領域的快速進步,挑戰(zhàn)也隨之而來,其中最大的一個挑戰(zhàn)就是隱私保護的問題?;诖耍疚木蛯Υ髷?shù)據(jù)醫(yī)療時代的人工智能與隱私保護進行了簡單的探討,以供相關人員參考。
關鍵詞:醫(yī)療大數(shù)據(jù);人工智能;隱私保護
1、目前我國的大數(shù)據(jù)醫(yī)療發(fā)展現(xiàn)狀
“十二五”期間,我國初步建立了覆蓋13.7億人口信息的電子健康檔案,基本實現(xiàn)了對常住人口和流動人口的服務、監(jiān)測、管理,以及基層醫(yī)療衛(wèi)生機構信息化,完善了包含醫(yī)療機構、醫(yī)生、護士在內(nèi)的人員機構信息數(shù)據(jù)庫,同時也逐步建立傳染病疫情網(wǎng)絡直報系統(tǒng);建立覆蓋多達27個省市的全民健康信息平臺,并且初步實現(xiàn)了與國家平臺的連通;基本建立了中醫(yī)藥服務新農(nóng)合跨省結算、實驗性疾病的監(jiān)測系統(tǒng)、國家藥品供應保證綜合管理系統(tǒng)等,同時建立了電子健康檔案、電子病歷和全員人口個案數(shù)據(jù)庫。
大數(shù)據(jù)在醫(yī)療方面的作用初見成效,但目前核心問題主要是“數(shù)據(jù)孤島”,無法做到資源的充分統(tǒng)籌和整合利用,業(yè)務協(xié)同能力和數(shù)據(jù)共享能力亟待提高,相關政策法規(guī)和標準滯后于快速發(fā)展的業(yè)務,專業(yè)機構不健全,人才總量不足,尤其是高端人才、復合型人才尤為稀缺。目前行業(yè)現(xiàn)狀是醫(yī)療大數(shù)據(jù)普遍觀望多,動手少,雷聲大,雨點小,大部分醫(yī)院建設重點主要是HIS、LIS、PACS、RIS、EMR等醫(yī)療信息系統(tǒng),不會將重點遷移到大數(shù)據(jù)應用分析上,短時間內(nèi)也不會尋求和相關公司的合作。
2、大數(shù)據(jù)醫(yī)療時代的人工智能概況
目前國內(nèi)診斷病人CT圖像還普遍采用兩個醫(yī)生同時查看的形式,當兩個醫(yī)生對該圖像得出相同的判斷時容易認定,但當兩個醫(yī)生得到的結論不同時則需要討論。這種方法是為了提高診斷的準確率,但是耗費人力。卷積神經(jīng)網(wǎng)絡(Convolutional?neural?networks,CNN)是一種典型的深度學習算法,已經(jīng)在醫(yī)學圖像領域擁有廣泛的應用。CNN可以接受各種醫(yī)學圖像的訓練,包括放射科、病理科、皮膚科和眼科等。CNN獲取輸入圖像,并使用簡單的操作(如卷積、匯集和完全的連接層)將其順序轉換為扁平向量,輸出向量的元素表示疾病存在的概率,因此可以輔助醫(yī)生進行診斷,在很大程度上緩解醫(yī)生的工作量。
在真實的應用場景中,人工智能輔助醫(yī)療要通過大量的數(shù)據(jù)積累,包括疾病診斷記錄、病人用藥效果、基因數(shù)據(jù)、家庭病史等。在國內(nèi),要實現(xiàn)上述數(shù)據(jù)積累,最重要的壁壘是打通各個醫(yī)院和社區(qū)間的數(shù)據(jù)交換共享渠道。美國基于此考慮建設了一個電子健康記錄系統(tǒng),十年內(nèi)積累了1000萬名病人的記錄。EHR的潛在應用價值是巨大的,如果好好加以利用,這相當于積累了20萬年醫(yī)生的智慧和1億年的疾病情況。
3、醫(yī)療數(shù)據(jù)隱私面臨的安全性問題
3.1數(shù)據(jù)泄露
信息技術的快速發(fā)展給人們的生活帶來了質的飛躍。醫(yī)療信息的存儲從紙質病歷過渡到了電子病歷到使用完整的醫(yī)療信息系統(tǒng)(HIS),醫(yī)院逐漸使用電子病歷系統(tǒng)進行病歷的統(tǒng)計,將復雜多樣的數(shù)據(jù)存儲在數(shù)據(jù)庫中。電子病歷的泄露方式主要有兩種,一種是非交互式泄露,主要是醫(yī)院信息系統(tǒng)內(nèi)部的泄露,或者內(nèi)部人員的泄露,比如數(shù)據(jù)庫操作者被盈利機構高價購買數(shù)據(jù),另一種是交互式泄露,也就是醫(yī)療數(shù)據(jù)發(fā)布以及在不同機構之間共享時造成的信息泄露,特別是大數(shù)據(jù)時代數(shù)據(jù)共享變得普及,交互式泄露問題更加嚴重。
3.2數(shù)據(jù)挖掘的挑戰(zhàn)
大數(shù)據(jù)時代提高了醫(yī)療數(shù)據(jù)的透明度,醫(yī)療行業(yè)對電子健康記錄、臨床數(shù)據(jù)大規(guī)模的應用以及醫(yī)療數(shù)據(jù)的外包都會造成醫(yī)療隱私泄露的風險。首先,數(shù)據(jù)的監(jiān)測,使得隱私無處躲藏。通信技術的定位和監(jiān)測使得每個人變得透明,何時何地都有可能正在受到他人的監(jiān)視,個人隱私急需得到保護。其次,數(shù)據(jù)共享使得隱私被濫用。大數(shù)據(jù)時代電子病歷系統(tǒng)數(shù)據(jù)的共享可以有效促進醫(yī)學的研究和發(fā)展,但同時人們的醫(yī)療信息也可能成為商品被出售。聯(lián)網(wǎng)營銷人員根據(jù)患者信息可以為個人量身定制醫(yī)療廣告;醫(yī)療保險推銷人員可能查到病人的病歷資料和電話號碼,從而推銷某種疾病保險。
3.3數(shù)據(jù)存儲的挑戰(zhàn)
隨著云計算技術的廣泛應用,大量數(shù)據(jù)不再全部放在本地數(shù)據(jù)庫中,而是放在云平臺中存儲。云的存儲與計算大大提高了處理數(shù)據(jù)的速度,但云平臺虛擬化的服務模式也隨之帶來了一系列的安全問題。首先,數(shù)據(jù)和應用會分布到多個數(shù)據(jù)中心,增加了隱私保護的復雜度。其次,數(shù)據(jù)存儲機構不同于傳統(tǒng)方式。數(shù)據(jù)是以碎片化的模式存儲在云環(huán)境下,而且是多租戶共享資源,很難準確知道敏感數(shù)據(jù)存儲的物理位置,一些基于物理機的數(shù)據(jù)保護機制與手段都不再起作用了,而且用戶在使用虛擬資源時多個用戶可能指向的是同一個物理資源,如果虛擬軟件在云平臺上存在安全漏洞,則用戶的數(shù)據(jù)安全會受到威脅,同時直接造成數(shù)據(jù)的操作權限混亂問題。
4、隱私保護的技術措施和應用實施
4.1數(shù)據(jù)生成階段
醫(yī)療信息采集時可對數(shù)據(jù)進行一定的脫敏處理。比如針對醫(yī)護人員在診療過程中不可避免地接觸到的敏感信息,按照《個人隱私數(shù)據(jù)使用規(guī)則》對患者的隱私信息進行脫敏處理,患者姓名、出生日期、電話號碼、單位、地址、身份證號碼、生物特征等敏感信息被匿名保護,同時,通過數(shù)據(jù)使用協(xié)議約定醫(yī)療信息使用目的、期限和范圍等。
4.2數(shù)據(jù)存儲階段
醫(yī)療大數(shù)據(jù)平臺中個人醫(yī)療健康數(shù)據(jù)的采集渠道不斷增多,建立數(shù)據(jù)隱私處理程序,分辨隱私數(shù)據(jù)和可共享利用的數(shù)據(jù),在不影響信息準確性的前提下,運用數(shù)據(jù)脫敏、去標簽化等手段對數(shù)據(jù)進行處理,盡可能保護數(shù)據(jù)隱私。
4.3數(shù)據(jù)處理和分析階段
建立政府監(jiān)管、社會多方主體參與的管理機制,重點解決數(shù)據(jù)標準不統(tǒng)一的問題。例如正在細化的山東省智慧醫(yī)院評估方法中,采用定量評分、整體分級,綜合評估醫(yī)院智慧服務系統(tǒng)具備的功能、應用范圍、技術環(huán)境等,并具體分局部評估和整體評估,更全面的統(tǒng)一數(shù)據(jù)標準。
4.4數(shù)據(jù)應用階段
在重點考慮數(shù)據(jù)集相互關聯(lián)的情況下,最大化被匿名處理之后的數(shù)據(jù)效用,實現(xiàn)數(shù)據(jù)跨系統(tǒng)的共享與利用。同時,醫(yī)療應用系統(tǒng)應具備完整的用戶授權功能,在提供訪問或共享患者醫(yī)療數(shù)據(jù)前,明確是否允許或限制這些醫(yī)療數(shù)據(jù)的公開;及時開發(fā)有效避免越權的措施,配合授權審批管理流程,實現(xiàn)操作過程可追溯。
參考文獻:
[1]李杰.大數(shù)據(jù)時代醫(yī)療信息化趨勢探討[J].信息與電腦(理論版),2019(12):147-148+151.
[2]唐岫.大數(shù)據(jù)時代成都智慧養(yǎng)老醫(yī)療保障機制研究[J].智庫時代,2018(38):7-8+12.
(作者單位:日照心臟病醫(yī)院)