吳傅蕾,袁長蓉
(復(fù)旦大學(xué)護(hù)理學(xué)院,上海 200032,wufulei@fudan.edu.cn)
大數(shù)據(jù)正在為科學(xué)研究、經(jīng)濟(jì)建設(shè)和文化生活等社會(huì)各個(gè)領(lǐng)域的發(fā)展帶來顛覆性變革。2015年,國家先后頒布了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》和《國家信息化發(fā)展戰(zhàn)略綱要》,強(qiáng)調(diào)了推動(dòng)大數(shù)據(jù)發(fā)展和應(yīng)用以及實(shí)施國家大數(shù)據(jù)戰(zhàn)略。其中,醫(yī)療大數(shù)據(jù)作為關(guān)乎健康中國的重要部分被納入國家戰(zhàn)略布局[1-2]。2016年6月國務(wù)院辦公廳在《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》中指出“健康醫(yī)療大數(shù)據(jù)是國家重要的基礎(chǔ)性戰(zhàn)略資源”,致力于規(guī)范和推動(dòng)健康醫(yī)療大數(shù)據(jù)融合共享、開放應(yīng)用[3]。健康醫(yī)療大數(shù)據(jù)應(yīng)用和發(fā)展需堅(jiān)持以人為本、創(chuàng)新驅(qū)動(dòng),其有利于激發(fā)和深化醫(yī)藥衛(wèi)生體制改革的動(dòng)力與活力,提升健康醫(yī)療服務(wù)效率和質(zhì)量,拓展服務(wù)渠道,延伸和豐富服務(wù)內(nèi)容,擴(kuò)大資源供給,從而高效利用大數(shù)據(jù)以不斷滿足患者多層次、多樣化的健康需求,也有利于培育新的業(yè)態(tài)和經(jīng)濟(jì)增長點(diǎn)。
健康醫(yī)療大數(shù)據(jù)的構(gòu)成是多源的。臨床實(shí)踐是其中最核心、最龐大的來源?;颊咴u(píng)估、治療及護(hù)理的實(shí)施以及患者對(duì)治療及護(hù)理的反饋使得臨床實(shí)踐成為一個(gè)不斷產(chǎn)生數(shù)據(jù)的過程。且隨著當(dāng)前各大醫(yī)院信息化進(jìn)程不斷加深,以上數(shù)據(jù)都得以通過電子病歷記錄、移動(dòng)護(hù)理系統(tǒng)等被記錄和儲(chǔ)存。另一方面,隨著移動(dòng)醫(yī)療、遠(yuǎn)程照護(hù)等在近幾年的快速發(fā)展,基于傳感器、互聯(lián)網(wǎng)及物聯(lián)網(wǎng)的健康數(shù)據(jù)也成為健康醫(yī)療大數(shù)據(jù)的重要來源,如各類可穿戴設(shè)備、健康相關(guān)的智能手機(jī)應(yīng)用程序等監(jiān)測(cè)的患者健康數(shù)據(jù)。甚至通過深入挖掘各類社交媒體上的健康相關(guān)信息,我們可以大致描繪出個(gè)體的運(yùn)動(dòng)、飲食、作息等等健康相關(guān)的生活方式。這些健康醫(yī)療大數(shù)據(jù)的合理應(yīng)用和深度挖掘必將帶來健康醫(yī)療模式的深刻變化。
然而,我國在健康醫(yī)療大數(shù)據(jù)構(gòu)建的頂層設(shè)計(jì)中忽略了醫(yī)療照護(hù)過程中最重要的一部分人群,即患者自身。當(dāng)前臨床實(shí)踐產(chǎn)生和錄存的數(shù)據(jù)多為醫(yī)務(wù)人員評(píng)估的患者健康信息及客觀的實(shí)驗(yàn)室指標(biāo)、影像學(xué)結(jié)果等,而缺失了重要的人文數(shù)據(jù)——由患者自我報(bào)告的數(shù)據(jù)。被忽視的患者的聲音主要表現(xiàn)在我國傳統(tǒng)文化影響下,醫(yī)療決策主要依賴醫(yī)護(hù)專業(yè)決策,缺乏對(duì)患者報(bào)告健康信息的長期、系統(tǒng)收集和及時(shí)反饋,使得極具價(jià)值的患者真實(shí)體驗(yàn)消失于空氣之中。研究證實(shí),單獨(dú)使用臨床客觀指標(biāo),如實(shí)驗(yàn)室檢查結(jié)果,可能會(huì)低估疾病對(duì)個(gè)體的影響,并高估醫(yī)療干預(yù)措施的有效性,從而影響患者疾病預(yù)后和生活質(zhì)量[4]。因此,若這一缺失得不到解決,健康醫(yī)療大數(shù)據(jù)的來源必定是不完整的。而我們?nèi)衾^續(xù)僅依賴臨床客觀指標(biāo)作為提供健康照護(hù)及決策的證據(jù),則可能是我們向以患者為中心的醫(yī)療照護(hù)模式邁進(jìn)過程中的倒退。
基于上述背景,美國食品藥品監(jiān)督局(FDA)于在2004年提出了患者報(bào)告結(jié)局(Patient-reported Outcomes, PROs)這一理念,用以描述來自患者的,與其健康狀態(tài)有關(guān)的信息[5]。本文將通過介紹PROs的概念、內(nèi)容、測(cè)量方式等及其與健康醫(yī)療大數(shù)據(jù)的整合,總結(jié)現(xiàn)階段的幾大主要研究和實(shí)踐方向,以及潛在的倫理挑戰(zhàn)和可能的解決策略,以期為健康醫(yī)療大數(shù)據(jù)的研究和應(yīng)用補(bǔ)充新的視角和思路。
PROs是指沒有經(jīng)過醫(yī)生或其他人的解釋,直接來自患者的與患者健康狀態(tài)有關(guān)的任何信息[5]。當(dāng)前,根據(jù)PROs收集的內(nèi)容,一般可以分為5大類:①疾病對(duì)日常生活和社會(huì)功能的影響,如身體功能、社會(huì)角色、自尊及表現(xiàn)等;②癥狀相關(guān)信息,包括癥狀的嚴(yán)重程度、強(qiáng)度、頻率、困擾程度以及對(duì)癥狀對(duì)功能及日常生活的影響等;③患者依從性,如最典型的服藥依從性;④健康相關(guān)生活質(zhì)量;⑤患者滿意度,如醫(yī)、護(hù)患溝通、合作治療以及治療獲得手段等和衛(wèi)生服務(wù)(health delivery)有關(guān)的結(jié)局[6]。但也有研究者指出滿意度,包括患者對(duì)診療過程及結(jié)果的滿意度,作為與衛(wèi)生服務(wù)績效有關(guān)的指標(biāo),屬于患者報(bào)告體驗(yàn)(Patient-reported Experience, PRE)而非結(jié)局[7]。根據(jù)FDA的定義,我們認(rèn)為PROs側(cè)重于與患者健康狀態(tài)有關(guān)的信息,因此更傾向于不包含患者滿意度。
PROs是一個(gè)廣義的概念,泛指任何形式的來自患者本人的健康相關(guān)信息。也就是說,通過患者主訴、患者訪談等獲取的質(zhì)性資料和通過由患者填寫問卷及量表獲得的量性資料均可被視為PROs。然而患者主訴往往是分散的、非系統(tǒng)的,難以完整地反映患者當(dāng)下的健康狀態(tài);患者訪談則多為某一質(zhì)性研究的資料收集方式,訪談主題取決于研究目的,其臨床指導(dǎo)意義十分有限。且質(zhì)性資料還需經(jīng)過主題提取、降維、字段標(biāo)準(zhǔn)化等多種數(shù)據(jù)分析和整合技術(shù)才能與健康醫(yī)療大數(shù)據(jù)整合,在一定程度上影響數(shù)據(jù)轉(zhuǎn)化和利用效率。為了更全面、系統(tǒng)地評(píng)估和評(píng)價(jià)患者生理、心理和社會(huì)的健康狀態(tài),我們所指的PROs往往是狹義層面上的,主要指通過問卷或量表系統(tǒng)收集的患者健康狀態(tài)相關(guān)信息。如通過癌癥治療功能評(píng)價(jià)量表(Function Assessment of Cancer Therapy, FACT)評(píng)價(jià)癌癥患者的生活質(zhì)量[8],通過疼痛視覺模擬量表(Visual Analogue Scale, VAS)測(cè)量患者的疼痛程度[9]等。更進(jìn)一步說,只有在規(guī)范化的、恰當(dāng)?shù)那榫诚?,采用高質(zhì)量的工具收集來自患者的聲音,這部分信息才有可能形成大數(shù)據(jù)。
PROs和大數(shù)據(jù)的相互結(jié)合可在多個(gè)層面上用于指導(dǎo)患者照護(hù)的研究和實(shí)踐。如PROs可作為證據(jù)來源之一構(gòu)建大數(shù)據(jù)決策輔助系統(tǒng);作為預(yù)后模型的結(jié)局指標(biāo)和預(yù)測(cè)指標(biāo)識(shí)別在醫(yī)療照護(hù)需求上處于優(yōu)先級(jí)的群體和個(gè)體[10]。在臨床實(shí)踐上,可通過對(duì)PROs的常規(guī)收集形成癥狀預(yù)警,實(shí)現(xiàn)癥狀的早期識(shí)別和干預(yù)[10]。
如Dr. Watson通過機(jī)器學(xué)習(xí),結(jié)合輸入的癥狀、影像學(xué)及實(shí)驗(yàn)室資料等可實(shí)現(xiàn)腫瘤診斷及治療方案和臨床專家的基本一致[11]。在診療之外,如癥狀管理,決策輔助支持系統(tǒng)同樣大有可為。以乳腺癌為例,癥狀管理是乳腺癌救治和康復(fù)過程中的關(guān)鍵環(huán)節(jié)。不同患者在不同階段出現(xiàn)的癥狀、可能的困擾和適宜的解決方案不盡相同。基于大數(shù)據(jù)發(fā)現(xiàn)癥狀規(guī)律,并基于規(guī)律推薦個(gè)性化方案以幫助預(yù)防和干預(yù)是大數(shù)據(jù)時(shí)代乳腺癌癥狀管理的新思路。因此,筆者所在課題組嘗試通過整合循證證據(jù)和大數(shù)據(jù)構(gòu)建癥狀管理的智能推薦系統(tǒng)作為一種臨床決策輔助系統(tǒng)。其中,針對(duì)患者自我報(bào)告癥狀數(shù)據(jù)的缺乏,我們開發(fā)了乳腺癌階段特異性患者報(bào)告結(jié)局測(cè)量系統(tǒng)[12],在此基礎(chǔ)上統(tǒng)籌收集包括患者臨床數(shù)據(jù)、生活數(shù)據(jù)和PROs數(shù)據(jù),經(jīng)過數(shù)據(jù)整理、清洗、轉(zhuǎn)換和融合形成推薦系統(tǒng)所依賴的多源大數(shù)據(jù)庫。
PROs應(yīng)用的一大趨勢(shì)是從出于研究目的的收集向臨床常規(guī)實(shí)踐轉(zhuǎn)換。PROs最初引起研究者的重視是由于美國FDA指出,PROs必須被包括在臨床試驗(yàn)中作為次要結(jié)局(secondary outcomes)指標(biāo)綜合評(píng)價(jià)藥物或治療手段的效果和長期效應(yīng)[5]。因此PROs在臨床試驗(yàn)中,尤其是在美國及英國等發(fā)達(dá)國家已有成熟的應(yīng)用。多項(xiàng)研究也已經(jīng)證實(shí),將PROs作為臨床診療和護(hù)理常規(guī)有助于醫(yī)護(hù)人員盡早發(fā)現(xiàn)和識(shí)別患者在疾病過程中易被忽視的問題,從而提供及時(shí)的針對(duì)性干預(yù)[13]。加拿大公主瑪格麗特癌癥中心(Princess Margaret Cancer Centre, PMCC)的困擾評(píng)估和反饋系統(tǒng)(Distress Assessment Response Tool, DART)是目前較成熟的將PROs納入臨床評(píng)估常規(guī)的項(xiàng)目[14]?;颊咴陂T診就診時(shí)通過院方提供的iPad以就診卡號(hào)及生日登陸DART系統(tǒng),完成所有評(píng)估后,相關(guān)信息即被保存在患者個(gè)人醫(yī)療記錄中,醫(yī)生可進(jìn)行即時(shí)瀏覽。DRAT項(xiàng)目的另一主要目的是PROs數(shù)據(jù)的收集,目前已累積6萬余例患者數(shù)據(jù),這部分?jǐn)?shù)據(jù)的挖掘利用將是下一階段的研究重點(diǎn)。也就是說,PROs數(shù)據(jù)的臨床常規(guī)收集不僅有助于提升照護(hù)質(zhì)量,更是數(shù)據(jù)持續(xù)累積的過程,是進(jìn)行結(jié)合PROs的大數(shù)據(jù)研究的基礎(chǔ)。
值得指出的是,以上研究及實(shí)踐均要求我們?cè)谠O(shè)計(jì)初始即考慮到PROs在其中的角色及作用,達(dá)到患者臨床數(shù)據(jù)、生活數(shù)據(jù)和自我報(bào)告數(shù)據(jù)等各類數(shù)據(jù)的相匹配,才能完整的描畫患者的“數(shù)字畫像”。因此在收集內(nèi)容、測(cè)量工具、以及收集程序等諸多環(huán)節(jié)的選擇或設(shè)計(jì)上都需要研究者和臨床工作者的細(xì)致考量。
PROs的原始收集多并非出于構(gòu)建健康醫(yī)療大數(shù)據(jù)進(jìn)行全方位分析的目的,而是此時(shí)的患者知情同意必然應(yīng)遵照監(jiān)管機(jī)構(gòu)的要求對(duì)患者進(jìn)行收集目的如實(shí)告知。然而當(dāng)這部分?jǐn)?shù)據(jù)被用于二次利用時(shí),告知不當(dāng)可能引起一系列問題,從而影響PROs數(shù)據(jù)的真實(shí)性和準(zhǔn)確性。如果在患者進(jìn)行PROs測(cè)量之前即明確告知患者這些數(shù)據(jù)將被用以共享以及二次使用,那么患者的應(yīng)答可能產(chǎn)生偏倚。PROs作為患者主觀感受的表達(dá),涉及多個(gè)不同的方面,其中一些報(bào)告的內(nèi)容對(duì)患者來說可能是十分敏感的,尤其是情緒狀態(tài),功能狀態(tài)等。如當(dāng)被試將嚴(yán)重的抑郁狀態(tài)視作一種羞恥,那么很可能會(huì)在所對(duì)應(yīng)的選項(xiàng)中有意地弱化自己的真實(shí)情況。對(duì)于患者認(rèn)為十分敏感或不愿暴露的問題,患者在填寫問卷或量表時(shí)可能采用隱私保護(hù)的應(yīng)答行為(privacy-protective responding behaviors),包括謊報(bào)自己的健康狀態(tài)、遺漏重要的細(xì)節(jié)或?qū)δ承﹩栴}不予以應(yīng)答等[15]。同樣地,在PROs數(shù)據(jù)收集完成后對(duì)患者進(jìn)行告知也存在一定問題,主要體現(xiàn)在同意者和不同意者之間可能會(huì)存在如年齡、教育水平等不同因素的差異,導(dǎo)致整體數(shù)據(jù)集的偏倚。此外,在數(shù)據(jù)收集完成后重新聯(lián)系如此大量的患者以獲取知情同意存在相當(dāng)?shù)睦щy。
匿名化(Anonymization)是一種獲取數(shù)據(jù)和完整數(shù)據(jù)集并確保數(shù)據(jù)安全的有效策略,經(jīng)匿名化的數(shù)據(jù)無需經(jīng)過明確的知情同意即可進(jìn)行共享。隨著信息技術(shù)的發(fā)展,健康醫(yī)療數(shù)據(jù),包括PROs數(shù)據(jù)均儲(chǔ)存于電子數(shù)據(jù)庫,大量來自黑客的攻擊加大了數(shù)據(jù)泄漏的風(fēng)險(xiǎn)。而有效的數(shù)據(jù)匿名化可極大程度上降低黑客攻擊的成功率。研究顯示,經(jīng)過有效的匿名化后,僅有少于0.5%的數(shù)據(jù)可被精準(zhǔn)再識(shí)別(re-identification)[16]。現(xiàn)有標(biāo)準(zhǔn)和指南提供了很多數(shù)據(jù)匿名化的策略,這些方法已被倫理監(jiān)管機(jī)構(gòu)接受,并已納入最佳實(shí)踐[17-18]。根據(jù)匿名化后所得的變量是否可進(jìn)行分析,我們可將匿名化策略分為數(shù)據(jù)屏蔽(data masking)和去標(biāo)識(shí)化(de-identification)兩大類。
第一類:數(shù)據(jù)屏蔽。數(shù)據(jù)屏蔽多用于直接標(biāo)識(shí)(direct identifiers),即可以單獨(dú)或通過與其他易于獲取的信息組合來唯一標(biāo)識(shí)數(shù)據(jù)主體的變量,如姓名、寄件地址、就診號(hào)、病歷號(hào)等[19]。常用的技術(shù)包括字段抑制(filed suppression)、隨機(jī)(randomization)和假名化(pseudonymization)等[19]。字段抑制指刪除一列對(duì)于匿名數(shù)據(jù)集無用的信息,如自由地址字段。隨機(jī)用于創(chuàng)造虛假的信息使數(shù)據(jù)看起來像原始數(shù)據(jù),如從人口普查中隨機(jī)選取名字替代數(shù)據(jù)主體的真實(shí)姓名。假名化則將直接標(biāo)識(shí)符替換為其他一些唯一值。
第二類:數(shù)據(jù)去標(biāo)識(shí)化。數(shù)據(jù)去標(biāo)識(shí)化多用于間接標(biāo)識(shí)或類標(biāo)識(shí)(quasi-identifiers),即他人可結(jié)合其他變量,根據(jù)可獲得的背景信息推斷出數(shù)據(jù)主體的變量[19]。典型的例子包括出生日期、民族、疾病診斷、診療日期等。針對(duì)這些信息,可采用信息泛化的方法進(jìn)行去標(biāo)識(shí),如將個(gè)體的具體出生日期改為出生年月、模糊疾病的具體診斷等。還可采用子數(shù)據(jù)集的方式保存數(shù)據(jù),這樣一來他人難以知道目標(biāo)個(gè)體是否存在于某一個(gè)隨機(jī)子數(shù)據(jù)集中。
除PROs數(shù)據(jù)匿名化儲(chǔ)存外,在多個(gè)數(shù)據(jù)集合并和共享的過程中還需注意其他問題。如多個(gè)數(shù)據(jù)集的合并是否會(huì)增加信息,從而增加識(shí)別出數(shù)據(jù)主體的風(fēng)險(xiǎn)。這就要求數(shù)據(jù)所有者和使用者對(duì)數(shù)據(jù)集的合并十分謹(jǐn)慎,尤其嚴(yán)禁將數(shù)據(jù)集與未匿名化的數(shù)據(jù)集相關(guān)聯(lián)。
PROs進(jìn)一步補(bǔ)充和完善了現(xiàn)有健康醫(yī)療大數(shù)據(jù),而大數(shù)據(jù)及大數(shù)據(jù)技術(shù)的發(fā)展也為PROs的相關(guān)研究和實(shí)踐帶來了新的思路和生機(jī)。然而在PROs數(shù)據(jù)與其他數(shù)據(jù)相結(jié)合,形成健康醫(yī)療大數(shù)據(jù)的過程中,由于大數(shù)據(jù)對(duì)患者個(gè)體的精準(zhǔn)定位的特性,數(shù)據(jù)匿名化存儲(chǔ)及共享尤其重要。只有在保障患者信息安全和隱私的前提下,結(jié)合了PROs的醫(yī)療健康大數(shù)據(jù)才能在智能決策、精準(zhǔn)干預(yù)等領(lǐng)域有可為,并最終提升照護(hù)質(zhì)量,節(jié)約醫(yī)療資源。
(致謝:誠摯感謝加拿大PMCC Medline Li博士關(guān)于DART系統(tǒng)的分享。)