閆妍,劉旭,王繼釗,屈航英,張佳,王健生 段小藝
(1.西安交通大學(xué)第一附屬醫(yī)院,西安市 710061; 2.陜西中醫(yī)藥大學(xué)第二附屬醫(yī)院,陜西省咸陽市 712000)
?
大數(shù)據(jù)時代背景下單病種協(xié)作模式發(fā)展的探討
閆妍1,劉旭1,王繼釗1,屈航英2,張佳1,王健生1段小藝1
(1.西安交通大學(xué)第一附屬醫(yī)院,西安市 710061; 2.陜西中醫(yī)藥大學(xué)第二附屬醫(yī)院,陜西省咸陽市 712000)
【摘要】隨著數(shù)據(jù)的爆炸與信息技術(shù)的發(fā)展,如何挖掘與利用大數(shù)據(jù)的價值成為當(dāng)今社會關(guān)注的焦點。單病種協(xié)作網(wǎng)絡(luò)中不斷積累的數(shù)據(jù)具有大數(shù)據(jù)的4V特點,單病種協(xié)作體系應(yīng)當(dāng)順應(yīng)大數(shù)據(jù)時代的客觀背景需求進行發(fā)展。在數(shù)據(jù)安全、個人隱私和數(shù)據(jù)產(chǎn)權(quán)等諸多難題的挑戰(zhàn)下,如何完成體系內(nèi)海量數(shù)據(jù)的收集、存儲、質(zhì)控、挖掘與利用,并將體系大數(shù)據(jù)價值充分作用于臨床決策與科研和醫(yī)療服務(wù)兩大領(lǐng)域是值得我們思考的問題。
【關(guān)鍵詞】單病種協(xié)作;大數(shù)據(jù);數(shù)據(jù)挖掘;安全與隱私;質(zhì)量控制
數(shù)據(jù)科學(xué)正在成為一個新興的領(lǐng)域,大數(shù)據(jù)是信息時代發(fā)展所必須面對的問題與挑戰(zhàn)。近年來,各領(lǐng)域數(shù)據(jù)量成幾何增長,大數(shù)據(jù)多種價值在各種領(lǐng)域,特別是醫(yī)學(xué)生物學(xué)領(lǐng)域被不斷證明。大數(shù)據(jù)掙脫了小樣本理論的束縛,能直白地解釋與預(yù)測科學(xué)與社會發(fā)展規(guī)律,在未來社會的發(fā)展與規(guī)劃中起到革命性的作用。已經(jīng)開展11年的單病種協(xié)作體系積累的數(shù)據(jù)具有大數(shù)據(jù)的特點,如何充分挖掘、利用體系平臺中大量醫(yī)療數(shù)據(jù)的價值,使單病種協(xié)作體系愈加完善是順應(yīng)數(shù)據(jù)時代要求、更好促進單病種防治協(xié)作的有效舉措。
1大數(shù)據(jù)時代來自數(shù)據(jù)的挑戰(zhàn)
1.1大數(shù)據(jù)時代的必然性
隨著信息技術(shù)的不斷發(fā)展,計算機與互聯(lián)網(wǎng)逐漸滲透到人類生活的各個角落,為了方便信息的處理與記錄,加強環(huán)境探索與自我探索,社會環(huán)境與每一個個體都盡可能地被數(shù)字化。此時,結(jié)構(gòu)化數(shù)據(jù)已不能滿足人類的需要,占人類信息總量的80%,以全文文本、圖像、聲音、影視、超媒體為代表的,邏輯性更強的非結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域飛速發(fā)展,并開始被記錄。很小一部分人類活動信息得以記錄與保存,成為人類探索環(huán)境與自我探索的寶貴財富。僅這一部分數(shù)據(jù)量之大已超乎想象,只能以估算的方式加以統(tǒng)計[1-2]。
1.2大數(shù)據(jù)的概念及特性
大數(shù)據(jù)這一概念的專業(yè)化最早可以追溯到《自然》雜志2008年9月??邪l(fā)表的文章BigData:scienceinthePetabyteEra,文章中探討了科研形式在大數(shù)據(jù)產(chǎn)生時發(fā)生的變化[3]。其后Science、麥肯錫、IDC相繼發(fā)表了關(guān)于大數(shù)據(jù)的期刊文章和調(diào)查報告,闡釋了全球數(shù)據(jù)量的飛速增長的背景,肯定了大數(shù)據(jù)的高生產(chǎn)價值與創(chuàng)新價值(用于美國醫(yī)療保險僅一年可產(chǎn)生約3 000億美元的價值),強調(diào)大數(shù)據(jù)是下一個創(chuàng)新、競爭與發(fā)展并存的前沿科學(xué),從包括生物醫(yī)藥的多個方面介紹了大數(shù)據(jù)所帶來的機遇和技術(shù)挑戰(zhàn),以美國為代表的發(fā)達國家紛紛開展大數(shù)據(jù)的開發(fā)、利用工作,作為新一輪國際競爭的重要突破點[4-6]。之后IBM提出大數(shù)據(jù)的4V特性“數(shù)量(Volume)、多樣性(Variety)、速度(Velocity)和價值(Value)” ,全面地推進了全球大數(shù)據(jù)戰(zhàn)略,2013年在4V的基礎(chǔ)上增加了第5V真實性(Veracity)?,F(xiàn)在,大數(shù)據(jù)這一名詞有了較為統(tǒng)一的認識,即一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有4V特點的數(shù)據(jù)集[7]。
由上可見,大數(shù)據(jù)是人類進入信息時代,伴隨科學(xué)技術(shù)發(fā)展而自然產(chǎn)生的重要資料與科學(xué)問題,在各領(lǐng)域如何正確認識與利用大數(shù)據(jù)的價值是值得認真思考的問題。
2單病種協(xié)作平臺的數(shù)據(jù)屬于大數(shù)據(jù)范疇
2.1單病種協(xié)作模式的基本概念
單病種協(xié)作體系是由相關(guān)專業(yè)知名專家組成,以某一疾病防治為目的的協(xié)作網(wǎng)絡(luò)體系,主要以某一種疾病的防治為切入點,在協(xié)作醫(yī)院和高校附屬醫(yī)院之間建立區(qū)域化協(xié)作平臺,通過預(yù)防為主、防治結(jié)合的協(xié)作模式,幫助基層醫(yī)院建立并完善該疾病的防治體系,更好地為區(qū)域內(nèi)的人群提供優(yōu)質(zhì)高效的醫(yī)療服務(wù),同時建立疾病數(shù)據(jù)庫,最終實現(xiàn)大型醫(yī)院、協(xié)作醫(yī)院和患者三方的互利共贏[8]。
陜西省抗癌協(xié)會于2004年實施單病種協(xié)作模式,已在全省初步建立乳腺疾病的單病種協(xié)作網(wǎng)絡(luò)體系,由國內(nèi)、省內(nèi)乳腺疾病及相關(guān)領(lǐng)域知名專家為指導(dǎo)團,并選擇省內(nèi)10個行政區(qū)內(nèi)具有代表性的基層醫(yī)療機構(gòu)為協(xié)作單位,試點將村醫(yī)群體納入?yún)f(xié)作團隊,展開乳腺疾病特別是乳腺癌防止與響應(yīng)的密切合作[9-10]。
2.2單病種協(xié)作體系中的數(shù)據(jù)符合大數(shù)據(jù)的特點與要求
2.2.1體系數(shù)據(jù)樣本量大,種類多樣。單病種協(xié)作體系團隊擁有4 000多名成員,基本覆蓋陜西省86個縣內(nèi)所有單病種病人,建立了完善的區(qū)域單病種醫(yī)療數(shù)據(jù)庫,除了傳統(tǒng)的關(guān)系數(shù)據(jù)類型,也包括以圖像、網(wǎng)頁、視頻、音頻、電子郵件、文檔等形式存在的未加工的、半結(jié)構(gòu)化的和非結(jié)構(gòu)化的數(shù)據(jù),并隨病人的健康狀況而不斷累積,符合大數(shù)據(jù)數(shù)據(jù)量大、數(shù)據(jù)多樣的特點[11]。
2.2.2實時響應(yīng)與高速轉(zhuǎn)診。 單病種協(xié)作平臺以強大的專業(yè)團隊成員為依托,要求通過協(xié)作網(wǎng)絡(luò),以三級轉(zhuǎn)診為依托,實時響應(yīng)病人的就診信息,根據(jù)病情與病人的要求進行分診處理。不僅使病人迅速得到治療,還能確保各類病人都能得到符合預(yù)期的服務(wù)。
2.2.3數(shù)據(jù)價值高,價值密度低。單信息在以綜合判斷為主的傳統(tǒng)醫(yī)療健康領(lǐng)域價值很低,和直面病人收集到的數(shù)據(jù)相比較,單病種協(xié)作網(wǎng)絡(luò)平臺上面對的病人數(shù)據(jù)更存在內(nèi)容無關(guān)、重復(fù)、不準確甚至錯誤,類型復(fù)雜、多樣的特點,這樣的數(shù)據(jù)價值密度更低,需要通過多種數(shù)據(jù)的整合來提煉大數(shù)據(jù)價值。
3大數(shù)據(jù)時代背景下單病種協(xié)作模式的發(fā)展方向
雖然大數(shù)據(jù)的價值已被各個領(lǐng)域不斷證實,作為一門新興學(xué)科,大數(shù)據(jù)在各領(lǐng)域的普遍利用仍不夠成熟,單病種協(xié)作體系還需要不斷發(fā)展與完善。
3.1數(shù)據(jù)的收集、存儲
首先,在數(shù)據(jù)收集方面,患者與醫(yī)生信息的天然不對等,使得患者借助網(wǎng)絡(luò)傳遞的疾病與檢查信息可能存在片面甚至錯誤的問題。醫(yī)學(xué)生命科學(xué)是一門嚴謹?shù)目茖W(xué),為了避免錯誤信息對診斷和治療的干擾,單病種協(xié)作平臺必須根據(jù)相關(guān)疾病特征設(shè)計相應(yīng)的問診流程與復(fù)查制度,方便網(wǎng)絡(luò)患者的表述并對數(shù)據(jù)進行多角度的完善,盡可能地去偽存真,確保數(shù)據(jù)的全面性和可信性。
其次,生物醫(yī)療數(shù)據(jù)是大數(shù)據(jù)的重要組成部分和起源之一。僅一個病人的影像學(xué)數(shù)據(jù)就可達十多GB,在實現(xiàn)低成本、高保真、易檢索、易提取的目標,在冗余配置、云計算等相關(guān)技術(shù)的基礎(chǔ)上,仍需要針對平臺數(shù)據(jù)的特點,進一步對數(shù)據(jù)進行過濾和去重,減少存儲量[1]。
3.2數(shù)據(jù)質(zhì)量控制
單病種協(xié)作平臺數(shù)據(jù)的來源廣、數(shù)量大、種類多,低質(zhì)量的數(shù)據(jù)會極大地浪費傳輸和存儲資源,降低處理效率,錯誤的數(shù)據(jù)甚至?xí)a(chǎn)生錯誤的結(jié)論。單病種協(xié)作體系應(yīng)當(dāng)建立統(tǒng)一的數(shù)據(jù)處理標準、檢驗標準和科學(xué)的抽樣檢查方案,以便剔除冗余數(shù)據(jù),保證數(shù)據(jù)準確性[12]。從而方便各類數(shù)據(jù)的挖掘分析,有效地找出疾病成因,進而提供有針對性的預(yù)防、診斷和治療措施。
3.3數(shù)據(jù)挖掘
醫(yī)學(xué)生命科學(xué)是一門經(jīng)驗科學(xué),僅單個病種就涉及高達上百個檢驗相關(guān)參數(shù),還有難以應(yīng)用傳統(tǒng)方法表述的影像學(xué)信息。同時,隨著醫(yī)院級別的不同,相關(guān)參數(shù)的可信度也不一致。這些都對數(shù)據(jù)的挖掘造成了很大的困難。除了保證數(shù)據(jù)的收集和質(zhì)控環(huán)節(jié)外,單病種協(xié)作體系應(yīng)當(dāng)加強對影像資料描述信息的動態(tài)分析和管理,并制定針對不同來源的數(shù)據(jù)可信度評價,以便于醫(yī)療數(shù)據(jù)的挖掘。
3.4數(shù)據(jù)利用
數(shù)據(jù)利用是大數(shù)據(jù)時代背景下單病種協(xié)作模式發(fā)展的最終目的。單病種協(xié)作體系致力于利用協(xié)作體系內(nèi)的大數(shù)據(jù)價值升級臨床決策與科研和醫(yī)療服務(wù)兩大領(lǐng)域的運行模式。通過對協(xié)作體系內(nèi)大數(shù)據(jù)的挖掘,可以建立公共健康檔案與預(yù)警系統(tǒng),完成疾病的監(jiān)控與響應(yīng),并根據(jù)疾病發(fā)病前的特征預(yù)測疾病相關(guān)風(fēng)險因素,做好疾病預(yù)防,減少醫(yī)療支出;匯總臨床治療結(jié)果,獲取最佳性價比的臨床決策,降低臨床研究成本,提高臨床研究結(jié)果的價值;提高醫(yī)療數(shù)據(jù)透明度,優(yōu)化三級轉(zhuǎn)診服務(wù)與醫(yī)院就診流程,降低國家醫(yī)療支出與醫(yī)院管理成本,降低醫(yī)、患、社會三方的醫(yī)療壓力。
3.5人才培養(yǎng)
隨著醫(yī)療信息化的深入與互聯(lián)網(wǎng)醫(yī)療平臺的發(fā)展,如何收集、處理、分析數(shù)據(jù)日益成為醫(yī)學(xué)大數(shù)據(jù)發(fā)展的重中之重。培養(yǎng)數(shù)據(jù)挖掘、機器學(xué)習(xí)等高級數(shù)據(jù)分析技術(shù)人才是促進醫(yī)學(xué)數(shù)據(jù)向知識轉(zhuǎn)化,將理論知識應(yīng)用于臨床的關(guān)鍵[13]。大數(shù)據(jù)量、高速增長、多樣化、高價值的數(shù)據(jù)庫的管理過程中,涉及醫(yī)學(xué)、管理學(xué)、信息學(xué)、數(shù)理統(tǒng)計學(xué)等多學(xué)科知識。數(shù)據(jù)管理人員必須強化數(shù)據(jù)向知識的轉(zhuǎn)化、數(shù)據(jù)收集、數(shù)據(jù)隱私保護、數(shù)據(jù)聯(lián)機分析、數(shù)據(jù)挖掘、數(shù)據(jù)可視化知識與技能[14-15]。目前,這種貫通多學(xué)科的綜合人才還比較少,單病種協(xié)作體系需要大力培養(yǎng)跨專業(yè)人才,滿足在大數(shù)據(jù)時代背景下醫(yī)療數(shù)據(jù)分析、處理方面的需求。
4大數(shù)據(jù)背景下單病種協(xié)作模式面臨的挑戰(zhàn)
大數(shù)據(jù)浪潮的飛速發(fā)展遠超社會預(yù)期,相關(guān)理論、標準、模式與法規(guī)仍顯稚嫩,需要隨著問題的出現(xiàn)被不斷完善。因此,在相對陌生的大數(shù)據(jù)領(lǐng)域,單病種協(xié)作模式也面臨一些挑戰(zhàn)。
4.1數(shù)據(jù)安全與隱私保護
在數(shù)據(jù)的價值被逐步認可的今天,更大的數(shù)據(jù)量意味著更高的價值,大數(shù)據(jù)已然成為不法分子利用與竊取的對象。近年來,互聯(lián)網(wǎng)廠商頻發(fā)用戶隱私被泄露的事件,反映了我國在數(shù)據(jù)保護方面存在的安全隱患[16-17]。不同于社交網(wǎng)絡(luò)資料,醫(yī)療資料特別是病例、醫(yī)保等資料涉及的內(nèi)容更敏感也更為隱私,在互聯(lián)網(wǎng)背景下,面對多級協(xié)作單位,如何保證單病種協(xié)作平臺的數(shù)據(jù)安全是我們應(yīng)該重視并加以解決的問題。
4.2數(shù)據(jù)產(chǎn)權(quán)
國際上一直關(guān)注有關(guān)數(shù)據(jù)的立法問題,我國目前還沒有一部關(guān)于數(shù)據(jù)方面的正式法律問世。單病種協(xié)作平臺數(shù)據(jù)來源十分廣泛,區(qū)分好公共數(shù)據(jù)與專有數(shù)據(jù),平衡好數(shù)據(jù)開發(fā)者、原始數(shù)據(jù)擁有者、社會公眾等各方利益有利于單病種協(xié)作模式的發(fā)展壯大與維護數(shù)據(jù)安全[18]。
大數(shù)據(jù)為單病種協(xié)作模式的發(fā)展提出了巨大的挑戰(zhàn)和新的機遇,單病種協(xié)作模式與大數(shù)據(jù)的結(jié)合具有極高的理論價值與實踐意義。大數(shù)據(jù)時代背景下單病種協(xié)作模式的發(fā)展是大數(shù)據(jù)在醫(yī)學(xué)領(lǐng)域的嶄新探索:以構(gòu)建實時、便捷、全方位的協(xié)作平臺為基礎(chǔ),充分發(fā)掘數(shù)據(jù)價值,為個體化診療服務(wù),改變醫(yī)療研究、研發(fā)、診療模式。
參考文獻
[1]繆其浩.大數(shù)據(jù)時代來臨,你準備好了嗎[J],科技潮,2012,(9):54-55.
[2]鄔賀銓.大數(shù)據(jù)時代的機遇與挑戰(zhàn)[J].信息安全與通信保密,2013,(3):9-10.
[3]Graham-Rowe D,Goldston D,Doctorow C,et al.Big data:Science in the petabyte era[J].Nature,2008,455(7209):8-9.
[4]Science Staff.Dealing with data.Challenges and opportunities.Introduction[J].Science,2011,331(6018):692-693.
[5]于艷華,宋美娜.大數(shù)據(jù)[J].中興通訊技術(shù),2013,19(1):57-60.
[6]李昆陽.云存儲技術(shù)理論研究[J].計算機光盤軟件與應(yīng)用,2014,(9):47-48.
[7]Margolis R,Derr L,Dunn M,et al.The National Institutes of Health′s Big Data to Knowledge (BD2K) initiative:capitalizing on biomedical big data[J].Journal of the American Medical Informatics Association,2014,21(6):957-958.
[8]范炳文,王昌燕,郭生平,等.單病種協(xié)作在構(gòu)建協(xié)調(diào)統(tǒng)一的衛(wèi)生服務(wù)體系中的作用探討[J].中國初級衛(wèi)生保健,2011,25(9):1-2.
[9]吳宏培,葉爾買克·唐沙哈爾,李松,等.基于單病種協(xié)作防治體系的胃癌區(qū)域化合作防治策略探討[J].中國農(nóng)村衛(wèi)生事業(yè)管理,2012,32(5):507-508.
[10]魯鳴,葉爾買克·唐沙哈爾,王健生,等.單病種協(xié)作對腫瘤綜合治療促進作用探討[J].中國腫瘤,2012,21(1):48-50.
[11]趙屹,卜德超.當(dāng)生物醫(yī)學(xué)遇上大數(shù)據(jù)[J].北大商業(yè)評論,2015,(3):74-79.
[12]陶雪嬌,胡曉峰,劉洋.大數(shù)據(jù)研究綜述[J].系統(tǒng)仿真學(xué)報,2013,Suppl(25):142-146.
[13]左建安,陳雅.基于大數(shù)據(jù)環(huán)境的科學(xué)數(shù)據(jù)共享模式研究[J].情報雜志,2013,32(12):151-154.
[14]涂子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命[M].桂林:廣西師范大學(xué)出版社,2013.
[15]王曉東,吳雅琴.大數(shù)據(jù)時代醫(yī)學(xué)信息管理專業(yè)人才培養(yǎng)[J].醫(yī)學(xué)信息學(xué)雜志,2014,35(01):83-85.
[16]馮登國,張敏,李昊,等.大數(shù)據(jù)安全與隱私保護[J].計算機學(xué)報,2014,37(1):246-258.
[17]劉雅輝,張鐵贏,靳小龍,等.大數(shù)據(jù)時代的個人隱私保護[J].計算機研究與發(fā)展,2015,52(1):229-247.
[18]黃立芳.大數(shù)據(jù)時代呼喚數(shù)據(jù)產(chǎn)權(quán)[J].法制博覽,2014,(12):50-51.
修回日期:2016-05-04
(編輯曹曉蕓)
【中圖分類號】R197
【文獻標識碼】A
【文章編號】1672-4232(2016)03-0086-03
【DOI編碼】10.3969/j.issn.1672-4232.2016.03.027
通信作者:段小藝(1974-),女,博士,副教授;研究方向:重大疾病影像學(xué)診斷。
收稿日期:2016-01-08
Discussion of Single-disease Cooperation Mode under the Background of Big Data
YAN Yan1,LIU Xu1,WANG Ji-zhao1,QU Hang-ying2,ZHANG Jia1,WANG Jian-sheng1,DUAN Xiao-yi1
(1.The First Affiliated Hospital of Xi′an Jiaotong University,Xi′an 710061,China; 2.The Second Affiliated Hospital of Shaanxi University of Chinese Medicine,Xianyang,Shaanxi 712000,China)
【Abstract】With the explosion of data and the development of information technology,the value of data mining and data exploitation has become the concern of the society.The gradually accumulated online data on single-disease cooperation has 4V characteristics,and the single-disease cooperation system should comply with the objective background of big data and develop.With the challenges of data safety,personal privacy,and data property right,we should consider the way to collect,store,mine,exploit and control the quality of huge amount of data within the system and apply the value of big data into clinical decision,scientific research,and medical service.
【Key words】single-disease cooperation; big data; data mining; safety and privacy; quality monitoring