毛廣瑋 王文清 馮斌元 王黎雄 黃浩穎
摘 要:隨著大數(shù)據(jù)時(shí)代的熱潮來襲,運(yùn)用大數(shù)據(jù)的思維及技術(shù)解決生物醫(yī)學(xué)工程領(lǐng)域的問題,已經(jīng)成為時(shí)下的研究熱點(diǎn)。本文通過對(duì)大數(shù)據(jù)的概念以及特征進(jìn)行分析,結(jié)合當(dāng)前生物醫(yī)學(xué)工程中大數(shù)據(jù)的存儲(chǔ)和分析方法,對(duì)生物醫(yī)學(xué)工程的發(fā)展趨勢(shì)進(jìn)行了展望。
關(guān)鍵詞:大數(shù)據(jù);生物醫(yī)學(xué)工程;發(fā)展趨勢(shì)
一、生物醫(yī)學(xué)工程與大數(shù)據(jù)的密切聯(lián)系
1.生物醫(yī)學(xué)工程的基本概念及其應(yīng)用技術(shù)
生物醫(yī)學(xué)工程是綜合生物學(xué)、醫(yī)學(xué)、電子學(xué)、材料學(xué)和工程學(xué)的理論和方法而發(fā)展起來的新興邊緣學(xué)科,其基本任務(wù)是運(yùn)用工程技術(shù)手段,研究和解決生物學(xué)和醫(yī)學(xué)中的有關(guān)問題。其主要應(yīng)用技術(shù)包括生物醫(yī)學(xué)傳感器技術(shù)、信號(hào)檢測(cè)與處理技術(shù)、基因芯片、醫(yī)學(xué)影像處理技術(shù)、臨床生化檢測(cè)技術(shù)等。
2. 生物醫(yī)學(xué)工程數(shù)據(jù)的特點(diǎn)
構(gòu)成生物醫(yī)學(xué)工程的數(shù)據(jù)主要來自對(duì)生物學(xué)、醫(yī)學(xué)、工程學(xué)這幾個(gè)方面的采集,因此數(shù)據(jù)形式呈現(xiàn)多樣化,主要有以下5個(gè)特點(diǎn):①數(shù)據(jù)量龐大。數(shù)據(jù)來源的多樣性使得所搜集到的數(shù)據(jù)繁雜且呈現(xiàn)出不同形式。②數(shù)據(jù)異結(jié)構(gòu)。采集到的非結(jié)構(gòu)化數(shù)據(jù)不方便用數(shù)據(jù)庫二維表結(jié)構(gòu)來表達(dá)。③數(shù)據(jù)無法量化。數(shù)據(jù)無法用具體的數(shù)學(xué)公式或者表達(dá)式來表示其結(jié)構(gòu)及特征。④數(shù)據(jù)冗余無意義。搜集到的數(shù)據(jù)并非都是有意義且有用的。⑤數(shù)據(jù)準(zhǔn)確性較低。進(jìn)行生物信號(hào)數(shù)據(jù)采集時(shí)很難完全避免噪聲干擾,而噪聲往往會(huì)造成數(shù)據(jù)誤差。
二、生物醫(yī)學(xué)工程中的數(shù)據(jù)挖掘方法
1.基于大數(shù)據(jù)大量、多樣特征的 NoSQL數(shù)據(jù)庫
NoSQL(NoSQL=Not Only SQL,它打破了關(guān)系型數(shù)據(jù)庫長(zhǎng)久以來占主導(dǎo)地位的局面,是快速成長(zhǎng)起來的非關(guān)系松散數(shù)據(jù)存儲(chǔ)類型。這種數(shù)據(jù)存儲(chǔ)不需要事先設(shè)計(jì)好的表結(jié)構(gòu),它也不會(huì)出現(xiàn)表與表之間的連接操作和水平分割。
相對(duì)于鋪天蓋地的關(guān)系型數(shù)據(jù)庫的應(yīng)用,NoSQL提倡非關(guān)系數(shù)據(jù)存儲(chǔ),無需事先為要存儲(chǔ)的數(shù)據(jù)建立字段,隨時(shí)可以存儲(chǔ)自定義的數(shù)據(jù)格式。而在關(guān)系數(shù)據(jù)庫里,增刪字段是一件非常麻煩的事情。例如,生物醫(yī)學(xué)工程技術(shù)在獲取數(shù)據(jù)時(shí),得到的往往是大量的且非結(jié)構(gòu)化的數(shù)據(jù),這時(shí)大量且非結(jié)構(gòu)化的數(shù)據(jù)的存儲(chǔ)顯得極其重要。
2.基于大數(shù)據(jù)高速、價(jià)值特征的Hadoop技術(shù)
Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布處理的軟件框架。它包含兩個(gè)基本組成部分:一個(gè)是作為主要存儲(chǔ)系統(tǒng)的Hadoop分布式文件系統(tǒng)(HDFS,Hadoop Distributed File System),它復(fù)制和分發(fā)源數(shù)據(jù)塊到服務(wù)器集群的計(jì)算節(jié)點(diǎn), 由一個(gè)或多個(gè)應(yīng)用程序?qū)ζ溥M(jìn)行分析;另一個(gè)是由MapReduce創(chuàng)建的一個(gè)軟件框架和編程模型,用于編寫能夠并行處理大量分布式數(shù)據(jù)的應(yīng)用程序。
三、生物醫(yī)學(xué)工程的發(fā)展展望
1.診療遠(yuǎn)程網(wǎng)絡(luò)化
在醫(yī)院診斷中,醫(yī)生可以通過互聯(lián)網(wǎng)技術(shù)遠(yuǎn)程操作機(jī)器對(duì)患者進(jìn)行全方位的檢查,并且將采集到的相關(guān)數(shù)據(jù)通過網(wǎng)絡(luò)進(jìn)行實(shí)時(shí)傳輸并儲(chǔ)存。
2.診療系統(tǒng)統(tǒng)一化
普通人一出生即可到當(dāng)?shù)匦l(wèi)生部門建立其個(gè)人醫(yī)療電子檔案,并且衛(wèi)生部門的電子檔案數(shù)據(jù)庫可以和醫(yī)院里的患者電子病歷數(shù)據(jù)庫實(shí)現(xiàn)實(shí)時(shí)同步。在患者到醫(yī)院就診時(shí),全國(guó)各個(gè)醫(yī)院都可以通過調(diào)用患者的醫(yī)療電子檔案查看其以前的相關(guān)病史及治療方案,甚至可以對(duì)比患者親屬相關(guān)病歷,給患者做出明確診斷。
3.醫(yī)療儀器智能小型化
體積小、智能化且契合人體構(gòu)造的新型診斷儀器的出現(xiàn),使醫(yī)生能夠?qū)颊哌M(jìn)行方便快捷的檢查。例如,患者佩戴智能手環(huán),醫(yī)生可實(shí)時(shí)監(jiān)測(cè)人體系統(tǒng)細(xì)微的變化,包括血糖、血壓、血蛋白等含量的變化,再通過和正常人體的相關(guān)數(shù)據(jù)的對(duì)比,提出合理建議和解決方案。
總之,大數(shù)據(jù)時(shí)代下,生物醫(yī)學(xué)工程發(fā)展會(huì)更加迅速,會(huì)為人類健康醫(yī)療產(chǎn)業(yè)帶來重大的貢獻(xiàn)。
參考文獻(xiàn):
[1]李德偉,顧 煜,王海平,等.大數(shù)據(jù)改變世界[M].北京:電子工業(yè)出版社,2013.
[2]錢志新.數(shù)據(jù)大金礦[M].南京:南京大學(xué)出版社,2013.
[3]李海云,景文武,于紅玉.生物醫(yī)學(xué)工程學(xué)科發(fā)展的思考[J].北京生物醫(yī)學(xué)工程,2015,34(6).