眭沛雯 陸群(通訊作者)
(1江蘇省丹陽市第三中學(xué)生物學(xué) 江蘇 丹陽 212300)
(2南京醫(yī)科大學(xué)臨床醫(yī)學(xué) 江蘇 南京 210000)
若是從生物醫(yī)學(xué)數(shù)據(jù)處理工序的角度分析,從生物醫(yī)學(xué)數(shù)據(jù)中完成數(shù)據(jù)挖掘最關(guān)鍵的就是在眾多信息中提取精煉信息并且有效處理一些潛在的數(shù)據(jù)和知識(shí)。
第一,要確定目標(biāo)數(shù)據(jù)。應(yīng)用數(shù)據(jù)挖掘技術(shù)的人員要明確具體的任務(wù)和關(guān)鍵,切實(shí)建立健全完整的數(shù)據(jù)處理和管控流程,確保能有效提升數(shù)據(jù)管控和應(yīng)用機(jī)制,保證基礎(chǔ)方式的合理性[1]。
第二,要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,對(duì)于數(shù)據(jù)挖掘技術(shù)應(yīng)用過程和效果而言,數(shù)據(jù)預(yù)處理具有非常關(guān)鍵的意義和價(jià)值,相關(guān)人員要積極建立健全完整的預(yù)處理機(jī)制,確保預(yù)處理能對(duì)相關(guān)信息展開初步探討和管控。
第三,要對(duì)數(shù)據(jù)進(jìn)行變換,也就是對(duì)數(shù)據(jù)開展處理工作,并且建立相應(yīng)的評(píng)價(jià)機(jī)制,保證建模工作的合理性,也為數(shù)據(jù)管控體系的全面升級(jí)奠定基礎(chǔ)。
第四,要對(duì)數(shù)據(jù)進(jìn)行最終的分析,然后得出數(shù)據(jù)挖掘的結(jié)論。
需要注意的是,數(shù)據(jù)挖掘技術(shù)本身就不能僅僅依托一種處理方式,而是要利用多元化技術(shù)進(jìn)行并行處理和控制,有效對(duì)比分析相關(guān)數(shù)據(jù)信息,且有效對(duì)處理方式進(jìn)行改進(jìn)和監(jiān)管,確保能更加適宜研究對(duì)象開展相關(guān)工作。需要注意的是,在數(shù)據(jù)挖掘技術(shù)應(yīng)用體系內(nèi),數(shù)據(jù)提取過程較為關(guān)鍵,技術(shù)人員不僅要對(duì)降維和除噪予以關(guān)注,也要保證參數(shù)引入后能為后續(xù)處理工序的全面落實(shí)奠定基礎(chǔ),確保效果能符合實(shí)際需求[2]。
除此之外,在進(jìn)行數(shù)據(jù)挖掘的過程中,要對(duì)同化處理工序予以關(guān)注,確保能針對(duì)不同種類以及不同結(jié)構(gòu)的生物醫(yī)學(xué)數(shù)據(jù)進(jìn)行數(shù)值型數(shù)據(jù)模型分析,從而發(fā)揮歸一化處理機(jī)制的優(yōu)勢(shì)。并且,要對(duì)數(shù)學(xué)最優(yōu)估計(jì)理論進(jìn)行統(tǒng)籌控制,維護(hù)數(shù)據(jù)模型和實(shí)際醫(yī)學(xué)數(shù)據(jù)之間的最優(yōu)轉(zhuǎn)換體系,維護(hù)動(dòng)態(tài)化數(shù)據(jù)模型實(shí)效性價(jià)值,保證驅(qū)動(dòng)模型能有效運(yùn)行,也能為后續(xù)輸入的數(shù)據(jù)進(jìn)行初始同化處理,確保輸出結(jié)果能更加接近實(shí)際數(shù)值,維護(hù)應(yīng)用價(jià)值的基礎(chǔ)上保證數(shù)據(jù)結(jié)構(gòu)的一致性,也為數(shù)據(jù)內(nèi)部關(guān)系的明確化處理奠定基礎(chǔ)。
對(duì)于DNA的研究是遺傳學(xué)研究的關(guān)鍵,因此,充分整合數(shù)據(jù)挖掘技術(shù)能有效對(duì)相關(guān)內(nèi)容進(jìn)行系統(tǒng)化分析和信息處理。
第一,DNA序列間相似搜索。在進(jìn)行時(shí)間序列數(shù)據(jù)挖掘的過程中,要盡量采取相似搜索機(jī)制。首先,要從數(shù)據(jù)庫中借助關(guān)鍵詞對(duì)相關(guān)樣本進(jìn)行搜索和檢索處理,并且有效構(gòu)造出患者基因序列組以及健康組織基因組,有效將其作為對(duì)照進(jìn)行分析。尤其要注意的是,要借助神經(jīng)網(wǎng)絡(luò)、頻度測(cè)定和統(tǒng)計(jì)工序等進(jìn)行智能管理,有效完成模式分析[3]。其次,要在健康樣本中對(duì)頻度超出帶病樣本的序列進(jìn)行集中收集和管控,并且有效可用技術(shù)機(jī)制和時(shí)間序列分析體系完善數(shù)據(jù)管控工作,目前較為常見的就是數(shù)據(jù)變化方式,合理性建構(gòu)伸縮體系、規(guī)范化體系以及時(shí)頻窗等,確保能在頻繁序列模式中搜索具體信息和內(nèi)容。
第二,關(guān)聯(lián)分析。在對(duì)DNA進(jìn)行研究的過程中發(fā)現(xiàn),基因表達(dá)一直是研究工作的重點(diǎn),多數(shù)基因聯(lián)合控制性狀成為了研究關(guān)鍵,多數(shù)致病因素并不是單一基因?qū)е碌?,而是不同基因組合后共同作用的結(jié)果。建立完整的關(guān)聯(lián)分析機(jī)制對(duì)于幫助搜索和判定樣本中基因種類具有非常重要的意義和價(jià)值。
為了有效對(duì)影像數(shù)據(jù)進(jìn)行管控和分析,要充分發(fā)揮數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì),建立健全完整的數(shù)據(jù)分析和管控體系,確保能從根本上解決數(shù)據(jù)豐富但是信息缺失的問題[4]。
第一,有效強(qiáng)化增強(qiáng)和邊緣提取水平。在數(shù)據(jù)挖掘理論中,數(shù)據(jù)預(yù)處理技術(shù)和降噪處理工序?qū)τ谛畔⑹占托畔⒎治鼍哂兄匾饬x,能在提升目標(biāo)影像質(zhì)量的基礎(chǔ)上對(duì)目標(biāo)信息予以集中收集和管理,并且完成組織邊緣提取工作。
第二,組織定征處理。在應(yīng)用醫(yī)學(xué)數(shù)據(jù)挖掘技術(shù)的過程中,要對(duì)目標(biāo)器官以及組織進(jìn)行概念性描述,并且結(jié)合數(shù)據(jù)分析獲取相應(yīng)的特征,有效整合自動(dòng)化研究過程。近幾年,研究學(xué)者開始使用CT影像對(duì)鈣化組織的體積和數(shù)量等進(jìn)行分析,并且試圖有效統(tǒng)計(jì)并且分析相應(yīng)的腫瘤屬于良性還是惡性[5]。
第三,對(duì)醫(yī)學(xué)影像進(jìn)行管理和檢索。伴隨著數(shù)據(jù)庫技術(shù)的不斷發(fā)展和進(jìn)步,利用DICOM標(biāo)準(zhǔn)建立影像設(shè)備、影響數(shù)據(jù)分析機(jī)制能有效提升數(shù)據(jù)存儲(chǔ)管理的實(shí)際水平。一方面,能有效從描述的角度對(duì)檢索系統(tǒng)進(jìn)行判定,并且能在影像存儲(chǔ)的基礎(chǔ)上建立完整的病人病歷檔案,合理化對(duì)目標(biāo)組織和器官等進(jìn)行信息檢索,全面提高影像管理和檢索的實(shí)效性。另一方面,若是從內(nèi)容的角度對(duì)檢索系統(tǒng)進(jìn)行分析,基本思路就是從影像中合理性提取相關(guān)信息,借助數(shù)據(jù)簡約處理和投影分析就能對(duì)相關(guān)特征性向量和標(biāo)記進(jìn)行處理,充分應(yīng)用模糊神經(jīng)網(wǎng)絡(luò)以及決策樹算法對(duì)信息進(jìn)行智能化識(shí)別,有效提升計(jì)算量處理效果。
在醫(yī)學(xué)數(shù)據(jù)進(jìn)行挖掘的過程中,生理參數(shù)數(shù)據(jù)處理工作也非常關(guān)鍵,尤其是在計(jì)算機(jī)技術(shù)和電子監(jiān)護(hù)技術(shù)不斷發(fā)展的時(shí)代背景下,人們利用監(jiān)護(hù)數(shù)據(jù)能為后續(xù)監(jiān)護(hù)工作的開展制定相應(yīng)的規(guī)劃,并且減少醫(yī)生的工作強(qiáng)度,為醫(yī)學(xué)規(guī)律的探索和深度管理奠定基礎(chǔ)。
一方面,能有效自動(dòng)預(yù)測(cè)趨勢(shì)和行為,在對(duì)醫(yī)學(xué)數(shù)據(jù)進(jìn)行深度分析的基礎(chǔ)上,就能一定程度上科學(xué)化預(yù)測(cè)疾病發(fā)作頻率,制定科學(xué)化預(yù)防和救治方案,以保證能及時(shí)挽救患者的生命。目前較為常見的技術(shù)體系內(nèi),線性技術(shù)、非線性技術(shù)以及廣義回歸模型具有深遠(yuǎn)的研究意義。另外,將神經(jīng)網(wǎng)絡(luò)和模糊控制技術(shù)應(yīng)用在生理參數(shù)分析中也較為常見[6]。
另一方面,要對(duì)關(guān)聯(lián)分析進(jìn)行綜合管控,醫(yī)學(xué)生理參數(shù)作用機(jī)理聯(lián)合數(shù)據(jù)挖掘技術(shù)能提升數(shù)據(jù)處理和挖掘的效果。
總而言之,數(shù)據(jù)挖掘本身是數(shù)據(jù)處理技術(shù)的最新成果,要對(duì)先驗(yàn)知識(shí)和相關(guān)醫(yī)學(xué)體系進(jìn)行深度剖析,提升醫(yī)療服務(wù)的準(zhǔn)確水平,提升研究工作的實(shí)際水平,也為全面提高醫(yī)學(xué)診斷和治療效果奠定了堅(jiān)實(shí)基礎(chǔ),充分發(fā)揮醫(yī)學(xué)數(shù)據(jù)的實(shí)際價(jià)值。