基于內(nèi)容的醫(yī)學(xué)圖像檢索技術(shù)在維吾爾藥材圖像檢索中的應(yīng)用前景
木拉提·哈米提, 孫靜, 嚴(yán)傳波, 阿布都艾尼·庫(kù)吐魯克
(新疆醫(yī)科大學(xué)醫(yī)學(xué)工程技術(shù)學(xué)院, 烏魯木齊830011)
摘要:維吾爾醫(yī)藥是我國(guó)醫(yī)藥學(xué)的重要組成部分,長(zhǎng)期以來(lái)新疆維吾爾醫(yī)療機(jī)構(gòu)累積了大量的藥材數(shù)據(jù)資料,目前主要采用人工標(biāo)注、文本檢索的方式對(duì)其進(jìn)行使用。為改善這種低效利用的局面,建立藥材資源數(shù)據(jù)庫(kù)及藥材圖像檢索平臺(tái)是一項(xiàng)亟待解決的問(wèn)題。為滿足快速發(fā)展的維吾爾醫(yī)學(xué)及新藥開(kāi)發(fā)過(guò)程中快速而準(zhǔn)確的檢索需求,將基于內(nèi)容的圖像檢索技術(shù)應(yīng)用于維吾爾醫(yī)藥材資源數(shù)據(jù)庫(kù)及檢索平臺(tái)中,此項(xiàng)技術(shù)的成功運(yùn)用將會(huì)對(duì)維吾爾醫(yī)學(xué)臨床治療、新藥開(kāi)發(fā)和民族地區(qū)衛(wèi)生醫(yī)療事業(yè)的發(fā)展產(chǎn)生積極而深遠(yuǎn)的影響。本文針對(duì)基于內(nèi)容的圖像檢索技術(shù)、圖像特征提取方法以及圖像相似度匹配方法進(jìn)行綜述。
關(guān)鍵詞:維吾爾醫(yī)藥材; 基于內(nèi)容的圖像檢索; 特征提?。?相似度匹配
中圖分類號(hào):R318.04文獻(xiàn)標(biāo)識(shí)碼:A
doi:10.3969/j.issn.1009-5551.2015.07.005
[收稿日期:2015-04-19]
維吾爾族醫(yī)藥(簡(jiǎn)稱“維藥”)有著長(zhǎng)期的發(fā)展過(guò)程,長(zhǎng)久以來(lái)維吾爾族人民在與疾病進(jìn)行斗爭(zhēng)和自我保健的過(guò)程中,積累了許多寶貴經(jīng)驗(yàn),并通過(guò)連續(xù)不斷的發(fā)揚(yáng)創(chuàng)新與總結(jié)提高,維藥在傳統(tǒng)中醫(yī)學(xué)的影響下,綜合了阿拉伯和古希臘醫(yī)藥學(xué)的優(yōu)點(diǎn),逐步形成了具有新疆特色的醫(yī)學(xué)體系[1-4]。
維吾爾族醫(yī)藥在傳統(tǒng)醫(yī)學(xué)庫(kù)中占有很高的比例,僅常用藥就有1 000多種,再加上長(zhǎng)期以來(lái)新疆維吾爾醫(yī)療機(jī)構(gòu)的行醫(yī)用藥,積累了大量維吾爾醫(yī)藥材數(shù)據(jù)資料。目前這些藥材數(shù)據(jù)資源主要是采用已編書籍來(lái)存檔,使用時(shí)通過(guò)目錄中記載的藥材名稱或人工標(biāo)注來(lái)進(jìn)行檢索。查找過(guò)程中往往依賴于搜索者的先行經(jīng)驗(yàn),搜索存在諸多困難,數(shù)據(jù)利用率低,滿足不了快速發(fā)展的維吾爾醫(yī)學(xué)及新藥開(kāi)發(fā)過(guò)程中快速而準(zhǔn)確檢索的需求。要高效利用這些數(shù)據(jù)資源,就要建立一個(gè)維吾爾醫(yī)藥材資源數(shù)據(jù)庫(kù)和檢索平臺(tái)。
針對(duì)上述目標(biāo),本課題組提出建立“維吾爾醫(yī)藥材資源數(shù)據(jù)庫(kù)及檢索平臺(tái)的研究與設(shè)計(jì)”,本文就該檢索平臺(tái)中的維吾爾族醫(yī)藥材數(shù)據(jù)庫(kù)中圖像檢索技術(shù)作一綜述。
1圖像檢索
圖像檢索技術(shù)從20世紀(jì)70年代興起,到21世紀(jì)80年代,基于文本的圖像檢索(TBIR)已經(jīng)普遍應(yīng)用起來(lái)。其將圖像作為一個(gè)處理單元,人為地進(jìn)行關(guān)鍵信息標(biāo)識(shí);使用時(shí),通過(guò)對(duì)這些標(biāo)注的查找,完成對(duì)圖像的檢索。直到20世紀(jì)末,利用圖像的內(nèi)容進(jìn)行分析和檢索的方法出現(xiàn)了,稱為基于內(nèi)容的圖像檢索(CBIR)[5-6]。
1.1基于文本的圖像檢索基于文本的圖像檢索使用了傳統(tǒng)的文本檢索方法,不關(guān)注圖像視覺(jué)信息[7-9],而是通過(guò)圖像的作者、創(chuàng)建日期、大小、圖像基本信息等信息標(biāo)識(shí)圖像,并利用這些標(biāo)識(shí)來(lái)查詢,或按照文件系統(tǒng)的結(jié)構(gòu)化目錄瀏覽圖像。進(jìn)行圖像查找時(shí),輸入描述性文本,當(dāng)描述信息與圖像標(biāo)識(shí)一致時(shí)即可輸出圖像;反之則輸出為空。文本標(biāo)識(shí)檢索包括2條途徑:(1)使用圖像基本信息進(jìn)行檢索,包括圖像的作者、創(chuàng)建日期、大小以及其他的文本信息。(2)使用手工標(biāo)注進(jìn)行檢索。用文字描述圖像的內(nèi)容,分類并標(biāo)識(shí)為關(guān)鍵字,進(jìn)而建立索引。
基于文本的檢索容易實(shí)現(xiàn),操作簡(jiǎn)單,目前仍然是各搜索引擎和門戶網(wǎng)站主要使用方法;但是用戶一旦對(duì)圖像的理解與圖像的標(biāo)注描述有偏差,就無(wú)法準(zhǔn)確地查找所需圖像;同時(shí)人為地進(jìn)行圖像標(biāo)識(shí),工作量較大且效率低,并且標(biāo)識(shí)是主觀的;某些圖像本身要表達(dá)的信息很難用語(yǔ)言或文字進(jìn)行描述。
在數(shù)字化時(shí)代,圖像數(shù)據(jù)與日俱增,單純基于文本的圖像檢索已滿足不了用戶的需求。為了突破基于文本檢索中標(biāo)識(shí)的人為干預(yù),人們開(kāi)始研究圖像視覺(jué)特征,并期望使用這些特征作為圖像的“關(guān)鍵字”。
1.2基于內(nèi)容的圖像檢索基于內(nèi)容的圖像檢索是根據(jù)圖像本身所包含的信息進(jìn)行檢索,用目標(biāo)圖像本身的顏色、形狀等底層視覺(jué)特征構(gòu)成描述圖像內(nèi)容的特征向量,用特征向量建立索引并定義匹配方法,找出特性相似的圖像[10]。用圖像本身具有的內(nèi)容去描述圖像使得檢索的切入點(diǎn)更加準(zhǔn)確。目前已啟用的基于內(nèi)容的圖像檢索系統(tǒng)有很多[11],如IBM公司開(kāi)發(fā)的QBIC系統(tǒng)、哥倫比亞大學(xué)研發(fā)的WebSeek系統(tǒng)、麻省理工學(xué)院研發(fā)的Photobook系統(tǒng)等。基于內(nèi)容的圖像檢索思路是:(1)針對(duì)不同來(lái)源的圖像進(jìn)行預(yù)處理,選取特定算法進(jìn)行特征提取,建立特征檢索索引;(2)使用相似度匹配算法,計(jì)算待查詢圖像與特征檢索索引之間的關(guān)聯(lián);(3)按相似度的不同級(jí)別進(jìn)行反饋。該方法根據(jù)圖像表現(xiàn)實(shí)質(zhì)提取檢索特征;能夠近似匹配,在不知道目標(biāo)圖像注釋信息的情況下,利用圖像特征找到與其相似的圖片;基于內(nèi)容的圖像檢索系統(tǒng)一般配套有圖像庫(kù)、特征庫(kù)等,可以滿足用戶多方面的查詢要求[12-13]。
2圖像檢索的內(nèi)容特征提取
圖像內(nèi)容特征提取是對(duì)圖像本質(zhì)特性進(jìn)行檢測(cè)并將圖像分割,將其數(shù)值化或符號(hào)化,形成特征矢量[14]。圖像的本質(zhì)特征是指那些能夠反映圖像內(nèi)在屬性和特點(diǎn)的低層信息。在提取這些特征時(shí),對(duì)拍攝和采集環(huán)境的變化不敏感,因而在表示圖像時(shí),盡可能地展現(xiàn)圖像本身的內(nèi)容,并不受到領(lǐng)域的干擾。特征提取是圖像識(shí)別、基于內(nèi)容的圖像檢索、圖像數(shù)據(jù)挖掘等工作的基礎(chǔ),是圖像分類和模式識(shí)別的重要環(huán)節(jié)[15]。
2.1圖像顏色特征顏色特征是最主要區(qū)分事物的視覺(jué)特征,在現(xiàn)有檢索系統(tǒng)中被廣泛使用,主要原因是與其他的視覺(jué)特征相比,對(duì)于圖像的大小、縮放和旋轉(zhuǎn)的依賴性較小,甚至在各種形變中,均能保持特征不變性,穩(wěn)定性比較好[16-18]。
2.1.1顏色直方圖特征顏色直方圖作為顏色特征廣泛地應(yīng)用于圖像檢索系統(tǒng),表現(xiàn)能力很好,彩色圖像的直方圖描述的是不同顏色在整幅圖像中所占得比例,而對(duì)顏色所處的空間位置并不是很關(guān)心[19]。計(jì)算顏色直方圖,首先根據(jù)使用的顏色空間劃分區(qū)間,每一個(gè)區(qū)間作為一個(gè)直方圖小單元;然后計(jì)算每一個(gè)區(qū)間中某顏色像素出現(xiàn)的頻率;最后進(jìn)行圖形化描述。
2.1.2顏色矩特征顏色矩(Color Moments)特征是一種簡(jiǎn)單有效的顏色特征表達(dá)方法[20],即用它的矩表示圖像的顏色分布,例如常使用顏色的一階矩(Mean)、二階矩(Variance)、三階矩(Skewness)。由于像素具有顏色空間的3個(gè)分量,結(jié)合每個(gè)分量上的3個(gè)顏色矩就可以表達(dá)圖像信息,特征量相對(duì)少,但是該特征分辨力較低,因而進(jìn)行過(guò)濾縮小范圍時(shí)使用。
2.1.3顏色集顏色集比較類似于顏色直方圖,它支持大數(shù)據(jù)量的圖像檢索。在提取該特征時(shí),首先要進(jìn)行顏色空間的轉(zhuǎn)化,將RGB空間轉(zhuǎn)化為用戶感知特性的顏色空間,得到一個(gè)多顏色輸出的量化函數(shù);利用該顏色分量函數(shù)建立圖像的索引表。顏色集方法只是一種表達(dá)方式,類似于閾值直方圖,對(duì)大規(guī)模的圖像集檢索效果比較好。
2.1.4顏色相關(guān)圖顏色相關(guān)圖(Color Correlogram)是圖像顏色分布特征的描述。它描述了圖像中顏色變換的空間關(guān)系,該特征對(duì)于查詢空間相同的圖像比較好,但是計(jì)算量太大。
2.2圖像紋理特征紋理特征是一種量化的結(jié)構(gòu)特征,用于反映圖像中特定結(jié)構(gòu)的重復(fù),可區(qū)分不同內(nèi)容。近些年來(lái),對(duì)紋理分析方法的各種理論或方法的應(yīng)用已經(jīng)比較成熟,目前常用的紋理特征提取方法包括結(jié)構(gòu)方法、信號(hào)處理方法、幾何方法、模型方法和統(tǒng)計(jì)方法。
2.2.1灰度共生矩陣灰度共生矩陣是20世紀(jì)70年代早期Haralick等[21]提出的基于二階灰度統(tǒng)計(jì)特征的共生矩陣方法。灰度共生矩陣是圖像中處于相對(duì)位置的像素對(duì)同時(shí)具有某灰度值的頻數(shù)來(lái)統(tǒng)計(jì)表達(dá)圖像的紋理信息。該方法中總共有14種標(biāo)量來(lái)表征紋理特征,但是在實(shí)際應(yīng)用中只選用能量、慣性矩、熵、相關(guān)4種標(biāo)量,特征向量的維數(shù)較少,提取速度快,是公認(rèn)的一種重要的紋理分析方法。
2.2.2Tamura紋理特征Tamura等[22]以人的主觀心理度量為標(biāo)準(zhǔn),提出6個(gè)基本的紋理特征,即粗糙度、方向度、對(duì)比度、線像度、規(guī)整度和粗略度,其中最常用的是前3個(gè)特征:(1)粗糙度:是指圖像中像素點(diǎn)之間灰度級(jí)別在三維形態(tài)下的變化差距和間距狀況,它反映了圖像灰度變化的程度。(2)對(duì)比度:是指一幅圖像中灰度變化的層次,層次越多表示對(duì)比度越大,反之則越小。(3)方向度:圖像中的像素在某個(gè)方向上呈現(xiàn)線性分布,例如人體肌肉或者組織的紋理。紋理分析在醫(yī)學(xué)中的應(yīng)用始于20世紀(jì)70年代,目前國(guó)內(nèi)外學(xué)者仍在不斷地進(jìn)行探索。將紋理特征提取應(yīng)用于醫(yī)學(xué)圖像時(shí),找到圖像的本質(zhì)特點(diǎn)和紋理分布規(guī)律,才可能取得較好的結(jié)果。
2.3圖像形狀特征形狀特征是屬于圖像的基本特征之一,有2種表示方法:一類是區(qū)域,它針對(duì)圖像中特定范圍;另一種是輪廓,它針對(duì)的是物體的邊界[23]。
2.3.1區(qū)域特征區(qū)域特征利用一定的界限范圍內(nèi),具有相似性和連續(xù)性的像素點(diǎn)來(lái)描述這一范圍的參數(shù)。矩的計(jì)算就要使用目標(biāo)范圍內(nèi)所有相關(guān)的點(diǎn)進(jìn)行統(tǒng)計(jì),從全圖像的角度描述對(duì)象。
Hu在應(yīng)用圖像二維矩進(jìn)行模式識(shí)別時(shí)給出了一組基于通用矩組合的代數(shù)矩不變量,稱為Hu矩[24]。Hu矩利用圖像的第二、三階歸一化中心矩,可以得到描述圖像的7個(gè)特征變量組。由于Hu矩描述圖像輪廓時(shí)具有空間幾何不變性,已經(jīng)被廣泛用于描述圖像的形狀特征。
2.3.2輪廓特征輪廓特征是對(duì)對(duì)象形體和周圍區(qū)域之間的明顯變化進(jìn)行描述,進(jìn)而借助該描述,查詢具有相似輪廓的其他對(duì)象。常見(jiàn)的輪廓描述方法包括基于傅立葉變換的輪廓描述[25]、基于曲率尺寸空間的輪廓描述[26]、基于小波變換的輪廓描述、Hough變換以及鏈碼等方法。
3圖像特征提取方法比較
隨著圖像檢索技術(shù)的應(yīng)用,特征提取的方法也逐步深入,不同的特征提取方法也各有優(yōu)劣。圖像顏色特征能夠描述一幅圖像中不同顏色的分布比例,但其對(duì)圖像中局部顏色無(wú)能為力,而且在對(duì)各種色彩所處的空間位置進(jìn)行描述也比較困難,即無(wú)法具體描述圖像中的對(duì)象[27]。
圖像紋理特征是全局特征,因而具有很好的可行性和穩(wěn)定性。相比顏色特征,紋理特征不會(huì)受到局部差異的影響而搜索失敗。同時(shí)該特征不受圖像轉(zhuǎn)動(dòng)的影響,有很強(qiáng)的抗噪能力。但是,得到的紋理特征會(huì)隨著圖像的像素分辨率變化而變化[28]。
圖像形狀特征的目的性很明確,研究圖像中的特殊區(qū)域,但若目標(biāo)產(chǎn)生形變,則算法穩(wěn)定性會(huì)大大下降,同時(shí)由于形狀特征具有全局性,對(duì)其計(jì)算時(shí)間比較長(zhǎng),而且存儲(chǔ)空間要求也會(huì)比較大[29-30]。每一類圖像特征都有其各自的憂劣,僅使用某一類特征進(jìn)行圖像檢索,可能從該特征的角度出發(fā),可獲得比較好的檢索結(jié)果,但是在進(jìn)行整體描述時(shí),卻可能和人眼觀察到的有偏差。因此,在進(jìn)行整幅圖像內(nèi)容檢索時(shí),通常不使用描述部分屬性的單一特征,大多數(shù)情況下,都會(huì)使用不同特征進(jìn)行組合,力求最好的檢索效果。
4圖像特征的相似性匹配
一種合適的相似性匹配方法在很大程度上影響著檢索結(jié)果。人通過(guò)眼睛觀察、搜尋相似圖像和目前使用的距離算法有很大的差異,這也是導(dǎo)致檢索結(jié)果不一定符合要求的重要原因。
目前,進(jìn)行圖像特征相似性匹配的主要方法是通過(guò)向量空間模型,計(jì)算圖像特征之間的距離來(lái)衡量彼此之間的相似性程度。
總之,基于內(nèi)容的圖像檢索技術(shù)已經(jīng)應(yīng)用于多個(gè)領(lǐng)域,彌補(bǔ)了傳統(tǒng)檢索方法的不足。隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,基于內(nèi)容的圖像檢索必將有著更為廣闊的使用前景。將基于內(nèi)容的圖像檢索技術(shù)運(yùn)用到維吾爾醫(yī)藥學(xué)領(lǐng)域,找到適合于新疆維吾爾藥材圖像檢索的特征并驗(yàn)證其檢索性能,旨在提高維吾爾醫(yī)藥材圖像檢索準(zhǔn)確率,為開(kāi)發(fā)基于內(nèi)容的新疆維吾爾醫(yī)藥材圖像檢索系統(tǒng)提供一定的依據(jù),提高維吾爾醫(yī)藥材圖像資料的利用率,進(jìn)一步輔助醫(yī)藥學(xué)科研人員及其他相關(guān)人員檢索所需藥材并查詢相關(guān)的藥理作用,高效地利用已有的維吾爾藥材數(shù)據(jù)資源。這對(duì)新疆維吾爾醫(yī)藥材數(shù)據(jù)資源的全面研究和有效利用有著積極而深遠(yuǎn)的影響,對(duì)于促進(jìn)民族地區(qū)醫(yī)藥事業(yè)和經(jīng)濟(jì)發(fā)展具有重要意義。
參考文獻(xiàn):
[1]新疆藥物研究所維吾爾藥重點(diǎn)實(shí)驗(yàn)室.維吾爾藥材真?zhèn)舞b別[M].烏魯木齊:新疆美術(shù)攝影出版社/新疆電子音像出版社,2007:132-133.
[2]Liu C, Gu ZY, Yang WJ, et al. Advances of biological taxonomy and species identification in Medicinal Plant Species by DNA barcodes[J].J Am Sci,2011, 7(5):147-151.
[3]黃秀蘭,周秋蘭.維吾爾醫(yī)藥發(fā)展現(xiàn)狀及存在問(wèn)題分析[J].中央民族大學(xué)學(xué)報(bào),2007,16(3):223-228.
[4]王宇真,呂風(fēng)民,韓勇明.維吾爾醫(yī)藥資源及藥物學(xué)說(shuō)簡(jiǎn)介[J].中國(guó)中藥雜志,2005,30(4):315-317.
[5]韋娜,耿國(guó)華,周明全,等.基于內(nèi)容的圖像檢索系統(tǒng)性能評(píng)價(jià)[J].中國(guó)圖像圖形學(xué)報(bào),2004,9(11):1271-1276.
[6]王春燕,郭圣文,吳效明.基于內(nèi)容的醫(yī)學(xué)圖像檢索[J].醫(yī)療衛(wèi)生裝備,2008,29(5): 33-35.
[7]Nidhi G, Priti S. A refined hybrid image retrieval system using text and color[J].Int J Comput Sci Issues,2012,9(4):48-56.
[8]阿斯艷·哈米提,阿不都熱西提·哈米提.基于文本的圖像檢索與基于內(nèi)容的圖像檢索技術(shù)的比較研究[J].首都師范大學(xué)學(xué)報(bào):自然科學(xué)版,2012,33(4):6-9.
[9]張騫.基于文本的與基于內(nèi)容的圖像檢索技術(shù)比較研究[J].情報(bào)探索,2012,171(1):111-113.
[10]齊恒,李克秋,申彥明.基于特征點(diǎn)組合聚類的圖像檢索新方法[J].大連理工大學(xué)學(xué)報(bào),2014,54(4):477-481.
[11]王瑩,羅坤,姜磊,等.基于內(nèi)容的圖像檢索技術(shù)的專利技術(shù)綜述[J].電視技術(shù),2013,3(2):62-65.
[12]Shi ZP, Liu X, Li QY ,et al. Extracting discriminative features for CBIR[J]. Multimedia Tools Appl, 2012, 61(2):263-279.
[13]Imane D, Khalid I. A fast and efficient fuzzy approximation-based indexing for CBIR[J]. Multimed Tools Appl,2014,1(12):821-847.
[14]劉益新,郭依正.灰度直方圖特征提取的Matlab實(shí)現(xiàn)[J].電腦知識(shí)與技術(shù),2009,5(32):9032-9034.
[15]翟俊海,趙文秀,王熙照.圖像特征提取研究[J]. 河北大學(xué)學(xué)報(bào), 2009, 29(1): 106-112.
[16]劉穎,范九倫.基于內(nèi)容的圖像檢索技術(shù)綜述[J].西安郵電學(xué)院學(xué)報(bào),2012,17(2):1-8.
[17]Liu GH, Yang JY. Content-based image retrieval using color difference histogram [J]. Pattern Recognition, 2013, 46(1):188-198.
[18]Ping Y, Zhang CH. Image retrievals based on color and texture features [J]. IEEE Int Sig Pro Appl,2007, 2:1-4.
[19]張悅,霍宏,方濤.基于生物視覺(jué)的顏色直方圖特征提取[J].高技術(shù)通訊,2014,24(4):407-413.
[20]張少博,全書海,石英,等. 基于顏色矩的圖像檢索算法研究[J].計(jì)算機(jī)工程,2014,40(6):252-255.
[21]Haralick RM, Shanmugan K, Instein I. Texture features for image classification [J]. IEEE Trans Syst Man Cybern B Cybern,1973, 3(6): 610-620.
[22]Tamura W, Hideyuki T, Mori C, et al. Texture features corresponding to visual perception [J]. IEEE Trans Syst Man Cybern B Cybern, 1978, 8(6):460-473.
[23]Zhang DS, Lu GJ. Review of shape representation and description techniques[J]. Pattern Recognition,2004,37:1-19.
[24]Hu KM.Visual pattern recognition by moment invariant[J]. IEEE Trans Inf Theory,1962,8(2):179-187.
[25]Zhang DS, Lu GJ. Shape based image retrieval using generic fourier descriptors[J]. Signal Processing, 2002,17(10):825-848.
[26]Mokhtarian F, Mackworth AK. A theory of multiscale, curvature-based shape representation for planar curves [J]. IEEE Trans Pattern Anal Mach Intell, 1992, 14(8):789-805.
[27]Dong YB, Li J, Cheng GL. Research on Feature Extraction Based on Color and Texture[J]. Appl Mech Mater,2013,10(448): 3671-3674.
[28]Gletsos M, Mougiakakou SG, Matopoulos GK, et al. A computer-aided diagnostic system to characterize CT focal liver lesions: design and optimization of a neural network classifier [J]. IEEE Trans Inf Technol Biomed,2003,7(3):153-162.
[29]Sonal K, John HP, Andrew NY, et al. Histological image classification using biologically interpretable shape-based features[J]. BMC Med Imaging,2013,13(1):9.
[30]Li HL, Guo CH. Similarity measure based on multidimensional shape feature representation for time series[J]. Xitong Gongcheng Lilun YU Shijian (Systems Engineering Theory and Practice),2013,33(4):1024-1034.
(本文編輯施洋)