王大羽,張文娟
(周口師范學(xué)院 計算機(jī)科學(xué)與技術(shù)學(xué)院,河南 周口 466000)
利用改進(jìn)曲波變換特征提取的CBIR算法
王大羽,張文娟
(周口師范學(xué)院 計算機(jī)科學(xué)與技術(shù)學(xué)院,河南 周口 466000)
針對Gabor變換(Gabor transform,GT)和使用àtrous小波變換(wavelet transform,WT)分解圖像的曲波變換不能準(zhǔn)確地采集圖像中邊緣信息的問題,提出一種改進(jìn)曲波變換(improved curvelet transform,ICT)特征提取的CBIR(content based image retreval)算法。ICT使用脊波變換作為一個組成步驟,使用Gabor小波過濾器的過濾器組實現(xiàn)曲波子帶,使用詞匯樹索引每幅圖像的描述符向量,即能量直方圖向量。在Corel收集的1 000幅圖像上的實驗結(jié)果表明:提出的算法對數(shù)據(jù)庫中恐龍圖像的檢索精度可高達(dá)97.20%,平均精度比Gabor變換的CBIR算法和使用atrous小波變換的CBIR算法分別提高至少18%,23%,算法ICT的平均召回率為37.40%,遠(yuǎn)優(yōu)于GT算法(27.13%)和WT算法(30.70%)。在加權(quán)平均精度、平均精度、平均檢索率和平均秩方面的顯著改進(jìn)使提出算法擁有很好的實用性。
曲波變換;小波變換;CBIR;能量直方圖; 檢索精度
隨著互聯(lián)網(wǎng)和圖像傳感器技術(shù)的發(fā)展,逐漸形成了科學(xué)、教育、醫(yī)療、工業(yè)和其他應(yīng)用中的大型圖像數(shù)據(jù)庫,因此,亟需一種高效的自動化程序來索引并采集數(shù)據(jù)庫中圖像[1-2]。傳統(tǒng)的基于文本的方法很難從數(shù)據(jù)庫中檢索出各種圖像,為了解決這個問題,基于內(nèi)容的圖像檢索技術(shù)(content based image retreval,CBIR)誕生了。CBIR利用視覺特征進(jìn)行相似性匹配,其系統(tǒng)性能依賴于視覺特征的提取[3]。因此,提取更多視覺特征以減少語義鴻溝是目前CBIR研究的一個重要內(nèi)容[4],而提取差異特征和各向異性元素的對象是CBIR的前提和必要步驟,這些特征的提取直接關(guān)系到數(shù)據(jù)庫檢索的準(zhǔn)確性。
圖像提取的幾個低級別特征(如顏色、形狀、紋理等)可以輔助檢索[5],已經(jīng)提出的紋理分析技術(shù)眾多,如基于局部算子的紋理分析、基于統(tǒng)計學(xué)的紋理分析以及光譜分析法等。文獻(xiàn)[6]提出利用灰度級共生矩陣表征亮度分布以及亮度與像素之間的位置關(guān)系。然而,對于復(fù)雜的紋理,該方法并不適用。文獻(xiàn)[7]將粒子群優(yōu)化算法的進(jìn)化搜索過程與用戶的反饋過程結(jié)合, 提出了一種基于粒子群的CBIR方法,避免了初始檢索影響用戶認(rèn)知,提高了反饋結(jié)果的效能,但該方法容易造成相關(guān)反饋提供的標(biāo)注樣本數(shù)不足。文獻(xiàn)[8]通過合并未標(biāo)記圖像,使用已標(biāo)記數(shù)據(jù)的觀測誤差的最小化函數(shù),選擇綜合性能最好的回歸函數(shù),獲得了圖像語義特征和圖像幾何結(jié)構(gòu)的平衡,提高了檢索性能,但依然存在“語義鴻溝”問題[4]。文獻(xiàn)[9]在3個尺度上進(jìn)行Daubechies的小波(wavelet transform,WT)變換,計算每個子帶中小波系數(shù)的直方圖,并存儲為特征向量。其缺點是單純的小波變換在采集邊緣信息的時候并不準(zhǔn)確,特別是復(fù)雜邊緣情況下。文獻(xiàn)[10]將彩色直方圖和Gabor小波變換(Gabor transform, GT)的特征用于CBIR,雖然取得了不錯的效果,但檢索的圖像內(nèi)容比較簡單。同時,基于小波和Gabor變換的CBIR無法表示具有高各向異性元素的對象,例如線或曲線結(jié)構(gòu),而使用脊波和曲波變換能夠解決這個問題[11]。
大部分CBIR系統(tǒng)中,均值、標(biāo)準(zhǔn)差和變換系數(shù)的直方圖用作檢索過程中的特征向量[10-12],本文的創(chuàng)新之處在于使用詞匯樹[13]收集并索引特征方向,在處理大型描述符時,詞匯樹具有不錯的優(yōu)勢;另外,àtrous小波變換可以給出單個圖像中的方向信息,但無法表示圖像的高各項異性,而改進(jìn)的曲波變換在該方面具有一定優(yōu)勢。
CBIR算法計算出各圖像特征矢量,并把它們存儲于視覺特征數(shù)據(jù)庫。在用戶檢索圖像時,首先計算適合檢索的特征矢量,使用相似準(zhǔn)則查詢視覺特征數(shù)據(jù)庫中的矢量,檢索出與查詢圖像最相似的圖像[14]。因此,CBIR算法的性能主要依靠圖像特征的提取。目前,常用的方法有2種:①特征增強(qiáng),即主要使用適應(yīng)、提高和離散化方法;②特征相似度度量,從圖像中提取特征中最好的子集。這兩種方法通常單獨使用,并利用預(yù)定義和設(shè)置固定參數(shù)的方式提取特征,圖1所示為傳統(tǒng)的CBIR的示意圖。
圖1 傳統(tǒng)CBIR算法示意圖Fig.1 Sketch map of traditional CBIR algorithm
使用改進(jìn)曲波變換同時提取和選擇特征,在該過程中,改進(jìn)的曲波變換使用脊波變換作為一個組成步驟,使用Gabor小波過濾器的過濾器組獲得曲波子帶,使用詞匯樹索引每幅圖像的描述符向量(即能量直方圖向量)。本文算法示意圖如圖2所示。圖2中,虛線表示特征提取和特征選擇同時進(jìn)行。從圖中可看出,利用改進(jìn)的曲波變換同時實現(xiàn)特征提取和特征選擇步驟,以實現(xiàn)最大化CBIR算法的精度。
圖2 CBIR算法同時提取和選擇特征Fig.2 CBIR algorithm using extracting and choosing features at the same time
改進(jìn)曲波變換方法的基本框圖如圖3所示,它包括下列組成:Gabor變換、脊波變換、能量直方圖和詞匯樹。一般的曲波變換[16](特指第1代曲波變換,由脊波理論延伸而來,第2代與脊波沒有關(guān)系,不是本文的討論范圍)可以表示圖像的方向信息,但無法表示圖像的各向異性。如圖3,多尺度的Gabor變換可以獲得曲波子帶,并描述圖像的各項異性。同時,使用詞匯樹索引圖像的描述符向量,可解決大型描述符問題。
如圖3所示,利用Gabor變換(gabor transform,GT)處理圖像,在不同尺度和方向分解圖像后,劃分這些子帶為大小為Z×Z的圖像塊,通過radon變換處理每個塊,由1D小波變換處理radon變換的輸出,從而產(chǎn)生各自子塊的脊波變換系數(shù)。
圖3 提出的系統(tǒng)架構(gòu)Fig.3 Proposed framework of the system
2D Gabor函數(shù)g(x,y)是復(fù)雜正弦調(diào)制高斯函數(shù)的結(jié)果,由正弦頻率ω和標(biāo)準(zhǔn)差σx,高斯包絡(luò)σy決定,定義為
(1)
Gabor小波g(x,y)的擴(kuò)張和旋轉(zhuǎn)所得的Gabor小波為
(2)
(2)式中:x′=a-m(xcosθ+ysinθ),y′=a-m(-xsinθ+ycosθ),θ=nπ/N,m∈{0,…,M-1},n∈{0,…,N-1}分別表示尺度和方向。
(1)-(2)式中的變量定義為
Gabor過濾器的響應(yīng)是Gabor窗口與圖像I的卷積
(3)
(3)式中,Uh和Ul分別為設(shè)計頻段的上界和下界。Gabor變換的信息見文獻(xiàn)[15]。
2.2 脊波變換
由于含邊或曲線結(jié)構(gòu)的圖像不能由小波變換有效地表示,而脊波變換和曲波變換(curvelet transform, CT)卻可以有效表示,CT中最重要的元素是脊波變換,這是因為脊波變換提供了平滑函數(shù)的稀疏表示以及完美的直線邊。其2個基本組成是radon變換和1D小波變換。
R2中連續(xù)脊波變換(continuous ridgelet transform,CRT)可定義為[16]
(4)
使用小波函數(shù)定義2D脊波ψa,b,θ(x)為
(5)
(5)式給出一個角度θ和恒定線x1cosθ+x2sinθ=const的脊波,除了用線參數(shù)(b,θ)代替點參數(shù)(x,y),CRT類似于2D連續(xù)小波變換,即這些2D多尺度變換相關(guān)。
小波ψscale,point-position表示孤立奇異性的對象時非常有效,而脊波ψscale,line-position能有效表示沿線奇異性對象。事實上,脊波是一種沿線串聯(lián)1D小波。2D中,點和線通過Radon變換相關(guān),本文通過小波變換和脊波變換連接。
對象f的Radon變換是由(b,θ)∈[0,2π)×R索引的線積分集合
(6)
(6)式中:δ是Dirac分布;對象f的脊波系數(shù)CRTf(a,b,θ)通過radon變換分析給出為
(7)
從(7)式可明顯得知,離散脊波變換(discrete ridgelet transform,DRT)正是1D小波變換對radon變換片段的應(yīng)用,其中角度變量θ是常量,t一直變化。DRT的限制之一是它能對直線產(chǎn)生良好結(jié)果,但圖像往往包含曲邊而不是直線。在這種情況下,脊波的性能下降,曲波變換可補(bǔ)救這個問題。曲波變換的基本思想是它以局部化方式使用脊波變換。
2.3 能量直方圖
在圖像每個子帶的脊波變換系數(shù)上執(zhí)行這個操作,產(chǎn)生描述符向量,之后映射在詞匯樹上,子塊的能量直方圖為
(8)
(8)式中,θ={1,2,3,…,θmax},DRTθ是收集角度θ的離散脊波變換系數(shù);Z是離散脊波變換系數(shù)的數(shù)目。然后,存儲這個直方圖,實現(xiàn)特征生成中的旋轉(zhuǎn)不變性,這些描述符向量的體積和bin數(shù)依賴于radon變換操作中所用的子塊數(shù)和θ值。
2.4 詞匯樹
在處理這類大型描述符向量時,可利用詞匯樹技術(shù)進(jìn)行排序,詞匯樹給出一個分層量化閾值(聚類中心),由分層k-均值聚類構(gòu)建,包括以下3個步驟:
1)使用k-均值聚類無監(jiān)督訓(xùn)練樹;
2)在該樹上映射圖像描述符向量;
3)規(guī)范化特征。
選擇各種圖像的描述符向量作為訓(xùn)練向量,使用k-均值聚類技術(shù)劃分這些訓(xùn)練向量為各個組,其算法步驟如下:
1)選擇T個描述符向量作為訓(xùn)練向量;
2)在級別1聚類,使用k-均值聚類技術(shù)組合T個訓(xùn)練向量組成k個類;
3)存儲各自的類中心和類成員;
4)然后遞歸調(diào)用同一個過程到每個聚類的描述符向量,以便之后各自組的類成員劃分成k個組,這個過程持續(xù)到最大L級。
圖4給出了上述算法的流程圖。
該過程使用各級別的聚類,將每幅圖像的描述符向量映射到詞匯樹,映射算法如下:
1)令一幅圖像擁有P個描述符向量;
2)在樹中傳播每個描述符向量,同時在每個級別與k個聚類中心進(jìn)行比較,使用L2距離選擇最接近的一個。與此同時,在每個葉子節(jié)點設(shè)置一個計數(shù)器,計數(shù)經(jīng)過它的描述符向量。在所有級別上設(shè)置這個過程,以便可以在各個級別收集圖像特征,耗盡所有描述符向量之后,處理不同葉子節(jié)點上的計數(shù)器值。
上述2個步驟在整個數(shù)據(jù)庫圖像上重復(fù)。
在不同級別定義每幅圖像的特征向量,在第L級和第i個葉子節(jié)點,特征向量FLi為
(9)
(10)
(8)式和(9)式中:mi是經(jīng)過葉子節(jié)點i的數(shù)據(jù)庫圖像的描述符向量;wi是葉子節(jié)點i的權(quán)重;N是數(shù)據(jù)庫中圖像總數(shù);Ni是數(shù)據(jù)庫中至少有一個描述符向量經(jīng)過節(jié)點i的圖像數(shù)。
類似地,規(guī)范化用于實現(xiàn)各種描述符向量的數(shù)據(jù)庫圖像之間的公平性。因此在級別L和節(jié)點i的規(guī)范化的特征向量為
(11)
這個規(guī)范化的特征向量用作每幅圖像的最終特征。
在本文算法中,GT分解圖像為各種子帶,GT分解的大小為X×Y的圖像I,即M個尺度和N個方向的子帶,如(3)式所示。
圖1表示ICT的數(shù)字實現(xiàn)流程圖,其解釋了按照每個子帶的空間劃分分解原始圖像成子帶的過程,然后脊波變換應(yīng)用于每塊,該實現(xiàn)有3個階段
1)分解給定圖像為子帶,然后運(yùn)用大小為B1=Z×Z的空間劃分到每個子帶;
2)對每個塊運(yùn)用脊波變換;
3)得到脊波系數(shù)的能量直方圖并用詞匯樹索引它們。
詳細(xì)實現(xiàn)見下述算法:
初始化:
?MZ—分解級別數(shù);m∈{1,2,…,M}
?NZ—方向數(shù);n∈{1,2,…,N}
?BmZ—空間劃分大?。籅m=Z×Z
1)運(yùn)用Gabor變換分解大小為X×Y的圖像I為M個尺度和N個方向;
2)m=1;
3)n=1,2,…,N;
? 使用塊大小Bm空間劃分子帶圖像,運(yùn)用radon變換到每個塊;
? 運(yùn)用1D小波變換到每個Radon片段;
? 獲得各個塊的能量直方圖(Hθ)mn(2.3節(jié))
4)第m個尺度的描述符向量為
Dm=(Hθ)mn
5)Ifm模2 == 1
Bm+1=2×Bm
Else
Bm+1=Bm
End
6)m=m+1
If (m≤M)
執(zhí)行步驟3到5
End
7)最終描述符向量為
DFinal=[Dm=1,Dm=2,…,Dm=M]B1=16×16
實際實現(xiàn)過程中,選擇塊大小,然后映射最終描述符向量(DFinal)到詞匯樹上。
4.1 特征提取
運(yùn)用具有M=3尺度和N=3方向的2D GT到圖像,對于第1個尺度(M=1),子帶劃分成大小為Z×Z的塊,類似地,第2和第3尺度的子帶劃分成大小為Z×Z的塊,運(yùn)用radon變換到每個塊,然后運(yùn)用一維小波變換到每個徑向線,1D小波變換的輸出是曲波系數(shù),從中生成能量直方圖(描述符向量),有了這些描述符向量,計算下列3組特征:
1)特征集1:對于M=1
映射描述符向量到詞匯樹,詞匯樹葉子節(jié)點上的值用作相應(yīng)圖像的特征向量,實際實現(xiàn)時,使用10個聚類中心(k=10)和4個級別(L=4)訓(xùn)練詞匯樹,在級別1,2,3和4產(chǎn)生的葉子節(jié)點數(shù)分別為10,100,1000和10 000,特征集1沒有什么,但是其值在第4級葉子節(jié)點上可用。
(12)
(12)式中,fL是第4級葉子節(jié)點上可用值。
2)特征集2:對于M=2,3
執(zhí)行特征集1中所用的同一程序,但是僅有的一個變化是在詞匯樹第3級別上收集葉子節(jié)點的值。
(13)
(13)式中,fL是詞匯樹的第3級別的葉子節(jié)點上可用的值。
3)特征集3:合并FM1和FM2_3
通過具有合適權(quán)重的FM1和FM2_3的組合計算每幅圖像的特征向量,特征向量為
(14)
(14)式中,w1和w2分別是FM1和FM2_3的權(quán)重。
4.2 相似度度量
為相似度度量打分,計算查詢Qi和數(shù)據(jù)庫圖像Ii之間的分?jǐn)?shù),如(15)式所示
(15)
(15)式中:FQi是查詢圖像的特征向量;P是葉子節(jié)點數(shù);FIi是數(shù)據(jù)庫中圖像的特征向量。將最高分?jǐn)?shù)的數(shù)據(jù)庫圖像視作與查詢圖像最相關(guān)的圖像。
5.1 數(shù)據(jù)描述
通過加拿大科立爾數(shù)位科技公司(Corel)收集的1 000幅圖像[17]驗證本文算法,數(shù)據(jù)庫中的圖像分類成10類,每類包含100幅JPEG格式的圖像,每幅圖像大小為384×256或256×384,這10種語義類別的圖像包括人類、獅子、大象、馬、花、食物、山、名勝古跡、室內(nèi)裝潢和巴士等,查詢圖像是從每一類圖像中隨機(jī)提取的一幅圖像,整個數(shù)據(jù)庫作為查詢對象。
5.2 評估函數(shù)
本文評估考慮了加權(quán)平均精度、平均進(jìn)度、召回率和平均秩。為了評估本文算法,從Corel數(shù)據(jù)庫的1 000幅圖像子集中選擇查詢圖像,特別地,當(dāng)且僅當(dāng)檢索圖像與查詢圖像位于同一目錄時考慮匹配,根據(jù)查詢圖像和檢索圖像索引向量之間的分?jǐn)?shù)以降序方式顯示每個查詢結(jié)果。
下列參數(shù)用于量化提出方法的性能:
1)平均精度
2)加權(quán)平均精度
3)平均召回率
4)平均秩
圖像I的精度為
(16)
使用下式計算加權(quán)精度
(17)
(17)式中:nk是前k個檢索圖像之間的匹配數(shù);N是檢索圖像數(shù)。使用(18)式在所有匹配上計算每個查詢圖像Iq的秩
(18)
(18)式中:A表示查詢目錄;NA表示同一目錄中圖像數(shù)。
(19)
類似地,平均精度、平均加權(quán)精度、平均秩和召回率定義為
(20)
(21)
(22)
(23)
(20)-(23)式中,Nq表示查詢數(shù),Ik表示數(shù)據(jù)庫中第k幅圖像。對于全局平均,Nq=1 000(Corel 1000數(shù)據(jù)庫),對于特定目錄的平均,Nq=100。
5.3 實驗結(jié)果
在Corel 1000數(shù)據(jù)庫上將提出的ICT與文獻(xiàn)[10]提出的算法(運(yùn)用Gabor變換的CBIR算法,簡稱GT)、文獻(xiàn)[9]提出的算法(運(yùn)用小波變換的CBIR算法,簡稱WT)在加權(quán)平均精度、平均精度、平均秩和平均檢索率方面進(jìn)行比較,結(jié)果如表1所示,從表1中可以觀察到:
1)本文算法的平均精度和平均加權(quán)精度(83.18%,84.07%)超過GT(65.53%,79.13%)和WT(66.06%,78.28%)。
2)平均召回率(37.40%)遠(yuǎn)優(yōu)于GT(27.13%)和WT(30.70%)。
3)平均秩(247.51)低于GT(326.74)和WT(296.19)。
表2至表3給出了提出的算法與GT和WT之間的比較結(jié)果,表2表明,相比GT和WT,本文提出算法的組精度率在8組中最高,表3表明,相比GT和WT方法,ICT的加權(quán)精度在7組中更高,在1組中略低。
表1 不同目錄的圖像檢索結(jié)果比較
表2 不同目錄圖像的組精度(%)
表3 不同目錄圖像的加權(quán)精度(%)
圖5a給出了本文算法與GT和WT在平均召回率方面的比較結(jié)果,進(jìn)一步表明提出方法平均召回率優(yōu)于GT和WT。對于前10幅圖像,提出方法的平均召回率為5.318%,針對前100幅圖像,進(jìn)一步增加到37.40%,超過GT(4.553%,27.13%)和WT(4.406%,30.70%)。類似地,圖5b表示ICT與GT和WT的準(zhǔn)確率的比較結(jié)果,進(jìn)一步給出對于前10幅圖像,本文算法的準(zhǔn)確率為83.18%,對于前100幅圖像,降低到65.40%。
圖5 算法性能比較Fig.5 Performances of different algorithms
5.4 檢索實例
圖6a為一張查詢圖像“馬”,檢索圖像庫為Corel數(shù)據(jù)庫,圖6b是WT的查詢結(jié)果,圖6c是本文算法查詢結(jié)果,可以看出,實例1中基于WT的CBIR檢索結(jié)果中有24幅與查詢樣本相關(guān),查全率為0.24,而本文算法的檢索結(jié)果中有39幅與查詢樣本相關(guān),查全率為0.39;圖7a是一張查詢圖像“食物”,所用檢索數(shù)據(jù)庫為Corel數(shù)據(jù)庫,圖7b是GT查詢結(jié)果,圖7c是本文算法查詢結(jié)果,可以看出,實例2中基于GT的CBIR檢索結(jié)果中有34幅與查詢樣本相關(guān),查全率為0.34,本文算法檢索結(jié)果中有42幅與查詢樣本相關(guān),查全率為0.42。因此本文算法優(yōu)于其他2種CBIR檢索算法。
本文提出一種曲波變換算法,將Gabor變換結(jié)合小波變換,代替使用均值和標(biāo)準(zhǔn)差作為特征向量,另外還引入了能量直方圖,聯(lián)合詞匯樹產(chǎn)生特征向量。從仿真結(jié)果可以看出,本文算法優(yōu)于其他2種算法。這是由于ICT比曲波變換給出更好的詳細(xì)子帶圖像,這些詳細(xì)子帶圖像對后續(xù)曲波變換的特征提取非常有益。ICT優(yōu)于Gabor變換是因為Gabor變換專注于局部區(qū)域,Gabor變換、方向直方圖和詞匯樹技術(shù)的利用可以提取附加特征。
圖6 圖像檢索實例1Fig.6 Example 1 for image retrieval
圖7 圖像檢索實例2Fig.7 Example 2 for image retrieval
未來將本文算法應(yīng)用于Brodatz紋理圖像庫,并考慮利用梯度直方圖等技術(shù)進(jìn)行特征提取。
[1] 王劍峰, 趙曉容, 李明科. 基于數(shù)字特征直方圖的圖像檢索算法[J]. 重慶郵電大學(xué)學(xué)報:自然科學(xué)版, 2013, 25(5):700-704. WANG Jianfeng, ZHAO Xiaorong, LI Mingke. Image Retrieval Algorithm Based on Numerical Characteristics Histogram[J]. Journal of Chongqing University of Posts and Telecommunications: Natural Science Edition, 2013, 25(5): 700-704.
[2] RASHEDI E, NEZAMABADI H. Improving the Precision of CBIR Systems by Feature Selection Using Binary Gravitational Search Algorithm[C]//Proceedings of the 16th CSI International Symposium on Artificial Intelligence and Signal Processing. Washington D. C., USA: IEEE Press, 2012: 39-42.
[3] CHOY Siukai, TONG Chongsze. Statistical Wavelet Subband Characterization Based on Generalized Gamma Density and Its Application in Texture Retrieval[J]. IEEE Transactions on Image Processing,2010,19(2):281-289.
[4] 劉黎寧. 利用小波的綜合紋理和形狀特征圖像檢索及系統(tǒng)實現(xiàn)[D]. 西安: 西北大學(xué), 2011. LIU Lining. Image Retrieval of Comprehensive Texture and Shape Feature Based on Wavelet Transform and Its System Implementation[D]. Xi’an: Northwest University, 2011.
[5] BUGATTI P H, KASTER D S, Ponciano S M, et al. PRoSPer: perceptual similarity queries in medical CBIR systems through user profiles [J]. Computers in Biology & Medicine, 2014, 45(2):8-19.
[6] 史繼先. 基于Android的圖像內(nèi)容檢索系統(tǒng)[D]. 長春: 東北師范大學(xué), 2014. SHI Jixian.Image Content Retrieval System Based on Android[D].Changchun:Northeast Normal University,2014.
[7] 許相莉,張利彪,劉向東,等.基于粒子群的圖像檢索相關(guān)反饋算法[J].電子學(xué)報,2010,38(8):1935-1940. XU Xiangli, ZHANG Libiao, LIU Xiangdong, et al. Image retrieval relevance feedback algorithm based on particle swarm optimization[J]. Acta Electronica Sinica, 2010, 38(8): 1935-1940.
[8] LI G. Improving Relevance Feedback in Image Retrieval by Incorporating Unlabelled Images [J]. TELKOMNIKA Indonesian Journal of Electrical Engineering, 2013, 11(7): 3634-3640.
[9] MOGHADDAM H A, NIKZAD D M. Enhanced Gabor wavelet correlogram feature for image indexing and retrieval[J]. Pattern Analysis & Applications, 2013, 16(2): 163-177.
[10] 孔超, 張化祥, 劉麗. 基于興趣區(qū)域特征融合的半監(jiān)督圖像檢索算法[J]. 山東大學(xué)學(xué)報 ;工學(xué)版, 2014, 44(3): 22-28. KONG Chao, ZHANG Huaxiang, LIU Li. A semi-supervised image retrieval algorithm based on feature fusion of the region of interest[J]. Journal of Shandong University (Engineering Science), 2014, 44(3): 22-28.
[11] KUMAR D A, ESTHER J. Comparative study on CBIR based by color histogram, Gabor and wavelet transform[J]. International Journal of Computer Applications, 2011, 17(3): 37-44.
[12] 楊舒, 王玉德. 基于Contourlet變換和Hu不變矩的圖像檢索算法[J]. 紅外與激光工程, 2014, 27(1): 2271-2276. YANG Shu, WANG Yude. Image Retrieval Algorithm Based on Contourlet transform and Hu invariant moments[J]. Infrared and Laser Engineering, 2014, 27(1): 2271-2276.
[13] 齊錦. 基于仿射傳播聚類算法的詞匯樹生成研究[D]. 西安:西北大學(xué), 2011. QI Jing. Research of Lexical tree generation based on affinity propagation clustering algorithm[D]. Xi’an: Northwest University, 2011.
[14] 傅啟明,劉全,王曉燕,等.遺傳反饋的多特征圖像檢索[J].中國圖象圖形學(xué)報,2011,16(10):1858-1865. FU Qiming,LIU Quan,WANG Xiaoyan,et al.Relevance Feedback Image Retrieval Based on multiple features[J].Journal of Image and Graphics,2011,16(10):1858-1865.
[15] 彭輝. 基于Gabor小波變換多特征向量的人臉識別魯棒性研究[J]. 計算機(jī)科學(xué), 2014, 41(2):308-311. PENG Hui. Research on Gabor Wavelet Transform Feature Recognition Robustness Based on Vector of Face[J].Computer Science, 2014, 41(2): 308-311.
[16] 焦李成, 譚山, 劉芳. 脊波理論:從脊波變換到Curvelet變換[J]. 工程數(shù)學(xué)學(xué)報, 2005, 22(5):761-773. JIAO Licheng, TAN Shan, LIU Fang. Ridgelet Theory: From Ridgelet Transform to Curvelet[J]. Chinese Journal of Engineering Mathematics, 2005, 22(5): 761-773.
[17] 張亮,施伯樂,周向東,等.發(fā)掘相關(guān)反饋日志中關(guān)聯(lián)信息的圖像檢索方法[J].軟件學(xué)報,2004,15(1):41-48. ZHANG Liang, SHI Bole, ZHOU Xiangdong, et al. Image retrieval method mining correlation information from relevance feedback logs[J]. Journal of Software, 2004, 15(1): 41-48.
(編輯:張 誠)
Content based image retrieval using improved curvelet transform for feature extraction
WANG Dayu, ZHANG Wenjuan
(School of computer science and technology, Zhoukou Normal University, Zhoukou, 466000, P.R.China)
As curvelet of decomposition images using Gabor Transform (GT) and àtrous Wavelet Transform (WT) can not accurately capture the edge information of the images, a new CBIR algorithm using Improved Curvelet Transform (ICT) for feature extraction is proposed. Gabor wavelet filter is used as a part of ICT, and a set of filters used to achieve the sub-band of curvelet. The vocabulary tree is used to index descriptor vector of each image, which is vector of energy histogram. Experiments with 1 000 pictures that corel dataset collects show: the retrieval accuracy of the algorithm for images of dinosaurs is 97.20%, the average accuracy of the proposed algorithm is 18% more than that of algorithms using Gabor transform and 23% more than that of algorithm using atrous wavelet transform. The recall rate is 37.40 percent, much better than that of the GT algorithm(27.13%) and WT algorithm(30.70%). Significant improvement in the aspects of the weighted average precision, the average accuracy, average retrieval rate and average rank makes the proposed algorithm good practicability.
curvelet transform; wavelet transform; CBIR; energy histogram; vectors; retrieval accuracy
10.3979/j.issn.1673-825X.2017.01.019
2015-05-14
2016-06-15 通訊作者:王大羽 wangdyemail@sina.com
河南省軟科學(xué)計劃項目(142400411213);河南省基礎(chǔ)與前沿技術(shù)研究項目(132300410479,142300410339)
Foundation Items:The Soft Science Research Project in Henan Province (142400411213); The Research Project of the Base and Advanced Technology in Henan Province (132300410479, 142300410339)
TP391
A
1673-825X(2017)01-0129-08
王大羽(1985-),女(漢),河南周口人,講師,碩士,主要研究方向為智能算法、數(shù)據(jù)挖掘等。E-mail:wangdyemail@sina.com。 張文娟(1984-),女(漢),山西陽泉人,講師,碩士,主要研究方向為智能算法、信息安全等。