王琪+杜娟+徐國清+程彬
摘 要: 顏色特征是圖像最直觀的特征,傳統(tǒng)的顏色直方圖雖然能夠描述圖像中各顏色分量的比例,然而卻破壞了圖像各顏色分量的空間位置分布信息,從而使得圖像檢索結(jié)果不準確。因此,提出一種分塊顏色核特征的方法,使用重疊分塊策略,強調(diào)圖像中心的視覺內(nèi)容,同時,設(shè)計顏色核函數(shù)將分塊顏色直方圖映射到核特征空間,更準確地描述圖像顏色特征。經(jīng)過實驗證明,該方法與全局顏色直方圖相比,分塊顏色特征有較高的查準率和查全率。
關(guān)鍵詞: 顏色特征; 圖像檢索; 重疊分塊; 核函數(shù)
中圖分類號: TN911.73?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2015)15?0042?03
Image retrieval method based on block color kernel feature
WANG Qi1, DU Juan1, XU Guoqing1, CHENG Bin2
(1. College of Computer and Information Engineering, Nanyang Institute of Technology, Nanyang 473000, China;
2. College of Software, Nanyang Institute of Technology, Nanyang 473000, China)
Abstract: Color feature is the most intuitive features of images. Even though the traditional color histogram can describe respective color component in image, spatial location distribution information of respective color component is destroyed. It makes the image retrieval results inaccurate. Because of this reason, a method of block color kernel feature is proposed, which uses overlap block strategy to emphasize visual content of image center zone. Block color histogram is mapped to kernel feature space by the designed color kernel function, so the image color features are described more accurately. The experimental results show that in comparison with global color histogram method and block color feature method, the proposed method has higher precision ratio and recall ratio.
Keywords: color feature; image retrieval; overlap block; kernel function
0 引 言
隨著網(wǎng)絡(luò)的發(fā)展,圖像數(shù)據(jù)量劇增,基于內(nèi)容的圖像檢索可以有效地解決在眾多圖像數(shù)據(jù)中搜索到目標圖像的問題,其關(guān)鍵問題是提取圖像的視覺特征。顏色特征是圖像最基礎(chǔ)最直接的特征且魯棒性較好,然而傳統(tǒng)的顏色直方圖雖然能夠很好地表征顏色分量的含量,但卻無法體現(xiàn)各顏色分量的空間分布情況,往往造成顏色直方圖和圖像之間一對多的關(guān)系即不同圖像擁有相同的顏色直方圖,因而造成圖像檢索結(jié)果準確性較低[1?2]。同時,均勻分塊雖然可以體現(xiàn)顏色空間分布,但是由于分塊模板大小難以把握,分塊過大則不能較好地體現(xiàn)空間分布情況失去分塊意思,而分塊過小則使得圖像整體內(nèi)容被破壞,過分關(guān)注細節(jié)內(nèi)容,從而失去了顏色特征的魯棒性優(yōu)勢[3];另一方面,顏色特征是線性空間特征,對于細節(jié)差異的區(qū)分度較差[4]。當(dāng)檢索正確圖像與錯誤圖像的特征向量差異性量綱過小時,無法通過選擇合適的閾值過濾掉錯誤圖像,則檢索結(jié)果中返回大量錯誤圖像,對用戶形成極大的干擾。
基于以上分析,本文提出一種重疊分塊顏色核特征的方法來更好地描述圖像的顏色視覺內(nèi)容,該方法共分為三步:首先,以4×4為模板對圖像進行劃分,形成4×4個分塊;然后,在4×4分塊的基礎(chǔ)上,除去四個角的分塊,以2×2模板進行滑動分塊,從而獲得5個重疊的分塊;最后,獲得每個子塊的顏色直方圖通過核函數(shù)形成分塊顏色核特征,從而獲得圖像顏色內(nèi)容的更準確描述。
1 算法描述
1.1 顏色直方圖
顏色直方圖因其實現(xiàn)簡單成為當(dāng)前最廣泛采用的表示圖像視覺內(nèi)容的方法,由于它關(guān)注的是整幅圖像各顏色分量比例,因此存在較好的全局性、旋轉(zhuǎn)以及尺度不變性[5]。
(1) 由于HSV空間與人眼感知色彩的方式較一致,將彩色圖像從RGB轉(zhuǎn)換到HSV空間獲得的顏色特征更適合視覺模型;
(2) 進行量化處理。理論上直接對真彩圖像進行顏色直方圖的計算獲得結(jié)果更加真實準確,但實際上人眼對很多顏色細節(jié)并不敏感,而真彩圖像則花費大量的計算在這些并不重要的細節(jié)方面,通常需要對真彩圖像進行顏色量化突出人眼敏感的主要顏色,本文使用了簡單而快速的查色表量化方法對HSV數(shù)據(jù)進行非均勻量化,同時完成了從3維HSV分量中獲取1維顏色特征值,量化方法如下:[L=0,v<0.2(v-0.2)×10+1,s<0.2?0.2
(3) 根據(jù)式(1)中顏色特征值[L]計算各顏色值發(fā)生頻率即獲得顏色直方圖,如式(2)所示:
[H(k)=nkn,k=1,2,…,L-1,L] (2)
式中:[nk]表示顏色特征值為[k]出現(xiàn)的頻率;[n]則表示像素總數(shù)。
1.2 分塊策略
圖像的全局顏色直方圖能夠描述圖像全局顏色成分,具有良好的視覺感知效果,同時,有較好的旋轉(zhuǎn)不變性,但是缺乏圖像空間分布信息,使得完全不同的圖像可能擁有較相近的顏色直方圖,造成基于顏色特征的圖像檢索準確率低[6]。而傳統(tǒng)的分塊方法將圖像劃分為大小相同的小塊,雖然可以增加圖像空間分布信息,但是破壞了圖像的主體部分,并且忽略了子塊之間的聯(lián)系。本文提出重疊分塊的分塊策略,首先,對圖像進行均勻分塊,使得顏色特征包含空間分布信息;然后,在均勻分塊的基礎(chǔ)上,使用固定模板對除去四角分塊外的圖像進行2次滑動分塊,使得圖像中間區(qū)域在分塊時進行重疊,從而強調(diào)圖像中間部分,克服了分塊帶來的圖像主體部分遭到破壞的缺點。因此,本文分塊策略即獲得了顏色空間分布信息,又較好地保存了顏色特征的整體性。步驟如下:
(1) 將原圖像按照4×4的模板進行分割,形成16個大小相同的分塊,如圖1所示,S11~S44為16個分塊。
(2) 在這16個分塊的基礎(chǔ)上進一步分塊。上下左右4個角由于處于圖像邊緣,用戶感興趣度不高,因此對這些分塊不進行再次處理,取這四個角的分塊作為最終結(jié)果中的前四個分塊區(qū)域用F1~F4表示,其余分塊以2×2為模板進行滑動分塊得到新的5個分塊,即F5={S12,S13,S22,S23};F6={S22,S23,S32,S33};F7={S32,S33,S42,S43};F8={S21,S22,S31,S32};F9={S23,S24,S33,S34}。最終獲得了F1~F9共9個分塊,可以看出,圖像的中間區(qū)域即F6實質(zhì)上強調(diào)了3次,而圖像的周邊區(qū)域僅出現(xiàn)1次,因此,本文重疊分塊策略能夠有效地突出圖像主體部分,避免分塊帶來的圖像主體部分分裂問題。同時,由于分塊的劃分,使得顏色特征增加了空間分布信息。
圖1 分塊策略
1.3 分塊顏色核函數(shù)
分塊包含了顏色的空間位置信息,而重疊的分塊又強調(diào)了圖像中間區(qū)域的內(nèi)容,因此,本文顏色特征可通過計算由重疊分塊獲得的這9個子塊的顏色直方圖獲得。分別提取9個子塊的顏色直方圖,最后將之合并為1維的圖像重疊分塊顏色特征向量。
顏色直方圖是低維特征,采用傳統(tǒng)歐式距離的方式計算相似性,往往遇到這樣的情況,相似性距離過于集中或者過于離散,那么很難找到一個合適的閾值使得返回結(jié)果準確。閾值過大則返回結(jié)果中不相關(guān)圖像較多,查準率降低;而閾值過小則可能將相關(guān)圖像隔離在外,查準率降低[7]。因此,需要尋求一種方法更準確地描述圖像視覺特征使其更有利于區(qū)分不相關(guān)圖像。核函數(shù)能解決這種線性不可分的問題,使低維顏色直方圖變換到高維的核空間,放大特征之間關(guān)聯(lián)性[8?9],使相似特征集中,而不相似特征遠離,從而可以很好地找到一個閾值將之劃分開,因此,能夠更準確地描述圖像的顏色特征,克服了低維特征線性不可分的問題。同時,核函數(shù)維數(shù)與輸入特征的維數(shù)無直接關(guān)系,可以避免“維數(shù)災(zāi)難”,對特征值進行有效的降維。
高斯核是一個符合Mercer條件的核函數(shù)[10],如式(3)所示,其中,[x,y]分別表示兩個低維空間的顏色特征。依據(jù)分塊顏色直方圖的統(tǒng)計特性,本文通過高斯核原理設(shè)計了顏色核函數(shù),可將顏色特征轉(zhuǎn)換到高維核空間進行更精確的處理。
[K(x,y)=exp(-x-y2)] (3)
[Kh(x,y)=exp(-φ2(x,y))] (4)
公式(4)為分塊顏色核函數(shù),[φ2]實質(zhì)上表示了兩個圖像的分塊顏色直方圖的相似性,[φ2]越高,則兩個樣本在核空間中越聚集。顏色直方圖的相似性采用[φ2]統(tǒng)計矩,如式(5)所示:
[φ2(x,y)=12i=1N(xi-yi)2xi+yi] (5)
2 實驗結(jié)果與分析
實驗圖像數(shù)據(jù)庫由corel圖像庫中的花朵,馬,風(fēng)景,公交車,建筑,印第安人,蝴蝶,夕陽,沙灘,大象共1 000幅圖像,每類100幅圖像,圖2是以圖中左上角第一幅黃色花朵圖像為待測圖像,采用傳統(tǒng)全局顏色直方圖的方法獲得的檢索結(jié)果,由于全局顏色直方圖只關(guān)注顏色成分,而沒有顏色分布信息,因此檢索結(jié)果中有很多干擾圖像。圖3為用本文方法獲得的檢索結(jié)果,由于本文方法不僅包含顏色成分信息,同時有顏色分布信息,且運用顏色核函數(shù)使得顏色特征突出差異性,從圖2和圖3可以看出,圖2中的檢索結(jié)果有較多錯誤圖像,圖3結(jié)果全部與花朵有關(guān),顯示了本文方法的有效性,檢索結(jié)果明顯優(yōu)于全局顏色特征。
圖2 全局顏色直方圖檢索結(jié)果
圖3 本文方法檢索結(jié)果
在實驗圖像庫上分別運用3種方法檢索與本文方法進行對比,即全局顏色直方圖,均勻分塊,重疊分塊與本文重疊分塊顏色核特征方法進行對比。在花朵,風(fēng)景,馬,公交車,建筑,印第安人這6類圖像中,分別從每類中隨機抽取10幅圖像作為測試圖像,通過上述4種方法進行檢索,因而每類圖像獲得10次檢索結(jié)果,對這10次檢索結(jié)果的查準率和查全率進行平均,從而獲得這類圖像的平均查全率和平均查準率,將其作為檢索結(jié)果的評價準則。圖4和圖5分別是這4種方法進行圖像檢索的結(jié)果對比,可見,本文方法無論是查準率還是查全率,都明顯優(yōu)于傳統(tǒng)全局顏色直方圖,均勻分塊顏色直方圖,重疊分塊顏色直方圖。
圖4 查全率對比
圖5 查準率對比
3 結(jié) 語
顏色特征在基于內(nèi)容的圖像檢索中得到廣泛應(yīng)用,但由于顏色直方圖破壞了顏色空間分布信息同時低維數(shù)據(jù)存在線性不可分問題,導(dǎo)致檢索結(jié)果不理想;而均勻分塊的顏色特征易破壞顏色全局性且分塊大小難以把握。本文提出一種分塊顏色核特征的方法,使得分塊策略兼顧圖像主體內(nèi)容和顏色空間分布信息,同時設(shè)計核函數(shù)解決了顏色特征數(shù)據(jù)線性不可分的問題。實驗中,本文算法獲得了較好的檢索結(jié)果,與全局顏色直方圖,分塊顏色直方圖相比較,具有較高的查準率及查全率。
參考文獻
[1] 周明全,耿國華,韋娜.基于內(nèi)容圖像檢索技術(shù)[M].北京:清華大學(xué)出版社,2007.
[2] YUE Jun, LI Zhenbo. Content?based image retrieval using color and texture fused features [J]. Mathematical and Computer Mo?delling, 2011, 54(3/4): 1121?1127.
[3] 林克正,張彩華,劉丕娥.基于分塊主顏色匹配的圖像檢索[J].計算機工程,2010,36(13):186?188.
[4] 劉廣海,吳璟莉.基于顏色體積直方圖的圖像檢索[J].計算機科學(xué),2012,39(1):273?275.
[5] 黃元元,劉寧鐘.一種新的基于顏色特征的圖像檢索方法[J].小型微型計算機系統(tǒng),2012,33(3):609?613.
[6] MIN R, Cheng H D. Effective image retrieval using dominant color descriptor and fuzzy support vector machine [J]. Pattern Recognition, 2008, 42(1): 147?157.
[7] 孔銳,張國宣,施澤生,等.基于核的K?均值聚類[J].計算機工程,2004,30(11):12?13.
[8] 唐曉燕,高昆,倪國強.高光譜圖像非線性解混方法的研究進展[J].遙感技術(shù)與應(yīng)用,2013,28(4):731?738.
[9] SHEN Yi, FAN Jianping. Leveraging loosely?tagged images and inter?object correlations for tag recommendation [C]// Proceedings of 2010 ACM International Conference on Multimedia. New York: ACM, 2010: 5?14.
[10] 王琪,彭進業(yè).一種基于混合特征核的圖像檢索方法[J].計算機工程與應(yīng)用,2012,48(15):168?172.