王令
(廣州科技職業(yè)技術(shù)學(xué)院,廣東廣州510550)
對視覺信息的檢索需要根據(jù)圖像所表達(dá)的內(nèi)容來進(jìn)行。基于內(nèi)容的圖像檢索方法是獲取和利用視覺信息的有效手段,只有根據(jù)內(nèi)容進(jìn)行檢索才可能有效地獲取需要的信息,同時在掌握信息內(nèi)容的基礎(chǔ)上才有可能有效地管理數(shù)據(jù)庫中的信息?;趦?nèi)容的查詢還能幫助計算機(jī)調(diào)度圖像,對分布式多媒體數(shù)據(jù)庫,可減少網(wǎng)絡(luò)上的傳輸量?;趦?nèi)容的圖像檢索是借助對視覺媒體從低層到高層進(jìn)行處理、分析和理解的過程獲取其內(nèi)容并根據(jù)內(nèi)容進(jìn)行檢索。它涉及到對圖像的視覺信息進(jìn)行有效地查詢、索引、瀏覽、搜索和提取,而且這種工作是直接根據(jù)圖像的內(nèi)容含義而展開和進(jìn)行的。
基于內(nèi)容的圖像檢索系統(tǒng)(圖1)支持根據(jù)視覺內(nèi)容的檢索。對視覺信息的訪問不僅在概念層利用關(guān)鍵字進(jìn)行(與在文字領(lǐng)域類似),而且也在感知層利用對圖像內(nèi)容的客觀測量和合適的相似模型進(jìn)行。在離線狀態(tài),不僅注解員可通過一定的方法對數(shù)據(jù)庫內(nèi)容進(jìn)行注解,而且系統(tǒng)也自動地對數(shù)據(jù)庫圖像進(jìn)行分析、提取特征,從而提供出在線應(yīng)用時所需的多維索引。用戶不僅可以借助文字查詢方法,也可以借助視覺瀏覽和范例查詢方法,利用搜索引擎進(jìn)入索引進(jìn)行檢索,返回的結(jié)果仍可以用可視化的手段顯示給用戶,使用戶能借助相關(guān)反饋開始新一輪查詢。由此可見,對原始數(shù)據(jù)的處理和分析是系統(tǒng)功能不可缺少的一部分。HSL、YIQ)以及分塊加權(quán)HSV顏色直方圖比較的實驗結(jié)果,并且綜合圖像的顏色和紋理特征以及紋理和形狀特征進(jìn)行圖像檢索時,采用了基于灰度共生矩陣的紋理特征提取和基于不變矩的形狀特征提取方法,并在此基礎(chǔ)上加入了基于權(quán)重調(diào)整的相關(guān)反饋機(jī)制,使用戶可以參與檢索過程,通過調(diào)整權(quán)重使得檢索結(jié)果最終滿足用戶的檢索要求。
圖1 第二代基于內(nèi)容的圖像檢索系統(tǒng)工作流程圖
文中給出了六種顏色空間(HSV、YUV、RGB、XYZ、
圖2 基于內(nèi)容的圖像檢索系統(tǒng)基本框架
顏色和紋理、紋理和不變矩是圖像檢索中使用最為頻繁的視覺特征。人眼觀察圖像時往往不是只基于某一個特征,而是綜合多種特征。因此綜合多特征的檢索算法比單一特征的檢索算法更符合人的視覺感受。在這里先計算各個子特征的距離度量,再組合這些子特征距離得到全局相似距離。
由于特征向量中各個分量具有不同的物理意義和取值范圍,需要對特征向量進(jìn)行內(nèi)部歸一化。本文采用了效果較好且最常用的高斯歸一化方法。一個N維的特征向量可記為:F=[f1,f2,…,fN]。如果用I1,I2,…,IM代表圖像庫中的圖像,則對其中任一幅圖像Ii,其對應(yīng)的特征向量為Fi=[fi,1,fi,2,…,fi,N]。假設(shè)特征分量值系列[f1,j,f2,j,…,fM,j]符合高斯分布,可計算出其均值mj和標(biāo)準(zhǔn)差σj,然后利用下式將fij歸一化至區(qū)間[-1,1]:
根據(jù)公式(1)歸一化后,各個fi,j均轉(zhuǎn)變成具有N(0,1)分布的。圖像的相似性度量采用絕對值距離,因為絕對值距離計算復(fù)雜度小,且能取得比較好的檢索結(jié)果,即:
其中Xk,Xj表示兩個樣本的特征向量。xki,xji則是相應(yīng)的第i個分量。
基于內(nèi)容的相似性檢索可以劃分為三種類型:
①區(qū)間查找:從數(shù)據(jù)庫找出所有符合如下條件的圖像:圖像特征的值分別在用戶指定的區(qū)間內(nèi)。
②K-最近鄰查找:從數(shù)據(jù)庫返回與檢索樣本最相似的前K個圖像。
③限定誤差范圍內(nèi)查找(a-cut):從數(shù)據(jù)庫找出與檢索樣本的相似度不小于a的所有圖像。
本文采用第②種方法,當(dāng)圖像由多個不同的底層視覺特征描述子表示時,把這些特征參數(shù)組成一個向量是比較自然的想法。比如把x1,x2,…,xk個特征描述子用k維向量空間中的一個向量(空間中的點(diǎn))代表。在向量表示的特征空間中進(jìn)行區(qū)域查找等同于查找位于空間中的超立方體中的點(diǎn)。
為了支持最近鄰查找,特征空間必須具備相似性度量的能力。兩個向量的相似性可以用多種方法進(jìn)行度量,一般分為距離度量和非距離度量兩大類。
本文采用一般的歐式距離,一般的歐式距離公式:
K為正定的,不一定為協(xié)方差陣。
高維數(shù)據(jù)索引是數(shù)據(jù)庫、信息檢索等多個領(lǐng)域的研究熱點(diǎn),并且新的研究結(jié)果在不斷涌現(xiàn),比如高維索引方法一般分為向量空間方法和度量空間方法。本文采用高維索引方法時中的度量空間方法。
度量空間方法檢索數(shù)據(jù)庫對象的距離而不是數(shù)據(jù)對象本身。其優(yōu)點(diǎn)是可以靈活選擇合適的距離度量方法,減少檢索時的度量計算開銷。度量空間法可以很好地支持最近鄰查找,但是一般并不支持區(qū)間查找。常用的度量空間法高維索引結(jié)構(gòu)為:VP-樹和M-樹。
為配合空間地理遙感衛(wèi)星圖片研究,實驗數(shù)據(jù)庫特采用中國科學(xué)院“全國資源環(huán)境遙感數(shù)據(jù)庫”,它是像素柵格圖形數(shù)據(jù)庫的地圖投影,其數(shù)學(xué)基礎(chǔ)為ALBERS等積圓錐投影。
對一幅給定的檢索圖像,設(shè)N是圖像庫中相似圖像的總數(shù),n是提取出的相似圖像數(shù),T是系統(tǒng)提取出的總圖像數(shù),則檢索效率定義為:
當(dāng)進(jìn)行了一系列檢索實驗時,如果在某些實驗中N>T而在另一些實驗中N<T,那么根據(jù)式(2),某些實驗結(jié)果就會比其它實驗結(jié)果被賦予較大的權(quán)重。為了避免這個問題,以在一致的條件下比較不同的技術(shù),需要提取比相似圖像的總數(shù)更多的圖像,即總要取N<T,這樣不僅可以確定是否所有相似圖像都提取出來了,還可以確定這些圖像的排序是否正確。
本文實驗中取M=8類進(jìn)行檢索,并且N>20,T=20檢索率結(jié)果取百分整數(shù)。
表1 紋理和不變矩綜合特征檢索效率
從實驗數(shù)據(jù)可以看出采用綜合特征檢索后。紋理權(quán)重占50%時平均檢索率最高。圖像特征入庫提取的平均速度也很快,在海量的遙感衛(wèi)星圖片中,要提取自己想找到的圖片可以通過這種方法進(jìn)行特征比對。
圖3 紋理權(quán)重對應(yīng)檢索率
從圖3可以看出,綜合紋理和不變矩特征檢索的平均最高檢索率比綜合紋理和顏色特征的平均最高檢索率高出約2%,并且當(dāng)紋理權(quán)重占50%時平均檢索率最高。
圖4是依據(jù)本文理論設(shè)計的圖像檢索系統(tǒng),待檢索的目標(biāo)圖像已提取出來,將圖像按紋理和不變矩特征入庫,然后按紋理加權(quán)權(quán)重檢索圖像。
經(jīng)過上面的分析和比較,基于內(nèi)容的圖像檢索要分析被檢索圖像本身的特征,要從海量的圖像里快速檢索目標(biāo)圖像,必須針對圖像本身的特征應(yīng)用不同的方法提取圖像的特征入庫,實驗證明衛(wèi)星遙感圖片便用紋理加權(quán)權(quán)重和不變矩綜合檢索的效率較高。
圖4 檢索系統(tǒng)檢索衛(wèi)星遙感圖片截圖
[1]G.Ayala,J.Domingo,Spatial size distributions.Applications to shape and texture analysis,IEEE Trans.Pattern Anal.Mach.Intell.23(12)(2001)1430-1442.
[2]章毓晉.基于內(nèi)容的視覺信息檢索[M].北京:科學(xué)出版社,2003.
[3]唐立軍,段立娟,高文.基于內(nèi)容的圖像檢索系統(tǒng)[J].計算機(jī)應(yīng)用,2000,10(7):41245.
[4]李向陽,魯東明,潘云鶴.基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J].計算機(jī)研究與發(fā)展,2001,38(3):344-354.