王玉蘭 王劍雄 趙翊君 甄同妙
(河北建筑工程學院,河北,張家口075000)
隨著視頻監(jiān)控的發(fā)展,數(shù)字圖像正以驚人的速度增長,因此當前需要解決的問題是如何快速、準確的管理,并且檢索出所需要的圖像.而傳統(tǒng)的圖像檢索技術因為其本身的局限性,已經(jīng)不能滿足現(xiàn)在龐大數(shù)據(jù)的需求,這時人們把研究的焦點放在基于內(nèi)容的圖像檢索技術上.在提取能表示圖像內(nèi)容的紋理、顏色、形狀和空間位置等底層視覺特征的基礎上,融合圖像多特征進行索引匹配,通過降維、構建索引結構,這就是基于內(nèi)容的圖像檢索.具體算法流程為:a)利用聚類算法提取視頻的背景幀,把當前幀與背景幀相減得到運動目標的位置;b)用戶指定前景目標上、中、下三個位置的權重;c)計算前景目標的顏色低階矩;d)按公式計算關鍵圖和目標圖對應的相似度;e)把相似度高于閾值的圖像存放到數(shù)據(jù)庫中;f)按相似度大小進行索引排序目標圖片;g)顯示結果.
本文參考了國內(nèi)外很多研究人員的方法,如基于統(tǒng)計模型的方法[1],基于預測的方法[2]等,最后經(jīng)過分析研究,得出一種新的背景提取算法,即基于聚類思想的背景提取算法.經(jīng)過實驗,該算法的時間度優(yōu)于前兩個算法,且具有顯著的應用效果.
算法的過程是,在N幀圖像中取出相同位置的每一個像素值,然后求其均值與方差,如果方差大于某一個特定的閾值,則去掉與均值距離最遠的那個像素值,然后再重新求均值與方差,直到剩下像素值的方差小于特定的閾值,最后該均值就是該像素點的背景值,然后取下一個像素值,直到圖像所有像素值的背景提取完畢,算法具體步驟如下:
Step1:對N幀圖像同一個位置點的像素灰度值進行排序.讀取視頻流中N幀圖像同一個位置像素點的灰度值,把這些數(shù)據(jù)進行由小到大排序,放入一個臨時(Temp)數(shù)組中,該數(shù)組預先清零,且開始時k=1,x=1,y=1.用公式(1)表示為:
式(1)中:Temp(k)表示數(shù)組Temp中存放的由小到大排列的K個灰度值數(shù)據(jù),1≤k≤N,Imagek(x,y)表示第k幀圖像中(x,y)處的灰度值,且1≤x≤Height(圖像行高),1≤y≤Width(圖像列寬),總共N幀圖像.
Step2:計算視頻序列圖像(x,y)點處像素的平均值與方差.初始化low=1,high=N.用公式(2)表示為:
Average(x,y)是視頻序列圖像(x,y)點處灰度的平均值,D(x,y)是視頻序列圖像(x,y)點處灰度的方差,low指向Temp數(shù)組中未被去掉的極小值,high指向Temp數(shù)組中未被去掉的極大值.
Step3:比較該點方差與閾值,如果方差大于閾值,比較Temp數(shù)組中第一個和最后一個數(shù)據(jù)值與Average(x,y)的距離值,然后去掉距離大的那一個,重復Step2和Step3;如果方差小于閾值,平均值即為該像素點的背景值.
當D(x,y)>TH時,用公式(3)表示為:
當D(x,y)≤TH時,用公式(4)表示為:
BImage(x,y)是視頻序列圖像(x,y)處的背景灰度值,本文中TH閾值取值為50.
Step4:行或列移動一個單位,重復Step1、Step2、Step3直到計算出圖像的全部像素點的背景值BImage(x,y),用公式(5)表示為:
x代表圖像像素的行數(shù),y代表圖像像素的列數(shù),width是圖像的寬度,height是圖像的高度.
數(shù)字圖像內(nèi)容的一種重要表示方法就是顏色.因為顏色特征對圖像本身的大小、方向的不敏感,所以顏色特征成為圖像檢索中應用最為廣泛的視覺特征.再由于顏色和圖像中所包含的物體或場景十分相關,從而具有較強的魯棒性.之所以很多基于顏色特征的圖像檢索算法被提出來,就是因為顏色特征的重要作用.
顏色直方圖具有隨圖像尺度、旋轉等變化不敏感,并且特征提取和相似度計算簡便的特點,因此將它作為一種重要的基于顏色特征進行圖像檢索的方法.但是,顏色直方圖也有一些缺點:顏色直方圖只計算圖像顏色數(shù)量分布,沒有考慮顏色在圖像空間的分布,并且真彩色的數(shù)字圖像的R,G,B分量取值均在[0,255]之間,那么一張數(shù)字圖像的顏色數(shù)有255×255×255種.這就使得提取的特征維數(shù)過高,不利于檢索,這就會出現(xiàn)顏色直方圖相同但圖像內(nèi)容完全不同的情況.故我們采取顏色矩[3]的方法來提取顏色特征值.此外,由于顏色分布信息主要集中在低階矩中,因此僅采用計算顏色分布的一階矩、二階中心矩和三階中心矩就可以表達圖像的顏色特征.另外,采用顏色矩的另一個好處在于降低了顏色特征的維數(shù)并且無需對顏色進行量化.顏色矩的三個低階矩為公式(6):
圖像的顏色矩一共有9個分量,其中3個顏色通道分量,每個顏色分量有3個低階矩,hij表示第i個顏色通道分量中灰度為j的像素出現(xiàn)的概率,下角標的第二個分量j表示灰度級數(shù).本文采取顏色矩作為特征值,并且顏色矩同其它顏色特征相比是非常簡潔的.
相似性度量方法模型多種多樣,沒有具體的哪一種方法能夠適用于所有情況.就是因為計算方法和計算量的原因,當前用于圖像檢索的相似性度量模型主要還是采用歐幾里德距離度量,如果圖像特征的分量之間各維特征的重要程度相同,并且它們互不相關,那么特征向量T和Q之間的相似程度可以如公式(7)表示:其中:n為特征向量的維數(shù).
本文綜合考慮其它距離相似性的度量方法的優(yōu)缺點,最后對歐幾里德距離稍加修改,即加權歐幾里德距離作為相似性的度量方法.設待查圖像為Q,目標圖像為T,其顏色矩特征分別為:Eqi,Eti,加權系數(shù)是W,則圖像Q和T之間的相似度距離可用以下公式表示:
式中:n為分割區(qū)域個數(shù);Wt為分割區(qū)域所占視覺權重,We、Ws為各階顏色矩的權重.
由于圖像數(shù)據(jù)庫包含著眾多的數(shù)據(jù)而且描述圖像的特征矢量的維數(shù)[4]往往很高,所以要有效檢索,高效的索引機制是非常重要的.之所以很多常用的索引機制無法直接用于圖像數(shù)據(jù)庫,是因為圖像數(shù)據(jù)庫與文本數(shù)據(jù)庫有很大的區(qū)別.
本文采用特征向量來表示圖像[5],這些特征向量維數(shù)的數(shù)量級通常達到102.對于小型圖像數(shù)據(jù)庫(≤104幅),用優(yōu)化或者簡單的線性查找就可以有效地進行.但對于數(shù)字化圖書館和其他的一些集成檢索系統(tǒng),圖像庫的容量一般都是非常大的(≥105幅),高維索引對檢索效率的影響很大,因此采用高效地索引機制是十分必要的.本文研究的合理做法是對圖像特征向量的維數(shù)先進行縮減,為此采用RGB三個通道分開,分別計算每個通道的特征值,再乘以它們的權值,然后相加就得到數(shù)據(jù)庫索引的索引值,通過索引值檢索圖庫,查找相似圖像.
為了模擬真實環(huán)境下的圖像檢索[6],特意拍攝了500多幅各個種類的照片,經(jīng)過系統(tǒng)模擬實驗,大部分能預期檢索發(fā)現(xiàn)。模擬檢索系統(tǒng)如圖1所示:
圖1 圖像檢索系統(tǒng)
為了和本文參考文獻的算法進行比較,本文查準率取前6幅進行比較,查全率取前12幅進行比較,比較結果本文算法優(yōu)于大量參考文獻的算法,符合人的心理預期。
本文實現(xiàn)了一個基于內(nèi)容的顏色特征圖像檢索原型系統(tǒng),這是以內(nèi)容圖像檢索技術進行研究和分析為基礎的.本文對許多經(jīng)典的傳統(tǒng)算法進行了諸多的改進:提取運動目標區(qū)域的方法,使得查找范圍縮??;采取加權的歐幾米的距離進行相似度測量,提高相似度檢測;把運動目標區(qū)域分成上、中、下三個部分,每個部分都有自己的權值,使得查找精確度大大提高,實驗仿真驗證了該方法的有效性.本文還存在一些不足之處,今后需要進一步研究和改進:
1)文章中進行的特征檢索技術還只是基于圖像的低層視覺特征,沒有涉及低層視覺特征與高層語義特征之間的聯(lián)系.
2)需要加大對人的視覺感知特性的考慮和研究,這樣有助于快速捕獲用戶的需求.
3)如何解決檢索精度和檢索效率之間的矛盾.
4)大量的特征數(shù)據(jù)必然要采用建立圖像特征數(shù)據(jù)庫方法,因此,要引入分布式計算模式,提高基于內(nèi)容圖像檢索系統(tǒng)的并行處理能力、響應能力和檢索能力.
[1]Christopher Richard WREN,All AZARBAYEJANI,Trevor DARRELL,et al.Pfinder:real-time tracking of the human body[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):780~785
[2]Christof RIDDER,Olaf MUNKELT,Harald KIRCHNER.Adaptive background estimation and foreground detection using Kalman-Filtering[A].Proceedings of the International Conference on recent Advances in Mechatronics[C].Istanbul,Turkey:UNESCO Chair on Mechatronics,1995.193~199
[3]Stricker,M.,Orengo,M.Similarity of color images[A].In:Niblack,W.R.,Rceds,J.,eds.Proceedings of the SPIE2420,Storage and Retrieval for Image and Video DatabaseI I I[C].San Jose,CA:SPIE,1995.381~392
[4]Salton G.,McGill M.J..Introduction to modern information retrieval[M].New York:McGraw2Hi 11Book Company
[5]岳磊.基于分塊顏色矩和灰度共生矩陣的圖像檢索[J].微計算機信息,2012,8(28):162~164
[6]李一波,樸慧.小波變換在紋理提取技術中的研究現(xiàn)狀[J].小型微型計算機系統(tǒng),2010,3l(6):1213~1217