【摘要】 隨著互聯(lián)網及多媒體技術的高速發(fā)展,傳統(tǒng)的文字搜索漸漸難以滿足用戶獲取信息的需求。本文介紹了幾種基礎的圖像檢索理論,通過一個簡單的多特征加權系統(tǒng),比較了不同系統(tǒng)的檢索結果?!娟P鍵字】 圖像檢索 CBIR 理論一、引言基于內容的圖像檢索(Content-Based Image Retrieval,簡寫為CBIR)是通過使用圖像自身的視覺內容,比如顏色、紋理、形狀等來檢索相似圖片的","Introduction":"","Columns":"新技術","Volume":"","Content":"
【摘要】 隨著互聯(lián)網及多媒體技術的高速發(fā)展,傳統(tǒng)的文字搜索漸漸難以滿足用戶獲取信息的需求。本文介紹了幾種基礎的圖像檢索理論,通過一個簡單的多特征加權系統(tǒng),比較了不同系統(tǒng)的檢索結果。
【關鍵字】 圖像檢索 CBIR 理論
一、引言
基于內容的圖像檢索(Content-Based Image Retrieval,簡寫為CBIR)是通過使用圖像自身的視覺內容,比如顏色、紋理、形狀等來檢索相似圖片的一種技術。CBIR的提出改變了一直以來對圖片標注關鍵詞的窘境。無論是人工標注或是采用大數據分析,用關鍵詞代替圖片的過程一定伴隨著信息的大量丟失。CBIR以圖片本身來進行檢索,避免了此種損失,是將來圖片搜索的發(fā)展方向。
二、CBIR技術簡介
一般說來,建立一個CBIR系統(tǒng)分為兩步:第一步,建立數據庫。使用某種方法提取圖像特征,將待檢索圖片集的特征提取出來存在數據庫中。第二步,檢索。當需要檢索時,對檢索圖片提取特征,和數據庫中特征比較。特征相似的圖片視覺上也應當相似。CBIR涉及到的核心技術主要在兩點:特征提取和相似性度量。
2.1特征提取
特征提取是CBIR的基礎。特征要能切實的反應出圖像的性質:特征相似的圖像,人眼看上去也應該覺得相似,較為通用的特征一般有顏色、紋理等。
2.1.1顏色特征
由于顏色往往和圖像中所包含的物體或場景十分相關;且顏色特征提取相對容易,對圖像本身尺寸、方向和視角的依賴性也較小[1],顏色特征成為了圖像檢索中應用最廣泛的視覺特征。在實際的CBIR系統(tǒng)中,顏色往往被當作主特征使用。
2.1.2紋理特征
紋理是一種不依賴于顏色和亮度的反映圖像同質現(xiàn)象的視覺特征,體現(xiàn)了物體表面共有的內在聯(lián)系;同時,紋理還包含了物體表面組織結構排列的重要信息以及它們與周圍環(huán)境的聯(lián)系。因此,紋理特征在基于內容的圖像檢索中也得到了廣泛的應用。
2.2相似性比較
提取了特征向量之后,就要將檢索圖片和圖片集中圖片的特征向量進行比較,來判定圖像之間的相似性。常用匹配方法有以下幾種[2]。
2.2.1 Minkowsky距離
Minkowsky距離是基于LP范數定義的,其數學描述為:
三、實驗說明
圖像測試集方面,本領域并沒有一個統(tǒng)一的標準。這主要是因為圖像是否相似,本身就有很大的主觀性。另一方面,不同的算法對不同類型的圖片也會有著明顯不同的檢索率。本次測試集共有1000張圖片,文件名從0~999,共分十類,每類圖片為相鄰文件名的100張。測試時,從每類圖像中選擇前三張(文件名為X00,X01,X02)進行檢索,將檢索結果中得分最高的前100張圖片中出現(xiàn)該類別圖片數目作為該張圖片檢索得分。方案的最終得分取30張圖片得分平均值。實驗分別采用了單特征檢索與混合特征檢索。單特征檢索包含了顏色特征的RGB顏色累加直方圖、HSV直方圖、HSV直方圖(空間顏色特征)以及紋理特征的顏色值共生矩陣和Gabor紋理特征。混合特征檢索以上述特征以3,5,5,3,2進行乘法加權進行計算。
四、結論
最終混合特征以微弱優(yōu)勢勝出。單特征檢索中,符合人眼視覺特性的HSV相關特性有著不錯的檢索結果?;旌咸卣髦辛硗鈹捣N輔助特征則幫忙篩選掉了部分HSV相關特征中的錯誤結果,一定程度提升了檢索率。另外,混合結果的高分結果(排序在前)精確度遠超單特征檢索。因此,混合特征更適合實際檢索的需求。
參 考 文 獻
[1] 周明全,耿國華,韋娜.基于內容圖像檢索技術.清華大學出版社.2007.17.
[2] 孫君項,趙珊.圖像低層特征提取與檢索技術.電子工業(yè)出版社.2009.35-37.