滕沖 王穎
摘 要:數(shù)字圖像的數(shù)量在飛速增長,如何通過搜索引擎從海量的圖像中準確、快速地搜索到所需圖像,已成為領域內迫切需要解決的問題?;趦热莸膱D像檢索近年來已成為圖像檢索領域的研究熱點,本文將從CBIR主要技術分支、全球專利申請量/地域分布、國內申請人分布及基于IPC分類號的國內CBIR技術研究方向分析幾個方面對CBIR技術發(fā)展態(tài)勢進行淺析。
關鍵詞:CBIR;圖像檢索;專利
1 CBIR主要技術分支及技術演變
1.1 基于內容的圖像檢索
基于內容的圖像檢索(Content-Based Image Retrieval,CBIR),其研究涉及認知科學、人工智能、模式識別、圖像處理、信息檢索等多個領域,簡化的圖像內容的層次模型一般分為三層:第一層為原始數(shù)據(jù)層,即圖像的原始像素點;第二層為物理特征層,反應了圖像內容的底層物理特征,如顏色、紋理、形狀和輪廓等;第三層為語義特征層,是人們對圖像內容概念級的反應,一般是對圖像內容的文字性描述。為便于用戶更靈活、更有效地表達檢索要求、提高檢索準確率,提出采用組合特征檢索,即可以在顏色、紋理、形狀等集中查詢特征中選擇兩種或兩種以上的特征進行組合檢索。該檢索方法可分為兩種情況,一種是異步組合檢索,另一種是同步組合檢索。
1.2 基于語義的圖像檢索
基于內容的圖像主要僅利用了圖像的底層視覺特征(如顏色、紋理、形狀)進行檢索,但人們判斷圖像的相似度更多的是根據(jù)圖像的含義。為了克服基于簡單視覺特征的圖像檢索方法的不足,人們提出了基于語義的圖像檢索方法?;谡Z義的圖像檢索需要解決兩個主要問題:一是必須提供高層語義的描述方式;二是必須有將底層圖像視覺特征映射到高層語義的方法。語義圖像檢索中的關鍵技術是如何獲取圖像的語義信息。圖像語義獲取方法大致分為3種:(1)利用系統(tǒng)知識的語義提??;(2)基于系統(tǒng)交互的語義生成;(3)基于外部信息的語義提取。
1.3 基于知識的圖像檢索系統(tǒng)
基于知識的圖像檢索系統(tǒng),將人工智能領域的基于知識的處理方法引入到圖像處理領域,通過對圖像理解、知識表達、機器學習,并結合專家和用戶的先驗知識,建立圖像知識庫實現(xiàn)對圖像數(shù)據(jù)庫的智能檢索?;谥R的圖像檢索方法主要涉及自然語言理解、專家系統(tǒng)、知識表達和機器學習等人工智能的主要研究領域。
2 全球專利申請量/地域分布
通過在中外文專利庫中檢索到的數(shù)據(jù),基于CBIR相關專利在全球專利申請量和主要申請地域分布的分析。
2.1 全球申請量趨勢分析
下圖1所示是1999~2015年基于內容的圖像檢索領域申請量趨勢統(tǒng)計數(shù)據(jù),其中紅色線表示國內申請量的變化情況,藍色線表示國際申請量的變化情況。從顯示的數(shù)據(jù)看,不論是在國際還是國內,該領域的申請量都是逐年增長,且繼續(xù)呈現(xiàn)增長態(tài)勢。從2006年,該技術領域的申請量開始有快速的增長,說明此段時間,在基于內容的圖像檢索領域相關技術得到了快速的發(fā)展,相關技術手段和算法日趨成熟。對于國內申請來說,申請量也是穩(wěn)步增長,預計未來幾年的申請量仍處于增長趨勢,但增長率會有所下降,這與相關技術的日趨成熟和難度的增加一定關系。
2.2 全球專利申請地域分布
由下圖2柱狀圖所示,截止到2015年,美國、日本、中國在這一技術領域的申請量位居前三位,其申請量分別為1345、1110、806,美國仍舊是該領域的技術強國,他們在該領域起步較早,且申請人大部分是大公司如IBM、Virage等企業(yè),其對圖像檢索的系統(tǒng)設計較成熟和深入。日本緊隨其后,對該領域也有較多的申請,中國在國際申請量中排名第三,超過韓國、歐洲等國家。雖然中國在該領域起步晚于美國,但在2000之后,中國開始在該領域的申請量逐年增加,得益于國家政策及科技專項的扶持,高校和科研院所對圖像檢索領域中涉及的算法有著深入的研究,由前圖1的曲線也可以看出,中國申請量還處于增長態(tài)勢,說明還有大量的申請人對該領域的技術進行進一步的研究和探索。
3 國內重要申請人分布
如下圖3所示為該技術領域中申請量排名前十位的申請人。
由上圖3的統(tǒng)計數(shù)據(jù)顯示,在前十位申請人中,國內申請人提交的申請數(shù)量最多,高校申請占7位,外國企業(yè)占2位,科研機構占一位,其中排名靠前的主要是高校和科研院所,包括有浙江大學、中國科學院、上海交通大學、北京大學等等。由此可見,該技術在國內高校、研究院研究較為廣泛,較多是從算法改進角度增強檢索的準確性和效率。
4 基于IPC分類號的國內CBIR技術研究方向分析
為了進一步了解基于內容的圖像檢索技術分布,對于檢索到的專利文獻按照IPC分類進行整理,統(tǒng)計得出出現(xiàn)頻次前5位的IPC分類號,分布如下圖4所示。
基于內容的圖像檢索專利申請中,G06F17/30分類號的申請量最大,說明對于圖像的檢索技術是該領域的關鍵技術,對于檢索相關技術的研究是很是活躍,位于第二、三位的是G06K9/46圖像特征或特性的抽取和G06K9/62應用電子設備進行識別的方法或裝置,可見對圖像特征的選取、提取、處理是圖像檢索是否準確的核心所在;同時,隨之研究通過電子設備實現(xiàn)圖像的識別方法或裝置也是本領域的研究重點,還有一部分是對電子設備中的識別基準的研究,涉及分類號G06K9/64和G06K9/66。
5 總結
雖然CBIR技術的諸多研究已經取得了很大進展,但仍存在很多不完善的地方,仍需要進一步研究。對于CBIR的未來發(fā)展,如何進一步提高圖像語義學習的準確度,如何提高圖像檢索的速度,如何融合不同語義層次的圖像信息進行檢索以及融合多種圖像特征以實現(xiàn)基于內容的圖像檢索以滿足使用這的需求,仍將是圖像檢索領域的一個研究熱點。
參考文獻
[1]陳劍雄,張蓓.簡析圖像檢索系統(tǒng)中的CBIR技術[J].貴州學刊,2010,(2):47-48.
[2]黃祥林,沈蘭蓀.基于內容的圖像檢索技術研究[J].電子學報,2012,(7):1065-1071.
(作者單位:國家知識產權局專利局專利審查協(xié)作天津中心)