• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)字圖書館圖像資源檢索框架的構(gòu)建與實現(xiàn)

      2017-07-17 15:22數(shù)字圖書館圖像資源檢索框架的構(gòu)建與實現(xiàn)—
      現(xiàn)代情報 2017年6期
      關(guān)鍵詞:特征提取紋理檢索

      數(shù)字圖書館圖像資源檢索框架的構(gòu)建與實現(xiàn)——基于非下采樣的Contourlet變換+徐彤陽+任浩然+張國標

      [摘要]圖像檢索為數(shù)字圖書館的發(fā)展提供了技術(shù)支持,圖書館應(yīng)重視數(shù)字化發(fā)展以提升服務(wù)質(zhì)量。本文提出一種數(shù)字圖書館圖像資源檢索框架,并對系統(tǒng)的實現(xiàn)過程做了詳細的分析。同時,在提取圖像特征時提出了一種基于非下采樣的con.toudet變換圖像檢索算法(NSCT),能夠在大量圖像數(shù)據(jù)中挖掘有效的特征信息。該算法首先對圖像進行多尺度、多方向分解,然后計算低頻和高頻中不同方向的子帶系數(shù)的標準差和均值作為圖像的紋理特征。實驗結(jié)果顯示,本文提出的圖像檢索框架具有可行性,能夠為用戶提供更優(yōu)質(zhì)的搜索服務(wù),并且與同類特征提取算法進行比較,該算法具有良好的檢索性能和較高的查準率、查全率。

      [關(guān)鍵詞]數(shù)字圖書館;圖像檢索;框架構(gòu)建;非下采樣conlourIet

      DOI:10.3969/j.issn.1008—0821.2017.06.009

      [中圖分類號]C250.76 [文獻標識碼]A [文章編號]1008—0821(2017)06—0055—06

      隨著計算機技術(shù)、網(wǎng)絡(luò)技術(shù)及多媒體技術(shù)的快速發(fā)展,人們進入了“讀圖時代”,大量圖像源源不斷的產(chǎn)生,而且圖像本身具有生動性、直觀性和易懂性的特點,滿足了人們對信息的需求,成為信息處理領(lǐng)域中的主要處理對象。盡管數(shù)字圖書館圖像采集技術(shù)以及存儲技術(shù)也在不斷地進步,但如何從大量的圖像數(shù)據(jù)中分析出有價值的內(nèi)容并對這些海量的圖像進行有效的組織,使用戶能快速、準確地找到他們感興趣的信息,成為研究者們研究的熱點之一。同時,在大數(shù)據(jù)時代,用戶的信息素養(yǎng)越來越高,對信息的質(zhì)量要求也不斷提高,也對圖書館產(chǎn)生了更新、更高的要求。而圖像檢索技術(shù)的發(fā)展,能夠更好地滿足用戶對圖像檢索匹配的精準度要求,改善用戶在圖像檢索過程中的信息檢索體驗。總之,對圖像檢索領(lǐng)域的深入研究將決定大數(shù)據(jù)時代數(shù)字圖書館能否抓住機遇提升自己的發(fā)展水平。

      近年來,對圖像檢索需求和檢索行為等方面的研究已經(jīng)取得了豐富的成果,但在如何提高用戶圖像檢索效率的問題上并沒有統(tǒng)一合理的解決措施,而圖像檢索技術(shù)恰恰能夠彌補這一缺失,現(xiàn)階段的圖像檢索技術(shù)主要分為基于文本的圖像檢索和基于內(nèi)容的圖像檢索兩大類。傳統(tǒng)的基于文本的圖像檢索系統(tǒng)是先對圖片信息用關(guān)鍵字進行描述和注釋,該技術(shù)雖然已經(jīng)在數(shù)字圖書館圖像檢索領(lǐng)域中有了比較成熟的研究經(jīng)驗,但依靠手工標注會浪費大量的精力并且人為的主觀性理解不能充分表達圖片的內(nèi)涵,使得圖像檢索的結(jié)果并不盡如人意。圖像文本包含更多的內(nèi)容,這些豐富的信息需要使用一定的方法和技術(shù)進行挖據(jù),采用內(nèi)容的檢索方法不僅可以對圖像信息進行客觀合理的描述,而且采用相似性度量的手段有效地提高了檢索效率,滿足了信息時代發(fā)展的需求,于是基于內(nèi)容的圖像檢索(CBIR)成為數(shù)字圖書館研究的主要方向。

      本文通過構(gòu)建一種基于內(nèi)容的數(shù)字圖書館圖像資源檢索框架,并利用非下采樣的Contourlet變換方法對圖像資源進行特征提取,提高了圖像檢索精準度,有效地實現(xiàn)了數(shù)字圖像資源檢索方案,為數(shù)字圖書館圖像資源的搜索提供了參考價值。

      1基于內(nèi)容的圖像檢索研究現(xiàn)狀

      CBIR結(jié)合人工智能、認知心理學(xué)、面向數(shù)據(jù)庫等方面的學(xué)科知識,利用計算機視覺等方面的理論對圖像進行自動檢索,它不再依賴人工注釋,具有節(jié)省人力、客觀、可建立復(fù)雜描述和應(yīng)用前景廣闊等諸多優(yōu)點,因而該技術(shù)被廣泛研究?,F(xiàn)階段CBIR主要從以下兩個方面進行研究:

      1)圖像特征提取。圖像特征提取就是通過映射或變換將高維信息轉(zhuǎn)換成計算機識別的底層特征的過程,常用的特征包括顏色特征、形狀特征、紋理特征等,這些特征要盡可能維數(shù)小、獨立性好才能對圖像的描述具有更好的相似性。

      2)相似匹配和圖像特征索引。提取圖像特征后,如何采用合理的方法對特征集進行匹配和索引以提高圖像檢索的精度成為該階段的主要研究方向,圖像匹配和索引大致分為3類技術(shù):相似性測量、聚類分析、相關(guān)反饋技術(shù)。主要框架概念圖如圖1所示。

      1.1特征提取

      特征是圖像的一種固有屬性。在CBIR檢索模型中,對特征向量的提取是實現(xiàn)圖像檢索的關(guān)鍵步驟之一,也是數(shù)字圖書館圖像檢索領(lǐng)域研究的重點和難點。特征提取的內(nèi)容主要有基于低層的特征提取和基于高層語義的特征提取兩個方面。盡管高層語義特征能夠更好地反映圖像特征。目前也出現(xiàn)了有關(guān)高層語義特征提取的相關(guān)研究,但圖像低層特征與高層語義特征之間存在著巨大的“鴻溝”,如何從低層特征中提取語義信息并將它們?nèi)诤显谝黄鹑匀惶幱谄款i期,所以近幾年對圖像特征提取的研究主要還是從顏色、形狀、紋理等低層特征來進行的。

      顏色作為圖像內(nèi)容的底層特征之一,在圖像檢索領(lǐng)域的研究中得到廣泛應(yīng)用。顏色特征易于從圖像中提取,它對圖像的變化依賴性較小,可以有效地減少旋轉(zhuǎn)、尺度不一所帶來的干擾。除了采用顏色直方圖對顏色特征進行提取以外,還可以采用顏色聚合向量、顏色協(xié)方差和顏色矩等方式提取。

      形狀特征是圖像的另一個重要特征,包括了部分圖像語義信息,形狀特征的優(yōu)點是可以通過算法提取將圖像低層特征和高層特征很好地融合在一起,這樣就可以得到圖像中的檢索目標。但形狀特征受圖像的平移、縮放、旋轉(zhuǎn)等變換的影響,有一定的局限性。有關(guān)形狀特征的圖像檢索,可以通過基于邊界特征的或基于區(qū)域特征這兩種方法來提取。

      紋理是絕大多數(shù)物體表面的固有屬性,不同物體表面的組織結(jié)構(gòu)之間的排列規(guī)則不相同,人們通過感官視覺可以輕易地分辨不同的紋理。紋理特征能夠反映像素在領(lǐng)域空間的灰度分布規(guī)律,是對像素在局部區(qū)域之間關(guān)系的一種度量。針對紋理特征的提取算法已經(jīng)有了很多研究成果,目前紋理分析的方法基本分為統(tǒng)計法、結(jié)構(gòu)法、模型法和空間/頻率域聯(lián)合分析法這4類方法。

      1.2特征的索引與匹配

      對數(shù)字圖書館圖像資源特征提取后,如何將圖像數(shù)據(jù)集進行索引和匹配成為主要的問題,如何解決語義鴻溝問題是這一過程的主要研究難點。相似性度量是圖像特征匹配非常重要的組成部分,其承擔(dān)著判斷圖像是否相關(guān)的重要作用,常用的相似性度量算法有曼哈頓距離、夾角余弦、蘭式距離、歐式距離和編輯距離等。每一種相似性度量算法都有其優(yōu)點也有其應(yīng)用的局限,對于不同的應(yīng)用和不同的圖像特征,在設(shè)計圖像檢索系統(tǒng)時,相似性度量算法的選擇和設(shè)計是不可忽視的一步。同時,單一地通過一種相似度測量方法難以產(chǎn)生健壯的、符合人類感知的圖像序列,來解決這一問題,研究人員還需要從圖像聚類、分類和相關(guān)反饋技術(shù)進行改進。

      聚類和分類適用于處理大規(guī)模、非結(jié)構(gòu)化的圖像數(shù)據(jù)。Murthy在對圖像檢索時提出了K-means聚類并結(jié)合分層的方法,首先根據(jù)圖像顏色特征將其分為不同類別,再利用K-Means算法進行進一步的聚類,分層聚類能夠有效忒搞檢索速度,K-Means算法通過對向量與其聚類中心之間的距離進行評價,高校準確地獲得聚類結(jié)果。張永庫等人在利用改進顏色聚合向量提取圖像顏色特征的基礎(chǔ)上,找到服務(wù)條件的特征向量作為初始聚類中心,利用分散度與貢獻度進行聚類并建立特征索引庫,提高了檢索的效率。

      相關(guān)反饋為人們提供了與系統(tǒng)交互的機會,通過反饋檢索結(jié)果,可以不斷提高檢索效率。芮勇等人最早提出了相關(guān)反饋技術(shù),并將其應(yīng)用于基于內(nèi)容的圖像檢索中?,F(xiàn)階段有關(guān)圖像檢索的相關(guān)反饋技術(shù)研究方向為減少系統(tǒng)與用戶的交互次數(shù),滿足用戶的檢索需求從而提高檢索的效率和精度。

      2數(shù)字圖書館圖像資源檢索框架構(gòu)建

      本文構(gòu)建的基于內(nèi)容的數(shù)字圖書館圖像檢索框架主要由特征提取、相似匹配、反饋輸出這3個模塊組成。其中對圖像資源特征提取,建立特征數(shù)據(jù)庫是構(gòu)建數(shù)字圖書館檢索系統(tǒng)的核心,也是本文研究的重點。具體模型框架如圖2所示。

      系統(tǒng)首先對存儲在數(shù)字圖書館數(shù)據(jù)庫中的圖像進行自動提取特征,然后用多維的特征向量來表示,存入到圖像特征數(shù)據(jù)庫。而用戶根據(jù)自己的檢索需要,選擇一張或幾張樣本圖像,同樣用相同特征提取方法提取特征向量。最后,系統(tǒng)計算出特征數(shù)據(jù)庫中特征向量和提取的樣本圖像的多維特征相向量的相似距離,根據(jù)距離進行排序,再結(jié)合相應(yīng)的索引信息,最終就能獲得一定程度上相似的圖像。

      2.1圖像預(yù)處理

      由于生成圖像數(shù)據(jù)的工具、手段以及圖像在傳輸時會引入噪聲,導(dǎo)致圖像質(zhì)量下降。因此,為了提高圖像檢索效果,在收集圖像數(shù)據(jù)集后,不能直接作為檢索圖像,本文首先對原始圖像灰度處理,然后采用中值濾波的方法對圖像進行去噪以減少圖像檢索的干擾因素。

      2.2圖像數(shù)據(jù)庫特征提取

      特征提取是數(shù)字圖書館圖像檢索系統(tǒng)實現(xiàn)的重要環(huán)節(jié),信息提取的完整性直接影響數(shù)字圖書館圖像檢索的效果,紋理特征反映圖像本質(zhì)信息,是近年來較為常用的提取圖像信息的方式,本文提出了一種NSCT紋理算法提取圖像特征,并通過實驗并與同類算法比較分析,該算法具有較好的檢索效果,可以為數(shù)字圖書館圖像檢索系統(tǒng)的實現(xiàn)提供參考方案。

      2.2.1 NSCT算法

      NSCT算法是由Contourlet變換發(fā)展而來的,Contourlet變換的基本思想是用近似的“線段”來逼近原始圖像,相比小波采用“點”來逼近,可以利用更少的系數(shù)來近似原始圖像,因而具有良好的各異性和方向性。它很好的解決了二維或更高維奇異性,可以獲得更多的高頻中各個方向的細節(jié)信息。但是,采用Contourlet變換對圖形進行分解時,必須對圖像信號頻繁地進行采樣操作,導(dǎo)致分解的過程中不僅缺乏平移不變性還容易信息失真,為此Cunha等人針對Contourlet變換的一些局限性進行改進,提出非下采樣的Contourlet變換,在分解和重構(gòu)過程中,取消了上、下采樣操作,具有較好的平移不變性。

      NSCT由非下采樣的金字塔濾波器NSP和非下采樣的方向濾波器組NSDFB實現(xiàn)。如圖3所示,圖像首先經(jīng)NSP分解為低通部分和帶通部分,然后帶通部分通過DFB進行多方向分解,類似的分解步驟可以對低頻子帶繼續(xù)迭代濾波,實現(xiàn)對信號的多尺度、多方向分析。因為多尺度分解和多方向分解是相互獨立的,所以各高頻子帶上的方向分解數(shù)都可以是2的任意正整數(shù)次冪。與Contourlet變換相比,由于剔除了下采樣環(huán)節(jié),經(jīng)NSCT分解后的圖像與原始圖像尺寸一致,在保持平移不變性的同時也保留了更多的圖像細節(jié)。

      3.2結(jié)果分析

      通過實驗結(jié)果看出,相比同類算法,本文提出的算法在檢索目標圖像后,返回前7、10、20、30幅圖像的平均查準率要明顯高于其它類方法,同時該算法檢索五幅圖像的平均查全率達到80%,優(yōu)于Harr小波變換檢索40%和文獻[16]提出的檢索算法59%,不僅使數(shù)字圖書館圖像檢索框架得以有效實現(xiàn),而且具有較高的檢索準確率。

      4結(jié)語

      大數(shù)據(jù)時代,圖書館新興的數(shù)據(jù)分析、知識挖掘、信息處理等服務(wù)為數(shù)字圖書館帶來了歷史性的發(fā)展機遇,圖書館通過總結(jié)數(shù)據(jù)中存在的規(guī)律,挖掘潛在價值,將促進圖書館服務(wù)水平的提升。圖像檢索技術(shù)為數(shù)字圖書館圖像采集與處理提供了新的技術(shù)支持和科技創(chuàng)新的平臺,能夠更好地實現(xiàn)圖書館的服務(wù)宗旨。本文構(gòu)建了數(shù)字圖書館圖像資源檢索框架,并提出了一種基于NSCT的圖像紋理檢索算法,實驗結(jié)果顯示該算法實用便捷,具有較好的魯棒性和較高的檢索性能,對數(shù)字圖書館圖像檢索的服務(wù)模式具有一定參考價值。多種特征融合和相關(guān)反饋機制可以進一步提高圖像檢索精度,將是以后研究的重點。

      猜你喜歡
      特征提取紋理檢索
      2019年第4-6期便捷檢索目錄
      使用紋理疊加添加藝術(shù)畫特效
      基于Daubechies(dbN)的飛行器音頻特征提取
      TEXTURE ON TEXTURE質(zhì)地上的紋理
      Bagging RCSP腦電特征提取算法
      專利檢索中“語義”的表現(xiàn)
      消除凹凸紋理有妙招!
      基于MED和循環(huán)域解調(diào)的多故障特征提取
      Walsh變換在滾動軸承早期故障特征提取中的應(yīng)用
      國際標準檢索
      景谷| 文化| 开平市| 清镇市| 吉安市| 香港 | 邹城市| 长葛市| 大连市| 鄢陵县| 宜黄县| 郴州市| 松潘县| 紫阳县| 和顺县| 昌宁县| 鹤壁市| 乡城县| 苍南县| 芦溪县| 安达市| 新巴尔虎右旗| 潮州市| 兴业县| 凤阳县| 社会| 万源市| 佛坪县| 灵川县| 永嘉县| 青海省| 德昌县| 梨树县| 松滋市| 澄江县| 庆安县| 合水县| 读书| 京山县| 淮北市| 闸北区|