• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于大數(shù)據(jù)內(nèi)容標(biāo)簽的近似圖像搜索算法研究

      2016-04-12 00:00:00許金玲孟慶福
      現(xiàn)代電子技術(shù) 2016年16期

      摘 要: 準(zhǔn)確計(jì)算圖像多特征距離成為大數(shù)據(jù)時(shí)代影響基于圖像的內(nèi)容標(biāo)簽的一個(gè)關(guān)鍵問(wèn)題,對(duì)基于內(nèi)容的圖像檢索技術(shù)至關(guān)重要。在借鑒歐氏距離和高斯歸一化兩種方法的優(yōu)勢(shì)的基礎(chǔ)上,對(duì)高斯歸一化算法進(jìn)行改進(jìn),提出一種基于特征距離糾偏的多特征距離計(jì)算算法。該算法首先采用歐氏距離法計(jì)算定量特征距離,然后利用改進(jìn)高斯歸一化法完成距離糾偏,最后通過(guò)自由設(shè)定權(quán)重得到最終的圖像多特征距離。與傳統(tǒng)高斯歸一化算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果表明,利用該算法既能有效得到特征間的定量距離,又能方便地把多個(gè)特征的地位均衡,從而達(dá)到提高相似圖像搜索質(zhì)量的目標(biāo)。

      關(guān)鍵詞: 大數(shù)據(jù); 內(nèi)容標(biāo)簽; 圖像檢索; 高斯歸一; 歐氏距離

      中圖分類號(hào): TN919?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)16?0058?03

      Abstract: The accurate calculation of image’s multi?feature distance is a key problem in big data era, which influences on the image? based content label, and plays an important role in content?based image retrieval technique. On the basis of the advantages of Gaussian normalization method and Euclidean distance method, the Gaussian normalization method is improved, and a multi?feature distance calculation (C?GN) algorithm based on feature distance rectification is presented. The Euclidean distance method is used in the C?GN algorithm to calculate the quantitative feature distance, and then the improved Gaussian normalization method is used to rectify the distance. The image’s multi?feature distance is obtained through the free weight setting. The experimental results show that, the algorithm can not only effectively obtain the quantitative distance among the features, but balance the status of multi?features conveniently, which improve the search quality of similar images.

      Keywords: big data; content label; image retrieval; Gaussian normalization; Euclidean distance

      0 引 言

      隨著互聯(lián)網(wǎng)和多媒體技術(shù)的迅速發(fā)展,大數(shù)據(jù)[1?2]時(shí)代已經(jīng)到來(lái),多媒體信息資源呈指數(shù)增長(zhǎng),基于內(nèi)容的標(biāo)簽體系應(yīng)運(yùn)而生。為了從大量的圖像信息中快速、準(zhǔn)確地找到需要的內(nèi)容,傳統(tǒng)的基本文本的圖像檢索已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足人們的需求,基于內(nèi)容的圖像檢索技術(shù)[3?5]引起了國(guó)內(nèi)外眾多學(xué)者的關(guān)注。圖像內(nèi)容實(shí)質(zhì)上就是圖像中所包含對(duì)象的特征(如顏色,形狀)等,這些特征決定了圖像的特性,也成為區(qū)別其他圖像的關(guān)鍵因素。相似圖像區(qū)分的越精確,基于內(nèi)容的圖像檢索準(zhǔn)確度也就越高。因此,如何精準(zhǔn)區(qū)分相似圖像,準(zhǔn)確計(jì)算圖像多特征距離成為影響圖像檢索質(zhì)量的一個(gè)關(guān)鍵問(wèn)題。

      通過(guò)對(duì)多個(gè)特征進(jìn)行聚類[6?7]分析,使用K?mean等類似的聚類算法可以得到相似特征集合,但不能得到定量特征距離成為使用該方法的制約因素;直接使用廣義歐氏計(jì)算公式[8?10]ED(Euclidean Distance) 進(jìn)行多特征整合,雖然能定量得到特征的距離,但是,由于多個(gè)特征之間的地位不平等,需要進(jìn)行大量的試驗(yàn)確定權(quán)重。使用高斯歸一法GN(Gaussian Normalization)[11?13]計(jì)算多特征計(jì)算距離,是一種簡(jiǎn)單、高效的方法,但由于對(duì)特殊距離進(jìn)行模糊處理導(dǎo)致了搜索的質(zhì)量降低。

      受到啟發(fā),整合歐氏距離和高斯歸一化兩種方法的優(yōu)勢(shì),本文提出一種基于特征距離糾偏的圖像多特征距離計(jì)算算法(C?GN),采用歐氏距離法計(jì)算定量特征距離,利用改進(jìn)高斯歸一化法完成距離糾偏,通過(guò)自由設(shè)定權(quán)重[14]得到最終的圖像多特征距離。該算法既能有效定量得到特征間的距離,又能方便地把多個(gè)特征的地位均衡,從而達(dá)到提高相似圖像搜索質(zhì)量的目標(biāo)。

      1 現(xiàn)有算法簡(jiǎn)述

      1.1 高斯歸一化算法

      高斯歸一法將特征距離歸到0~1區(qū)間,進(jìn)行最終歸一處理的公式為:

      [Ni=0, Ni<01, Ni>1] (1)

      式中,[Ni]為每一個(gè)特征歸一化后的值。

      該算法導(dǎo)致距離小于0的多個(gè)距離值都被歸一為0,而大于1的就被處理成1,造成了計(jì)算結(jié)果的不準(zhǔn)確。

      1.2 歐式計(jì)算法

      歐氏計(jì)算公式實(shí)現(xiàn)了多特征整合,整合公式如下:

      [D=i=1mwiri-si2, i=1mwi=1, 0

      式中[w]是權(quán)重。優(yōu)點(diǎn)是能定量得到特征的距離,但是,多個(gè)特征之間的地位不平等,需要進(jìn)行大量的試驗(yàn)確定[w]。

      2 本文提出的算法

      2.1 算法流程

      該算法的基本思想是采用歐式距離計(jì)算公式對(duì)二類特征分別求取距離,采用改進(jìn)的高斯歸一化方法進(jìn)行距離歸一處理,然后對(duì)歸一距離加權(quán)求和,最終輸出距離數(shù)組。算法的基本流程如圖1所示。

      圖1中,待檢測(cè)圖像是需要比較的圖像,需要計(jì)算出這張圖像和庫(kù)里的圖像的距離,從而知道相似程度最接近的是哪些圖像。首先需要對(duì)圖像進(jìn)行預(yù)處理,把圖像規(guī)格成統(tǒng)一大小。經(jīng)過(guò)預(yù)處理后開(kāi)始提取圖像的特征,在此,提取圖像的顏色、形狀二個(gè)特征。

      對(duì)于該流程的實(shí)現(xiàn)重點(diǎn),是在圖1的第二個(gè)虛框中,在這個(gè)部分完成特征距離的計(jì)算、特征距離歸一以及特征距離加權(quán)求和。

      2.2 計(jì)算特征距離數(shù)組

      采用通用的歐氏距離計(jì)算式(2)對(duì)二類特征分別求取距離。

      對(duì)于顏色特征,分別由4個(gè)子特征組成,如R,G,B,Gray,使用式(2)得到[D_Colori=i=14Ci-Li2],其中,[Ci]([i]取0~3)分別對(duì)應(yīng)R,G,B,Gray四個(gè)特征。這樣得到一共N個(gè)距離,其中N為特征庫(kù)中特征圖像的數(shù)量。[Ci]是代表輸入需要檢測(cè)的圖像子特征;[Li]為特征庫(kù)中圖像子特征。R,G,B,Gray的含義如下:紅、綠、藍(lán)、灰度值。

      顏色特征數(shù)組,結(jié)果如下:

      [D_Color0,D_Color1,…,D_Colorn-1]

      式中,n為特征庫(kù)中特征圖像的數(shù)量。

      對(duì)于形狀特征,分別由5個(gè)子特征組成,即A,D,OA,OD,N,使用式(2)得到[D_Shapei=i=15Ci-Li2]。其中,[Ci]([i]取0~4)分別對(duì)應(yīng)A,D,OA,OD,N五個(gè)特征。這樣也得到一共N個(gè)距離,其中N為特征庫(kù)中特征圖像的數(shù)量。[Ci]是代表輸入需要檢測(cè)的圖像子特征;[Li]為特征庫(kù)中圖像子特征。A,D,OA,OD,N的含義如下:角度、質(zhì)量中心、外部角度、外部質(zhì)量中心、頂點(diǎn)。形狀特征數(shù)組如下:

      [D_Shape0,D_Shape1,…,D_Shapen-1]

      式中,n為特征庫(kù)中特征圖像的數(shù)量。

      2.3 改進(jìn)的高斯歸一化算法

      改進(jìn)的高斯歸一化算法如下:

      (1) 計(jì)算均值[Tave:]

      [Tave=i=1nDin] (3)

      式中:n為特征的個(gè)數(shù);[Di]為形狀、顏色或者紋理的距離值。

      (2) 計(jì)算標(biāo)準(zhǔn)差:

      [Tbzc=i=1nDi-Tave2] (4)

      式中:n為特征的個(gè)數(shù);[Tave]為式(3)計(jì)算出的均值。

      (3) 歸一:

      [Ni=Di-Tbzc3?Tbzc] (5)

      式中:[Ni]為初步歸一的距離值。

      (4) 計(jì)算得到偏離常數(shù)[Contoff]:

      [Contoff=0-Tbzc3?Tbzc] (6)

      (5) 對(duì)距離值進(jìn)行正值化(糾偏):

      [Ni=i=lnDi+Contoff] (7)

      (6) 使用廣義歐氏計(jì)算式(2)進(jìn)行多特征整合。

      2.4 設(shè)定權(quán)重求和

      各個(gè)特征經(jīng)過(guò)第2.3節(jié)的歸一化后,特征的地位平等了,然后可以設(shè)定權(quán)重。較為重要的特征可以設(shè)定高的權(quán)值。這里的計(jì)算方法如下:

      [Sumj=w1?Cj+w2?Sj+wi?Tj, i=1mwi=1, 0

      式中:[Cj,Sj,Tj]分別對(duì)應(yīng)著特征距離數(shù)組的值。

      針對(duì)該實(shí)施例子,這里僅有前兩項(xiàng),對(duì)于更多的特征,可以繼續(xù)擴(kuò)展,例如式(8)中的[wi?Tj]。

      這樣就得到了顏色和形狀的加權(quán)距離和數(shù)組,可以推廣到大于兩個(gè)特征的情況,加權(quán)距離和數(shù)組如下:

      [DSumN0,DSumN1,…,DSumNn-1]

      式中,n為特征庫(kù)中特征圖像的數(shù)量。這里,權(quán)重的選擇可以根據(jù)重要程度等原則進(jìn)行取值。

      3 實(shí)驗(yàn)分析與應(yīng)用

      本文對(duì)上述算法進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)為某購(gòu)物網(wǎng)站提供的10萬(wàn)條商品圖像數(shù)據(jù),該實(shí)驗(yàn)數(shù)據(jù)符合大數(shù)據(jù)的數(shù)據(jù)量大、搜索數(shù)據(jù)種類多、搜索內(nèi)容類域交叉等多個(gè)特點(diǎn)。將這些數(shù)據(jù)按照?qǐng)D像相似度分成5大類,每類圖像數(shù)量為2萬(wàn)張,將每?jī)蓮垐D像分為一組進(jìn)行對(duì)比,最后再將1萬(wàn)組圖像的特征距離進(jìn)行匯總后平均得到每類相似度圖像的特征距離。分別采用高斯歸一化GN算法、歐式距離ED算法和改進(jìn)的C?GN算法進(jìn)行計(jì)算,得到表1所示的計(jì)算結(jié)果。

      表1 算法核心運(yùn)算比較

      計(jì)算結(jié)果表明,較傳統(tǒng)的高斯歸一化GN算法和歐式距離ED算法,改進(jìn)的C?GN算法更能準(zhǔn)確識(shí)別相似圖像,圖像搜索質(zhì)量較高。將此算法應(yīng)用在網(wǎng)絡(luò)公開(kāi)課程標(biāo)簽體系建設(shè)中,對(duì)于網(wǎng)絡(luò)中提取到的公開(kāi)課圖像進(jìn)行分析識(shí)別,準(zhǔn)確定位課程內(nèi)容,形成精準(zhǔn)的內(nèi)容標(biāo)簽,網(wǎng)絡(luò)公開(kāi)課標(biāo)簽的精準(zhǔn)度從62.8%提升到82.3%,滿足了教師和學(xué)生搜索視頻資料的準(zhǔn)確度。

      4 結(jié) 語(yǔ)

      本文提出了一種快速、準(zhǔn)確計(jì)算圖像多特征距離的算法C?GN。該算法采用歐式距離計(jì)算公式對(duì)二類特征分別求取距離,以便得到定量的特征距離,準(zhǔn)確識(shí)別圖像特征;然后采用改進(jìn)的高斯歸一化方法進(jìn)行距離歸一處理,通過(guò)設(shè)定偏離常數(shù)對(duì)距離值進(jìn)行正值化糾偏,實(shí)現(xiàn)了圖像特征的地位平等化;既保證了對(duì)多個(gè)特征做歸一化處理時(shí)值均大于等于0,又實(shí)現(xiàn)了不同的圖像的特征有惟一的不同的歸一化值,同樣的圖像的距離歸一后為0;最后,根據(jù)重要程度等原則可自由設(shè)置特征權(quán)重,對(duì)歸一距離加權(quán)求和,從而準(zhǔn)確獲取相似圖像的特征距離。實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有的歐氏計(jì)算方法和高斯歸一化方法相比,本文提出的算法在相似圖像搜索的質(zhì)量和效率上表現(xiàn)出良好的性能。

      注:本文通訊作者為孟慶福。

      參考文獻(xiàn)

      [1] TIEN J M. Big data: unleashing information [J]. Journal of systems science and systems engineering, 2013, 22(2): 4?9.

      [2] 王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2013,36(6):1125?1238.

      [3] 施智平,李清勇,趙曉東,等.基于內(nèi)容圖像檢索中的優(yōu)化鑒別特征[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2012,24(12):1592?1598.

      [4] 余明艷,丘衍航,劉海員.內(nèi)容圖像檢索IALA算法的設(shè)計(jì)與實(shí)現(xiàn)[J].科技通報(bào),2013,29(2):103?105.

      [5] HUSSAIN M, EAKINS J P. Component?based visual clustering using the self?organizing map [J]. Neural networks, 2007, 20(2): 260?273.

      [6] 陳湘濤,王愛(ài)云,謝偉平,等.基于內(nèi)容圖像檢索的聚類算法研究[J].計(jì)算機(jī)應(yīng)用研究,2008,25(12):3546?3549.

      [7] 張白妮,駱嘉偉,湯德佑.動(dòng)態(tài)的K?均值聚類算法在圖像檢索中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2004,25(10):1843?1846.

      [8] 賈迪,孟祥福,孟琭,等.結(jié)合高斯加權(quán)距離圖的圖像邊緣提取[J].中國(guó)圖象圖形學(xué)報(bào),2014,19(1):62?68.

      [9] 張闖,王婷婷,孫冬嬌,等.基于歐氏距離圖的圖像邊緣檢測(cè)[J].中國(guó)圖象圖形學(xué)報(bào),2013,18(2):176?183.

      [10] ZHANG C, WANG T T, SUN D J, et al. Image edge detection based on the Euclidean distance graph [J]. Journal of image and graphics, 2013, 18(2): 176?183.

      [11] YANG Xiaohui, YAO Xueyan, LI Dengfeng, et al. Adaptive image retrieval based on generalized Gaussian model and LBP [C]// Proceedings 2010 2nd IEEE Symposium on Web Society. [S.l.]: IEEE, 2496?2503.

      [12] HOU Biao, TANG Xu, JIAO Licheng, et al. SAR image retrieval based on Gaussian mixture model classification [C]// Proceedings of 2009 2nd Asian?Pacific Conference on Synthetic Aperture Radar. Xi’an, China: IEEE, 2009: 796?799.

      [13] WEI Xiao. Research on image retrieval algorithm based on Gaussian mixture models clustering [J]. Software guide, 2011, 4(10): 48?50.

      [14] JAIN A K,VAILAYA A. Shape?based retrieval a case study with trademark image database [J]. Pattern recognition, 1998, 31(9): 1369?1390.

      玉林市| 苏尼特左旗| 兴化市| 七台河市| 东乡| 灵石县| 三亚市| 扎囊县| 英超| 于都县| 安吉县| 德清县| 遂宁市| 阿鲁科尔沁旗| 夹江县| 运城市| 嘉祥县| 洪泽县| 灵川县| 弥勒县| 隆子县| 惠东县| 都江堰市| 温宿县| 伽师县| 防城港市| 宾阳县| 丹巴县| 沁水县| 盐亭县| 榆树市| 晋州市| 柳江县| 信阳市| 钦州市| 永清县| 台州市| 云和县| 游戏| 宝坻区| 桃园市|