潘春光
摘 要: 為了提高體育商標(biāo)識(shí)別的正確率,針對(duì)傳統(tǒng)模型識(shí)別效果差的不足,提出基于神經(jīng)網(wǎng)絡(luò)的體育商標(biāo)識(shí)別模型。采用Canny算子對(duì)體育商標(biāo)的邊緣進(jìn)行檢測(cè),提取不同類型特征,然后采用神經(jīng)網(wǎng)絡(luò)對(duì)每一種特征分別建立體育商標(biāo)識(shí)別模型,得到相應(yīng)的識(shí)別結(jié)果,采用支持向量機(jī)確定每一種模型識(shí)別結(jié)果的權(quán)值,根據(jù)權(quán)值得到體育商標(biāo)的最終識(shí)別結(jié)果。仿真對(duì)比實(shí)驗(yàn)結(jié)果表明,該模型的體育商標(biāo)識(shí)別正確率達(dá)到95%以上,體育商標(biāo)的識(shí)別率要遠(yuǎn)遠(yuǎn)低于其他體育商標(biāo)的識(shí)別模型,同時(shí)滿足體育商標(biāo)識(shí)別的實(shí)時(shí)性要求。
關(guān)鍵詞: 體育商標(biāo); 識(shí)別模型; 神經(jīng)網(wǎng)絡(luò); 廣告牌
中圖分類號(hào): TN711?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)01?0049?04
Abstract: In order to improve the accuracy of the sports trademark recognition and remedy the deficiency of poor recognition effect of the traditional model, a sports trademark recognition model based on neural network is proposed. The Canny operator is used to detect the edge of the sports trademark, and extract the different type features. The neural network is adopted to establish the sports trademark recognition model for each feature, and obtain the corresponding recognition results. The support vector machine is employed to determine the weight of the recognition result of each model. The final recognition result of the sports trademark was obtained according to the weight. The experimental results of simulation contrast show that the accuracy of the sports trademark recognition model can reach up to 95%, the sports trademark recognition rate is much better than that of other sports trademark recognition models, and the model can meet the real?time requirement of the sports trademark recognition.
Keywords: sports trademark; identification model; neural network; billboard
0 引 言
隨著我國(guó)體育事業(yè)的迅速發(fā)展,體育產(chǎn)品越來(lái)越多,體育競(jìng)賽中的體育產(chǎn)品廣告增多,競(jìng)爭(zhēng)日益激烈[1]。商標(biāo)是識(shí)別產(chǎn)品的重要標(biāo)志,因此,如何準(zhǔn)確地識(shí)別體育產(chǎn)品商標(biāo)具有十分重要的研究意義[2]。
針對(duì)體育產(chǎn)品商標(biāo)的識(shí)別問(wèn)題,專家們進(jìn)行了相關(guān)研究,涌現(xiàn)了一些體育產(chǎn)品商標(biāo)的識(shí)別模型[2]。最初采用人工方式對(duì)體育產(chǎn)品商標(biāo)進(jìn)行識(shí)別,該方法簡(jiǎn)單,但耗時(shí)長(zhǎng)、無(wú)法自動(dòng)識(shí)別,對(duì)于多樣的體育商標(biāo)識(shí)別效率低[3]。隨著信息處理技術(shù)應(yīng)用的不斷深入,有學(xué)者提出一些體育產(chǎn)品商標(biāo)自動(dòng)識(shí)別模型,將體育產(chǎn)品商標(biāo)看作是多種類型的識(shí)別問(wèn)題,通過(guò)一定的規(guī)則將體育產(chǎn)品商標(biāo)歸劃到相應(yīng)的類別中[4]。由于是多分類問(wèn)題,必須建立體育產(chǎn)品商標(biāo)的多分類器,當(dāng)前可以建立多分類器的算法有神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)等[5?7],在所有算法中,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度最快,可以滿足實(shí)時(shí)性要求,在體育產(chǎn)品商標(biāo)識(shí)別中應(yīng)用最廣[8]。體育產(chǎn)品商標(biāo)的特征可以描述體育產(chǎn)品商標(biāo)的特點(diǎn),當(dāng)前特征有顏色、紋理、SIFT特征等[9],受到運(yùn)動(dòng)員以及其他物體對(duì)商標(biāo)遮擋的影響,單一特征僅能描述體育商標(biāo)某一方面的信息,識(shí)別正確率難以滿足體育商標(biāo)識(shí)別的實(shí)際要求。近年來(lái),有學(xué)者提出了多種特征的體育商標(biāo)識(shí)別模型,分別對(duì)單一特征建立體育商標(biāo)識(shí)別模型,然后通過(guò)加權(quán)獲得體育商標(biāo)的最終識(shí)別結(jié)果,但權(quán)值均采用人工方式確定,具有盲目性,權(quán)值無(wú)法描述特征對(duì)體育商標(biāo)識(shí)別結(jié)果的貢獻(xiàn),因此如何進(jìn)行體育商標(biāo)的精確識(shí)別仍然面臨巨大的挑戰(zhàn)。
為了提高體育商標(biāo)識(shí)別的正確率,提出一種基于神經(jīng)網(wǎng)絡(luò)的體育商標(biāo)識(shí)別模型,結(jié)果表明,本文模型的體育商標(biāo)識(shí)別正確率達(dá)95%以上,識(shí)別結(jié)果要優(yōu)于其他體育商標(biāo)識(shí)別模型。
1 相關(guān)理論
1.1 Canny算子
1.3 神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)能夠以任意精度逼近函數(shù),學(xué)習(xí)過(guò)程分為兩階段:信號(hào)正向傳遞、誤差反向傳遞。第一階段信號(hào)從輸入層經(jīng)過(guò)隱含層到達(dá)輸出層,如果輸出誤差不符合實(shí)際要求,便進(jìn)入第二階段。第二階段信號(hào)的誤差從隱含層向輸入層傳遞,并根據(jù)信號(hào)的誤差不斷修正各神經(jīng)元的權(quán)值,直到誤差滿足實(shí)際要求為止。
基于神經(jīng)網(wǎng)絡(luò)的體育商標(biāo)識(shí)別模型的工作步驟為:
(1) 收集體育商標(biāo)圖像,并對(duì)其進(jìn)行灰度化處理。
(2) 采用Canny算子對(duì)體育商標(biāo)圖像中的目標(biāo)邊緣進(jìn)行檢測(cè),提取商標(biāo)輪廓。
(3) 分別提取體育商標(biāo)的顏色、紋理以及SIFT特征,并采用式(7)對(duì)它們進(jìn)行歸一化處理:
(4) 設(shè)和分別為輸入和輸出神經(jīng)元的數(shù)量,根據(jù)式(8)確定神經(jīng)網(wǎng)絡(luò)的隱含層神經(jīng)元數(shù)量:
(5) 對(duì)神經(jīng)網(wǎng)絡(luò)反復(fù)訓(xùn)練,直到訓(xùn)練誤差達(dá)到實(shí)際要求為止。
(6) 利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對(duì)體育商標(biāo)進(jìn)行識(shí)別,輸出相應(yīng)的識(shí)別結(jié)果。
1.4 支持向量機(jī)
2 本文的體育商標(biāo)識(shí)別模型
本文體育商標(biāo)識(shí)別模型綜合考慮特征間的互補(bǔ)性,避免單一特征信息量少的缺陷,同時(shí)合理確定權(quán)值,解決人工方式確定權(quán)值的不足,具體工作步驟為:
(1) 采用Canny算子檢測(cè)體育商標(biāo)邊緣、提取特征;
(2) 采用神經(jīng)網(wǎng)絡(luò)的體育商標(biāo)識(shí)別模型;
(3) 最后采用支持向量機(jī)估計(jì)模型的權(quán)值,輸出體育商標(biāo)的識(shí)別結(jié)果。
本文模型的框架如圖2所示。
3 實(shí)驗(yàn)結(jié)果及分析
3.1 體育商標(biāo)樣本
選擇體育產(chǎn)品商標(biāo)類型為:LG,BRIDGESTONE,TISSOT,VISA和ADIDAS,它們的類別標(biāo)簽分別采用1~5進(jìn)行描述,樣本數(shù)量的分布情況見表1。選擇權(quán)值人工方式確定多特征權(quán)值的識(shí)別模型進(jìn)行對(duì)比實(shí)驗(yàn)。
3.2 結(jié)果與分析
3.2.1 單一特征的識(shí)別正確率
采用BP神經(jīng)網(wǎng)絡(luò)分別對(duì)顏色特征、紋理特征以及SIFT特征分別建立體育商標(biāo)識(shí)別模型,得到的識(shí)別正確率見表2。從表2可以看出,單一特征的體育商標(biāo)識(shí)別正確率均低于85%,不能滿足體育商標(biāo)識(shí)別的實(shí)際應(yīng)用要求,這主要是由于它們只能提供片面信息,識(shí)別結(jié)果沒有太多的實(shí)際應(yīng)用價(jià)值,同時(shí)也證明了本文采用多特征建立體育商標(biāo)識(shí)別模型的思想是正確的。
3.2.2 估計(jì)單特征的權(quán)值
將單一特征的體育商標(biāo)識(shí)別結(jié)果輸入到支持向量機(jī)中進(jìn)行學(xué)習(xí)和回歸,得到單一特征的權(quán)值見表3。從表3可以看出,在所有特征中,SIFT特征的權(quán)值最大,其次是顏色特征,最小為紋理特征,說(shuō)明SIFT特征對(duì)體育商標(biāo)識(shí)別結(jié)果的貢獻(xiàn)最大,這與實(shí)際情況相符。
3.2.3 與對(duì)比模型結(jié)果對(duì)比
本文模型與對(duì)比模型的體育商標(biāo)識(shí)別正確率和識(shí)別時(shí)間分別如圖3和圖4所示。從圖3和圖4可知,相對(duì)于對(duì)比模型,本文模型的體育商標(biāo)識(shí)別正確率大約提高了5%,而且識(shí)別時(shí)間也大大減少,符合體育商標(biāo)識(shí)別的實(shí)時(shí)性要求,這主要是由于本文模型采用支持向量機(jī)對(duì)單一特征權(quán)值進(jìn)行合理確定,建立了更加合理的體育商標(biāo)識(shí)別模型,能夠準(zhǔn)確地描述體育商標(biāo)類別與特征之間的變化關(guān)系,具有更高的實(shí)際應(yīng)用價(jià)值。
4 結(jié) 論
體育商標(biāo)識(shí)別非常復(fù)雜,傳統(tǒng)模型無(wú)法準(zhǔn)確描述其變化特點(diǎn),本文利用支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),提出基于神經(jīng)網(wǎng)絡(luò)的體育商標(biāo)識(shí)別模型,首先采用神經(jīng)網(wǎng)絡(luò)根據(jù)單一特征建立相應(yīng)的體育商標(biāo)識(shí)別模型,然后采用支持向量機(jī)確定它們的權(quán)值,并通過(guò)對(duì)比實(shí)驗(yàn)對(duì)其性能進(jìn)行分析。結(jié)果表明,本文模型的體育商標(biāo)識(shí)別效率大幅度提高,識(shí)別正確率可以滿足體育商標(biāo)識(shí)別的應(yīng)用要求。
在實(shí)驗(yàn)過(guò)程中發(fā)現(xiàn)一些問(wèn)題有待解決,如支持向量機(jī)的參數(shù)設(shè)置影響識(shí)別結(jié)果,今后將解決支持向量機(jī)參數(shù)的設(shè)置問(wèn)題,產(chǎn)生更加合理的權(quán)值,以獲得更優(yōu)的體育商標(biāo)識(shí)別效果。
參考文獻(xiàn)
[1] PELISSON F, HALL D, RIFF O, et al. Brand identification using Gaussian derivative histograms [J]. Machine vision and applications, 2004, 16(1): 41?46.
[2] WATVE A, SURAL S. Soccer video processing for the detection of advertisement billboards [J]. Pattern recognition letters, 2008, 29(7): 994?1006.
[3] PHAN R, ANDROUTSOS D. Content?based retrieval of logo and trademarks in unconstrained color image databases using color edge gradient co?occurrence histograms [J]. Computer vision and image understanding, 2010, 114(1): 66?84.
[4] LIU W Y, SUN X M, WANG L. Trademark contour extraction based on improved snake model [J]. Journal of computational information systems, 2009, 5(3): 1253?1260.
[5] LI D D, KWONG C P. Understanding latent semantic inde?xing: a topological structure analysis using Q?analysis [J]. Journal of the American Society for Information Science and Technology, 2010, 61(3): 592?608.
[6] HALIN A A, RAJESWARI M, RAMACHANDRAM D. Shot view classification for playfield?based sports video [C]// Proceedings of 2009 IEEE International Conference on Signal and Image Processing Applications. Kuala Lumpur: IEEE, 2009: 410?414.
[7] 王三虎,姚望舒,凌興宏.基于SIFT和角點(diǎn)特征的商標(biāo)檢索算法[J].計(jì)算機(jī)應(yīng)用,2011,31(7):1841?1843.
[8] 卜江,老松楊,白亮,等.一種體育商標(biāo)中廣告牌商標(biāo)的實(shí)時(shí)識(shí)別算法[J].自動(dòng)化學(xué)報(bào),2011,37(4):418?426.
[9] 孫林,吳相林,周莉,等.對(duì)扭轉(zhuǎn)魯棒的SIFT圖像匹配在商標(biāo)識(shí)別中的應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32(4):1406?1410.
[10] 林傳力,趙宇明.基于SIFT特征的商標(biāo)檢索算法[J].計(jì)算機(jī)工程,2008,34(23):275?277.