楊 磊
(安徽財經(jīng)大學(xué) 教務(wù)處,安徽 蚌埠 233000)
實驗室局域網(wǎng)含噪字符易受到環(huán)境等因素的干擾,導(dǎo)致含噪字符的識別能力較差,需要研究含噪字符圖像特征識別模型,結(jié)合模糊相關(guān)性特征檢測方法,進(jìn)行含噪字符圖像識別[1].對含噪字符圖像特征識別是建立在特征提取和模糊度分析基礎(chǔ)上,建立含噪字符圖像特征識別的統(tǒng)計分析模型,采用模糊信息融合方法,進(jìn)行含噪字符圖像局部模糊特征提取和識別[2],相關(guān)的含噪字符圖像特征識別方法研究受到人們的極大關(guān)注.
在傳統(tǒng)方法中,對含噪字符圖像局部模糊特征識別方法主要有子空間特征識別方法,模糊特征檢測方法和區(qū)域分塊信息增強方法等[3].文獻(xiàn)[4]提出空間欠采樣技術(shù)的含噪字符圖像特征識別方法.通過構(gòu)建實驗室局域網(wǎng)含噪字符圖像的空間采樣模型,結(jié)合局域網(wǎng)含噪字符特征分析方法進(jìn)行信息特征分析等.該方法有效提高特征識別能力,但該方法在進(jìn)行含噪字符圖像局部模糊特征識別時精度不高.
針對上述問題,本文提出基于模糊邊緣特征檢測和模板匹配的含噪字符圖像局部模糊特征精準(zhǔn)識別方法.
實驗結(jié)果表明:采用本文方法可以提高含噪字符識別能力,且優(yōu)越性能顯著.
為了實現(xiàn)含噪字符圖像特征識別,首先需要對含噪字符圖像視覺空間進(jìn)行采樣,本文借助大數(shù)據(jù)對其進(jìn)行采樣處理.
假設(shè)含噪字符圖像視覺空間數(shù)據(jù)為?1(i),?2(i),...,?n(i),通過公式(1)獲取含噪字符圖像視覺空間數(shù)據(jù),即:
式(1)中,?代表含噪字符圖像視覺空間基本數(shù)據(jù)量,a,b表示含噪字符圖像視覺空間數(shù)據(jù)的基本特征,A,B表示不同含噪字符圖像視覺空間數(shù)據(jù)的基本特征集合.
在上述獲取的含噪字符圖像視覺空間數(shù)據(jù)后,由于該樣本數(shù)據(jù)量較大,存在一定重復(fù)及噪聲較大的數(shù)據(jù)樣本,需要對該數(shù)據(jù)進(jìn)行有效的清洗,即:
式(2)中,?(k)代表精確的局域網(wǎng)含噪字符圖像視覺空間數(shù)據(jù),g(k)代表局域網(wǎng)含噪字符圖像視覺空間數(shù)據(jù)總集,v(k)代表干擾、重復(fù)的含噪字符圖像視覺空間數(shù)據(jù)集.
在此基礎(chǔ)上,通過構(gòu)建含噪字符圖像的三維可視化特征重建模型[5].結(jié)合含噪字符圖像的局部模糊特征采樣結(jié)果,進(jìn)行含噪字符圖像的模糊特征分析.
假設(shè)含噪字符圖像的邊緣輪廓長度為L=xmax-xmin,含噪字符圖像的分布空間區(qū)域的寬度為W=ymax-ymin,結(jié)合模糊邊緣區(qū)域重構(gòu)方法,進(jìn)行含噪字符圖像的特征重構(gòu)和識別,建立含噪字符圖像的模糊特征塊分配模型[6],得到含噪字符圖像的局部模糊空間分布像素序列為:
其中,m為含噪字符圖像的輪廓曲線分布維數(shù),p代表含噪字符圖像上的一點.結(jié)合模糊信息融合方法,進(jìn)行含噪字符圖像的特征識別[7].基于邊緣輪廓特征檢測方法,構(gòu)建含噪字符圖像的分布式模板匹配函數(shù)為ηm(x,y)∈{-1,0,1},對含噪字符圖像進(jìn)行空間區(qū)域定位,得到圖像分量為:
其中,ψ為含噪字符圖像的局部模糊特征抽樣閾值,且0≤ψ≤1.采用向量量化檢測的方法,獲取含噪字符的量化編碼,得到特征編碼的均值為0,方差為,由此建立含噪字符的特征匹配模型,結(jié)合空間采樣技術(shù)進(jìn)行含噪字符圖像重建和識別[8].
通過模板自動匹配和小波多尺度分解方法,檢測含噪字符圖像的局部模糊特征,建立含噪字符圖像的視空間區(qū)域融合模型[9],得到含噪字符區(qū)域分布的灰度直方圖為:
其中,c為含噪字符圖像像素分布列數(shù),r代表含噪字符圖像像素分布行數(shù),I代表局域網(wǎng)含噪字符圖像的真實灰度值.
提取局域網(wǎng)含噪字符圖像的譜特征量,根據(jù)譜特征量分布進(jìn)行局域網(wǎng)含噪字符局部模糊特征的多維重建,含噪字符軌跡模糊度函數(shù)為:
式(8)中,Δu為含噪字符圖像的全局閾值分割關(guān)聯(lián)像素點,σ為含噪字符圖像灰度差異度特征量.
在上述含噪字符圖像灰度差異度特征量提取后,為了保證后續(xù)識別含噪字符的準(zhǔn)確度,對其特征進(jìn)行融合.將獲取的特征量通過大數(shù)據(jù)技術(shù)進(jìn)行融合.假設(shè)在特征量數(shù)據(jù)中存在多個數(shù)據(jù),其大小值基本相同,為保證特征量的均勻分布,數(shù)據(jù)融合后的結(jié)果為:
式(9)中,G(a)代表融合結(jié)果,R代表圖像局部模糊特征量,?代表數(shù)據(jù)融合介質(zhì),?代表2個特征量相鄰的概率.
在實驗室局域網(wǎng)含噪字符圖像區(qū)域內(nèi),提取實驗室局域網(wǎng)含噪字符圖像的局部關(guān)聯(lián)幀,根據(jù)上述分析,提取含噪字符圖像的局部模糊特征并對其進(jìn)行融合.
構(gòu)建含噪字符模糊區(qū)域視覺圖像的稀疏性特征分割模型,重構(gòu)含噪字符圖像的邊緣輪廓特征分布集,采用模糊邊緣特征識別含噪字符圖像特征,得到含噪字符圖像相似度特征量,含噪字符圖像的邊緣與區(qū)域信息的變分水平集[10]為:
其中,
假設(shè)第k個含噪字符模糊區(qū)域的模糊分布特征向量為:
其中,Ic(y)為含噪字符局部模糊跟蹤像素集,Ac表示含噪字符圖像的尺度信息.根據(jù)灰度特征點重組,對含噪字符的圖像信息進(jìn)行融合,得到信息融合矩陣描述為:
其中,Lxy(x,σ)和Lyy(x,σ)為不同含噪字符特征匹配點的移動尺度.
采用超像素特征融合方法,得到含噪字符像素特征點重構(gòu)輸出為:
其中,p(ωi)為含噪字符圖像的超像素大數(shù)據(jù)集分布維數(shù).
基于GEPSO模型特征匹配方法[11],建立網(wǎng)含噪字符的模板自動匹配模型,采用小波多尺度分解方法,進(jìn)行含噪字符圖像局部區(qū)域重構(gòu)和再檢測,分割圖像活動輪廓并進(jìn)行優(yōu)化.將含噪字符圖像分割成M×N個2×2的子塊Gm,n,得到含噪字符圖像的匹配集為:
充分利用含噪字符圖像字符串的分布進(jìn)行特征匹配,融合圖像邊緣區(qū)域信息.采用大數(shù)據(jù)融合分析方法,進(jìn)行含噪字符識別.建立含噪字符圖像局部模糊特征檢測模型,得到特征分布函數(shù)描述為:
其中,Gnew和Gold分別是含噪字符圖像的分布向量集,進(jìn)行含噪字符圖像的視覺跟蹤和分塊匹配[12],實驗室局域網(wǎng)含噪字符圖像的特征識別輸出為:
其中,ejθF(k1,k2)和ejθG(k1,k2)為含噪字符跟蹤目標(biāo)域的分量,模板匹配大小為N1×N2,局域網(wǎng)含噪字符圖像的標(biāo)準(zhǔn)測試集為:
其中,‖sj‖表示sj中含噪字符圖像相似度.結(jié)合模板匹配方法,檢測和匹配含噪字符特征,建立含噪字符圖像局部模糊特征的分塊辨識模型.
為了驗證本文方法在實現(xiàn)實驗室局域網(wǎng)含噪字符圖像特征識別中的應(yīng)用性能,進(jìn)行仿真實驗分析.
結(jié)合Visual C++和Matlab進(jìn)行仿真實驗,含噪字符圖像采樣數(shù)據(jù)庫來自于網(wǎng)絡(luò)數(shù)據(jù)庫DadaSet,隨機選取了5 000份實驗數(shù)據(jù)進(jìn)行特征識別,其中,訓(xùn)練集樣本為2 000,測試集樣本為1 000份,含噪字符的分布像素強度為120 dB,特征采樣的時間間隔為0.46 s,樣本的幀長度為500,根據(jù)上述參數(shù)設(shè)定,進(jìn)行含噪字符的識別.
通過對比本文方法,文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的含噪字符識別精度、特征匹配的準(zhǔn)確性以及識別用時,驗證本文方法的有效性.
3.3.1 不同方法識別精度分析為了驗證本文方法的可靠性,在相同實驗環(huán)境下對比3種方法對實驗室局域網(wǎng)含噪字符圖像識別精度,對比結(jié)果如表1所示.
表1 不同方法含噪字符圖像識別精度對比Tab.1 Comparison of recognition accuracy of noisy character image by different methods
分析表1中數(shù)據(jù),可以看出,在不同的迭代次數(shù)情況下,不同方法的含噪字符圖像識別精度有所差異.當(dāng)?shù)螖?shù)為100時,本文方法的識別精度為93.4%,文獻(xiàn)[3]方法的識別精度為84.3%,文獻(xiàn)[4]方識別精度為85.6%;當(dāng)?shù)螖?shù)為300時,本文方法的識別精度為98.5%,文獻(xiàn)[3]方法的識別精度為93.6%,文獻(xiàn)[4]方法識別精度為96.5%;可以看出本文方法的最高識別精度可達(dá)98.6%,文獻(xiàn)[3]方法的識別精度最高為94.3%,文獻(xiàn)[4]方法識別精度最高為96.5%,本文方法的識別精度高于其他2種方法.這是由于本文方法采用大數(shù)據(jù)融合分析方法,建立含噪字符圖像局部模糊特征檢測模型等,對含噪字符進(jìn)行識別,進(jìn)而提高了本文方法的識別精度,證明本文方法具有一定的可靠性.
3.3.2 不同方法含噪字符圖像識別效果分析為了驗證本文方法在含噪字符圖像識別效果的優(yōu)勢,采用3種方法對含噪字符圖像進(jìn)行識別用時的對比,實驗結(jié)果如圖1所示.
圖1 不同方法特征匹配準(zhǔn)確度對比Fig.1 Comparison of feature matching accuracy by different methods
分析圖1可以看出,采用3種方法進(jìn)行含噪字符圖像特征匹配的準(zhǔn)確度有所差異.隨著匹配次數(shù)的增加,3種方法的匹配準(zhǔn)確度也隨之提高.當(dāng)匹配次數(shù)為4時,本文方法的準(zhǔn)確度約為87%,文獻(xiàn)[3]方法的準(zhǔn)確度約為72%,文獻(xiàn)[4]方法的準(zhǔn)確度約為65%;當(dāng)匹配次數(shù)為10時,本文方法的準(zhǔn)確度約為98%,文獻(xiàn)[3]方法的準(zhǔn)確度約為90%,文獻(xiàn)[4]方法的準(zhǔn)確度約為85%.可以看出本文方法在進(jìn)行含噪字符圖像特征匹配的準(zhǔn)確度最高,這是由于本文方法對含噪字符圖像字符串的分布進(jìn)行特征匹配,融合圖像邊緣區(qū)域信息等,實現(xiàn)了含噪字符圖像的特征匹配,從而提高了本文方法的特征匹配能力.
3.3.3 不同方法識別用時分析為了驗證本文所提方法的可行性,實驗對比3種方法在含噪字符圖像識別的用時,實驗結(jié)果如圖2所示.
圖2 不同方法含噪字符識別用時對比Fig.2 Time comparison of noisy character reagnition by different methods
分析圖2可以看出,在相同的含噪字符規(guī)模下,3種方法的識別用時不相同.其中,本文方法的識別用時較低,其次為文獻(xiàn)[3]方法和文獻(xiàn)[4]方法.本文方法的識別用時最大約為18 s,文獻(xiàn)[3]方法的識別用時最大約為50 s;文獻(xiàn)[4]方法的識別用時最大約為69 s.這是由于所提方法對含噪字符圖像局部模糊區(qū)域像素特征點進(jìn)行重構(gòu),構(gòu)建含噪字符圖像特征識別模型,通過識別模型直接對其進(jìn)行識別,進(jìn)而縮短了識別的用時,驗證了本文方法的工作效率較高,具有一定的可行性.
本文提出的基于大數(shù)據(jù)的實驗室局域網(wǎng)含噪字符識別方法研究,通過分析實驗室局域網(wǎng)含噪字符圖像的特征,將此特征進(jìn)行重建、提取等,實現(xiàn)了基于大數(shù)據(jù)的含噪字符的識別.實驗結(jié)果表明,采用本文多提方法對含噪字符進(jìn)行識別的精度較高,特征匹配的準(zhǔn)確度最高可達(dá)98%,在識別過程中識別用時均小于20 s,在現(xiàn)實的應(yīng)用中具有一定意義.