姜琴
摘要:在對數(shù)字樣本進行篩選的過程中,需要使用到手寫體數(shù)字識別的過程,用聚類源的形式來對篩選的結果進行歸納,再經(jīng)過對模糊關系矩陣的構建,就能夠開始時模糊聚類了。實踐證明,該方法具有非常搞得有效性,能夠?qū)ν饨绲母蓴_有很強的抵制作用,不僅準確率和識別率都有所提高,而且還消除了傳統(tǒng)算法下單因子因素帶來的局限性的影響,具有非常高的實踐意義。
關鍵詞:模糊聚類;算法;手寫體;數(shù)字識別
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)04-0175-02
在針對模式識別的研究領域中,無約束手寫體識別一直是長久以來一直研究的一個話題,在傳統(tǒng)的形式下,手寫數(shù)字能夠提供的樣本庫太少,一直成為了研究突破的一個瓶頸,運用無約束手寫體數(shù)字識別一直是評判算法質(zhì)量及效果的一個非常具有影響力的檢測方式。國內(nèi)外的科研人員對這類問題開展可研究工作,也有著不同的算法建議。不過以最終結果來看,被廣泛應用的識別算法有統(tǒng)計法、神經(jīng)網(wǎng)絡法、聚類分析法。這些算法具體來說,有Bagging算法、Adaboost算法、誤差反向傳播算法、支持向量機。自組織映射和徑向基函數(shù)。經(jīng)過實踐證明,這些算法在實踐過程中給用戶帶來了完美的影響,具有非常高質(zhì)量的識別效果。然而,這些算法也存在這局限性,如果在其他領域例如對支票、統(tǒng)計報表、銀行票據(jù)等文件的識別當中,它們的質(zhì)量和精確率就很難得到保證,難以完成識別目的。
1 識別系統(tǒng)的構建
模糊聚類是目前采用率最高的一種的一種手寫體識別方法,但是在實踐過程中,也有著自己的優(yōu)勢和局限,優(yōu)勢就是它的模糊性和容錯率非常高,對識別質(zhì)量有一定的保障,但是它的劣勢也比較突出,在實踐應用中出現(xiàn)了下列一些問題。例如,第一,在對模糊關系矩陣進行識別的過程中,具有難確定的基本特點。第二,模糊聚類在識別過程中,其識別對象往往異常龐大,這就造成了在模糊關系矩陣當中,存在的階數(shù)較高,導致了其識別過程選喲非常高的計算量。針對這一局限性,一般在模糊聚類的手寫體數(shù)字識別過程中,會采用BP神經(jīng)網(wǎng)絡來進行輔助識別,它的原理是在模糊聚類識別過程中,BP神經(jīng)網(wǎng)絡協(xié)助其對特征因素也進行篩選,有些不符合的條件被排除開外,降低了計算幅度,這就提高了計算速度,對聚類的效果和質(zhì)量有了極大的保證。之所以會取得如此明顯的變化,這是因為BP神經(jīng)網(wǎng)絡自身就有著非常高的對外界的適應能力,在對樣本進行篩選的練習中能夠?qū)颖具M行分析,最終得出相應的規(guī)律,如果識別因素具有交叉性,那么BP神經(jīng)網(wǎng)絡模式下的模糊聚類識別就具有非常高的篩選作用,其提供的數(shù)據(jù)能夠很好地指導以后的模糊聚類識別。一般情況下,高效率的模糊聚類都是與BP神經(jīng)網(wǎng)絡進行有效的聯(lián)系,其原理就是,第一步:先給出一定的數(shù)字樣本,BP網(wǎng)絡對給出的樣本進行訓練。第二步,模糊聚類分析方法的使用倆完成對矢量數(shù)據(jù)的歸類工作。通過這兩步,可以完成數(shù)字識別的具體工作。識別系統(tǒng)流程是先輸出樣本,再對樣本進行預處理,BP神經(jīng)網(wǎng)絡在處理過程中提取這些樣本的特征,然后在其學習下提取標準特征完成特征篩選工作。這些標準特征完成模糊關系矩陣之后,進行模糊聚類,最后進行識別輸出。
2 模糊聚類條件下的手寫體數(shù)字識別方法
1)預處理
由于識別方法的不同,預處理的項目和要求也會不盡相同,具有一定的差異性,在設計識別系統(tǒng)的過程中,預處理的過程一共由三部分組成,依次是二值化、歸一化、平滑。第一步,在識別之前,要對樣本的整體閾值進行確定,因此可以采用閾值法來確定閾值,閾值法是在灰度直方圖的基礎上建立起來的。第二步,需要對數(shù)字或文字的尺寸進行規(guī)定,規(guī)定的方法主要是采用外框歸一化,按照一定的比例,將數(shù)字的外界邊框縮小或者是放大,以滿足文字的規(guī)定尺寸。第三步,也就是平滑的過程,也就是對二值數(shù)字點進行掃描,一般都采用三乘三的輔助矩形進行掃描工作。平滑過程還需要做到一步工作,就是將矩陣最重型的被平滑的像素X0從“0”變成“1”,或者是從“1”變成“0”。這一工作主要是根據(jù)輔助矩陣中的像素0,1的分布來完成的。
2)特征提取
通過模糊聚類與BP神經(jīng)網(wǎng)絡的結合來完成特征提取,就首先需要進行定義并提取出6種基本特征,依次為端點、分店、交叉點、直線、弧和圓。采用一定的結構特征組合。如果規(guī)定起始點只有一種,那就是端點,線段有兩種,那就是直線和??;終點有三種,那就是端點、分點和交叉點。按照這種邏輯對線段的結構特征進行分析,可以發(fā)現(xiàn)結構特征具有6各組合,以此是第一種,端點加直線加端點;第二種,端點加弧加端點;第三種。端點加直線加交叉點;第四種是端點加弧加交叉點;第五種低端點加直線加分點。第六種是端點節(jié)哀弧加分點。這時候我們需要增加一個定義,那就是V,它來對這些組合進行表示,它包括{0,1,-1,2,-2,3,-3},當v是零的情況下表示這個區(qū)域內(nèi)沒有圖像信息。下一步,我們把圖像分為三乘三的區(qū)域,對特征矢量進行構造S1,S1包含著九個不同的特征向量,他們的端點位置特征都具有不同性,端點的位置特征有這幾種情況{0,1,-1,2,-2,3,-3}。這就表示在不同的位置具有一條與其位置相似的一條曲線。直線和弧在交叉點的指向上具有四種不同的方向,依次是上下左右四種。
3)BP識別器特征篩選
BP神經(jīng)網(wǎng)絡作為一種學習算法,具有反向傳播的特性,它主要被應用于前向多層神經(jīng)網(wǎng)絡。通過對其特征的選取的過程進行總結會得出結論,造成這些特征的因素很可能是其中存在著一定的相互交叉現(xiàn)象。因為BP網(wǎng)絡在多層的情況之下會具有一些特點例如自動學習的特性、容錯性、分類能力較強并能夠并行處理,將它作用于對手寫體數(shù)字識別訓練具有非常高的現(xiàn)實意義。在本文當中,BP網(wǎng)絡一共有三層,輸入層具有十五個輸出點,與特征矢量的十五個分量一一對應。它的輸出層也具有十個輸出點。在BP網(wǎng)絡對數(shù)字樣本進行訓練之后,可以將學習的結果歸納入聚類源,通過公式Y=f(x)=(1-e-x)-1來對BP神經(jīng)網(wǎng)絡進行訓練,這個公式是輸入輸出的轉化公式,具有一定的實踐意義。另一方面,設置N是每次修正權值的步長,權值的取值要符合一定的標準,必須得經(jīng)過嚴格的控制,
當取值太小或者取值太大都會影響結論的正確性。如果取值太大的話,在網(wǎng)絡的輸出過程中會出現(xiàn)震蕩現(xiàn)象,在最終收斂的過程中會出現(xiàn)阻礙作用。如果取值太小的化,會導致訓練的時間太長,如果當前網(wǎng)絡狀態(tài)的變化在誤差曲面的平坦區(qū)域內(nèi),可能會導致訓練的時間更加長。
4)模糊聚類分析
模糊聚類分析主要由兩個階段組成一個是構造模糊相似矩陣,另一個則是聚變。在構造模糊相似矩陣過程中,設論域U={u1,u2,u3……un},其中有n個待識別的手寫體數(shù)字,這些數(shù)字每一個都有不同的向量值邊式與其一一對應,當ui={ui1,ui2,ui3……uim}(i=1,2,3,……n)。通過對這些取值進行標準化存放,可以得到一個矩陣,這個矩陣有n行m列。通過數(shù)量積法對矩陣標準化可以得到模糊相似矩陣R(rij)nxm,其中可以得出
當相似矩陣構造完成后就是聚類,可以應用直接聚類法,通過從模糊相似矩陣出發(fā),可以求出聚類圖。第一步,是構建相似類,第二步是得出等價分類,第三步將所有的樣本歸為一類。
3 結果分析
通過對某印刷體的測試片段進行提取,按照以上的方式來對每一個手寫體數(shù)字進行特征提取特征向量,可以得出U={u1,u2,u3,u4,……,u115}的論域,論域中包含著一百一十五各待識別手寫體數(shù)字,這些數(shù)字中,它們每一個的特征矢量都是十五位,將這些待識別的手寫體數(shù)字作為輸入樣本,將它通過BP神經(jīng)網(wǎng)絡學習之后,可以得到一個十維的輸出向量,將這些向量中的每一個數(shù)字的特征矢量進行模糊聚類分析。如下圖所示,利用該BP神經(jīng)網(wǎng)絡,我們將n的初始值設為0.15,為了達到分析識別目的,需要對初始值的值進行不斷的調(diào)減,讓初始值逐漸變小,而調(diào)減的方法是利用退火函數(shù)n(1)=Cx(1-t/tm)、通過調(diào)減之后,可以將定勢態(tài)因子進行調(diào)整,將其定值為0.175,BP神經(jīng)網(wǎng)絡學習結束的條件是網(wǎng)絡的均方根ERMS=0.1。提供參數(shù)M=50.0,可以得出標準模式相似矩陣,通過模糊聚類之后,可以得出三十九種分類結果。當取值為0.135時,分類效果最好。
4 總結
通過實驗結果,可以發(fā)現(xiàn)模糊聚類條件下的手寫體數(shù)字識別具有非常高的正確率,能夠達到百分之九十八,識誤率可以達到百分之一點六,拒誤率是百分之一點七,具有百分之九十六的可靠程度。因此,我們可以得出結論,利用模糊聚類來對手寫體數(shù)字識別結合BP神經(jīng)網(wǎng)絡能更加的增加識別的有效性,與傳統(tǒng)的統(tǒng)計識別比起來,可靠性、正確率有了明顯的提高。
參考文獻:
[1] 葉佩,江濤. 基于BP特征篩選的模糊聚類手寫體數(shù)字識別[J]. 武漢理工大學學報,2007(6):128-130.
[2] 洪沛霖,張佑生,邢燕. 基于改進模擬退火算法的手寫體數(shù)字識別[J]. 計算機技術與發(fā)展,2007(9):15-17+20.
[3] 柳回春,馬樹元,吳平東,等. 基于結構特征的手寫體數(shù)字識別算法[J]. 計算機工程,2002(11):28-29.
[4] 黃心曄,王茂祥,富煜清,等. 基于結構分析的手寫體數(shù)字識別算法[J]. 電子工程師,1999(11):23-25.
[5] 陳軍勝. 組合結構特征的自由手寫體數(shù)字識別算法研究[J]. 計算機工程與應用,2013(5):179-184+194.
[6] 王松,蘇輝,夏紹瑋. 無約束手寫體數(shù)字識別的預處理算法[J]. 模式識別與人工智能,1997(3):243-250.
[7] 盛積德,常勝江,陳戍,等. 用于手寫體數(shù)字識別的視覺與神經(jīng)網(wǎng)絡混合算法[J]. 光電子·激光,2001(12):1280-1283.
[8] 李云峰,胡文平. SVM多類分類算法及其在手寫體數(shù)字識別中的應用[J]. 物流工程與管理,2012(7):131-134.