馮文革 李琳 雷軍麗
摘要:目前,基于神經(jīng)模擬網(wǎng)絡(luò)應(yīng)用技術(shù)方案的辨識匹配算法層出不窮,其已經(jīng)成為各行各業(yè)廣泛應(yīng)用的數(shù)字化技術(shù)之一。在針對手工書寫體數(shù)字進行辨識匹配的過程中,相關(guān)應(yīng)用算法主要以反向傳播神經(jīng)模擬網(wǎng)絡(luò)類型為主。然而,該網(wǎng)絡(luò)類型本身訓(xùn)練時間相對較長,同時有可能出現(xiàn)局部最小的弊端。為避免此類問題影響實際辨識匹配效果,需要基于神經(jīng)模擬網(wǎng)絡(luò)進一步探索相關(guān)應(yīng)用算法,使手工書寫體數(shù)字能夠得到高效率、高質(zhì)量辨識匹配。本文主要針對基于神經(jīng)模擬網(wǎng)絡(luò)的手工書寫體數(shù)字辨識匹配算法設(shè)計進行深入研究,以供參考。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);手寫體數(shù)字;識別算法
數(shù)字辨識匹配算法當前應(yīng)用范圍較廣,在各種信息化平臺中均存在基礎(chǔ)需求。通過結(jié)合神經(jīng)模擬網(wǎng)絡(luò)解決方案,能夠快速對手工書寫體數(shù)字進行辨識匹配,有效降低錯誤率,增強工作效率。通過對神經(jīng)模擬網(wǎng)絡(luò)手工書寫體數(shù)字辨識匹配算法進行分析,能夠明確其主要概念與設(shè)計細節(jié),有利于強化整體應(yīng)用效果,對未來進一步開展手工書寫體數(shù)字辨識匹配具有正面影響意義。
1 神經(jīng)模擬網(wǎng)絡(luò)與反向傳播辨識匹配應(yīng)用算法基礎(chǔ)概念簡述
1.1神經(jīng)模擬網(wǎng)絡(luò)
神經(jīng)模擬網(wǎng)絡(luò)又被稱作人工神經(jīng)模擬網(wǎng)絡(luò)類型,即ANN。其自上世紀八十年代開始出現(xiàn)研究熱潮,主要針對信息處理角度進行探究。ANN對信息內(nèi)容的處理方式主要通過抽象人腦運轉(zhuǎn)邏輯、建立基礎(chǔ)模型的措施完成,其可以將多種主要連接方案整合為主體網(wǎng)絡(luò),進而達到高效率應(yīng)用的目標。ANN在工程學(xué)界被稱作類神經(jīng)模擬網(wǎng)絡(luò)的一種,主要代表運算應(yīng)用模型方案,通過海量的處理節(jié)點并聯(lián)而成,與人類大腦的神經(jīng)模擬元存在一定程度的相似性[1]。常規(guī)情況下,處理節(jié)點自身能夠代表特定條件的輸出應(yīng)用函數(shù),即激勵函數(shù)。兩個節(jié)點之間建立連接關(guān)系即可代表對單一連接用信號的加權(quán)數(shù)據(jù),即權(quán)重。這一結(jié)構(gòu)能夠組成ANN記憶,最終為輸出內(nèi)容提供基礎(chǔ)處理條件。網(wǎng)絡(luò)本身權(quán)重數(shù)據(jù)與激勵函數(shù)若存在差異,則邏輯策略也會出現(xiàn)差異。因此,神經(jīng)模擬網(wǎng)絡(luò)的算法具有多樣化應(yīng)用特征。
1.2反向傳播辨識匹配算法
反向傳播辨識匹配算法屬于經(jīng)典手工書寫體數(shù)字辨識匹配解決方案,其具有前向應(yīng)用特征,主要包含三個基礎(chǔ)層次,即輸入、隱含、輸出。通常情況下,該網(wǎng)絡(luò)隱含層可以設(shè)置為單層或多層兩種,各層需要由單一或多個節(jié)點組成,同層節(jié)點之內(nèi)不允許建立連接,層與層之間的節(jié)點需要保證全連接狀態(tài)。反向傳播神經(jīng)模擬網(wǎng)絡(luò)的應(yīng)用核心便是反向傳播算法,這一算法由正向傳遞與誤差反向傳播組成。在正向傳播過程中,輸入的信息內(nèi)容需要從輸入?yún)^(qū)域、隱含層逐步計算,最終輸入至輸出層面。但是,其應(yīng)用階段受到基本原理的限制,經(jīng)常需要消耗大量時間,同時有可能陷入局部最小值狀態(tài)。因此,需要基于全新改進版神經(jīng)模擬網(wǎng)絡(luò)方案,對手工書寫體數(shù)字的辨識匹配算法進行革新處理,使其能夠擺脫原有反向傳播網(wǎng)絡(luò)限制,達到理想優(yōu)化目標,進一步提高整體辨識匹配效率與質(zhì)量。
2 基于神經(jīng)模擬網(wǎng)絡(luò)方案設(shè)計匹配算法研究
2.1初始階段化轉(zhuǎn)變種族群落內(nèi)容
在改進神經(jīng)模擬網(wǎng)絡(luò)手寫數(shù)字辨識匹配算法的過程中,需要首先處理種族群落初始階段化轉(zhuǎn)變模塊。常規(guī)情況下,針對不存在先驗知識內(nèi)容的優(yōu)化性問題,經(jīng)典遺傳ANN算法主要利用隨機方式處理產(chǎn)生階段。這種方式雖然效率較高,但會導(dǎo)致完成初始階段化轉(zhuǎn)變的群體出現(xiàn)一定程度的盲目特性,同時也不利于篩選具有代表特征的群體。因此,在改進過程中需要利用正交設(shè)計方式,對種族群落進行科學(xué)初始階段化轉(zhuǎn)變。利用此類方法初始階段化轉(zhuǎn)變的群體能夠有效代表所有可能性組合,同時也可以提高數(shù)值的優(yōu)化特性,使其搜索效率得到顯著提升[2]。通過應(yīng)用正交方式初始階段化轉(zhuǎn)變?nèi)后w,還可以使初始種族群落內(nèi)容具有高魯棒性與高統(tǒng)計合理性,有利于后續(xù)進一步展開辨識匹配操作。
2.1.1構(gòu)建正交設(shè)計矩陣類型
常規(guī)情況下,正交矩陣的規(guī)劃措施較為豐富,為確保后續(xù)手工書寫體數(shù)字能夠得到高效率、高質(zhì)量辨識匹配,本次改進應(yīng)當重視設(shè)計方法的計算便捷特性。通過將Q設(shè)置為基因變量變化水平數(shù),N設(shè)置為基因個數(shù),可以總結(jié)正交設(shè)計矩陣為 ,同時 。在這一矩陣前提下,針對正交設(shè)計的矩陣基本列進行構(gòu)造處理時,基礎(chǔ)算法如下:
For k=1 to J do
Begin
For i=1 to QJ do
mod Q
End
在構(gòu)造非基本列的過程中,其基礎(chǔ)算法如下:
For k=2 to J do
Begin
For s=1 to j-1 do
Or t=1 to Q-1 do
End
在構(gòu)建完成后,需要對ai,j進行+1處理,使l≤i≤M,l≤j≤N。
2.1.2開始生成初始階段種族群落
在完成種族群落的初始階段化轉(zhuǎn)變操作后,由于無法明確反向傳播網(wǎng)絡(luò)本身所具有的權(quán)重數(shù)據(jù)與閾值數(shù)據(jù),同時也無法了解全局最小信息。因此,初始種族群落的實際染色體內(nèi)容將會呈現(xiàn)均勻分布狀態(tài),其在可行解的空間內(nèi)具有一定程度的合理性。通過將xi設(shè)定為第i個基礎(chǔ)因素,即可使單一染色體能夠?qū)?yīng)N個基礎(chǔ)因素。這些因素本身存在連續(xù)性特征與變化性特征,因此必須將各個因素進行離散化轉(zhuǎn)變,使其能夠成為有限個數(shù)量值。在實際執(zhí)行階段,需要將xi的區(qū)間[l,u]分割為Q個基礎(chǔ)水平,進而獲得初始種族群落,即 。Ti,j本身屬于初始種族群落矩陣內(nèi)T元素的實際數(shù)值,而δ為實際數(shù)據(jù)較低的隨機數(shù)字,常規(guī)情況下需要保證 。針對手寫數(shù)字辨識匹配應(yīng)用測試樣品進行訓(xùn)練的反向傳播網(wǎng)絡(luò)類型,其需要大量的訓(xùn)練網(wǎng)絡(luò)權(quán)重數(shù)據(jù)與閾值數(shù)據(jù)。在這種情況下,N的數(shù)值會存在過大問題,最終導(dǎo)致M的數(shù)據(jù)增大。這種規(guī)模龐大的矩陣作為初始應(yīng)用種族群落會嚴重消耗存儲空間,同時也會增加算法進行迭代的總時長[3]。因此,需要從T中利用隨機處理方式選擇n個具有不同行為的個體元素作為初始應(yīng)用種族群落,確保后續(xù)能夠達到理想辨識匹配目標。
2.2針對父系應(yīng)用個體元素進行篩選
篩選父系應(yīng)用個體元素的過程中,應(yīng)用賭輪盤處理方式進行操作容易導(dǎo)致神經(jīng)模擬網(wǎng)絡(luò)優(yōu)化出現(xiàn)收斂過快的負面問題。因此,在改進算法中為確保群體多樣性能夠符合需求,需要盡可能減少算法的實際收斂速度,避免其出現(xiàn)過快弊端。在選擇階段,針對低于平均適應(yīng)度的個體元素需要進行淘汰處理。被淘汰的個體元素可以從T內(nèi)部隨機選擇單行作為新型個體元素,同時提高δ的實際變化范圍。為確保種族群落能夠達到優(yōu)秀的多樣性,需要在低于平均適應(yīng)度個體元素數(shù)量低于1/4種族群落整體數(shù)量時,采用保持處理措施,使其數(shù)量能夠穩(wěn)定在該層次,實現(xiàn)最佳處理效果。
3 算法應(yīng)用案例方針分析
在針對改進算法進行測試的過程中,主要采用USPS手寫類型數(shù)字應(yīng)用測試樣品作為基礎(chǔ)實驗應(yīng)用數(shù)據(jù),應(yīng)用測試樣品總量為1200個。單一應(yīng)用測試樣品數(shù)據(jù)內(nèi)存儲16X16的圖像應(yīng)用測試樣品,同時將ANN的實際輸入成熟設(shè)置為512,部署0~9個類別,共10種。由于類別為10種,因此需要將輸出的成熟設(shè)置為10,并根據(jù)經(jīng)驗隱含層部署 。在該部署內(nèi)容中,I代表輸入層實際神經(jīng)模擬元數(shù)量,Q代表輸出層實際神經(jīng)模擬元數(shù)量,n需要在0~10內(nèi)進行選取[4]。在實驗階段,隱含層實際數(shù)量需要設(shè)置為20,同時訓(xùn)練目標為0.05。反向傳播網(wǎng)絡(luò)類型需要應(yīng)用L-M的訓(xùn)練處理方案,改進的參數(shù)為種族群落規(guī)模25、交叉概率0.8、迭代數(shù)量70、權(quán)重數(shù)值與閾值取值范圍[-4,4]、水平數(shù)量10。通過對兩種基礎(chǔ)應(yīng)用算法進行對比,結(jié)果如表1所示,能夠發(fā)現(xiàn)改進版算法相對于經(jīng)典反向傳播算法具有更快的處理速度。手寫數(shù)字內(nèi)容的辨識匹配精確程度與應(yīng)用測試樣品數(shù)量存在關(guān)聯(lián),因此需要通過增加應(yīng)用測試樣品量的方式,使手寫數(shù)字辨識匹配效果能夠達到理想目標。改進版神經(jīng)模擬網(wǎng)絡(luò)手寫數(shù)字算法能夠以較短的訓(xùn)練時間完成整體規(guī)劃,具有良好的應(yīng)用效果。
結(jié)論:
綜上所述,基于神經(jīng)模擬網(wǎng)絡(luò)訓(xùn)練的手工書寫體數(shù)字辨識匹配具有良好的應(yīng)用效果。通過對其設(shè)計方式進行分析,能夠明確基礎(chǔ)應(yīng)用原理,有利于未來進一步改進相關(guān)細節(jié),使其可以適應(yīng)工作需求變化,實現(xiàn)理想部署目標。
參考文獻
[1]陳巖,李洋洋,余樂,等.基于卷積神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別系統(tǒng)[J].微電子學(xué)與計算機,2018,405(02):71-74.
[2]蔣銳鵬,姑麗加瑪麗·麥麥提艾力,安麗娜.基于長短期記憶神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別[J].計算機技術(shù)與發(fā)展,2020,274(02):100-103.
[3]茹曉青,華國光,李麗宏,等.基于形變卷積神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別研究[J].微電子學(xué)與計算機,2019,36(04):53-57.
[4]宋曉茹,吳雪,高嵩,等.基于深度神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別模擬研究[J].科學(xué)技術(shù)與工程,2019,019(005):193-196.
基金項目:基于HLS的手寫體數(shù)字識別。編號:2020HYA01001.教育部科技發(fā)展中心立的項。