基于神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別算法設(shè)計

2021-10-21 08:51:30馮文革李琳雷軍麗

科技信息·學(xué)術(shù)版 2021年15期

馮文革李琳雷軍麗

摘要：目前，基于神經(jīng)模擬網(wǎng)絡(luò)應(yīng)用技術(shù)方案的辨識匹配算法層出不窮，其已經(jīng)成為各行各業(yè)廣泛應(yīng)用的數(shù)字化技術(shù)之一。在針對手工書寫體數(shù)字進行辨識匹配的過程中，相關(guān)應(yīng)用算法主要以反向傳播神經(jīng)模擬網(wǎng)絡(luò)類型為主。然而，該網(wǎng)絡(luò)類型本身訓(xùn)練時間相對較長，同時有可能出現(xiàn)局部最小的弊端。為避免此類問題影響實際辨識匹配效果，需要基于神經(jīng)模擬網(wǎng)絡(luò)進一步探索相關(guān)應(yīng)用算法，使手工書寫體數(shù)字能夠得到高效率、高質(zhì)量辨識匹配。本文主要針對基于神經(jīng)模擬網(wǎng)絡(luò)的手工書寫體數(shù)字辨識匹配算法設(shè)計進行深入研究，以供參考。

關(guān)鍵詞：神經(jīng)網(wǎng)絡(luò);手寫體數(shù)字;識別算法

數(shù)字辨識匹配算法當前應(yīng)用范圍較廣，在各種信息化平臺中均存在基礎(chǔ)需求。通過結(jié)合神經(jīng)模擬網(wǎng)絡(luò)解決方案，能夠快速對手工書寫體數(shù)字進行辨識匹配，有效降低錯誤率，增強工作效率。通過對神經(jīng)模擬網(wǎng)絡(luò)手工書寫體數(shù)字辨識匹配算法進行分析，能夠明確其主要概念與設(shè)計細節(jié)，有利于強化整體應(yīng)用效果，對未來進一步開展手工書寫體數(shù)字辨識匹配具有正面影響意義。

1 神經(jīng)模擬網(wǎng)絡(luò)與反向傳播辨識匹配應(yīng)用算法基礎(chǔ)概念簡述

1.1神經(jīng)模擬網(wǎng)絡(luò)

神經(jīng)模擬網(wǎng)絡(luò)又被稱作人工神經(jīng)模擬網(wǎng)絡(luò)類型，即ANN。其自上世紀八十年代開始出現(xiàn)研究熱潮，主要針對信息處理角度進行探究。ANN對信息內(nèi)容的處理方式主要通過抽象人腦運轉(zhuǎn)邏輯、建立基礎(chǔ)模型的措施完成，其可以將多種主要連接方案整合為主體網(wǎng)絡(luò)，進而達到高效率應(yīng)用的目標。ANN在工程學(xué)界被稱作類神經(jīng)模擬網(wǎng)絡(luò)的一種，主要代表運算應(yīng)用模型方案，通過海量的處理節(jié)點并聯(lián)而成，與人類大腦的神經(jīng)模擬元存在一定程度的相似性[1]。常規(guī)情況下，處理節(jié)點自身能夠代表特定條件的輸出應(yīng)用函數(shù)，即激勵函數(shù)。兩個節(jié)點之間建立連接關(guān)系即可代表對單一連接用信號的加權(quán)數(shù)據(jù)，即權(quán)重。這一結(jié)構(gòu)能夠組成ANN記憶，最終為輸出內(nèi)容提供基礎(chǔ)處理條件。網(wǎng)絡(luò)本身權(quán)重數(shù)據(jù)與激勵函數(shù)若存在差異，則邏輯策略也會出現(xiàn)差異。因此，神經(jīng)模擬網(wǎng)絡(luò)的算法具有多樣化應(yīng)用特征。

1.2反向傳播辨識匹配算法

反向傳播辨識匹配算法屬于經(jīng)典手工書寫體數(shù)字辨識匹配解決方案，其具有前向應(yīng)用特征，主要包含三個基礎(chǔ)層次，即輸入、隱含、輸出。通常情況下，該網(wǎng)絡(luò)隱含層可以設(shè)置為單層或多層兩種，各層需要由單一或多個節(jié)點組成，同層節(jié)點之內(nèi)不允許建立連接，層與層之間的節(jié)點需要保證全連接狀態(tài)。反向傳播神經(jīng)模擬網(wǎng)絡(luò)的應(yīng)用核心便是反向傳播算法，這一算法由正向傳遞與誤差反向傳播組成。在正向傳播過程中，輸入的信息內(nèi)容需要從輸入?yún)^(qū)域、隱含層逐步計算，最終輸入至輸出層面。但是，其應(yīng)用階段受到基本原理的限制，經(jīng)常需要消耗大量時間，同時有可能陷入局部最小值狀態(tài)。因此，需要基于全新改進版神經(jīng)模擬網(wǎng)絡(luò)方案，對手工書寫體數(shù)字的辨識匹配算法進行革新處理，使其能夠擺脫原有反向傳播網(wǎng)絡(luò)限制，達到理想優(yōu)化目標，進一步提高整體辨識匹配效率與質(zhì)量。

2 基于神經(jīng)模擬網(wǎng)絡(luò)方案設(shè)計匹配算法研究

2.1初始階段化轉(zhuǎn)變種族群落內(nèi)容

在改進神經(jīng)模擬網(wǎng)絡(luò)手寫數(shù)字辨識匹配算法的過程中，需要首先處理種族群落初始階段化轉(zhuǎn)變模塊。常規(guī)情況下，針對不存在先驗知識內(nèi)容的優(yōu)化性問題，經(jīng)典遺傳ANN算法主要利用隨機方式處理產(chǎn)生階段。這種方式雖然效率較高，但會導(dǎo)致完成初始階段化轉(zhuǎn)變的群體出現(xiàn)一定程度的盲目特性，同時也不利于篩選具有代表特征的群體。因此，在改進過程中需要利用正交設(shè)計方式，對種族群落進行科學(xué)初始階段化轉(zhuǎn)變。利用此類方法初始階段化轉(zhuǎn)變的群體能夠有效代表所有可能性組合，同時也可以提高數(shù)值的優(yōu)化特性，使其搜索效率得到顯著提升[2]。通過應(yīng)用正交方式初始階段化轉(zhuǎn)變?nèi)后w，還可以使初始種族群落內(nèi)容具有高魯棒性與高統(tǒng)計合理性，有利于后續(xù)進一步展開辨識匹配操作。

2.1.1構(gòu)建正交設(shè)計矩陣類型

常規(guī)情況下，正交矩陣的規(guī)劃措施較為豐富，為確保后續(xù)手工書寫體數(shù)字能夠得到高效率、高質(zhì)量辨識匹配，本次改進應(yīng)當重視設(shè)計方法的計算便捷特性。通過將Q設(shè)置為基因變量變化水平數(shù)，N設(shè)置為基因個數(shù)，可以總結(jié)正交設(shè)計矩陣為，同時。在這一矩陣前提下，針對正交設(shè)計的矩陣基本列進行構(gòu)造處理時，基礎(chǔ)算法如下：

For k=1 to J do

Begin

For i=1 to QJ do

mod Q

End

在構(gòu)造非基本列的過程中，其基礎(chǔ)算法如下：

For k=2 to J do

Begin

For s=1 to j-1 do

Or t=1 to Q-1 do

End

在構(gòu)建完成后，需要對ai，j進行+1處理，使l≤i≤M，l≤j≤N。

2.1.2開始生成初始階段種族群落

在完成種族群落的初始階段化轉(zhuǎn)變操作后，由于無法明確反向傳播網(wǎng)絡(luò)本身所具有的權(quán)重數(shù)據(jù)與閾值數(shù)據(jù)，同時也無法了解全局最小信息。因此，初始種族群落的實際染色體內(nèi)容將會呈現(xiàn)均勻分布狀態(tài)，其在可行解的空間內(nèi)具有一定程度的合理性。通過將xi設(shè)定為第i個基礎(chǔ)因素，即可使單一染色體能夠?qū)?yīng)N個基礎(chǔ)因素。這些因素本身存在連續(xù)性特征與變化性特征，因此必須將各個因素進行離散化轉(zhuǎn)變，使其能夠成為有限個數(shù)量值。在實際執(zhí)行階段，需要將xi的區(qū)間[l，u]分割為Q個基礎(chǔ)水平，進而獲得初始種族群落，即。Ti，j本身屬于初始種族群落矩陣內(nèi)T元素的實際數(shù)值，而δ為實際數(shù)據(jù)較低的隨機數(shù)字，常規(guī)情況下需要保證。針對手寫數(shù)字辨識匹配應(yīng)用測試樣品進行訓(xùn)練的反向傳播網(wǎng)絡(luò)類型，其需要大量的訓(xùn)練網(wǎng)絡(luò)權(quán)重數(shù)據(jù)與閾值數(shù)據(jù)。在這種情況下，N的數(shù)值會存在過大問題，最終導(dǎo)致M的數(shù)據(jù)增大。這種規(guī)模龐大的矩陣作為初始應(yīng)用種族群落會嚴重消耗存儲空間，同時也會增加算法進行迭代的總時長[3]。因此，需要從T中利用隨機處理方式選擇n個具有不同行為的個體元素作為初始應(yīng)用種族群落，確保后續(xù)能夠達到理想辨識匹配目標。

2.2針對父系應(yīng)用個體元素進行篩選

篩選父系應(yīng)用個體元素的過程中，應(yīng)用賭輪盤處理方式進行操作容易導(dǎo)致神經(jīng)模擬網(wǎng)絡(luò)優(yōu)化出現(xiàn)收斂過快的負面問題。因此，在改進算法中為確保群體多樣性能夠符合需求，需要盡可能減少算法的實際收斂速度，避免其出現(xiàn)過快弊端。在選擇階段，針對低于平均適應(yīng)度的個體元素需要進行淘汰處理。被淘汰的個體元素可以從T內(nèi)部隨機選擇單行作為新型個體元素，同時提高δ的實際變化范圍。為確保種族群落能夠達到優(yōu)秀的多樣性，需要在低于平均適應(yīng)度個體元素數(shù)量低于1/4種族群落整體數(shù)量時，采用保持處理措施，使其數(shù)量能夠穩(wěn)定在該層次，實現(xiàn)最佳處理效果。

3 算法應(yīng)用案例方針分析

在針對改進算法進行測試的過程中，主要采用USPS手寫類型數(shù)字應(yīng)用測試樣品作為基礎(chǔ)實驗應(yīng)用數(shù)據(jù)，應(yīng)用測試樣品總量為1200個。單一應(yīng)用測試樣品數(shù)據(jù)內(nèi)存儲16X16的圖像應(yīng)用測試樣品，同時將ANN的實際輸入成熟設(shè)置為512，部署0～9個類別，共10種。由于類別為10種，因此需要將輸出的成熟設(shè)置為10，并根據(jù)經(jīng)驗隱含層部署。在該部署內(nèi)容中，I代表輸入層實際神經(jīng)模擬元數(shù)量，Q代表輸出層實際神經(jīng)模擬元數(shù)量，n需要在0～10內(nèi)進行選取[4]。在實驗階段，隱含層實際數(shù)量需要設(shè)置為20，同時訓(xùn)練目標為0.05。反向傳播網(wǎng)絡(luò)類型需要應(yīng)用L-M的訓(xùn)練處理方案，改進的參數(shù)為種族群落規(guī)模25、交叉概率0.8、迭代數(shù)量70、權(quán)重數(shù)值與閾值取值范圍[-4，4]、水平數(shù)量10。通過對兩種基礎(chǔ)應(yīng)用算法進行對比，結(jié)果如表1所示，能夠發(fā)現(xiàn)改進版算法相對于經(jīng)典反向傳播算法具有更快的處理速度。手寫數(shù)字內(nèi)容的辨識匹配精確程度與應(yīng)用測試樣品數(shù)量存在關(guān)聯(lián)，因此需要通過增加應(yīng)用測試樣品量的方式，使手寫數(shù)字辨識匹配效果能夠達到理想目標。改進版神經(jīng)模擬網(wǎng)絡(luò)手寫數(shù)字算法能夠以較短的訓(xùn)練時間完成整體規(guī)劃，具有良好的應(yīng)用效果。

結(jié)論：

綜上所述，基于神經(jīng)模擬網(wǎng)絡(luò)訓(xùn)練的手工書寫體數(shù)字辨識匹配具有良好的應(yīng)用效果。通過對其設(shè)計方式進行分析，能夠明確基礎(chǔ)應(yīng)用原理，有利于未來進一步改進相關(guān)細節(jié)，使其可以適應(yīng)工作需求變化，實現(xiàn)理想部署目標。

參考文獻

[1]陳巖，李洋洋，余樂，等.基于卷積神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別系統(tǒng)[J].微電子學(xué)與計算機，2018，405（02）：71-74.

[2]蔣銳鵬，姑麗加瑪麗·麥麥提艾力，安麗娜.基于長短期記憶神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別[J].計算機技術(shù)與發(fā)展，2020，274（02）：100-103.

[3]茹曉青，華國光，李麗宏，等.基于形變卷積神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別研究[J].微電子學(xué)與計算機，2019，36（04）：53-57.

[4]宋曉茹，吳雪，高嵩，等.基于深度神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別模擬研究[J].科學(xué)技術(shù)與工程，2019，019（005）：193-196.

基金項目：基于HLS的手寫體數(shù)字識別。編號：2020HYA01001.教育部科技發(fā)展中心立的項。