余聶芳
摘 要:神經(jīng)網(wǎng)絡(luò)是一種新型的信息處理模型,通過對生物神經(jīng)系統(tǒng)的模擬,憑借自適應學習以及自動處理等功能,可達到預期目的。脫機手寫漢字識別難度較大,為提高識別速度和精確度,采用了建立在反向傳播法基礎(chǔ)上的神經(jīng)網(wǎng)絡(luò)模型,對脫機手寫漢字進行識別。以小字符集漢字識別為例,針對反向傳播法中存在的缺陷,如收斂速度過慢,易陷入局部最小點等,對其算法進行了改進,取得了較好的效果。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) BP算法改進 脫機手寫漢字識別 誤差函數(shù)
中圖分類號:TP183 文獻標識碼:A 文章編號:1674-098X(2014)01(b)-0047-01
漢字識別有兩種,一種是印刷體漢字,因比較規(guī)范,容易識別;第二種是手寫漢字,分聯(lián)機手寫和脫機手寫兩類,前者準確率較高,后者則偏低,是當前的研究重點。作為模式識別的重要組成部分,漢字識別技術(shù)應用廣泛,但由于涉及圖像處理、人工智能、計算機、數(shù)字信號處理等多種技術(shù),加上漢字的復雜繁多,使得漢字識別存在著很大困難,如尤其是相似字,使得識別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現(xiàn)錯誤。
1 神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)
1.1 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代神經(jīng)科研成果的基礎(chǔ)上提出并發(fā)展起來的,通過對生物大腦神經(jīng)的模擬建立的一種信息處理系統(tǒng),由許多簡單元件連接構(gòu)成,具有非線性和容錯性,從能力特征來講,具有自適應和自組織性。其優(yōu)勢主要體現(xiàn)在:能夠模仿人腦進行聯(lián)想記憶;對存儲的信息進行分類識別;能夠自動總結(jié)歸納經(jīng)驗。在長期的實踐發(fā)展中,神經(jīng)網(wǎng)絡(luò)技術(shù)不斷完善,在語音處理、機器人研究、模式識別等諸多領(lǐng)域都有廣泛應用。
1.2 BP神經(jīng)網(wǎng)絡(luò)
用于文字識別的神經(jīng)網(wǎng)絡(luò)模型有很多,BP神經(jīng)網(wǎng)絡(luò)是其中較為常用的一種,該網(wǎng)絡(luò)模型是以BP算法(即反向傳播算法)為基礎(chǔ)的,除了函數(shù)逼近功能,還具有良好的機器學習能力。
BP神經(jīng)網(wǎng)絡(luò)屬于多層前向網(wǎng)絡(luò),能夠進行反向傳遞、修正誤差,通過結(jié)構(gòu)和權(quán)值將頗為復雜的非線性映射關(guān)系表達出來。多由輸入層、輸出層以及隱含層組成,每層都有若干神經(jīng)元,前向網(wǎng)絡(luò)是指其計算過程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個階段,一是正向傳播,二是反向傳播,在第一個階段,將信號輸進系統(tǒng)的輸入層,由其內(nèi)部神經(jīng)元進行處理,主要是加權(quán)求和、激勵函數(shù)等,而后傳遞到中間層(即隱含層),在經(jīng)過內(nèi)部逐層處理,傳到輸出層,將實際的輸出值和預期值相比,若超過了規(guī)定的誤差范圍,就開始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內(nèi)各單元的誤差,將相應的權(quán)值進行修改,經(jīng)不斷的調(diào)整,直至誤差值符合要求。
2 BP網(wǎng)絡(luò)神經(jīng)在小字符集漢字識別中的實際應用
2.1 缺陷
(1)站在數(shù)學的角度看,BP網(wǎng)絡(luò)神經(jīng)所使用的梯度下降法屬于非線性優(yōu)化算法的一種,以至于局部極小值大的問題很難得到解決,在實際計算中,BP算法能夠?qū)⒕W(wǎng)絡(luò)權(quán)值進行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒有可靠的保證。若解決的問題比較復雜,很容易致使誤差函數(shù)陷入局部的極小區(qū)域。
(3)中間層的結(jié)點
在確定訓練集之后,輸入層和輸出層的結(jié)點數(shù)目也相應的確定下來,然而中間層及選取層內(nèi)結(jié)點時,缺乏足夠的理論作指導,中間層的結(jié)點數(shù)直接影響著網(wǎng)絡(luò)的學習效率和復雜程度,因此,在選取中間層變得結(jié)點時,也應做一定的改進,積極建立相關(guān)的指導理論。
3 結(jié)語
針對脫機手寫漢字識別技術(shù)存在的難度,可運用BP神經(jīng)網(wǎng)絡(luò)技術(shù),而實際應用中,收斂速度過慢以及局部最小點問題對BP神經(jīng)網(wǎng)絡(luò)技術(shù)影響較大,為此,需從初始權(quán)值的選取、激勵函數(shù)、誤差函數(shù)等方面對其算法加以改進,以達到提升脫機手寫漢字識別速度和精確度的目的。
參考文獻
[1] 張中.漢字識別技術(shù)綜述[J].語言文學應用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經(jīng)網(wǎng)絡(luò)算法的改進及其在手寫體漢字識別中的應用[J].江西師范大學學報,2009,33(5):598-603.endprint
摘 要:神經(jīng)網(wǎng)絡(luò)是一種新型的信息處理模型,通過對生物神經(jīng)系統(tǒng)的模擬,憑借自適應學習以及自動處理等功能,可達到預期目的。脫機手寫漢字識別難度較大,為提高識別速度和精確度,采用了建立在反向傳播法基礎(chǔ)上的神經(jīng)網(wǎng)絡(luò)模型,對脫機手寫漢字進行識別。以小字符集漢字識別為例,針對反向傳播法中存在的缺陷,如收斂速度過慢,易陷入局部最小點等,對其算法進行了改進,取得了較好的效果。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) BP算法改進 脫機手寫漢字識別 誤差函數(shù)
中圖分類號:TP183 文獻標識碼:A 文章編號:1674-098X(2014)01(b)-0047-01
漢字識別有兩種,一種是印刷體漢字,因比較規(guī)范,容易識別;第二種是手寫漢字,分聯(lián)機手寫和脫機手寫兩類,前者準確率較高,后者則偏低,是當前的研究重點。作為模式識別的重要組成部分,漢字識別技術(shù)應用廣泛,但由于涉及圖像處理、人工智能、計算機、數(shù)字信號處理等多種技術(shù),加上漢字的復雜繁多,使得漢字識別存在著很大困難,如尤其是相似字,使得識別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現(xiàn)錯誤。
1 神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)
1.1 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代神經(jīng)科研成果的基礎(chǔ)上提出并發(fā)展起來的,通過對生物大腦神經(jīng)的模擬建立的一種信息處理系統(tǒng),由許多簡單元件連接構(gòu)成,具有非線性和容錯性,從能力特征來講,具有自適應和自組織性。其優(yōu)勢主要體現(xiàn)在:能夠模仿人腦進行聯(lián)想記憶;對存儲的信息進行分類識別;能夠自動總結(jié)歸納經(jīng)驗。在長期的實踐發(fā)展中,神經(jīng)網(wǎng)絡(luò)技術(shù)不斷完善,在語音處理、機器人研究、模式識別等諸多領(lǐng)域都有廣泛應用。
1.2 BP神經(jīng)網(wǎng)絡(luò)
用于文字識別的神經(jīng)網(wǎng)絡(luò)模型有很多,BP神經(jīng)網(wǎng)絡(luò)是其中較為常用的一種,該網(wǎng)絡(luò)模型是以BP算法(即反向傳播算法)為基礎(chǔ)的,除了函數(shù)逼近功能,還具有良好的機器學習能力。
BP神經(jīng)網(wǎng)絡(luò)屬于多層前向網(wǎng)絡(luò),能夠進行反向傳遞、修正誤差,通過結(jié)構(gòu)和權(quán)值將頗為復雜的非線性映射關(guān)系表達出來。多由輸入層、輸出層以及隱含層組成,每層都有若干神經(jīng)元,前向網(wǎng)絡(luò)是指其計算過程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個階段,一是正向傳播,二是反向傳播,在第一個階段,將信號輸進系統(tǒng)的輸入層,由其內(nèi)部神經(jīng)元進行處理,主要是加權(quán)求和、激勵函數(shù)等,而后傳遞到中間層(即隱含層),在經(jīng)過內(nèi)部逐層處理,傳到輸出層,將實際的輸出值和預期值相比,若超過了規(guī)定的誤差范圍,就開始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內(nèi)各單元的誤差,將相應的權(quán)值進行修改,經(jīng)不斷的調(diào)整,直至誤差值符合要求。
2 BP網(wǎng)絡(luò)神經(jīng)在小字符集漢字識別中的實際應用
2.1 缺陷
(1)站在數(shù)學的角度看,BP網(wǎng)絡(luò)神經(jīng)所使用的梯度下降法屬于非線性優(yōu)化算法的一種,以至于局部極小值大的問題很難得到解決,在實際計算中,BP算法能夠?qū)⒕W(wǎng)絡(luò)權(quán)值進行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒有可靠的保證。若解決的問題比較復雜,很容易致使誤差函數(shù)陷入局部的極小區(qū)域。
(3)中間層的結(jié)點
在確定訓練集之后,輸入層和輸出層的結(jié)點數(shù)目也相應的確定下來,然而中間層及選取層內(nèi)結(jié)點時,缺乏足夠的理論作指導,中間層的結(jié)點數(shù)直接影響著網(wǎng)絡(luò)的學習效率和復雜程度,因此,在選取中間層變得結(jié)點時,也應做一定的改進,積極建立相關(guān)的指導理論。
3 結(jié)語
針對脫機手寫漢字識別技術(shù)存在的難度,可運用BP神經(jīng)網(wǎng)絡(luò)技術(shù),而實際應用中,收斂速度過慢以及局部最小點問題對BP神經(jīng)網(wǎng)絡(luò)技術(shù)影響較大,為此,需從初始權(quán)值的選取、激勵函數(shù)、誤差函數(shù)等方面對其算法加以改進,以達到提升脫機手寫漢字識別速度和精確度的目的。
參考文獻
[1] 張中.漢字識別技術(shù)綜述[J].語言文學應用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經(jīng)網(wǎng)絡(luò)算法的改進及其在手寫體漢字識別中的應用[J].江西師范大學學報,2009,33(5):598-603.endprint
摘 要:神經(jīng)網(wǎng)絡(luò)是一種新型的信息處理模型,通過對生物神經(jīng)系統(tǒng)的模擬,憑借自適應學習以及自動處理等功能,可達到預期目的。脫機手寫漢字識別難度較大,為提高識別速度和精確度,采用了建立在反向傳播法基礎(chǔ)上的神經(jīng)網(wǎng)絡(luò)模型,對脫機手寫漢字進行識別。以小字符集漢字識別為例,針對反向傳播法中存在的缺陷,如收斂速度過慢,易陷入局部最小點等,對其算法進行了改進,取得了較好的效果。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) BP算法改進 脫機手寫漢字識別 誤差函數(shù)
中圖分類號:TP183 文獻標識碼:A 文章編號:1674-098X(2014)01(b)-0047-01
漢字識別有兩種,一種是印刷體漢字,因比較規(guī)范,容易識別;第二種是手寫漢字,分聯(lián)機手寫和脫機手寫兩類,前者準確率較高,后者則偏低,是當前的研究重點。作為模式識別的重要組成部分,漢字識別技術(shù)應用廣泛,但由于涉及圖像處理、人工智能、計算機、數(shù)字信號處理等多種技術(shù),加上漢字的復雜繁多,使得漢字識別存在著很大困難,如尤其是相似字,使得識別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現(xiàn)錯誤。
1 神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)
1.1 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是在現(xiàn)代神經(jīng)科研成果的基礎(chǔ)上提出并發(fā)展起來的,通過對生物大腦神經(jīng)的模擬建立的一種信息處理系統(tǒng),由許多簡單元件連接構(gòu)成,具有非線性和容錯性,從能力特征來講,具有自適應和自組織性。其優(yōu)勢主要體現(xiàn)在:能夠模仿人腦進行聯(lián)想記憶;對存儲的信息進行分類識別;能夠自動總結(jié)歸納經(jīng)驗。在長期的實踐發(fā)展中,神經(jīng)網(wǎng)絡(luò)技術(shù)不斷完善,在語音處理、機器人研究、模式識別等諸多領(lǐng)域都有廣泛應用。
1.2 BP神經(jīng)網(wǎng)絡(luò)
用于文字識別的神經(jīng)網(wǎng)絡(luò)模型有很多,BP神經(jīng)網(wǎng)絡(luò)是其中較為常用的一種,該網(wǎng)絡(luò)模型是以BP算法(即反向傳播算法)為基礎(chǔ)的,除了函數(shù)逼近功能,還具有良好的機器學習能力。
BP神經(jīng)網(wǎng)絡(luò)屬于多層前向網(wǎng)絡(luò),能夠進行反向傳遞、修正誤差,通過結(jié)構(gòu)和權(quán)值將頗為復雜的非線性映射關(guān)系表達出來。多由輸入層、輸出層以及隱含層組成,每層都有若干神經(jīng)元,前向網(wǎng)絡(luò)是指其計算過程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個階段,一是正向傳播,二是反向傳播,在第一個階段,將信號輸進系統(tǒng)的輸入層,由其內(nèi)部神經(jīng)元進行處理,主要是加權(quán)求和、激勵函數(shù)等,而后傳遞到中間層(即隱含層),在經(jīng)過內(nèi)部逐層處理,傳到輸出層,將實際的輸出值和預期值相比,若超過了規(guī)定的誤差范圍,就開始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內(nèi)各單元的誤差,將相應的權(quán)值進行修改,經(jīng)不斷的調(diào)整,直至誤差值符合要求。
2 BP網(wǎng)絡(luò)神經(jīng)在小字符集漢字識別中的實際應用
2.1 缺陷
(1)站在數(shù)學的角度看,BP網(wǎng)絡(luò)神經(jīng)所使用的梯度下降法屬于非線性優(yōu)化算法的一種,以至于局部極小值大的問題很難得到解決,在實際計算中,BP算法能夠?qū)⒕W(wǎng)絡(luò)權(quán)值進行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒有可靠的保證。若解決的問題比較復雜,很容易致使誤差函數(shù)陷入局部的極小區(qū)域。
(3)中間層的結(jié)點
在確定訓練集之后,輸入層和輸出層的結(jié)點數(shù)目也相應的確定下來,然而中間層及選取層內(nèi)結(jié)點時,缺乏足夠的理論作指導,中間層的結(jié)點數(shù)直接影響著網(wǎng)絡(luò)的學習效率和復雜程度,因此,在選取中間層變得結(jié)點時,也應做一定的改進,積極建立相關(guān)的指導理論。
3 結(jié)語
針對脫機手寫漢字識別技術(shù)存在的難度,可運用BP神經(jīng)網(wǎng)絡(luò)技術(shù),而實際應用中,收斂速度過慢以及局部最小點問題對BP神經(jīng)網(wǎng)絡(luò)技術(shù)影響較大,為此,需從初始權(quán)值的選取、激勵函數(shù)、誤差函數(shù)等方面對其算法加以改進,以達到提升脫機手寫漢字識別速度和精確度的目的。
參考文獻
[1] 張中.漢字識別技術(shù)綜述[J].語言文學應用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經(jīng)網(wǎng)絡(luò)算法的改進及其在手寫體漢字識別中的應用[J].江西師范大學學報,2009,33(5):598-603.endprint