• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于神經(jīng)網(wǎng)絡(luò)的手寫(xiě)體數(shù)字識(shí)別

      2016-11-02 06:44:06陳園園袁煥麗石齊雙
      關(guān)鍵詞:手寫(xiě)體數(shù)字圖像特征提取

      陳園園,袁煥麗,石齊雙

      (周口師范學(xué)院物理與電信工程學(xué)院,河南周口 466001)

      基于神經(jīng)網(wǎng)絡(luò)的手寫(xiě)體數(shù)字識(shí)別

      陳園園,袁煥麗,石齊雙

      (周口師范學(xué)院物理與電信工程學(xué)院,河南周口466001)

      本文重點(diǎn)解決以圖像方式存在的手寫(xiě)體數(shù)字識(shí)別問(wèn)題,首先對(duì)圖像進(jìn)行預(yù)處理,其次對(duì)結(jié)構(gòu)特征進(jìn)行提取,最后利用神經(jīng)網(wǎng)絡(luò)模型對(duì)前面兩步得到的樣本數(shù)據(jù)進(jìn)行學(xué)習(xí)和訓(xùn)練。通過(guò)MATLAB進(jìn)行仿真,神經(jīng)稀疏編碼算法應(yīng)用在手寫(xiě)體數(shù)字識(shí)別中能夠得到比較好的識(shí)別率。

      手寫(xiě)體數(shù)字識(shí)別;預(yù)處理與特征提??;神經(jīng)稀疏編碼算法;MATLAB

      0 引 言

      近年來(lái),模式識(shí)別獲得了迅猛發(fā)展和學(xué)術(shù)界的廣泛關(guān)注,并且在人工智能研究的高端構(gòu)建與創(chuàng)新中發(fā)揮著基礎(chǔ)性的推動(dòng)作用。當(dāng)前,模式識(shí)別也依然存在著眾多問(wèn)題有待改進(jìn)與完善:輸入樣本表達(dá)的選擇、分類(lèi)器的選擇、采集數(shù)據(jù)、處理數(shù)據(jù)、選擇數(shù)據(jù)和樣本集對(duì)識(shí)別器的優(yōu)化訓(xùn)練。

      模式識(shí)別中的一個(gè)核心組成就是數(shù)字識(shí)別。而基于時(shí)下需求,數(shù)字識(shí)別中的重點(diǎn)分支—手寫(xiě)體數(shù)字識(shí)別已經(jīng)成為當(dāng)前矚目的技術(shù)熱點(diǎn)和焦點(diǎn)研究?jī)?nèi)容。雖然在手寫(xiě)體數(shù)字識(shí)別上已經(jīng)取得了一定成果,識(shí)別率基本上不會(huì)低于96%。但是手寫(xiě)體數(shù)字識(shí)別技術(shù)卻仍然呈現(xiàn)出若干不足,由此而成為文字識(shí)別中的關(guān)鍵難點(diǎn)之一。

      得益于神經(jīng)網(wǎng)絡(luò)和模糊邏輯技術(shù)的發(fā)展,手寫(xiě)體數(shù)字識(shí)別正是應(yīng)用了人工神經(jīng)網(wǎng)絡(luò)這一方法,才獲得可觀和長(zhǎng)足進(jìn)步。因?yàn)樯窠?jīng)網(wǎng)絡(luò)具有推廣能力、記憶力、非線性和自學(xué)習(xí)能力以及高速運(yùn)算能力。綜上可得,本文即針對(duì)基于神經(jīng)網(wǎng)絡(luò)的手寫(xiě)體數(shù)字識(shí)別給出了研究設(shè)計(jì)完整過(guò)程技術(shù)論述。

      1 手寫(xiě)體數(shù)字識(shí)別的預(yù)處理

      數(shù)字識(shí)別的第一步便是圖像預(yù)處理。圖像的預(yù)處理過(guò)程能夠顯著壓縮信息的冗余度,將數(shù)字圖像中的噪聲有效降到最低,從而使得到的點(diǎn)陣規(guī)范化、標(biāo)準(zhǔn)化,為后續(xù)數(shù)字識(shí)別提供必備和完備基礎(chǔ)[1]。

      預(yù)處理過(guò)程包括3個(gè)步驟:平滑去噪、二值化、歸一化及細(xì)化。其中,平滑去噪技術(shù)能夠降低灰度圖像中出現(xiàn)的黑白噪聲,原因則出自人們的手寫(xiě)體數(shù)字經(jīng)常發(fā)生斷筆、連筆等非預(yù)期的理想狀況。其后,將圖像中的像素依據(jù)研究設(shè)計(jì)準(zhǔn)則轉(zhuǎn)換成2種顏色,從而成為圖像的二值化。黑白兩種顏色則是依據(jù)圖像的灰度值處理演化形成的。此時(shí),若要將二值化后的圖像能完整、逼真地恢復(fù)原初數(shù)字,主要處理內(nèi)容包括空白點(diǎn)不在筆畫(huà)中出現(xiàn),并且二值化的筆畫(huà)還得保持最初的文字的結(jié)構(gòu)特征。因而,閾值的選擇對(duì)于數(shù)字圖像的二值化具有現(xiàn)實(shí)重大作用。同時(shí),歸一化就是使數(shù)字圖像經(jīng)由某算法的效果設(shè)置而達(dá)到同一寬度、同一尺寸、同一高度,具體來(lái)說(shuō),第一是得到原來(lái)圖像的寬度與高度;第二是將不同要求的寬度與高度比較;第三就是計(jì)算得到符合變換要求的參數(shù);第四是算出原圖的每個(gè)像素點(diǎn)在歸一化后所處的新位置;第五是計(jì)算出處理后的每個(gè)數(shù)字圖像中的像素值[1]。最后,細(xì)化將是對(duì)二值化數(shù)字點(diǎn)陣進(jìn)行處理后所形成一個(gè)只存在圖像像素寬度的數(shù)字圖形。細(xì)化不僅能夠顯著減少工作的處理量,并且能夠保留將原圖像的真實(shí)可見(jiàn)特征,利于其后開(kāi)展的特征提取[2]。

      2 手寫(xiě)體數(shù)字識(shí)別的特征提取

      數(shù)字圖像的特征提取關(guān)鍵在于尋求到一種變換,將多維的模式類(lèi)別轉(zhuǎn)化到低維特征空間。特征提取對(duì)于降低計(jì)算復(fù)雜度表現(xiàn)出了高效及實(shí)用價(jià)值。與此同時(shí),更加精準(zhǔn)的圖像分類(lèi)函數(shù)的描述可以應(yīng)用到訓(xùn)練樣本上,從而形成先進(jìn)、可信的分類(lèi)規(guī)則[3]。

      對(duì)于結(jié)構(gòu)特征的提取是對(duì)預(yù)處理過(guò)后的圖像進(jìn)行分割,效果呈現(xiàn)如圖1所示。

      圖1 分割圖像Fig.1 Split image

      由圖1可知,圖像分割的實(shí)現(xiàn)流程為:

      1)記錄細(xì)化后的數(shù)字圖像,取3條縱向垂直線依次分布在一定的距離處,并標(biāo)記其與手寫(xiě)體數(shù)字的筆段的相交的點(diǎn)數(shù)。

      2)再將與1)中垂直相交的3條直線依次取位在1/3處,同時(shí)分別記下這3條線與數(shù)字筆段的交點(diǎn)數(shù)。

      3)最后取2條直線,并且也將其和數(shù)字筆段的交點(diǎn)的個(gè)數(shù)記錄下來(lái)。

      至此可得,圖像結(jié)構(gòu)特征提取的算法描述如下:

      1)確定像素值并且要按照一定的方式去掃描。

      2)計(jì)算出圖像的像素與端點(diǎn)的數(shù)字N。

      3)端點(diǎn)從1逐次遞增。

      4)從1)~3)依次進(jìn)行循環(huán)操作。

      3 基于神經(jīng)稀疏網(wǎng)絡(luò)的數(shù)字識(shí)別模型

      研究可知,人類(lèi)的大腦中獲取其他的神經(jīng)元信息是通過(guò)具有精細(xì)結(jié)構(gòu)的無(wú)數(shù)的樹(shù)突。具有電活性的脈沖是神經(jīng)元經(jīng)過(guò)一個(gè)長(zhǎng)長(zhǎng)細(xì)細(xì)的軸突而發(fā)出的。軸突后端可以分化成無(wú)數(shù)個(gè)分支,而在所有的分支的末端,軸突的電作用是借由突觸的結(jié)構(gòu)將電活性激發(fā)演變而來(lái)的。經(jīng)過(guò)如上過(guò)程后,其他的神經(jīng)元就會(huì)受到興奮或者抑制。

      基于此,學(xué)習(xí)行為的發(fā)生就是因?yàn)榕d奮輸入比抑制輸入要更為強(qiáng)大,因而導(dǎo)致了軸突的有效性獲得了明確變化。而若輔助以參數(shù)調(diào)節(jié),就可以達(dá)到最佳完美性能。研究實(shí)現(xiàn)的學(xué)習(xí)方式可以概括為:監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和再勵(lì)學(xué)習(xí)。

      首先定義訓(xùn)練樣本,假設(shè)P為輸入矢量,T為目標(biāo)矢量

      實(shí)驗(yàn)數(shù)據(jù)部分綜合了10張不同的測(cè)試圖像,每張圖像分別有5個(gè)0~9,并對(duì)每個(gè)數(shù)字進(jìn)行識(shí)別。識(shí)別后的數(shù)據(jù)結(jié)果可作如下闡釋分析:

      數(shù)字“0”和“1”的識(shí)別結(jié)果最好,都達(dá)到了80%;其次,數(shù)字“2”、“5”、“6”、“7”和“8”的識(shí)別精度也都達(dá)到70%以上;數(shù)字“4”的識(shí)別結(jié)果未臻理想,識(shí)別精度要低于60%,4被誤識(shí)為6的次數(shù)較多。

      使用MATLAB語(yǔ)言實(shí)現(xiàn)本研發(fā)系統(tǒng),設(shè)計(jì)效果實(shí)現(xiàn)可分別列示如下。讀入圖像,其中有多組測(cè)試圖片可以用來(lái)測(cè)試,選定其中一張[4]。讀入圖像的用戶(hù)界面如圖2所示。

      圖2 挑選待測(cè)圖片F(xiàn)ig.2 Choose the picture to be measured

      接下來(lái),利用MATLAB中圖像處理工具箱讀入bmp文件,并將其轉(zhuǎn)化為二值數(shù)據(jù),過(guò)程中使用了imread、im2double、rgb2gray、mat2gray、im2bw等函數(shù)[5]。由此可取得單個(gè)的數(shù)字圖像文件,使用imcrop函數(shù)進(jìn)行剪裁。選取圖片中的任意數(shù)字,比如5,如圖3所示。

      經(jīng)過(guò)平滑去噪、二值化、規(guī)范化、細(xì)化等過(guò)程處理以后,即可識(shí)別出選取數(shù)字。

      圖3 數(shù)字5的各種形狀Fig.3 Various shapes of number 5

      4 結(jié)束語(yǔ)

      當(dāng)前的手寫(xiě)體數(shù)字識(shí)別的基礎(chǔ)是數(shù)學(xué)建模,不僅難于建立,其應(yīng)用范圍也稍顯片面。本文研發(fā)設(shè)計(jì)關(guān)鍵即在于運(yùn)用神經(jīng)網(wǎng)絡(luò)代替了原來(lái)的數(shù)學(xué)建模。首先通過(guò)2個(gè)重要過(guò)程:圖像預(yù)處理;圖像的特征提取。然后基于神經(jīng)網(wǎng)絡(luò)的手寫(xiě)體數(shù)字識(shí)別,用稀疏自編碼方法去實(shí)現(xiàn)0~9這10個(gè)手寫(xiě)體的數(shù)分類(lèi)。最后運(yùn)用MATLAB實(shí)驗(yàn)仿真后可以得知:基于選用定制結(jié)構(gòu)模型和知識(shí)庫(kù)的識(shí)別方法對(duì)規(guī)范手寫(xiě)體數(shù)字識(shí)別具有高度可行性和現(xiàn)實(shí)針對(duì)性。并且研究重點(diǎn)利用了神經(jīng)稀疏自編碼網(wǎng)絡(luò)使手寫(xiě)體數(shù)字識(shí)別的應(yīng)用更趨廣闊、廣泛領(lǐng)域空間[6]。

      [1]蔡元明.神經(jīng)網(wǎng)絡(luò)識(shí)別手寫(xiě)體數(shù)字預(yù)處理后樣本空間凸集性研究[D].北京:中國(guó)科學(xué)院半導(dǎo)體所,1995.

      [2]崔屹.圖像處理與分析—數(shù)學(xué)形態(tài)學(xué)方法及應(yīng)用[M].北京:科學(xué)出版社,2002.

      [3]金忠,胡鐘山,楊靜宇,等.手寫(xiě)體數(shù)字有效鑒別特征的抽取與識(shí)別[J].計(jì)算機(jī)研究與發(fā)展,1999,36(12):1484-1489.

      [4]BERNHARD R C,SHI Y.Evolving artificial neural networks[C]// Proc of 1998 Int’l Conf.on neural networks and brain.Beijing,P.R. China:IEEE,2013,26(18):145-152.

      [5]HU J,YAN H.A model-based segmentation method for handwritten numeral strings[J].Computer Vision and Image Understanding,1998,70(3):383-403.

      [6]叢爽.面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2009.

      Handwritten digit recognition based on neural network

      CHEN Yuanyuan,YUAN Huanli,SHI Qishuang
      (School of Physics and Electromechnical Engineering,Zhoukou Normal University,Zhoukou Henan 466001,China)

      This paper focuses on handwritten numbers recognition problems in image way.Firstly,the image pretreatment,followed by the structural features are extracted.Next,The neural network model is used to study and train the sample data obtained from the previous two steps.Through MATLAB simulation,neural sparse coding algorithm can be used in handwritten numeral recognition to get better recognition rate.

      handwritten digit recognition;pre-processing and feature extraction;neural algorithm for sparse coding;MATLAB

      TP391

      A

      2095-2163(2016)03-0140-02

      2016-06-05

      國(guó)家自然科學(xué)基金(61401526);河南省科技廳資助項(xiàng)目(152102210368);河南省科技廳重點(diǎn)科技攻關(guān)項(xiàng)目(162102310607)。

      陳園園(1986-),女,碩士,助教,主要研究方向:信息處理、計(jì)算機(jī)技術(shù)。

      猜你喜歡
      手寫(xiě)體數(shù)字圖像特征提取
      哐當(dāng)(外一首)
      哐當(dāng)(外一首)
      基于大數(shù)據(jù)下的手寫(xiě)體識(shí)別的設(shè)計(jì)與研發(fā)
      披著書(shū)法外衣的手寫(xiě)體
      基于Daubechies(dbN)的飛行器音頻特征提取
      電子制作(2018年19期)2018-11-14 02:37:08
      ARGUS-100 藝術(shù)品鑒證數(shù)字圖像比對(duì)系統(tǒng)
      Bagging RCSP腦電特征提取算法
      基于塊效應(yīng)測(cè)度的JPEG數(shù)字圖像盲取證
      基于MED和循環(huán)域解調(diào)的多故障特征提取
      數(shù)字圖像修復(fù)在圖像壓縮上的應(yīng)用
      称多县| 晴隆县| 麦盖提县| 博客| 罗山县| 怀远县| 县级市| 武强县| 富锦市| 罗城| 牡丹江市| 铜鼓县| 天气| 娱乐| 和龙市| 化德县| 阳信县| 依兰县| 浦县| 大同市| 腾冲县| 栾川县| 甘谷县| 龙泉市| 静宁县| 九龙城区| 双牌县| 河津市| 平凉市| 衡阳县| 遂平县| 灵台县| 昆山市| 三台县| 沙雅县| 通山县| 栾城县| 泸州市| 武邑县| 于田县| 恩施市|