汪曉青
摘 要:在分析人工智能機器學習的基礎上,利用實例,從各方面論述了基于人工智能機器學習的文字識別方法需要注意的問題,希望對于今后我國的機器學習領域發(fā)展具有一定幫助。
關鍵詞:人工智能;機器學習;文字識別;神經(jīng)網(wǎng)絡
前言
在不斷發(fā)展的科學技術背景下,智能化則是各個行業(yè)所發(fā)展的趨勢,機器學習就是智能化中一個重要方面。當前,人類在語音、圖像識別、智能機器人以及智能搜索領域中獲得很大的進步,也有著很多的成功應用實例。當前,自動駕駛技術、深度問答都是建立在人工智能中的機器學習領域的基礎上,在逐步發(fā)展壯大的過程中,已經(jīng)能夠體現(xiàn)出具有巨大的優(yōu)越性[1,2]。鑒于此,應該重視基于人工智能機器學習的文字識別方法的研究工作,希望能夠在此領域獲得進一步的發(fā)展。
一、人工智能機器學習概述
在具體的計算機程序智能化研究中,應該從大腦模擬角度思考,這則是進行機器學習的基本內(nèi)容。在分析人腦進行知識構(gòu)建的情況下,應該對于環(huán)境中涉及到數(shù)據(jù)和規(guī)律進行總結(jié)分析,并能積極應用在云計算程序中,并能有效改善程序相應的執(zhí)行能力。在人工智能機器學習方面,從二十世紀中期,就已經(jīng)獲得必要的成就,但是,對于其具體的學習機理還存在很大的研究空間,應該從機器學習的發(fā)展歷史,進行思考。一是,在20世紀中期,這個階段中計算機信息技術呈現(xiàn)出飛速發(fā)展的趨勢,人們逐漸應用神經(jīng)網(wǎng)絡模型,一些機器學習算法(比如,進化算法)以及判別函數(shù)在背景下出現(xiàn),但由于上述算法存在一定的局限性,難以應用于實踐中;二是,在二十世紀七十年代中,這部分專家對于人工智能機器學習陷入一定的瓶頸期,在理論方面存在很大的問題,無法彌補實踐中的理論差距,還對于神經(jīng)網(wǎng)絡學習器存在一定的理論缺陷,研究工作進展很慢;三是,到了二十世紀八十年代,機器學習領域獲得比較大的成功,更多專家學者關注到不同類型的學習器模型的實際應用,并能發(fā)展出多種的學習算法,能夠較好地建立起理論和實踐之間的聯(lián)系,能夠?qū)⑷斯ぶ悄軝C器學習應用在很多研究領域中,并在理論方面有了一定的突破和應用,比如,在股票交易、天氣預報、圖像處理等應用中。所以,人工智能機器學習在某種程度上也是體現(xiàn)國家綜合競爭力的表現(xiàn),應該在各個方面予以充分重視,保證充分提升我國在人工智能機器學習領域中的實力。
二、人工智能機器學習基礎上的文字識別方法
1.文字識別系統(tǒng)分類器
在進行文字系統(tǒng)分類器選擇中,經(jīng)常應用BP神經(jīng)網(wǎng)絡分類器,具體的構(gòu)建中,應該結(jié)合BP神經(jīng)網(wǎng)絡的需求,進行網(wǎng)絡構(gòu)建,利用net1,net2和net3來對于特征數(shù)據(jù)訓練的表征,結(jié)合BP網(wǎng)絡要求,包括相應的輸入層、輸出層以及兩個隱層。
在進行網(wǎng)絡初始化的過程中,主要包括initwb和initnw兩種方式,前者的應用中,主要就是使得全部網(wǎng)絡偏置量進行初始化,并進行權值賦值,這還需要結(jié)合實際來應用自定義矩陣,而后者則利用網(wǎng)絡中的默認初始化進行,在具體的應用中,利用算法Nguyen以及Widrow,能夠保證在不同的層次中,能夠有效初始化偏置值以及權重問題,在這樣的背景下,輸入控件的全部神經(jīng)元活動能保障被輸入,盡量避免在神經(jīng)元的浪費問題,表現(xiàn)出比較高效的訓練速率,體現(xiàn)出較好的優(yōu)勢。
2.文字識別性能
經(jīng)過統(tǒng)計,在日常生活中所經(jīng)常出現(xiàn)的漢字達到六千多字,其中,醫(yī)學領域中包括2000多字。基于此,這里選擇常用的醫(yī)學漢字為基礎,對于六百字符的數(shù)字進行圖像構(gòu)建操作,其中,字幅圖像一共包括十幅,并分成六組,前九幅字符圖像則是進行訓練的數(shù)據(jù),另外,最后一組則為進行測試的圖像。具體將其應用在上述的LSSVM以及BP神經(jīng)網(wǎng)絡中,經(jīng)過實驗分析,可以得到如下結(jié)論。
具體的交叉驗證中,文字識別系統(tǒng)能夠有效判斷部分文字,經(jīng)過統(tǒng)計,應用此系統(tǒng),為了滿足識別率高達2000字符以上。為了進一步完善此系統(tǒng)的應用效果,應該對于分類器在每一組的特征基礎進行分類操作,要想保證能夠有效識別更多文字,則應該在該分類器中包含以上全部字符。所以,應該對于2000漢字進行劃分處理,利用不同的小組特征進行訓練,保證不同分類器所具備的同一類的特征。在此基礎上,針對不同分類器當中的數(shù)據(jù)進行篩選,應用票數(shù)最多的識別結(jié)果,將其應用于交叉驗證當中,在有效的驗證后對最終的識別結(jié)果進行輸出。
三、結(jié)論
由此可見,在信息技術飛速發(fā)展的背景下,人類文明也在經(jīng)歷著翻天覆地的變化,信息技術正在改變我們的生活和工作。人工智能機器學習則是信息技術發(fā)展的一個重要方面,具有非常重要的研究價值以及廣闊的發(fā)展空間,在此基礎上,應該充分重視人工智能機器學習的研究工作,并詳細開展文字識別方法展的研究,對于進一步提升我國的機器學習發(fā)展具有重要意義。
參考文獻
[1]歐文武,朱軍民,劉昌平.視頻文本定位[J].計算機工程與應用,2004,40(30).
[2]張鵬,謝曉堯.基于改進的C-支持向量機的手寫體數(shù)字高識別率方法研究[J].貴州師范大學學報(自然科學版),2014,32(2).
(作者單位:武漢軟件工程職業(yè)學院)