• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于人工智能機器學習的文字識別技術分析

      2022-02-22 23:59:41沈沖
      科技信息·學術版 2022年7期
      關鍵詞:識別深度學習文字

      沈沖

      關鍵詞:人工智能;深度學習;文字;識別;神經網絡

      隨著信息技術發(fā)展,以圖像為主的多媒體信息迅速成為了重要的消息傳播手段。而準確有效地提取圖片中的信息能有助于社會在工業(yè)自動化、機器人導航、人機交互、多媒體檢索領域獲得長遠發(fā)展。目前文字識別已經成為智能機器深度學習的重要內容,具有一定的研究價值。基于此,本文將對基于人工智能機器學習的文字識別技術為論點,對現有的文字識別技術進行研究,以期能為同行產生幾點借鑒意義。

      一、傳統(tǒng)文字識別技術與現代文字識別技術的特點研究

      傳統(tǒng)的文字識別技術有筆輸入、專用OCR、手寫體OCR、印刷體OCR四類[1]。現代文字識別技術依靠Matlab技術實現,大致應用步驟為調取原始圖像、處理圖像獲得灰度圖像、圖像二值處理,調動計算函數,輸出目標文字。

      二、現有文字識別技術仍存在的問題

      (一)網絡文字圖片標注成本高,訓練數據集小

      人工智能機器學習功能需要在復雜模型的監(jiān)督訓練下開展,因此,需要以海量數據集作為學習初始支持。針對網絡圖片中的文字,進行深度學習前,要對圖片中的所有字符串進行標注,并需要對某個區(qū)域內是否包含文字進行檢測。相較于一般的物體識別任務,網絡圖片文字識別所花費的任務成本更高。但從當前來看,現開放的有關文字識別技術開放性源代碼數據集較少,圖片數量也較少,故開展深度學習的前期支持數據不足。

      (二)序列建模常用的循環(huán)網絡無法并行計算

      當前文字序列識別的常用技術為依靠卷積循環(huán)神經網絡,技術支撐主體為LSTM技術。雖然該技術序列建模能力較為優(yōu)秀,但在建模過長的文字序列時,信息發(fā)出與收到反饋的用時較長,有可能增加系統(tǒng)深度學習的最終用時,進而對模型的識別效率造成影響。

      (三)復雜場景圖片文字識別準確率不足

      現有的文字識別模型大多依靠普通的單層卷積網絡,針對背景較為簡單的文字進行識別時,準確率較高。但當識別復雜場景文字時,需要加深提取模塊層數,從而出現梯度發(fā)散問題,最終導致機器學習內容不足的現象。

      三、基于人工智能機器學習的文字識別技術分析

      (一)分類器識別

      基于深度學習的文字識別工作開展前,首先要對文字識別的分類器進行識別。以BP神經網絡分類器為例,其學習訓練步驟如下:輸入模式順傳播→輸出誤差逆?zhèn)鞑ァh(huán)記憶訓練→學習結果判別。在應用BP神經網絡分類器前,首先需構建神經網絡,設計代表3大不同數據的通道。采用net函數構建神經網絡,則可將3大數據通道用net1、net2及net3、表示,每一通道內包含的數據數量分別為64與128、24與48、60與128,每一個數量分別代表一個節(jié)點。滿足上述技術支持后即可對神經網絡進行初始化。當前最常用的初始化方式為Initnw,每一次運行都能將數據運行時的權值及偏移量合理的初始,在后續(xù)進行單個文字的識別時,數據的輸入能更加便捷,同時也能減少神經元網絡節(jié)點的冗余[2]。

      (二)規(guī)則文字識別相關技術

      (1)卷積神經網絡法:該結構屬于前饋型神經網絡結構類型,對規(guī)則文字類型具有較高的文字識別靈敏度。即使針對已經經過平移或旋轉變換后的圖片,也可利用該技術較為靈敏地識別出。該技術文字識別步驟如下:輸入→預處理→識別→識別后處理四大流程。各流程中所包含的數據層級也有所差別,現將具體內容介紹如下:①輸入層。截取需要處理后的單字圖像,并轉換為64*64像素的灰度文字圖片,調整文字為白色,調整背景為黑色,如此處理以避免無關因素對文字識別的影響。

      ②隱藏層。共包含三個池化層與三個卷積層,卷積層與乳化層交替構成,處理數據。a、卷積層1:計算第一層卷積尺寸,以64*64像素文字處理為例,最終輸出卷積尺寸詳見表1;b、池化層1:對第一卷積層輸出的圖像進行最大池化運算處理。并計算出第一次池化結果。以60*60像素文字處理為例,最終輸出的池化尺寸詳見表2;c、卷積層2:采用5*5的卷積(共計128)個,對池化層1輸出的圖像再次進行卷積運算:d、池化層2:采用2*2的池化器對卷積層2輸出的圖像進行池化最高值運算:e、卷積層3:采用4*4的卷積對圖像進行卷積運算;f、池化層3:采用2*2的(256個)池化器對卷積層圖像進行池化最高運算[3]。

      ③全連接層:對隱藏層所輸出的參數進行處理,并由系統(tǒng)對神經元的興奮度進行計算??砂凑杖缦潞瘮祹雲?,激活函數公式,最終輸出神經元興奮度數值,神經元激活函數公式為:

      ④輸出層:神經元函數激活后,最終輸出層得到3755個節(jié)點,每一個節(jié)點分別對應一個漢字。根據步驟三中所計算出的興奮度值,最終輸出所識別漢字。

      (1)FRAEN技術:該網絡能夠識別自然場景下拉伸或縮放的文字。技術核心架構由AEN識別網絡與FEN靈活矯正網絡所構成。在識別不規(guī)則文字時。FRN對圖片中的文字進行識別并予以矯正,矯正至文字處于水平狀態(tài);隨后AEN將矯正后的圖像輸入至AEN網絡中,利用規(guī)則文字識別相關技術,如卷積神經網絡算法進行文字識別,隨后輸出預測的單詞。其中FRN技術為本節(jié)內容研究的重點。FRN技術為常用的文字矯正方法,但應用時對文字變形度的要求較為局限,僅包括平移、縮放、旋轉等。因此,當前的文字識別技術為增強對變形文字的矯正能力,引入了CNN文字矯正加強網絡,增強文字的矯正效果[4]。傳統(tǒng)的FRN處理技術易產生圖像解碼過程中的噪點,故可在矯正前,在程序內輸入最大池化層減少或避免噪點產生。FRN矯正不規(guī)則文字的結果詳見圖1。將矯正后的文字圖片輸入至卷積神經網絡中,進行規(guī)則文字處理流程,即可完成文字的識別。

      漢字屬于詞素音節(jié)類型文字,英文屬于表音文字。漢字的個數要遠遠多于英文字母的個數。對于中文文字的識別而言,文字識別時需構建大量的圖像,這導致了中文文字識別時的錯誤自檢率要遠高于英文字母。關于如何提升中文文字識別能力,筆者從分類器的選擇上提出了改進建議有條件的最好選擇包含所有字符的分類器,同時在其應用時,應對字符不同進行合理分類[5]。此過程中需對分類器進行訓練,前期以小組文字選擇的方式,將具有這一特征的文字類型進行整合,以便分類器更好的識別這一特征的字符。經過不斷地深入學習,在識別文字時,系統(tǒng)將會在分類器中選出與所檢測文字相似特征最多的字符。在對機器進行日常訓練的過程中,采用文字交叉驗證方式,使機器不斷搜集到有關文字特征的共性,對文字識別準確度的提升有顯著成效[6]。

      結束語:

      現如今,神經網絡已經成為人工智能文字識別領域的重要組成模塊,為當前文字識別的最常用手段。在未來,文字識別領域將向著對場景非拉丁文字的檢測與識別、多語言混合的端到端文字識別、曲線型文字的檢測與識別、文字圖像的自動生成及提高算法的性能角度發(fā)展。隨著科學社會的發(fā)展,文字識別技術將被更多的應用到虛擬現實、教育、車牌識別、無人駕駛等諸多領域,成為未來科學研究的主流。

      參考文獻:

      [1] 馮琬婷. 基于文字識別視角分析人工智能機器學習中的文字識別方法[J]. 電子技術與軟件工程,2019,8(13):253.

      [2] 張龍坤,何舟橋,萬武南. 基于機器學習的截圖識別翻譯應用研究[J]. 網絡安全技術與應用,2020,5(8):54-56.

      [3] 劉維維. 人工智能技術在移動終端自動化測試中的應用[J]. 軟件導刊,2021,20(2):59-62.

      [4] 劉子俊,王廷凰. 基于AR文字識別技術實現二次設備定值修改[J]. 自動化與儀器儀表,2019,6(2):161-164.

      [5] 王祥旭,潘偉,張瓊,等. 人工智能輔助惡性腫瘤診斷的應用進展[J]. 腫瘤防治研究,2020,47(10):788-792.

      [6] 高強,靳其兵,程勇. 基于卷積神經網絡探討深度學習算法與應用[J]. 電腦知識與技術,2020,5(13):169-170.

      猜你喜歡
      識別深度學習文字
      文字的前世今生
      熱愛與堅持
      當我在文字中投宿
      文苑(2020年12期)2020-04-13 00:55:10
      MOOC與翻轉課堂融合的深度學習場域建構
      大數據技術在反恐怖主義中的應用展望
      深度學習算法應用于巖石圖像處理的可行性研究
      軟件導刊(2016年9期)2016-11-07 22:20:49
      淺談哈密瓜病蟲害的防治措施
      基于深度卷積網絡的人臉年齡分析算法與實現
      軟件工程(2016年8期)2016-10-25 15:47:34
      蘋果樹常見病蟲害防治技術
      青島市中山公園園林樹木易混淆品種識別
      現代園藝(2016年17期)2016-10-17 07:35:19
      二手房| 宁阳县| 古浪县| 富顺县| 娱乐| 崇阳县| 永和县| 丁青县| 泗水县| 商南县| 商丘市| 临夏县| 丽水市| 大安市| 仪陇县| 会宁县| 阳西县| 钦州市| 包头市| 安新县| 彝良县| 新晃| 澎湖县| 中卫市| 全椒县| 鸡西市| 托里县| 清河县| 二连浩特市| 仲巴县| 铜川市| 酒泉市| 濮阳县| 石渠县| 修文县| 深水埗区| 武穴市| 长乐市| 隆化县| 库车县| 年辖:市辖区|