• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Python的圖片文本識(shí)別系統(tǒng)的研究

      2019-10-21 10:06:01韓琳
      科學(xué)與財(cái)富 2019年20期
      關(guān)鍵詞:剪裁虛擬環(huán)境像素點(diǎn)

      韓琳

      近年來隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,Optical Character Recognition(光學(xué)字符識(shí)別,簡(jiǎn)稱“OCR”)應(yīng)用的領(lǐng)域更加的廣泛,而圖片文字識(shí)別就是其中重要的一個(gè)。目前圖片文字識(shí)別的準(zhǔn)確率并沒有達(dá)到100%,這也成為了圖片文字識(shí)別發(fā)展領(lǐng)域的一大瓶頸,因此要去探索一個(gè)好的圖片文字識(shí)別算法是非常有意義的。

      圖片文字識(shí)別系統(tǒng)的基本流程為:獲得圖片、去噪處理、二值化處理、矯正圖片、行查找、文字定位、細(xì)化處理、文字特征掃描、查詢顯示文字。OpenCv提供了圖片處理的基本函數(shù),例如數(shù)據(jù)矩陣的遍歷,圖片的存儲(chǔ)等,去噪處理中的平滑處理、二值化處理等。矯正圖片就是將圖片按照文字的行擺正,該步驟是比較的關(guān)鍵一步,后面的行定位等都是依賴于圖片矯正。文字的行定位和文字定位即確定文字的區(qū)域,方便文字特征掃描,細(xì)化處理是將文字細(xì)化為一個(gè)像素,而不破壞連通性。細(xì)化處理是方便特征掃描而做的處理使數(shù)據(jù)庫中存儲(chǔ)文字特征碼和UTF-8編碼對(duì)應(yīng)起來。涉及到的相關(guān)技術(shù)主要如下。

      1. OpenCv

      OpenCv是一個(gè)基于BSD許可發(fā)行的可以跨平臺(tái)的計(jì)算機(jī)視覺庫。它可以運(yùn)行在Windows和Linux等操作系統(tǒng)之上,它是由一系列的C函數(shù)和少許的C++類構(gòu)成,同時(shí)還提供了Python、Matlab等語言的接口,實(shí)現(xiàn)了計(jì)算機(jī)視覺和圖像處理等方面的很多通用算法。

      包含的五個(gè)基本模塊,功能非常的強(qiáng)大。可以在設(shè)計(jì)中使用的是圖形處理模塊,結(jié)構(gòu)圖如下所示:

      2. UTF-8編碼

      UTF-8是一種針對(duì)Unicode的可變長度字符編碼,又稱萬國碼,由Ken Thompson于1992年創(chuàng)建。UTF-8用1到6個(gè)字節(jié)編碼Unicode字符。在計(jì)算機(jī)內(nèi)存中,統(tǒng)一使用Unicode編碼,當(dāng)我們用記事本編輯的時(shí)候,從文件中讀取的UTF-8字符被轉(zhuǎn)換為Unicode字符到內(nèi)存里,編輯完成后,保存的時(shí)候再把Unicode轉(zhuǎn)換為UTF-8保存到文件。

      3.Flask框架

      在大多數(shù)的標(biāo)準(zhǔn)當(dāng)中,F(xiàn)lask是一個(gè)小型的框架,小到可以稱之為“微框架”。 Flask有3個(gè)主要依賴,分別為調(diào)試和Web服務(wù)器網(wǎng)關(guān)接口以及路由。子系統(tǒng)是由Werkzeug提供,模板系統(tǒng)是由Jinja2提供,命令行集成是由Click提供。這些依賴全部都是由Flask的開發(fā)者Armin Ronacher開發(fā)的。

      Flask 本身是并不支持?jǐn)?shù)據(jù)庫的訪問、用戶身份驗(yàn)證和 Web 表單驗(yàn)證等高級(jí)功能的。這些功能以及大多數(shù)Web應(yīng)用需要的核心服務(wù)都以擴(kuò)展的形式實(shí)現(xiàn),然后再與核心包集成。

      4.圖像處理相關(guān)技術(shù)

      4.1圖像的灰度處理

      在我們的生活中常見的圖片大多數(shù)都是24位真彩色圖像。8位的灰度圖片就能夠包含其基本信息。所以,在處理圖片的過程中為了更快捷的對(duì)圖片信息進(jìn)行相應(yīng)的處理,首先需要對(duì)圖片進(jìn)行灰度化處理操作,灰度圖像就包含了圖像處理中所需要的圖像形態(tài)特征。在24位的真彩色圖像中,每個(gè)像素都是要用3個(gè)字節(jié)來保存,它們分別用來描述R,G,B,三種不同的顏色分量。每一種顏色的分量范圍都是從0-255,顏色的分量值越大,其對(duì)應(yīng)的顏色分量高度值就會(huì)越高,因引用255來表示最亮,用0來表示最暗。在將一個(gè)真正色彩像素點(diǎn)轉(zhuǎn)換為灰度圖時(shí),其亮度值通常按常理取三個(gè)分量的平均值。

      4.2圖像的二值化處理

      在圖片中的每個(gè)像素點(diǎn)的灰度值低于某個(gè)闕值則把它置于0,高于某個(gè)闕值把它置于255,從而使整個(gè)圖片呈現(xiàn)出一種“非白即黑”的效果,這就是圖片的二值化處理。二值化后的圖片仍然能夠反映出整個(gè)圖片的局部特征。為了能夠得到便于處理的二值化圖片,采用區(qū)域的要求是連通且封閉的并且邊界不能夠重疊?;叶戎档扔诨蛘呤歉哂谥付I值的像素點(diǎn)為目標(biāo)像素,其灰度值是255,其他的像素點(diǎn)就會(huì)被排除在物體的區(qū)域之外,其灰度值定為0。

      對(duì)于不一樣的圖片效果,可以選擇使用不同的闕值選擇方法。在空間的角度來看,分為全局闕值法和局部闕值法。全局闕值法對(duì)于具有明顯雙峰直方圖的圖像有更為顯著的效果,但是,當(dāng)圖片的光照不均勻的時(shí)候,效果就會(huì)不那么明顯。局部闕值法適用于圖片特征比較復(fù)雜的圖片,但是有一個(gè)缺陷是忽略了圖片的邊緣特征,因此會(huì)造成偽影的現(xiàn)象。

      4.3圖像的剪裁處理

      在一張含有文字信息的圖片中,非文字的部分往往占據(jù)了這張圖片的一定比例,如果不對(duì)這張圖片進(jìn)行相應(yīng)的剪裁處理,在圖片文字識(shí)別的過程中就會(huì)對(duì)這張照片的整個(gè)區(qū)域進(jìn)行掃描識(shí)別,這往往會(huì)增加了項(xiàng)目的額外開銷,與此同時(shí)也大大降低了圖片文字識(shí)別的速率。為此,在為了提高圖片文字識(shí)別的速率,對(duì)圖 片文字進(jìn)行光學(xué)字符識(shí)別之前往往是需要進(jìn)行剪裁的,剪裁之后僅保留包涵文字信息的部份,將非文字的部份區(qū)域剪裁掉。在本次設(shè)計(jì)中,圖片文字剪裁是由用戶自己手動(dòng)進(jìn)行剪裁,具體過程是:由用戶自己選擇要進(jìn)行識(shí)別的圖片,在圖片上就會(huì)出現(xiàn)一個(gè)小小的方塊,用戶自己可以根據(jù)需求隨意進(jìn)行拖動(dòng)剪裁,最終方塊內(nèi)部留下來的部份就是要識(shí)別的內(nèi)容,然后系統(tǒng)會(huì)對(duì)這一部份進(jìn)行識(shí)別處理。

      4.4文字的特征碼掃描

      本文所研究的圖片文字識(shí)別是根據(jù)所有文字的幾何特征進(jìn)行編碼,然后輸入一個(gè)能夠代表所識(shí)別文字的特征碼,文字的特征碼和文字的UTF-8編碼一起關(guān)聯(lián)存放到數(shù)據(jù)庫中。一個(gè)文字可以有很多個(gè)特征碼,然而它只能對(duì)應(yīng)一個(gè)UTF-8編碼。這樣的設(shè)計(jì)是因?yàn)榭梢詽M足不同的圖片文字特征。只有更一步的進(jìn)入文字的點(diǎn)和筆畫的關(guān)系才能夠更加具體的編出具有唯一性的特征編碼,那么接下來的每一個(gè)步驟都將會(huì)向更可靠的圖片文字識(shí)別方法靠近。

      5系統(tǒng)開發(fā)環(huán)境的搭建

      主要涉及到PyCharm的安裝, Python的安裝,虛擬環(huán)境的搭建。搭建虛擬環(huán)境有兩個(gè)目的,一是為了真實(shí)環(huán)境不被破壞。二是為了開發(fā)時(shí)的版本號(hào)不沖突,在Python3中,虛擬環(huán)境由Python標(biāo)準(zhǔn)庫中的venv包原生支持。

      綜上所述,本文獨(dú)立自主的去探索一種基于文字幾何特征去深入文字內(nèi)部來獲取文字特征編碼。這樣的編碼的唯一性非常高。并且可重入性也非常高。雖然該方法復(fù)雜,但是卻類似人類來識(shí)別文字的過程。

      猜你喜歡
      剪裁虛擬環(huán)境像素點(diǎn)
      虛擬環(huán)境中空間壓縮問題的影響與改善
      包裝工程(2023年16期)2023-08-25 11:32:42
      心靈手巧的“剪裁師”——卷葉象甲
      前庭刺激對(duì)虛擬環(huán)境三維空間定向的影響及與空間能力的相關(guān)關(guān)系
      載人航天(2021年5期)2021-11-20 06:04:34
      如何通過虛擬環(huán)境有效管理Python第三方庫
      渾然一體有玄奧——寫人作文之人事“剪裁”與“拼接”
      論報(bào)紙圖片編輯如何巧“剪裁”
      新聞傳播(2018年10期)2018-08-16 02:10:08
      基于canvas的前端數(shù)據(jù)加密
      虛擬環(huán)境下大數(shù)據(jù)智能并行聚類方法研究
      基于逐像素點(diǎn)深度卷積網(wǎng)絡(luò)分割模型的上皮和間質(zhì)組織分割
      基于Node-Cell結(jié)構(gòu)的HEVC幀內(nèi)編碼
      普陀区| 石渠县| 永康市| 佛冈县| 沁源县| 集安市| 田东县| 康保县| 盐城市| 临安市| 井研县| 仁怀市| 潼关县| 康乐县| 博罗县| 浦北县| 汉川市| 饶平县| 莎车县| 禹州市| 古田县| 涪陵区| 榆树市| 赤城县| 永修县| 彭泽县| 新竹市| 肇州县| 许昌县| 宜城市| 凯里市| 安塞县| 固原市| 革吉县| 永平县| 陕西省| 和硕县| 邵阳县| 尚义县| 周口市| 长顺县|