文本圖像條帶污染去除的0稀疏模型與算法

2022-07-12 14:03:44耿則勛

計算機應(yīng)用與軟件 2022年6期

喻恒耿則勛,2

1(平頂山學(xué)院信息工程學(xué)院河南平頂山 467000) 2(信息工程大學(xué)地理空間信息學(xué)院河南鄭州 450052)

0 引言

文字作為人們普遍使用的信息交流載體，在信息傳播中發(fā)揮著重要作用，現(xiàn)代文字通常采用橫向表述的方式，因此條帶污染是網(wǎng)絡(luò)文本圖像最常用、最經(jīng)常出現(xiàn)的干擾、加噪及涂改方式(如圖1所示)，這種圖像涂改方式并不會影響閱讀者對于文字圖像內(nèi)容的理解，但是會嚴(yán)重干擾網(wǎng)絡(luò)監(jiān)管系統(tǒng)的對文字信息的自動識別，因此研究污染的文本圖像條帶去除技術(shù)，對網(wǎng)絡(luò)中文本圖像的識別和監(jiān)管具有重要的現(xiàn)實意義。

(a) 文檔圖像 (b)網(wǎng)絡(luò)文本圖像圖1 條帶污染的文本圖像

一般意義上受污染的文本圖像主要指采用掃描儀、復(fù)印機等光學(xué)儀器對紙質(zhì)文檔掃描成像時，受紙張質(zhì)量、背景等原因產(chǎn)生的噪聲[2]，大量研究都集中在去除這類噪聲污染而針對人為或手工故意添加的條帶型污染、劃痕、標(biāo)注等噪聲去除與恢復(fù)的研究較少。通常學(xué)術(shù)界對條帶噪聲的研究一般集中于遙感圖像，是由探測元件掃描不一致或探測器運動、溫度變化等因素的影響引起的一種系統(tǒng)性條紋污染[3]。這種噪聲污染與文本圖像的條帶污染都是對圖像的像素進行逐行破壞，具有一定相似性。

近年來，針對遙感圖像的條帶去除方法主要是分為三類：基于濾波的方法、基于統(tǒng)計的方法和基于泛函變分的方法?；跒V波的方法是通過各種濾波器去除遙感圖像的條帶噪聲(如文獻[4-6])。基于統(tǒng)計的方法主要是分析條紋的分布(如文獻[7-8])。最近，基于泛函變分的方法在遙感圖像去除條帶噪聲問題上顯示出優(yōu)越性，該方法主要是探索和發(fā)現(xiàn)內(nèi)在先驗知識，生成合理的正則化模型。文獻[9]提出了一種去除MODIS圖像條紋的單向全變分(Unidirectional Total Variation，UTV)模型。文獻[10]提出了一種將UTV與稀疏條紋先驗相結(jié)合的優(yōu)化模型。文獻[11]利用具有各向異性光譜空間全變分正則化的分裂Bregman迭代法去除多光譜圖像條紋。文獻[3]提出了一種非凸L0稀疏遙感圖像去噪模型，并通過近似交替方向乘數(shù)法(PADMM)為基礎(chǔ)的算法求解得到了較好的結(jié)果。然而，文本圖像中的條帶噪聲相比較于遙感圖像中的條帶噪聲對于圖像像素的逐行破壞比較嚴(yán)重，對文字覆蓋的像素寬度比例也更大，單純采用遙感圖像的去條帶方法并不能準(zhǔn)確地估計出條帶圖像，需要尋找到合適的方法準(zhǔn)確地估計并修復(fù)條帶區(qū)域，這也是本文的主要工作。

圖像修復(fù)方法主要分為兩類：基于偏微分方程(PDE)的方法和基于范例/樣本的方法?；跇颖镜姆椒ㄊ且环N非常有效的大目標(biāo)區(qū)域修復(fù)方法。它們傾向于通過直接從源區(qū)域復(fù)制和粘貼來填充目標(biāo)區(qū)域，從而很好地保留圖像紋理[12-14]?；谄⒎址匠痰姆椒ú惶m合恢復(fù)大區(qū)域的紋理，但非常適合于完成直線、曲線和修補小區(qū)域，可以有效避免斷裂邊緣，因此更適合文本字符圖像的修復(fù)。這項技術(shù)首先由Bertalmio等提出[15]。根據(jù)Bertalmio等的工作，文獻[16-17]提出了兩個基于偏微分方程的模型，全變分(TV)模型和曲率驅(qū)動擴散(CDD)模型，用于處理非紋理圖像的修復(fù)問題。近年來基于TV模型的修復(fù)研究得到不斷拓展，文獻[18]提出了一種自適應(yīng)分?jǐn)?shù)階TV修復(fù)算法，利用分?jǐn)?shù)階微分的全局性，將ROF修復(fù)模型的正則項由一階微分拓展到分?jǐn)?shù)階微分。文獻[19]提出結(jié)合紋理結(jié)構(gòu)的分?jǐn)?shù)階微分TV模型，文獻[20]改進了TV修復(fù)算法，在正則項中加入自適應(yīng)參數(shù)擴散調(diào)節(jié)系數(shù)，提高了運算速度，獲得了較好的效果。因此可以判斷出TV模型算法是一種廣泛使用的基于偏微分方程的修復(fù)算法。

綜上所述，為了去除文本圖像的條帶污染，我們從條帶的結(jié)構(gòu)特性出發(fā)，提出了一個基于稀疏模型的污染范圍(或區(qū)域)估計方法，該模型主要由三個稀疏先驗構(gòu)成，包括基于原圖與修復(fù)圖相似性的約束項、條帶(Y軸)的方向特性的L0稀疏先驗、條帶(X軸)的過平滑“L0稀疏先驗”；在X軸和Y軸先驗?zāi)Ｐ椭幸胱赃m應(yīng)參數(shù)，實現(xiàn)對水平條帶的細節(jié)保持和其他方向紋理的平滑并給出對該稀疏模型的優(yōu)化求解算法，估計出準(zhǔn)確的條帶污染區(qū)域。為了保證字符的完整連續(xù)，我們采用經(jīng)典的TV模型圖像修復(fù)方法恢復(fù)文字。仿真和測試圖像的結(jié)果表明，該方法可以有效去除文本圖像的條帶污染，與當(dāng)前最新的遙感圖像去除條帶噪聲算法以及條紋脈沖噪聲圖像修復(fù)算法相比，本文估計的條帶污染區(qū)域更加準(zhǔn)確，PSNR和SSIM值也有很大提高，均值分別在20和0.93以上，污染英文文本圖片文字正確識別率提高40%以上，中文文本提高10%以上。

1 條帶估計算法研究

1.1 條帶噪聲模型

遙感圖像條帶噪聲一般由加性成分和乘性成分組成[21]。文本圖像中的條帶污染主要是人為在原圖上添加的規(guī)則或不規(guī)則的條紋型噪聲污染，因此本文將研究集中在加性條帶模型上。

u(x,y)=n(x,y)+s(x,y)

(1)

式中：u(x,y)表示觀察圖像；s(x,y)表示條帶分量；n(x,y)表示底層文本圖像。為了方便起見，將式(1)按照逐行轉(zhuǎn)置疊加的方式改寫成如下的向量形式：

U=N+S

(2)

式中：U,N,S∈Rn,n=M×N，分別表示觀測圖像、修復(fù)圖像和條帶噪聲，M和N表示圖像的行列數(shù)。我們的工作目的是估計條帶S，找出被污染的區(qū)域，然后進行修復(fù)。

1.2 0梯度最小化模型

(3)

式中：第一項是保真項，Sp表示平滑后輸出圖像，Up表示輸入的觀測圖，p表示圖像像素坐標(biāo)位置；λ是正則化參數(shù)，C(S)表示0范數(shù)正則化項即

C(S)=‖▽Sp‖0=#{p||▽xSp|+|▽ySp|≠0}

(4)

式中：▽是圖像的差分運算符，▽x表示沿水平方向的差分運算，▽y表示沿垂直方向的差分運算。C(S)表示圖像在水平方向和垂直方向梯度不為0的像素個數(shù)。

1.3 條帶估計模型

分析條帶污染的文本圖像，可將未覆蓋的文字區(qū)域看作待平滑區(qū)域，條帶區(qū)域為平滑后的待保留區(qū)域。污染條帶一般是逐行(X軸)或近似逐行出現(xiàn)的，并且條帶自身可近似為灰度相等、均勻連續(xù)的水平條狀窄帶，相鄰像素之間水平差異(X方向梯度)很小，或者甚至接近零，因此，我們使用條帶水平方向(X軸)梯度稀疏的先驗?zāi)Ｐ?，?

R1=λ1‖▽xS‖0

(5)

?yS>>?xS?xS≠0

(6)

式中：?xS和?yS分別表示圖像水平方向和垂直方向的偏導(dǎo)數(shù)。如果只采用式(5)的正則項，可以對圖1(a)所示的條帶污染進行完美的估計，但是對手工添加的不規(guī)則條帶污染(圖2(a))提取效果比較差。圖2(b)所示為只包含式(5)的模型對圖2(a)提取的條帶區(qū)域，可以看出無法精確地提取出非水平方向的條帶。

(a) 人工條帶污染文本圖

(b) X軸正則項提取條帶圖像

為此我們引入帶自適應(yīng)參數(shù)的垂直方向正則化項并定義正則化項參數(shù)：

(7)

同時定義式(5)正則化參數(shù)λ1為：

(8)

式中：k1,k2∈R+為輔助參數(shù)；ε為不等于零的極小正數(shù)，防止出現(xiàn)分母為零的情況。在近似水平條帶區(qū)域，▽xS值較小，▽yS的值較大，λ1值趨近于無窮小，λ2的值趨近于無窮大，可以有效地平滑掉垂直方向的紋理，保持水平條帶，這與我們的目的一致。但是在垂直紋理區(qū)域(文本字符部分區(qū)域)當(dāng)▽xS值較小，▽yS的值較大，λ1值趨近于無窮大，λ2的值趨近于無窮小，會保持垂直紋理，這與我們的目的不一致，因此設(shè)置兩個輔助參數(shù)k1、k2，k1參數(shù)值偏大，用來抑制Y軸方向梯度，k2參數(shù)值偏小，用來盡可能保持水平紋理。而在非垂直非水平的紋理(字符的部分筆畫)部分，λ1、λ2可保持在合適的數(shù)值，使得非條帶區(qū)域的文本部分被有效地平滑掉。如果缺乏自適應(yīng)參數(shù)，則模型會有效地保持任意梯度的紋理條紋，使得針對條帶污染的提取失敗，如圖2(c)所示。

(9)

式中：第一項為保真項，S為條帶圖像，U為觀測的條帶污染圖像。

1.4 模型求解

(10)

C1(S)=#{p||▽xS|≠0}

(11)

C2(S)=#{p||▽yS|≠0}

(12)

引入輔助變量(hp,vp)，令hp=▽xSp,vp=▽ySp，將目標(biāo)函數(shù)重寫為：

(▽yS-vp)2]+λ1C1(h)+λ2C2(v)}

(13)

式(13)的目標(biāo)函數(shù)可分解為下述3個子問題：

S子問題：

(14)

h子問題：

(15)

v子問題：

(16)

下邊分別討論每個子問題求解方法。

1)S子問題最小化可寫作以下形式：

(17)

以矩陣向量的形式表示為：

(18)

式(18)為連續(xù)可微凸泛函，對J求關(guān)于S的一階偏導(dǎo)數(shù)，并令偏導(dǎo)數(shù)等于零，得到：

S=[E+β(BTB+DTD)]-1[U+β(BTH+DTV)]

(19)

直接求逆矩陣計算耗時，可對上述方程兩端作傅里葉變換，注意B、D為循環(huán)矩陣，其傅里葉變換的卷積等于對應(yīng)元素的乘積，因而有：

(20)

2)h子問題能量函數(shù)可以寫作：

(21)

因為C1(h)是0范數(shù)，當(dāng)λ1/β≥(▽xSp)2時，若hp不等于0，則:

(22)

若hp等于0，則:

Ep=(▽xSp)2

(23)

所以hp=0時，minEp=(▽xSp)2。

當(dāng)λ2/β<(▽xSp)2時，若hp不等于0，則:

(24)

若hp等于0，則:

(25)

綜合以上兩種情況，有h子問題最優(yōu)解表達式為：

(26)

3) 對于v子問題最優(yōu)解表達式為：

(27)

綜合以上三個子問題的分析，對于式(9)的最小化求解算法如算法1所示。

算法1式(9)算法

輸入：觀察圖像U(包含條帶污染)，參數(shù)β0、βmax迭代系數(shù)r，參數(shù)k1、k2。

初始化：S←U，β←β0，i←0

當(dāng)β≤βmax重復(fù)：

3)β←rβ，i++

輸出：圖像S

結(jié)合步驟1)到步驟3)，給出式(9)的完整算法。特別是子問題都有閉式解公式。有關(guān)算法的收斂性分析參見文獻[22]。算法1中總結(jié)了求解過程，其中β0、βmax、k1、k2是預(yù)先定義的參數(shù)。本文將k1設(shè)置為1 000，k2設(shè)置為0.001。

由于文本或文檔圖像中的字符包含有極小的水平梯度的像素區(qū)域，因此通過算法1得到的條帶估計圖像會一定程度上保留這些水平梯度區(qū)域，在估計的條帶圖像中以噪聲的形式存在，因此需要對條帶圖像做進一步去噪處理，以得到準(zhǔn)確的條帶圖。本文采用了形態(tài)學(xué)去除小區(qū)域的方法，以8連通域為標(biāo)準(zhǔn)，計算各區(qū)域像素個數(shù)記為該連通域面積，將像素面積較小的噪聲區(qū)域進行去除，從而得到文本圖像條帶污染區(qū)域的最終估計。

2 文本圖像修復(fù)

文本文檔圖像中的條帶污染一般可分為覆蓋文字區(qū)域和未覆蓋文字區(qū)域兩類對于未覆蓋文字的條帶形標(biāo)注、涂改可采用N=U-S直接獲取底層文本圖像，但是因為覆蓋文字的條帶區(qū)域較大，簡單的通過式(2)獲得的去條帶圖像會有很大部分的像素缺失，對于文本識別是不利的?？紤]到文本圖像不同于普通的灰度圖像，文字特征在圖像中的表達更趨近于一種紋理，因此本文采用基于TV模型的圖像修復(fù)，在之前估計出的污染區(qū)域的基礎(chǔ)上，進一步恢復(fù)被條帶污損的文字。

TV模型圖像修復(fù)方法是一種基于偏微分方程的圖像修復(fù)方法，其修復(fù)模型為：

(28)

式中：D為待修復(fù)區(qū)域即估計的條帶區(qū)域，E為D的鄰域，第一項為正則項，作用是尋求E∪D區(qū)域的最優(yōu)解，第二項是保真項，u0為待修復(fù)圖像，u為估計得到的最優(yōu)修復(fù)圖像，λ為平衡正則項和保真項的正則化參數(shù)。

(29)

(30)

3 實驗結(jié)果與比較

本節(jié)將對所提出的方法性能進行分析，針對英文和中文文本圖像中水平方向的規(guī)則條帶、近似水平的不規(guī)則條帶以及各種行寬強度的條帶污染進行估計和修復(fù)，并分析修復(fù)前后的文本圖像PNSR和SSIM值，以及文字識別率。因為目前針對文本圖像去條帶污染的相關(guān)研究較少，本文與幾種最新的去條帶方法和圖像修復(fù)方法進行比較，包括遙感圖像條帶去除和脈沖噪聲圖像修復(fù)等。由于沒有標(biāo)準(zhǔn)的測試圖像集，我們使用規(guī)則/非規(guī)則條帶噪聲污染文本圖像建立一個包含150幅圖像的測試集(測試文本包含原圖以及污染圖片，內(nèi)容為隨機選取中英文文檔，不包含任何含義)，其中規(guī)則條帶污染各種文本文檔圖像50幅，不規(guī)則條帶污染各種文本文檔圖像50幅，不同強度條帶污染圖像50幅。所有實驗均在4 GB RAM和Inter(R)Core(TM)CPU i7- 5500UCPU,@2.40 GHz的臺式機上用MATLAB(R2016a)進行。

3.1 規(guī)則條帶文本圖像修復(fù)

規(guī)則的條帶污染文本文檔圖像一般指使用辦公軟件或者圖像編輯軟件自動添加的水平條紋，這種方式添加的條帶一般為絕對水平梯度，覆蓋整個文字區(qū)域。本文算法效果如圖3所示。

(a) 英文文本圖像修復(fù)

(b) 中文文本圖像修復(fù)圖3 規(guī)則條帶污染的文本圖像條帶估計與修復(fù)

可以看出，使用辦公軟件對英文和中文文本添加的規(guī)則水平梯度的條帶污染，本文算法可以準(zhǔn)確地估計出條帶圖像，修復(fù)后的圖像能夠完整地去除條帶部分，并對條帶遮擋區(qū)域進行了效果滿意的恢復(fù)，如字母“e”和漢字“民”，但是個別字符仍然存在修復(fù)不完全的情況，如字母“A”和漢字“毛”。

為了客觀評價算法的有效性，我們比較去除條帶前后圖像的PSNR、SSIM值，同時為了驗證算法的實際應(yīng)用性(即條帶污染的網(wǎng)絡(luò)文本圖像的文字識別)，我們使用同一文字識別模型的OCR識別算法對修復(fù)前后的文本圖像進行識別。按照識別率=正確識別字符個數(shù)/全部字符個數(shù)×100%的公式計算(下文的識別率都按照此方法進行初步定性分析)。

圖2(a)英文文本圖像修復(fù)前PSNR、SSIM值分別為16.216 4、0.876 7，正確識別(按順序)率44.2%，修復(fù)后PSNR、SSIM值分別為22.357 9、0.967 3，正確識別率98%，；圖2(b)漢字文本圖像共31個字符(包括標(biāo)點)修復(fù)前PSNR、SSIM值分別為18.382 6、0.889 4，正確識別率87%，修復(fù)后PSNR、SSIM值為25.397 7、0.953 3，正確識別率達到100%。我們對50副規(guī)則條帶污染文本圖像(英文23副，中文27副)進行實驗，英文條帶文本圖像PSNR平均提高6.53，SSIM值平均提高0.087，字符識別率平均提高53.2%，中文條帶文本圖像PSNR平均提高7.93，SSIM值平均提高0.092，字符識別率平均提高14.9%，因此本文算法對于規(guī)則條帶污染的文本圖像修復(fù)具有較好的效果。

3.2 不規(guī)則條帶文本圖像修復(fù)

不規(guī)則條帶污染指的是人為添加條狀或近似條狀的涂改，一般包括兩種情況，一種是指通過圖像編輯軟件手動添加的條狀涂改標(biāo)注等，這一類是直接對數(shù)字圖像進行編輯；另一類是紙質(zhì)書籍、文檔中手工添加的條帶狀標(biāo)注、涂改、刪除等，當(dāng)需要轉(zhuǎn)化為電子文檔、數(shù)字圖片進行保存或?qū)臋n中的文字進行自動識別時，就需要將這些條帶污染去除。這類條帶污染一般是近似水平梯度的情況，而且是不規(guī)則的出現(xiàn)，如圖4所示。

(a) 中文書籍文本圖像修復(fù)

(b) 英文書籍文本圖像修復(fù)

(d) 英文電子文檔文本圖像修復(fù)圖4 不規(guī)則條帶污染的文本圖像(黑色背景上的白色條子圖帶表示估計的污染區(qū)域)

可以看出，分別對中文書籍圖像(圖4(a))、英文書籍圖像(圖4(b)),中文字符電子文檔圖像(圖4(c))、英文字符電子文檔圖像(圖4(d))人工添加條帶污染，雖然條帶噪聲在部分區(qū)域呈現(xiàn)非水平梯度，算法仍然能夠很好地提取完整的條帶圖像，并對文本圖像進行修復(fù)，達到正常閱讀和識別的目的，這從實驗的視覺效果中可以直接體會到。修復(fù)前后PSNR、SSIM與OCR算法文字識別率(只針對條帶覆蓋字符區(qū)域)結(jié)果如表1所示。

表1 人工條帶污染文本圖像修復(fù)前后評價數(shù)據(jù)對比

可以看出，條帶污染對英文文本的字符識別率破壞比較嚴(yán)重，而被污染的中文字符的識別率稍高，經(jīng)本文算法處理后的文本圖像的PSNR、SSIM值以及識別率都得到了有效改善。通過對50幅人工污染的條帶文本圖像(中文書籍圖片15幅，英文書籍圖片8幅，中文電子文檔圖片15幅，英文電子文檔圖片12幅)仿真實驗分析，中文書籍圖片修復(fù)后文字PSNR和SSIM平均分別提高4.98、0.079，識別率平均提高12.5%，英文書籍圖片修復(fù)后PSNR和SSIM平均提高4.33、0.068，識別率提高50.3%，中文電子文檔圖片修復(fù)后識別率提高9.8%，PSNR和SSIM分別提高7.84、0.082，英文電子文檔圖片修復(fù)后識別率提高62.4%，PSNR和SSIM分別提高8.14、0.089。因此本文方法在去除人工污染的英文文本圖像中不規(guī)則條帶方面同樣有很好的表現(xiàn)，有效去除了條帶噪聲，提高了文本圖像的識別率。

3.3 不同強度條帶去除分析

從圖4的結(jié)果中可以初步分析出，條帶區(qū)域在覆蓋文字字符占比較大即條帶行寬較大的情況下，文字修復(fù)后的視覺效果和識別率均有一定程度的降低。為了進一步分析本文算法對于文本圖像不同行寬的條帶污染估計和修復(fù)能力，我們對同一文本圖像添加不同行寬的條帶污染，分析本文算法對條帶圖像的估計情況和修復(fù)效果。

如圖5、圖6所示，對同一英文文本圖像和中文文本圖像添加不同行寬強度的規(guī)則與不規(guī)則的條帶污染，通過實驗結(jié)果視覺效果可以看出，本文算法能夠精確地估計出不同強度的條帶污染區(qū)域，但是隨著條帶行寬強度增大，字符修復(fù)的效果逐漸變差，在條帶噪聲強度最大的最后一行出現(xiàn)字符被遮擋區(qū)域效果更差。

圖5 英文文本不同強度條帶估計與修復(fù)

圖6 中文文本不同強度條帶估計與修復(fù)

為了分析本文方法在不同強度條帶污染的文本圖像修復(fù)的文字識別率，對同一文本圖像添加強度逐漸增加的條帶污染，計算PSNR和SSIM值，通過OCR方法進行識別，并分析識別率。

如圖7所示，對同一英文文檔圖像(共計34字符)添加三種強度寬度規(guī)則條帶污染和不規(guī)則條帶污染。修復(fù)前后的PSNR與SSIM值如表2所示。圖7(a)三幅圖像字符識別率分別為58.8%、26.5%、0%；修復(fù)后圖7(e)字符識別率分別為100%、79.4%、18.8%；圖7(b)字符識別率分別為64.7%、56.3%、41.2%，修復(fù)后圖7(f)字符識別率分別為100%、91.2%、79.4%。通過實驗結(jié)果可以分析出本文方法在不同強度條帶污染的英文文本圖像修復(fù)上都大幅度提高了字符的識別率，但是隨著條帶強度的增大，PSNR與SSIM值以及識別率有所下降，但相比較比原圖有著一定提高，這一數(shù)據(jù)也和主觀視覺感受相一致。

(a) 規(guī)則條帶 (b) 不規(guī)則條帶

(e) 規(guī)則條帶修復(fù)圖像 (f) 不規(guī)則條帶修復(fù)圖像圖7 多強度條帶英文文本圖像修復(fù)

表2 多強度條帶英文文本圖像修復(fù)PSNR和SSIM

如圖8所示，對同一中文文檔圖像(共計15字符)添加三種強度寬度規(guī)則條帶污染和不規(guī)則條帶污染，修復(fù)前后的PSNR與SSIM值如表3所示。原始圖像圖8(a)三字符識別率分別為80%、66.7%、60%；修復(fù)后圖8(e)字符識別率分別為100%、93.3%、53.3%；圖8(b)字符識別率分別為93.3%、53.3%、46.7%，修復(fù)后圖8(f)字符識別率分別為100%、93.3%、46.7%。通過實驗可以分析出因為中文字符的結(jié)構(gòu)與英文的差別，條帶污染對中文字符識別率的影響要低于英文字符，但相同的是條帶強度越大，PSNR、SSIM值和識別率越低，通過本文算法修復(fù)后的各項數(shù)據(jù)均有一定提高，在條帶強度逐漸增大的情況下，數(shù)據(jù)改善效果逐漸降低。

(a) 規(guī)則條帶 (b) 不規(guī)則條帶

(e) 規(guī)則條帶修復(fù)圖像 (f) 不規(guī)則條帶修復(fù)圖像圖8 多強度條帶中文文本圖像修復(fù)

表3 多強度條帶中文文本圖像修復(fù)PSNR與SSIM

為了驗證本文方法在不同強度條帶污染圖像修復(fù)效果一般性，我們采用圖7、圖8實驗方法分析三種強度條帶污染(規(guī)則和不規(guī)則)的文本圖像50幅(電子文本圖片)的文字識別率，每幅不少于100字符。其中英文25幅(規(guī)則條帶12幅，不規(guī)則13幅)，每幅中文25幅(規(guī)則條帶12幅，不規(guī)則13幅)，計算修復(fù)后的字符識別率(如圖9、圖10所示)，直方圖縱坐標(biāo)為字符識別率，橫坐標(biāo)為測試圖像編號，淺灰色直方圖為0.5磅寬度條帶，標(biāo)注為強度1，深灰色直方圖為1.5磅寬度條帶，標(biāo)注為強度2，黑色為2.5磅寬度條帶，標(biāo)注為強度3。

(a) 規(guī)則條帶英文OCR識別率直方圖

(b) 不規(guī)則條帶英文OCR識別率直方圖圖9 英文文本圖像OCR識別率直方圖對比

(a) 規(guī)則條帶中文OCR識別率直方圖

(b) 不規(guī)則條帶中文OCR識別率直方圖圖10 中文文本圖像OCR識別率直方圖對比

由識別率直方圖對比結(jié)果可以看出，本文算法對不同強度條帶污染文本圖像的修復(fù)識別率顯著提高，但是隨著條帶行寬增加(如強度3條帶圖像)，條帶覆蓋字符區(qū)域面積比例較大，對字符結(jié)構(gòu)破壞比較嚴(yán)重，修復(fù)后識別率提高效果不明顯，說明修復(fù)算法還有進一步提升的空間，但是實驗結(jié)果仍然證明本文方法在去除條帶，提高文本圖像識別率上確實有效的。

3.4 本文算法與其他算法比較

因為目前在文本圖像條帶污染去除方面的研究較少，為了進一步分析本文算法與其他方法在文本圖像去除條帶的修復(fù)效果，我們選擇在遙感圖像去除條帶噪聲效果較好的幾種最新算法，包括方向0稀疏建模的圖像條紋噪聲去除(UESTC)[3](圖11(a))、基于圖像分解的遙感圖像條紋噪聲去除(LRSID)[25](圖11(b))，以及0TV稀疏優(yōu)化方法的脈沖噪聲圖像恢復(fù)算法[23](圖11(c))?？梢钥闯鋈N算法在條帶估計和圖像修復(fù)上都有較好的視覺效果。

(a) UESTC

(b) LRSID

為了比較三種算法和本文方法文本圖像條帶去除效果，實驗選用0.5磅強度的規(guī)則/不規(guī)則條帶污染文本圖像，分別給出了四種算法對測試圖的條帶估計級圖像修復(fù)效果，并比較去除條帶后圖像的PSNR、SSIM值以及OCR識別率。

如圖12(b)所示，UESTC算法能夠較好地估計出文本圖像規(guī)則條帶污染圖像，修復(fù)效果也可達滿意效果，但是對于不規(guī)則條帶的估計和修復(fù)效果不好，特別是非水平梯度區(qū)域；圖12(c)中LRSID算法也可估計出規(guī)則條帶，但是對于不規(guī)則條帶的估計以及整體修復(fù)結(jié)果較差；圖12(d)0TV算法因為缺少精確的條帶估計方法，使得對所有類型文本圖像修復(fù)效果都比較差。本文算法可以精確地估計規(guī)則條帶進行修復(fù)，尤其在不規(guī)則條帶的估計和文本圖像修復(fù)上有著明顯優(yōu)于其他算法的表現(xiàn)，這從實驗的視覺效果中可以直接體現(xiàn)出來。

(a) 條帶污染文本圖

(b) UESTC

(d) 0TV

(e) 本文算法圖12 不同算法去除文本條帶污染效果比較

為了量化本文算法文本圖像去條帶能力，實驗分別給出4種算法條帶污染文本圖像修復(fù)后對應(yīng)的PSNR、SSIM以及文字OCR識別率(以單個字符為準(zhǔn))計算值如表4所示。為了制表方便，圖12(a)四幅受污染文本圖像分別標(biāo)記為圖像1、圖像2、圖像3和圖像4。

表4 四種算法PSNR、SSIM和OCR識別率

可以看出，本文算法修復(fù)的圖像在PSNR和SSIM值上都明顯優(yōu)于其他三種算法，尤其在修復(fù)圖像識別率上有著更優(yōu)秀的表現(xiàn)。采用以上方法對10幅條帶污染圖像的實驗分析比較，本文算法在英文文本修復(fù)圖像的PSNR值均在20左右，SSIM值在0.93左右，對中文文本修復(fù)圖像的PSNR值均在24左右，SSIM值在0.94左右，都優(yōu)于其他算法。OCR識別率本文算法的規(guī)則條帶識別率都在90%以上，不規(guī)則條帶文本識別率均在95%以上，綜合以上實驗數(shù)據(jù)，本文算法具有良好的文本圖像條帶去除能力，基本達到提高識別率的要求。

3.5 一般性實驗

為了驗證算法的一般性，我們又對包含文本字符較多的大幅文本圖像進行了仿真實驗，部分實驗結(jié)果如圖13所示。

(a) 英文文本條帶提取與修復(fù)

(b) 中文文本條帶提取和修復(fù)圖13 多行大幅文本圖像條帶提取和修復(fù)

由圖13的實驗結(jié)果可以觀察到，本文算法針對行數(shù)較多的大幅文本圖像也能夠較好地提取條帶污染并進行修復(fù)。我們在測試集基礎(chǔ)上添加了20幅平均超過15行的大幅文本污染圖像，經(jīng)過實驗均能有效地提取出文本中的條帶污染進行修復(fù)，證明本文算法針對一般尺寸的書籍、文檔等數(shù)字圖像的條帶污染具有較好的修復(fù)能力。

3.6 局限性分析

由于我們的方法是假定文本圖像條帶的具體類型是水平梯度和近水平梯度的，雖然這與文本涂改的一般情況相一致，但是對于非水平梯度的涂改污染修復(fù)效果還是有限的。同時本文方法雖然可以良好地估計出各種行寬強度的條帶圖像，但是對強度較大的條帶圖像修復(fù)效果還達不到滿意的結(jié)果，因此對于任意方向、行寬強度條帶污染文本污染的估計和文本圖像的修復(fù)算法還需要進一步研究。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

文本圖像條帶污染去除的0稀疏模型與算法

0 引言