劉明興 劉澤平 李斌 符朝興 孟含
摘要:為解決不均勻光照下圖像二值化問題,提出一種基于最大類間方差法(OTSU算法)的改進二值化算法,將圖片分為明亮區(qū)域和陰暗區(qū)域兩部分,分別計算兩部分最大類間方差對應(yīng)的閾值,通過分析陰暗區(qū)域特征,判斷每一像素點位于明亮區(qū)域還是陰暗區(qū)域,從而確定每一點的閾值。實驗結(jié)果表明,該算法可以解決OTSU算法處理光照不均勻圖像丟失信息問題,可廣泛應(yīng)用于光照不均勻條件下的文本圖像二值化處理,針對特殊情況較好,相對于其他算法適用性更強,本算法可通過提高OTSU算法的運算速度,縮減算法的運行時間。該研究提取信息較為完整,可以作為字符識別及缺陷檢測等工作的預(yù)處理方法,提高識別精度。
關(guān)鍵詞:二值化; OTSU; 不均勻光照; 閾值分割; 最大類間方差; 全局閾值
中圖分類號: TP391.413??文獻標識碼: A
近年來,數(shù)字化圖像技術(shù)在許多學(xué)科都得到了廣泛應(yīng)用[1]。例如可以結(jié)合邊緣檢測對采煤沉陷、耕地作物絕產(chǎn)邊界識別,結(jié)合快速行進方法完成風(fēng)洞試驗缺陷修復(fù)等[23]。在對數(shù)字化圖像進行二值化處理時,通過選取適當?shù)拈撝?,將圖像分為背景與目標,提取其中的特征和有效信息[45]。作為圖像處理的預(yù)處理手段,當背景光照均勻時,可以有效地過濾圖像背景信息,不均勻光照的二值化算法可以有效提高自然光照下的文本識別和QR碼識別等[67]工作的速度和準確度。對光照均勻的圖片進行二值化處理時,使用全局閾值方法可以將圖片中的信息提取出來,并取得較好的效果。全局閾值方法主要有灰度平均值法、基于谷底最小值的閾值、迭代法、OTSU法等[89]。其中,OTSU算法計算簡單快速,受亮度和對比度影響較小,應(yīng)用較為廣泛。例如基于OTSU算法和HU不變矩進行信號燈識別、生物組織損傷辨識等[1011]。目前,改進OTSU算法多針對OTSU算法時間復(fù)雜度高、實時性差的問題,對OTSU算法運行速度進行改進,王玉銀等人[1214]基于狼群優(yōu)化或粒子群算法,提高了OTSU算法的運行效率。但當背景光照不均勻時,OTSU算法不能很好的提取圖片中的信息。為了解決光照不均勻條件下的圖像二值化問題,一般采用局部閾值算法,例如Bernsen算法、Niblack算法、Sauvola算法等,局部閾值化算法經(jīng)常會出現(xiàn)大量噪點,而且運行時間也較長[1516],或者基于Retinex或Gamma矯正直接對圖片進行圖像增強、光照平衡后在進行二值化處理,該方法需要在增強圖像后再一次對圖像進行二值化處理,無法直接得到二值化圖像[1719]。在缺陷檢測、邊緣檢測等方面,OTSU算法經(jīng)常無法達到預(yù)期效果,羅鈞等人[2025]基于小波變換等理論,對OTSU算法在速度或適用范圍方面進行了改進?;诖?,本文提出了一種利用OTSU算法,分別計算圖像明亮處與陰暗處的最大類間方差,通過分析光照不均勻圖像,判斷每一像素點位于圖片明亮處還是陰暗處,確定每一點的閾值,對圖片明亮處和陰暗處分別確定兩區(qū)域的閾值。實驗結(jié)果表明,在不均勻光照條件下,該方法可以有效提取圖像的特征和信息。該研究具有廣泛的應(yīng)用前景。
1?OTSU算法
1.1?全局二值化算法
全局二值化算法進行二值化處理時,計算一個全局閾值,逐點計算圖像灰度值與閾值的大小關(guān)系。將圖像中坐標為(x,y)點的像素灰度值記為f(x,y),二值化處理后的圖像中坐標為(x,y)點的像素值記為g(x,y),閾值記為T,則可將常規(guī)二值化方法表示為
g(x,y)=0,f(x,y) 1.2?OTSU算法 OTSU算法又名最大類間方差法,是由日本學(xué)者大津展之于1979年提出,利用整副圖像的直方圖特性,選擇全局閾值T。文字圖片和背景通常會出現(xiàn)兩個駝峰,確定一個灰度值作為閾值,將灰度值小于閾值的點作為目標,大于等于閾值的點作為背景。遍歷整副圖像灰度值,選擇類間方差最大時對應(yīng)的灰度值作為閾值,OTSU算法為目前比較好的確定閾值的算法[2630]。 采用OTSU算法計算閾值,首先選取一個灰度值作為閾值T,將圖像分成前景C0和背景C1兩類,記μ為圖像整體期望,μf為前景C0的期望,μb為背景C1的期望?;叶葹閕的像素出現(xiàn)的概率為Pi,μb為背景C1的期望,Pf為前景C0的概率,Pb為背景C1的概率,σ2B為類間方差,則有 μ=∑2550iPi, Sumf=∑Ti=0iPi, Pf=∑Ti=0Pi(2) μf=SumfPf, Sumb=∑255i=TiPi, Pb=1-Pf(3) Eb=SumbPb, σ2B=Pfμ-μf2+Pbμ-μb2(4) 當T使類間方差σ2B為最大時,這個灰度值T即為最大類間方差法所得的閾值。不均勻光照下的原圖像如圖1所示,采用OTSU算法,對不均勻光照的圖像進行二值化處理,OTSU算法二值化處理結(jié)果如圖2所示。 根據(jù)光照強度的不同,將不均勻光照下的圖像分為明亮區(qū)域和陰暗區(qū)域。由圖2可以看出,對于光照不均勻的圖像,OTSU算法求得的閾值對于圖像明亮處二值化效果較好,但是對于圖像陰暗處未能提取出有效的信息。 2?改進OTSU算法處理光照不均勻圖像 2.1?利用OTSU算法計算照片明亮處的最大類間方差 設(shè)圖像分辨率為nWidth×nHeight,每一點的灰度值為g(x,y),其中,0≤x≤(nWidth-1),0≤y≤(nHeight-1),0≤g(x,y)≤255。整副圖像最大類間方差對應(yīng)的閾值為T1,在計算時,雖然考慮了陰暗處像素的灰度值,但對明亮處二值化效果影響不大,為減少輸入?yún)?shù),把T1作為圖像明亮處的閾值。 2.2?利用OTSU算法計算照片陰暗處的最大類間方差 [5]?徐晶晶. 低質(zhì)量文檔圖像的二值化算法研究[D]. 武漢: 湖北工業(yè)大學(xué), 2017. [6]?路陽, 高慧敏. 光照不均QR碼圖像二值化研究[J]. 太原科技大學(xué)學(xué)報, 2012, 33(5): 396400. [7]?何鎏一, 楊國為. 基于深度學(xué)習(xí)的光照不均勻文本圖像的識別系統(tǒng)[J]. 計算機應(yīng)用與軟件, 2020, 37(6): 184190, 217. [8]?楊馥溢, 何嘉. 基于深度學(xué)習(xí)的圖像檢索研究[J]. 計算機與數(shù)字工程, 2019, 47(9): 22762280, 2285. [9]?趙世峰, 何皙健. 基于OpenCV的復(fù)雜環(huán)境下圖像二值化方法[J]. 電子測量技術(shù), 2018, 41(6): 5559. [10]?余澤東. 基于otsu算法和Hu不變矩的交通信號燈識別[J]. 武漢大學(xué)學(xué)報: 工學(xué)版, 2020, 53(4): 371376. [11]?李曦, 黃榮慧, 劉備, 等. 基于Otsu聚類的生物組織損傷辨識方法[J/OL]. 湖南師范大學(xué)自然科學(xué)學(xué)報, 2020, (43): 8287. [12]?王玉銀. 狼群優(yōu)化的二維Otsu快速圖像分割算法[J]. 信息系統(tǒng)工程, 2020(3): 7273. [13]?張舉世. 改進的狼群優(yōu)化二維Otsu閾值分割算法[J]. 電力學(xué)報, 2020, 35(1): 4045. [14]?白元明, 孔令成, 張志華, 等. 基于改進OTSU算法的快速作物圖像分割[J]. 江蘇農(nóng)業(yè)科學(xué), 2019, 47(24): 231236. [15]?賈坤昊, 夾尚豐, 楊栩, 等. 改進Niblack算法及其在不均勻光照條件下的應(yīng)用[J]. 軟件導(dǎo)刊, 2019, 18(4): 8286. [16]?王鑫睿. 歷史文檔圖像二值化算法研究[D]. 武漢: 湖北工業(yè)大學(xué), 2019. [17]?曾凡鋒, 劉樹鵬. Retinex在光照不均文本圖像中的研究[J]. 計算機工程與設(shè)計, 2017, 38(11): 30723079. [18]?梁琳, 何衛(wèi)平, 雷蕾, 等. 光照不均圖像增強方法綜述[J]. 計算機應(yīng)用研究, 2010, 27(5): 16251628. [19]?李治江, 叢林. 基于樸素貝葉斯理論的彩色圖像二值化方法研究[J]. 數(shù)字印刷, 2020(1): 1721. [20]?羅鈞, 楊永松, 侍寶玉. 基于改進的自適應(yīng)差分演化算法的二維Otsu多閾值圖像分割[J]. 電子與信息學(xué)報, 2019, 41(8): 20172024. [21]?吳延海, 潘晨, 吳楠. 改進的Otsu遞歸分割單幅圖像去霧算法研究[J]. 西安科技大學(xué)學(xué)報, 2017, 37(3): 438444. [22]?何志勇. 基于改進OTSU法和顯著性分析的表面缺陷高效視覺檢測方法研究[D]. 江蘇: 蘇州大學(xué), 2015. [23]?李世文, 李立聰. 自適應(yīng)OTSU算法在艦船邊緣檢測中的應(yīng)用及其FPGA實現(xiàn)[J]. 軟件導(dǎo)刊, 2019(6): 176180. [24]?魏晉, 郜澤霖. 基于OTSU二值化的航天器在軌環(huán)境預(yù)測方法[J]. 計算機測量與控制, 2020, 28(4): 7579. [25]?吳佳鵬, 楊兆選, 韓東, 等. 基于小波和Otsu法的二維條碼圖像二值化[J]. 計算機工程, 2010, 36(10): 190192. [26]?郭佳. 基于光照不均勻圖像的自適應(yīng)二值化方法研究[D]. 武漢: 武漢科技大學(xué), 2013. [27]?郭佳, 劉曉玉, 吳冰, 等. 一種光照不均勻圖像的二值化方法[J]. 計算機應(yīng)用與軟件, 2014(3): 189192, 208. [28]?Otsu N. A threshold selection method from graylevel histograms[J]. IEEE Transactions on Systems Man & Cybernetics, 2007, 9(1): 6266. [29]?Sezgin M, Sankur B. Survey over image thresholding techniques and quantitative performance evaluation[J]. Journal of Electronic Imaging, 2004, 13(1): 146165. [30]?Sahoo P K, Soltani S, Wong A K C. A survey of thresholding techniques[J]. Computer Vision, Graphics, and Image Processing, 1988, 41(2): 233260. Research on the Improved Algorithm of Processing Uneven Illumination Image Based on OTSU LIU Mingxing, LIU Zeping, LI Bin, FU Chaoxing, MENG Han (School of Electromechanic Engineering, Qingdao University, Qingdao 266071, China) Abstract: ??In order to solve the problem of image binarization under uneven illumination, an improved binary algorithm based on OTSU algorithm is proposed. The image is divided into two parts: bright region and dark region. The threshold corresponding to the maximum variance between the two parts is calculated respectively. By analyzing the characteristics of dark region, each pixel is judged to be in the bright region or dark region, and the threshold of each point is determined. The experimental results show that the algorithm can solve the problem of information loss in OTSU algorithm, and can be widely used in the binary processing of text image under the condition of uneven illumination. It is better for special cases, and more universal than other algorithms. The algorithm in this paper can reduce the running time of the algorithm by improving the operation speed of OTSU algorithm. This research can be used as a preprocessing method for character recognition and defect detection to improve the recognition accuracy. Key words: binarization; OTSU; uneven illumination; threshold segmentation; maximum inter class variance; global threshold