林海龍,文志強(qiáng),喻魁蘭
基于單元信息熵的半色調(diào)圖像有效子塊提取*
林海龍,文志強(qiáng),喻魁蘭
(湖南工業(yè)大學(xué)計(jì)算機(jī)與通信學(xué)院,湖南株洲412000)
針對(duì)數(shù)字半色調(diào)圖像有效子塊的提取,提出了圖像的單元熵及熵矩陣構(gòu)造的算法.首先,將半色調(diào)圖像分割成若干子塊,對(duì)每一個(gè)子塊的每一個(gè)像素點(diǎn)計(jì)算熵,得出熵矩陣.然后,對(duì)熵矩陣取均值及方差.最后,根據(jù)信息理論可得,當(dāng)熵的均值越大且方差越小時(shí),越能有效地獲得子塊.實(shí)驗(yàn)表明,通過單元信息熵獲取的有效子塊,含有信息量大,紋理變化平緩,適合用于分類.
半色調(diào)圖像;單元熵;熵矩陣;圖像分割
數(shù)字圖像的半色調(diào)技術(shù)是將一幅連續(xù)的灰度圖像通過一定的技術(shù)轉(zhuǎn)換成僅含有黑白兩點(diǎn)的二值圖像,使用黑白兩點(diǎn)的密度來表示灰度圖像的灰度值,利用人眼的低通濾波性使半色調(diào)圖像與原始圖像相近.半色調(diào)技術(shù)廣泛應(yīng)用于噴墨式打印、激光打?。娮诱障啵┲?,近幾年隨著計(jì)算工業(yè)的發(fā)展,半色調(diào)市場更廣.具體將其分為誤差分散法(Error Diffusion)、點(diǎn)分散法(Dot Diffusion)、有序抖動(dòng)法(Ordered Dithering).
在紙質(zhì)圖像數(shù)字化、數(shù)字出版系統(tǒng)與半色調(diào)圖像的銳化、較色、壓縮等圖像再處理領(lǐng)域,需要將半色調(diào)圖像轉(zhuǎn)換成連續(xù)色調(diào)圖像,即圖像的逆半調(diào)過程.逆半調(diào)技術(shù)的研究始于上世紀(jì)90年代并取得一定的成果,數(shù)字圖像的半色調(diào)圖像主要是在原圖中引入噪聲的過程,關(guān)于濾去噪聲,文獻(xiàn)[1]提出線性濾波和迭代技術(shù),但通過濾波會(huì)降低圖像的質(zhì)量減少圖像的邊緣信息,所以相繼提出將圖像的邊緣和前景分開的小波逆半調(diào).此外還有專門針對(duì)誤差分散核的逆半調(diào)技術(shù)誤差分散核估計(jì)、最大后驗(yàn)概率估計(jì)(MAP)等.針對(duì)有序抖動(dòng)的逆半調(diào)方法:中值濾波、邏輯濾波.現(xiàn)有逆半調(diào)技術(shù)需要知道半色調(diào)圖像的類別及參數(shù)[2],或者區(qū)分圖像的半調(diào)種類[3],或者只是針對(duì)某一種類型[4],這便使得逆半調(diào)技術(shù)的有效性、靈活性、自適應(yīng)性受到限制,所以對(duì)半色調(diào)圖像類別的區(qū)分便顯得特別重要.在半色調(diào)圖像的分類中由于涉及圖像數(shù)量眾多,若對(duì)單一圖像進(jìn)行特征提取便會(huì)影響其效率,并且若一副圖像中某一區(qū)域像素值均為0或者均為1,那么該部分為無效區(qū)域,所以對(duì)半色調(diào)圖像有效子塊的提取就十分重要.文獻(xiàn)[5]對(duì)半調(diào)圖像的特征提取作了相關(guān)的研究,但均未對(duì)有效子塊提取作相應(yīng)的討論.文獻(xiàn)[6]通過提出了一種新的基于信息熵的圖像檢索,但由于圖像中相鄰的單元格之間存在一定的相關(guān)性,所以構(gòu)建的熵矩陣亦存在一定的信息冗余.本文將熵矩陣的思想應(yīng)用于數(shù)字半色調(diào)圖像有效子塊的提取并作相應(yīng)的改進(jìn),以圖像每個(gè)元素為中心,一定步長為半徑計(jì)算該區(qū)域熵且對(duì)邊界作相應(yīng)處理,將整幅圖像構(gòu)造成熵矩陣,且對(duì)熵矩陣的均值和方差作統(tǒng)計(jì)分析,計(jì)算出有效子塊提取的閥值.該算法的設(shè)計(jì)能夠消除文獻(xiàn)[4]熵矩陣的信息冗余.
信息是事物運(yùn)動(dòng)狀態(tài)或存在方式的不確定性的描述,香農(nóng)將熵作為該種狀態(tài)或方式不確定性的一種量度.這種不確定性在概率論中使用隨機(jī)事件來描述,假設(shè)存在隨機(jī)事件X1,X2,X3,…,Xn,其出現(xiàn)的概率分別滿足P1,P2,P3,…,Pn,且滿足下列條件:
則信息熵的定義為:
由公式(2)可知,圖像的全局信息熵是一個(gè)關(guān)于圖像像素值的概率函數(shù),其反映的是一副圖像的全局統(tǒng)計(jì)特征,如同圖像的直方圖一樣并未考慮圖像的空間關(guān)系,兩幅視覺效果完全不同的圖像其全局信息熵完全可能相等,所以全局信息熵并不能完全顯示圖像的差異性質(zhì).圖像的局部信息熵反映了圖像的局部灰度分布的統(tǒng)計(jì)特征,相對(duì)于圖像的全局信息熵來說,其反映了圖像的空間分布信息.文獻(xiàn)[7-9]中運(yùn)用網(wǎng)格描述符GD(Gird Descriptor)描述圖像,算法中先將圖像置于固定分辨率的網(wǎng)格上,如圖1所示[6],圖像占據(jù)單元格(超過一定的閥值)則將單元格賦值“1”,反之,賦值“0”.則形成一個(gè)含有0、1的二值矩陣,將其從左至右,由上至下順序排列用來描述圖像,顯然在網(wǎng)格的分辨率越高,其識(shí)別度就越高.
由于GD網(wǎng)格描述法并未考慮圖像的顏色,僅僅將圖像用0、1來描述,文獻(xiàn)[6]在基于GD的基礎(chǔ)上提出了單元熵.將圖像置于一分辨率固定的網(wǎng)格中(分辨率隨圖像的尺寸變化,定義w、h分別為圖像的尺寸,cw、ch設(shè)定為單元格的尺寸,則分辨率為w/cw*h/ch),在每個(gè)網(wǎng)格中賦值并非采用GD賦值法,而是計(jì)算每個(gè)網(wǎng)格的信息熵,假設(shè)單元為(i,j),E(i,j)為單元熵,定義
從而形成一個(gè)w/cw*h/ch的信息熵矩陣.
圖1 圖像的網(wǎng)格描述
本小節(jié)的主要任務(wù)是提取半色調(diào)圖像的有效子塊,參考眾多文獻(xiàn)發(fā)現(xiàn),相關(guān)理論并不多.孔月萍等人在文獻(xiàn)[5]中提到一維自相關(guān)函數(shù)和灰度梯度共生矩陣分類算法只是將整幅圖像進(jìn)行特征提取,用提取出來的特征進(jìn)行分類,很顯然這種方法會(huì)大大降低其效率.
孫君頂?shù)龋?]指出由單元熵構(gòu)成的熵矩陣在表達(dá)圖像的局部特征上,優(yōu)于圖像的全局信息熵且單元熵體現(xiàn)了圖像的顏色特征.但是由于原圖相鄰單元格之間存在一定的相關(guān)性,所以在熵矩陣中,相鄰的熵具有一定的信息冗余.本小節(jié)對(duì)單元熵的計(jì)算進(jìn)行改進(jìn)形成新的熵矩陣消除相鄰熵之間的信息冗余,之后根據(jù)信息熵理論選出一幅二值圖像的有效子塊.
假設(shè)存在圖像f(x,y)(0<x<w,0<y<h),分割成fi(xi,yi)子塊,其中(0<xi<k,0<yi<k)、(0<i<w/k*h/k),算法設(shè)計(jì)如下:
(2)將圖像的子塊fi(xi,yi)劃分為以下區(qū)域:區(qū)域Ⅰ(0<xi<k-m/2,0<yi<m/2),區(qū)域Ⅱ(0<xi<m/2,m/2<yi<k-m/2),區(qū)域Ⅲ(0<xi<k-m/2,k-m/2<yi<m),區(qū)域Ⅳ(k-m/2<xi<k,0<yi<k-m/2),區(qū)域Ⅴ(k-m/2<xi<k,k-m/2<yi<k),剩余部分為區(qū)域Ⅵ.對(duì)于子塊中的每一個(gè)像素劃分出分塊fij(xij,yij),其中(0<j<k)、(0<xij<m,0<yij<m).
(3)根據(jù)信息熵公式計(jì)算出分塊fij(xij,yij)的熵,并且求得fi(xi,yi)熵矩陣Qi.
本實(shí)驗(yàn)在Windows XP操作系統(tǒng)環(huán)境下進(jìn)行操作,采用VC6.0結(jié)合OpenCv及matlab進(jìn)行編程.從十二類半色調(diào)圖像庫中,隨機(jī)選出409幅圖片,改變半色調(diào)圖像子塊的k值大小,計(jì)算出每個(gè)子塊每個(gè)像素點(diǎn)的單元熵形成熵矩陣,實(shí)驗(yàn)證明通過該算法獲取的有效子塊信息含量大且紋理變化平緩,適合分類.
為了能夠給出一個(gè)關(guān)于μ、σ的范圍,更準(zhǔn)確地找出半色調(diào)圖像的有效子塊,筆者計(jì)算出十二種半色調(diào)圖像子塊的μ、σ值(均為(w/k)*(h/k)*409*12個(gè)),對(duì)其進(jìn)行統(tǒng)計(jì),結(jié)果如圖2.
從特征圖上可以看出隨著k值的增大,μ和σ趨于0的比例會(huì)越來越小,也就是圖像的信息越來越豐富,但信息之間的差異會(huì)越來越大.為了權(quán)衡μ和σ值,使其在分類中取得最佳值,筆者設(shè)定一個(gè)比例L,μα值為局部信息熵均值μ從大到小值,σβ值為σ為局部信息熵方差從小到大值.那么得出μα、σβ分別為比例L的函數(shù),表示為:μα=f(L)、σβ=Ψ(L).當(dāng)L分別取初值為10%步值為10%時(shí)的μα、σβ的統(tǒng)計(jì)值如表1所示.
表1的μα值和σβ值體現(xiàn)在二維坐標(biāo)圖上,如圖3所示.
由圖3可以看出μα是一個(gè)隨L增加遞減的值,σβ是一個(gè)隨L增加遞增的值,二者交于一點(diǎn).根據(jù)有效子塊的判別依據(jù):局部信息熵μα越大、σβ值越小,越適合分類,可以得出在相交點(diǎn)的右邊區(qū)域?yàn)闊o效區(qū)域(不會(huì)選擇一個(gè)μα值越來越小、σβ值越來越大的子塊作為分類子塊).其值的大小與比例L有關(guān),根據(jù)所需要分類圖像以及圖庫的數(shù)目的多少選取L值,由表1和圖3可以得出μα、σβ值,L取值越小,那么μα值就會(huì)越大,σβ值就會(huì)越小,子塊就越適合分類.取k=64,L=10%,μthresh=0.5903,σthresh=0.2801作為有效子塊的閥值,當(dāng)μ≥μthresh,σ≤σthresh時(shí),圖像適合分類.
圖2 參數(shù)μ、σ的特征圖.(a)參數(shù)μ的特征圖;(b)參數(shù)σ的特征圖
表1 L及μα、σβ統(tǒng)計(jì)表
圖3 L及μα、σβ分布圖
本文以半色調(diào)和逆半調(diào)技術(shù)為背景,通過研究發(fā)現(xiàn)在圖像重建過程中需要知道半色調(diào)圖像產(chǎn)生的方法,因此半色調(diào)圖像分類十分重要.當(dāng)前未曾報(bào)道過半色調(diào)圖像有效子塊的提取,而一幅用于分類的圖像并非所有區(qū)域均是有效適合分類的,若對(duì)整幅圖像進(jìn)行特征提取,那么會(huì)大大降低效率.本文在基于單元熵的基礎(chǔ)上構(gòu)造出熵矩陣并對(duì)熵矩陣進(jìn)行均值、方差的統(tǒng)計(jì)分析,得出了無效區(qū)域和最佳有效子塊閥值.
[1]Kern R S,Stockham Jr TG,Strong D C.Descreening via linear filtering and iterative techniques[A].Proc SPIE 1913,Human Vision,Visual Processing,Digital Display IV[C].San Jose,1993.
[2]Wong PW.Inverse halftoning and kernel estimation for error diffusion[J].Image Processing,IEEE Transactions on,1995,(4):486-498.
[3]Mese M,Vaidyanathan P P.Look-up table(LUT)method for inverse halftoning[J].Image Processing,IEEE Transactions on,2001,(10):1566-1578.
[4]Stevenson R L.Inverse halftoning via MAP estimation[J].Image Processing,IEEE Transactions on,1997,(4):574-583.
[5]孔月萍,杜旭苗.一種半調(diào)圖像類型識(shí)別方法[J].計(jì)算機(jī)應(yīng)用研究,2009,(12):4850-4851.
[6]孫君頂,毋小省.基于信息熵的圖像檢索[J].西安電子科技大學(xué)學(xué)報(bào)(自然科學(xué)報(bào)),2004,(2):224-228.
[7]Lu G,Sajjanhar A.Region-based shape representation and similaritymeasure suitable for content-based image retrieval[J].Multimedia Systems,1999,(2):165-174.
[8]Safar M,Shahabi C,Sun X.Image retrieval by shape:A comparative study[A].Proceedings of ICME 2000[C].New York:IEEE,2000.
[9]Chakrabarti K,Ortega-Binderberger M,Porkaew K,etal.Similar shape retrieval in MARS[A].Proceedings of ICME 2000[C].New York:IEEE,2000.
Extraction of Effective Sub-blocks of Halftone Images Based on Unit Entropy
LIN Hailong,WEN Zhiqiang,YU Kuilan
(School of Computer&Communication,Hunan University of Technology,Zhuzhou Hunan 412000,China)
In allusion to the extraction of effective sub-blocks of digital halftone images,this article proposes the unit entropy of images and the algorithm for the entropymatrix construction.Firstly,the halftone image is divided into several sub-blocks,and then the entropy for each pixel pointof each sub-block is calculated to obtain the entropymatrix.Secondly,the study calculates themean and variance of entropymatrix.Lastly,according to the information theory,when the entropy of themean is greater and variance is smaller,sub-blocks can bemore effectively obtained.Experimental results show that effective sub-blocks acquired through the unit entropy contain a large amount of information and the texture changes smoothly,so they are suitable for the classification.
halftone image;unit entropy;entropymatrix;image segmentation
TP391
A
1008-4681(2014)02-0028-04
(責(zé)任編校:晴川)
2013-12-18
國家自然科學(xué)基金(批準(zhǔn)號(hào):61170102)資助項(xiàng)目;湖南省自然科學(xué)基金(批準(zhǔn)號(hào):11JJ3070)資助項(xiàng)目;湖南省教育廳科研項(xiàng)目(批準(zhǔn)號(hào):12A039).
林海龍(1986-),男,江西上饒人,湖南工業(yè)大學(xué)計(jì)算機(jī)與通信學(xué)院碩士生.研究方向:圖像處理.