張玲
摘 要 字符特征提取是含文字碎片圖像拼接的關(guān)鍵環(huán)節(jié),直接影響拼接效果。提出了一種包含文字信息的碎片圖像特征提取方法,首先,對原始碎片圖像進(jìn)行預(yù)處理,分別得到字符和碎片背景的二值圖像;然后,利用邊緣檢測算子提取字符和碎片背景的單像素邊緣;最后,利用結(jié)構(gòu)算子檢測碎片圖像中字符與碎片背景邊緣的交叉點(diǎn),并根據(jù)交叉點(diǎn)的信息提取字體邊緣方向特征。仿真實(shí)驗(yàn)結(jié)果表明本文提出的碎片圖像字符特征提取方法思路合理,能夠快速、準(zhǔn)確地提取出碎片圖像中的字符特征,為后續(xù)的匹配拼接奠定基礎(chǔ)。
關(guān)鍵詞 圖像拼接;邊緣檢測;特征提取
中圖分類號:TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號:1671-7597(2014)04-0118-02
圖像拼接是一種將多幅相關(guān)圖像無縫拼接成一幅寬視角全景圖像的技術(shù),涉及特征提取及匹配、圖像配準(zhǔn)和圖像融合等理論。包含著文宇、圖片等信息的紙張往往會(huì)因?yàn)楦鞣N原因造成破碎,通過人眼比對查找的方式對這些碎片文件進(jìn)行拼接比較費(fèi)時(shí)費(fèi)力。將碎片文件通過掃描等方式轉(zhuǎn)化為數(shù)字圖像,再利用數(shù)字圖像處理技術(shù)進(jìn)行匹配可以取得較好的拼接效果。碎片圖像的拼接可以根據(jù)紋理、色彩和輪廓等多種不同特征進(jìn)行拼接,也可以按碎片中有無目標(biāo)、形狀特征是否規(guī)則等進(jìn)行復(fù)原。碎片圖像拼接技術(shù)能夠?qū)崿F(xiàn)對原始文件或圖片信息的還原,可廣泛應(yīng)用。目前,學(xué)者們提出了很多碎片圖像特征提取方法,如Harris特征提取、基于邊緣的特征提取、SIFT特征提取等。針對含文字碎片圖像的特點(diǎn),本文提出了一種有效的字符特征提取方法,該方法能夠快速、準(zhǔn)確地提取碎片圖像中特征點(diǎn)的坐標(biāo)及字體走向等特征,為碎片圖像拼接奠定良好的基礎(chǔ)。
1 字符特征提取方法研究
關(guān)鍵特征的提取是碎片圖像拼接的核心和難點(diǎn)。因?yàn)樘卣髅黠@的點(diǎn)、線和邊緣可以較精確地定位碎片圖像邊緣連接點(diǎn)坐標(biāo)和連接線段的角度,所以搜索這些特征明顯的點(diǎn)、線和邊緣是拼接含字符碎片圖像的關(guān)鍵?,F(xiàn)在提出的方法主要檢測字符與碎片圖像背景邊緣的交叉點(diǎn)和提取字體邊緣方向,主要包括圖像預(yù)處理、邊緣檢測、特征提取三個(gè)環(huán)節(jié)。
1.1 預(yù)處理
首先,將碎紙片放在黑色臺(tái)布上掃描得到原始圖像,其中黑色部分為臺(tái)布,白色部分為碎片空白區(qū)域,字符區(qū)域?yàn)榫G色。然后,將原始圖像轉(zhuǎn)換為灰度圖像,并分別利用大律法和自定義閾值法進(jìn)行二值化和反色處理,提取字符區(qū)域(目標(biāo))和碎片圖像區(qū)域(背景)。大律法,即最大類間方差法,根據(jù)圖像中目標(biāo)和背景兩個(gè)類別的可分離性自適應(yīng)確定分割閾值T,類間方差越大,則表明兩類之間灰度差別越大,所以獲得最大類間方差的閾值T就是最佳分割閾值。
1.2 邊緣檢測
邊緣檢測是字符特征提取的基礎(chǔ),現(xiàn)提出的特征提取方法主要是基于字符輪廓信息,所以邊緣檢測對碎片圖像字符特征的提取起著至關(guān)重要的作用,主要包括字符區(qū)域提取、去除目標(biāo)邊緣毛刺、提取字符及背景單像素邊緣檢測等環(huán)節(jié)。
1.2.1 字符區(qū)域提取
字符區(qū)域的確定是進(jìn)行字符特征提取的前提,通過對碎片背景圖像和字符圖像進(jìn)行差值運(yùn)算可以將碎片圖像中的字符區(qū)域提取出來。開運(yùn)算具有磨光圖像的外邊界的優(yōu)點(diǎn),所以利用開運(yùn)算剔除差值圖像中的毛刺。為了去除圖像中的噪聲,對去毛刺圖像再進(jìn)行先腐蝕、后膨脹的運(yùn)算,得到去除毛刺及噪聲的字符圖像。
1.2.2 單像素邊緣檢測
字符與碎片圖像邊緣的交叉點(diǎn)坐標(biāo)和字體邊緣方向是進(jìn)行圖像拼接的重要特征,而確定字體和碎片圖像的邊緣是提取這些特征的基礎(chǔ)。為了精確計(jì)算交叉點(diǎn)坐標(biāo)和字體邊緣方向,可利用單像素邊緣檢測方法。
1.3 特征提取
字符與碎片背景圖像的交叉點(diǎn)坐標(biāo)和字體邊緣方向是用于碎片圖像拼接的關(guān)鍵特征。
1.3.1 交叉點(diǎn)檢測
首先,將提取出的碎片背景邊緣圖像和字符邊緣圖像進(jìn)行“與”操作,提取二者相重疊的部分。
單像素邊緣端點(diǎn)的特點(diǎn)是若端點(diǎn)像素的灰度值為“1”,則只有一個(gè)鄰域像素的灰度值為“1”,其余7個(gè)鄰域像素的灰度值均為“0”。其根據(jù)單像素邊緣端點(diǎn)的這種特性,構(gòu)造了端點(diǎn)圖6字符與背景邊緣重疊區(qū)域檢測的8方向結(jié)構(gòu)算子(如圖1),利用這些結(jié)構(gòu)算子對重疊區(qū)域圖像進(jìn)行逐點(diǎn)掃描,確定重疊區(qū)域的端點(diǎn),并記錄該點(diǎn)的坐標(biāo)值。
圖1 單像素邊緣端點(diǎn)檢測結(jié)構(gòu)算子
1.3.2 字體邊緣方向檢測
為了確定字體邊緣方向,將字符邊緣圖像與重疊區(qū)域圖像作差,得到去除重疊區(qū)域的字符邊緣圖像[如圖2(a)]。因?yàn)橹丿B區(qū)域邊緣端點(diǎn)(Ak,k=1,2,…,N,灰度值為“0”)與字符邊緣的端點(diǎn)(Bk,k=1,2,…,N,灰度值為“1”)鄰接,所以將Ak作為起點(diǎn)檢測字體邊緣方向,具體步驟如下。
第1步根據(jù)重疊區(qū)域邊緣端點(diǎn)坐標(biāo)對的數(shù)量,確定碎片圖像中重疊區(qū)域邊緣端點(diǎn)個(gè)數(shù)N。
第2步任意選取一個(gè)起點(diǎn)Ap,設(shè)定要檢測邊緣像素的長度M。
第3步在去除重疊區(qū)域的字符邊緣圖像[圖2(a)]中搜索像素Ap八鄰蜮中灰度值為“1”的像素點(diǎn),記錄此像素點(diǎn)的坐標(biāo)Bp,并累計(jì)邊緣像素個(gè)數(shù)。
第4步以Bp為起點(diǎn),在其八鄰域內(nèi)搜索灰度值為“1”的像素點(diǎn),記錄此像素點(diǎn)的坐標(biāo)Cp,將Bp像素點(diǎn)灰度值置為“0”,并累計(jì)邊緣像素個(gè)數(shù)。
第5步再以Cp為起點(diǎn),重復(fù)步驟4,直到邊緣像素個(gè)數(shù)與設(shè)定值M相同為止。
第6步以Ap為起點(diǎn),沿檢測出的邊緣像素(即存儲(chǔ)的灰度值為“1”的像素)繪制線段,并進(jìn)行標(biāo)記,如圖2(b)所示。
第7步選取另一個(gè)端點(diǎn)Aq,重復(fù)步驟2-6,直到所有的邊緣端點(diǎn)都檢測完畢。
(a)去除重疊區(qū)域的字符邊緣圖 (b)字符邊緣方向標(biāo)記圖
圖2 字體邊緣方向檢測說明圖
2 仿真實(shí)驗(yàn)
現(xiàn)提出的碎片圖像字符特征提取方法在VisualC++6.0軟件平臺(tái)上進(jìn)行仿真,并調(diào)用OpenCV庫中的函數(shù)。首先,將碎紙片圖像逐張放到黑色臺(tái)布上進(jìn)行掃描,并存儲(chǔ)這些掃描圖像;然后,讀取掃描圖像,對其進(jìn)行預(yù)處理,得到字符區(qū)域圖像和碎片背景區(qū)域圖像,并檢測字符和碎片背景的單像素邊緣;最后,確定字符與碎片背景邊緣交叉點(diǎn)坐標(biāo)和字體邊緣方向,得到用于后續(xù)拼接的特征。為了驗(yàn)證本文提出的方法,對三個(gè)碎紙片圖像進(jìn)行了字符特征提取仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖3所示。圖3(a)為原始圖像,圖3(b)為相應(yīng)的交叉點(diǎn)(圓圈標(biāo)記)檢測圖像,圖3(c)為字體邊緣(與圓圈相連的黑色線段標(biāo)記)方向提取圖像。從這三組圖像可以看出,本文給出的碎片圖像字符特征提取方法能夠較好地檢測出字符與碎片背景邊界交叉點(diǎn)及字體邊緣方向,具有較強(qiáng)的魯棒性。
(a)原始圖像 (b)相應(yīng)的交叉點(diǎn)圖像(c)相應(yīng)的邊緣方向圖像
圖3 字符特征提取結(jié)果圖
3 結(jié)論與認(rèn)識(shí)
含字符信息的碎片圖像拼接在工作中具有非常重要的意義。針對含字符碎片圖像的特點(diǎn),提出了一種碎片圖像字符特征提取方法。該方法利用數(shù)學(xué)形態(tài)學(xué)和邊緣檢測等知識(shí),有效地提取碎片圖像中字符與碎片背景邊緣的交叉點(diǎn)和字體邊緣方向特征。該方法能夠快速、準(zhǔn)確地提取碎片圖像中字符特征,為后續(xù)的碎片圖像拼接提供關(guān)鍵的點(diǎn)坐標(biāo)、線段方向、角度等特征。
參考文獻(xiàn)
[1]李寒,牛紀(jì)楨,郭禾.基于特征點(diǎn)的全自動(dòng)無縫圖像拼接方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(09):2083-2085.
[2]趙彩虹,盧章平,魯金忠.基于匹配對的非規(guī)則碎片拼合算法[J].計(jì)算機(jī)應(yīng)用,2005,25(03):596-597,605.
[3]周石林,廖文和,尹建平.平面碎片匹配算法的研究[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(31):151-153.
[4]鄭蓓蓓,郭立本.改進(jìn)的遺傳算法應(yīng)用于碎片拼接[J].計(jì)算機(jī)與現(xiàn)代化,2011(05):52-56.
[5]吳銘,林錦國,梅雪.用于圖像拼接的特征提取算法研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2009,30(2):440-442.endprint
摘 要 字符特征提取是含文字碎片圖像拼接的關(guān)鍵環(huán)節(jié),直接影響拼接效果。提出了一種包含文字信息的碎片圖像特征提取方法,首先,對原始碎片圖像進(jìn)行預(yù)處理,分別得到字符和碎片背景的二值圖像;然后,利用邊緣檢測算子提取字符和碎片背景的單像素邊緣;最后,利用結(jié)構(gòu)算子檢測碎片圖像中字符與碎片背景邊緣的交叉點(diǎn),并根據(jù)交叉點(diǎn)的信息提取字體邊緣方向特征。仿真實(shí)驗(yàn)結(jié)果表明本文提出的碎片圖像字符特征提取方法思路合理,能夠快速、準(zhǔn)確地提取出碎片圖像中的字符特征,為后續(xù)的匹配拼接奠定基礎(chǔ)。
關(guān)鍵詞 圖像拼接;邊緣檢測;特征提取
中圖分類號:TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號:1671-7597(2014)04-0118-02
圖像拼接是一種將多幅相關(guān)圖像無縫拼接成一幅寬視角全景圖像的技術(shù),涉及特征提取及匹配、圖像配準(zhǔn)和圖像融合等理論。包含著文宇、圖片等信息的紙張往往會(huì)因?yàn)楦鞣N原因造成破碎,通過人眼比對查找的方式對這些碎片文件進(jìn)行拼接比較費(fèi)時(shí)費(fèi)力。將碎片文件通過掃描等方式轉(zhuǎn)化為數(shù)字圖像,再利用數(shù)字圖像處理技術(shù)進(jìn)行匹配可以取得較好的拼接效果。碎片圖像的拼接可以根據(jù)紋理、色彩和輪廓等多種不同特征進(jìn)行拼接,也可以按碎片中有無目標(biāo)、形狀特征是否規(guī)則等進(jìn)行復(fù)原。碎片圖像拼接技術(shù)能夠?qū)崿F(xiàn)對原始文件或圖片信息的還原,可廣泛應(yīng)用。目前,學(xué)者們提出了很多碎片圖像特征提取方法,如Harris特征提取、基于邊緣的特征提取、SIFT特征提取等。針對含文字碎片圖像的特點(diǎn),本文提出了一種有效的字符特征提取方法,該方法能夠快速、準(zhǔn)確地提取碎片圖像中特征點(diǎn)的坐標(biāo)及字體走向等特征,為碎片圖像拼接奠定良好的基礎(chǔ)。
1 字符特征提取方法研究
關(guān)鍵特征的提取是碎片圖像拼接的核心和難點(diǎn)。因?yàn)樘卣髅黠@的點(diǎn)、線和邊緣可以較精確地定位碎片圖像邊緣連接點(diǎn)坐標(biāo)和連接線段的角度,所以搜索這些特征明顯的點(diǎn)、線和邊緣是拼接含字符碎片圖像的關(guān)鍵?,F(xiàn)在提出的方法主要檢測字符與碎片圖像背景邊緣的交叉點(diǎn)和提取字體邊緣方向,主要包括圖像預(yù)處理、邊緣檢測、特征提取三個(gè)環(huán)節(jié)。
1.1 預(yù)處理
首先,將碎紙片放在黑色臺(tái)布上掃描得到原始圖像,其中黑色部分為臺(tái)布,白色部分為碎片空白區(qū)域,字符區(qū)域?yàn)榫G色。然后,將原始圖像轉(zhuǎn)換為灰度圖像,并分別利用大律法和自定義閾值法進(jìn)行二值化和反色處理,提取字符區(qū)域(目標(biāo))和碎片圖像區(qū)域(背景)。大律法,即最大類間方差法,根據(jù)圖像中目標(biāo)和背景兩個(gè)類別的可分離性自適應(yīng)確定分割閾值T,類間方差越大,則表明兩類之間灰度差別越大,所以獲得最大類間方差的閾值T就是最佳分割閾值。
1.2 邊緣檢測
邊緣檢測是字符特征提取的基礎(chǔ),現(xiàn)提出的特征提取方法主要是基于字符輪廓信息,所以邊緣檢測對碎片圖像字符特征的提取起著至關(guān)重要的作用,主要包括字符區(qū)域提取、去除目標(biāo)邊緣毛刺、提取字符及背景單像素邊緣檢測等環(huán)節(jié)。
1.2.1 字符區(qū)域提取
字符區(qū)域的確定是進(jìn)行字符特征提取的前提,通過對碎片背景圖像和字符圖像進(jìn)行差值運(yùn)算可以將碎片圖像中的字符區(qū)域提取出來。開運(yùn)算具有磨光圖像的外邊界的優(yōu)點(diǎn),所以利用開運(yùn)算剔除差值圖像中的毛刺。為了去除圖像中的噪聲,對去毛刺圖像再進(jìn)行先腐蝕、后膨脹的運(yùn)算,得到去除毛刺及噪聲的字符圖像。
1.2.2 單像素邊緣檢測
字符與碎片圖像邊緣的交叉點(diǎn)坐標(biāo)和字體邊緣方向是進(jìn)行圖像拼接的重要特征,而確定字體和碎片圖像的邊緣是提取這些特征的基礎(chǔ)。為了精確計(jì)算交叉點(diǎn)坐標(biāo)和字體邊緣方向,可利用單像素邊緣檢測方法。
1.3 特征提取
字符與碎片背景圖像的交叉點(diǎn)坐標(biāo)和字體邊緣方向是用于碎片圖像拼接的關(guān)鍵特征。
1.3.1 交叉點(diǎn)檢測
首先,將提取出的碎片背景邊緣圖像和字符邊緣圖像進(jìn)行“與”操作,提取二者相重疊的部分。
單像素邊緣端點(diǎn)的特點(diǎn)是若端點(diǎn)像素的灰度值為“1”,則只有一個(gè)鄰域像素的灰度值為“1”,其余7個(gè)鄰域像素的灰度值均為“0”。其根據(jù)單像素邊緣端點(diǎn)的這種特性,構(gòu)造了端點(diǎn)圖6字符與背景邊緣重疊區(qū)域檢測的8方向結(jié)構(gòu)算子(如圖1),利用這些結(jié)構(gòu)算子對重疊區(qū)域圖像進(jìn)行逐點(diǎn)掃描,確定重疊區(qū)域的端點(diǎn),并記錄該點(diǎn)的坐標(biāo)值。
圖1 單像素邊緣端點(diǎn)檢測結(jié)構(gòu)算子
1.3.2 字體邊緣方向檢測
為了確定字體邊緣方向,將字符邊緣圖像與重疊區(qū)域圖像作差,得到去除重疊區(qū)域的字符邊緣圖像[如圖2(a)]。因?yàn)橹丿B區(qū)域邊緣端點(diǎn)(Ak,k=1,2,…,N,灰度值為“0”)與字符邊緣的端點(diǎn)(Bk,k=1,2,…,N,灰度值為“1”)鄰接,所以將Ak作為起點(diǎn)檢測字體邊緣方向,具體步驟如下。
第1步根據(jù)重疊區(qū)域邊緣端點(diǎn)坐標(biāo)對的數(shù)量,確定碎片圖像中重疊區(qū)域邊緣端點(diǎn)個(gè)數(shù)N。
第2步任意選取一個(gè)起點(diǎn)Ap,設(shè)定要檢測邊緣像素的長度M。
第3步在去除重疊區(qū)域的字符邊緣圖像[圖2(a)]中搜索像素Ap八鄰蜮中灰度值為“1”的像素點(diǎn),記錄此像素點(diǎn)的坐標(biāo)Bp,并累計(jì)邊緣像素個(gè)數(shù)。
第4步以Bp為起點(diǎn),在其八鄰域內(nèi)搜索灰度值為“1”的像素點(diǎn),記錄此像素點(diǎn)的坐標(biāo)Cp,將Bp像素點(diǎn)灰度值置為“0”,并累計(jì)邊緣像素個(gè)數(shù)。
第5步再以Cp為起點(diǎn),重復(fù)步驟4,直到邊緣像素個(gè)數(shù)與設(shè)定值M相同為止。
第6步以Ap為起點(diǎn),沿檢測出的邊緣像素(即存儲(chǔ)的灰度值為“1”的像素)繪制線段,并進(jìn)行標(biāo)記,如圖2(b)所示。
第7步選取另一個(gè)端點(diǎn)Aq,重復(fù)步驟2-6,直到所有的邊緣端點(diǎn)都檢測完畢。
(a)去除重疊區(qū)域的字符邊緣圖 (b)字符邊緣方向標(biāo)記圖
圖2 字體邊緣方向檢測說明圖
2 仿真實(shí)驗(yàn)
現(xiàn)提出的碎片圖像字符特征提取方法在VisualC++6.0軟件平臺(tái)上進(jìn)行仿真,并調(diào)用OpenCV庫中的函數(shù)。首先,將碎紙片圖像逐張放到黑色臺(tái)布上進(jìn)行掃描,并存儲(chǔ)這些掃描圖像;然后,讀取掃描圖像,對其進(jìn)行預(yù)處理,得到字符區(qū)域圖像和碎片背景區(qū)域圖像,并檢測字符和碎片背景的單像素邊緣;最后,確定字符與碎片背景邊緣交叉點(diǎn)坐標(biāo)和字體邊緣方向,得到用于后續(xù)拼接的特征。為了驗(yàn)證本文提出的方法,對三個(gè)碎紙片圖像進(jìn)行了字符特征提取仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖3所示。圖3(a)為原始圖像,圖3(b)為相應(yīng)的交叉點(diǎn)(圓圈標(biāo)記)檢測圖像,圖3(c)為字體邊緣(與圓圈相連的黑色線段標(biāo)記)方向提取圖像。從這三組圖像可以看出,本文給出的碎片圖像字符特征提取方法能夠較好地檢測出字符與碎片背景邊界交叉點(diǎn)及字體邊緣方向,具有較強(qiáng)的魯棒性。
(a)原始圖像 (b)相應(yīng)的交叉點(diǎn)圖像(c)相應(yīng)的邊緣方向圖像
圖3 字符特征提取結(jié)果圖
3 結(jié)論與認(rèn)識(shí)
含字符信息的碎片圖像拼接在工作中具有非常重要的意義。針對含字符碎片圖像的特點(diǎn),提出了一種碎片圖像字符特征提取方法。該方法利用數(shù)學(xué)形態(tài)學(xué)和邊緣檢測等知識(shí),有效地提取碎片圖像中字符與碎片背景邊緣的交叉點(diǎn)和字體邊緣方向特征。該方法能夠快速、準(zhǔn)確地提取碎片圖像中字符特征,為后續(xù)的碎片圖像拼接提供關(guān)鍵的點(diǎn)坐標(biāo)、線段方向、角度等特征。
參考文獻(xiàn)
[1]李寒,牛紀(jì)楨,郭禾.基于特征點(diǎn)的全自動(dòng)無縫圖像拼接方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(09):2083-2085.
[2]趙彩虹,盧章平,魯金忠.基于匹配對的非規(guī)則碎片拼合算法[J].計(jì)算機(jī)應(yīng)用,2005,25(03):596-597,605.
[3]周石林,廖文和,尹建平.平面碎片匹配算法的研究[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(31):151-153.
[4]鄭蓓蓓,郭立本.改進(jìn)的遺傳算法應(yīng)用于碎片拼接[J].計(jì)算機(jī)與現(xiàn)代化,2011(05):52-56.
[5]吳銘,林錦國,梅雪.用于圖像拼接的特征提取算法研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2009,30(2):440-442.endprint
摘 要 字符特征提取是含文字碎片圖像拼接的關(guān)鍵環(huán)節(jié),直接影響拼接效果。提出了一種包含文字信息的碎片圖像特征提取方法,首先,對原始碎片圖像進(jìn)行預(yù)處理,分別得到字符和碎片背景的二值圖像;然后,利用邊緣檢測算子提取字符和碎片背景的單像素邊緣;最后,利用結(jié)構(gòu)算子檢測碎片圖像中字符與碎片背景邊緣的交叉點(diǎn),并根據(jù)交叉點(diǎn)的信息提取字體邊緣方向特征。仿真實(shí)驗(yàn)結(jié)果表明本文提出的碎片圖像字符特征提取方法思路合理,能夠快速、準(zhǔn)確地提取出碎片圖像中的字符特征,為后續(xù)的匹配拼接奠定基礎(chǔ)。
關(guān)鍵詞 圖像拼接;邊緣檢測;特征提取
中圖分類號:TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號:1671-7597(2014)04-0118-02
圖像拼接是一種將多幅相關(guān)圖像無縫拼接成一幅寬視角全景圖像的技術(shù),涉及特征提取及匹配、圖像配準(zhǔn)和圖像融合等理論。包含著文宇、圖片等信息的紙張往往會(huì)因?yàn)楦鞣N原因造成破碎,通過人眼比對查找的方式對這些碎片文件進(jìn)行拼接比較費(fèi)時(shí)費(fèi)力。將碎片文件通過掃描等方式轉(zhuǎn)化為數(shù)字圖像,再利用數(shù)字圖像處理技術(shù)進(jìn)行匹配可以取得較好的拼接效果。碎片圖像的拼接可以根據(jù)紋理、色彩和輪廓等多種不同特征進(jìn)行拼接,也可以按碎片中有無目標(biāo)、形狀特征是否規(guī)則等進(jìn)行復(fù)原。碎片圖像拼接技術(shù)能夠?qū)崿F(xiàn)對原始文件或圖片信息的還原,可廣泛應(yīng)用。目前,學(xué)者們提出了很多碎片圖像特征提取方法,如Harris特征提取、基于邊緣的特征提取、SIFT特征提取等。針對含文字碎片圖像的特點(diǎn),本文提出了一種有效的字符特征提取方法,該方法能夠快速、準(zhǔn)確地提取碎片圖像中特征點(diǎn)的坐標(biāo)及字體走向等特征,為碎片圖像拼接奠定良好的基礎(chǔ)。
1 字符特征提取方法研究
關(guān)鍵特征的提取是碎片圖像拼接的核心和難點(diǎn)。因?yàn)樘卣髅黠@的點(diǎn)、線和邊緣可以較精確地定位碎片圖像邊緣連接點(diǎn)坐標(biāo)和連接線段的角度,所以搜索這些特征明顯的點(diǎn)、線和邊緣是拼接含字符碎片圖像的關(guān)鍵?,F(xiàn)在提出的方法主要檢測字符與碎片圖像背景邊緣的交叉點(diǎn)和提取字體邊緣方向,主要包括圖像預(yù)處理、邊緣檢測、特征提取三個(gè)環(huán)節(jié)。
1.1 預(yù)處理
首先,將碎紙片放在黑色臺(tái)布上掃描得到原始圖像,其中黑色部分為臺(tái)布,白色部分為碎片空白區(qū)域,字符區(qū)域?yàn)榫G色。然后,將原始圖像轉(zhuǎn)換為灰度圖像,并分別利用大律法和自定義閾值法進(jìn)行二值化和反色處理,提取字符區(qū)域(目標(biāo))和碎片圖像區(qū)域(背景)。大律法,即最大類間方差法,根據(jù)圖像中目標(biāo)和背景兩個(gè)類別的可分離性自適應(yīng)確定分割閾值T,類間方差越大,則表明兩類之間灰度差別越大,所以獲得最大類間方差的閾值T就是最佳分割閾值。
1.2 邊緣檢測
邊緣檢測是字符特征提取的基礎(chǔ),現(xiàn)提出的特征提取方法主要是基于字符輪廓信息,所以邊緣檢測對碎片圖像字符特征的提取起著至關(guān)重要的作用,主要包括字符區(qū)域提取、去除目標(biāo)邊緣毛刺、提取字符及背景單像素邊緣檢測等環(huán)節(jié)。
1.2.1 字符區(qū)域提取
字符區(qū)域的確定是進(jìn)行字符特征提取的前提,通過對碎片背景圖像和字符圖像進(jìn)行差值運(yùn)算可以將碎片圖像中的字符區(qū)域提取出來。開運(yùn)算具有磨光圖像的外邊界的優(yōu)點(diǎn),所以利用開運(yùn)算剔除差值圖像中的毛刺。為了去除圖像中的噪聲,對去毛刺圖像再進(jìn)行先腐蝕、后膨脹的運(yùn)算,得到去除毛刺及噪聲的字符圖像。
1.2.2 單像素邊緣檢測
字符與碎片圖像邊緣的交叉點(diǎn)坐標(biāo)和字體邊緣方向是進(jìn)行圖像拼接的重要特征,而確定字體和碎片圖像的邊緣是提取這些特征的基礎(chǔ)。為了精確計(jì)算交叉點(diǎn)坐標(biāo)和字體邊緣方向,可利用單像素邊緣檢測方法。
1.3 特征提取
字符與碎片背景圖像的交叉點(diǎn)坐標(biāo)和字體邊緣方向是用于碎片圖像拼接的關(guān)鍵特征。
1.3.1 交叉點(diǎn)檢測
首先,將提取出的碎片背景邊緣圖像和字符邊緣圖像進(jìn)行“與”操作,提取二者相重疊的部分。
單像素邊緣端點(diǎn)的特點(diǎn)是若端點(diǎn)像素的灰度值為“1”,則只有一個(gè)鄰域像素的灰度值為“1”,其余7個(gè)鄰域像素的灰度值均為“0”。其根據(jù)單像素邊緣端點(diǎn)的這種特性,構(gòu)造了端點(diǎn)圖6字符與背景邊緣重疊區(qū)域檢測的8方向結(jié)構(gòu)算子(如圖1),利用這些結(jié)構(gòu)算子對重疊區(qū)域圖像進(jìn)行逐點(diǎn)掃描,確定重疊區(qū)域的端點(diǎn),并記錄該點(diǎn)的坐標(biāo)值。
圖1 單像素邊緣端點(diǎn)檢測結(jié)構(gòu)算子
1.3.2 字體邊緣方向檢測
為了確定字體邊緣方向,將字符邊緣圖像與重疊區(qū)域圖像作差,得到去除重疊區(qū)域的字符邊緣圖像[如圖2(a)]。因?yàn)橹丿B區(qū)域邊緣端點(diǎn)(Ak,k=1,2,…,N,灰度值為“0”)與字符邊緣的端點(diǎn)(Bk,k=1,2,…,N,灰度值為“1”)鄰接,所以將Ak作為起點(diǎn)檢測字體邊緣方向,具體步驟如下。
第1步根據(jù)重疊區(qū)域邊緣端點(diǎn)坐標(biāo)對的數(shù)量,確定碎片圖像中重疊區(qū)域邊緣端點(diǎn)個(gè)數(shù)N。
第2步任意選取一個(gè)起點(diǎn)Ap,設(shè)定要檢測邊緣像素的長度M。
第3步在去除重疊區(qū)域的字符邊緣圖像[圖2(a)]中搜索像素Ap八鄰蜮中灰度值為“1”的像素點(diǎn),記錄此像素點(diǎn)的坐標(biāo)Bp,并累計(jì)邊緣像素個(gè)數(shù)。
第4步以Bp為起點(diǎn),在其八鄰域內(nèi)搜索灰度值為“1”的像素點(diǎn),記錄此像素點(diǎn)的坐標(biāo)Cp,將Bp像素點(diǎn)灰度值置為“0”,并累計(jì)邊緣像素個(gè)數(shù)。
第5步再以Cp為起點(diǎn),重復(fù)步驟4,直到邊緣像素個(gè)數(shù)與設(shè)定值M相同為止。
第6步以Ap為起點(diǎn),沿檢測出的邊緣像素(即存儲(chǔ)的灰度值為“1”的像素)繪制線段,并進(jìn)行標(biāo)記,如圖2(b)所示。
第7步選取另一個(gè)端點(diǎn)Aq,重復(fù)步驟2-6,直到所有的邊緣端點(diǎn)都檢測完畢。
(a)去除重疊區(qū)域的字符邊緣圖 (b)字符邊緣方向標(biāo)記圖
圖2 字體邊緣方向檢測說明圖
2 仿真實(shí)驗(yàn)
現(xiàn)提出的碎片圖像字符特征提取方法在VisualC++6.0軟件平臺(tái)上進(jìn)行仿真,并調(diào)用OpenCV庫中的函數(shù)。首先,將碎紙片圖像逐張放到黑色臺(tái)布上進(jìn)行掃描,并存儲(chǔ)這些掃描圖像;然后,讀取掃描圖像,對其進(jìn)行預(yù)處理,得到字符區(qū)域圖像和碎片背景區(qū)域圖像,并檢測字符和碎片背景的單像素邊緣;最后,確定字符與碎片背景邊緣交叉點(diǎn)坐標(biāo)和字體邊緣方向,得到用于后續(xù)拼接的特征。為了驗(yàn)證本文提出的方法,對三個(gè)碎紙片圖像進(jìn)行了字符特征提取仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖3所示。圖3(a)為原始圖像,圖3(b)為相應(yīng)的交叉點(diǎn)(圓圈標(biāo)記)檢測圖像,圖3(c)為字體邊緣(與圓圈相連的黑色線段標(biāo)記)方向提取圖像。從這三組圖像可以看出,本文給出的碎片圖像字符特征提取方法能夠較好地檢測出字符與碎片背景邊界交叉點(diǎn)及字體邊緣方向,具有較強(qiáng)的魯棒性。
(a)原始圖像 (b)相應(yīng)的交叉點(diǎn)圖像(c)相應(yīng)的邊緣方向圖像
圖3 字符特征提取結(jié)果圖
3 結(jié)論與認(rèn)識(shí)
含字符信息的碎片圖像拼接在工作中具有非常重要的意義。針對含字符碎片圖像的特點(diǎn),提出了一種碎片圖像字符特征提取方法。該方法利用數(shù)學(xué)形態(tài)學(xué)和邊緣檢測等知識(shí),有效地提取碎片圖像中字符與碎片背景邊緣的交叉點(diǎn)和字體邊緣方向特征。該方法能夠快速、準(zhǔn)確地提取碎片圖像中字符特征,為后續(xù)的碎片圖像拼接提供關(guān)鍵的點(diǎn)坐標(biāo)、線段方向、角度等特征。
參考文獻(xiàn)
[1]李寒,牛紀(jì)楨,郭禾.基于特征點(diǎn)的全自動(dòng)無縫圖像拼接方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(09):2083-2085.
[2]趙彩虹,盧章平,魯金忠.基于匹配對的非規(guī)則碎片拼合算法[J].計(jì)算機(jī)應(yīng)用,2005,25(03):596-597,605.
[3]周石林,廖文和,尹建平.平面碎片匹配算法的研究[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(31):151-153.
[4]鄭蓓蓓,郭立本.改進(jìn)的遺傳算法應(yīng)用于碎片拼接[J].計(jì)算機(jī)與現(xiàn)代化,2011(05):52-56.
[5]吳銘,林錦國,梅雪.用于圖像拼接的特征提取算法研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2009,30(2):440-442.endprint