• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于CDF9?7小波和自適應(yīng)Otsu算法的視頻字幕分割

      2014-06-19 17:57:18黃同邵思飛
      現(xiàn)代電子技術(shù) 2014年9期
      關(guān)鍵詞:類間字幕小波

      黃同 邵思飛

      摘 要: 提出了一種基于CDF9?7小波和自適應(yīng)Otsu算法的視頻圖像字幕分割算法。首先從視頻中截取視頻圖像,并對(duì)其進(jìn)行灰度化等預(yù)處理,其次對(duì)預(yù)處理后的圖像進(jìn)行CDF9?7小波變換,獲取其水平和垂直的高頻分量HH,然后使用自適應(yīng)Otsu算法分割出該高頻分量圖像中的字幕區(qū)域。實(shí)驗(yàn)表明,該算法分割效果良好,具有一定的魯棒性和自適應(yīng)性。以這些區(qū)域?yàn)榛A(chǔ),可以進(jìn)一步完成諸如視頻字幕識(shí)別等圖像分析、理解和識(shí)別操作。

      關(guān)鍵字: CDF9?7小波; 自適應(yīng)Otsu算法; 視頻字幕; 圖像分割

      中圖分類號(hào): TN911.73?34; TP391.1 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2014)09?0050?03

      0 引 言

      視頻是依據(jù)人眼視覺(jué)暫留原理,存儲(chǔ)的看上去平滑連續(xù)而實(shí)際上動(dòng)態(tài)捕捉的一系列的靜態(tài)照片,已經(jīng)成為互聯(lián)網(wǎng)上除文字、聲音之外最重要的媒體形式,對(duì)其自動(dòng)分析與理解已經(jīng)成為當(dāng)前網(wǎng)絡(luò)監(jiān)管的重要研究?jī)?nèi)容。視頻圖像中的文字隱含了非常豐富的高層語(yǔ)義信息,對(duì)其分割、定位、識(shí)別、理解和檢索具有重要的現(xiàn)實(shí)意義。從這些處理步驟來(lái)講,分割和定位操作是字符識(shí)別、理解和檢索等高層處理的基礎(chǔ),直接影響著高層處理的成功率和精確度。字幕作為視頻中最重要的文字,有的以獨(dú)立的字幕文件存在,而有的被嵌入在視頻圖像中。獨(dú)立存在的字幕文件往往僅包含時(shí)間區(qū)間和文本信息,比較容易處理,而嵌入在視頻圖像中的字幕就必須首先進(jìn)行圖像分割操作,然后采用適當(dāng)算法定位這些文字的區(qū)域。

      圖像分割就是把圖像分解成有限個(gè)感興趣的和特質(zhì)相關(guān)的區(qū)域的一種操作,是圖像分析、理解和識(shí)別操作的基礎(chǔ),因此研究人員從各個(gè)學(xué)科出發(fā),提出并不斷改進(jìn)了很多圖像分割方法。目前主要的分割方法有基于閾值設(shè)定、基于邊緣檢測(cè)、基于區(qū)域、基于聚類分析、基于模糊集理論[1],以及基于群體智能[2]等眾多分割方法。這些算法各有優(yōu)缺點(diǎn),存在的主要問(wèn)題是適用范圍的局限性和較低的準(zhǔn)確性及魯棒性。本文提出的CDF9?7小波變換結(jié)合自適應(yīng)Otsu算法的視頻圖像分割方法,對(duì)于視頻圖像中字幕區(qū)域的分割效果良好。

      1 視頻圖像分割步驟

      本文給出的分割方法總體來(lái)說(shuō)有三步。首先,先從視頻中獲取視頻圖像,對(duì)彩色圖像則要進(jìn)行去噪和灰度化等預(yù)處理。目的在于盡可能削弱圖像背景級(jí)噪聲對(duì)字幕文字的相關(guān)性。然后,對(duì)預(yù)處理后的圖像進(jìn)行CDF9?7小波變換,獲取其水平和垂直方向的高頻分量HH。因?yàn)镃DF9?7小波是滿足線性相位要求的非常適用于圖像處理的雙正交小波,而視頻字幕區(qū)域背景和字幕顏色往往對(duì)比度高,邊緣信息和高頻分量豐富。最后,使用自適應(yīng)Otsu算法找出該高頻分量中的最佳閾值,分割出圖像中包含字幕文字的有效區(qū)域。

      1.1 CDF9?7小波

      9?7小波是一個(gè)雙正交小波[3],其正交性體現(xiàn)在母小波[ψ]及其對(duì)偶母小波[ψ]之間,[ψ]和[ψ]本身沒(méi)有正交性, 即[<ψm,n,ψj,k>=δm,jδn,k],對(duì)應(yīng)地其尺度函數(shù)[?]及其對(duì)偶尺度函數(shù)[?]也滿足正交關(guān)系,即[=δm,jδn,k],[ψ]和[ψ]構(gòu)成一對(duì)[L2(R)]空間的雙正交小波基。正交小波可視為是在[ψ=ψ]時(shí)的雙正交小波的特例。雖然相對(duì)正交小波,9?7雙正交小波正交性放寬或者說(shuō)變?nèi)酰撬哂泻芎玫膶?duì)稱性和線性相位特性。其濾波器系數(shù)獲取可以通過(guò)求解約束PR條件得到。但約束條件畢竟只是必要條件,為使無(wú)窮乘積收斂,Cohen、Daubechies和Feauveau提出了以它們名字首字母命名的CDF方法,在求解時(shí)增加了新的消失矩條件,求解出了系數(shù)和沒(méi)有消失矩條件略有不同的9?7小波,可記為CDF9?7小波。這種小波除了原有的對(duì)稱性和線性相位這些優(yōu)點(diǎn)外,支撐區(qū)間變小且收斂更快,正是由于CDF9?7小波的這些優(yōu)秀特征,因而被廣泛用于圖像處理等領(lǐng)域,目前已經(jīng)成為了JPEG 2000有損圖像壓縮標(biāo)準(zhǔn)中的默認(rèn)小波。但在具體實(shí)現(xiàn)中,由于圖像數(shù)據(jù)量往往很大,為提高運(yùn)行效率,往往并不直接采用離散小波變換的快速算法(MALLAT算法),而是對(duì)CDF9?7小波進(jìn)行提升實(shí)現(xiàn),在同等條件下,運(yùn)算速度和效率較MALLAT算法提高2倍。

      CDF9?7小波對(duì)二維圖像變換的步驟是,首先用分析濾波器[h,g]對(duì)圖像(記為[cj+1l,n])的列做小波變換,得到低頻部分[nhn-2mcj+1l,n]和高頻部分[ngn-2mcj+1l,n]。然后對(duì)低頻部分的行做小波變換,得到低頻中的低頻分量[cjk,m](記為L(zhǎng)L)和低頻中的高頻分量[dj,1k,m](記為HL);對(duì)高頻部分的行做小波變換,得到高頻中的低頻分量[dj,2k,m](記為L(zhǎng)H)和高頻中的高頻分量[dj,3k,m](記為HH)。以上分解也可以先做行小波變換再做列小波變換,結(jié)果相同。最后,圖像經(jīng)一級(jí)分解后由如下4塊區(qū)域組成:

      [LLHLLHHH或cjk,mdj,1k,mdj,2k,mdj,3k,m]

      多級(jí)分解可以持續(xù)對(duì)LL分量(圖像概貌)進(jìn)行,最終圖像變成塔式結(jié)構(gòu),為區(qū)分每個(gè)小塊,一般需要對(duì)LL等塊添加代表分解級(jí)數(shù)的下標(biāo)。由于一般的視頻字幕文字區(qū)域與背景(往往純色)存在比較強(qiáng)的邊緣,對(duì)比度高,邊緣信息和高頻分量本身非常豐富,因此,經(jīng)過(guò)分解后,利于圖像分割的信息主要集中在高頻中的高頻分量HH中;多級(jí)分解必然是對(duì)上次分解的低頻分量LL進(jìn)行,本身隱含的視頻字幕文字區(qū)域信息很少。經(jīng)過(guò)多種條件下的反復(fù)測(cè)試,在準(zhǔn)確率基本一致的情況下,多級(jí)分解運(yùn)算量大幅度提高,并無(wú)必要,對(duì)預(yù)處理后的圖像只需要使用CDF9?7小波變換進(jìn)行了一級(jí)分解即可。即完成一級(jí)分解得到的[HH1]送做后續(xù)處理,其他3塊數(shù)據(jù)暫時(shí)不用。

      1.2 自適應(yīng)Otsu算法

      經(jīng)過(guò)CDF9?7小波分解后的圖像區(qū)域[HH1]濾除了原視頻圖像中的低頻信息,隱含了大量視頻圖像的高頻邊緣信息,但并沒(méi)有對(duì)圖像進(jìn)行分割,同時(shí)由于圖像背景的復(fù)雜性, 視頻圖像字幕區(qū)域之外的部分仍然存在很多對(duì)比度高的邊緣信息,因而必須采用相應(yīng)的方法進(jìn)行分割和判定。

      傳統(tǒng)的Otsu算法一般被認(rèn)為是圖像閾值方式分割中閾值選取的“最佳算法”,也可以稱為最大類間差法或大津算法[4]。這種算法計(jì)算簡(jiǎn)單,受圖像對(duì)比度和亮度影響較小,因而在圖像分割領(lǐng)域應(yīng)用廣泛。其基本理論是按圖像的灰度特性,尋找出灰度范圍在0~[L-1]之間共[L]個(gè)灰度級(jí)的圖像的使得類間方差[d]最大的最佳閾值[t],小于[t]的像素集歸為背景,大于[t]的像素集歸為前景。用數(shù)學(xué)方法描述即為:[t=max(d),][d=bp(t)*(be(t)-u)2+fp(t)*(fe(t)-u)2],其中變量:[bp]為取最佳閾值時(shí)背景總的像素點(diǎn)占整幅圖像的比例(概率);[be]為取最佳閾值時(shí)背景總的像素點(diǎn)灰度值的均值;[fp]為取最佳閾值時(shí)前景總的像素點(diǎn)占整幅圖像的比例(概率);[fe]為取最佳閾值時(shí)前景總的像素點(diǎn)灰度值的均值;[u]為整幅圖像像素點(diǎn)灰度值的均值。使以上表達(dá)式值最大的[t],即為分割圖像的最佳閾值。類間方差越大,則背景和前景的差別越大,類間方差越小,則背景和前景的差別越小。造成類間方差變小的原因主要是閾值計(jì)算不當(dāng),使得部分背景錯(cuò)分為前景或部分前景錯(cuò)分為背景,因此,最佳閾值的選擇至關(guān)重要。

      這種算法雖然簡(jiǎn)單且效果較好,但是也有一些顯著缺陷。主要有:

      (1) 最佳閾值的選取必須遍歷圖像整個(gè)灰度范圍[0~L-1]內(nèi)的所有像素,逐個(gè)計(jì)算類間方差[d]并找出使類間方差最大的[t,]運(yùn)算量大,難以滿足視頻圖像中字幕區(qū)域的分割這樣的實(shí)時(shí)系統(tǒng)應(yīng)用;

      (2) 閾值選取是在整個(gè)視頻圖像范圍進(jìn)行計(jì)算,而實(shí)際視頻幀圖像本身灰度分布動(dòng)態(tài)變化且受到各種噪聲的干擾,僅利用灰度直方圖得到的閾值難以得到滿意的圖像字幕區(qū)域分割結(jié)果。

      為此,在視頻圖像中字幕區(qū)域圖像分割這樣的實(shí)時(shí)應(yīng)用中,針對(duì)以上兩點(diǎn)不足,考慮到視頻圖像字幕區(qū)域往往集中在視頻圖像下部,甚至有的字幕區(qū)域背景還是純色或少量噪聲的實(shí)際,提出了一種自適應(yīng)的Otsu算法。設(shè)某視頻圖像分辨率(寬×高)為[m×n](如640×480,1 280×720等),共[L]個(gè)灰度級(jí),其基本方法步驟是:首先,根據(jù)圖像高度,自適應(yīng)地確定字幕區(qū)域的高度范圍,截取字幕區(qū)域子圖像并結(jié)合根據(jù)sum(第[k]行像素值)等于或約等于[m×L,]用軟件簡(jiǎn)單計(jì)算,自適應(yīng)地判別上述字幕區(qū)域背景是否為純色(如白和黑)或近似純色。好處是,最佳閾值[t]的選取局限在較小區(qū)域,大幅度降低了運(yùn)算量;然后,選擇字幕區(qū)域子圖像灰度值中位數(shù)作為“最佳閾值”或傳統(tǒng)的Otsu算法遍歷出最佳閾值。特別地,對(duì)字幕區(qū)域中字符和背景為純色或近似純色的情況,即使有噪聲,灰度個(gè)數(shù)或灰度級(jí)[L]也非常小,傳統(tǒng)的Otsu算法可以極快找出最佳閾值,甚至可以直接灰度值中位數(shù)作為“最佳閾值”,兩種方案都可以進(jìn)一步降低運(yùn)算量,真正滿足實(shí)時(shí)系統(tǒng)要求;最后,使用上述最佳閾值對(duì)整幅視頻圖像進(jìn)行分割。

      2 實(shí)驗(yàn)及結(jié)果

      實(shí)驗(yàn)全部在Matlab 2009b下編程完成,數(shù)據(jù)為常見(jiàn)的電影、新聞和動(dòng)畫(huà)。目前,對(duì)于圖像分割效果的評(píng)價(jià),沒(méi)有統(tǒng)一的客觀數(shù)量指標(biāo)[5],本文的評(píng)價(jià)指標(biāo)設(shè)定為傳統(tǒng)的Otsu算法求出的最佳閾值和自適應(yīng)Otsu算法求出的最佳閾值之間的差值[td,]傳統(tǒng)的Otsu算法耗時(shí)減去自適應(yīng)Otsu算法耗時(shí)的時(shí)間差[jl。]以從電影《第五元素》中截取的一個(gè)視頻圖像為實(shí)例,其分辨率為560×315,寬高比為16∶9,經(jīng)過(guò)對(duì)比計(jì)算[td]等于3,可見(jiàn)閾值差別很?。籟jl]等于80 ms,如果將整個(gè)2小時(shí)5分鐘的整個(gè)視頻累積,則總的[jl]近590 s,可見(jiàn)自適應(yīng)Otsu算法效率和實(shí)時(shí)性顯著提升。作為實(shí)例的視頻圖像按自適應(yīng)Otsu算法所得閾值進(jìn)行圖像分割的結(jié)果如圖1所示。從實(shí)驗(yàn)結(jié)果看出,改進(jìn)的算法令人滿意。

      圖1 視頻圖像分割結(jié)果

      3 結(jié) 語(yǔ)

      本研究提出的基于CDF9?7小波分析和自適應(yīng)Otsu算法的視頻圖像分割方法,較其他分割方法大幅度降低了運(yùn)算量,高效易行,滿足實(shí)時(shí)性需求并具有一定的魯棒性。以這些區(qū)域?yàn)榛A(chǔ),可以進(jìn)一步完成諸如視頻文字區(qū)域定位等圖像分析、理解和識(shí)別操作。但由于視頻圖像背景的復(fù)雜性,算法的準(zhǔn)確性及魯棒性仍需進(jìn)一步提升。

      參考文獻(xiàn)

      [1] 何俊,葛紅.王玉峰.圖像分割算法研究綜述[J].計(jì)算機(jī)工程與科學(xué),2009(12):58?61.

      [2] 馬苗,劉艷麗.圖像分割背景下群體智能優(yōu)化算法的性能對(duì)比[J].云南大學(xué)學(xué)報(bào):自然科學(xué)版,2012(4):401?407.

      [3] 劉在德,常晉義,沈鈞毅.一類雙正交插值小波的參數(shù)化構(gòu)造及圖像編碼應(yīng)用[J].中國(guó)圖象圖形學(xué)報(bào),2010(4):557?564.

      [4] 胡敏,宋銀龍.基于二維Otsu和模糊聚類的圖像分割算法[J].計(jì)算機(jī)應(yīng)用研究,2012(4):1563?1565.

      [5] 鄧廷權(quán),焦穎穎.圖像分割質(zhì)量評(píng)價(jià)的二型模糊集方法[J].計(jì)算機(jī)工程與應(yīng)用,2011(32):217?220.

      [6] 彭正濤,方康玲,蘇志祁.基于改進(jìn)PSO算法的Otsu快速多閾值圖像分割[J].現(xiàn)代電子技術(shù),2011,34(6):10?14.

      傳統(tǒng)的Otsu算法一般被認(rèn)為是圖像閾值方式分割中閾值選取的“最佳算法”,也可以稱為最大類間差法或大津算法[4]。這種算法計(jì)算簡(jiǎn)單,受圖像對(duì)比度和亮度影響較小,因而在圖像分割領(lǐng)域應(yīng)用廣泛。其基本理論是按圖像的灰度特性,尋找出灰度范圍在0~[L-1]之間共[L]個(gè)灰度級(jí)的圖像的使得類間方差[d]最大的最佳閾值[t],小于[t]的像素集歸為背景,大于[t]的像素集歸為前景。用數(shù)學(xué)方法描述即為:[t=max(d),][d=bp(t)*(be(t)-u)2+fp(t)*(fe(t)-u)2],其中變量:[bp]為取最佳閾值時(shí)背景總的像素點(diǎn)占整幅圖像的比例(概率);[be]為取最佳閾值時(shí)背景總的像素點(diǎn)灰度值的均值;[fp]為取最佳閾值時(shí)前景總的像素點(diǎn)占整幅圖像的比例(概率);[fe]為取最佳閾值時(shí)前景總的像素點(diǎn)灰度值的均值;[u]為整幅圖像像素點(diǎn)灰度值的均值。使以上表達(dá)式值最大的[t],即為分割圖像的最佳閾值。類間方差越大,則背景和前景的差別越大,類間方差越小,則背景和前景的差別越小。造成類間方差變小的原因主要是閾值計(jì)算不當(dāng),使得部分背景錯(cuò)分為前景或部分前景錯(cuò)分為背景,因此,最佳閾值的選擇至關(guān)重要。

      這種算法雖然簡(jiǎn)單且效果較好,但是也有一些顯著缺陷。主要有:

      (1) 最佳閾值的選取必須遍歷圖像整個(gè)灰度范圍[0~L-1]內(nèi)的所有像素,逐個(gè)計(jì)算類間方差[d]并找出使類間方差最大的[t,]運(yùn)算量大,難以滿足視頻圖像中字幕區(qū)域的分割這樣的實(shí)時(shí)系統(tǒng)應(yīng)用;

      (2) 閾值選取是在整個(gè)視頻圖像范圍進(jìn)行計(jì)算,而實(shí)際視頻幀圖像本身灰度分布動(dòng)態(tài)變化且受到各種噪聲的干擾,僅利用灰度直方圖得到的閾值難以得到滿意的圖像字幕區(qū)域分割結(jié)果。

      為此,在視頻圖像中字幕區(qū)域圖像分割這樣的實(shí)時(shí)應(yīng)用中,針對(duì)以上兩點(diǎn)不足,考慮到視頻圖像字幕區(qū)域往往集中在視頻圖像下部,甚至有的字幕區(qū)域背景還是純色或少量噪聲的實(shí)際,提出了一種自適應(yīng)的Otsu算法。設(shè)某視頻圖像分辨率(寬×高)為[m×n](如640×480,1 280×720等),共[L]個(gè)灰度級(jí),其基本方法步驟是:首先,根據(jù)圖像高度,自適應(yīng)地確定字幕區(qū)域的高度范圍,截取字幕區(qū)域子圖像并結(jié)合根據(jù)sum(第[k]行像素值)等于或約等于[m×L,]用軟件簡(jiǎn)單計(jì)算,自適應(yīng)地判別上述字幕區(qū)域背景是否為純色(如白和黑)或近似純色。好處是,最佳閾值[t]的選取局限在較小區(qū)域,大幅度降低了運(yùn)算量;然后,選擇字幕區(qū)域子圖像灰度值中位數(shù)作為“最佳閾值”或傳統(tǒng)的Otsu算法遍歷出最佳閾值。特別地,對(duì)字幕區(qū)域中字符和背景為純色或近似純色的情況,即使有噪聲,灰度個(gè)數(shù)或灰度級(jí)[L]也非常小,傳統(tǒng)的Otsu算法可以極快找出最佳閾值,甚至可以直接灰度值中位數(shù)作為“最佳閾值”,兩種方案都可以進(jìn)一步降低運(yùn)算量,真正滿足實(shí)時(shí)系統(tǒng)要求;最后,使用上述最佳閾值對(duì)整幅視頻圖像進(jìn)行分割。

      2 實(shí)驗(yàn)及結(jié)果

      實(shí)驗(yàn)全部在Matlab 2009b下編程完成,數(shù)據(jù)為常見(jiàn)的電影、新聞和動(dòng)畫(huà)。目前,對(duì)于圖像分割效果的評(píng)價(jià),沒(méi)有統(tǒng)一的客觀數(shù)量指標(biāo)[5],本文的評(píng)價(jià)指標(biāo)設(shè)定為傳統(tǒng)的Otsu算法求出的最佳閾值和自適應(yīng)Otsu算法求出的最佳閾值之間的差值[td,]傳統(tǒng)的Otsu算法耗時(shí)減去自適應(yīng)Otsu算法耗時(shí)的時(shí)間差[jl。]以從電影《第五元素》中截取的一個(gè)視頻圖像為實(shí)例,其分辨率為560×315,寬高比為16∶9,經(jīng)過(guò)對(duì)比計(jì)算[td]等于3,可見(jiàn)閾值差別很??;[jl]等于80 ms,如果將整個(gè)2小時(shí)5分鐘的整個(gè)視頻累積,則總的[jl]近590 s,可見(jiàn)自適應(yīng)Otsu算法效率和實(shí)時(shí)性顯著提升。作為實(shí)例的視頻圖像按自適應(yīng)Otsu算法所得閾值進(jìn)行圖像分割的結(jié)果如圖1所示。從實(shí)驗(yàn)結(jié)果看出,改進(jìn)的算法令人滿意。

      圖1 視頻圖像分割結(jié)果

      3 結(jié) 語(yǔ)

      本研究提出的基于CDF9?7小波分析和自適應(yīng)Otsu算法的視頻圖像分割方法,較其他分割方法大幅度降低了運(yùn)算量,高效易行,滿足實(shí)時(shí)性需求并具有一定的魯棒性。以這些區(qū)域?yàn)榛A(chǔ),可以進(jìn)一步完成諸如視頻文字區(qū)域定位等圖像分析、理解和識(shí)別操作。但由于視頻圖像背景的復(fù)雜性,算法的準(zhǔn)確性及魯棒性仍需進(jìn)一步提升。

      參考文獻(xiàn)

      [1] 何俊,葛紅.王玉峰.圖像分割算法研究綜述[J].計(jì)算機(jī)工程與科學(xué),2009(12):58?61.

      [2] 馬苗,劉艷麗.圖像分割背景下群體智能優(yōu)化算法的性能對(duì)比[J].云南大學(xué)學(xué)報(bào):自然科學(xué)版,2012(4):401?407.

      [3] 劉在德,常晉義,沈鈞毅.一類雙正交插值小波的參數(shù)化構(gòu)造及圖像編碼應(yīng)用[J].中國(guó)圖象圖形學(xué)報(bào),2010(4):557?564.

      [4] 胡敏,宋銀龍.基于二維Otsu和模糊聚類的圖像分割算法[J].計(jì)算機(jī)應(yīng)用研究,2012(4):1563?1565.

      [5] 鄧廷權(quán),焦穎穎.圖像分割質(zhì)量評(píng)價(jià)的二型模糊集方法[J].計(jì)算機(jī)工程與應(yīng)用,2011(32):217?220.

      [6] 彭正濤,方康玲,蘇志祁.基于改進(jìn)PSO算法的Otsu快速多閾值圖像分割[J].現(xiàn)代電子技術(shù),2011,34(6):10?14.

      傳統(tǒng)的Otsu算法一般被認(rèn)為是圖像閾值方式分割中閾值選取的“最佳算法”,也可以稱為最大類間差法或大津算法[4]。這種算法計(jì)算簡(jiǎn)單,受圖像對(duì)比度和亮度影響較小,因而在圖像分割領(lǐng)域應(yīng)用廣泛。其基本理論是按圖像的灰度特性,尋找出灰度范圍在0~[L-1]之間共[L]個(gè)灰度級(jí)的圖像的使得類間方差[d]最大的最佳閾值[t],小于[t]的像素集歸為背景,大于[t]的像素集歸為前景。用數(shù)學(xué)方法描述即為:[t=max(d),][d=bp(t)*(be(t)-u)2+fp(t)*(fe(t)-u)2],其中變量:[bp]為取最佳閾值時(shí)背景總的像素點(diǎn)占整幅圖像的比例(概率);[be]為取最佳閾值時(shí)背景總的像素點(diǎn)灰度值的均值;[fp]為取最佳閾值時(shí)前景總的像素點(diǎn)占整幅圖像的比例(概率);[fe]為取最佳閾值時(shí)前景總的像素點(diǎn)灰度值的均值;[u]為整幅圖像像素點(diǎn)灰度值的均值。使以上表達(dá)式值最大的[t],即為分割圖像的最佳閾值。類間方差越大,則背景和前景的差別越大,類間方差越小,則背景和前景的差別越小。造成類間方差變小的原因主要是閾值計(jì)算不當(dāng),使得部分背景錯(cuò)分為前景或部分前景錯(cuò)分為背景,因此,最佳閾值的選擇至關(guān)重要。

      這種算法雖然簡(jiǎn)單且效果較好,但是也有一些顯著缺陷。主要有:

      (1) 最佳閾值的選取必須遍歷圖像整個(gè)灰度范圍[0~L-1]內(nèi)的所有像素,逐個(gè)計(jì)算類間方差[d]并找出使類間方差最大的[t,]運(yùn)算量大,難以滿足視頻圖像中字幕區(qū)域的分割這樣的實(shí)時(shí)系統(tǒng)應(yīng)用;

      (2) 閾值選取是在整個(gè)視頻圖像范圍進(jìn)行計(jì)算,而實(shí)際視頻幀圖像本身灰度分布動(dòng)態(tài)變化且受到各種噪聲的干擾,僅利用灰度直方圖得到的閾值難以得到滿意的圖像字幕區(qū)域分割結(jié)果。

      為此,在視頻圖像中字幕區(qū)域圖像分割這樣的實(shí)時(shí)應(yīng)用中,針對(duì)以上兩點(diǎn)不足,考慮到視頻圖像字幕區(qū)域往往集中在視頻圖像下部,甚至有的字幕區(qū)域背景還是純色或少量噪聲的實(shí)際,提出了一種自適應(yīng)的Otsu算法。設(shè)某視頻圖像分辨率(寬×高)為[m×n](如640×480,1 280×720等),共[L]個(gè)灰度級(jí),其基本方法步驟是:首先,根據(jù)圖像高度,自適應(yīng)地確定字幕區(qū)域的高度范圍,截取字幕區(qū)域子圖像并結(jié)合根據(jù)sum(第[k]行像素值)等于或約等于[m×L,]用軟件簡(jiǎn)單計(jì)算,自適應(yīng)地判別上述字幕區(qū)域背景是否為純色(如白和黑)或近似純色。好處是,最佳閾值[t]的選取局限在較小區(qū)域,大幅度降低了運(yùn)算量;然后,選擇字幕區(qū)域子圖像灰度值中位數(shù)作為“最佳閾值”或傳統(tǒng)的Otsu算法遍歷出最佳閾值。特別地,對(duì)字幕區(qū)域中字符和背景為純色或近似純色的情況,即使有噪聲,灰度個(gè)數(shù)或灰度級(jí)[L]也非常小,傳統(tǒng)的Otsu算法可以極快找出最佳閾值,甚至可以直接灰度值中位數(shù)作為“最佳閾值”,兩種方案都可以進(jìn)一步降低運(yùn)算量,真正滿足實(shí)時(shí)系統(tǒng)要求;最后,使用上述最佳閾值對(duì)整幅視頻圖像進(jìn)行分割。

      2 實(shí)驗(yàn)及結(jié)果

      實(shí)驗(yàn)全部在Matlab 2009b下編程完成,數(shù)據(jù)為常見(jiàn)的電影、新聞和動(dòng)畫(huà)。目前,對(duì)于圖像分割效果的評(píng)價(jià),沒(méi)有統(tǒng)一的客觀數(shù)量指標(biāo)[5],本文的評(píng)價(jià)指標(biāo)設(shè)定為傳統(tǒng)的Otsu算法求出的最佳閾值和自適應(yīng)Otsu算法求出的最佳閾值之間的差值[td,]傳統(tǒng)的Otsu算法耗時(shí)減去自適應(yīng)Otsu算法耗時(shí)的時(shí)間差[jl。]以從電影《第五元素》中截取的一個(gè)視頻圖像為實(shí)例,其分辨率為560×315,寬高比為16∶9,經(jīng)過(guò)對(duì)比計(jì)算[td]等于3,可見(jiàn)閾值差別很??;[jl]等于80 ms,如果將整個(gè)2小時(shí)5分鐘的整個(gè)視頻累積,則總的[jl]近590 s,可見(jiàn)自適應(yīng)Otsu算法效率和實(shí)時(shí)性顯著提升。作為實(shí)例的視頻圖像按自適應(yīng)Otsu算法所得閾值進(jìn)行圖像分割的結(jié)果如圖1所示。從實(shí)驗(yàn)結(jié)果看出,改進(jìn)的算法令人滿意。

      圖1 視頻圖像分割結(jié)果

      3 結(jié) 語(yǔ)

      本研究提出的基于CDF9?7小波分析和自適應(yīng)Otsu算法的視頻圖像分割方法,較其他分割方法大幅度降低了運(yùn)算量,高效易行,滿足實(shí)時(shí)性需求并具有一定的魯棒性。以這些區(qū)域?yàn)榛A(chǔ),可以進(jìn)一步完成諸如視頻文字區(qū)域定位等圖像分析、理解和識(shí)別操作。但由于視頻圖像背景的復(fù)雜性,算法的準(zhǔn)確性及魯棒性仍需進(jìn)一步提升。

      參考文獻(xiàn)

      [1] 何俊,葛紅.王玉峰.圖像分割算法研究綜述[J].計(jì)算機(jī)工程與科學(xué),2009(12):58?61.

      [2] 馬苗,劉艷麗.圖像分割背景下群體智能優(yōu)化算法的性能對(duì)比[J].云南大學(xué)學(xué)報(bào):自然科學(xué)版,2012(4):401?407.

      [3] 劉在德,常晉義,沈鈞毅.一類雙正交插值小波的參數(shù)化構(gòu)造及圖像編碼應(yīng)用[J].中國(guó)圖象圖形學(xué)報(bào),2010(4):557?564.

      [4] 胡敏,宋銀龍.基于二維Otsu和模糊聚類的圖像分割算法[J].計(jì)算機(jī)應(yīng)用研究,2012(4):1563?1565.

      [5] 鄧廷權(quán),焦穎穎.圖像分割質(zhì)量評(píng)價(jià)的二型模糊集方法[J].計(jì)算機(jī)工程與應(yīng)用,2011(32):217?220.

      [6] 彭正濤,方康玲,蘇志祁.基于改進(jìn)PSO算法的Otsu快速多閾值圖像分割[J].現(xiàn)代電子技術(shù),2011,34(6):10?14.

      猜你喜歡
      類間字幕小波
      Word和Excel聯(lián)手字幕添加更高效
      構(gòu)造Daubechies小波的一些注記
      基于貝葉斯估計(jì)的多類間方差目標(biāo)提取*
      基于MATLAB的小波降噪研究
      電子制作(2019年13期)2020-01-14 03:15:32
      基于類間區(qū)分度的屬性約簡(jiǎn)方法*
      基于類間相對(duì)均勻性的紙張表面缺陷檢測(cè)
      基于改進(jìn)的G-SVS LMS 與冗余提升小波的滾動(dòng)軸承故障診斷
      基于改進(jìn)最大類間方差法的手勢(shì)分割方法研究
      整合適應(yīng)選擇度下的動(dòng)畫(huà)電影字幕翻譯——以《冰河世紀(jì)》的字幕漢譯為例
      論紀(jì)錄片的字幕翻譯策略
      人間(2015年22期)2016-01-04 12:47:26
      晴隆县| 鸡泽县| 新化县| 南江县| 拉萨市| 延庆县| 绥江县| 通化县| 达州市| 林西县| 鹿邑县| 娱乐| 海林市| 东海县| 长丰县| 平江县| 察哈| 漯河市| 泸西县| 巴里| 广元市| 手游| 三明市| 罗田县| 仪征市| 二连浩特市| 福安市| 安新县| 嫩江县| 和硕县| 新营市| 襄汾县| 务川| 大渡口区| 万山特区| 繁峙县| 城步| 株洲县| 甘肃省| 龙陵县| 儋州市|