趙 彥 明
(河北民族師范學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院 河北 承德 067000)
慢變信號是不變量的表達(dá)形式,是高頻輸入信號在高層表達(dá)上抽象的不變量信息。慢特征分析算法是基于不變量學(xué)習(xí)的分析算法,用于提取信號的慢屬性和屬性間的慢拓?fù)?,并在諸多領(lǐng)域成功應(yīng)用。
在1989年,Hinton[1]首次給出慢變特征的基本概念、基本理論和假設(shè),初步形成慢變特征提取理論。2002年文獻(xiàn)[2]提出慢變特征分析算法(SFA),該算法是一種非監(jiān)督學(xué)習(xí)算法,通過特征空間的非線性擴(kuò)張算法,有效解決了監(jiān)督學(xué)習(xí)算法的樣本數(shù)量不足與恒維等現(xiàn)象。慢變特征分析的理論和算法被建立。
2005年Berkes[3]和Wiskott將不變量學(xué)習(xí)成果應(yīng)用于復(fù)雜細(xì)胞感受野學(xué)習(xí)模型研究上。2007年文獻(xiàn)[4]研究并揭示不變量在馬海體細(xì)胞上的性質(zhì),為不變量學(xué)習(xí)理論鑒定了生理學(xué)基礎(chǔ)。2008年文獻(xiàn)[5]利用慢變特征分析算法實(shí)現(xiàn)了卡通魚位置與旋轉(zhuǎn)角度的不變特征提取與識別,首次證明了慢變特征算法有能力提取分類信息,為慢變特征算法在特征提取與模式識別領(lǐng)域內(nèi)應(yīng)用提供了理論與實(shí)驗(yàn)基礎(chǔ)。
文獻(xiàn)[6]于2009年研究利用馬爾科夫鏈生成訓(xùn)練數(shù)據(jù)訓(xùn)練慢變特征分析算法。證明當(dāng)小參數(shù)a趨近于0時(shí),慢變特征算法抽取的特征與FDA算法抽取的特征等效,證明不變量特征提取算法在特征提取上是正確可行的,同時(shí)證實(shí)馬爾可夫鏈在慢特征訓(xùn)練上的可行性。
2011年馬奎俊等[7]提出基于核的慢變特征分析算法,解決了特征空間擴(kuò)充問題和避免在高維空間的運(yùn)算問題,實(shí)現(xiàn)了慢變特征分析算法在盲信號分離上的應(yīng)用。至此,標(biāo)準(zhǔn)慢特征分析算法已初步成熟。
為降低標(biāo)準(zhǔn)慢特征分析算法計(jì)算復(fù)雜度,受分治策略啟發(fā),文獻(xiàn)[8]提出層次化的慢變特征分析算法,緩解計(jì)算復(fù)雜度過高問題,但是該算法因分層結(jié)構(gòu)而損失相當(dāng)一部分信息,不能確保算法能夠提取全部的全局優(yōu)化特征。為改進(jìn)信息損失引起的特征提取非完全全局最優(yōu)特征問題,以圖論為基礎(chǔ),文獻(xiàn)[9]提出了基于圖論的慢變特征分析算法(GFSA)。該算法提出利用訓(xùn)練圖的復(fù)雜結(jié)構(gòu)來訓(xùn)練慢變特征分析算法的思想,該算法初步提出根據(jù)訓(xùn)練圖像自身的復(fù)雜結(jié)構(gòu)特征實(shí)現(xiàn)特征提取。2015年趙彥明等[10]提出了基于自然圖像復(fù)雜視覺信息的特征提取算法,從視覺選擇性角度,以自定義的TICA,提取自然圖像復(fù)雜視覺空間信息與信息間的拓?fù)潢P(guān)系的慢特征,揭示視覺選擇性與慢特征之間的一致性。
近年來慢變分析算法在人類行為識別[11-13]、忙信號分析[7,14]、動(dòng)態(tài)監(jiān)測[15]、3D特征提取[16]和多人路徑規(guī)劃[17]等不同領(lǐng)域上取得較好的應(yīng)用。
慢特征分析方法在理論與應(yīng)用上取得較好進(jìn)展。但是,仍然存在如下兩點(diǎn)缺欠:(1) 盡管慢特征分析方法已經(jīng)采用訓(xùn)練圖的復(fù)雜結(jié)構(gòu)來訓(xùn)練慢變特征,但是傳統(tǒng)慢特征分析方法提取的慢變特征不能揭示自然圖像的視覺空間拓?fù)浣Y(jié)構(gòu);(2) 沒有利用圖像序列的序列性和序列變化的視覺慢變性實(shí)現(xiàn)基元素的非線性擴(kuò)張。
基于此,本文提出基于視覺選擇性的離變焦圖像序列慢變特征提取算法,解決了上述缺欠。
在對自然圖像分析上,慢特征分析過程具有與靈長類動(dòng)物視覺皮層復(fù)雜視覺細(xì)胞視覺成像相近的特征[18]。靈長類動(dòng)物的視覺系統(tǒng)對外界環(huán)境觀察的過程中,傳感信號和環(huán)境表示都是時(shí)域上的快速變化函數(shù),頻域上的高頻函數(shù),而其本質(zhì)特征則是隨時(shí)間緩慢變化的,即信號中包含的基函數(shù)空間與空間中基函數(shù)的拓?fù)潢P(guān)系變化緩慢,靈長類動(dòng)物的視覺處理過程是多通路并行,每通路分層串行處理的過程[19-20];視覺選擇性理論[10]:在視覺空間中,相同或相近子功能的視覺細(xì)胞分布在相同視覺區(qū)域,不同子功能的視覺細(xì)胞分布在不同視覺區(qū)域。
自然場景的離變焦圖像序列采集過程類似于靈長類動(dòng)物視覺系統(tǒng)對外界環(huán)境的觀察過程。該過程是不同視距、視角和運(yùn)動(dòng)條件下,自然圖像包含的視覺信息變化過程。離變焦采集系統(tǒng)采集的離變焦圖像序列包含的傳感信號與環(huán)境信號表示都是時(shí)域上快速變化的函數(shù)與過程,是頻域上的高頻函數(shù)。而離變焦圖像序列視覺空間本質(zhì)特征,則是隨時(shí)間緩慢變化的,是快速變化的圖像序列包含的傳感信號與環(huán)境信號表示中的基函數(shù)空間與基函數(shù)空間的拓?fù)浣Y(jié)構(gòu)的不變性。
因此,本算法以靈長類動(dòng)物的視覺選擇性為理論基礎(chǔ),以慢特征分析為方法,提取離變焦圖像序列中能夠反映自然圖像離變焦圖像序列的視覺空間基的種類、每類元素?cái)?shù)量、類內(nèi)與類間拓?fù)浣Y(jié)構(gòu)不變性的Gabor特征。
初步分析SFA算法的理論與應(yīng)用進(jìn)行概述與分析,并歸納出傳統(tǒng)SFA算法的優(yōu)勢與缺欠?,F(xiàn)有算法的工作成果如表1所示。
表1 現(xiàn)有算法工作成果比較表
基于表1的比較分析結(jié)果,本文將重點(diǎn)從慢特征提取方法、慢特征擴(kuò)展方法和特征結(jié)構(gòu)方面改進(jìn),實(shí)現(xiàn)滿特征算法與視覺選擇性有效結(jié)合,實(shí)現(xiàn)離變焦圖序列的特征提取與識別。下面將逐條論證算法改進(jìn)與改進(jìn)結(jié)果。
離變焦圖像是一個(gè)廣泛的定義。在研究離變焦圖像特征提取與分析時(shí),應(yīng)該限定離變焦的研究范圍和研究約束。本文研究的離變焦圖像序列是不改變圖像視覺空間基的組成信息及拓?fù)浣Y(jié)構(gòu)的離變焦圖像集合。這是在視覺空間內(nèi)研究離變焦圖像的基本約束,稱為有限離變焦約束準(zhǔn)則。
基于此,離變焦圖像表達(dá)為:
I(k)={IB(k,i,t),t=1,2,…;i=1,2,…,Nk}
(1)
式中:IB(k,i,t)是第k個(gè)待研究離變焦圖像的第i視覺基空間的第t個(gè)視覺功能區(qū)。Nk表示有限離變焦約束系數(shù),以此保證本文算法提取離變焦圖像序列不變性視覺特征的一致性。計(jì)算方法為:
(2)
式中:IB(k,i,t)是第k個(gè)待研究離變焦圖像的第i視覺基空間的第t個(gè)視覺功能區(qū)。Tall表示特征學(xué)習(xí)完成后第k個(gè)待研究離變焦圖像的基空間的個(gè)數(shù)|I(k)|,且T 受有限離變焦約束準(zhǔn)則限定,本文離變焦圖像序列定義為:GI={I(k),k=1,2,…,N}。 改進(jìn)1特征提取方法改進(jìn)。 原SFA算法的特征提取方法為PCA方法,主要提取圖像的獨(dú)立成分信息,并沒有提取自然圖像的視覺空間拓?fù)浣Y(jié)構(gòu),不能從視覺本質(zhì)上反映圖像的視覺本質(zhì)特征。受視覺選擇性理論啟發(fā),IB(k,i,t)中的元素應(yīng)該具有相近或相似的視覺功能,并且分布在視覺空間相近的位置,具有明顯的視覺選擇性。因此,以myTICA[20]方法替代源SFA算的PCA方法,提取能夠反映自然圖像離變焦圖像視覺慢變特征。即IB(k,i,t)用Gabor函數(shù)模擬,表達(dá)為: I(k)={IB(k,i,t)|IB(k,i,t)=gabor(f,o,t), t=1,2,…;i=1,2,…,NK} (3) 式中:f表示頻率,o表示方向角,t表示歸一化分布位置。 改進(jìn)2特征基擴(kuò)展與優(yōu)化方法改進(jìn)。 原SFA算法的特征空間擴(kuò)展方法為多項(xiàng)式擴(kuò)展算法,計(jì)算復(fù)雜度高,并且沒有與自然圖像視覺本質(zhì)信息相結(jié)合,從視覺本質(zhì)特征上進(jìn)行特征空間擴(kuò)展,生成反映自然圖像本質(zhì)的超完備不變性特征集合。受人類視覺形成過程預(yù)備離變焦圖像序列生成過程的一致性啟發(fā),本文利用馬爾可夫蒙特卡洛(MCMC)算法替代源SFA算法的多項(xiàng)式擴(kuò)張方法,實(shí)現(xiàn)特征空間非線性擴(kuò)展。該擴(kuò)展包括特征基內(nèi)元素?cái)U(kuò)展和特征樹上元素?cái)U(kuò)展,生成自然圖像離變焦圖像序列視覺不變性特征的超完備基,并利用自定義的近似正交剪枝算法實(shí)現(xiàn)不變性特征森林的優(yōu)化,得到優(yōu)化超完備基。具體實(shí)現(xiàn)如下: 以GI特征集合元素的分布作為先驗(yàn)概率,利用基于Gibbs方法的馬爾可夫蒙特卡羅預(yù)測算法,實(shí)現(xiàn)超完備基擴(kuò)展,并依據(jù)超完備基約束系數(shù),生成滿足用戶需求的離變焦圖像不變性的超完備基。并啟用近似正交判別規(guī)則對超完備基進(jìn)行剪枝操作,優(yōu)化超完備基。同時(shí)對tree(m)鏈上數(shù)據(jù)采用相同的預(yù)測算法,實(shí)現(xiàn)鏈上數(shù)據(jù)的完備擴(kuò)展。 超完備基約束系數(shù)定義為: (4) 該系數(shù)針對于自然圖像視覺空間的每個(gè)基,該系數(shù)限定MCMC算法生成基不能主導(dǎo)本文算法,只能起到輔助作用。 近似正交判別規(guī)則和剪枝方法: 設(shè)任意向量α、β,則兩個(gè)向量正交的判別條件為:α⊥β?<α,β>=0。因此,定義相似正交的等價(jià)條件為:<α,β>=ε,ε為任意小正數(shù),稱為剪枝系數(shù),控制剪枝的程度。因此,當(dāng)lim<α,β><ε時(shí),兩個(gè)向量近似正交,如果是非擴(kuò)展生成向量,響應(yīng)系數(shù)增加1,并剪枝其中一個(gè),否則,直接剪枝;當(dāng)lim<α,β>≥ε時(shí),不進(jìn)行剪枝。 改進(jìn)3不變性特征形成。 原SFA算法僅提取自然圖像的PCA特征,并沒有根據(jù)自然圖像自身的視覺特征提取離變焦自然圖像慢變特征和特征間的空間拓?fù)潢P(guān)系。 因此,根據(jù)上述兩步改進(jìn),在原SFA算法構(gòu)架上改進(jìn),構(gòu)造反映離變焦自然圖像序列視覺不變性的特征森林,如圖1所示。 圖1 離變焦自然圖像序列視覺不變性的特征森林 圖中:tree(m)為離變焦圖像序列的視覺空間第m序列的特征,m=1,2,3,…。該tree(m)是依據(jù)靈長類動(dòng)物視覺信息處理全局并行,局部串行的理論設(shè)計(jì)的,有利于算法分布式并行設(shè)計(jì)。 綜上所述,離變焦圖像序列的慢變特征表達(dá)為: IS={tree(m)|m=1,2,3,…} (5) tree(m)={(index(m,j),gabor(m,j))} (6) 式中:m表示表示視覺空間基,j表示該視覺空間基中元素位置,j=1,2,…,360。IS矩陣的列具有頻率選擇性,行具有方向角選擇性,排列方法為遞增排列,且方向角范圍規(guī)定為[1°,360°]。 因此特征描述如表2所示。 表2 特征矩陣index(每行包含360個(gè)特征) 表中:1表示該位置存在感受野;0表示該位置不存在感受野。而且每個(gè)index(i,j)節(jié)點(diǎn)處隱含與其對應(yīng)的gabor(i,j)函數(shù),這些函數(shù)組成特征矩陣GMindes,如表3所示。 表3 特征矩陣GMindex對應(yīng)的感受野 S1:初始化訓(xùn)練圖庫指針k=1。 S2:從訓(xùn)練圖庫train_db中,提取離變焦圖像序列GI={I(k)|k=1,2,…,N}。 S3:在圖像I(k)上,按照窗口大小N1×N2,隨機(jī)采樣個(gè)數(shù)2 048×sample_number個(gè)子圖像,生成訓(xùn)練子集train_sub_db(k)。其中采樣次數(shù)sample_number是一個(gè)實(shí)驗(yàn)值,是防止算法過擬合的控制參數(shù)。 S5:如果i≤N,i=i+1,算法重復(fù)執(zhí)行S2-S4步。否則,算法完成。 S6:當(dāng)GI={I(k)|k=1,2,…,N}特征集合生成完畢,利用該集合元素作為先驗(yàn)概率,啟動(dòng)基于Gibbs方法的馬爾可夫蒙特卡羅預(yù)測算法,實(shí)現(xiàn)各個(gè)基的超完備基擴(kuò)展,并啟用近似正交判別規(guī)則對超完備基進(jìn)行剪枝操作,簡化優(yōu)化計(jì)算過程且保持超完備基特征。同時(shí)對tree(m)鏈上數(shù)據(jù)采用相同的預(yù)測算法,實(shí)現(xiàn)鏈上數(shù)據(jù)的完備擴(kuò)展。 該擴(kuò)展過程受超完備基約束系數(shù)和剪枝系數(shù)兩個(gè)參數(shù)影響,其定義為: (7) 該系數(shù)針對自然圖像視覺空間的每個(gè)基,并限定MCMC算法生成基不能主導(dǎo)本文算法,只能起到輔助作用。 近似正交判別規(guī)則如下: 設(shè)任意向量α、β,則兩個(gè)向量正交的判別條件為:α⊥β?<α,β>=0。因此,定義相似正交的等價(jià)條件為: <α,β>=ε,ε為任意小正數(shù),稱為剪枝系數(shù),控制剪枝的程度。 當(dāng)lim<α,β><ε時(shí),兩個(gè)向量近似正交,如果是非擴(kuò)展生成向量,響應(yīng)系數(shù)增加1,并剪枝其中一個(gè);否則,直接剪枝。 當(dāng)lim<α,β>≥ε時(shí),不進(jìn)行剪枝。 S1:從測試圖像集合test_db中提取一幅圖片test_db(i)。 S2:在圖像test_db(i)上,按照窗口大小11×11像素隨機(jī)采樣個(gè)數(shù)2 048×sample_number個(gè)子圖像,生成測試子集test_sub_db(i,k)。 S3:從特征數(shù)據(jù)庫中讀取特征矩陣index和GMindex,設(shè)滑動(dòng)尺度為1,按照自定義響應(yīng)度計(jì)算方法,計(jì)算test_sub_db元素與特征矩陣GMindex的響應(yīng)度。按照響應(yīng)度計(jì)算規(guī)則,生成識別結(jié)果矩陣test_index(i)。 自定義響應(yīng)度計(jì)算規(guī)則如下: 計(jì)算相似矩陣T: (8) 計(jì)算T矩陣每一列中內(nèi)積值大于平均內(nèi)積值的元素個(gè)數(shù)ref_number,并將該值賦值給test_index(i)行。 S4:利用基于巴氏距離的直方圖匹配法計(jì)算test_index與index的相似性系數(shù)δ。將相似系數(shù)δ>δ0的類記錄到識別結(jié)果recong_result(j)中。 S5:按照Softmax函數(shù)方法計(jì)算recong_result(j)矩陣識別結(jié)果。 根據(jù)第2節(jié)的理論分析,離變焦圖像可由原始清晰圖像通過仿射變換近似生成。因此,算法實(shí)驗(yàn)圖庫為從INRIA Holidays dataset圖庫中選區(qū)的1 000幅圖像集,按照表4的前5列參數(shù)做仿射變換生成包含原始圖像在內(nèi)的研究圖庫,圖庫大小為15 000幅。該圖庫被分成兩個(gè)部分,前12 000幅為訓(xùn)練圖集train_set;后3 000幅為測試圖集test_set,兩個(gè)集合均包含原始圖像1 000幅。圖2顯示了部分來自研究圖庫的圖片樣本。 表4 仿射變換表 圖2 基于INRIA Holidays圖庫的實(shí)驗(yàn)圖庫樣本 在INRIA Holidays dataset選取圖像103901.jpg,按照采樣窗口大小為11×11像素和采樣次數(shù)為2 048次,在該圖像上隨機(jī)采樣生成original_set子圖像集,并依據(jù)文獻(xiàn)[10]算法生成original_set_base視覺空間基集;按照仿射變換表參數(shù)設(shè)定,依據(jù)上面的過程生成不同參數(shù)下rotate_set_base(angle)、translate_set_base(pixels)和scala_set_base(scala)視覺空間基集。按照基于巴氏距離的直方圖匹配方法,計(jì)算各個(gè)變換集合到原始視覺空間基集的巴士系數(shù)。結(jié)果如圖3所示。 圖3 bhattacharyya系數(shù)分布圖 由圖3可知:根據(jù)bhattacharyya系數(shù)分布圖,在有限約束條件下,離變焦圖像具有視覺慢變性。其中平移對巴氏系數(shù)影響非常小,圖像平移具有最強(qiáng)的視覺不變性。旋轉(zhuǎn)與伸縮對巴氏系數(shù)影響非常大,具有有限視覺慢變性,即約束范圍內(nèi)具有視覺不變性。實(shí)驗(yàn)驗(yàn)證,當(dāng)旋轉(zhuǎn)角度控制在1°范圍內(nèi),算法具有嚴(yán)格的角度視覺不變性。伸縮尺度限定在[1/8,3]內(nèi),算法具有嚴(yán)格的伸縮視覺不變性。因此,實(shí)驗(yàn)圖庫生成嚴(yán)格按照該約束。 采樣窗口大小對算法識別率具有較大影響,在不同采樣窗口大小下,以訓(xùn)練圖集train_set訓(xùn)練,并以測試圖集train_set測試本文算法。結(jié)果如圖4所示(窗口大小為n×n,其中n=3,5,7,9,11,13,17,19,23,29,33,37)。 圖4 采樣窗口大小對算法識別率的影響 由圖4可知:隨采樣窗口大小增加,算法識別率先增加后區(qū)域穩(wěn)定,原因?yàn)榇翱诖笮∵^小時(shí),算法局部特征過于明顯,影響全局特征標(biāo)書,造成識別率下降。而隨采樣窗口大小逐漸增高,全局信息與局部信息采集達(dá)到均衡,算法識別率逐漸增高后會(huì)趨于平穩(wěn)變化。當(dāng)采樣窗口大小為11×11時(shí),算法識別率為99.37%,具有較好的實(shí)用性。 當(dāng)采樣窗口大小為11×11時(shí),采樣次數(shù)為128、162、196、256、296、352、406、456、512、587、624、698、729、798、852、962、1 024、1 225、1 532、1 856、1 960、2 048、2 155、3 256、4 096、5 056、6 024、7 152、7 852、8 192次時(shí),采樣次數(shù)對算法識別效果的影響如圖5所示。 圖5 采樣次數(shù)對算法識別率的影響 由圖5可知:隨采樣次數(shù)增加,算法識別率呈現(xiàn)先增加后趨于穩(wěn)定,原因?yàn)椴蓸哟螖?shù)過少時(shí),因采樣算法會(huì)發(fā)生信息丟失,造成識別率下降。而隨采樣次數(shù)逐漸增高,信息丟失現(xiàn)象會(huì)被盡量避免,算法識別率逐漸增高后會(huì)趨于平穩(wěn)變化。當(dāng)采樣次數(shù)為2 048時(shí),算法識別率為99.67%,具有較好的實(shí)用性。 綜上所述,當(dāng)采樣窗口大小為11×11像素,采樣次數(shù)為2 048次時(shí),算法具有較好的識別效果,可作為后續(xù)實(shí)驗(yàn)的約束條件。 根據(jù)上述實(shí)驗(yàn)結(jié)果,采樣窗口大小為11×11像素,采樣次數(shù)為2 048次,采用本文算法,在訓(xùn)練圖集train_set和測試圖集test_set上,研究剪枝系數(shù)和超完備基約束系數(shù)λ與本文算法性能的關(guān)系,如圖6、圖7所示。 圖6 剪枝系數(shù)ε與本文算法性能的關(guān)系 由圖6可知:當(dāng)剪枝系數(shù)增加變化較小時(shí),剪枝去除的基元素?cái)?shù)量較小,基本上不會(huì)影響自然圖像的視覺特征空間表達(dá),因此,不會(huì)影響算法識別率;隨剪枝系數(shù)增加,超完備基元素?cái)?shù)目減小增加,會(huì)增加去除從自然圖像直接提取的基元素,視覺空間表達(dá)效果降低,識別率下降;當(dāng)剪枝系數(shù)增加到一定區(qū)域時(shí),算法提取的基元素基本來自于自然圖像直接提取,算法識別率不會(huì)發(fā)生明顯變化。 由圖7可知:當(dāng)超完備基約束系數(shù)λ增加變化較小時(shí),算法預(yù)測生成的基元素?cái)?shù)量較小,對自然圖像的視覺特征空間表達(dá)影響大,因此,對算法識別率影響較??;隨超完備基約束系數(shù)增加,超完備基生成元素?cái)?shù)目增加,將減小從自然圖像直接提取的基元素對視覺空間表達(dá)效果貢獻(xiàn),導(dǎo)致識別率下降。 圖7 超完備基約束系數(shù)λ與本文算法性能的關(guān)系圖 綜上所述,當(dāng)采樣窗口大小為11×11個(gè)像素,采樣數(shù)為2 048,剪枝系數(shù)ε=0.15和超完備基約束系數(shù)λ=0.06時(shí),本文算法識別性能最佳,識別率為99.87%。 選擇采取采樣窗口大小為11×11像素,采樣次數(shù)為2 048次,剪枝系數(shù)ε=0.15和超完備基約束系數(shù)λ=0.06時(shí),在訓(xùn)練圖集train_set和測試圖集test_set上。按照本文算法進(jìn)行類內(nèi)與類間bhattacharyya距離分布實(shí)驗(yàn),結(jié)果如圖8所示。 圖8 bhattacharyya距離分布 可以看出,依據(jù)ROC(receiver operating characteristic)曲線,當(dāng)實(shí)驗(yàn)閾值為0.4時(shí),算法獲得識別率為99.96%,誤識率與誤據(jù)率都小于0.02%。表明本文算法具有較強(qiáng)的分類能力。 選擇采取采樣窗口大小為11×11像素,采樣次數(shù)為2 048次,剪枝系數(shù)ε=0.15和超完備基約束系數(shù)λ=0.06時(shí)。在訓(xùn)練圖集train_set和測試圖集test_set上,比較本文算法與SFA[1]、GSFA[8]、TICA[9]、myICA[10]性能,結(jié)果如圖9所示。 由圖9可知:與SFA[1]、GSFA[8]、TICA[9]、myICA[10]相比,本文算法具有高于其他算法識別率,原因是本文算法不僅提取自然圖像的感受野信息,也提取感受野間拓?fù)潢P(guān)系,從視覺空間上構(gòu)造信息+拓?fù)涞奶卣鹘Y(jié)構(gòu),本質(zhì)上表示自然圖像的視覺特征,是其他算法所沒有的。隨采樣窗口大小的增加,每種算法的識別率先增加后趨于穩(wěn)定。當(dāng)采樣窗口大小為11×11時(shí),各個(gè)算法均達(dá)到穩(wěn)定識別率。當(dāng)窗口過小時(shí),算法抗噪聲能力差,算法識別率低;當(dāng)窗口大小過大時(shí),提取的感受野可能會(huì)包含多個(gè)感受野信息,造成感受野局部性信息丟失,算法識別率低。 不同噪聲強(qiáng)度、不同噪聲類型(Gaussian、Salt&pepper和Speckl)會(huì)對識別率產(chǎn)生影響,當(dāng)噪聲過大時(shí),將失去研究價(jià)值。因此,分析算法的抗噪性能,結(jié)果如表5所示。 表5 算法的抗噪性能表 % 由表5可知:隨噪聲強(qiáng)度的增加算法識別率顯著減小,但是在噪聲強(qiáng)度低于5%時(shí),算法具有較強(qiáng)的抗噪能力。Gaussian噪聲的函數(shù)表達(dá)式是gabor函數(shù)的一個(gè)子集,具有明顯視覺“ON-OFF”選擇性。因此,高斯噪聲增加會(huì)改變局部視覺空間結(jié)構(gòu)的基函數(shù)屬性與特征,造成提取gabor函數(shù)不能表述原自然圖像的本質(zhì)屬性,但是高斯噪聲對拓?fù)浣Y(jié)構(gòu)影響不大。Salt&pepper具有黑白點(diǎn)噪聲特點(diǎn),具有體量較小視覺“ON-OFF”選擇性。對局部區(qū)域特征提取具有較大影響,對區(qū)域性gabor函數(shù)提取具有較大影響,當(dāng)采樣窗口大小較小時(shí),影響尤為嚴(yán)重,對全局與局部拓?fù)浣Y(jié)構(gòu)影響比高斯噪聲大。與前兩種噪聲相比較,Speckl噪聲具有單體結(jié)構(gòu)大的特點(diǎn),每個(gè)斑點(diǎn)噪聲均可以形成獨(dú)立的視覺gabor函數(shù),可產(chǎn)生獨(dú)立的視覺選擇性,同時(shí)破壞原有自然圖像的視覺選擇性和視覺分塊屬性。因此,按照本文算法提取的感受野特征不能較好表示原圖像視覺特征,算法識別率受到較大影響。整體上,在相同噪聲強(qiáng)度下,Speckl、Salt&pepper和Gaussian對本文算法識別率影響依次減弱。 本文提出基于改進(jìn)慢特征分析的離變焦圖像序列特征提取算法。算法受自然圖像視覺不變性理論啟發(fā),提取離變焦圖像序列的視覺空間基的種類與類內(nèi)元素?cái)?shù)量、類內(nèi)拓?fù)渑c類間拓?fù)浣Y(jié)構(gòu)的不變性特征建立圖像序列的視覺不變性特征森林,解決了慢變特征提取算法忽視自然圖像自身所包含的復(fù)雜視覺特征不變性問題;提出慢變特征森林從本質(zhì)上描述離變焦圖像的視覺不變性本質(zhì)。通過蒙特卡洛馬爾可夫算法預(yù)測生成新的基元素,解決采樣算法造成的自然圖像的基元素丟失問題,并降低基擴(kuò)張部分的計(jì)算復(fù)雜度;利用自定義的近似正交剪枝算法實(shí)現(xiàn)森林剪枝,優(yōu)化不變性特征森林,并利用自定義響應(yīng)度計(jì)算規(guī)則實(shí)現(xiàn)匹配算法。從理論與實(shí)驗(yàn)角度,通過大量實(shí)驗(yàn)驗(yàn)證本文算法。實(shí)驗(yàn)結(jié)果表明:與同類算法相比,該算法正確可行,具有較好的抗噪能力;在實(shí)驗(yàn)閾值為0.4時(shí),算法獲得識別率為:99.96%,誤識率與誤據(jù)率都小于0.02%,這說明本文提取的算法具有較強(qiáng)的分類能力。 未來將深入研究依據(jù)自然圖像視覺本質(zhì)特征自適應(yīng)設(shè)定蒙特卡洛馬爾可夫算法參數(shù)問題,使其在視覺計(jì)算領(lǐng)域取得更好的應(yīng)用效果,并展開該算法在信號識別領(lǐng)域應(yīng)用探索。3 算法設(shè)計(jì)
3.1 特征提取算法
3.2 識別算法
4 實(shí)驗(yàn)及分析
4.1 實(shí)驗(yàn)圖庫生成與展示
4.2 離變焦圖像視覺不變性驗(yàn)證
4.3 采樣窗口大小與采樣次數(shù)對算法識別性能的影響
4.4 超完備基生成參數(shù)對算法識別性能的影響
4.5 算法可行性評價(jià)
4.6 算法識別性能比較
4.7 算法抗噪性能分析
5 結(jié) 語