楊瑞鋒, 黃 山
(四川大學(xué)電氣信息學(xué)院,成都 610065)
圖像作為人類感知世界的視覺基礎(chǔ),是人類獲取信息、表達(dá)信息和傳遞信息的重要手段。隨著計(jì)算機(jī)視覺和圖像處理在各個(gè)領(lǐng)域內(nèi)的廣泛應(yīng)用,運(yùn)動(dòng)目標(biāo)檢測(cè)[1]成為當(dāng)今研究的熱點(diǎn)。近些年來(lái),基于稀疏表示的壓縮感知理論發(fā)展使稀疏表示成為一種有效的數(shù)據(jù)表示方式。低秩矩陣恢復(fù)(RPCA)[1]已經(jīng)成為一種流行的數(shù)據(jù)獲取和表示方式,隨著文獻(xiàn)[2]提出矩陣RPCA,開始通過引入稀疏表示從而提高對(duì)含有大噪聲和異常點(diǎn)的觀測(cè)數(shù)據(jù)的魯棒性。然而隨著現(xiàn)代視頻數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)維度增高和更為復(fù)雜,為了更好地表達(dá)高階數(shù)據(jù)復(fù)雜的本質(zhì)結(jié)構(gòu),文獻(xiàn)[3]提出張量高階奇異值分解,將矩陣的奇異值分解擴(kuò)展到張量,為高維數(shù)據(jù)的分析和處理提供有力的支撐。因此,越來(lái)越多的研究人員運(yùn)用張量高階奇異值分解來(lái)實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)提取。但是對(duì)實(shí)驗(yàn)正則化參數(shù)的調(diào)試過程是一項(xiàng)工作量大并且耗時(shí)長(zhǎng)的工程,研究者們開始關(guān)注于正則化參數(shù)的自適應(yīng)估計(jì)?,F(xiàn)有選擇參數(shù)的方法有Morozov’s 偏差準(zhǔn)則[4]、廣義交互驗(yàn)證法(Generalized Cross-Validation,GCV)[5]、Curve法[6]和變分貝葉斯法(Variational Bayes’ Approach)[7]等。文獻(xiàn)[8]中利用Morozov’s 偏差準(zhǔn)則實(shí)現(xiàn)了基于全變分的圖像去模糊的正則化參數(shù)自適應(yīng)估計(jì),受此啟發(fā),本文將采用Morozov’s偏差準(zhǔn)則實(shí)現(xiàn)基于HOSVD的運(yùn)動(dòng)目標(biāo)檢測(cè)的正則化參數(shù)自適應(yīng)估計(jì)。
以圖像恢復(fù)為例引入Morozov’s偏差準(zhǔn)則。一般而言,圖像的退化過程可以表示為
V=KUclean+N
(1)
式中:V為觀測(cè)圖像;K為已知的模糊算子的矩陣表示形式;Uclean為原始圖像;N為高斯白噪聲。根據(jù)V估計(jì)出Uclean是一個(gè)不適定逆問題。用正則化方法求解該問題的最小化方程,即
(2)
式中:J(U)為正則項(xiàng),U為Uclean的估計(jì)值;二次項(xiàng)被稱作數(shù)據(jù)保真項(xiàng);λ為正則項(xiàng)參數(shù),平衡了保真項(xiàng)和正則項(xiàng)的相對(duì)權(quán)重。
根據(jù)偏差準(zhǔn)則,上述問題的解應(yīng)該存在于集合中
(3)
式中,c=τmnσ2,τ是一個(gè)提前確定的參數(shù),mn表示圖像的大小,σ2表示噪聲方差。當(dāng)噪聲方差σ2未知時(shí),文獻(xiàn)[9]提出可以通過中值估計(jì)方法(Median Absolute Deviation,MAD)估計(jì)出σ2。該方法的理論基礎(chǔ)是噪聲小波系數(shù)主要集中在高頻子帶中,因此可以通過高頻子帶系數(shù)近似估計(jì)噪聲系數(shù)。另外,中值操作的原因是避免高頻子帶中存在極少數(shù)的大幅度系數(shù)對(duì)方差估計(jì)[10]造成影響。MAD噪聲水平估計(jì)方法的數(shù)學(xué)表示為[11]
σ=1.482 6MAD(real(YHH))
(4)
式中:MAD( · )表示求中值;real( · )表示求實(shí)部;YHH表示圖像經(jīng)二維小波分解后得到的最高頻子帶的系數(shù)。
在偏差準(zhǔn)則下,式(2)問題等價(jià)于有約束的優(yōu)化問題,即
(5)
通過拉格朗日定理可以將式(5)有約束問題轉(zhuǎn)化為式(2)無(wú)約束問題。如果U是特定的λ下式(5)的解,那么它也是式(2)的解,用U*(λ)表示式(2)對(duì)應(yīng)的最優(yōu)解。那么,作為式(5)的最小化,有:U*(0)∈S,λ=0或者
張量又稱為多階陣列,是向量和矩陣的高階推廣。其中,零維張量為標(biāo)量,一維張量為向量,二維張量為矩陣,N階張量表示為A∈RI1×I2×…×IN,其中元素(i1,i2,…,iN)表示為ai1,i2,…,iN。張量也能夠用矩陣形式表示,該過程稱為張量的n-模式展開,是將張量的元素重新排列成矩陣。
張量A與矩陣U∈RJn×In的n-模式積是一個(gè)維度為I1×I2×…In-1×Jn×In+1×…×IN的張量,用A×nU表示,其元素為
(6)
通常需要求核張量S,可通過下式求得
S=A×1(U(1))T×2(U(2))T×…×N(U(N))T
(7)
式中:S∈RJ1×J2×…×JN為奇異值分解后得到的核心張量,矩陣U(n)∈RIn×In為將張量A的n-模式展開矩陣A(n)進(jìn)行SVD分解得到的左酉矩陣,符號(hào)×n表示張量與矩陣的n-模式積[12]。
將輸入的I3幀大小為I1×I2×3的RGB圖像序列均轉(zhuǎn)化為I3幀大小為I1×I2的灰度圖序列,觀測(cè)圖像序列表示為三階張量O∈RI1×I2×I3?;謴?fù)張量表示的背景部分可由如下凸優(yōu)化問題形式表示,即
(8)
(9)
引入輔助變量A=B,則將上式轉(zhuǎn)化為如下問題,即
(10)
s.t.>A=B>。
根據(jù)拉格朗日定理,上述有約束優(yōu)化問題的拉格朗日函數(shù)為
(11)
式中:Y1是拉格朗日乘子;β1是正的懲罰參數(shù)。本文采用ADMM來(lái)求解上述問題,采用偏差準(zhǔn)則,推導(dǎo)出參數(shù)λ和μ的更新公式,每一次迭代中,隨其他變量的更新,參數(shù)λ和μ也會(huì)按照固定的規(guī)律不斷更新,直到算法終止。將上述問題分解為以下幾個(gè)子問題求解,每次迭代中固定其他變量只更新一個(gè)變量,迭代步驟如下。
1) 固定其他變量,更新變量A。
(12)
對(duì)奇異值閾值收縮進(jìn)行張量擴(kuò)展,通過如下3個(gè)步驟求得式(12)的最優(yōu)解。
>;
(13)
② 對(duì)S進(jìn)行軟閾值收縮;
③ 張量重建
(14)
2) 更新變量B和μ。
(15)
對(duì)式(15)右邊B求導(dǎo),令求導(dǎo)后的式子為0,可得
(16)
c(k+1)=τI1I2I3(σ(k+1))2
>。
(17)
根據(jù)上文可得
(18)
如果
(19)
B*(0)∈S1,μ=0,即
(20)
如果
(21)
(22)
(23)
更新變量M,這里引入輔助變量E=M,即
(24)
s.t.>E=M
>。
根據(jù)拉格朗日定理,上述有約束優(yōu)化問題的拉格朗日函數(shù)為
(25)
式中:Y2是拉格朗日乘子;β2是正的懲罰參數(shù)。
3) 更新變量E。
(26)
可通過軟閾值收縮算子Sα(Z)求得最優(yōu)解
(27)
4) 同步驟2),更新變量M和λ。
(28)
(29)
6) 判斷終止條件。
(30)
若式(30)滿足或者達(dá)到最大迭代次數(shù),則終止迭代。
7) 輸出表示背景的B(k+1)、表示運(yùn)動(dòng)目標(biāo)的M(k+1);最后對(duì)輸出的運(yùn)動(dòng)目標(biāo)部分M進(jìn)行二值化處理,得運(yùn)動(dòng)目標(biāo)G為
(31)
然后進(jìn)一步對(duì)G進(jìn)行形態(tài)學(xué)中開閉運(yùn)算,消除運(yùn)動(dòng)目標(biāo)區(qū)域外的噪聲,填充目標(biāo)區(qū)域內(nèi)的空洞,最終提取較準(zhǔn)確的運(yùn)動(dòng)目標(biāo)。
本文數(shù)據(jù)是從標(biāo)準(zhǔn)的change detection video database (http://www.changedetection.net)數(shù)據(jù)庫(kù)中選取4組真實(shí)視頻序列進(jìn)行測(cè)試,在相同實(shí)驗(yàn)環(huán)境下,本文方法與近期極具競(jìng)爭(zhēng)力的魯棒性主成分分析法(RPCA),以及基于迭代張量高階奇異值分解(HOSVD)的運(yùn)動(dòng)目標(biāo)提取方法進(jìn)行比較。
視頻1的圖片像素大小為180×120。實(shí)驗(yàn)選取80幀進(jìn)行測(cè)試,結(jié)果如圖1 所示。
圖1 視頻1運(yùn)動(dòng)目標(biāo)檢測(cè)結(jié)果Fig.1 Moving target test results of Video 1
視頻2的像素大小為240×140。實(shí)驗(yàn)中選取80 幀進(jìn)行測(cè)試,結(jié)果如圖2 所示。
圖2 視頻2運(yùn)動(dòng)目標(biāo)檢測(cè)結(jié)果Fig.2 Moving target test results of Video 2
視頻3的像素大小為160×120。實(shí)驗(yàn)選取80 幀進(jìn)行測(cè)試,結(jié)果如圖3 所示。
圖3 視頻3運(yùn)動(dòng)目標(biāo)檢測(cè)結(jié)果Fig.3 Moving target test results of Video 3
視頻4的像素大小為160×120。實(shí)驗(yàn)選取80幀進(jìn)行測(cè)試,結(jié)果如圖4 所示。
圖4 視頻4運(yùn)動(dòng)目標(biāo)檢測(cè)結(jié)果Fig.4 Moving target test results of Video 4
從實(shí)驗(yàn)結(jié)果可以看出,本文方法在多種場(chǎng)景下比RPCA的提取效果要好很多,與HOSVD方法結(jié)果差別不大,能較準(zhǔn)確完整地提取運(yùn)動(dòng)目標(biāo)。
為量化評(píng)估算法提取運(yùn)動(dòng)目標(biāo)的性能,本文采用召回率(Rrecall)、準(zhǔn)確率(PPrecision)和兩者的調(diào)和平均值F-Measure來(lái)衡量運(yùn)動(dòng)目標(biāo)檢測(cè)效果的好壞,即
(32)
(33)
F-Measure能夠有效地維持Rrecall,PPrecision這兩個(gè)標(biāo)準(zhǔn)的平衡,依此評(píng)價(jià)標(biāo)準(zhǔn),F(xiàn)-Measure的大小和目標(biāo)檢測(cè)的效果成正比,即F-Measure值越高,目標(biāo)檢測(cè)的效果越好。
分別計(jì)算各視頻序列的Rrecall,PPrecision和F-Measure,從表1結(jié)果可以看出,本文方法的Rrecall,PPrecision和F-Measure都比RPCA方法高。實(shí)驗(yàn)結(jié)果證明本文方法提取運(yùn)動(dòng)目標(biāo)更為準(zhǔn)確,且能在不需要進(jìn)行繁瑣的手動(dòng)調(diào)試參數(shù)的情況下,取得和HOSVD方法幾乎相同甚至更好的效果。
表1 各個(gè)視頻在不同算法下的結(jié)果指標(biāo)
圖5展示了8組圖像序列基于常規(guī)的HOSVD運(yùn)動(dòng)目標(biāo)檢測(cè)[14]的F-Measure指標(biāo)隨正則化參數(shù)λ變化的曲線圖。對(duì)于不同的圖像序列,它們對(duì)應(yīng)的最優(yōu)參數(shù)都不同,而且這8條曲線都很陡峭,說(shuō)明λ變化很快,F-Measure值對(duì)λ比較敏感;從變化范圍看:對(duì)于8個(gè)圖像序列,盡管λ的變化范圍都很小,在0~0.04之間,F(xiàn)-Measure的值變化卻很大,變化范圍從最小值0到最大值1。
圖5 F-Measure隨λ變化曲線圖Fig.5 The changing of F-Measure with λ
綜合上述實(shí)驗(yàn)數(shù)據(jù)可知:1) 常規(guī)的HOSVD運(yùn)動(dòng)目標(biāo)檢測(cè)效果的好壞對(duì)正則化參數(shù)的變化極其敏感;2) 針對(duì)不同的實(shí)驗(yàn)數(shù)據(jù),正則化參數(shù)的最優(yōu)值都不同。由于這兩個(gè)原因,通過試錯(cuò)法手動(dòng)調(diào)試正則化參數(shù)是一件極其困難的事,需要通過大量的實(shí)驗(yàn)才能找到最優(yōu)參數(shù),而本文方法能在不需要進(jìn)行繁瑣的手動(dòng)調(diào)試參數(shù)的情況下,取得和HOSVD方法幾乎相同甚至更好的效果。
正則化參數(shù)不需要設(shè)置初值,算法中上限c是已知的與噪聲相關(guān)的數(shù),本文采用c=τI1I2I3σ2來(lái)估計(jì)c。τ=1是一個(gè)經(jīng)驗(yàn)值,當(dāng)τ=2時(shí),目標(biāo)檢測(cè)效果最佳且該算法對(duì)懲罰參數(shù)β1和β2的值不敏感,當(dāng)它們的取值在較大范圍內(nèi)變動(dòng)時(shí),實(shí)驗(yàn)結(jié)果變化不明顯,這里選擇β1=β2=3×10-3。
本文提出了一種基于正則化參數(shù)自適應(yīng)估計(jì)和HOSVD的運(yùn)動(dòng)目標(biāo)提取方法。以Morozov’s偏差準(zhǔn)則為理論基礎(chǔ),根據(jù)誤差水平對(duì)正則化參數(shù)進(jìn)行選擇和調(diào)整。實(shí)驗(yàn)結(jié)果證明,本文方法能很好地實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)提取,并且節(jié)省了大量的調(diào)試參數(shù)的時(shí)間。但由于模型的局限性,在動(dòng)態(tài)背景干擾很大時(shí)提取效果還不理想。因此在未來(lái)的工作中,將繼續(xù)優(yōu)化本文模型和算法,建立魯棒性更強(qiáng)的優(yōu)化模型并找到簡(jiǎn)潔、高效的奇異值分解算法,使之能更好地去除動(dòng)態(tài)背景帶來(lái)的劇烈干擾。