基于非凸低秩優(yōu)化的壓縮感知植株圖像重構(gòu)

2019-02-07 05:32沈躍李尚龍崔業(yè)民朱嘉慧劉加林

軟件導(dǎo)刊 2019年12期

沈躍李尚龍崔業(yè)民朱嘉慧劉加林

摘要：目標(biāo)植株圖像壓縮重構(gòu)對于圖像的高效傳輸及存儲(chǔ)意義重大，同時(shí)為后期植株生長狀態(tài)檢測及病蟲害識(shí)別奠定了基礎(chǔ)。傳統(tǒng)圖像壓縮感知方法大多是針對信號(hào)在某個(gè)特征空間的稀疏性進(jìn)行的，并沒有考慮信號(hào)的局部特征與結(jié)構(gòu)化特性，存在重構(gòu)效率不高、重構(gòu)精度較低等問題。針對以上情況，提出一種基于非凸低秩優(yōu)化的壓縮感知植株圖像重構(gòu)算法。首先通過KinectV2.0采集植株圖像深度數(shù)據(jù)并進(jìn)行預(yù)處理，結(jié)合K-means與Mean-shift聚類算法提取目標(biāo)植株有效區(qū)域，再考慮圖像的非局部自相似性，采用加權(quán)l(xiāng)p范數(shù)最小化算法（wsNM）求解低秩優(yōu)化問題，較好地保留了圖像結(jié)構(gòu)細(xì)節(jié)，最后采用Dog-leg最小二乘算法取代最快下降法進(jìn)行迭代優(yōu)化。試驗(yàn)結(jié)果證明，該算法在不同采樣率下的植株圖像重構(gòu)質(zhì)量優(yōu)于其它同類算法，尤其在低采樣率下重構(gòu)效果更為突出。

關(guān)鍵詞：壓縮感知;圖像重構(gòu);低秩優(yōu)化;聚類算法;Dog-Leg最小二乘法;深度信息

DOI：10.11907/rjdk.191237

中圖分類號(hào)：TP317.4 文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：1672-7800（2019）012-0173-07

0引言

隨著農(nóng)業(yè)信息化與自動(dòng)化的持續(xù)發(fā)展，圖像采集技術(shù)被廣泛運(yùn)用于現(xiàn)代農(nóng)業(yè)生產(chǎn)中，農(nóng)田信息獲取技術(shù)已成為精準(zhǔn)農(nóng)業(yè)的關(guān)鍵技術(shù)之一。其中對目標(biāo)植株圖像進(jìn)行壓縮重構(gòu)對于圖像的高效傳輸與存儲(chǔ)意義重大，同時(shí)也為后期植株生長狀態(tài)檢測及病蟲害識(shí)別奠定了基礎(chǔ)。因此，如何高質(zhì)量、高速率地對圖像進(jìn)行壓縮采集與重構(gòu)已成為國內(nèi)外機(jī)構(gòu)的研究熱點(diǎn)。

在農(nóng)業(yè)植株檢測與識(shí)別過程中，目標(biāo)物體識(shí)別是首先需要解決的問題。吳煥麗等提出基于HSV空間的自適應(yīng)果蠅均值聚類算法分割圖像背景，該算法加快了小麥圖像分割速度，一定程度上提高了小麥覆蓋率，但對于具有如滴灌帶等局部干擾因素的圖像分割效果并不突出;馬博珩等選用共軛梯度下降算法取代最快下降法，結(jié)合正交匹配追蹤算法進(jìn)行圖像重構(gòu)，初步提高了圖像重構(gòu)速度，但處理過程中忽略了圖像的局部特征與結(jié)構(gòu)化特性，重構(gòu)精度并沒有得到太大改善，且該方法在迭代計(jì)算過程中不太穩(wěn)定，容易出現(xiàn)貪婪問題;代媛等提出一種壓縮感知蘋果圖像的并行快速重構(gòu)方法，該算法分析了二維正交匹配跟蹤重構(gòu)算法的并行性，結(jié)合GPU通用并行計(jì)算平臺(tái)設(shè)計(jì)出對應(yīng)的并行化重構(gòu)算法，初步提高了蘋果圖像重構(gòu)效率，但是并沒有保證蘋果圖像重構(gòu)質(zhì)量，且未能消除復(fù)雜背景;宋云等引入低秩矩陣恢復(fù)思想，考慮到圖像的非局部自相似性，將圖像恢復(fù)問題轉(zhuǎn)化成聚合的相似塊矩陣秩最小問題，有效提高了圖像重構(gòu)質(zhì)量，但其在迭代上也采用共軛梯度算法，從而影響到算法整體的穩(wěn)定性和魯棒性。

因此，本文在前人研究的基礎(chǔ)上，提出一種基于非凸低秩優(yōu)化的壓縮感知植株圖像重構(gòu)算法。首先通過Ki-nect V2.0采集目標(biāo)植株的彩色圖像和深度數(shù)據(jù)，對獲取的植株圖像進(jìn)行深度預(yù)處理，并結(jié)合K-means和Mean-shift聚類算法提取目標(biāo)植株有效區(qū)域;再考慮圖像的非局部自相似性，采用加權(quán)l(xiāng)p范數(shù)最小化算法求解低秩優(yōu)化問題，較好保留了圖像結(jié)構(gòu)細(xì)節(jié);最后采用Dog-leg最小二乘算法取代最小二乘法進(jìn)行迭代優(yōu)化，以加快算法整體重構(gòu)速度。該算法不僅解決了傳統(tǒng)重構(gòu)算法重構(gòu)精度低的問題，而且很大程度上提高了目標(biāo)植株重構(gòu)效率，對于農(nóng)業(yè)中的相關(guān)控制決策具有一定指導(dǎo)意義。

1材料與方法

1.1植株圖像目標(biāo)區(qū)域提取

1.1.1植株圖像采集

為了獲取目標(biāo)植株的彩色圖像及深度數(shù)據(jù)，搭建如圖1所示的試驗(yàn)平臺(tái)，主要包括Kinect二代傳感器、PC機(jī)、相機(jī)支架和若干待測植株。Kinect傳感器固定在相機(jī)支架上，通過USB延長線接口連至PC機(jī)，待測植株與Kinect傳感器之間距離約為1700mm。

試驗(yàn)分為兩組進(jìn)行：第一組目標(biāo)植株為單植株，植株高度為1.8m;第二組目標(biāo)植株為多植株，選取3棵不同高.度的待測植株，高度分別為14m、1.2m和1.0m。使用Ki-nect V2.0傳感器提供的Kinect for Windows SDK結(jié)合OpenCV庫獲取待測植株的彩色圖像和深度圖像，見圖2。

1.1.2深度數(shù)據(jù)預(yù)處理

由于采集到的植株圖像背景較為復(fù)雜，將嚴(yán)重影響后期圖像重構(gòu)效率，如何去除植株背景干擾對于后期重構(gòu)處理至關(guān)重要。Kinect傳感器采用TOF獲取空間的深度數(shù)據(jù)信息，合理設(shè)置待測植株與傳感器之間距離，即能將圖像中的待提取物從背景中分離出來。因此，本文根據(jù)Kinect傳感器的這一特征，采用彩色圖像和深度圖像相結(jié)合的方法提取目標(biāo)植株關(guān)鍵區(qū)域。

Kinect傳感器識(shí)別的最佳限制距離范圍為1500-1800mm，因此本文將待測植株放置于傳感器前方約1700mm，通過圖像采集平臺(tái)（見圖1）采集圖像，進(jìn)而通過距離限制初步將目標(biāo)植株與背景分離。程序設(shè)置距離內(nèi)的區(qū)域像素值為1，距離外的區(qū)域像素值為0。

1.13K-means與Mean-shih聚類算法

聚類分析算法是用于數(shù)據(jù)挖掘的一個(gè)重要算法，被廣泛運(yùn)用在圖像分割、圖像融合等各個(gè)領(lǐng)域，其中以K-means算法最為常見。雖然K-means聚類相對簡單，對于數(shù)據(jù)集的處理效率也較高，但其初始聚類中心需要從n個(gè)數(shù)據(jù)對象中任意選擇，對于噪聲的魯棒性并不強(qiáng)，且想要達(dá)到最佳分割效果需要經(jīng)過大量反復(fù)試驗(yàn)，一定程度上增大了工作量。Mean-shift算法能夠在一組數(shù)據(jù)的密度分布中尋找到局部極值，并實(shí)現(xiàn)無參密度估計(jì)，即可對服從任意分布的數(shù)據(jù)進(jìn)行密度估計(jì)。此外，Mean-shiN算法是一個(gè)單參數(shù)算法，容易作為一個(gè)模塊與其它算法進(jìn)行集成。因此，本文將K-means聚類與Mean-shiN算法相結(jié)合，將Mean-shiN聚類后的質(zhì)心作為K-means算法初始中心進(jìn)行聚類，避免了因K-means初始中心不確定導(dǎo)致的大量試驗(yàn)，具體流程如圖3所示。試驗(yàn)結(jié)果表明初始聚類中心為2時(shí)，分割效果最好。

為了提高后續(xù)圖像重構(gòu)效率，只需保留目標(biāo)植株所在圖像區(qū)域，去除背景中其它干擾物。在進(jìn)行深度數(shù)據(jù)處理得到的二值圖像基礎(chǔ)上，水平方向從上到下、從下往上依次對每一行求和，直到找到第一個(gè)非空白行為止，記為第m行、第n行;同樣，豎直方向從左往右、從右到左依次對每一列求和，直到找到第一個(gè)非空白列為止，記為第i列、第j列。在原彩色圖像上截取第m行～第n行、第i列～第j列的矩形區(qū)域，即為要提取的目標(biāo)植株所在圖像區(qū)域。處理后的圖像如圖4所示。

圖4（a）、圖4（c）分別為Kinect傳感器拍攝的單植株和多植株圖像，圖4（b）、圖4（d）分別為對應(yīng)去除復(fù)雜背景后的彩色圖像。其中黑色部分是被去除的無目標(biāo)植株部分，保留了植株所在矩形區(qū)域。

1.2壓縮感知理論

壓縮感知理論主要由信號(hào)稀疏表示、測量矩陣與重構(gòu)算法3部分組成。圖像壓縮感知重建觀測得到的隨機(jī)測量值，其維度遠(yuǎn)小于原始圖像維度，目的在于通過觀測得到的一組隨機(jī)測量值復(fù)原原始圖像。具體而言，設(shè)原始信號(hào)f∈R^N+1，在變換基ψ下的稀疏向量為x，即f=ψx。對原始信號(hào)廠進(jìn)行測量，公式為：

由于上述最小lo范數(shù)方法是一個(gè)不確定多項(xiàng)式（NP）問題，同時(shí)對噪聲很敏感，很難直接進(jìn)行優(yōu)化且無法驗(yàn)證其準(zhǔn)確性，因此需要更加有效的重構(gòu)算法對信號(hào)進(jìn)行精確重構(gòu)。

1.3加權(quán)l(xiāng)p范數(shù)非凸低秩優(yōu)化

1.3.1非局部自相似與低秩特性

任意一幅圖像的結(jié)構(gòu)信息都存在大量重復(fù)部分，其中隨便一個(gè)樣本塊，都能在該圖像中尋找出大量相似塊，并且這種相似結(jié)構(gòu)不僅存在于平滑區(qū)域，在紋理及邊緣輪廓中也一樣存在。利用圖像的這種非局部自相似性，不僅能解決傳統(tǒng)重構(gòu)算法中因未考慮信號(hào)局部特性和結(jié)構(gòu)化特征導(dǎo)致的重構(gòu)精度不高的問題，同時(shí)也提高了算法本身的適應(yīng)性。提取部分圖像塊作為樣本塊，將與其相似的其它圖像塊統(tǒng)一按照行或列展開得到一維向量。以此類推，將得到的所有一維向量組合成二維相似塊矩陣。由于相似圖像塊之間結(jié)構(gòu)紋理近似，即提取到的圖像相似塊一維向量之間具有強(qiáng)相關(guān)性，因此該二維相似塊矩陣具有低秩特性。從另一方面看，矩陣的秩也可作為矩陣稀疏性的衡量方法，即求解信號(hào)稀疏性的圖像重構(gòu)問題可引申為基于秩最小化的圖像重構(gòu)問題。

1.3.2加權(quán)l(xiāng)p范數(shù)低秩優(yōu)化

2試驗(yàn)與結(jié)果分析

為了驗(yàn)證本文方法的正確性和有效性，本文通過MATLAB R2015處理平臺(tái)對該算法進(jìn)行各項(xiàng)測試。試驗(yàn)主機(jī)CPU配置為Intel Core i5，主頻為3.60GHz，內(nèi)存為8G，操作系統(tǒng)為Window 10。圖像采用256×256植株圖作為測試對象，主要分為單植株圖像重構(gòu)和多植株圖像重構(gòu)兩種情況進(jìn)行。每種情況均重復(fù)實(shí)驗(yàn)200次，試驗(yàn)中采用離散小波變換對圖像進(jìn)行稀疏化表示，測量矩陣采用隨機(jī)高斯測量矩陣。

重構(gòu)算法性能指標(biāo)分為重構(gòu)效率和重構(gòu)精度兩類。重構(gòu)效率用重構(gòu)時(shí)間進(jìn)行衡量，同等條件下重構(gòu)時(shí)間T越小，重構(gòu)效率越高;重構(gòu)精度分為主觀性評價(jià)標(biāo)準(zhǔn)和客觀性評價(jià)標(biāo)準(zhǔn)兩種。主觀標(biāo)準(zhǔn)主要指通過視覺感知判斷一幅圖的清晰度，本文采用結(jié)構(gòu)相似度（sSIM）進(jìn)行衡量，相同條件下SSIM越高，重構(gòu)精度越高;客觀標(biāo)準(zhǔn)則可以由峰值信噪比（PSNR）表示，相同條件下PSNR越高，重構(gòu)精度越高。

2.1不同p值下單植株圖像重構(gòu)效果對比

通過植株圖像采集平臺(tái)獲取單植株彩色圖像，經(jīng)過深度數(shù)據(jù)預(yù)處理以及K-means與Mean-shift聚類算法提取植株圖像目標(biāo)區(qū)域并轉(zhuǎn)化成灰度圖。對于p值選取，在0.1-1范圍內(nèi)以0.1為步長進(jìn)行，分別在采樣率（M/N）為0.05、0.10、0.15、0.20、0.25、0.30的情況下對圖像進(jìn)行重構(gòu)。選取峰值信噪比作為評價(jià)指標(biāo)，具體情況如圖5所示。

由圖5可以看出，在不同采樣率下，當(dāng)p值取0.8時(shí)，峰值信噪比最高，植株重構(gòu)效果最好。同時(shí)，由于傳統(tǒng)壓縮感知重構(gòu)算法大多屬于最小lo范數(shù)或最小l1范數(shù)算法，因此本文的非凸低秩加權(quán)l(xiāng)p范數(shù)最小化算法重構(gòu)效果明顯優(yōu)于其它傳統(tǒng)算法。

為了從視覺角度更直觀地說明重構(gòu)效果，選取采樣率（M/N）為0.15時(shí)，單植株在p值為0.4、0.8、1.0時(shí)的重構(gòu)效果圖，如圖6所示。選取葉片末梢及枝干部分進(jìn)行放大并置于右上角處，從圖中可以看出，p為0.4時(shí)，植株圖像重構(gòu)的偽影較多，葉片輪廓等具體信息不夠清晰;p為1.0時(shí)，重構(gòu)質(zhì)量有所提高，但從右上角部分放大圖可以發(fā)現(xiàn)，暗影部分依舊存在;p=0.8時(shí)，植株重構(gòu)效果最好，暗影明顯減少，同時(shí)葉片末梢及枝干處的輪廓等細(xì)節(jié)信息都得到了很好保留，在直觀視覺感受方面有很大程度提高。

2.2不同算法下植株圖像重構(gòu)效果對比

為了評估提出算法的性能及魯棒性，本文針對采集到的單植株和多植株圖像，分別測試測量值有噪和無噪情況下的重建性能。

2.2.1無噪情況下植株重構(gòu)對比情況

以采集到的單植株圖像為例，經(jīng)過預(yù)處理之后提取植株目標(biāo)區(qū)域，選取采樣率（M/N）為0.15時(shí)當(dāng)前主流的壓縮感知重構(gòu)算法TV、BM3D-CS、NLR與本文提出算法（p=0.8）進(jìn)行對比，具體如圖7所示。

重構(gòu)過程中選取葉片末梢及枝干處進(jìn)行放大并置于圖像右上角，以便觀察細(xì)節(jié)。從圖中可以看出，在TV算法下由于局部平滑特性較弱，重構(gòu)效果不太理想，圖像暗影較多，特別是枝干處較為模糊，不能很好地適應(yīng)復(fù)雜紋理;BM3D-CS算法下的重構(gòu)效果與其相比得到了很大程度提高，從放大部分可以看出，暗影已有明顯減少;對于NLR-CS與本文提出的重構(gòu)算法，低秩正則項(xiàng)的引人很好地利用了圖像的非局部特征和結(jié)構(gòu)特性，整體效果優(yōu)于前兩種算法，而相比之下，由右上角的局部放大圖可以看出，本文算法下枝干處的偽影幾乎全部消失，葉片末梢及輪廓等細(xì)節(jié)信息也更好地得到保留，效果優(yōu)于NLR-CS算法。

為了定量分析4種算法下單植株圖像的重構(gòu)效果，本文采用重構(gòu)時(shí)間T、結(jié)構(gòu)相似度SSIM以及峰值信噪比PSNR 3種評價(jià)標(biāo)準(zhǔn)在采樣率（M/N）為0.1、0.15、0.20、0.25、0.30情況下進(jìn)行對比分析，具體情況如表1所示。

從表1可以看出，在運(yùn)行時(shí)間方面，TV算法重構(gòu)時(shí)間最長，BM3D-CS和NLR-CS兩種算法重構(gòu)速度比較接近，而本文算法相比其它3種算法，重構(gòu)速度有了很大提高，比TV算法提高了2.796s，比NLR-CS算法提高了1.510s，且采樣率越大，速度差越大;在峰值信噪比（PSNR）方面，本文算法具有很大優(yōu)勢，與其它3種算法相比，依次平均提高了14.24dB、7.08dB和2.47dB;同時(shí)，在結(jié)構(gòu)相似度（sSIM）方面，相比于TV和BM3D-CS兩種算法，本文算法與NLR-CS算法效果最佳且比較接近，在采樣率為0.30時(shí)，SSIM分別達(dá)到了0.9912和0.9947。由此可以看出，經(jīng)過深度數(shù)據(jù)預(yù)處理以及K-means和Mean-shift聚類算法提取出植株圖像目標(biāo)區(qū)域后，去除了背景中不必要的干擾，一定程度上提高了后期重構(gòu)速度，并且采用Dog-Leg最小二乘算法作為迭代算法，在有效提高收斂速度的同時(shí)，也保障了算法的整體重構(gòu)精度。

2.2.2含噪情況下植株重構(gòu)對比情況

為了評估算法在含噪狀態(tài)下的魯棒性，本文在測量值中加入不同量級的噪聲進(jìn)行測試，比較各種算法的重建性能。

以采集的多植株圖像為例，噪聲選取高斯白噪聲，均值為0，標(biāo)準(zhǔn)差為0.01，經(jīng)過預(yù)處理之后提取植株目標(biāo)區(qū)域，同樣選取采樣率（M/N）為0.15時(shí)，當(dāng)前主流的壓縮感知重構(gòu)算法TV、BM3D-CS、NLR-CS與本文算法（p=0.8）進(jìn)行對比，具體如圖8所示。重構(gòu)過程中選取前兩棵植株樹干及葉片末梢部分進(jìn)行放大，并置于圖片右上角以便于觀察圖像細(xì)節(jié)信息。

由圖8可以看出，在直觀的視覺感受上，當(dāng)采樣率（M/N）為0.15時(shí)，TV算法對于加噪之后的植株圖像重構(gòu)結(jié)果很模糊，樹葉的輪廓、紋理等細(xì)節(jié)信息丟失嚴(yán)重，整體效果類似于油畫;BM3D-CS和NLR-CS兩種算法相比TV算法整體效果有所改善，但左邊第一棵樹的樹葉密集處依舊比較模糊;本文算法對于加噪之后的多植株圖像重構(gòu)效果最佳，3棵植株樹葉處的紋理都比較清晰，從右上角的局部放大圖可以發(fā)現(xiàn)，葉片輪廓等細(xì)節(jié)信息也很好地得到了保留。

為了定量分析含噪環(huán)境中圖像在不同算法下的重構(gòu)效果對比情況，圖9給出了在采樣率為0.15時(shí)，多植株圖像在測量值受不同量級高斯白噪聲影響的環(huán)境下，不同算法的重建性能曲線。橫軸為圖像感知測量值的信噪比（singal to Noise Ratio，SNR），范圍為15～35dB，步長為5，縱軸為重建圖像的峰值信噪比PSNR。

可以直觀地看出，在采用TV和BM3D-CS兩種算法時(shí)，圖像重構(gòu)精度起初增長較快，但后期隨著測量值信噪比的增大，曲線增長幅度逐漸減小，而NLR-CS算法與本文算法的重構(gòu)效果增長趨勢較為穩(wěn)定，其中可明顯看出，本文算法在含噪環(huán)境下的重建性能依然優(yōu)于其它對比算法，取得了很好的重構(gòu)效果。

3結(jié)語

傳統(tǒng)圖像壓縮感知方法大多是針對信號(hào)在某個(gè)特征空間的稀疏性進(jìn)行的，并沒有考慮信號(hào)局部特征和結(jié)構(gòu)化特性，存在重構(gòu)效率不高、重構(gòu)精度較低等問題。本文針對這些情況，提出一種基于非凸低秩優(yōu)化的壓縮感知植株圖像重構(gòu)算法。首先通過Kinect V2.0采集植株圖像的深度數(shù)據(jù)并進(jìn)行預(yù)處理，結(jié)合K-means與Mean-shih聚類算法提取目標(biāo)植株有效區(qū)域，再考慮圖像的非局部自相似性，采用加權(quán)l(xiāng)p范數(shù)最小化算法求解低秩優(yōu)化問題，較好地保留了圖像結(jié)構(gòu)細(xì)節(jié)，最后采用Dog-leg最小二乘算法取代最快下降法進(jìn)行迭代優(yōu)化。同時(shí)，為了評估提出算法的性能及魯棒性，本文針對采集的單植株和多植株圖像分別測試了測量值有噪與無噪狀態(tài)下的重建性能。試驗(yàn)結(jié)果證明，本文算法在不同采樣率下的植株圖像重構(gòu)質(zhì)量都優(yōu)于其它同類算法，尤其在低采樣率下重構(gòu)效果更為突出。

（1）本文通過Kinect傳感器采集植株圖像深度數(shù)據(jù)并進(jìn)行預(yù)處理，同時(shí)結(jié)合K-means和Mean-shift聚類算法提取目標(biāo)植株有效區(qū)域，去除了背景中不必要的其它干擾物，為提高后期重構(gòu)效率提供了可能。

（2）考慮到圖像的非局部相似性與結(jié)構(gòu)特性，本文采用加權(quán)l(xiāng)p范數(shù)最小化算法求解低秩優(yōu)化問題，較好地保留了圖像結(jié)構(gòu)細(xì)節(jié)，一定程度上提高了植株圖像重構(gòu)精度。試驗(yàn)結(jié)果證明，在不同采樣率下，p值不同，重構(gòu)效果也不同。當(dāng)p值取0.8時(shí)，重構(gòu)精度最高。因此可以得出，非凸低秩加權(quán)l(xiāng)p范數(shù)最小化算法重構(gòu)效果明顯優(yōu)于其它傳統(tǒng)算法。

（3）結(jié)合Dog-Leg最小二乘算法，避免了最快下降法運(yùn)算過程中因過于貪婪導(dǎo)致的收斂速度減慢的情況，同時(shí)混合了GaussNewton法的特性，保證了算法整體的穩(wěn)定性。試驗(yàn)結(jié)果證明，Dog-Leg法加快了收斂速度，提高了算法整體重構(gòu)效率，并在一定程度上改善了圖像重構(gòu)精度。

（4）本文分別在無噪和含噪環(huán)境下對采集到的單植株與多植株圖像進(jìn)行試驗(yàn)。結(jié)果證明，在兩種環(huán)境下，本文算法不論在重構(gòu)效率還是重構(gòu)精度上，效果都優(yōu)于NLR-CS等其它當(dāng)前主流的壓縮感知算法。

（5）該方法也可進(jìn)一步推廣應(yīng)用于其它場合的圖像采集中，以實(shí)現(xiàn)基于Kinect傳感器的農(nóng)業(yè)植株生長狀態(tài)監(jiān)測以及病蟲害防治。