張 然,桂心遠(yuǎn),成昊遠(yuǎn),褚金奎
(大連理工大學(xué)遼寧省微/納米技術(shù)與系統(tǒng)重點(diǎn)實(shí)驗(yàn)室精密與特種加工教育部重點(diǎn)實(shí)驗(yàn)室,遼寧 大連116024)
物體位姿信息在航空、航海、室內(nèi)機(jī)器人定位等領(lǐng)域都有著十分重要的地位[1-2]。為了保證在各種工況下目標(biāo)位姿的實(shí)時(shí)可控,對(duì)物體位姿進(jìn)行精準(zhǔn)測量是必要的,這也對(duì)物體位姿測量技術(shù)提出了更高的要求。位姿測量主要針對(duì)物體的6個(gè)自由度進(jìn)行檢測:俯仰角、偏航角、翻滾角以及X,Y,Z3個(gè)方向上的位移。與慣性測量位姿和雷達(dá)測量位姿相比,視覺測量位姿具有非接觸、直觀性強(qiáng)、測量精度較高、抗電磁干擾能力強(qiáng)、結(jié)構(gòu)簡單、測量成本低等優(yōu)點(diǎn),因此廣泛應(yīng)用于實(shí)際工程測量中[3-5]。Xu等人在室內(nèi)環(huán)境下借助天花板來求解相機(jī)的位姿[6]。Zhao等人對(duì)比研究了常用的基于LED照明的方法[7]。Yin等人研究了基于單目成像系統(tǒng)的平面目標(biāo)測量[8]。Li等人以ArUco碼作為參照物測量物體的相對(duì)位姿[9]。但是在低光照條件下,比如夜間與水下,計(jì)算機(jī)視覺測量技術(shù)遇到了較大的挑戰(zhàn)。
在自然界中,生物偏振視覺很常見,如沙蟻可以利用天空偏振光進(jìn)行導(dǎo)航并找到自己的巢穴[10]。而在幾乎全黑的水下環(huán)境中,魷魚和螳螂蝦都具有偏振視覺,它們能在極暗的環(huán)境中捕獵和藏匿[11-12]。偏振光具有“弱光強(qiáng)化,強(qiáng)光弱化”的特點(diǎn),這正是眾多弱光環(huán)境下生物依賴偏振視覺的原因[13-14],即偏振光作為信息載體,其偏振度及偏振角等信息相較光強(qiáng)信息具有更高的強(qiáng)度,傳輸距離遠(yuǎn),特別適合在低光照環(huán)境中進(jìn)行傳遞[15]。利用偏振成像技術(shù),可有效提高低光照下的可見度,從而求解運(yùn)動(dòng)物體的位姿信息。已有大量研究證明了在大霧和水下等復(fù)雜環(huán)境中使用偏振成像的優(yōu)異性[16-22],偏振成像獲得的圖像更加清晰并且可視距離更遠(yuǎn),極端情況下甚至能恢復(fù)出光強(qiáng)圖幾乎看不到的細(xì)節(jié)。本文提出了一種基于偏振成像的低光照強(qiáng)背景噪聲環(huán)境下的物體位姿求解方法,針對(duì)設(shè)計(jì)的四偏振光源目標(biāo)提出了一種有效的識(shí)別算法,使用偏振成像來識(shí)別目標(biāo)的4個(gè)定位點(diǎn),進(jìn)而估計(jì)目標(biāo)的位姿參數(shù)。后續(xù)實(shí)驗(yàn)中對(duì)比了偏振圖與光強(qiáng)圖,并驗(yàn)證了算法的性能。
偏振成像常使用的方法有分時(shí)法、分振幅法和分焦面法等。本文使用的是分焦面成像法,采用的偏振相機(jī)一次成像可以獲得4張不同偏振角度的光強(qiáng)圖像,其偏振角度分別為0°,45°,90°和135°。
光波偏振屬性的數(shù)學(xué)表達(dá)一般采用斯托克斯矢量。在斯托克斯矢量表示方法中,光波的偏振屬性可以用4個(gè)實(shí)數(shù)來描述,即:
式中:I是投影在成像傳感器上的光強(qiáng),Q是0°和90°方向偏振分量的光強(qiáng)差,U是45°和135°方向偏振分量的光強(qiáng)差,V是左旋和右旋圓偏振分量的光強(qiáng)差。一般情況下,分量V可以忽略。因此,若假設(shè)光源的斯托斯矢量表示為S,當(dāng)偏振器的主透光軸與設(shè)定的零度參考線之間的夾角為Ψ時(shí),偏振器對(duì)原光波偏振屬性的改變可以用MULLER矩陣表示,即有:
因?yàn)橄鄼C(jī)可以直接測量的是光強(qiáng)I,所以可以利用MULLER矩陣的第一行。即:
假設(shè)Ψ角度選取0°,45°,90°,得方程組:
整理得:
求得線偏振度為:
由此便可以通過一次成像中的0°,45°和90°圖像計(jì)算出線偏振度(Degree of Linear Polariza?tion,DoLP)。
相機(jī)的成像模型即中心透視成像模型,其基本原理如圖1所示。三維物體投影到相機(jī)的成像平面上,量化后最終獲得離散的二維圖像。單相機(jī)成像時(shí),由于存在三維向二維的不可逆變換,沒有輔助信息時(shí)無法從圖像推算出物體的位置以及姿態(tài)。為了從單張圖解算出其中物體的位置和姿態(tài),需要知道相機(jī)的內(nèi)參數(shù)以及在物體上做一個(gè)已知參數(shù)的標(biāo)記。本文采用4個(gè)點(diǎn)作為標(biāo)記的方法,如圖1所示,由OtXt,OtYt,OtZt構(gòu)成的三維坐標(biāo)系為現(xiàn)實(shí)世界中目標(biāo)物體的坐標(biāo)系,A′,B′,C′,D′為目標(biāo)物體上的4個(gè)標(biāo)記點(diǎn),其中有OtA′=OtB′=OtC′=OtD′。有OiXi和OiYi構(gòu)成的二維坐標(biāo)系為相機(jī)成像的圖像坐標(biāo)系,A,B,C,D為目標(biāo)物體上的標(biāo)記點(diǎn)投影到圖像上的點(diǎn)。Oc為中心透視成像模型中的透視原點(diǎn),相機(jī)的焦距即為f=OcOi。已知相機(jī)每個(gè)像素點(diǎn)的實(shí)際尺寸,這樣在圖像坐標(biāo)系下可以計(jì)算出A,B,C,D4個(gè)點(diǎn)的實(shí)際坐標(biāo)。
圖1 中心透視成像原理Fig.1 Principle diagram of central perspective imaging
通過以上參數(shù)和成像模型,根據(jù)余弦定理可以求出目標(biāo)物體的位置和姿態(tài):
其中:α,β和γ分別代表∠AOcB,∠BOcC,∠COcA,通過對(duì)應(yīng)的像素坐標(biāo)可以求得;a,b和c分別代表A′B′,B′C′,C′A′的長度;x,y,z分別代表OcA′,OcB′,OcC′的長度。根據(jù)式(7)即可求得x,y,z,然而該方程具有多解,所以需要第4個(gè)點(diǎn)來求得唯一解。
已知A,B,C在圖像坐標(biāo)系的坐標(biāo),利用x,y,z可求得A′,B′和C′在圖像坐標(biāo)系的坐標(biāo)。最后,利用坐標(biāo)轉(zhuǎn)化矩陣可求得相機(jī)相對(duì)于四光源的位姿。如下式:
其中:T X,T Y,T Z分別為相機(jī)相對(duì)于光源X,Y,Z方向的位移;θ,φ,μ分別為繞X軸,Y軸,Z軸的旋轉(zhuǎn)角度,逆時(shí)針為正;(X,Y,Z)是四光源在世界坐標(biāo)系下的坐標(biāo),(X′,Y′,Z′)是四光源在相機(jī)坐標(biāo)系下的坐標(biāo)。
在低光照室外的環(huán)境下,不發(fā)光的傳統(tǒng)標(biāo)記將無法使用。若使用4個(gè)普通的LED燈作為標(biāo)記,則可以在低光照的環(huán)境下使用,但是在室外很可能存在人造燈光的干擾,導(dǎo)致無法識(shí)別。本文將4個(gè)普通LED光源更換成4個(gè)偏振LED光源,配合偏振相機(jī)來解決低光照室外使用所遇到的問題。如圖2所示,在4個(gè)偏振光源上安裝一層線偏振片,經(jīng)過線偏振片的LED光便成為線偏振光。理論上來說,出射的光線是完全線偏振光,但由于線偏振片無法達(dá)到完美的效果,加上透過空氣后,光線的偏振狀態(tài)會(huì)略微發(fā)生變化,實(shí)際由4個(gè)偏振光源到達(dá)偏振相機(jī)的光線并非完全線偏振光,即其偏振度略小于1。即便如此,相較于自然光和一般人造光源,本文中偏振光源的偏振度更大。并且偏振光具有“強(qiáng)光弱化,弱光強(qiáng)化”的特點(diǎn),不需要很高功率的LED燈也能在遠(yuǎn)距離保持一定的偏振度,更具有經(jīng)濟(jì)效益。
圖2 基于偏振成像的目標(biāo)位姿估計(jì)實(shí)驗(yàn)示意圖Fig.2 Schematic of target pose estimation based on po?larized imaging experiment
如圖2所示,偏振相機(jī)拍攝含有四偏振光源的圖像,在圖像中提取的4個(gè)偏振光標(biāo)記后,使用計(jì)算機(jī)計(jì)算出目標(biāo)物體的位置和姿態(tài),其算法流程如圖3所示。
圖3 目標(biāo)識(shí)別與位姿估計(jì)算法流程Fig.3 Flow chart of target recognition and pose estima?tion algorithm
在提取目標(biāo)點(diǎn)以前,首先應(yīng)該考慮低光照環(huán)境下暗電流、熱噪聲、壞點(diǎn)等成像問題對(duì)圖像質(zhì)量的影響[23-24]。在低光照環(huán)境下,成像后圖像上像素的灰度值都很低,此時(shí)CMOS上暗電流的影響會(huì)被放大,考慮到偏振相機(jī)拍攝的原圖(下稱RAW圖)將用來計(jì)算偏振度圖,本文采用閾值法減少暗電流對(duì)偏振度圖的影響。拍攝多張RAW圖并計(jì)算偏振度圖后,對(duì)比發(fā)現(xiàn)像素的灰度值選取2作為閾值點(diǎn)能兼顧降噪和保留細(xì)節(jié)信息,即RAW圖中所有像素灰度值小于2的點(diǎn)都將它們改為2。而在上述對(duì)比還發(fā)現(xiàn)了壞點(diǎn)問題,即每張圖片都有固定的像素點(diǎn)出現(xiàn)異常值。本文采用“屏蔽+插值”的方法,即將該點(diǎn)異常值舍棄,根據(jù)周圍像素插值出新的值去代替異常值。
上述處理后,低光照環(huán)境下圖片依然有較為明顯的噪點(diǎn),這會(huì)影響4個(gè)偏振光源的識(shí)別。對(duì)此問題,本文提出“兩次濾波”的降噪方法。偏振相機(jī)一次成像可獲得4張不同偏振角的RAW圖像,由其中3張即可計(jì)算出所需的偏振度圖,故分別在RAW圖和偏振度圖上進(jìn)行濾波,就可以改善最終偏振度圖的成像質(zhì)量,使得后續(xù)識(shí)別4個(gè)偏振光源更加精確。中值濾波應(yīng)對(duì)椒鹽噪聲的效果很好,高斯濾波可以讓圖像梯度更加平緩。本文在RAW圖中使用中值濾波,在偏振度圖中使用“中值濾波+高斯濾波”的方式。降噪效果對(duì)比如圖4所示,可以看到本文的方法能夠?qū)⒛繕?biāo)從背景中有效地分離出來,并且目標(biāo)更加平滑,易于識(shí)別。由于鏡頭制造安裝等誤差,實(shí)際拍攝的圖像存在畸變、扭曲等問題,這會(huì)顯著影響目標(biāo)物體的位姿計(jì)算精度,故需要對(duì)這些誤差進(jìn)行標(biāo)定。本文以張正友提出的基于平面靶標(biāo)標(biāo)定方法為基礎(chǔ)[25],并考慮到制造時(shí)鏡頭畸變及其他因素的影響,基于小孔成像模型求解出相機(jī)的內(nèi)、外參數(shù)和鏡頭畸變系數(shù)并保存起來,后續(xù)就能隨時(shí)校正圖像。
圖4 降噪效果對(duì)比Fig.4 Comparison of noise reduction effects
4個(gè)偏振光源的偏振度很高,但在偏振度圖中每個(gè)光源會(huì)形成一片偏振度很高的區(qū)域而不是點(diǎn),故在偏振圖中識(shí)別出4個(gè)最高偏振度且偏振度大于一定閾值的區(qū)域即可認(rèn)為識(shí)別到了目標(biāo)偏振標(biāo)記。識(shí)別時(shí)按偏振度從大到小依次識(shí)別4個(gè)區(qū)域。識(shí)別偏振光源時(shí),先在偏振度圖中尋找最大的偏振度點(diǎn),再按偏振度不低于最大偏振度70%的閾值去按廣度優(yōu)先算法膨脹最大偏振度區(qū)域,這樣就找到了一個(gè)區(qū)域。然后將該區(qū)域保存起來,并在偏振度圖中將該區(qū)域的偏振度設(shè)為0,以便在接下來的循環(huán)找點(diǎn)中排除該區(qū)域。按上述規(guī)則循環(huán)4次,即可找出偏振度圖中偏振度最大的4個(gè)區(qū)域。為了提高識(shí)別精度至亞像素級(jí),使用加權(quán)平均法計(jì)算每個(gè)區(qū)域的質(zhì)心作為最終識(shí)別的偏振光源坐標(biāo)點(diǎn)。在空氣中,由于散射等原因,偏振光源的偏振度隨著傳播距離的增加會(huì)有一定程度的衰減??紤]到遠(yuǎn)距離成像時(shí)可能會(huì)存在干擾,最后在算法中加入糾錯(cuò)部分來增加識(shí)別的準(zhǔn)確率。糾錯(cuò)部分為:識(shí)別出4個(gè)點(diǎn)后,若4個(gè)點(diǎn)形成的四邊形有兩條邊長明顯長于另外兩條邊長,意味著此時(shí)兩條最長邊交點(diǎn)為離另外3個(gè)點(diǎn)異常遠(yuǎn)的異常點(diǎn),則剔除異常點(diǎn)所在區(qū)域,重新尋找下一個(gè)候選區(qū)域;進(jìn)而重新開始一輪循環(huán)。
為證明本文方法的優(yōu)異性和算法的有效性,選擇低光照強(qiáng)背景噪聲環(huán)境下進(jìn)行實(shí)驗(yàn)。偏振相機(jī)的型號(hào)為PHX050S-PC,相機(jī)分辨率為2448×2048,每個(gè)像素的物理尺寸為3.45μm,鏡頭焦距為10.5 mm,四偏振光源距離中心0.1 m,在固定好的4個(gè)LED上方分別固定一塊線偏振片組成四偏振光源,每個(gè)LED的功率約為5 mW。偏振相機(jī)拍攝圖像后,由它所連接的筆記本電腦計(jì)算接收數(shù)據(jù)并完成計(jì)算。將偏振相機(jī)調(diào)平并固定,分別在距離偏振相機(jī)約5,20,40 m的地方拍攝四偏振光源。圖5為四偏振光源距離偏振相機(jī)約40 m遠(yuǎn)時(shí)的場景圖,可以看到拍攝背景存在大量居民樓燈光以及路燈的干擾。由于LED功率有限,隨著目標(biāo)與相機(jī)的距離增加,光強(qiáng)圖中四偏振光源相對(duì)背景噪聲越來越不明顯,識(shí)別難度增大。
圖5 偏振相機(jī)視角下的實(shí)驗(yàn)場景Fig.5 Experimental scene from perspective of polariza?tion camera
圖6所示為不同距離下四偏振光源的光強(qiáng)圖和偏振度圖以及識(shí)別結(jié)果。可以看到在光強(qiáng)圖中四偏振光源都很難辨認(rèn),而在偏振度圖中四偏振光源都很清晰,并且3個(gè)不同距離情況下算法都成功識(shí)別出4個(gè)光源位置。每組曝光時(shí)間相同,遠(yuǎn)距離時(shí)適當(dāng)提高了曝光時(shí)間。
圖6 光強(qiáng)圖與偏振圖識(shí)別結(jié)果對(duì)比Fig.6 Comparison of recognition results of illumination and DoP images
為了進(jìn)行定量對(duì)比,本文引入?yún)?shù)K:
其中:V代表圖像中的像素,在光強(qiáng)圖中代表亮度,在偏振度圖中代表線偏振度;Vmin表示圖像中四偏振光源區(qū)域中最暗區(qū)域的最大值,此處選擇最暗光源區(qū)域像素的最大值是因?yàn)楸疚奶岢龅乃惴ɑ谧畲笾堤崛」庠磪^(qū)域,故Vmin代表四偏振光源中最暗的那個(gè)光源,Vmax表示四偏振光源以外背景區(qū)域的最大值,代表背景中的最大噪聲。K為最暗光源與背景最大噪聲之比,代表四偏振光源相較于背景噪聲的顯著度。K值越大,即四偏振光源區(qū)域整體越顯著;K值越小,四偏振光源區(qū)域就越難在背景中區(qū)分出來。當(dāng)K>1時(shí),本文提出的算法可以識(shí)別四偏振光源;當(dāng)K<1時(shí),存在一個(gè)最暗的偏振光源區(qū)域,該區(qū)域比背景噪聲小。雖然本文提出的算法中有糾錯(cuò)部分,但此時(shí)有可能識(shí)別失敗,并且K越小,識(shí)別成功率越低。分別計(jì)算光強(qiáng)圖和偏振度圖的K值,如圖7所示。
圖7 光強(qiáng)圖和偏振度圖的K值Fig.7 K of illumination and DoP images
由圖7可知,5 m時(shí)光強(qiáng)的K值大于偏振度,這是因?yàn)榻嚯x下LED的亮度遠(yuǎn)高于背景亮度;而隨著距離增大,相機(jī)接收到的LED亮度變小,到20 m時(shí)光強(qiáng)的K值降至0.93,遠(yuǎn)小于偏振度,并且K<1,此時(shí)四偏振光源中最暗的光源已經(jīng)很難從背景中區(qū)分開來;40 m時(shí)光強(qiáng)圖的K值繼續(xù)降至0.58,依然遠(yuǎn)小于偏振度圖,此時(shí)K值遠(yuǎn)小于1,這意味著在光強(qiáng)圖中很難從背景中區(qū)分四偏振光源。隨著距離的增大,光強(qiáng)圖的K值迅速下降,而偏振度圖的K值雖然也在下降,但其下降緩慢,并且一直保持在1以上。而觀察圖6可以發(fā)現(xiàn),光強(qiáng)圖中4個(gè)光源區(qū)域亮度差異很大,這是因?yàn)長ED發(fā)出的光有一定的方向性,光源的略微傾斜都會(huì)導(dǎo)致光強(qiáng)圖中出現(xiàn)這種情況??紤]到這一點(diǎn),這里統(tǒng)計(jì)了光強(qiáng)圖和偏振度中4個(gè)光源區(qū)域亮度的方差(對(duì)應(yīng)的光強(qiáng)圖和偏振度圖數(shù)值已做歸一化處理),如表1所示??梢园l(fā)現(xiàn),在不同距離下光強(qiáng)圖的方差都高于偏振圖,5 m時(shí)光強(qiáng)圖的方差是偏振度圖的10.8倍。而偏振度圖的方差比較穩(wěn)定,這也和K值的結(jié)果相吻合。K值和方差的對(duì)比證明了本文提出的偏振方法精度更高且魯棒性更強(qiáng)。
表1 四光源區(qū)域亮度方差Tab.1 Variance of brightness in area of 4 light sources
由于四偏振光源的安裝誤差以及實(shí)驗(yàn)時(shí)光源相對(duì)相機(jī)的角度難以精確控制(特別是在遠(yuǎn)距離),而且解算出的6個(gè)位姿參數(shù)是耦合的,相對(duì)角度的誤差會(huì)影響相對(duì)位置的精度,但不會(huì)影響四偏振光源與相機(jī)的距離精度,且算法的迭代性使得角度誤差極小,故本文以四偏振光源距離相機(jī)的直線距離來衡量識(shí)別的位姿精度。
表2 位姿精度Tab.2 Pose accuracy
由表可知,隨著距離的增加,相對(duì)誤差變小,這是因?yàn)榻嚯x時(shí)每個(gè)光源在圖像中區(qū)域占比較大,這就導(dǎo)致識(shí)別光源的像素精度不高,進(jìn)而導(dǎo)致相對(duì)誤差較大;而遠(yuǎn)距離時(shí)每個(gè)光源成像區(qū)域較小,識(shí)別光源的像素精度較高,也就減小了相對(duì)誤差。
光源的像素識(shí)別誤差是理論像素與識(shí)別像素的位置差,它對(duì)位姿識(shí)別的影響結(jié)果如表3所示。由上文分析得知,像素識(shí)別誤差與光源成像區(qū)域面積有關(guān)。假設(shè)光斑成像區(qū)域靠近圖像中心,由如圖1所示的相機(jī)成像模型可估算光源區(qū)域在圖像中的直徑為:
表3 像素識(shí)別誤差及其導(dǎo)致的位姿估計(jì)誤差Tab.3 Pixel recognition errors and corresponding pose estimation errors
其中:l為光源光斑的物理尺寸,L為光源與相機(jī)的距離,f為相機(jī)焦距。假定l不變,那么圖像中光斑尺寸僅與1/L成正比,故可認(rèn)為圖像中光斑識(shí)別誤差也僅與1/L呈線性關(guān)系,則有:
用式(11)來估算像素識(shí)別誤差,其中a和b為待估計(jì)參數(shù),使用5,20,40 m的誤差數(shù)據(jù)擬合后便可估計(jì)出a和b的值,進(jìn)而估計(jì)出70 m和100 m的像素識(shí)別誤差。
本文提出了一種受生物啟發(fā)的方法,利用偏振光源在低光照強(qiáng)背景噪聲環(huán)境下計(jì)算目標(biāo)的位姿。該方法基于偏振成像技術(shù),在保持傳統(tǒng)光學(xué)精度的前提下,拓寬了適用范圍并且增強(qiáng)了識(shí)別的魯棒性。實(shí)驗(yàn)結(jié)果表明,提出的識(shí)別算法降噪能力強(qiáng),抗噪聲效果好,識(shí)別準(zhǔn)確度高,在3個(gè)距離下均識(shí)別成功,40 m遠(yuǎn)時(shí)位姿估計(jì)誤差為2.99%。此外,該方法簡單易行、成本較低,只需帶有偏振片的4個(gè)低功耗LED光源作為目標(biāo)特征。未來的工作將集中在降低像素誤差和提高使用范圍上。